ComputersDatabases

Werken met tekst. Hoe de codering van een bestand te bepalen

Laten we eens kijken wat file-codering. Simpel gezegd, wordt de codering beschouwd als een set van byte-tekens, die overeenkomt met de letter alfabet in een bepaalde taal zijn. Elke taal heeft zijn eigen reeks codeersymbolen. Soms is er een behoefte om de codering op te geven. Beschouw dit als een voorbeeld van een tekstdocument.

Wat je nodig hebt

Een set van specifieke software. Om te beginnen, typt u Word-toepassingen, KWrite, Firefox browser en erkenning gereedschappen - enca.

Bepaal de codering van het bestand, kunt u de generieke Microsoft Word-editor. Eerst moet je om het te installeren vanaf de Office. Wanneer de applicatie is geïnstalleerd en kan worden geopend door middel van iconen een symbool W op het bureaublad, ga dan naar de volgende stap.

De volgende fase van de erkenning

Via de navigatiebalk toepassingen op hun beurt ga naar "File" - "Open". Hetzelfde kan worden gedaan met behulp van een combinatie van toetsenbord Ctrl + O.

Dan, in het dialoogvenster, selecteert u de map en eigenlijk een bestand om te lezen. Selecteer met de muis, klikt u op de "ontdekking".

Wanneer een bestand set wedstrijden zijn CP1251, de toepassing probeert om uw eigen codering bepalen. een lijst met mogelijke overeenkomsten wordt weergegeven. De voorgestelde set tekens aan de rechterkant van de lijst, kies een van de coderingen. Als de keuze correct is uitgevoerd, worden aan "sample" items weergegeven herkende tekst.

Hoe om te bepalen de codering betekent KWrite

Naast de preprocessor voor tekstverwerking, Word, zijn er andere functionele bruikbaarheid. Een van hen - KWrite (analoog voor UNIX-systemen). Dus u bent niet in de war, teken voor de punten van de taak "om de codering van het document in KWrite» bepalen.

  1. Download om een applicatie met de extensie .txt bestand.
  2. Bust coderingen zo lang als een van hen zou geschikt zijn.
  3. Voer stap 2, ga naar het menu Extra optie in de codering.

Mozilla Firefox-browser, het doel is hetzelfde - om het karakter encoding bepalen

Het principe is ongeveer hetzelfde als in de hulpprogramma's voor het werken met tekst. Start de installatie van de browser uit te voeren, en als het niet is geïnstalleerd - het downloaden van de installer van mozilla.org.

Dan moet je een tekstdocument te openen in een open raam, via het menu "Bestand", submenu "File Open". Als het geselecteerde bestand wordt weergegeven zonder vervorming, en de tekst leesbaar is, bepalen de codering is niet moeilijk.

Om dit te doen, ga naar "View" - "codering", er verschijnt een paar karakter sets, en een van hen, in de voorkant van die staat een "tik", en er is een zekere browser codering.

Als de tekst niet correct wordt herkend, selecteert u "Aanvullende overwegingen", experimenteren met deze coderingen of selecteer "Auto".

Gespecialiseerde software - we werken samen met enca

Er zijn een aantal hulpmiddelen elektronische middelen, die het mogelijk maken de codering van platte tekst te definiëren.

Voor degenen die gewend zijn aan het werken onder de unix, geschikt enca nut. Het kan worden geïnstalleerd met behulp van de "Package Manager" service. Het vinden van een betaalbare categorie pakket, kunt u overgaan tot de software te installeren.

Om de lijst van talen erkenning te geven, lopen enca --list talen, met behulp van de terminal.

Als u de codering van het tekstbestand opgeven na de sleutel (g), voer een naam, en vervolgens optie (L) op vrijwel dezelfde manier, voert u de taal herkenning:

enca L Russisch -g /home/vic/temp/myfile.txt.

Om de bovenstaande Encoding samenvatten

Ik ben van mening dat de bovenstaande hulpprogramma's voldoende zijn voor de gebruiker zal een set van tools voor het decoderen van tekstdocumenten.

Tot nu toe, in feite is alles over hoe om de codering te herkennen. Voor de toepassing van de norm, denk ik, de software is prima. Er zijn ook meer gespecialiseerde bepalingsmethoden, maar ze vallen buiten het bestek van dit artikel.

Voor Microsoft Word-programma bronherkenning kan zo eenvoudig tekst en documenten met complexe opmaak zijn.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 nl.delachieve.com. Theme powered by WordPress.