Cum se configurează smartphone-uri și PC-uri. Portal informativ
  • Acasă
  • Sfat
  • Se știe că în tabelul de coduri există caractere ascii. Codificare ASCII (cod standard american pentru schimbul de informații) - codificare de bază a textului pentru latină

Se știe că în tabelul de coduri există caractere ascii. Codificare ASCII (cod standard american pentru schimbul de informații) - codificare de bază a textului pentru latină

Se numește setul de caractere cu care este scris textul alfabet.

Numărul de caractere din alfabet este al lui putere.

Formula pentru determinarea cantității de informații: N = 2 b,

unde N este cardinalitatea alfabetului (numărul de caractere),

b - numărul de biți (greutatea informațională a caracterului).

Alfabetul cu o capacitate de 256 de caractere poate găzdui aproape toate caracterele necesare. Acest alfabet se numește suficient.

pentru că 256 = 2 8, atunci greutatea unui caracter este de 8 biți.

Unitatea de 8 biți a fost numită 1 octet:

1 octet = 8 biți.

Codul binar al fiecărui caracter din textul computerului ocupă 1 octet de memorie.

Cum sunt reprezentate informațiile text în memoria computerului?

Comoditatea codificării octet a caracterelor este evidentă, deoarece un octet este cea mai mică parte adresabilă a memoriei și, prin urmare, procesorul poate accesa fiecare caracter separat, efectuând procesarea textului. Pe de altă parte, 256 de caractere este un număr destul de suficient pentru a reprezenta o mare varietate de informații despre caractere.

Acum se pune întrebarea, ce fel de cod binar pe opt biți să asociem cu fiecare caracter.

Este clar că aceasta este o chestiune condiționată, puteți veni cu multe metode de codare.

Toate caracterele alfabetului computerului sunt numerotate de la 0 la 255. Fiecare număr corespunde unui cod binar de opt cifre de la 00000000 la 11111111. Acest cod este pur și simplu numărul ordinal al caracterului din sistemul binar.

Tabelul în care toate caracterele alfabetului computerului sunt atribuite numere de serie se numește tabel de codificare.

Pentru diferite tipuri de computere sunt folosite tabele de codare diferite.

Standardul internațional pentru PC a devenit tabelul ASCII(citiți asci) (Codul standard american pentru schimbul de informații).

Tabelul ASCII este împărțit în două părți.

Standardul internațional este doar prima jumătate a tabelului, adică. simboluri cu numere din 0 (00000000), până la 127 (01111111).

Structura tabelului de codificare ASCII

Număr de serie

Codul

Simbol

0 - 31

00000000 - 00011111

Simbolurile cu numere de la 0 la 31 sunt de obicei numite caractere de control.
Funcția lor este de a controla procesul de afișare a textului pe ecran sau de imprimare, de a da un semnal sonor, de marcare a textului etc.

32 - 127

00100000 - 01111111

Parte standard a tabelului (engleză). Aceasta include litere mici și mari ale alfabetului latin, cifre zecimale, semne de punctuație, tot felul de paranteze, simboluri comerciale și alte simboluri.
Caracterul 32 este un spațiu, adică. poziție goală în text.
Toate celelalte se reflectă în anumite semne.

128 - 255

10000000 - 11111111

Parte alternativă a tabelului (rusă).
A doua jumătate a tabelului de coduri ASCII, numită pagina de coduri (128 de coduri, începând cu 10000000 și terminând cu 11111111), poate avea variante diferite, fiecare variantă având propriul număr.
Pagina de coduri este folosită în primul rând pentru a găzdui alfabetele naționale, altele decât latină. În codificările naționale rusești, această parte a tabelului conține simboluri ale alfabetului rus.

Prima jumătate a tabelului ASCII


Vă atrag atenția că în tabelul de codificare literele (majuscule și mici) sunt aranjate în ordine alfabetică, iar numerele sunt ordonate în ordine crescătoare a valorilor. Această respectare a ordinii lexicografice în aranjarea caracterelor se numește principiul codificării secvențiale a alfabetului.

Pentru literele alfabetului rus, se respectă și principiul codificării secvențiale.

A doua jumătate a tabelului ASCII


Din păcate, în prezent există cinci codificări chirilice diferite (KOI8-R, Windows. MS-DOS, Macintosh și ISO). Din această cauză, apar adesea probleme cu transferul de text rusesc de la un computer la altul, de la un sistem software la altul.

Cronologic, unul dintre primele standarde pentru codificarea literelor rusești pe computere a fost KOI8 ("Cod de schimb de informații, 8 biți"). Această codificare a fost folosită încă din anii 70 pe computerele din seria de calculatoare ES, iar de la mijlocul anilor 80 a început să fie folosită în primele versiuni rusificate ale sistemului de operare UNIX.

De la începutul anilor 90, vremea dominației sistemului de operare MS DOS, codificarea CP866 rămâne („CP” înseamnă „Code Page”).

Computerele Apple care rulează Mac OS folosesc propria lor codificare Mac.

În plus, Organizația Internațională pentru Standardizare (International Standards Organization, ISO) a aprobat o altă codificare numită ISO 8859-5 ca standard pentru limba rusă.

În prezent, cea mai comună codificare este Microsoft Windows, prescurtat ca CP1251.

De la sfârșitul anilor '90, problema standardizării codării caracterelor a fost rezolvată prin introducerea unui nou standard internațional numit Unicode... Aceasta este o codificare pe 16 biți, adică alocă 2 octeți de memorie pentru fiecare caracter. Desigur, acest lucru dublează cantitatea de memorie utilizată. Dar, pe de altă parte, un astfel de tabel de coduri permite includerea a până la 65536 de caractere. Specificația completă a standardului Unicode include toate alfabetele existente, dispărute și create artificial din lume, precum și multe simboluri matematice, muzicale, chimice și alte simboluri.

Să încercăm să folosim un tabel ASCII pentru a ne imagina cum vor arăta cuvintele în memoria computerului.

Reprezentarea internă a cuvintelor în memoria computerului

Uneori se întâmplă ca un text constând din litere ale alfabetului rus, primit de la un alt computer, să nu poată fi citit - un fel de „farful” este vizibil pe ecranul monitorului. Acest lucru se datorează faptului că computerele folosesc codificare diferită a caracterelor limbii ruse.

Excel pentru Office 365 Word pentru Office 365 Outlook pentru Office 365 PowerPoint pentru Office 365 Publisher pentru Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 2007 Outlook 2007070200702010 PowerPoint One 2007070200702010 Visio Standard 2007 Visio Standard 2010 Mai puțin

În acest articol

Introduceți un caracter ASCII sau Unicode într-un document

Dacă trebuie să introduceți doar câteva caractere speciale sau simboluri, puteți utiliza oricare dintre comenzile rapide de la tastatură. Pentru o listă de caractere ASCII, consultați tabelele următoare sau articolul Introducerea alfabetelor naționale folosind comenzile rapide de la tastatură.

Note:

Introduceți caractere ASCII

Pentru a introduce un caracter ASCII, țineți apăsată tasta ALT în timp ce introduceți codul caracterului. De exemplu, pentru a introduce un simbol grad (º), apăsați și mențineți apăsată tasta Alt, apoi introduceți 0176 pe tastatura numerică.

Utilizați tastatura numerică pentru a introduce numereîn loc de numere de pe tastatura principală. Dacă trebuie să introduceți numere pe tastatura numerică, asigurați-vă că indicatorul BLOCARE NUMĂR este aprins.

Inserarea caracterelor Unicode

Pentru a introduce un caracter Unicode, introduceți codul caracterului, apoi apăsați ALT și X în secvență. De exemplu, pentru a introduce un semn dolar ($), introduceți 0024 și apăsați ALT și X în secvență. Pentru toate codurile de caractere Unicode, consultați.

Important: Unele programe Microsoft Office, cum ar fi PowerPoint și InfoPath, nu acceptă conversia codurilor Unicode în caractere. Dacă trebuie să inserați un caracter Unicode într-unul dintre aceste programe, utilizați.

Note:

    Dacă vedeți caracterul Unicode greșit după ce apăsați ALT + X, selectați codul corect, apoi apăsați din nou ALT + X.

    În plus, „U +” trebuie introdus înaintea codului. De exemplu, dacă introduceți „1U + B5” și apăsați Alt + X, este afișat textul „1µ”, iar dacă introduceți „1B5” și apăsați Alt + X, este afișat caracterul „Ƶ”.

Folosind tabelul de simboluri

Symbol Map este un program încorporat în Microsoft Windows care vă permite să vizualizați simbolurile disponibile pentru un font selectat.

Folosind un tabel de simboluri, puteți copia simboluri individuale sau un grup de simboluri în clipboard și le puteți lipi în orice program care poate afișa acele simboluri. Deschiderea tabelului de simboluri

    Pe Windows 10 Introduceți cuvântul „simbol” în caseta de căutare din bara de activități și selectați un tabel cu simboluri din rezultatele căutării.

    Pe Windows 8 Introduceți cuvântul „caracter” pe ecranul de start și selectați un tabel de caractere din rezultatele căutării.

    Pe Windows 7 apasa butonul start, selectați secvențial Toate programele, Standard, Serviciuși faceți clic tabel de simboluri.

Caracterele sunt grupate după font. Faceți clic pe lista de fonturi pentru a selecta setul de caractere corespunzător. Pentru a selecta un simbol, faceți clic pe el, apoi faceți clic Selectați... Pentru a insera un simbol, faceți clic dreapta pe locația dorită din document și selectați Introduce.

Coduri de simbol utilizate frecvent

Pentru o listă completă de caractere, consultați computerul dvs., tabelul cu coduri de caractere ASCII sau tabelele cu seturi de caractere Unicode.

Glifă

Glifă

Unități monetare

Simboluri legale

Simboluri matematice

Fracții

Simboluri de punctuație și dialect

Formează simboluri

Codurile diacritice utilizate în mod obișnuit

Pentru o listă completă de glife și coduri aferente, consultați.

Glifă

Glifă

Caractere de control ASCII neimprimabile

Caracterele folosite pentru a controla unele dispozitive periferice, cum ar fi imprimantele, sunt numerotate de la 0 la 31 în tabelul ASCII. De exemplu, un caracter de alimentare/nouă pagină este numărul 12. Acest caracter îi spune imprimantei să meargă în partea de sus a paginii următoare.

Tabel de caractere de control ASCII neimprimabil

Zecimal

Semn

Zecimal

Semn

Eliberarea canalului de date

Începutul titlului

Primul cod de control al dispozitivului

Începutul textului

Al doilea cod de control al dispozitivului

Sfârșitul textului

Al treilea cod de control al dispozitivului

Sfârșitul transmisiei

Al patrulea cod de control al dispozitivului

în cinci colţuri

Confirmare negativă

Confirmare

Mod transmisie sincronă

Semnal sonor

Sfârșitul blocului de date transmise

Filă orizontală

Sfârșitul media

Avans de linie / linie nouă

Caracter de înlocuire

Filă verticală

depaseste

Traducere pagină / pagină nouă

Al doisprezecelea

Separator de fișiere

Retur transport

Separator de grup

Schimbați fără a salva cifrele

Separator de înregistrări

Deplasare cu conservarea cifrelor

cincisprezece

Separator de date

Apropo, pe site-ul nostru puteți traduce orice text în cod zecimal, hexazecimal, binar folosind calculatorul de cod online.

Tabelul ASCII

ASCII (Codul standard american pentru schimbul de informații)

Tabel rezumat al codurilor ASCII

Tabel de coduri de caractere ASCII Windows (Win-1251)

Simbol

specialist. Tab

specialist. LF (întoarcerea căruciorului)

specialist. CR (Linie nouă)

ambreiaj SP (Spațiu)

Simbol

Tabel ASCII extins

Formatarea caracterelor.

Backspace (Backspace un caracter). Indică mișcarea mecanismului de imprimare sau a cursorului de afișare înapoi cu o poziție.

Tabularea orizontală Afișează mișcarea motorului de imprimare sau a cursorului de afișare la următoarea „oprire de tablă”.

Linie de alimentare. Afișează mișcarea motorului de imprimare sau a cursorului de afișare la începutul liniei următoare (cu o linie în jos).

Tabularea verticală Afișează mișcarea motorului de imprimare sau a cursorului de afișare la următorul grup de linii.

Feed de formulare. Indică mișcarea motorului de imprimare sau a cursorului de afișare la poziția de pornire a paginii, formularului sau ecranului următor.

Retur transport. Afișează mișcarea mecanismului de imprimare sau a cursorului de afișare la poziția inițială (cel mai din stânga) a liniei curente.

Transfer de date.

Începutul titlului. Folosit pentru a identifica începutul unui antet, care poate conține informații de rutare sau o adresă.

Începutul textului. Afișează începutul textului și, în același timp, sfârșitul titlului.

Sfârșitul textului. Se aplică la încheierea textului care a început cu caracterul STX.

Anchetă. Solicitare de date de identificare (cum ar fi „Cine ești?”) de la stația de la distanță.

Recunoașteți. Dispozitivul receptor transmite acest caracter expeditorului ca confirmare a recepției cu succes a datelor.

Recunoaștere negativă. Dispozitivul receptor transmite acest caracter expeditorului în cazul refuzului (eșecului) recepției datelor.

Sincron / Inactiv. Folosit în sistemele de transmisie sincronizată. Când nu există transmisie de date, sistemul trimite continuu simboluri SYN pentru a asigura sincronizarea.

Sfârșitul blocului de transmisie. Indică sfârșitul unui bloc de date în scopuri de comunicare. Este folosit pentru împărțirea unor cantități mari de date în blocuri separate.

Marcaje de separare la transferul de informații.

Alte simboluri.

Nul. (Fără caracter - fără date). Este folosit pentru transmitere în lipsa datelor.

clopot Este folosit pentru controlul dispozitivelor de alarmă.

Schimbă afară. Indică faptul că toate cuvintele de cod ulterioare ar trebui interpretate conform setului de caractere extern înainte de sosirea caracterului SI.

Schimbă în. Indică faptul că cuvintele de cod ulterioare trebuie interpretate conform setului de caractere standard.

Data Link Escape Schimbarea semnificației următoarelor caractere. Este folosit pentru control suplimentar sau pentru transferul unui model de biți arbitrar.

DC1, DC2, DC3, DC4

Comenzile dispozitivului. Simboluri pentru controlul dispozitivelor auxiliare (funcții speciale).

Anulare. Indică faptul că datele care au precedat acest caracter într-un mesaj sau bloc ar trebui ignorate (de obicei, dacă se întâlnește o eroare).

Sfârșitul Mediului. Indică capătul fizic al unei benzi sau al unui alt mediu de stocare

Substitui Folosit pentru a înlocui un caracter eronat sau invalid.

Evadare (Extensie). Folosit pentru a extinde codul, indicând faptul că caracterul următor are un sens alternativ.

Spaţiu Un caracter care nu poate fi imprimat pentru a separa cuvintele sau pentru a muta motorul de imprimare sau pentru a afișa cursorul înainte cu o poziție.

Șterge. Folosit pentru a șterge (șterge) caracterul anterior din mesaj

[Codări pe 8 biți: ASCII, KOI-8R și CP1251] Primele tabele de set de caractere create în SUA nu au folosit al optulea bit dintr-un octet. Textul a fost prezentat ca o secvență de octeți, dar al optulea bit nu a fost luat în considerare (a fost folosit în scopuri de service).

Standardul general acceptat a devenit tabelul ASCII(Codul American Standard pentru Schimbul de Informații). Primele 32 de caractere ASCII (de la 00 la 1F) au fost folosite pentru caracterele care nu pot fi imprimate. Au fost concepute pentru a controla un dispozitiv de imprimare și altele asemenea. Restul - de la 20 la 7F - sunt caractere normale (printabile).

Tabelul 1 - Codificare ASCII

DecHexoctCharDescriere
0 0 000 nul
1 1 001 începutul direcției
2 2 002 începutul textului
3 3 003 sfârşitul textului
4 4 004 sfârşitul transmisiei
5 5 005 Anchetă
6 6 006 recunoaște
7 7 007 clopot
8 8 010 backspace
9 9 011 filă orizontală
10 A 012 linie nouă
11 B 013 filă verticală
12 C 014 pagina noua
13 D 015 retur transport
14 E 016 schimbă afară
15 F 017 schimbă în
16 10 020 evadare a legăturii de date
17 11 021 controlul dispozitivului 1
18 12 022 controlul dispozitivului 2
19 13 023 controlul dispozitivului 3
20 14 024 controlul dispozitivului 4
21 15 025 recunoaștere negativă
22 16 026 inactiv sincron
23 17 027 sfârşitul trans. bloc
24 18 030 Anulare
25 19 031 sfârşitul mediei
26 1A 032 substitui
27 1B 033 evadare
28 1C 034 separator de fișiere
29 1D 035 separator de grup
30 1E 036 separator de înregistrări
31 1F 037 separator de unitate
32 20 040 spaţiu
33 21 041 !
34 22 042 "
35 23 043 #
36 24 044 $
37 25 045 %
38 26 046 &
39 27 047 "
40 28 050 (
41 29 051 )
42 2A 052 *
43 2B 053 +
44 2C 054 ,
45 2D 055 -
46 2E 056 .
47 2F 057 /
48 30 060 0
49 31 061 1
50 32 062 2
51 33 063 3
52 34 064 4
53 35 065 5
54 36 066 6
55 37 067 7
56 38 070 8
57 39 071 9
58 3A 072 :
59 3B 073 ;
60 3C 074 <
61 3D 075 =
62 3E 076 >
63 3F 077 ?
DecHexoctChar
64 40 100 @
65 41 101 A
66 42 102 B
67 43 103 C
68 44 104 D
69 45 105 E
70 46 106 F
71 47 107 G
72 48 110 H
73 49 111 eu
74 4A 112 J
75 4B 113 K
76 4C 114 L
77 4D 115 M
78 4E 116 N
79 4F 117 O
80 50 120 P
81 51 121 Q
82 52 122 R
83 53 123 S
84 54 124 T
85 55 125 U
86 56 126 V
87 57 127 W
88 58 130 X
89 59 131 Y
90 5A 132 Z
91 5B 133 [
92 5C 134 \
93 5D 135 ]
94 5E 136 ^
95 5F 137 _
96 60 140 `
97 61 141 A
98 62 142 b
99 63 143 c
100 64 144 d
101 65 145 e
102 66 146 f
103 67 147 g
104 68 150 h
105 69 151 i
106 6A 152 j
107 6B 153 k
108 6C 154 l
109 6D 155 m
110 6E 156 n
111 6F 157 o
112 70 160 p
113 71 161 q
114 72 162 r
115 73 163 s
116 74 164 t
117 75 165 u
118 76 166 v
119 77 167 w
120 78 170 X
121 79 171 y
122 7A 172 z
123 7B 173 {
124 7C 174 |
125 7D 175 }
126 7E 176 ~
127 7F 177 DEL

După cum puteți vedea cu ușurință, această codificare conține doar litere latine și cele care sunt folosite în engleză. Există, de asemenea, simboluri aritmetice și alte simboluri de serviciu. Dar nu există litere rusești, sau chiar litere latine speciale pentru germană sau franceză. Acest lucru este ușor de explicat - codificarea a fost dezvoltată special ca standard american. Când computerele au început să fie folosite în întreaga lume, a devenit necesară codificarea altor simboluri.

Pentru aceasta, s-a decis folosirea celui de-al optulea bit din fiecare octet. Astfel, au fost disponibile încă 128 de valori (de la 80 la FF), care puteau fi folosite pentru a codifica caractere. Primul dintre tabelele de opt biți este „ASCII extins” ( ASCII extins) - a inclus diverse variante de caractere latine utilizate în unele limbi ale Europei de Vest. Conținea și alte simboluri suplimentare, inclusiv pseudo-grafice.

Caracterele pseudo-grafice permit, prin afișarea doar a caracterelor text, să ofere o oarecare aparență de grafică. De exemplu, programul de gestionare a fișierelor FAR Manager funcționează cu ajutorul pseudo-grafice.

Nu existau litere rusești în tabelul ASCII extins. În Rusia (fostă URSS) și în alte state, au fost create propriile codificări, care au făcut posibilă reprezentarea unor caractere „naționale” specifice în fișiere text pe 8 biți - litere latine ale limbilor poloneză și cehă, chirilice (inclusiv litere rusești ) și alte alfabete.

În toate codificările care s-au răspândit, primele 127 de caractere (adică valorile octeților cu al optulea bit egal cu 0) coincid cu ASCII. Astfel, un fișier ASCII funcționează în oricare dintre aceste codificări; literele limbii engleze sunt reprezentate la fel.

Organizare ISO(International Standardization Organization) a adoptat un grup de standarde ISO 8859... Acesta definește codificări pe 8 biți pentru diferite grupuri de limbi. Deci, ISO 8859-1 este ASCII extins, un tabel pentru Statele Unite și Europa de Vest. Și ISO 8859-5 este un tabel pentru chirilic (inclusiv rus).

Cu toate acestea, din motive istorice, codarea ISO 8859-5 nu a prins. În realitate, următoarele codificări sunt folosite pentru limba rusă:

Pagina de cod 866 ( CP866), alias „DOS”, alias „codare GOST alternativă”. A fost folosit pe scară largă până la mijlocul anilor 90; este acum folosit într-o măsură limitată. Practic nu este folosit pentru distribuirea de texte pe Internet.
- KOI-8. Dezvoltat în anii 70 și 80. Este un standard general acceptat pentru transmiterea mesajelor poștale pe internetul rusesc. De asemenea, este utilizat pe scară largă în sistemele de operare din familia Unix, inclusiv Linux. Se numește versiunea KOI-8, concepută pentru limba rusă KOI-8R; există versiuni pentru alte limbi chirilice (de exemplu, KOI8-U este o opțiune pentru limba ucraineană).
- Pagina de cod 1251, CP1251, Windows-1251. Dezvoltat de Microsoft pentru a sprijini limba rusă în Windows.

Principalul avantaj al CP866 a fost păstrarea caracterelor pseudo-grafice în aceleași locuri ca în ASCII extins; prin urmare, programele cu text străin, de exemplu, celebrul Norton Commander, ar putea funcționa fără modificări. În prezent, CP866 este utilizat pentru programele Windows care rulează în ferestre text sau în modul text pe întreg ecranul, inclusiv FAR Manager.

În ultimii ani, textele în CP866 sunt destul de rare (dar sunt folosite pentru a codifica numele fișierelor rusești în Windows). Prin urmare, ne vom opri mai detaliat asupra altor două codificări - KOI-8R și CP1251.



După cum puteți vedea, în tabelul de codificare CP1251, literele rusești sunt aranjate în ordine alfabetică (cu excepția, totuși, a literei E). Acest aranjament facilitează sortarea alfabetică a programelor de calculator.

Dar în KOI-8R, ordinea literelor rusești pare să fie aleatorie. Dar de fapt nu este.

Multe programe mai vechi au pierdut al 8-lea bit la procesarea sau transmiterea textului. (Acum, astfel de programe practic s-au „stins”, dar la sfârșitul anilor 80 - începutul anilor 90 erau răspândite). Pentru a obține o valoare de 7 biți dintr-o valoare de 8 biți, scădeți 8 din cifra cea mai semnificativă; de exemplu, E1 devine 61.

Acum comparați KOI-8R cu tabelul ASCII (Tabelul 1). Veți descoperi că literele rusești sunt clar aliniate cu cele latine. Dacă al optulea bit dispare, literele rusești mici se transformă în litere latine mari, iar literele rusești mari se transformă în litere latine mici. Deci, E1 în KOI-8 este rusă „A”, în timp ce 61 în ASCII este latină „a”.

Deci, KOI-8 vă permite să păstrați lizibilitatea textului rusesc în timp ce pierdeți al 8-lea bit. „Salut tuturor” devine „pRIWET WSEM”.

Recent, atât ordinea alfabetică a caracterelor din tabelul de codificare, cât și lizibilitatea cu pierderea celui de-al 8-lea bit și-au pierdut importanța decisivă. Al optulea bit în computerele moderne nu se pierde nici în timpul transmisiei, nici în timpul procesării. Sortarea în ordine alfabetică se bazează pe codificare, și nu pe simpla comparație a codurilor. (Apropo, codurile CP1251 nu sunt complet alfabetice - litera E nu este la locul ei).

Datorită faptului că există două codificări comune, atunci când lucrați cu Internetul (e-mail, navigarea pe site-uri web), uneori puteți vedea un set de litere fără sens în loc de text rusesc. De exemplu, „Sunt SBUFEMHEL”. Acestea sunt doar cuvintele „cu respect”; dar au fost codificate în codificare CP1251, iar computerul a decodat textul conform tabelului KOI-8. Dacă aceleași cuvinte au fost, dimpotrivă, codificate în KOI-8, iar computerul a decodat textul conform tabelului CP1251, rezultatul va fi „У ХЧБЦЕОЙЕН”.

Uneori se întâmplă ca computerul să decripteze literele în limba rusă conform unui tabel care nu este destinat limbii ruse. Apoi, în loc de litere rusești, apare un set de simboluri fără sens (de exemplu, litere latine ale limbilor est-europene); ele sunt adesea numite „crocozyabras”.

În cele mai multe cazuri, programele moderne fac față singure cu determinarea codificărilor documentelor de pe Internet (e-mailuri și pagini web). Dar uneori „raușesc” și apoi puteți vedea secvențe ciudate de litere rusești sau „krokozyabra”. De regulă, pentru a afișa text real pe ecran, este suficient să selectați codarea manual în meniul programului.

Pentru articol s-au folosit informațiile de pe pagina http://open-office.edusite.ru/TextProcessor/p5aa1.html.

Material preluat de pe site:

Top articole similare