Se știe că în tabelul de coduri există caractere ascii. Codificare ASCII (cod standard american pentru schimbul de informații) - codificare de bază a textului pentru latină

11.08.2019 Sfat

Se numește setul de caractere cu care este scris textul alfabet.

Numărul de caractere din alfabet este al lui putere.

Formula pentru determinarea cantității de informații: N = 2 b,

unde N este cardinalitatea alfabetului (numărul de caractere),

b - numărul de biți (greutatea informațională a caracterului).

Alfabetul cu o capacitate de 256 de caractere poate găzdui aproape toate caracterele necesare. Acest alfabet se numește suficient.

pentru că 256 = 2 8, atunci greutatea unui caracter este de 8 biți.

Unitatea de 8 biți a fost numită 1 octet:

1 octet = 8 biți.

Codul binar al fiecărui caracter din textul computerului ocupă 1 octet de memorie.

Cum sunt reprezentate informațiile text în memoria computerului?

Comoditatea codificării octet a caracterelor este evidentă, deoarece un octet este cea mai mică parte adresabilă a memoriei și, prin urmare, procesorul poate accesa fiecare caracter separat, efectuând procesarea textului. Pe de altă parte, 256 de caractere este un număr destul de suficient pentru a reprezenta o mare varietate de informații despre caractere.

Acum se pune întrebarea, ce fel de cod binar pe opt biți să asociem cu fiecare caracter.

Este clar că aceasta este o chestiune condiționată, puteți veni cu multe metode de codare.

Toate caracterele alfabetului computerului sunt numerotate de la 0 la 255. Fiecare număr corespunde unui cod binar de opt cifre de la 00000000 la 11111111. Acest cod este pur și simplu numărul ordinal al caracterului din sistemul binar.

Tabelul în care toate caracterele alfabetului computerului sunt atribuite numere de serie se numește tabel de codificare.

Pentru diferite tipuri de computere sunt folosite tabele de codare diferite.

Standardul internațional pentru PC a devenit tabelul ASCII(citiți asci) (Codul standard american pentru schimbul de informații).

Tabelul ASCII este împărțit în două părți.

Standardul internațional este doar prima jumătate a tabelului, adică. simboluri cu numere din 0 (00000000), până la 127 (01111111).

Structura tabelului de codificare ASCII

Număr de serie	Codul	Simbol
0 - 31	00000000 - 00011111	Simbolurile cu numere de la 0 la 31 sunt de obicei numite caractere de control. Funcția lor este de a controla procesul de afișare a textului pe ecran sau de imprimare, de a da un semnal sonor, de marcare a textului etc.
32 - 127	00100000 - 01111111	Parte standard a tabelului (engleză). Aceasta include litere mici și mari ale alfabetului latin, cifre zecimale, semne de punctuație, tot felul de paranteze, simboluri comerciale și alte simboluri. Caracterul 32 este un spațiu, adică. poziție goală în text. Toate celelalte se reflectă în anumite semne.
128 - 255	10000000 - 11111111	Parte alternativă a tabelului (rusă). A doua jumătate a tabelului de coduri ASCII, numită pagina de coduri (128 de coduri, începând cu 10000000 și terminând cu 11111111), poate avea variante diferite, fiecare variantă având propriul număr. Pagina de coduri este folosită în primul rând pentru a găzdui alfabetele naționale, altele decât latină. În codificările naționale rusești, această parte a tabelului conține simboluri ale alfabetului rus.

Prima jumătate a tabelului ASCII

Vă atrag atenția că în tabelul de codificare literele (majuscule și mici) sunt aranjate în ordine alfabetică, iar numerele sunt ordonate în ordine crescătoare a valorilor. Această respectare a ordinii lexicografice în aranjarea caracterelor se numește principiul codificării secvențiale a alfabetului.

Pentru literele alfabetului rus, se respectă și principiul codificării secvențiale.

A doua jumătate a tabelului ASCII

Din păcate, în prezent există cinci codificări chirilice diferite (KOI8-R, Windows. MS-DOS, Macintosh și ISO). Din această cauză, apar adesea probleme cu transferul de text rusesc de la un computer la altul, de la un sistem software la altul.

Cronologic, unul dintre primele standarde pentru codificarea literelor rusești pe computere a fost KOI8 ("Cod de schimb de informații, 8 biți"). Această codificare a fost folosită încă din anii 70 pe computerele din seria de calculatoare ES, iar de la mijlocul anilor 80 a început să fie folosită în primele versiuni rusificate ale sistemului de operare UNIX.

De la începutul anilor 90, vremea dominației sistemului de operare MS DOS, codificarea CP866 rămâne („CP” înseamnă „Code Page”).

Computerele Apple care rulează Mac OS folosesc propria lor codificare Mac.

În plus, Organizația Internațională pentru Standardizare (International Standards Organization, ISO) a aprobat o altă codificare numită ISO 8859-5 ca standard pentru limba rusă.

În prezent, cea mai comună codificare este Microsoft Windows, prescurtat ca CP1251.

De la sfârșitul anilor '90, problema standardizării codării caracterelor a fost rezolvată prin introducerea unui nou standard internațional numit Unicode... Aceasta este o codificare pe 16 biți, adică alocă 2 octeți de memorie pentru fiecare caracter. Desigur, acest lucru dublează cantitatea de memorie utilizată. Dar, pe de altă parte, un astfel de tabel de coduri permite includerea a până la 65536 de caractere. Specificația completă a standardului Unicode include toate alfabetele existente, dispărute și create artificial din lume, precum și multe simboluri matematice, muzicale, chimice și alte simboluri.

Să încercăm să folosim un tabel ASCII pentru a ne imagina cum vor arăta cuvintele în memoria computerului.

Reprezentarea internă a cuvintelor în memoria computerului

Uneori se întâmplă ca un text constând din litere ale alfabetului rus, primit de la un alt computer, să nu poată fi citit - un fel de „farful” este vizibil pe ecranul monitorului. Acest lucru se datorează faptului că computerele folosesc codificare diferită a caracterelor limbii ruse.

Excel pentru Office 365 Word pentru Office 365 Outlook pentru Office 365 PowerPoint pentru Office 365 Publisher pentru Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 2007 Outlook 2007070200702010 PowerPoint One 2007070200702010 Visio Standard 2007 Visio Standard 2010 Mai puțin

În acest articol

Introduceți un caracter ASCII sau Unicode într-un document

Dacă trebuie să introduceți doar câteva caractere speciale sau simboluri, puteți utiliza oricare dintre comenzile rapide de la tastatură. Pentru o listă de caractere ASCII, consultați tabelele următoare sau articolul Introducerea alfabetelor naționale folosind comenzile rapide de la tastatură.

Note:

Introduceți caractere ASCII

Pentru a introduce un caracter ASCII, țineți apăsată tasta ALT în timp ce introduceți codul caracterului. De exemplu, pentru a introduce un simbol grad (º), apăsați și mențineți apăsată tasta Alt, apoi introduceți 0176 pe tastatura numerică.

Utilizați tastatura numerică pentru a introduce numereîn loc de numere de pe tastatura principală. Dacă trebuie să introduceți numere pe tastatura numerică, asigurați-vă că indicatorul BLOCARE NUMĂR este aprins.

Inserarea caracterelor Unicode

Pentru a introduce un caracter Unicode, introduceți codul caracterului, apoi apăsați ALT și X în secvență. De exemplu, pentru a introduce un semn dolar ($), introduceți 0024 și apăsați ALT și X în secvență. Pentru toate codurile de caractere Unicode, consultați.

Important: Unele programe Microsoft Office, cum ar fi PowerPoint și InfoPath, nu acceptă conversia codurilor Unicode în caractere. Dacă trebuie să inserați un caracter Unicode într-unul dintre aceste programe, utilizați.

Note:

Dacă vedeți caracterul Unicode greșit după ce apăsați ALT + X, selectați codul corect, apoi apăsați din nou ALT + X.

În plus, „U +” trebuie introdus înaintea codului. De exemplu, dacă introduceți „1U + B5” și apăsați Alt + X, este afișat textul „1µ”, iar dacă introduceți „1B5” și apăsați Alt + X, este afișat caracterul „Ƶ”.

Folosind tabelul de simboluri

Symbol Map este un program încorporat în Microsoft Windows care vă permite să vizualizați simbolurile disponibile pentru un font selectat.

Folosind un tabel de simboluri, puteți copia simboluri individuale sau un grup de simboluri în clipboard și le puteți lipi în orice program care poate afișa acele simboluri. Deschiderea tabelului de simboluri

Pe Windows 10 Introduceți cuvântul „simbol” în caseta de căutare din bara de activități și selectați un tabel cu simboluri din rezultatele căutării.

Pe Windows 8 Introduceți cuvântul „caracter” pe ecranul de start și selectați un tabel de caractere din rezultatele căutării.

Pe Windows 7 apasa butonul start, selectați secvențial Toate programele, Standard, Serviciuși faceți clic tabel de simboluri.

Caracterele sunt grupate după font. Faceți clic pe lista de fonturi pentru a selecta setul de caractere corespunzător. Pentru a selecta un simbol, faceți clic pe el, apoi faceți clic Selectați... Pentru a insera un simbol, faceți clic dreapta pe locația dorită din document și selectați Introduce.

Coduri de simbol utilizate frecvent

Pentru o listă completă de caractere, consultați computerul dvs., tabelul cu coduri de caractere ASCII sau tabelele cu seturi de caractere Unicode.

Glifă

Unități monetare

Simboluri legale

Simboluri matematice

Fracții

Simboluri de punctuație și dialect

Formează simboluri

Codurile diacritice utilizate în mod obișnuit

Pentru o listă completă de glife și coduri aferente, consultați.

Glifă

Caractere de control ASCII neimprimabile

Caracterele folosite pentru a controla unele dispozitive periferice, cum ar fi imprimantele, sunt numerotate de la 0 la 31 în tabelul ASCII. De exemplu, un caracter de alimentare/nouă pagină este numărul 12. Acest caracter îi spune imprimantei să meargă în partea de sus a paginii următoare.

Tabel de caractere de control ASCII neimprimabil

Zecimal	Semn	Zecimal	Semn
		Eliberarea canalului de date
Începutul titlului		Primul cod de control al dispozitivului
Începutul textului		Al doilea cod de control al dispozitivului
Sfârșitul textului		Al treilea cod de control al dispozitivului
Sfârșitul transmisiei		Al patrulea cod de control al dispozitivului
	în cinci colţuri	Confirmare negativă
Confirmare		Mod transmisie sincronă
Semnal sonor		Sfârșitul blocului de date transmise

Filă orizontală		Sfârșitul media
Avans de linie / linie nouă		Caracter de înlocuire
Filă verticală			depaseste
Traducere pagină / pagină nouă	Al doisprezecelea	Separator de fișiere
Retur transport		Separator de grup
Schimbați fără a salva cifrele		Separator de înregistrări
Deplasare cu conservarea cifrelor	cincisprezece	Separator de date

Apropo, pe site-ul nostru puteți traduce orice text în cod zecimal, hexazecimal, binar folosind calculatorul de cod online.

Tabelul ASCII

ASCII (Codul standard american pentru schimbul de informații)

Tabel rezumat al codurilor ASCII

Tabel de coduri de caractere ASCII Windows (Win-1251)

		Simbol









		specialist. Tab
		specialist. LF (întoarcerea căruciorului)


		specialist. CR (Linie nouă)


















		ambreiaj SP (Spațiu)

		Simbol

Tabel ASCII extins

Formatarea caracterelor.

	Backspace (Backspace un caracter). Indică mișcarea mecanismului de imprimare sau a cursorului de afișare înapoi cu o poziție.
	Tabularea orizontală Afișează mișcarea motorului de imprimare sau a cursorului de afișare la următoarea „oprire de tablă”.
	Linie de alimentare. Afișează mișcarea motorului de imprimare sau a cursorului de afișare la începutul liniei următoare (cu o linie în jos).
	Tabularea verticală Afișează mișcarea motorului de imprimare sau a cursorului de afișare la următorul grup de linii.
	Feed de formulare. Indică mișcarea motorului de imprimare sau a cursorului de afișare la poziția de pornire a paginii, formularului sau ecranului următor.
	Retur transport. Afișează mișcarea mecanismului de imprimare sau a cursorului de afișare la poziția inițială (cel mai din stânga) a liniei curente.

Transfer de date.

	Începutul titlului. Folosit pentru a identifica începutul unui antet, care poate conține informații de rutare sau o adresă.
	Începutul textului. Afișează începutul textului și, în același timp, sfârșitul titlului.
	Sfârșitul textului. Se aplică la încheierea textului care a început cu caracterul STX.
	Anchetă. Solicitare de date de identificare (cum ar fi „Cine ești?”) de la stația de la distanță.
	Recunoașteți. Dispozitivul receptor transmite acest caracter expeditorului ca confirmare a recepției cu succes a datelor.
	Recunoaștere negativă. Dispozitivul receptor transmite acest caracter expeditorului în cazul refuzului (eșecului) recepției datelor.
	Sincron / Inactiv. Folosit în sistemele de transmisie sincronizată. Când nu există transmisie de date, sistemul trimite continuu simboluri SYN pentru a asigura sincronizarea.
	Sfârșitul blocului de transmisie. Indică sfârșitul unui bloc de date în scopuri de comunicare. Este folosit pentru împărțirea unor cantități mari de date în blocuri separate.

Marcaje de separare la transferul de informații.

Alte simboluri.

	Nul. (Fără caracter - fără date). Este folosit pentru transmitere în lipsa datelor.
	clopot Este folosit pentru controlul dispozitivelor de alarmă.
	Schimbă afară. Indică faptul că toate cuvintele de cod ulterioare ar trebui interpretate conform setului de caractere extern înainte de sosirea caracterului SI.
	Schimbă în. Indică faptul că cuvintele de cod ulterioare trebuie interpretate conform setului de caractere standard.
	Data Link Escape Schimbarea semnificației următoarelor caractere. Este folosit pentru control suplimentar sau pentru transferul unui model de biți arbitrar.
DC1, DC2, DC3, DC4	Comenzile dispozitivului. Simboluri pentru controlul dispozitivelor auxiliare (funcții speciale).
	Anulare. Indică faptul că datele care au precedat acest caracter într-un mesaj sau bloc ar trebui ignorate (de obicei, dacă se întâlnește o eroare).
	Sfârșitul Mediului. Indică capătul fizic al unei benzi sau al unui alt mediu de stocare
	Substitui Folosit pentru a înlocui un caracter eronat sau invalid.
	Evadare (Extensie). Folosit pentru a extinde codul, indicând faptul că caracterul următor are un sens alternativ.
	Spaţiu Un caracter care nu poate fi imprimat pentru a separa cuvintele sau pentru a muta motorul de imprimare sau pentru a afișa cursorul înainte cu o poziție.
	Șterge. Folosit pentru a șterge (șterge) caracterul anterior din mesaj

[Codări pe 8 biți: ASCII, KOI-8R și CP1251] Primele tabele de set de caractere create în SUA nu au folosit al optulea bit dintr-un octet. Textul a fost prezentat ca o secvență de octeți, dar al optulea bit nu a fost luat în considerare (a fost folosit în scopuri de service).

Standardul general acceptat a devenit tabelul ASCII(Codul American Standard pentru Schimbul de Informații). Primele 32 de caractere ASCII (de la 00 la 1F) au fost folosite pentru caracterele care nu pot fi imprimate. Au fost concepute pentru a controla un dispozitiv de imprimare și altele asemenea. Restul - de la 20 la 7F - sunt caractere normale (printabile).

Tabelul 1 - Codificare ASCII

Dec	Hex	oct	Char	Descriere
0	0	000		nul
1	1	001		începutul direcției
2	2	002		începutul textului
3	3	003		sfârşitul textului
4	4	004		sfârşitul transmisiei
5	5	005		Anchetă
6	6	006		recunoaște
7	7	007		clopot
8	8	010		backspace
9	9	011		filă orizontală
10	A	012		linie nouă
11	B	013		filă verticală
12	C	014		pagina noua
13	D	015		retur transport
14	E	016		schimbă afară
15	F	017		schimbă în
16	10	020		evadare a legăturii de date
17	11	021		controlul dispozitivului 1
18	12	022		controlul dispozitivului 2
19	13	023		controlul dispozitivului 3
20	14	024		controlul dispozitivului 4
21	15	025		recunoaștere negativă
22	16	026		inactiv sincron
23	17	027		sfârşitul trans. bloc
24	18	030		Anulare
25	19	031		sfârşitul mediei
26	1A	032		substitui
27	1B	033		evadare
28	1C	034		separator de fișiere
29	1D	035		separator de grup
30	1E	036		separator de înregistrări
31	1F	037		separator de unitate
32	20	040		spaţiu
33	21	041	!
34	22	042	"
35	23	043	#
36	24	044	$
37	25	045	%
38	26	046	&
39	27	047	"
40	28	050	(
41	29	051	)
42	2A	052	*
43	2B	053	+
44	2C	054	,
45	2D	055	-
46	2E	056	.
47	2F	057	/
48	30	060	0
49	31	061	1
50	32	062	2
51	33	063	3
52	34	064	4
53	35	065	5
54	36	066	6
55	37	067	7
56	38	070	8
57	39	071	9
58	3A	072	:
59	3B	073	;
60	3C	074	<
61	3D	075	=
62	3E	076	>
63	3F	077	?

Dec	Hex	oct	Char
64	40	100	@
65	41	101	A
66	42	102	B
67	43	103	C
68	44	104	D
69	45	105	E
70	46	106	F
71	47	107	G
72	48	110	H
73	49	111	eu
74	4A	112	J
75	4B	113	K
76	4C	114	L
77	4D	115	M
78	4E	116	N
79	4F	117	O
80	50	120	P
81	51	121	Q
82	52	122	R
83	53	123	S
84	54	124	T
85	55	125	U
86	56	126	V
87	57	127	W
88	58	130	X
89	59	131	Y
90	5A	132	Z
91	5B	133	[
92	5C	134	\
93	5D	135	]
94	5E	136	^
95	5F	137	_
96	60	140	`
97	61	141	A
98	62	142	b
99	63	143	c
100	64	144	d
101	65	145	e
102	66	146	f
103	67	147	g
104	68	150	h
105	69	151	i
106	6A	152	j
107	6B	153	k
108	6C	154	l
109	6D	155	m
110	6E	156	n
111	6F	157	o
112	70	160	p
113	71	161	q
114	72	162	r
115	73	163	s
116	74	164	t
117	75	165	u
118	76	166	v
119	77	167	w
120	78	170	X
121	79	171	y
122	7A	172	z
123	7B	173	{
124	7C	174	\|
125	7D	175	}
126	7E	176	~
127	7F	177	DEL

După cum puteți vedea cu ușurință, această codificare conține doar litere latine și cele care sunt folosite în engleză. Există, de asemenea, simboluri aritmetice și alte simboluri de serviciu. Dar nu există litere rusești, sau chiar litere latine speciale pentru germană sau franceză. Acest lucru este ușor de explicat - codificarea a fost dezvoltată special ca standard american. Când computerele au început să fie folosite în întreaga lume, a devenit necesară codificarea altor simboluri.

Pentru aceasta, s-a decis folosirea celui de-al optulea bit din fiecare octet. Astfel, au fost disponibile încă 128 de valori (de la 80 la FF), care puteau fi folosite pentru a codifica caractere. Primul dintre tabelele de opt biți este „ASCII extins” ( ASCII extins) - a inclus diverse variante de caractere latine utilizate în unele limbi ale Europei de Vest. Conținea și alte simboluri suplimentare, inclusiv pseudo-grafice.

Caracterele pseudo-grafice permit, prin afișarea doar a caracterelor text, să ofere o oarecare aparență de grafică. De exemplu, programul de gestionare a fișierelor FAR Manager funcționează cu ajutorul pseudo-grafice.

Nu existau litere rusești în tabelul ASCII extins. În Rusia (fostă URSS) și în alte state, au fost create propriile codificări, care au făcut posibilă reprezentarea unor caractere „naționale” specifice în fișiere text pe 8 biți - litere latine ale limbilor poloneză și cehă, chirilice (inclusiv litere rusești ) și alte alfabete.

În toate codificările care s-au răspândit, primele 127 de caractere (adică valorile octeților cu al optulea bit egal cu 0) coincid cu ASCII. Astfel, un fișier ASCII funcționează în oricare dintre aceste codificări; literele limbii engleze sunt reprezentate la fel.

Organizare ISO(International Standardization Organization) a adoptat un grup de standarde ISO 8859... Acesta definește codificări pe 8 biți pentru diferite grupuri de limbi. Deci, ISO 8859-1 este ASCII extins, un tabel pentru Statele Unite și Europa de Vest. Și ISO 8859-5 este un tabel pentru chirilic (inclusiv rus).

Cu toate acestea, din motive istorice, codarea ISO 8859-5 nu a prins. În realitate, următoarele codificări sunt folosite pentru limba rusă:

Pagina de cod 866 ( CP866), alias „DOS”, alias „codare GOST alternativă”. A fost folosit pe scară largă până la mijlocul anilor 90; este acum folosit într-o măsură limitată. Practic nu este folosit pentru distribuirea de texte pe Internet.
- KOI-8. Dezvoltat în anii 70 și 80. Este un standard general acceptat pentru transmiterea mesajelor poștale pe internetul rusesc. De asemenea, este utilizat pe scară largă în sistemele de operare din familia Unix, inclusiv Linux. Se numește versiunea KOI-8, concepută pentru limba rusă KOI-8R; există versiuni pentru alte limbi chirilice (de exemplu, KOI8-U este o opțiune pentru limba ucraineană).
- Pagina de cod 1251, CP1251, Windows-1251. Dezvoltat de Microsoft pentru a sprijini limba rusă în Windows.

Principalul avantaj al CP866 a fost păstrarea caracterelor pseudo-grafice în aceleași locuri ca în ASCII extins; prin urmare, programele cu text străin, de exemplu, celebrul Norton Commander, ar putea funcționa fără modificări. În prezent, CP866 este utilizat pentru programele Windows care rulează în ferestre text sau în modul text pe întreg ecranul, inclusiv FAR Manager.

În ultimii ani, textele în CP866 sunt destul de rare (dar sunt folosite pentru a codifica numele fișierelor rusești în Windows). Prin urmare, ne vom opri mai detaliat asupra altor două codificări - KOI-8R și CP1251.

După cum puteți vedea, în tabelul de codificare CP1251, literele rusești sunt aranjate în ordine alfabetică (cu excepția, totuși, a literei E). Acest aranjament facilitează sortarea alfabetică a programelor de calculator.

Dar în KOI-8R, ordinea literelor rusești pare să fie aleatorie. Dar de fapt nu este.

Multe programe mai vechi au pierdut al 8-lea bit la procesarea sau transmiterea textului. (Acum, astfel de programe practic s-au „stins”, dar la sfârșitul anilor 80 - începutul anilor 90 erau răspândite). Pentru a obține o valoare de 7 biți dintr-o valoare de 8 biți, scădeți 8 din cifra cea mai semnificativă; de exemplu, E1 devine 61.

Acum comparați KOI-8R cu tabelul ASCII (Tabelul 1). Veți descoperi că literele rusești sunt clar aliniate cu cele latine. Dacă al optulea bit dispare, literele rusești mici se transformă în litere latine mari, iar literele rusești mari se transformă în litere latine mici. Deci, E1 în KOI-8 este rusă „A”, în timp ce 61 în ASCII este latină „a”.

Deci, KOI-8 vă permite să păstrați lizibilitatea textului rusesc în timp ce pierdeți al 8-lea bit. „Salut tuturor” devine „pRIWET WSEM”.

Recent, atât ordinea alfabetică a caracterelor din tabelul de codificare, cât și lizibilitatea cu pierderea celui de-al 8-lea bit și-au pierdut importanța decisivă. Al optulea bit în computerele moderne nu se pierde nici în timpul transmisiei, nici în timpul procesării. Sortarea în ordine alfabetică se bazează pe codificare, și nu pe simpla comparație a codurilor. (Apropo, codurile CP1251 nu sunt complet alfabetice - litera E nu este la locul ei).

Datorită faptului că există două codificări comune, atunci când lucrați cu Internetul (e-mail, navigarea pe site-uri web), uneori puteți vedea un set de litere fără sens în loc de text rusesc. De exemplu, „Sunt SBUFEMHEL”. Acestea sunt doar cuvintele „cu respect”; dar au fost codificate în codificare CP1251, iar computerul a decodat textul conform tabelului KOI-8. Dacă aceleași cuvinte au fost, dimpotrivă, codificate în KOI-8, iar computerul a decodat textul conform tabelului CP1251, rezultatul va fi „У ХЧБЦЕОЙЕН”.

Uneori se întâmplă ca computerul să decripteze literele în limba rusă conform unui tabel care nu este destinat limbii ruse. Apoi, în loc de litere rusești, apare un set de simboluri fără sens (de exemplu, litere latine ale limbilor est-europene); ele sunt adesea numite „crocozyabras”.

În cele mai multe cazuri, programele moderne fac față singure cu determinarea codificărilor documentelor de pe Internet (e-mailuri și pagini web). Dar uneori „raușesc” și apoi puteți vedea secvențe ciudate de litere rusești sau „krokozyabra”. De regulă, pentru a afișa text real pe ecran, este suficient să selectați codarea manual în meniul programului.

Pentru articol s-au folosit informațiile de pe pagina http://open-office.edusite.ru/TextProcessor/p5aa1.html.

Material preluat de pe site: