Dihet që në tabelën e kodeve ka karaktere ascii. Kodimi ASCII (kodi standard amerikan për shkëmbimin e informacionit) - kodimi bazë i tekstit për latinisht

11.08.2019 Këshilla

Bashkësia e karaktereve me të cilat shkruhet teksti quhet alfabeti.

Numri i karaktereve në alfabet është i tij pushtetin.

Formula për përcaktimin e sasisë së informacionit: N = 2 b,

ku N është kardinaliteti i alfabetit (numri i karaktereve),

b - numri i biteve (pesha informative e karakterit).

Alfabeti me një kapacitet prej 256 karakteresh mund të strehojë pothuajse të gjitha karakteret e nevojshme. Ky alfabet quhet mjaftueshëm.

Sepse 256 = 2 8, atëherë pesha e 1 karakteri është 8 bit.

Njësia 8-bitëshe u emërua 1 bajt:

1 bajt = 8 bit.

Kodi binar i çdo karakteri në tekstin kompjuterik merr 1 bajt memorie.

Si paraqitet informacioni i tekstit në memorien e kompjuterit?

Lehtësia e kodimit të karaktereve me bajt është e dukshme, pasi një bajt është pjesa më e vogël e adresueshme e memories dhe, për rrjedhojë, procesori mund të aksesojë çdo karakter veç e veç, duke kryer përpunimin e tekstit. Nga ana tjetër, 256 karaktere është një numër mjaft i mjaftueshëm për të përfaqësuar një shumëllojshmëri të gjerë të informacionit të karaktereve.

Tani lind pyetja, çfarë lloj kodi binar tetë-bit të lidhet me secilin karakter.

Është e qartë se kjo është një çështje e kushtëzuar, ju mund të dilni me shumë metoda kodimi.

Të gjithë karakteret e alfabetit të kompjuterit numërohen nga 0 deri në 255. Çdo numër korrespondon me një kod binar tetë-bitësh nga 00000000 deri në 11111111. Ky kod është thjesht numri rendor i karakterit në sistemin e numrave binar.

Tabela në të cilën të gjithë karakteret e alfabetit të kompjuterit janë caktuar numra serialë quhet tabela e kodimit.

Për lloje të ndryshme kompjuterash përdoren tabela të ndryshme kodimi.

Standardi ndërkombëtar për PC është bërë tabela ASCII(lexo asci) (Kodi standard amerikan për shkëmbimin e informacionit).

Tabela ASCII është e ndarë në dy pjesë.

Standardi ndërkombëtar është vetëm gjysma e parë e tabelës, d.m.th. simbolet me numra nga 0 (00000000), deri në 127 (01111111).

Struktura e tabelës koduese ASCII

Numër serik	Kodi	Simboli
0 - 31	00000000 - 00011111	Simbolet me numra nga 0 në 31 zakonisht quhen karaktere kontrolli. Funksioni i tyre është të kontrollojnë procesin e shfaqjes së tekstit në ekran ose të printimit, dhënien e një sinjali zanor, shënimin e tekstit, etj.
32 - 127	00100000 - 01111111	Pjesa standarde e tabelës (anglisht). Këtu përfshihen shkronjat e vogla dhe të mëdha të alfabetit latin, shifrat dhjetore, shenjat e pikësimit, të gjitha llojet e kllapave, simbolet tregtare dhe të tjera. Karakteri 32 është një hapësirë, d.m.th. pozicion bosh në tekst. Të gjitha të tjerat pasqyrohen në shenja të caktuara.
128 - 255	10000000 - 11111111	Pjesa alternative e tabelës (rusisht). Gjysma e dytë e tabelës së kodeve ASCII, e quajtur faqja e kodit (128 kode, duke filluar nga 10000000 dhe duke përfunduar me 11111111), mund të ketë variante të ndryshme, secili variant ka numrin e vet. Faqja e kodit përdoret kryesisht për të akomoduar alfabete kombëtare të ndryshme nga latinishtja. Në kodimet kombëtare ruse, kjo pjesë e tabelës përmban simbole të alfabetit rus.

Gjysma e parë e tabelës ASCII

Unë tërheq vëmendjen tuaj për faktin se në tabelën e kodimit, shkronjat (të mëdha dhe të vogla) janë renditur sipas rendit alfabetik, dhe numrat janë renditur në rendin rritës të vlerave. Ky respektim i rendit leksikografik në renditjen e karaktereve quhet parimi i kodimit sekuencial të alfabetit.

Për shkronjat e alfabetit rus, respektohet edhe parimi i kodimit sekuencial.

Gjysma e dytë e tabelës ASCII

Fatkeqësisht, aktualisht ekzistojnë pesë kodime të ndryshme cirilike (KOI8-R, Windows. MS-DOS, Macintosh dhe ISO). Për shkak të kësaj, shpesh lindin probleme me transferimin e tekstit rus nga një kompjuter në tjetrin, nga një sistem softuer në tjetrin.

Kronologjikisht, një nga standardet e para për kodimin e shkronjave ruse në kompjuter ishte KOI8 ("Kodi i shkëmbimit të informacionit, 8-bit"). Ky kodim u përdor përsëri në vitet '70 në kompjuterët e serisë kompjuterike ES, dhe nga mesi i viteve '80 filloi të përdoret në versionet e para të rusifikuara të sistemit operativ UNIX.

Që nga fillimi i viteve '90, koha e dominimit të sistemit operativ MS DOS, kodimi CP866 mbetet ("CP" do të thotë "Faqja e kodit").

Kompjuterët Apple me Mac OS përdorin kodimin e tyre Mac.

Për më tepër, Organizata Ndërkombëtare e Standardeve (ISO) ka miratuar një kodim tjetër të quajtur ISO 8859-5 si standard për gjuhën ruse.

Aktualisht, kodimi më i zakonshëm është Microsoft Windows, i shkurtuar si CP1251.

Që nga fundi i viteve '90, problemi i standardizimit të kodimit të karaktereve është zgjidhur me futjen e një standardi të ri ndërkombëtar të quajtur Unicode... Ky është një kodim 16-bit d.m.th. cakton 2 bajt memorie për çdo karakter. Sigurisht, kjo dyfishon sasinë e memories së përdorur. Por nga ana tjetër, një tabelë e tillë kodesh lejon përfshirjen deri në 65536 karaktere. Specifikimi i plotë i standardit Unicode përfshin të gjitha alfabetet ekzistuese, të zhdukura dhe të krijuara artificialisht të botës, si dhe shumë simbole matematikore, muzikore, kimike dhe të tjera.

Le të përpiqemi të përdorim një tabelë ASCII për të imagjinuar se si do të duken fjalët në kujtesën e kompjuterit.

Paraqitja e brendshme e fjalëve në kujtesën e kompjuterit

Ndonjëherë ndodh që një tekst i përbërë nga shkronja të alfabetit rus, i marrë nga një kompjuter tjetër, nuk mund të lexohet - një lloj "korrizi" është i dukshëm në ekranin e monitorit. Kjo për faktin se kompjuterët përdorin kodime të ndryshme të karaktereve të gjuhës ruse.

Excel për Office 365 Word për Office 365 Outlook për Office 365 PowerPoint për Office 365 Publisher për Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 2007 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 Më të vogla

Në këtë artikull

Futni një karakter ASCII ose Unicode në një dokument

Nëse ju duhet të futni vetëm disa karaktere ose simbole të veçanta, mund të përdorni ose shkurtoret e tastierës. Për një listë të karaktereve ASCII, shihni tabelat e mëposhtme ose artikullin Fut alfabetet kombëtare duke përdorur shkurtoret e tastierës.

Shënime:

Fut karaktere ASCII

Për të futur një karakter ASCII, shtypni dhe mbani tastin ALT ndërsa futni kodin e karakterit. Për shembull, për të futur një simbol të shkallës (º), shtypni dhe mbani tastin Alt, më pas futni 0176 në tastierën numerike.

Përdorni tastierën numerike për të futur numra në vend të numrave në tastierën kryesore. Nëse duhet të futni numra në tastierën numerike, sigurohuni që treguesi NUM LOCK të jetë i ndezur.

Futja e karaktereve Unicode

Për të futur një karakter Unicode, futni kodin e karakterit, më pas shtypni ALT dhe X në sekuencë. Për shembull, për të futur një shenjë dollari ($), futni 0024 dhe shtypni ALT dhe X me radhë. Për të gjitha kodet e karaktereve të Unicode, shihni.

E rëndësishme: Disa programe të Microsoft Office, të tilla si PowerPoint dhe InfoPath, nuk mbështesin konvertimin e kodeve të Unicode në karaktere. Nëse keni nevojë të futni një karakter Unicode në një nga këto programe, përdorni.

Shënime:

Nëse shihni karakterin e gabuar të Unicode pasi shtypni ALT + X, zgjidhni kodin e duhur dhe më pas shtypni përsëri ALT + X.

Për më tepër, "U +" duhet të futet përpara kodit. Për shembull, nëse futni "1U + B5" dhe shtypni Alt + X, shfaqet teksti "1µ", dhe nëse futni "1B5" dhe shtypni Alt + X, shfaqet karakteri "Ƶ".

Duke përdorur tabelën e simboleve

Symbol Map është një program i integruar në Microsoft Windows që ju lejon të shikoni simbolet e disponueshme për një font të zgjedhur.

Duke përdorur një tabelë simbolesh, mund të kopjoni simbole individuale ose një grup simbolesh në kujtesën e fragmenteve dhe t'i ngjisni në çdo program që mund t'i shfaqë ato simbole. Hapja e tabelës së simboleve

Në Windows 10 Futni fjalën "simbol" në kutinë e kërkimit në shiritin e detyrave dhe zgjidhni një tabelë simbolesh nga rezultatet e kërkimit.

Në Windows 8 Futni fjalën "karakter" në ekranin bazë dhe zgjidhni një tabelë karakteresh nga rezultatet e kërkimit.

Në Windows 7 Shtyp butonin Filloni, zgjidhni në mënyrë sekuenciale Të gjitha programet, Standard, Shërbimi dhe klikoni tabela e simboleve.

Karakteret janë grupuar sipas fontit. Klikoni në listën e shkronjave për të zgjedhur grupin e duhur të karaktereve. Për të zgjedhur një simbol, klikoni mbi të dhe më pas klikoni Zgjidhni... Për të futur një simbol, klikoni me të djathtën në vendndodhjen e dëshiruar në dokument dhe zgjidhni Fut.

Kodet e simboleve të përdorura shpesh

Për një listë të plotë të karaktereve, shihni kompjuterin tuaj, tabelën e kodit të karaktereve ASCII ose tabelat e grupeve të karaktereve Unicode.

Glyph

Njësitë monetare

Simbolet ligjore

Simbolet e matematikës

Thyesat

Simbolet e pikësimit dhe dialekteve

Forma simbole

Kodet diakritike të përdorura zakonisht

Për një listë të plotë të glifeve dhe kodeve përkatëse, shihni.

Glyph

Karaktere kontrolli ASCII jo të printueshme

Karakteret e përdorura për të kontrolluar disa pajisje periferike, të tilla si printerët, numërohen 0–31 në tabelën ASCII. Për shembull, një karakter ushqimor / faqe e re është numri 12. Ky karakter i thotë printerit të shkojë në krye të faqes tjetër.

Tabela e karaktereve të kontrollit ASCII jo të printueshme

dhjetore	Shenjë	dhjetore	Shenjë
		Lirimi i kanalit të të dhënave
Fillimi i titullit		Kodi i parë i kontrollit të pajisjes
Fillimi i tekstit		Kodi i dytë i kontrollit të pajisjes
Fundi i tekstit		Kodi i tretë i kontrollit të pajisjes
Fundi i transmetimit		Kodi i katërt i kontrollit të pajisjes
	me pesë cepa	Konfirmim negativ
Konfirmimi		Mënyra e transmetimit sinkron
Sinjali i zërit		Fundi i bllokut të të dhënave të transmetuara

Skeda horizontale		Fundi i medias
Furnizimi i linjës / linjë e re		Karakteri zëvendësues
Skeda vertikale			tejkalojnë
Përkthimi i faqes / faqe e re	I dymbëdhjeti	Ndarës i skedarëve
Kthim ngarkese		Ndarës grupi
Zhvendos pa ruajtur shifra		Ndarës rekordesh
Zhvendosja me ruajtjen e shifrave	pesëmbëdhjetë	Ndarës i të dhënave

Nga rruga, në faqen tonë ju mund të përktheni çdo tekst në kodin dhjetor, heksadecimal, binar duke përdorur kalkulatorin e kodit në internet.

Tabela ASCII

ASCII (Kodi standard amerikan për shkëmbimin e informacionit)

Tabela përmbledhëse e kodeve ASCII

Tabela e kodit të karaktereve të Windows ASCII (Win-1251)

		Simboli









		specialist. Tab
		specialist. LF (Kthimi me karrocë)


		specialist. CR (Linja e re)


















		tufë SP (Hapësirë)

		Simboli

Tabela e zgjeruar ASCII

Formatimi i karaktereve.

	Backspace (Backspace një karakter). Tregon lëvizjen e mekanizmit të printimit ose të kursorit të ekranit prapa një pozicioni.
	Tabela horizontale Tregon lëvizjen e motorit të printimit ose kursorit të ekranit në "stop ndalesën" tjetër të përshkruar.
	Furnizimi i linjës. Tregon lëvizjen e motorit të printimit ose kursorit të ekranit në fillim të rreshtit tjetër (një rresht poshtë).
	Tabela vertikale Tregon lëvizjen e motorit të printimit ose kursorit të ekranit në grupin vijues të rreshtave.
	Furnizimi i formularit. Tregon lëvizjen e motorit të printimit ose kursorit të ekranit në pozicionin fillestar të faqes, formularit ose ekranit tjetër.
	Kthim ngarkese. Tregon lëvizjen e mekanizmit të printimit ose kursorit të ekranit në pozicionin origjinal (më të majtë) të linjës aktuale.

Transferimi i të dhënave.

	Fillimi i titullit. Përdoret për të identifikuar fillimin e një titulli, i cili mund të përmbajë informacione rutimi ose një adresë.
	Fillimi i tekstit. Tregon fillimin e tekstit dhe në të njëjtën kohë fundin e titullit.
	Fundi i tekstit. Zbatohet kur përfundon tekstin që fillon me karakterin STX.
	hetim. Kërkesë për të dhëna identifikimi (si "Kush je ti?") Nga stacioni i largët.
	pranoni. Pajisja marrëse ia transmeton këtë karakter dërguesit si konfirmim për marrjen e suksesshme të të dhënave.
	Mirënjohja negative. Pajisja marrëse ia transmeton këtë karakter dërguesit në rast të refuzimit (dështimit) të marrjes së të dhënave.
	Sinkron / I papunë. Përdoret në sistemet e transmisionit të sinkronizuar. Kur nuk ka transmetim të të dhënave, sistemi dërgon vazhdimisht simbolet SYN për të siguruar sinkronizimin.
	Fundi i bllokut të transmetimit. Tregon fundin e një blloku të dhënash për qëllime komunikimi. Përdoret për ndarjen e sasive të mëdha të të dhënave në blloqe të veçanta.

Ndarja e shenjave gjatë transferimit të informacionit.

Simbole të tjera.

	I pavlefshëm. (Pa karakter - pa të dhëna). Përdoret për transmetim në mungesë të të dhënave.
	zile Përdoret për të kontrolluar pajisjet e alarmit.
	Zhvendos jashtë. Tregon që të gjitha fjalët e koduara pasuese duhet të interpretohen sipas grupit të karaktereve të jashtme përpara mbërritjes së karakterit SI.
	Shift In. Tregon që fjalët e koduara pasuese duhet të interpretohen sipas grupit standard të karaktereve.
	Arratisja e lidhjes së të dhënave Ndryshimi i kuptimit të karaktereve të mëposhtme. Përdoret për kontroll shtesë ose për transferimin e një modeli arbitrar bit.
DC1, DC2, DC3, DC4	Kontrollet e pajisjes. Simbolet për kontrollin e pajisjeve ndihmëse (funksione speciale).
	Anulo. Tregon që të dhënat që i paraprinë këtij karakteri në një mesazh ose bllok duhet të injorohen (zakonisht nëse haset një gabim).
	Fundi i Mediumit. Tregon fundin fizik të një shiriti ose mediumi tjetër ruajtës
	Zëvendësues Përdoret për të zëvendësuar një karakter të gabuar ose të pavlefshëm.
	Arratisje (Zgjerim). Përdoret për të zgjeruar kodin, duke treguar se karakteri pasues ka një kuptim alternativ.
	Hapësirë Një karakter jo i printueshëm për të ndarë fjalët ose për të lëvizur motorin e printimit ose kursorin e ekranit një pozicion përpara.
	Fshije. Përdoret për të fshirë (fshirë) karakterin e mëparshëm në mesazh

[Kodimi 8-bit: ASCII, KOI-8R dhe CP1251] Tabelat e para të grupeve të karaktereve të krijuara në SHBA nuk përdorën bitin e tetë në një bajt. Teksti u paraqit si një sekuencë bajtash, por biti i tetë nuk u mor parasysh (është përdorur për qëllime shërbimi).

Standardi i pranuar përgjithësisht është bërë tabela ASCII(Kodi standard amerikan për shkëmbimin e informacionit). 32 karakteret e para ASCII (00 deri në 1F) u përdorën për karaktere që nuk mund të printohen. Ato ishin krijuar për të kontrolluar një pajisje printimi dhe të ngjashme. Pjesa tjetër - nga 20 në 7 F - janë karaktere normale (të printueshme).

Tabela 1 - Kodimi ASCII

dhjetor	Heks	tetor	Char	Përshkrim
0	0	000		i pavlefshëm
1	1	001		fillimi i titullit
2	2	002		fillimi i tekstit
3	3	003		fundi i tekstit
4	4	004		fundi i transmetimit
5	5	005		hetim
6	6	006		pranoj
7	7	007		zile
8	8	010		backspace
9	9	011		skedë horizontale
10	A	012		linjë e re
11	B	013		skedë vertikale
12	C	014		faqe e re
13	D	015		kthim ngarkese
14	E	016		zhvendosja jashtë
15	F	017		zhvendosje brenda
16	10	020		ikja e lidhjes së të dhënave
17	11	021		kontrolli i pajisjes 1
18	12	022		kontrolli i pajisjes 2
19	13	023		kontrolli i pajisjes 3
20	14	024		kontrolli i pajisjes 4
21	15	025		pranimi negativ
22	16	026		boshe sinkron
23	17	027		fundi i trans. bllokoj
24	18	030		anuloni
25	19	031		fundi i mesëm
26	1A	032		zëvendësues
27	1B	033		arratisje
28	1C	034		ndarës i skedarëve
29	1D	035		ndarës grupi
30	1E	036		ndarës rekord
31	1F	037		ndarës njësi
32	20	040		hapësirë
33	21	041	!
34	22	042	"
35	23	043	#
36	24	044	$
37	25	045	%
38	26	046	&
39	27	047	"
40	28	050	(
41	29	051	)
42	2A	052	*
43	2B	053	+
44	2C	054	,
45	2D	055	-
46	2E	056	.
47	2F	057	/
48	30	060	0
49	31	061	1
50	32	062	2
51	33	063	3
52	34	064	4
53	35	065	5
54	36	066	6
55	37	067	7
56	38	070	8
57	39	071	9
58	3A	072	:
59	3B	073	;
60	3C	074	<
61	3D	075	=
62	3E	076	>
63	3F	077	?

dhjetor	Heks	tetor	Char
64	40	100	@
65	41	101	A
66	42	102	B
67	43	103	C
68	44	104	D
69	45	105	E
70	46	106	F
71	47	107	G
72	48	110	H
73	49	111	Unë
74	4A	112	J
75	4B	113	K
76	4C	114	L
77	4D	115	M
78	4E	116	N
79	4F	117	O
80	50	120	P
81	51	121	P
82	52	122	R
83	53	123	S
84	54	124	T
85	55	125	U
86	56	126	V
87	57	127	W
88	58	130	X
89	59	131	Y
90	5A	132	Z
91	5B	133	[
92	5C	134	\
93	5D	135	]
94	5E	136	^
95	5F	137	_
96	60	140	`
97	61	141	a
98	62	142	b
99	63	143	c
100	64	144	d
101	65	145	e
102	66	146	f
103	67	147	g
104	68	150	h
105	69	151	i
106	6A	152	j
107	6B	153	k
108	6C	154	l
109	6D	155	m
110	6E	156	n
111	6F	157	o
112	70	160	fq
113	71	161	q
114	72	162	r
115	73	163	s
116	74	164	t
117	75	165	u
118	76	166	v
119	77	167	w
120	78	170	x
121	79	171	y
122	7A	172	z
123	7B	173	{
124	7C	174	\|
125	7D	175	}
126	7E	176	~
127	7F	177	DEL

Siç mund ta shihni lehtësisht, ky kodim përmban vetëm shkronja latine dhe ato që përdoren në anglisht. Ekzistojnë gjithashtu simbole aritmetike dhe të tjera shërbimi. Por nuk ka shkronja ruse, madje as shkronja të veçanta latine për gjermanishten apo frëngjishten. Kjo është e lehtë për t'u shpjeguar - kodimi u zhvillua posaçërisht si një standard amerikan. Kur kompjuterët filluan të përdoren në të gjithë botën, u bë i nevojshëm kodimi i simboleve të tjera.

Për këtë, u vendos që të përdoret biti i tetë në çdo bajt. Kështu, 128 vlera të tjera ishin në dispozicion (nga 80 në FF), të cilat mund të përdoren për të koduar karakteret. E para nga tabelat me tetë bit është "ASCII e zgjeruar" ( ASCII i zgjeruar) - përfshinte variante të ndryshme të karaktereve latine të përdorura në disa gjuhë të Evropës Perëndimore. Ai gjithashtu përmbante simbole të tjera shtesë, duke përfshirë pseudografikë.

Karakteret pseudografike lejojnë, duke shfaqur vetëm karaktere teksti, të japin njëfarë pamjeje grafike. Për shembull, programi për menaxhimin e skedarëve FAR Manager funksionon me ndihmën e pseudografikës.

Nuk kishte shkronja ruse në tabelën e zgjeruar ASCII. Në Rusi (ish BRSS) dhe në shtetet e tjera, u krijuan kodimet e tyre, të cilat bënë të mundur përfaqësimin e karaktereve specifike "kombëtare" në skedarë teksti 8-bit - shkronja latine të gjuhëve polake dhe çeke, cirilike (përfshirë shkronjat ruse ) dhe alfabete të tjera.

Në të gjitha kodimet që janë bërë të përhapura, 127 karakteret e para (d.m.th., vlerat e bajtit me bitin e tetë të barabartë me 0) përkojnë me ASCII. Kështu, një skedar ASCII funksionon në cilindo nga këto kodime; shkronjat e gjuhës angleze përfaqësohen në të njëjtën mënyrë.

Organizimi ISO(Organizata Ndërkombëtare e Standardizimit) miratoi një grup standardesh ISO 8859... Ai përcakton kodimet 8-bit për grupe të ndryshme gjuhësh. Pra, ISO 8859-1 është Extended ASCII, një tabelë për Shtetet e Bashkuara dhe Evropën Perëndimore. Dhe ISO 8859-5 është një tabelë për cirilik (përfshirë rusishten).

Megjithatë, për arsye historike, kodimi ISO 8859-5 nuk ka arritur. Në realitet, kodimet e mëposhtme përdoren për gjuhën ruse:

Kodi Faqe 866 ( CP866), i njohur si "DOS", i njohur si "kodimi alternativ GOST". U përdor gjerësisht deri në mesin e viteve '90; tani përdoret në një masë të kufizuar. Praktikisht nuk përdoret për shpërndarjen e teksteve në internet.
- KOI-8. Zhvilluar në vitet '70 dhe '80. Është një standard përgjithësisht i pranuar për transmetimin e mesazheve postare në internetin rus. Përdoret gjithashtu gjerësisht në sistemet operative të familjes Unix, duke përfshirë Linux. Versioni KOI-8, i krijuar për gjuhën ruse, quhet KOI-8R; ka versione për gjuhë të tjera cirilike (për shembull, KOI8-U është një opsion për gjuhën ukrainase).
- Kodi Faqe 1251, CP1251, Windows-1251. Zhvilluar nga Microsoft për të mbështetur gjuhën ruse në Windows.

Avantazhi kryesor i CP866 ishte ruajtja e karaktereve pseudografike në të njëjtat vende si në Extended ASCII; prandaj, programet me tekst të huaj, për shembull, i famshëm Norton Commander, mund të funksiononin pa ndryshime. Në ditët e sotme CP866 përdoret për programet Windows që ekzekutohen në dritare me tekst ose në modalitetin e tekstit në ekran të plotë, duke përfshirë "FAR Manager".

Vitet e fundit, tekstet në CP866 janë mjaft të rralla (por përdoret për të koduar emrat e skedarëve rusë në Windows). Prandaj, do të ndalemi më në detaje në dy kodime të tjera - KOI-8R dhe CP1251.

Siç mund ta shihni, në tabelën e kodimit CP1251, shkronjat ruse janë rregulluar sipas rendit alfabetik (me përjashtim të shkronjës E). Ky rregullim e bën shumë të lehtë që programet kompjuterike të renditen sipas alfabetit.

Por në KOI-8R, renditja e shkronjave ruse duket të jetë e rastësishme. Por në fakt nuk është kështu.

Shumë programe të vjetra humbën bitin e 8-të gjatë përpunimit ose transmetimit të tekstit. (Tani programe të tilla praktikisht janë "shuar", por në fund të viteve '80 - fillimi i viteve '90 ato ishin të përhapura). Për të marrë një vlerë 7-bitësh nga një vlerë 8-bitësh, zbritni 8 nga shifra më e rëndësishme; për shembull E1 bëhet 61.

Tani krahasoni KOI-8R me tabelën ASCII (Tabela 1). Do të zbuloni se shkronjat ruse janë të lidhura qartë me ato latine. Nëse biti i tetë zhduket, shkronjat e vogla ruse kthehen në shkronja të mëdha latine dhe shkronjat e mëdha ruse kthehen në shkronja të vogla latine. Pra, E1 në KOI-8 është rusisht "A", ndërsa 61 në ASCII është latinisht "a".

Pra, KOI-8 ju lejon të ruani lexueshmërinë e tekstit rus duke humbur bitin e 8-të. "Përshëndetje të gjithëve" bëhet "pRIWET WSEM".

Kohët e fundit, si rendi alfabetik i karaktereve në tabelën e kodimit ashtu edhe lexueshmëria me humbjen e bitit të 8-të kanë humbur rëndësinë e tyre vendimtare. Biti i tetë në kompjuterët modernë nuk humbet as gjatë transmetimit dhe as gjatë përpunimit. Renditja sipas rendit alfabetik bazohet në kodim, dhe jo në krahasim të thjeshtë të kodeve. (Nga rruga, kodet CP1251 nuk janë plotësisht alfabetike - shkronja E nuk është në vendin e saj).

Për shkak të faktit se ekzistojnë dy kodime të zakonshme, kur punoni me internetin (mail, shfletimi i faqeve në internet), ndonjëherë mund të shihni një grup të pakuptimtë shkronjash në vend të tekstit rus. Për shembull, "Unë jam SBUFEMHEL". Këto janë vetëm fjalët "me respekt"; por ato ishin të koduara në kodimin CP1251, dhe kompjuteri deshifroi tekstin sipas tabelës KOI-8. Nëse të njëjtat fjalë ishin, përkundrazi, të koduara në KOI-8, dhe kompjuteri deshifroi tekstin sipas tabelës CP1251, rezultati do të jetë "У ХЧБЦЕОЙЕН".

Ndonjëherë ndodh që kompjuteri të deshifrojë fare shkronjat në gjuhën ruse sipas një tabele që nuk është menduar për gjuhën ruse. Pastaj, në vend të shkronjave ruse, shfaqet një grup simbolesh të pakuptimta (për shembull, shkronja latine të gjuhëve të Evropës Lindore); ata shpesh quhen "crocozyabras".

Në shumicën e rasteve, programet moderne përballen me përcaktimin e kodimeve të dokumenteve të Internetit (email dhe faqe në internet). Por ndonjëherë ata "shkojnë keq", dhe më pas mund të shihni sekuenca të çuditshme të shkronjave ruse ose "krokozyabra". Si rregull, për të shfaqur tekstin real në ekran, mjafton të zgjidhni kodimin manualisht në menunë e programit.

Për artikullin, u përdor informacioni nga faqja http://open-office.edusite.ru/TextProcessor/p5aa1.html.

Materiali i marrë nga faqja: