Kodet e karaktereve latine. Kodimi ASCII (kodi standard amerikan për shkëmbimin e informacionit) - kodimi bazë i tekstit për latinisht

05.09.2019 Interesante

dhjetor	Heks	Simboli	dhjetor	Heks	Simboli
000	00	specialist. JO	128	80	Ђ
001	01	specialist. SOH	129	81	Ѓ
002	02	specialist. STX	130	82	‚
003	03	specialist. ETX	131	83	ѓ
004	04	specialist. EOT	132	84	„
005	05	specialist. ENQ	133	85	…
006	06	specialist. ACK	134	86	†
007	07	specialist. BEL	135	87	‡
008	08	specialist. BS	136	88	€
009	09	specialist. TAB	137	89	‰
010	0A	specialist. LF	138	8A	Љ
011	0B	specialist. VT	139	8B	‹ ‹
012	0C	specialist. FF	140	8C	Њ
013	0D	specialist. CR	141	8D	Ќ
014	0E	specialist. KËSHTU QË	142	8E	Ћ
015	0F	specialist. SI	143	8F	Џ
016	10	specialist. DLE	144	90	ђ
017	11	specialist. DC1	145	91	‘
018	12	specialist. DC2	146	92	’
019	13	specialist. DC3	147	93	“
020	14	specialist. DC4	148	94	”
021	15	specialist. NAK	149	95
022	16	specialist. SYN	150	96	–
023	17	specialist. ETB	151	97	—
024	18	specialist. MUND	152	98
025	19	specialist. EM	153	99	™
026	1A	specialist. NËN	154	9A	љ
027	1B	specialist. ESC	155	9B	›
028	1C	specialist. FS	156	9C	њ
029	1D	specialist. GS	157	9D	ќ
030	1E	specialist. Rs	158	9E	ћ
031	1F	specialist. SHBA	159	9F	џ
032	20	tufë SP (Hapësirë)	160	A0
033	21	!	161	A1	Ў
034	22	"	162	A2	ў
035	23	#	163	A3	Ћ
036	24	$	164	A4	¤
037	25	%	165	A5	Ґ
038	26	&	166	A6	¦
039	27	"	167	A7	§
040	28	(	168	A8	Jo
041	29	)	169	A9	©
042	2A	*	170	AA	Є
043	2B	+	171	AB	«
044	2C	,	172	AC	¬
045	2D	-	173	pas Krishtit
046	2E	.	174	AE	®
047	2F	/	175	AF	Ї
048	30	0	176	B0	°
049	31	1	177	B1	±
050	32	2	178	B2	І
051	33	3	179	B3	і
052	34	4	180	B4	ґ
053	35	5	181	B5	µ
054	36	6	182	B6	¶
055	37	7	183	B7	·
056	38	8	184	B8	e
057	39	9	185	B9	№
058	3A	:	186	BA	є
059	3B	;	187	BB	»
060	3C	<	188	para Krishtit	ј
061	3D	=	189	BD	Ѕ
062	3E	>	190	BËHET	ѕ
063	3F	?	191	Bf	ї
064	40	@	192	C0	A
065	41	A	193	C1	B
066	42	B	194	C2	V
067	43	C	195	C3	G
068	44	D	196	C4	D
069	45	E	197	C5	E
070	46	F	198	C6	F
071	47	G	199	C7	Z
072	48	H	200	C8	DHE
073	49	Unë	201	C9	Th
074	4A	J	202	CA	TE
075	4B	K	203	CB	L
076	4C	L	204	CC	M
077	4D	M	205	CD	N
078	4E	N	206	CE	O
079	4F	O	207	CF	P
080	50	P	208	D0	R
081	51	P	209	D1	ME
082	52	R	210	D2	T
083	53	S	211	D3	Kanë
084	54	T	212	D4	F
085	55	U	213	D5	X
086	56	V	214	D6	C
087	57	W	215	D7	H
088	58	X	216	D8	Sh
089	59	Y	217	D9	SCH
090	5A	Z	218	DA	B
091	5B	[	219	DB	S
092	5C	\	220	DC	B
093	5D	]	221	DD	E
094	5E	^	222	DE	YU
095	5F	_	223	DF	UNË JAM
096	60	`	224	E0	a
097	61	a	225	E1	b
098	62	b	226	E2	v
099	63	c	227	E3	G
100	64	d	228	E4	d
101	65	e	229	E5	e
102	66	f	230	E6	f
103	67	g	231	E7	s
104	68	h	232	E8	dhe
105	69	i	233	E9	th
106	6A	j	234	EA	për të
107	6B	k	235	EB	l
108	6C	l	236	KE	m
109	6D	m	237	ED	n
110	6E	n	238	EE	O
111	6F	o	239	EF	P
112	70	fq	240	F0	R
113	71	q	241	F1	Me
114	72	r	242	F2	T
115	73	s	243	F3	në
116	74	t	244	F4	f
117	75	u	245	F5	X
118	76	v	246	F6	c
119	77	w	247	F7	h
120	78	x	248	F8	w
121	79	y	249	F9	SCH
122	7A	z	250	FA	b
123	7B	{	251	FB	s
124	7C	\|	252	FC	b
125	7D	}	253	FD	eh
126	7E	~	254	FE	Ju
127	7F	Specialist. DEL	255	FF	unë jam

Tabela e kodit të karaktereve të Windows ASCII.
Përshkrimi i karaktereve speciale (kontroll).

Duhet të theksohet se fillimisht karakteret e kontrollit të tabelës ASCII u përdorën për të siguruar shkëmbimin e të dhënave nëpërmjet teletipit, futjen e të dhënave nga shiriti i shtypur dhe për kontrollin më të thjeshtë të pajisjeve të jashtme.
Aktualisht, shumica e karaktereve të kontrollit ASCII në tabelë nuk e mbajnë më këtë barrë dhe mund të përdoren për qëllime të tjera.

Kodi	Përshkrim
NUL, 00	E pavlefshme, bosh
SOH, 01	Fillimi i titullit, fillimi i titullit
STX, 02	Fillimi i TeXt, fillimi i tekstit.
ETX, 03	Fundi i TeXt, fundi i tekstit
EOT, 04	Fundi i transmetimit, fundi i transmetimit
ENQ, 05	Pyete. Kërkoj konfirmim
ACK, 06	Mirënjohje. Unë konfirmoj
BEL, 07	Zile, zile
BS, 08	Backspace, kthehu një personazh
TAB, 09	Skeda, skeda horizontale
LF, 0A	Furnizimi i linjës, furnizimi i linjës. Tani në shumicën e gjuhëve programuese shënohet si \ n
VT, 0B	Skeda vertikale, skeda vertikale.
FF, 0C	Furnizimi i formularit, Furnizimi i faqeve, Faqe e re
CR, 0D	Kthim ngarkese Tani në shumicën e gjuhëve të programimit shënohet si \ r
SO, 0E	Shift Out, ndryshoni ngjyrën e shiritit të bojës në pajisjen e printimit
SI, 0F	Shift In, ktheni përsëri ngjyrën e shiritit të bojës në pajisjen e printimit
DLE, 10	Data Link Escape, kaloni kanalin në transmetimin e të dhënave
DC1, 11 DC2, 12 DC3, 13 DC4, 14	Kontrolli i pajisjes, simbolet e kontrollit të pajisjes
NAK, 15	Mirënjohje negative, nuk e pranoj.
SYN, 16	Sinkronizimi. Simboli i sinkronizimit
ETB, 17	Fundi i bllokut të tekstit, fundi i bllokut të tekstit
CAN, 18	Anulo, duke anuluar një të kaluar më parë
EM, 19	Fundi i Mediumit, fundi i bartësit të të dhënave
SUB, 1A	Zëvendësues Vendosur në vend të një personazhi vlera e të cilit humbi ose u korruptua gjatë transmetimit
ESC, 1B	Escape Escape Sequence
FS, 1C	Ndarës i skedarëve, ndarës i skedarëve
GS, 1D	Ndarës grupi, ndarës grupi
RS, 1E	Ndarëse e shënimeve, ndarës rekord
SHBA, 1F	Ndarës njësi, ndarës njësi
DEL, 7F	Fshi, fshi karakterin e fundit.

Një kompjuter kupton procesin e shndërrimit të tij në një formë që lejon organizimin e një transferimi, ruajtjeje ose përpunimi automatik më të përshtatshëm të këtyre të dhënave. Për këtë qëllim përdoren tabela të ndryshme. Kodimi ASCII është sistemi i parë i zhvilluar në Shtetet e Bashkuara për të punuar me tekst në gjuhën angleze, i cili më pas u përhap në të gjithë botën. Artikulli më poshtë i kushtohet përshkrimit, veçorive, vetive dhe përdorimit të mëtejshëm të tij.

Shfaqja dhe ruajtja e informacionit në një kompjuter

Simbolet në një monitor kompjuteri ose një ose një tjetër vegël dixhitale celulare formohen në bazë të grupeve të formave vektoriale të të gjitha llojeve të shenjave dhe një kodi që ju lejon të gjeni midis tyre simbolin që duhet të futet në vendin e duhur. Është një seri bitash. Kështu, çdo personazh duhet të korrespondojë në mënyrë unike me një grup zero dhe njësh, të cilat qëndrojnë në një renditje specifike, unike.

Si filloi gjithçka

Historikisht, kompjuterët e parë ishin në anglisht. Për të koduar informacionin simbolik në to, mjaftonte të përdoreshin vetëm 7 bit memorie, ndërsa për këtë qëllim u nda 1 bajt, i përbërë nga 8 bit. Numri i karaktereve të kuptuara nga kompjuteri në këtë rast ishte i barabartë me 128. Numri i karaktereve të tilla përfshinte alfabetin anglez me shenjat e pikësimit, numrat dhe disa karaktere të veçanta. Kodimi shtatë-bit në gjuhën angleze me tabelën përkatëse (faqe kodi), i zhvilluar në vitin 1963, u emërua Kodi Standard Amerikan për Shkëmbimin e Informacionit. Zakonisht shkurtesa "ASCII encoding" është përdorur për ta treguar atë dhe përdoret ende sot e kësaj dite.

Kalimi në shumëgjuhësi

Me kalimin e kohës, kompjuterët janë përdorur gjerësisht edhe në vendet jo-anglishtfolëse. Në këtë drejtim, kishte nevojë për kodime që do të lejonin përdorimin e gjuhëve kombëtare. U vendos që të mos rikrijohej rrota dhe të merrej ASCII si bazë. Tabela e kodimit në edicionin e ri është zgjeruar ndjeshëm. Përdorimi i bitit të 8-të bëri të mundur përkthimin e 256 karaktereve në gjuhën e kompjuterit.

Përshkrim

Kodimi ASCII ka një tabelë që ndahet në 2 pjesë. Vetëm gjysma e parë konsiderohet të jetë standardi ndërkombëtar i pranuar përgjithësisht. Ai përfshin:

Karaktere me numra rendor nga 0 deri në 31, të koduar nga sekuenca nga 00000000 deri në 00011111. Ato janë të rezervuara për karakteret e kontrollit që kontrollojnë procesin e shfaqjes së tekstit në ekran ose printer, duke dhënë një sinjal zanor etj.
Karakteret me NN në tabelën nga 32 në 127, të koduar nga sekuencat nga 00100000 deri në 01111111, përbëjnë pjesën standarde të tabelës. Këto përfshijnë një hapësirë (N 32), shkronja të alfabetit latin (të vogla dhe të mëdha), numra dhjetëshifrorë nga 0 në 9, shenja pikësimi, kllapa të stileve të ndryshme dhe simbole të tjera.
Karaktere me numra rendorë nga 128 në 255, të koduar nga sekuenca nga 10000000 deri në 11111111. Këto përfshijnë shkronja të alfabeteve kombëtare të ndryshme nga latinishtja. Është kjo pjesë alternative e tabelës që kodimi ASCII përdoret për të kthyer karakteret ruse në formë kompjuteri.

Disa prona

Veçoritë e kodimit ASCII përfshijnë ndryshimin midis shkronjave "A" - "Z" të rasteve të poshtme dhe të sipërme me vetëm një bit. Kjo rrethanë thjeshton shumë konvertimin e regjistrit, si dhe kontrollin e tij për përkatësinë në diapazonin e caktuar të vlerave. Për më tepër, të gjitha shkronjat në sistemin e kodimit ASCII përfaqësohen nga numrat e tyre rendorë në alfabet, të cilët shkruhen me 5 shifra në shënimin binar, të paraprirë nga 011 2 për shkronjat e vogla dhe 010 2 për shkronjat e mëdha.

Ndër veçoritë e kodimit ASCII mund të konsiderohet përfaqësimi i 10 shifrave - "0" - "9". Në sistemin e dytë të numrave, ato fillojnë me 00112 dhe mbarojnë me 2 numra. Për shembull, 0101 2 është ekuivalente me dhjetore pesë, kështu që karakteri "5" shkruhet si 0011 01012. Bazuar në këtë, ju mund t'i konvertoni lehtësisht BCD-të në një varg ASCII duke shtuar 00112 në secilën gërmim në të majtë.

"Unicode"

Siç e dini, mijëra karaktere kërkohen për të shfaqur tekste në gjuhët e grupit të Azisë Juglindore. Një numër i tillë i tyre nuk përshkruhet në asnjë mënyrë në një bajt informacioni, kështu që edhe versionet e zgjeruara ASCII nuk mund të plotësonin më nevojat e shtuara të përdoruesve nga vende të ndryshme.

Kështu, lindi nevoja për të krijuar një kodim universal të tekstit, i cili u zhvillua nga konsorciumi Unicode në bashkëpunim me shumë drejtues të industrisë globale të IT. Specialistët e tij krijuan sistemin UTF 32. Në të u ndanë 32 bit për kodimin e 1 karakteri, duke përbërë 4 bajt informacioni. Pengesa kryesore ishte një rritje e mprehtë e sasisë së kujtesës së kërkuar deri në 4 herë, gjë që solli shumë probleme.

Në të njëjtën kohë, për shumicën e vendeve me gjuhë zyrtare që i përkasin grupit indo-evropian, numri i karaktereve të barabartë me 2 32 është më shumë se i tepërt.

Si rezultat i punës së mëtejshme të specialistëve nga konsorciumi Unicode, u shfaq kodimi UTF-16. Ai u bë opsioni për transformimin e informacionit simbolik që i përshtatej të gjithëve si për sa i përket sasisë së memories së kërkuar ashtu edhe për numrin e karaktereve të koduara. Kjo është arsyeja pse UTF-16 u pranua si parazgjedhje dhe kërkon që 2 bajt të rezervohen për një karakter.

Edhe ky version mjaft i avancuar dhe i suksesshëm i "Unicode" kishte disa të meta, dhe pas kalimit nga versioni i zgjeruar i ASCII në UTF-16 dyfishoi peshën e dokumentit.

Në këtë drejtim, u vendos që të përdoret kodimi i gjatësisë së ndryshueshme UTF-8. Në këtë rast, çdo karakter i tekstit burim është i koduar me një sekuencë prej 1 deri në 6 bajt të gjatë.

Marrëdhënia me kodin standard amerikan për shkëmbimin e informacionit

Të gjithë karakteret e alfabetit latin në UTF-8 me gjatësi të ndryshueshme janë të koduara në 1 bajt, si në sistemin e kodimit ASCII.

E veçanta e UTP-8 është se në rastin e një teksti në latinisht pa përdorur karaktere të tjera, edhe programet që nuk e kuptojnë "Unicode" do t'ju lejojnë ende ta lexoni atë. Me fjalë të tjera, pjesa bazë e kodimit të tekstit ASCII thjesht shkrihet në UTF-në e re me gjatësi të ndryshueshme. Karakteret cirilike në UTP-8 zënë 2 bajt, dhe, për shembull, ato gjeorgjiane - 3 bajtë. Krijimi i UTF-16 dhe 8 zgjidhi problemin kryesor të krijimit të një hapësire të vetme kodi në fonte. Që atëherë, prodhuesit e shkronjave mund ta mbushin tabelën vetëm me forma vektoriale të karaktereve të tekstit bazuar në nevojat e tyre.

Në sisteme të ndryshme operative preferohen kodime të ndryshme. Për të qenë në gjendje të lexoni dhe modifikoni tekstet e shtypura në një kodim tjetër, përdoren programet ruse të konvertimit të tekstit. Disa redaktues teksti përmbajnë transkoder të integruar dhe ju lejojnë të lexoni tekst pavarësisht nga kodimi.

Tani e dini se sa karaktere janë në ASCII dhe si dhe pse u zhvillua. Sigurisht që sot standardi më i përhapur në botë është “Unicode”. Sidoqoftë, nuk duhet të harrojmë se ai u krijua në bazë të ASCII, prandaj duhet vlerësuar kontributi i zhvilluesve të tij në fushën e IT.

Siç e dini, një kompjuter ruan informacionin në formë binare, duke e paraqitur atë si një sekuencë njësh dhe zero. Për të përkthyer informacionin në një formë që është e përshtatshme për perceptimin njerëzor, çdo sekuencë unike e numrave zëvendësohet me simbolin përkatës kur shfaqet.

Një nga sistemet për lidhjen e kodeve binare me karakteret e printueshme dhe të kontrollit është

Në nivelin aktual të zhvillimit të teknologjisë kompjuterike, përdoruesi nuk kërkohet të dijë kodin e çdo simboli specifik. Sidoqoftë, një kuptim i përgjithshëm se si kryhet kodimi është jashtëzakonisht i dobishëm, dhe për disa kategori specialistësh madje i nevojshëm.

Krijimi i ASCII

Në formën e tij origjinale, kodimi u zhvillua në 1963 dhe më pas u përditësua dy herë brenda 25 viteve.

Në versionin origjinal, tabela e karaktereve ASCII përfshinte 128 karaktere, më vonë u shfaq një version i zgjeruar, ku u ruajtën 128 karakteret e para dhe karakteret që mungonin më parë iu caktuan kodeve me bitin e tetë të përfshirë.

Për shumë vite, ky kodim ka qenë më i popullarizuari në botë. Në vitin 2006, Latin 1252 zuri pozitën udhëheqëse, dhe nga fundi i 2007 e deri më sot, Unicode ka mbajtur me vendosmëri pozicionin drejtues.

Përfaqësimi kompjuterik ASCII

Çdo karakter ASCII ka kodin e tij prej 8 karakteresh që përfaqësojnë zero ose një. Numri minimal në një paraqitje të tillë është zero (tetë zero në sistemin binar), që është kodi i elementit të parë në tabelë.

Dy kode në tabelë u rezervuan për kalimin midis standardit US-ASCII dhe versionit të tij kombëtar.

Pasi ASCII filloi të përfshijë jo 128, por 256 karaktere, një variant i kodimit u përhap gjerësisht, në të cilin versioni origjinal i tabelës u ruajt në 128 kodet e para me një bit të 8-të zero. Shenjat e shkrimit kombëtar ruheshin në gjysmën e sipërme të tabelës (pozicionet 128-255).

Përdoruesi nuk ka nevojë të dijë drejtpërdrejt kodet e karaktereve ASCII. Zakonisht mjafton që një zhvillues softuerësh të dijë numrin e një elementi në një tabelë në mënyrë që të llogarisë kodin e tij duke përdorur një sistem binar, nëse është e nevojshme.

Gjuha ruse

Pas zhvillimit të kodimeve për gjuhët skandinave, kineze, koreane, greke etj. në fillim të viteve 70, edhe Bashkimi Sovjetik filloi të krijojë versionin e tij. Së shpejti, u zhvillua një version i kodimit 8-bit i quajtur KOI8, i cili ruan 128 kodet e para të karaktereve ASCII dhe cakton të njëjtin numër pozicionesh për shkronjat e alfabetit kombëtar dhe karaktere shtesë.

Para prezantimit të Unicode, KOI8 dominonte segmentin rus të internetit. Kishte opsione kodimi për alfabetin rus dhe ukrainas.

Problemet ASCII

Meqenëse numri i elementeve edhe në tabelën e zgjeruar nuk i kalonte 256, nuk ekzistonte mundësia e vendosjes së disa skripteve të ndryshme në një kodim. Në vitet '90, problemi i "crocozyabr" u shfaq në Runet, kur tekstet e shtypura me karaktere ruse ASCII u shfaqën gabimisht.

Problemi ishte se kodet e varianteve të ndryshme ASCII nuk përputheshin me njëri-tjetrin. Kujtoni që pozicionet 128-255 mund të përmbajnë karaktere të ndryshme, dhe kur ndryshoni një kodim cirilik në një tjetër, të gjitha shkronjat e tekstit u zëvendësuan me të tjera që kishin një numër identik në një version tjetër të kodimit.

Gjendja e tanishme

Me ardhjen e Unicode, popullariteti i ASCII ra ndjeshëm.

Arsyeja për këtë qëndron në faktin se kodimi i ri bëri të mundur akomodimin e shenjave të pothuajse të gjitha gjuhëve të shkruara. Në këtë rast, 128 karakteret e para ASCII korrespondojnë me të njëjtat karaktere në Unicode.

Në vitin 2000, ASCII ishte kodimi më i popullarizuar në internet dhe përdorej në 60% të faqeve të internetit të indeksuara nga Google. Deri në vitin 2012, pjesa e faqeve të tilla kishte rënë në 17%, dhe Unicode (UTF-8) zuri vendin e kodimit më të njohur.

Kështu, ASCII është një pjesë e rëndësishme e historisë së teknologjisë së informacionit, por përdorimi i tij në të ardhmen shihet si jopremtues.

Sipas Unionit Ndërkombëtar të Telekomunikacionit, në vitin 2016, tre miliardë e gjysmë njerëz përdorën internetin me rregullsi të ndryshme. Shumica e tyre as që e mendojnë faktin se çdo mesazh i dërguar prej tyre nëpërmjet kompjuterëve apo pajisjeve celulare, si dhe tekstet që shfaqen në të gjitha llojet e monitorëve, në fakt janë kombinime të 0 dhe 1. Ky prezantim i informacionit quhet kodim. . Ai siguron dhe lehtëson shumë ruajtjen, përpunimin dhe transmetimin e tij. Në vitin 1963, u zhvillua kodimi amerikan ASCII, të cilit i kushtohet ky artikull.

Prezantimi i informacionit në kompjuter

Nga pikëpamja e çdo kompjuteri elektronik, teksti është një koleksion karakteresh individuale. Këto përfshijnë jo vetëm shkronjat, duke përfshirë shkronjat e mëdha, por edhe shenjat e pikësimit dhe numrat. Përveç kësaj, përdoren karaktere speciale "=", "&", "(" dhe hapësira.

Tërësia e simboleve që përbëjnë tekstin quhet alfabet dhe numri i tyre quhet kardinalitet (shënohet si N). Për ta përcaktuar atë, përdoret shprehja N = 2 ^ b, ku b është numri i biteve ose pesha informative e një karakteri të caktuar.

Është vërtetuar se një alfabet me një kapacitet prej 256 karakteresh mund të përfaqësojë të gjitha karakteret e nevojshme.

Meqenëse 256 është fuqia e 8-të e dy, pesha e çdo karakteri është 8 bit.

Njësia matëse prej 8 bitësh quhet 1 bajt, kështu që është zakon të thuhet se çdo karakter në një tekst të ruajtur në një kompjuter merr një bajt memorie.

Si bëhet kodimi

Çdo tekst futet në kujtesën e një kompjuteri personal me anë të tasteve të tastierës në të cilat janë shkruar numra, shkronja, shenja pikësimi dhe simbole të tjera. Ato transferohen në RAM në një kod binar, domethënë, çdo karakter shoqërohet me një kod dhjetor të njohur për njerëzit, nga 0 në 255, që korrespondon me një kod binar - nga 00000000 në 11111111.

Kodimi i karaktereve me byte i lejon procesorit të tekstit të aksesojë secilin karakter veç e veç. Në të njëjtën kohë, 256 karaktere janë të mjaftueshme për të përfaqësuar çdo informacion të karakterit.

Kodimi i karaktereve ASCII

Kjo shkurtesë në anglisht qëndron për kodin për shkëmbimin e informacionit.

Edhe në agimin e kompjuterizimit, u bë e qartë se ju mund të gjeni një shumëllojshmëri të gjerë mënyrash për të koduar informacionin. Megjithatë, për të transferuar informacion nga një kompjuter në tjetrin, kërkohej të zhvillohej një standard i vetëm. Pra, në vitin 1963, një tabelë kodimi ASCII u shfaq në Shtetet e Bashkuara. Në të, çdo simbol i alfabetit të kompjuterit shoqërohet me numrin e tij rendor në paraqitjen binar. Fillimisht, ASCII u përdor vetëm në Shtetet e Bashkuara dhe më vonë u bë standardi ndërkombëtar për PC.

Kodet ASCII ndahen në 2 pjesë. Vetëm gjysma e parë e kësaj tabele konsiderohet Standard Ndërkombëtar. Ai përfshin karaktere me numra rendorë nga 0 (i koduar si 00000000) deri në 127 (kodi 01111111).

Numër serik	Kodimi i tekstit ASCII	Simboli
	0000 0000 - 0001 1111	Karakteret me N nga 0 në 31 quhen karaktere kontrolli. Funksioni i tyre është të "udhëzojnë" procesin e shfaqjes së tekstit në një monitor ose pajisje printimi, duke dhënë një sinjal zanor etj.
	0010 0000 - 0111 1111	Karakteret me N nga 32 në 127 (pjesa standarde e tabelës) - shkronja të mëdha dhe të vogla të alfabetit latin, numra 10-shifror, shenja pikësimi, si dhe kllapa të ndryshme, simbole tregtare dhe të tjera. Karakteri 32 tregon një hapësirë.
	1000 0000 - 1111 1111	Karakteret me N nga 128 në 255 (pjesë alternative e tabelës ose faqe kodi) mund të kenë variante të ndryshme, secila prej të cilave ka numrin e vet. Faqja e kodit përdoret për të specifikuar alfabetet kombëtare që janë të ndryshëm nga latinishtja. Në veçanti, është me ndihmën e tij që kryhet kodimi ASCII për karakteret ruse.

Në tabelën e kodimit, shkronjat e mëdha dhe ndiqni njëra pas tjetrës sipas rendit alfabetik, dhe numrat - sipas renditjes rritëse të vlerave. Ky parim vlen edhe për alfabetin rus.

Personazhet e kontrollit

Tabela e kodimit ASCII u krijua fillimisht për të marrë dhe transmetuar informacion në një pajisje të tillë që nuk është përdorur për një kohë të gjatë, siç është teletypi. Në këtë drejtim, në grupin e karaktereve janë përfshirë karaktere jo të printueshme, të përdorura si komanda për të kontrolluar këtë pajisje. Komanda të ngjashme u përdorën në metoda të tilla të mesazheve para kompjuterike si kodi Morse, etj.

Karakteri më i zakonshëm "teletipi" është NUL (00, "zero"). Përdoret ende në shumicën e gjuhëve programuese deri më sot, duke treguar një terminator të linjës.

Ku përdoret kodimi ASCII?

Kodi standard i SHBA-së nevojitet për më shumë sesa thjesht futjen e informacionit të tekstit nga tastiera. Përdoret gjithashtu në grafikë. Në mënyrë të veçantë, në ASCII Art Maker, imazhet e zgjerimeve të ndryshme përfaqësojnë një spektër karakteresh ASCII.

Produkte të tilla janë dy llojesh: ato kryejnë funksionin e redaktuesve grafikë duke shndërruar imazhet në tekst dhe duke konvertuar "fotografitë" në grafikë ASCII. Për shembull, emoticon i famshëm është një shembull kryesor i një karakteri kodues.

ASCII mund të përdoret gjithashtu kur krijoni një dokument HTML. Në këtë rast, mund të futni një grup të caktuar karakteresh dhe kur shikoni faqen, në ekran do të shfaqet një karakter që korrespondon me këtë kod.

ASCII është gjithashtu i nevojshëm për krijimin e faqeve shumëgjuhëshe, pasi karakteret që nuk përfshihen në një tabelë specifike kombëtare zëvendësohen me kode ASCII.

Disa veçori

Për të koduar informacionin e tekstit në kodimin ASCII, fillimisht u përdorën 7 bit (njëri mbeti bosh), por sot funksionon si 8-bit.

Shkronjat në kolonën e sipërme dhe të poshtme ndryshojnë nga njëra-tjetra vetëm me një bit të vetëm. Kjo redukton shumë kompleksitetin e kontrollit.

Përdorimi i ASCII në Microsoft Office

Nëse është e nevojshme, ky lloj kodimi teksti mund të përdoret në redaktuesit e tekstit të Microsoft si Notepad dhe Office Word. Sidoqoftë, kur shkruani në këtë rast, nuk do të jetë e mundur të përdorni disa funksione. Për shembull, ju nuk do të jeni në gjendje të bëni bold, sepse ASCII ruan vetëm kuptimin e informacionit, duke injoruar pamjen dhe formën e tij të përgjithshme.

Standardizimi

Organizata ISO ka miratuar standardet ISO 8859. Ky grup përcakton kodimet me tetë bit për grupe të ndryshme gjuhësore. Në mënyrë të veçantë, ISO 8859-1 është Extended ASCII, e cila është një tabelë për Shtetet e Bashkuara dhe Evropën Perëndimore. Dhe ISO 8859-5 është një tabelë e përdorur për alfabetin cirilik, duke përfshirë gjuhën ruse.

Për një sërë arsyesh historike, standardi ISO 8859-5 ka qenë në përdorim për një kohë shumë të shkurtër.

Për gjuhën ruse, për momentin, përdoren në të vërtetë kodimet:

CP866 (Kodi Faqe 866) ose DOS, i cili shpesh quhet kodimi alternativ GOST. Ajo u përdor në mënyrë aktive deri në mesin e viteve '90 të shekullit të kaluar. Për momentin, praktikisht nuk është përdorur.
KOI-8. Kodimi u zhvillua në vitet 1970-80, dhe për momentin është një standard i pranuar përgjithësisht për mesazhet postare në Runet. Përdoret gjerësisht në OS të familjes Unix, duke përfshirë Linux. Versioni "rus" i KOI-8 quhet KOI-8R. Përveç kësaj, ka versione për gjuhë të tjera cirilike, si për shembull ukrainisht.
Kodi Faqe 1251 (CP 1251, Windows - 1251). Zhvilluar nga Microsoft për të ofruar mbështetje për gjuhën ruse në mjedisin Windows.

Avantazhi kryesor i standardit të parë CP866 ishte ruajtja e karaktereve pseudografike në të njëjtat pozicione si në Extended ASCII. Kjo bëri të mundur ekzekutimin pa ndryshime të programeve tekstuale të prodhuara nga jashtë, si p.sh. Norton Commander i mirënjohur. Për momentin, CP866 përdoret për programet e zhvilluara nën Windows që funksionojnë në modalitetin e tekstit në ekran të plotë ose në dritaret e tekstit, duke përfshirë FAR Manager.

Tekstet kompjuterike të shkruara në kodimin CP866 janë mjaft të rralla kohët e fundit, por është pikërisht ky kodim që përdoret për emrat e skedarëve rusë në Windows.

"Unicode"

Për momentin, është ky kodim që ka marrë përdorimin më të përhapur. Kodet Unicode ndahen në zona. E para (U + 0000 në U + 007F) përfshin karaktere ASCII me kode. Kjo pasohet nga zonat e shenjave të shkrimeve të ndryshme kombëtare, si dhe shenjat e pikësimit dhe simbolet teknike. Përveç kësaj, disa nga kodet "Unicode" janë të rezervuara në rast se ka nevojë për të përfshirë karaktere të reja në të ardhmen.

Tani e dini se në ASCII, çdo karakter përfaqësohet si një kombinim i 8 zerave dhe njësheve. Për jo-specialistët, ky informacion mund të duket i panevojshëm dhe jo interesant, por a nuk doni të dini se çfarë po ndodh "në trurin" e kompjuterit tuaj?!

Bashkësia e karaktereve me të cilat shkruhet teksti quhet alfabeti.

Numri i karaktereve në alfabet është i tij pushtetin.

Formula për përcaktimin e sasisë së informacionit: N = 2 b,

ku N është kardinaliteti i alfabetit (numri i karaktereve),

b - numri i biteve (pesha informative e karakterit).

Alfabeti me një kapacitet prej 256 karakteresh mund të strehojë pothuajse të gjitha karakteret e nevojshme. Ky alfabet quhet mjaftueshëm.

Sepse 256 = 2 8, atëherë pesha e 1 karakteri është 8 bit.

Njësia 8-bitëshe u emërua 1 bajt:

1 bajt = 8 bit.

Kodi binar i çdo karakteri në tekstin kompjuterik merr 1 bajt memorie.

Si paraqitet informacioni i tekstit në memorien e kompjuterit?

Lehtësia e kodimit të karaktereve me bajt është e dukshme, pasi një bajt është pjesa më e vogël e adresueshme e memories dhe, për rrjedhojë, procesori mund të aksesojë çdo karakter veç e veç, duke kryer përpunimin e tekstit. Nga ana tjetër, 256 karaktere është një numër mjaft i mjaftueshëm për të përfaqësuar një shumëllojshmëri të gjerë të informacionit të karaktereve.

Tani lind pyetja, çfarë lloj kodi binar tetë-bit të lidhet me secilin karakter.

Është e qartë se kjo është një çështje e kushtëzuar, ju mund të dilni me shumë metoda kodimi.

Të gjithë karakteret e alfabetit të kompjuterit numërohen nga 0 deri në 255. Çdo numër korrespondon me një kod binar tetë-bitësh nga 00000000 deri në 11111111. Ky kod është thjesht numri rendor i karakterit në sistemin e numrave binar.

Tabela në të cilën të gjithë karakteret e alfabetit të kompjuterit janë caktuar numra serialë quhet tabela e kodimit.

Për lloje të ndryshme kompjuterash përdoren tabela të ndryshme kodimi.

Standardi ndërkombëtar për PC është bërë tabela ASCII(lexo asci) (Kodi standard amerikan për shkëmbimin e informacionit).

Tabela ASCII është e ndarë në dy pjesë.

Standardi ndërkombëtar është vetëm gjysma e parë e tabelës, d.m.th. simbolet me numra nga 0 (00000000), deri në 127 (01111111).

Struktura e tabelës koduese ASCII

Numër serik	Kodi	Simboli
0 - 31	00000000 - 00011111	Simbolet me numra nga 0 në 31 zakonisht quhen karaktere kontrolli. Funksioni i tyre është të kontrollojnë procesin e shfaqjes së tekstit në ekran ose të printimit, dhënien e një sinjali zanor, shënimin e tekstit etj.
32 - 127	00100000 - 01111111	Pjesa standarde e tabelës (anglisht). Këtu përfshihen shkronjat e vogla dhe të mëdha të alfabetit latin, shifrat dhjetore, shenjat e pikësimit, të gjitha llojet e kllapave, simbolet tregtare dhe të tjera. Karakteri 32 është një hapësirë, d.m.th. pozicion bosh në tekst. Të gjitha të tjerat pasqyrohen në shenja të caktuara.
128 - 255	10000000 - 11111111	Pjesa alternative e tabelës (rusisht). Gjysma e dytë e tabelës së kodeve ASCII, e quajtur faqja e kodit (128 kode, duke filluar nga 10000000 dhe duke përfunduar me 11111111), mund të ketë variante të ndryshme, secili variant ka numrin e vet. Faqja e kodit përdoret kryesisht për të akomoduar alfabete kombëtare të ndryshme nga latinishtja. Në kodimet kombëtare ruse, kjo pjesë e tabelës përmban simbole të alfabetit rus.

Gjysma e parë e tabelës ASCII

Unë tërheq vëmendjen tuaj për faktin se në tabelën e kodimit, shkronjat (të mëdha dhe të vogla) janë renditur sipas rendit alfabetik, dhe numrat renditen në rendin rritës të vlerave. Ky respektim i rendit leksikografik në renditjen e karaktereve quhet parimi i kodimit sekuencial të alfabetit.

Për shkronjat e alfabetit rus, respektohet edhe parimi i kodimit sekuencial.

Gjysma e dytë e tabelës ASCII

Për fat të keq, aktualisht ekzistojnë pesë kodime të ndryshme cirilike (KOI8-R, Windows. MS-DOS, Macintosh dhe ISO). Për shkak të kësaj, shpesh lindin probleme me transferimin e tekstit rus nga një kompjuter në tjetrin, nga një sistem softuer në tjetrin.

Kronologjikisht, një nga standardet e para për kodimin e shkronjave ruse në kompjuter ishte KOI8 ("Kodi i shkëmbimit të informacionit, 8-bit"). Ky kodim u përdor përsëri në vitet '70 në kompjuterët e serisë kompjuterike ES, dhe nga mesi i viteve '80 filloi të përdoret në versionet e para të rusifikuara të sistemit operativ UNIX.

Që nga fillimi i viteve '90, koha e dominimit të sistemit operativ MS DOS, kodimi CP866 mbetet ("CP" do të thotë "Faqja e kodit").

Kompjuterët Apple me Mac OS përdorin kodimin e tyre Mac.

Për më tepër, Organizata Ndërkombëtare për Standardizim (Organizata Ndërkombëtare e Standardeve, ISO) miratoi një kodim tjetër të quajtur ISO 8859-5 si standard për gjuhën ruse.

Aktualisht, kodimi më i zakonshëm është Microsoft Windows, i shkurtuar si CP1251.

Që nga fundi i viteve '90, problemi i standardizimit të kodimit të karaktereve është zgjidhur me futjen e një standardi të ri ndërkombëtar të quajtur Unicode... Ky është një kodim 16-bit d.m.th. cakton 2 bajt memorie për çdo karakter. Sigurisht, kjo dyfishon sasinë e memories së përdorur. Por nga ana tjetër, një tabelë e tillë kodesh lejon përfshirjen deri në 65536 karaktere. Specifikimi i plotë i standardit Unicode përfshin të gjitha alfabetet ekzistuese, të zhdukura dhe të krijuara artificialisht të botës, si dhe shumë simbole matematikore, muzikore, kimike dhe të tjera.

Le të përpiqemi të përdorim një tabelë ASCII për të imagjinuar se si do të duken fjalët në kujtesën e kompjuterit.

Paraqitja e brendshme e fjalëve në kujtesën e kompjuterit

Ndonjëherë ndodh që një tekst i përbërë nga shkronja të alfabetit rus, i marrë nga një kompjuter tjetër, nuk mund të lexohet - një lloj "korrizi" është i dukshëm në ekranin e monitorit. Kjo për faktin se kompjuterët përdorin kodime të ndryshme të karaktereve të gjuhës ruse.

Kodet e karaktereve latine. Kodimi ASCII (kodi standard amerikan për shkëmbimin e informacionit) - kodimi bazë i tekstit për latinisht

Tabela e kodit të karaktereve të Windows ASCII. Përshkrimi i karaktereve speciale (kontroll).

Shfaqja dhe ruajtja e informacionit në një kompjuter

Si filloi gjithçka

Kalimi në shumëgjuhësi

Përshkrim

Disa prona

"Unicode"

Marrëdhënia me kodin standard amerikan për shkëmbimin e informacionit

Krijimi i ASCII

Përfaqësimi kompjuterik ASCII

Gjuha ruse

Problemet ASCII

Gjendja e tanishme

Prezantimi i informacionit në kompjuter

Si bëhet kodimi

Kodimi i karaktereve ASCII

Personazhet e kontrollit

Ku përdoret kodimi ASCII?

Disa veçori

Përdorimi i ASCII në Microsoft Office

Standardizimi

"Unicode"

Si paraqitet informacioni i tekstit në memorien e kompjuterit?

Tani lind pyetja, çfarë lloj kodi binar tetë-bit të lidhet me secilin karakter.

Tabela në të cilën të gjithë karakteret e alfabetit të kompjuterit janë caktuar numra serialë quhet tabela e kodimit.

Struktura e tabelës koduese ASCII

Numër serik

Kodi

Simboli

0 - 31

00000000 - 00011111

32 - 127

00100000 - 01111111

128 - 255

10000000 - 11111111

Gjysma e parë e tabelës ASCII

Gjysma e dytë e tabelës ASCII

Le të përpiqemi të përdorim një tabelë ASCII për të imagjinuar se si do të duken fjalët në kujtesën e kompjuterit.

Paraqitja e brendshme e fjalëve në kujtesën e kompjuterit

Artikujt kryesorë të lidhur

Tabela e kodit të karaktereve të Windows ASCII.
Përshkrimi i karaktereve speciale (kontroll).