Kodet dhjetore të karaktereve ascii c. Kodimi i informacionit të tekstit

06.09.2019 Windows 7, XP

dhjetor	Hex	Simboli	dhjetor	Hex	Simboli
000	00	specialist. JO	128	80	Ђ
001	01	specialist. SOH	129	81	Ѓ
002	02	specialist. STX	130	82	‚
003	03	specialist. ETX	131	83	ѓ
004	04	specialist. EOT	132	84	„
005	05	specialist. ENQ	133	85	…
006	06	specialist. ACK	134	86	†
007	07	specialist. BEL	135	87	‡
008	08	specialist. B.S.	136	88	€
009	09	specialist. TAB	137	89	‰
010	0A	specialist. LF	138	8A	Љ
011	0B	specialist. VT	139	8B	‹ ‹
012	0C	specialist. FF	140	8C	Њ
013	0D	specialist. CR	141	8D	Ќ
014	0E	specialist. KËSHTU QË	142	8E	Ћ
015	0F	specialist. S.I.	143	8F	Џ
016	10	specialist. DLE	144	90	ђ
017	11	specialist. DC1	145	91	‘
018	12	specialist. DC2	146	92	’
019	13	specialist. DC3	147	93	“
020	14	specialist. DC4	148	94	”
021	15	specialist. N.A.K.	149	95
022	16	specialist. SYN	150	96	–
023	17	specialist. ETB	151	97	—
024	18	specialist. MUND	152	98
025	19	specialist. E.M.	153	99	™
026	1A	specialist. NËN	154	9A	љ
027	1B	specialist. ESC	155	9B	›
028	1C	specialist. FS	156	9C	њ
029	1D	specialist. G.S.	157	9D	ќ
030	1E	specialist. R.S.	158	9E	ћ
031	1F	specialist. SHBA	159	9F	џ
032	20	tufë SP (Hapësirë)	160	A0
033	21	!	161	A1	Ў
034	22	"	162	A2	ў
035	23	#	163	A3	Ћ
036	24	$	164	A4	¤
037	25	%	165	A5	Ґ
038	26	&	166	A6	¦
039	27	"	167	A7	§
040	28	(	168	A8	Jo
041	29	)	169	A9	©
042	2A	*	170	A.A.	Є
043	2B	+	171	AB	«
044	2C	,	172	A.C.	¬
045	2D	-	173	pas Krishtit
046	2E	.	174	A.E.	®
047	2F	/	175	A.F.	Ї
048	30	0	176	B0	°
049	31	1	177	B1	±
050	32	2	178	B2	І
051	33	3	179	B3	і
052	34	4	180	B4	ґ
053	35	5	181	B5	µ
054	36	6	182	B6	¶
055	37	7	183	B7	·
056	38	8	184	B8	e
057	39	9	185	B9	№
058	3A	:	186	B.A.	є
059	3B	;	187	BB	»
060	3C	<	188	B.C.	ј
061	3D	=	189	BD	Ѕ
062	3E	>	190	BE	ѕ
063	3F	?	191	B.F.	ї
064	40	@	192	C0	A
065	41	A	193	C1	B
066	42	B	194	C2	NË
067	43	C	195	C3	G
068	44	D	196	C4	D
069	45	E	197	C5	E
070	46	F	198	C6	DHE
071	47	G	199	C7	Z
072	48	H	200	C8	DHE
073	49	I	201	C9	Y
074	4A	J	202	C.A.	TE
075	4B	K	203	C.B.	L
076	4C	L	204	CC	M
077	4D	M	205	CD	N
078	4E	N	206	C.E.	RRETH
079	4F	O	207	CF	P
080	50	P	208	D0	R
081	51	P	209	D1	ME
082	52	R	210	D2	T
083	53	S	211	D3	U
084	54	T	212	D4	F
085	55	U	213	D5	X
086	56	V	214	D6	C
087	57	W	215	D7	H
088	58	X	216	D8	Sh
089	59	Y	217	D9	SCH
090	5A	Z	218	D.A.	Kommersant
091	5B	[	219	D.B.	Y
092	5C	\	220	DC	b
093	5D	]	221	DD	E
094	5E	^	222	DE	YU
095	5F	_	223	DF	I
096	60	`	224	E0	A
097	61	a	225	E1	b
098	62	b	226	E2	V
099	63	c	227	E3	G
100	64	d	228	E4	d
101	65	e	229	E5	e
102	66	f	230	E6	dhe
103	67	g	231	E7	h
104	68	h	232	E8	Dhe
105	69	i	233	E9	th
106	6A	j	234	E.A.	te
107	6B	k	235	E.B.	l
108	6C	l	236	E.C.	m
109	6D	m	237	ED	n
110	6E	n	238	E.E.	O
111	6F	o	239	E.F.	P
112	70	fq	240	F0	R
113	71	q	241	F1	Me
114	72	r	242	F2	T
115	73	s	243	F3	në
116	74	t	244	F4	f
117	75	u	245	F5	X
118	76	v	246	F6	ts
119	77	w	247	F7	h
120	78	x	248	F8	w
121	79	y	249	F9	sch
122	7A	z	250	F.A.	ъ
123	7B	{	251	FB	s
124	7C	\|	252	F.C.	b
125	7D	}	253	FD	uh
126	7E	~	254	F.E.	Ju
127	7F	Specialist. DEL	255	FF	I

Tabela e kodit të karaktereve të Windows ASCII.
Përshkrimi i karaktereve speciale (kontroll).

Duhet të theksohet se karakteret e kontrollit të tabelës ASCII fillimisht u përdorën për të siguruar shkëmbimin e të dhënave përmes makinës së shtypit, futjen e të dhënave nga shiriti i shtypur dhe për kontrollin e thjeshtë të pajisjeve të jashtme.
Aktualisht, shumica e karaktereve të kontrollit të tabelës ASCII nuk e mbajnë më këtë ngarkesë dhe mund të përdoren për qëllime të tjera.

Kodi	Përshkrim
NUL, 00	E pavlefshme, bosh
SOH, 01	Fillimi i Drejtimit
STX, 02	Fillimi i TeXt, fillimi i tekstit.
ETX, 03	Fundi i TeXt, fundi i tekstit
EOT, 04	Fundi i transmetimit, fundi i transmetimit
ENQ, 05	Pyete. Ju lutem konfirmoni
ACK, 06	Mirënjohje. Unë konfirmoj
BEL, 07	Zile, telefono
BS, 08	Backspace, kthehu një personazh prapa
TAB, 09	Skeda, skeda horizontale
LF, 0A	Furnizimi i linjës, furnizimi i linjës. Në ditët e sotme në shumicën e gjuhëve programuese shënohet si \n
VT, 0B	Skeda vertikale, tabela vertikale.
FF, 0C	Furnizimi i formularit, furnizimi i faqeve, faqe e re
CR, 0D	Carriage Return, karrocë kthimi. Në ditët e sotme në shumicën e gjuhëve programuese shënohet si \r
SO,0E	Shift Out, ndryshoni ngjyrën e shiritit të bojës në pajisjen e printimit
SI, 0F	Shift In, kthejeni ngjyrën e shiritit të bojës në pajisjen e printimit
DLE, 10	Data Link Escape, duke kaluar kanalin në transmetimin e të dhënave
DC1, 11 DC2, 12 DC3, 13 DC4, 14	Kontrolli i pajisjes, simbolet e kontrollit të pajisjes
NAK, 15	Mirënjohje negative, nuk e konfirmoj.
SYN, 16	Sinkronizimi. Simboli i sinkronizimit
ETB, 17	Fundi i bllokut të tekstit, fundi i bllokut të tekstit
MUND, 18	Anulimi, anulimi i një të transmetuar më parë
EM, 19	Fundi i Mediumit
SUB, 1A	Zëvendësim, zëvendësues. Vendosur në vend të një simboli kuptimi i të cilit humbi ose u korruptua gjatë transmetimit
ESC, 1B	Sekuenca e kontrollit të arratisjes
FS, 1C	Ndarës i skedarëve, ndarës i skedarëve
GS, 1D	Ndarës grupi
RS, 1E	Ndarëse e shënimeve, ndarës rekord
SHBA, 1F	Ndarës i njësisë
DEL, 7F	Fshi, fshi karakterin e fundit.

Mbivendosja e karaktereve

Karakteri BS (backspace) lejon printerin të printojë një karakter mbi tjetrin. ASCII parashikoi shtimin e diakritikëve në shkronja në këtë mënyrë, për shembull:

a BS "→ á
a BS ` → à
a BS ^ → â
o BS / → ø
c BS , → ç
n BS ~ → с

shënim: në shkronjat e vjetra, apostrofi " vizatohej i pjerrët në të majtë, dhe tilda ~ u zhvendos lart, kështu që ato thjesht përshtaten me rolin e një akute dhe një tilde sipër.

Nëse i njëjti karakter mbivendoset në një karakter, rezultati është një efekt shkronjash të theksuara, dhe nëse një nënvizim mbivendoset mbi një karakter, rezultati është tekst i nënvizuar.

a BS a → a
aBS_→ a

shënim: Kjo përdoret, për shembull, në sistemin e ndihmës mashkullore.

Variantet kombëtare ASCII

Standardi ISO 646 (ECMA-6) parashikon mundësinë e vendosjes së simboleve kombëtare në vend @ [ \ ] ^ ` { | } ~ . Përveç kësaj, në vend # mund të postohet £ , dhe në vend $ - ¤ . Ky sistem është i përshtatshëm për gjuhët evropiane ku nevojiten vetëm disa karaktere shtesë. Versioni i ASCII pa karaktere kombëtare quhet US-ASCII, ose "Versioni i referencës ndërkombëtare".

Më pas, doli të ishte më i përshtatshëm përdorimi i kodimeve 8-bit (faqet e kodit), ku gjysma e poshtme e tabelës së kodit (0-127) është e zënë nga karakteret US-ASCII, dhe gjysma e sipërme (128-255) me karaktere shtesë, duke përfshirë një grup karakteresh kombëtare. Kështu, gjysma e sipërme e tabelës ASCII, përpara miratimit të gjerë të Unicode, u përdor në mënyrë aktive për të përfaqësuar karaktere të lokalizuara, shkronja të gjuhës lokale. Mungesa e një standardi të unifikuar për vendosjen e karaktereve cirilike në tabelën ASCII shkaktoi shumë probleme me kodimet (KOI-8, Windows-1251 dhe të tjerët). Gjuhët e tjera me shkrime jo latine gjithashtu vuanin nga të pasurit e disa kodimeve të ndryshme.

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.A	.B	.C	.D	.E	.F
0.	NUL	SOM	EOA	MVZ	EQT	W.R.U.	RU	ZILE	BKSP	HT	LF	VT	FF	CR	KËSHTU QË	S.I.
1.	DC 0	DC 1	DC 2	DC 3	DC 4	ERR	SINKORONIZA	L.E.M.	S 0	S 1	S 2	S 3	S 4	S 5	S 6	S 7
2.
3.
4.	BLANK	!	"	#	$	%	&	"	(	)	*	+	,	-	.	/
5.	0	1	2	3	4	5	6	7	8	9	:	;	<	=	>	?
6.
7.
8.
9.
A.	@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
B.	P	P	R	S	T	U	V	W	X	Y	Z	[	\	]		←
C.
D.
E.		a	b	c	d	e	f	g	h	i	j	k	l	m	n	o
F.	fq	q	r	s	t	u	v	w	x	y	z				ESC	DEL

Në ata kompjuterë ku njësia minimale e adresueshme e memories ishte një fjalë 36-bit, fillimisht u përdorën karaktere 6-bit (1 fjalë = 6 karaktere). Pas kalimit në ASCII, kompjuterë të tillë filluan të përmbajnë ose 5 karaktere shtatë-bitësh (1 bit mbeti shtesë) ose 4 karaktere nëntë-bitësh në një fjalë.

Kodet ASCII përdoren gjithashtu për të përcaktuar se cili tast shtypet gjatë programimit. Për një tastierë standarde QWERTY, tabela e kodeve duket si kjo:

Unicode (Unicode në anglisht) është një standard kodimi i karaktereve. E thënë thjesht, kjo është një tabelë e korrespondencës midis karaktereve të tekstit (, shkronja, elementet e pikësimit) kodet binare. Kompjuteri kupton vetëm sekuencën e zerove dhe njësheve. Në mënyrë që të dijë se çfarë saktësisht duhet të shfaqë në ekran, është e nevojshme t'i caktoni secilit personazh numrin e tij unik. Në vitet tetëdhjetë, karakteret u koduan në një bajt, domethënë tetë bit (çdo bit është 0 ose 1). Kështu, rezultoi se një tabelë (aka kodim ose grup) mund të strehojë vetëm 256 karaktere. Kjo mund të mos mjaftojë as për një gjuhë. Prandaj, u shfaqën shumë kodime të ndryshme, konfuzioni me të cilin shpesh çonte në shfaqjen e disa gërmadhave të çuditshme në ekran në vend të tekstit të lexueshëm. Kërkohej një standard i vetëm, gjë që u bë Unicode. Kodimi më i përdorur është UTF-8 (Unicode Transformation Format), i cili përdor 1 deri në 4 bajt për të përfaqësuar një karakter.

Simbolet

Karakteret në tabelat Unicode numërohen me numra heksadecimal. Për shembull, shkronja e madhe cirilike M është caktuar U+041C. Kjo do të thotë se ai qëndron në kryqëzimin e rreshtit 041 dhe kolonës C. Ju thjesht mund ta kopjoni atë dhe pastaj ta ngjisni diku. Për të mos gërmuar nëpër një listë shumë kilometrash, duhet të përdorni kërkimin. Kur të shkoni në faqen e simboleve, do të shihni numrin e tij Unicode dhe mënyrën se si është shkruar me shkronja të ndryshme. Mund ta futni vetë shenjën në shiritin e kërkimit, edhe nëse në vend të tij vizatohet një katror, të paktën për të zbuluar se çfarë ishte. Gjithashtu, në këtë faqe ka grupe të veçanta (dhe të rastësishme) të të njëjtit lloj ikonash, të mbledhura nga seksione të ndryshme, për lehtësinë e përdorimit.

Standardi Unicode është ndërkombëtar. Ai përfshin personazhe nga pothuajse të gjitha skenarët e botës. Përfshirë ato që nuk përdoren më. Hieroglifet egjiptiane, runat gjermanike, shkrimet maja, kuneiformat dhe alfabetet e shteteve antike. Janë paraqitur edhe emërtimet e peshave dhe masave, shënimet muzikore dhe konceptet matematikore.

Vetë Konsorciumi Unicode nuk shpik personazhe të rinj. Në tabela shtohen ato ikona që gjejnë përdorim në shoqëri. Për shembull, shenja rubla u përdor në mënyrë aktive për gjashtë vjet përpara se të shtohej në Unicode. Piktogramet emoji (emoticons) gjithashtu u përdorën gjerësisht për herë të parë në Japoni përpara se të përfshiheshin në kodim. Por markat tregtare dhe logot e kompanisë nuk shtohen në parim. Edhe ato të zakonshme si molla Apple ose flamuri i Windows. Deri më sot, rreth 120 mijë karaktere janë të koduara në versionin 8.0.

Një kompjuter kupton procesin e konvertimit të tij në një formë që lejon transmetimin, ruajtjen ose përpunimin automatik të këtyre të dhënave më të përshtatshme. Për këtë qëllim përdoren tabela të ndryshme. ASCII ishte sistemi i parë i zhvilluar në Shtetet e Bashkuara për të punuar me tekst në anglisht, i cili më pas u përhap në të gjithë botën. Artikulli më poshtë i kushtohet përshkrimit, veçorive, vetive dhe përdorimit të mëtejshëm të tij.

Shfaqja dhe ruajtja e informacionit në një kompjuter

Simbolet në një monitor kompjuteri ose një ose një tjetër vegël dixhitale celulare formohen bazuar në grupe të formave vektoriale të karaktereve të ndryshme dhe një kod që ju lejon të gjeni midis tyre simbolin që duhet të futet në vendin e duhur. Ai përfaqëson një sekuencë bitash. Kështu, çdo karakter duhet të korrespondojë në mënyrë unike me një grup zero dhe njësh, të cilat shfaqen në një rend të caktuar, unik.

Si filloi gjithçka

Historikisht, kompjuterët e parë ishin në gjuhën angleze. Për të koduar informacionin simbolik në to, mjaftonte të përdoreshin vetëm 7 bit memorie, ndërsa për këtë u nda 1 bajt i përbërë nga 8 bit. Numri i karaktereve të kuptuara nga kompjuteri në këtë rast ishte 128. Këto karaktere përfshinin alfabetin anglez me shenjat e pikësimit, numrat dhe disa karaktere të veçanta. Kodimi shtatë-bit në gjuhën angleze me tabelën përkatëse (faqe kodi), i zhvilluar në vitin 1963, u quajt Kodi Standard Amerikan për Shkëmbimin e Informacionit. Zakonisht, shkurtesa "ASCII encoding" përdoret dhe përdoret ende për ta treguar atë.

Kalimi në shumëgjuhësi

Me kalimin e kohës, kompjuterët u përdorën gjerësisht në vendet jo anglishtfolëse. Në këtë drejtim, lindi nevoja për kodime që lejojnë përdorimin e gjuhëve kombëtare. U vendos që të mos rikrijohej rrota dhe të merrej si bazë ASCII. Tabela e kodimit në edicionin e ri është zgjeruar ndjeshëm. Përdorimi i bitit të 8-të bëri të mundur përkthimin e 256 karaktereve në një gjuhë kompjuteri.

Përshkrim

Kodimi ASCII ka një tabelë që është e ndarë në 2 pjesë. Vetëm gjysma e parë e tij konsiderohet të jetë një standard ndërkombëtar përgjithësisht i pranuar. Ai përfshin:

Karakteret me numra serialë nga 0 deri në 31, të koduar në sekuenca nga 00000000 deri në 00011111. Ato janë të rezervuara për karakteret e kontrollit që kontrollojnë procesin e shfaqjes së tekstit në ekran ose printer, tingëllimin e një sinjali zanor etj.
Karakteret me NN në tabelën nga 32 në 127, të koduar nga sekuencat nga 00100000 deri në 01111111 përbëjnë pjesën standarde të tabelës. Këto përfshijnë hapësirën (N 32), shkronjat e alfabetit latin (të vogla dhe të mëdha), numrat dhjetëshifrorë nga 0 në 9, shenjat e pikësimit, kllapat e stileve të ndryshme dhe simbole të tjera.
Karaktere me numra serialë nga 128 në 255, të koduar nga sekuenca nga 10000000 deri në 11111111. Këto përfshijnë shkronja të alfabeteve kombëtare të ndryshme nga latinishtja. Është kjo pjesë alternative e tabelës ASCII që përdoret për të kthyer karakteret ruse në formë kompjuteri.

Disa prona

Karakteristikat e kodimit ASCII përfshijnë ndryshimin midis shkronjave "A" - "Z" të shkronjave të vogla dhe të mëdha me vetëm një bit. Kjo rrethanë thjeshton shumë konvertimin e regjistrit, si dhe kontrollon nëse ai i përket një diapazoni të caktuar vlerash. Për më tepër, të gjitha shkronjat në sistemin e kodimit ASCII përfaqësohen nga numrat e tyre të sekuencës në alfabet, të cilët shkruhen me 5 shifra në sistemin e numrave binar, të paraprirë nga 011 2 për shkronjat e vogla dhe 010 2 për shkronjat e mëdha.

Një nga veçoritë e kodimit ASCII është paraqitja e 10 shifrave - "0" - "9". Në sistemin e dytë të numrave fillojnë me 00112 dhe përfundojnë me 2 vlera numrash. Kështu, 0101 2 është ekuivalent me numrin dhjetor pesë, kështu që karakteri "5" shkruhet si 0011 01012. Bazuar në sa më sipër, ju mund t'i konvertoni lehtësisht numrat BCD në një varg ASCII duke shtuar sekuencën e biteve 00112 në çdo gërvishtje në majtas.

"Unicode"

Siç e dini, mijëra karaktere kërkohen për të shfaqur tekste në gjuhët e grupit të Azisë Juglindore. Një numër i tillë i tyre nuk mund të përshkruhet në asnjë mënyrë në një bajt informacioni, kështu që edhe versionet e zgjeruara të ASCII nuk mund të plotësonin më nevojat e shtuara të përdoruesve nga vende të ndryshme.

Kështu, lindi nevoja për të krijuar një kodim universal të tekstit, zhvillimi i të cilit, në bashkëpunim me shumë drejtues të industrisë globale të IT, u ndërmor nga konsorciumi Unicode. Specialistët e tij krijuan sistemin UTF 32. Në të, 32 bit u ndanë për të koduar 1 karakter, duke përbërë 4 bajt informacion. Disavantazhi kryesor ishte një rritje e mprehtë e sasisë së kujtesës së kërkuar deri në 4 herë, gjë që solli shumë probleme.

Në të njëjtën kohë, për shumicën e vendeve me gjuhë zyrtare që i përkasin grupit indo-evropian, numri i karaktereve të barabartë me 2 32 është më se i tepërt.

Si rezultat i punës së mëtejshme nga specialistë nga konsorciumi Unicode, u shfaq kodimi UTF-16. Ai u bë opsioni për konvertimin e informacionit simbolik që i përshtatej të gjithëve si për sa i përket sasisë së memories së kërkuar ashtu edhe për numrin e karaktereve të koduara. Kjo është arsyeja pse UTF-16 u miratua si parazgjedhje dhe kërkon që 2 bajt të rezervohen për një karakter.

Edhe ky version mjaft i avancuar dhe i suksesshëm i Unicode kishte disa të meta, dhe pas kalimit nga versioni i zgjeruar i ASCII në UTF-16, pesha e dokumentit u dyfishua.

Në këtë drejtim, u vendos që të përdoret kodimi me gjatësi të ndryshueshme UTF-8. Në këtë rast, çdo karakter i tekstit burim është i koduar si një sekuencë me gjatësi nga 1 deri në 6 bajt.

Kontaktoni kodin standard amerikan për shkëmbim informacioni

Të gjitha karakteret latine në gjatësinë e ndryshueshme UTF-8 janë të koduara në 1 bajt, si në sistemin e kodimit ASCII.

Një veçori e veçantë e YTF-8 është se në rastin e tekstit në latinisht pa përdorur karaktere të tjera, edhe programet që nuk e kuptojnë Unicode do të jenë ende në gjendje ta lexojnë atë. Me fjalë të tjera, kodimi bazë i tekstit ASCII thjesht bëhet pjesë e UTF-së së re me gjatësi të ndryshueshme. Karakteret cirilike në YTF-8 zënë 2 bajt, dhe, për shembull, karakteret gjeorgjiane - 3 bajtë. Duke krijuar UTF-16 dhe 8, u zgjidh problemi kryesor i krijimit të një hapësire të vetme kodi në fonte. Që atëherë, prodhuesit e shkronjave mund ta mbushin tabelën vetëm me forma vektoriale të karaktereve të tekstit bazuar në nevojat e tyre.

Sisteme të ndryshme operative preferojnë kodime të ndryshme. Për të qenë në gjendje të lexoni dhe modifikoni tekstet e shtypura në një kodim tjetër, përdoren programet ruse të konvertimit të tekstit. Disa redaktues teksti përmbajnë transkoder të integruar dhe ju lejojnë të lexoni tekst pavarësisht nga kodimi.

Tani e dini se sa karaktere janë në kodimin ASCII dhe si dhe pse u zhvillua. Sigurisht, sot standardi Unicode është më i përhapuri në botë. Megjithatë, nuk duhet të harrojmë se bazohet në ASCII, ndaj duhet vlerësuar kontributi i zhvilluesve të tij në fushën e IT.

Bashkësia e karaktereve me të cilat shkruhet teksti quhet alfabeti.

Numri i karaktereve në alfabet është i tij pushtet.

Formula për përcaktimin e sasisë së informacionit: N=2b,

ku N është fuqia e alfabetit (numri i karaktereve),

b – numri i biteve (pesha e informacionit të simbolit).

Alfabeti me një kapacitet prej 256 karakteresh mund të strehojë pothuajse të gjitha karakteret e nevojshme. Ky alfabet quhet mjaftueshëm.

Sepse 256 = 2 8, atëherë pesha e 1 karakterit është 8 bit.

Njësisë matëse 8 bit iu dha emri 1 bajt:

1 bajt = 8 bit.

Kodi binar i çdo karakteri në tekstin kompjuterik merr 1 bajt memorie.

Si paraqitet informacioni i tekstit në kujtesën e kompjuterit?

Lehtësia e kodimit të karaktereve byte-pas-byte është e dukshme sepse një bajt është pjesa më e vogël e adresueshme e memories dhe, për rrjedhojë, procesori mund të qaset në secilin karakter veçmas kur përpunon tekstin. Nga ana tjetër, 256 karaktere është një numër mjaft i mjaftueshëm për të përfaqësuar një shumëllojshmëri të gjerë informacionesh simbolike.

Tani lind pyetja, cilin kod binar tetë-bit t'i caktoni secilit karakter.

Është e qartë se kjo është një çështje e kushtëzuar; ju mund të dilni me shumë metoda kodimi.

Të gjithë karakteret e alfabetit të kompjuterit numërohen nga 0 në 255. Çdo numër korrespondon me një kod binar tetë-bitësh nga 00000000 deri në 11111111. Ky kod është thjesht numri serial i karakterit në sistemin e numrave binar.

Një tabelë në të cilën të gjithë karakteret e alfabetit të kompjuterit u caktohen numra serialë quhet tabelë koduese.

Lloje të ndryshme kompjuterësh përdorin tabela të ndryshme kodimi.

Tabela është bërë standardi ndërkombëtar për PC ASCII(lexo aski) (American Standard Code for Information Interchange).

Tabela e kodeve ASCII është e ndarë në dy pjesë.

Vetëm gjysma e parë e tabelës është standardi ndërkombëtar, d.m.th. simbolet me numra nga 0 (00000000), deri në 127 (01111111).

Struktura e tabelës koduese ASCII

Numër serik	Kodi	Simboli
0 - 31	00000000 - 00011111	Simbolet me numra nga 0 në 31 zakonisht quhen simbole kontrolli. Funksioni i tyre është të kontrollojnë procesin e shfaqjes së tekstit në ekran ose printimit, tingullit të një sinjali zanor, shënimit të tekstit, etj.
32 - 127	00100000 - 01111111	Pjesa standarde e tabelës (anglisht). Këtu përfshihen shkronjat e vogla dhe të mëdha të alfabetit latin, numrat dhjetorë, shenjat e pikësimit, të gjitha llojet e kllapave, simbolet tregtare dhe të tjera. Karakteri 32 është një hapësirë, d.m.th. pozicion bosh në tekst. Të gjitha të tjerat pasqyrohen nga shenja të caktuara.
128 - 255	10000000 - 11111111	Pjesa alternative e tabelës (rusisht). Gjysma e dytë e tabelës së kodeve ASCII, e quajtur faqja e kodit (128 kode, duke filluar nga 10000000 dhe duke përfunduar me 11111111), mund të ketë opsione të ndryshme, secili opsion ka numrin e vet. Faqja e kodit përdoret kryesisht për të akomoduar alfabete kombëtare të ndryshme nga latinishtja. Në kodimet kombëtare ruse, karakteret nga alfabeti rus vendosen në këtë pjesë të tabelës.

Gjysma e parë e tabelës së kodit ASCII

Ju lutemi vini re se në tabelën e kodimit, shkronjat (të mëdha dhe të vogla) janë renditur sipas rendit alfabetik, dhe numrat janë renditur në rend rritës. Ky respektim i rendit leksikografik në renditjen e simboleve quhet parimi i kodimit sekuencial të alfabetit.

Për shkronjat e alfabetit rus, respektohet gjithashtu parimi i kodimit sekuencial.

Gjysma e dytë e tabelës së kodit ASCII

Për fat të keq, aktualisht ekzistojnë pesë kodime të ndryshme cirilike (KOI8-R, Windows. MS-DOS, Macintosh dhe ISO). Për shkak të kësaj, shpesh lindin probleme me transferimin e tekstit rus nga një kompjuter në tjetrin, nga një sistem softuer në tjetrin.

Kronologjikisht, një nga standardet e para për kodimin e shkronjave ruse në kompjuter ishte KOI8 ("Kodi i shkëmbimit të informacionit, 8-bit"). Ky kodim u përdor përsëri në vitet '70 në kompjuterët e serisë kompjuterike ES, dhe nga mesi i viteve '80 filloi të përdoret në versionet e para të rusifikuara të sistemit operativ UNIX.

Nga fillimi i viteve '90, koha e mbizotërimit të sistemit operativ MS DOS, kodimi CP866 mbetet ("CP" do të thotë "Faqja e kodit", "faqja e kodit").

Kompjuterët Apple që përdorin sistemin operativ Mac OS përdorin kodimin e tyre Mac.

Për më tepër, Organizata Ndërkombëtare e Standardeve (ISO) ka miratuar një kodim tjetër të quajtur ISO 8859-5 si standard për gjuhën ruse.

Kodimi më i zakonshëm që përdoret aktualisht është Microsoft Windows, shkurtuar CP1251.

Që nga fundi i viteve '90, problemi i standardizimit të kodimit të karaktereve është zgjidhur me futjen e një standardi të ri ndërkombëtar të quajtur Unicode. Ky është një kodim 16-bit, d.m.th. cakton 2 bajt memorie për çdo karakter. Sigurisht, kjo rrit sasinë e kujtesës së zënë me 2 herë. Por një tabelë e tillë kodi lejon përfshirjen deri në 65536 karaktere. Specifikimi i plotë i standardit Unicode përfshin të gjitha alfabetet ekzistuese, të zhdukura dhe të krijuara artificialisht të botës, si dhe shumë simbole matematikore, muzikore, kimike dhe të tjera.

Le të përpiqemi të përdorim një tabelë ASCII për të imagjinuar se si do të duken fjalët në kujtesën e kompjuterit.

Paraqitja e brendshme e fjalëve në kujtesën e kompjuterit

Ndonjëherë ndodh që një tekst i përbërë nga shkronja të alfabetit rus të marrë nga një kompjuter tjetër nuk mund të lexohet - një lloj "abracadabra" është i dukshëm në ekranin e monitorit. Kjo ndodh sepse kompjuterët përdorin kodime të ndryshme të karaktereve për gjuhën ruse.

Artikujt më të mirë mbi këtë temë

Kopjimi i skedarëve dhe dosjeve

Mënyra të ndryshme për të ekzekutuar Command Prompt si Administrator në Windows

Komanda RUNAS - ekzekutimi i një aplikacioni si një përdorues tjetër i Windows

Kategoritë:

Kodet dhjetore të karaktereve ascii c. Kodimi i informacionit të tekstit

Tabela e kodit të karaktereve të Windows ASCII. Përshkrimi i karaktereve speciale (kontroll).

Mbivendosja e karaktereve

Variantet kombëtare ASCII

Simbolet

Shfaqja dhe ruajtja e informacionit në një kompjuter

Si filloi gjithçka

Kalimi në shumëgjuhësi

Përshkrim

Disa prona

"Unicode"

Kontaktoni kodin standard amerikan për shkëmbim informacioni

Si paraqitet informacioni i tekstit në kujtesën e kompjuterit?

Tani lind pyetja, cilin kod binar tetë-bit t'i caktoni secilit karakter.

Një tabelë në të cilën të gjithë karakteret e alfabetit të kompjuterit u caktohen numra serialë quhet tabelë koduese.

Struktura e tabelës koduese ASCII

Numër serik

Kodi

Simboli

0 - 31

00000000 - 00011111

32 - 127

00100000 - 01111111

128 - 255

10000000 - 11111111