Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ

Kodet dhjetore të karaktereve ascii c. Kodimi i informacionit të tekstit

dhjetor Hex Simboli dhjetor Hex Simboli
000 00 specialist. JO 128 80 Ђ
001 01 specialist. SOH 129 81 Ѓ
002 02 specialist. STX 130 82
003 03 specialist. ETX 131 83 ѓ
004 04 specialist. EOT 132 84
005 05 specialist. ENQ 133 85
006 06 specialist. ACK 134 86
007 07 specialist. BEL 135 87
008 08 specialist. B.S. 136 88
009 09 specialist. TAB 137 89
010 0Aspecialist. LF 138 8AЉ
011 0Bspecialist. VT 139 8B‹ ‹
012 0Cspecialist. FF 140 8CЊ
013 0Dspecialist. CR 141 8DЌ
014 0Especialist. KËSHTU QË 142 8EЋ
015 0Fspecialist. S.I. 143 8FЏ
016 10 specialist. DLE 144 90 ђ
017 11 specialist. DC1 145 91
018 12 specialist. DC2 146 92
019 13 specialist. DC3 147 93
020 14 specialist. DC4 148 94
021 15 specialist. N.A.K. 149 95
022 16 specialist. SYN 150 96
023 17 specialist. ETB 151 97
024 18 specialist. MUND 152 98
025 19 specialist. E.M. 153 99
026 1Aspecialist. NËN 154 9Aљ
027 1Bspecialist. ESC 155 9B
028 1Cspecialist. FS 156 9Cњ
029 1Dspecialist. G.S. 157 9Dќ
030 1Especialist. R.S. 158 9Eћ
031 1Fspecialist. SHBA 159 9Fџ
032 20 tufë SP (Hapësirë) 160 A0
033 21 ! 161 A1 Ў
034 22 " 162 A2ў
035 23 # 163 A3Ћ
036 24 $ 164 A4¤
037 25 % 165 A5Ґ
038 26 & 166 A6¦
039 27 " 167 A7§
040 28 ( 168 A8Jo
041 29 ) 169 A9©
042 2A* 170 A.A.Є
043 2B+ 171 AB«
044 2C, 172 A.C.¬
045 2D- 173 pas Krishtit­
046 2E. 174 A.E.®
047 2F/ 175 A.F.Ї
048 30 0 176 B0°
049 31 1 177 B1±
050 32 2 178 B2І
051 33 3 179 B3і
052 34 4 180 B4ґ
053 35 5 181 B5µ
054 36 6 182 B6
055 37 7 183 B7·
056 38 8 184 B8e
057 39 9 185 B9
058 3A: 186 B.A.є
059 3B; 187 BB»
060 3C< 188 B.C.ј
061 3D= 189 BDЅ
062 3E> 190 BEѕ
063 3F? 191 B.F.ї
064 40 @ 192 C0 A
065 41 A 193 C1 B
066 42 B 194 C2
067 43 C 195 C3 G
068 44 D 196 C4 D
069 45 E 197 C5 E
070 46 F 198 C6 DHE
071 47 G 199 C7 Z
072 48 H 200 C8 DHE
073 49 I 201 C9 Y
074 4AJ 202 C.A. TE
075 4BK 203 C.B. L
076 4CL 204 CC M
077 4DM 205 CD N
078 4EN 206 C.E. RRETH
079 4FO 207 CF P
080 50 P 208 D0 R
081 51 P 209 D1 ME
082 52 R 210 D2 T
083 53 S 211 D3 U
084 54 T 212 D4 F
085 55 U 213 D5 X
086 56 V 214 D6 C
087 57 W 215 D7 H
088 58 X 216 D8 Sh
089 59 Y 217 D9 SCH
090 5AZ 218 D.A. Kommersant
091 5B[ 219 D.B. Y
092 5C\ 220 DC b
093 5D] 221 DD E
094 5E^ 222 DE YU
095 5F_ 223 DF I
096 60 ` 224 E0 A
097 61 a 225 E1 b
098 62 b 226 E2 V
099 63 c 227 E3 G
100 64 d 228 E4 d
101 65 e 229 E5 e
102 66 f 230 E6 dhe
103 67 g 231 E7 h
104 68 h 232 E8 Dhe
105 69 i 233 E9 th
106 6Aj 234 E.A. te
107 6Bk 235 E.B. l
108 6Cl 236 E.C. m
109 6Dm 237 ED n
110 6En 238 E.E. O
111 6Fo 239 E.F. P
112 70 fq 240 F0 R
113 71 q 241 F1 Me
114 72 r 242 F2 T
115 73 s 243 F3
116 74 t 244 F4 f
117 75 u 245 F5 X
118 76 v 246 F6 ts
119 77 w 247 F7 h
120 78 x 248 F8 w
121 79 y 249 F9 sch
122 7Az 250 F.A. ъ
123 7B{ 251 FB s
124 7C| 252 F.C. b
125 7D} 253 FD uh
126 7E~ 254 F.E. Ju
127 7FSpecialist. DEL 255 FF I

Tabela e kodit të karaktereve të Windows ASCII.
Përshkrimi i karaktereve speciale (kontroll).

Duhet të theksohet se karakteret e kontrollit të tabelës ASCII fillimisht u përdorën për të siguruar shkëmbimin e të dhënave përmes makinës së shtypit, futjen e të dhënave nga shiriti i shtypur dhe për kontrollin e thjeshtë të pajisjeve të jashtme.
Aktualisht, shumica e karaktereve të kontrollit të tabelës ASCII nuk e mbajnë më këtë ngarkesë dhe mund të përdoren për qëllime të tjera.
Kodi Përshkrim
NUL, 00E pavlefshme, bosh
SOH, 01Fillimi i Drejtimit
STX, 02Fillimi i TeXt, fillimi i tekstit.
ETX, 03Fundi i TeXt, fundi i tekstit
EOT, 04Fundi i transmetimit, fundi i transmetimit
ENQ, 05Pyete. Ju lutem konfirmoni
ACK, 06Mirënjohje. Unë konfirmoj
BEL, 07Zile, telefono
BS, 08Backspace, kthehu një personazh prapa
TAB, 09Skeda, skeda horizontale
LF, 0AFurnizimi i linjës, furnizimi i linjës.
Në ditët e sotme në shumicën e gjuhëve programuese shënohet si \n
VT, 0BSkeda vertikale, tabela vertikale.
FF, 0CFurnizimi i formularit, furnizimi i faqeve, faqe e re
CR, 0DCarriage Return, karrocë kthimi.
Në ditët e sotme në shumicën e gjuhëve programuese shënohet si \r
SO,0EShift Out, ndryshoni ngjyrën e shiritit të bojës në pajisjen e printimit
SI, 0FShift In, kthejeni ngjyrën e shiritit të bojës në pajisjen e printimit
DLE, 10Data Link Escape, duke kaluar kanalin në transmetimin e të dhënave
DC1, 11
DC2, 12
DC3, 13
DC4, 14
Kontrolli i pajisjes, simbolet e kontrollit të pajisjes
NAK, 15Mirënjohje negative, nuk e konfirmoj.
SYN, 16Sinkronizimi. Simboli i sinkronizimit
ETB, 17Fundi i bllokut të tekstit, fundi i bllokut të tekstit
MUND, 18Anulimi, anulimi i një të transmetuar më parë
EM, 19Fundi i Mediumit
SUB, 1AZëvendësim, zëvendësues. Vendosur në vend të një simboli kuptimi i të cilit humbi ose u korruptua gjatë transmetimit
ESC, 1BSekuenca e kontrollit të arratisjes
FS, 1CNdarës i skedarëve, ndarës i skedarëve
GS, 1DNdarës grupi
RS, 1ENdarëse e shënimeve, ndarës rekord
SHBA, 1FNdarës i njësisë
DEL, 7FFshi, fshi karakterin e fundit.

Mbivendosja e karaktereve

Karakteri BS (backspace) lejon printerin të printojë një karakter mbi tjetrin. ASCII parashikoi shtimin e diakritikëve në shkronja në këtë mënyrë, për shembull:

  • a BS "→ á
  • a BS ` → à
  • a BS ^ → â
  • o BS / → ø
  • c BS , → ç
  • n BS ~ → с

shënim: në shkronjat e vjetra, apostrofi " vizatohej i pjerrët në të majtë, dhe tilda ~ u zhvendos lart, kështu që ato thjesht përshtaten me rolin e një akute dhe një tilde sipër.

Nëse i njëjti karakter mbivendoset në një karakter, rezultati është një efekt shkronjash të theksuara, dhe nëse një nënvizim mbivendoset mbi një karakter, rezultati është tekst i nënvizuar.

  • a BS a → a
  • aBS_→ a

shënim: Kjo përdoret, për shembull, në sistemin e ndihmës mashkullore.

Variantet kombëtare ASCII

Standardi ISO 646 (ECMA-6) parashikon mundësinë e vendosjes së simboleve kombëtare në vend @ [ \ ] ^ ` { | } ~ . Përveç kësaj, në vend # mund të postohet £ , dhe në vend $ - ¤ . Ky sistem është i përshtatshëm për gjuhët evropiane ku nevojiten vetëm disa karaktere shtesë. Versioni i ASCII pa karaktere kombëtare quhet US-ASCII, ose "Versioni i referencës ndërkombëtare".

Më pas, doli të ishte më i përshtatshëm përdorimi i kodimeve 8-bit (faqet e kodit), ku gjysma e poshtme e tabelës së kodit (0-127) është e zënë nga karakteret US-ASCII, dhe gjysma e sipërme (128-255) me karaktere shtesë, duke përfshirë një grup karakteresh kombëtare. Kështu, gjysma e sipërme e tabelës ASCII, përpara miratimit të gjerë të Unicode, u përdor në mënyrë aktive për të përfaqësuar karaktere të lokalizuara, shkronja të gjuhës lokale. Mungesa e një standardi të unifikuar për vendosjen e karaktereve cirilike në tabelën ASCII shkaktoi shumë probleme me kodimet (KOI-8, Windows-1251 dhe të tjerët). Gjuhët e tjera me shkrime jo latine gjithashtu vuanin nga të pasurit e disa kodimeve të ndryshme.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
0. NUL SOM EOA MVZ EQT W.R.U. RU ZILE BKSP HT LF VT FF CR KËSHTU QË S.I.
1. DC 0 DC 1 DC 2 DC 3 DC 4 ERR SINKORONIZA L.E.M. S 0 S 1 S 2 S 3 S 4 S 5 S 6 S 7
2.
3.
4. BLANK ! " # $ % & " ( ) * + , - . /
5. 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
6.
7.
8.
9.
A. @ A B C D E F G H I J K L M N O
B. P P R S T U V W X Y Z [ \ ]
C.
D.
E. a b c d e f g h i j k l m n o
F. fq q r s t u v w x y z ESC DEL

Në ata kompjuterë ku njësia minimale e adresueshme e memories ishte një fjalë 36-bit, fillimisht u përdorën karaktere 6-bit (1 fjalë = 6 karaktere). Pas kalimit në ASCII, kompjuterë të tillë filluan të përmbajnë ose 5 karaktere shtatë-bitësh (1 bit mbeti shtesë) ose 4 karaktere nëntë-bitësh në një fjalë.

Kodet ASCII përdoren gjithashtu për të përcaktuar se cili tast shtypet gjatë programimit. Për një tastierë standarde QWERTY, tabela e kodeve duket si kjo:

Unicode (Unicode në anglisht) është një standard kodimi i karaktereve. E thënë thjesht, kjo është një tabelë e korrespondencës midis karaktereve të tekstit (, shkronja, elementet e pikësimit) kodet binare. Kompjuteri kupton vetëm sekuencën e zerove dhe njësheve. Në mënyrë që të dijë se çfarë saktësisht duhet të shfaqë në ekran, është e nevojshme t'i caktoni secilit personazh numrin e tij unik. Në vitet tetëdhjetë, karakteret u koduan në një bajt, domethënë tetë bit (çdo bit është 0 ose 1). Kështu, rezultoi se një tabelë (aka kodim ose grup) mund të strehojë vetëm 256 karaktere. Kjo mund të mos mjaftojë as për një gjuhë. Prandaj, u shfaqën shumë kodime të ndryshme, konfuzioni me të cilin shpesh çonte në shfaqjen e disa gërmadhave të çuditshme në ekran në vend të tekstit të lexueshëm. Kërkohej një standard i vetëm, gjë që u bë Unicode. Kodimi më i përdorur është UTF-8 (Unicode Transformation Format), i cili përdor 1 deri në 4 bajt për të përfaqësuar një karakter.

Simbolet

Karakteret në tabelat Unicode numërohen me numra heksadecimal. Për shembull, shkronja e madhe cirilike M është caktuar U+041C. Kjo do të thotë se ai qëndron në kryqëzimin e rreshtit 041 dhe kolonës C. Ju thjesht mund ta kopjoni atë dhe pastaj ta ngjisni diku. Për të mos gërmuar nëpër një listë shumë kilometrash, duhet të përdorni kërkimin. Kur të shkoni në faqen e simboleve, do të shihni numrin e tij Unicode dhe mënyrën se si është shkruar me shkronja të ndryshme. Mund ta futni vetë shenjën në shiritin e kërkimit, edhe nëse në vend të tij vizatohet një katror, ​​të paktën për të zbuluar se çfarë ishte. Gjithashtu, në këtë faqe ka grupe të veçanta (dhe të rastësishme) të të njëjtit lloj ikonash, të mbledhura nga seksione të ndryshme, për lehtësinë e përdorimit.

Standardi Unicode është ndërkombëtar. Ai përfshin personazhe nga pothuajse të gjitha skenarët e botës. Përfshirë ato që nuk përdoren më. Hieroglifet egjiptiane, runat gjermanike, shkrimet maja, kuneiformat dhe alfabetet e shteteve antike. Janë paraqitur edhe emërtimet e peshave dhe masave, shënimet muzikore dhe konceptet matematikore.

Vetë Konsorciumi Unicode nuk shpik personazhe të rinj. Në tabela shtohen ato ikona që gjejnë përdorim në shoqëri. Për shembull, shenja rubla u përdor në mënyrë aktive për gjashtë vjet përpara se të shtohej në Unicode. Piktogramet emoji (emoticons) gjithashtu u përdorën gjerësisht për herë të parë në Japoni përpara se të përfshiheshin në kodim. Por markat tregtare dhe logot e kompanisë nuk shtohen në parim. Edhe ato të zakonshme si molla Apple ose flamuri i Windows. Deri më sot, rreth 120 mijë karaktere janë të koduara në versionin 8.0.

Një kompjuter kupton procesin e konvertimit të tij në një formë që lejon transmetimin, ruajtjen ose përpunimin automatik të këtyre të dhënave më të përshtatshme. Për këtë qëllim përdoren tabela të ndryshme. ASCII ishte sistemi i parë i zhvilluar në Shtetet e Bashkuara për të punuar me tekst në anglisht, i cili më pas u përhap në të gjithë botën. Artikulli më poshtë i kushtohet përshkrimit, veçorive, vetive dhe përdorimit të mëtejshëm të tij.

Shfaqja dhe ruajtja e informacionit në një kompjuter

Simbolet në një monitor kompjuteri ose një ose një tjetër vegël dixhitale celulare formohen bazuar në grupe të formave vektoriale të karaktereve të ndryshme dhe një kod që ju lejon të gjeni midis tyre simbolin që duhet të futet në vendin e duhur. Ai përfaqëson një sekuencë bitash. Kështu, çdo karakter duhet të korrespondojë në mënyrë unike me një grup zero dhe njësh, të cilat shfaqen në një rend të caktuar, unik.

Si filloi gjithçka

Historikisht, kompjuterët e parë ishin në gjuhën angleze. Për të koduar informacionin simbolik në to, mjaftonte të përdoreshin vetëm 7 bit memorie, ndërsa për këtë u nda 1 bajt i përbërë nga 8 bit. Numri i karaktereve të kuptuara nga kompjuteri në këtë rast ishte 128. Këto karaktere përfshinin alfabetin anglez me shenjat e pikësimit, numrat dhe disa karaktere të veçanta. Kodimi shtatë-bit në gjuhën angleze me tabelën përkatëse (faqe kodi), i zhvilluar në vitin 1963, u quajt Kodi Standard Amerikan për Shkëmbimin e Informacionit. Zakonisht, shkurtesa "ASCII encoding" përdoret dhe përdoret ende për ta treguar atë.

Kalimi në shumëgjuhësi

Me kalimin e kohës, kompjuterët u përdorën gjerësisht në vendet jo anglishtfolëse. Në këtë drejtim, lindi nevoja për kodime që lejojnë përdorimin e gjuhëve kombëtare. U vendos që të mos rikrijohej rrota dhe të merrej si bazë ASCII. Tabela e kodimit në edicionin e ri është zgjeruar ndjeshëm. Përdorimi i bitit të 8-të bëri të mundur përkthimin e 256 karaktereve në një gjuhë kompjuteri.

Përshkrim

Kodimi ASCII ka një tabelë që është e ndarë në 2 pjesë. Vetëm gjysma e parë e tij konsiderohet të jetë një standard ndërkombëtar përgjithësisht i pranuar. Ai përfshin:

  • Karakteret me numra serialë nga 0 deri në 31, të koduar në sekuenca nga 00000000 deri në 00011111. Ato janë të rezervuara për karakteret e kontrollit që kontrollojnë procesin e shfaqjes së tekstit në ekran ose printer, tingëllimin e një sinjali zanor etj.
  • Karakteret me NN në tabelën nga 32 në 127, të koduar nga sekuencat nga 00100000 deri në 01111111 përbëjnë pjesën standarde të tabelës. Këto përfshijnë hapësirën (N 32), shkronjat e alfabetit latin (të vogla dhe të mëdha), numrat dhjetëshifrorë nga 0 në 9, shenjat e pikësimit, kllapat e stileve të ndryshme dhe simbole të tjera.
  • Karaktere me numra serialë nga 128 në 255, të koduar nga sekuenca nga 10000000 deri në 11111111. Këto përfshijnë shkronja të alfabeteve kombëtare të ndryshme nga latinishtja. Është kjo pjesë alternative e tabelës ASCII që përdoret për të kthyer karakteret ruse në formë kompjuteri.

Disa prona

Karakteristikat e kodimit ASCII përfshijnë ndryshimin midis shkronjave "A" - "Z" të shkronjave të vogla dhe të mëdha me vetëm një bit. Kjo rrethanë thjeshton shumë konvertimin e regjistrit, si dhe kontrollon nëse ai i përket një diapazoni të caktuar vlerash. Për më tepër, të gjitha shkronjat në sistemin e kodimit ASCII përfaqësohen nga numrat e tyre të sekuencës në alfabet, të cilët shkruhen me 5 shifra në sistemin e numrave binar, të paraprirë nga 011 2 për shkronjat e vogla dhe 010 2 për shkronjat e mëdha.

Një nga veçoritë e kodimit ASCII është paraqitja e 10 shifrave - "0" - "9". Në sistemin e dytë të numrave fillojnë me 00112 dhe përfundojnë me 2 vlera numrash. Kështu, 0101 2 është ekuivalent me numrin dhjetor pesë, kështu që karakteri "5" shkruhet si 0011 01012. Bazuar në sa më sipër, ju mund t'i konvertoni lehtësisht numrat BCD në një varg ASCII duke shtuar sekuencën e biteve 00112 në çdo gërvishtje në majtas.

"Unicode"

Siç e dini, mijëra karaktere kërkohen për të shfaqur tekste në gjuhët e grupit të Azisë Juglindore. Një numër i tillë i tyre nuk mund të përshkruhet në asnjë mënyrë në një bajt informacioni, kështu që edhe versionet e zgjeruara të ASCII nuk mund të plotësonin më nevojat e shtuara të përdoruesve nga vende të ndryshme.

Kështu, lindi nevoja për të krijuar një kodim universal të tekstit, zhvillimi i të cilit, në bashkëpunim me shumë drejtues të industrisë globale të IT, u ndërmor nga konsorciumi Unicode. Specialistët e tij krijuan sistemin UTF 32. Në të, 32 bit u ndanë për të koduar 1 karakter, duke përbërë 4 bajt informacion. Disavantazhi kryesor ishte një rritje e mprehtë e sasisë së kujtesës së kërkuar deri në 4 herë, gjë që solli shumë probleme.

Në të njëjtën kohë, për shumicën e vendeve me gjuhë zyrtare që i përkasin grupit indo-evropian, numri i karaktereve të barabartë me 2 32 është më se i tepërt.

Si rezultat i punës së mëtejshme nga specialistë nga konsorciumi Unicode, u shfaq kodimi UTF-16. Ai u bë opsioni për konvertimin e informacionit simbolik që i përshtatej të gjithëve si për sa i përket sasisë së memories së kërkuar ashtu edhe për numrin e karaktereve të koduara. Kjo është arsyeja pse UTF-16 u miratua si parazgjedhje dhe kërkon që 2 bajt të rezervohen për një karakter.

Edhe ky version mjaft i avancuar dhe i suksesshëm i Unicode kishte disa të meta, dhe pas kalimit nga versioni i zgjeruar i ASCII në UTF-16, pesha e dokumentit u dyfishua.

Në këtë drejtim, u vendos që të përdoret kodimi me gjatësi të ndryshueshme UTF-8. Në këtë rast, çdo karakter i tekstit burim është i koduar si një sekuencë me gjatësi nga 1 deri në 6 bajt.

Kontaktoni kodin standard amerikan për shkëmbim informacioni

Të gjitha karakteret latine në gjatësinë e ndryshueshme UTF-8 janë të koduara në 1 bajt, si në sistemin e kodimit ASCII.

Një veçori e veçantë e YTF-8 është se në rastin e tekstit në latinisht pa përdorur karaktere të tjera, edhe programet që nuk e kuptojnë Unicode do të jenë ende në gjendje ta lexojnë atë. Me fjalë të tjera, kodimi bazë i tekstit ASCII thjesht bëhet pjesë e UTF-së së re me gjatësi të ndryshueshme. Karakteret cirilike në YTF-8 zënë 2 bajt, dhe, për shembull, karakteret gjeorgjiane - 3 bajtë. Duke krijuar UTF-16 dhe 8, u zgjidh problemi kryesor i krijimit të një hapësire të vetme kodi në fonte. Që atëherë, prodhuesit e shkronjave mund ta mbushin tabelën vetëm me forma vektoriale të karaktereve të tekstit bazuar në nevojat e tyre.

Sisteme të ndryshme operative preferojnë kodime të ndryshme. Për të qenë në gjendje të lexoni dhe modifikoni tekstet e shtypura në një kodim tjetër, përdoren programet ruse të konvertimit të tekstit. Disa redaktues teksti përmbajnë transkoder të integruar dhe ju lejojnë të lexoni tekst pavarësisht nga kodimi.

Tani e dini se sa karaktere janë në kodimin ASCII dhe si dhe pse u zhvillua. Sigurisht, sot standardi Unicode është më i përhapuri në botë. Megjithatë, nuk duhet të harrojmë se bazohet në ASCII, ndaj duhet vlerësuar kontributi i zhvilluesve të tij në fushën e IT.

Bashkësia e karaktereve me të cilat shkruhet teksti quhet alfabeti.

Numri i karaktereve në alfabet është i tij pushtet.

Formula për përcaktimin e sasisë së informacionit: N=2b,

ku N është fuqia e alfabetit (numri i karaktereve),

b – numri i biteve (pesha e informacionit të simbolit).

Alfabeti me një kapacitet prej 256 karakteresh mund të strehojë pothuajse të gjitha karakteret e nevojshme. Ky alfabet quhet mjaftueshëm.

Sepse 256 = 2 8, atëherë pesha e 1 karakterit është 8 bit.

Njësisë matëse 8 bit iu dha emri 1 bajt:

1 bajt = 8 bit.

Kodi binar i çdo karakteri në tekstin kompjuterik merr 1 bajt memorie.

Si paraqitet informacioni i tekstit në kujtesën e kompjuterit?

Lehtësia e kodimit të karaktereve byte-pas-byte është e dukshme sepse një bajt është pjesa më e vogël e adresueshme e memories dhe, për rrjedhojë, procesori mund të qaset në secilin karakter veçmas kur përpunon tekstin. Nga ana tjetër, 256 karaktere është një numër mjaft i mjaftueshëm për të përfaqësuar një shumëllojshmëri të gjerë informacionesh simbolike.

Tani lind pyetja, cilin kod binar tetë-bit t'i caktoni secilit karakter.

Është e qartë se kjo është një çështje e kushtëzuar; ju mund të dilni me shumë metoda kodimi.

Të gjithë karakteret e alfabetit të kompjuterit numërohen nga 0 në 255. Çdo numër korrespondon me një kod binar tetë-bitësh nga 00000000 deri në 11111111. Ky kod është thjesht numri serial i karakterit në sistemin e numrave binar.

Një tabelë në të cilën të gjithë karakteret e alfabetit të kompjuterit u caktohen numra serialë quhet tabelë koduese.

Lloje të ndryshme kompjuterësh përdorin tabela të ndryshme kodimi.

Tabela është bërë standardi ndërkombëtar për PC ASCII(lexo aski) (American Standard Code for Information Interchange).

Tabela e kodeve ASCII është e ndarë në dy pjesë.

Vetëm gjysma e parë e tabelës është standardi ndërkombëtar, d.m.th. simbolet me numra nga 0 (00000000), deri në 127 (01111111).

Struktura e tabelës koduese ASCII

Numër serik

Kodi

Simboli

0 - 31

00000000 - 00011111

Simbolet me numra nga 0 në 31 zakonisht quhen simbole kontrolli.
Funksioni i tyre është të kontrollojnë procesin e shfaqjes së tekstit në ekran ose printimit, tingullit të një sinjali zanor, shënimit të tekstit, etj.

32 - 127

00100000 - 01111111

Pjesa standarde e tabelës (anglisht). Këtu përfshihen shkronjat e vogla dhe të mëdha të alfabetit latin, numrat dhjetorë, shenjat e pikësimit, të gjitha llojet e kllapave, simbolet tregtare dhe të tjera.
Karakteri 32 është një hapësirë, d.m.th. pozicion bosh në tekst.
Të gjitha të tjerat pasqyrohen nga shenja të caktuara.

128 - 255

10000000 - 11111111

Pjesa alternative e tabelës (rusisht).
Gjysma e dytë e tabelës së kodeve ASCII, e quajtur faqja e kodit (128 kode, duke filluar nga 10000000 dhe duke përfunduar me 11111111), mund të ketë opsione të ndryshme, secili opsion ka numrin e vet.
Faqja e kodit përdoret kryesisht për të akomoduar alfabete kombëtare të ndryshme nga latinishtja. Në kodimet kombëtare ruse, karakteret nga alfabeti rus vendosen në këtë pjesë të tabelës.

Gjysma e parë e tabelës së kodit ASCII


Ju lutemi vini re se në tabelën e kodimit, shkronjat (të mëdha dhe të vogla) janë renditur sipas rendit alfabetik, dhe numrat janë renditur në rend rritës. Ky respektim i rendit leksikografik në renditjen e simboleve quhet parimi i kodimit sekuencial të alfabetit.

Për shkronjat e alfabetit rus, respektohet gjithashtu parimi i kodimit sekuencial.

Gjysma e dytë e tabelës së kodit ASCII


Për fat të keq, aktualisht ekzistojnë pesë kodime të ndryshme cirilike (KOI8-R, Windows. MS-DOS, Macintosh dhe ISO). Për shkak të kësaj, shpesh lindin probleme me transferimin e tekstit rus nga një kompjuter në tjetrin, nga një sistem softuer në tjetrin.

Kronologjikisht, një nga standardet e para për kodimin e shkronjave ruse në kompjuter ishte KOI8 ("Kodi i shkëmbimit të informacionit, 8-bit"). Ky kodim u përdor përsëri në vitet '70 në kompjuterët e serisë kompjuterike ES, dhe nga mesi i viteve '80 filloi të përdoret në versionet e para të rusifikuara të sistemit operativ UNIX.

Nga fillimi i viteve '90, koha e mbizotërimit të sistemit operativ MS DOS, kodimi CP866 mbetet ("CP" do të thotë "Faqja e kodit", "faqja e kodit").

Kompjuterët Apple që përdorin sistemin operativ Mac OS përdorin kodimin e tyre Mac.

Për më tepër, Organizata Ndërkombëtare e Standardeve (ISO) ka miratuar një kodim tjetër të quajtur ISO 8859-5 si standard për gjuhën ruse.

Kodimi më i zakonshëm që përdoret aktualisht është Microsoft Windows, shkurtuar CP1251.

Që nga fundi i viteve '90, problemi i standardizimit të kodimit të karaktereve është zgjidhur me futjen e një standardi të ri ndërkombëtar të quajtur Unicode. Ky është një kodim 16-bit, d.m.th. cakton 2 bajt memorie për çdo karakter. Sigurisht, kjo rrit sasinë e kujtesës së zënë me 2 herë. Por një tabelë e tillë kodi lejon përfshirjen deri në 65536 karaktere. Specifikimi i plotë i standardit Unicode përfshin të gjitha alfabetet ekzistuese, të zhdukura dhe të krijuara artificialisht të botës, si dhe shumë simbole matematikore, muzikore, kimike dhe të tjera.

Le të përpiqemi të përdorim një tabelë ASCII për të imagjinuar se si do të duken fjalët në kujtesën e kompjuterit.

Paraqitja e brendshme e fjalëve në kujtesën e kompjuterit

Ndonjëherë ndodh që një tekst i përbërë nga shkronja të alfabetit rus të marrë nga një kompjuter tjetër nuk mund të lexohet - një lloj "abracadabra" është i dukshëm në ekranin e monitorit. Kjo ndodh sepse kompjuterët përdorin kodime të ndryshme të karaktereve për gjuhën ruse.

Artikujt më të mirë mbi këtë temë