Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ
  • në shtëpi
  • Këshilla
  • Dihet që në tabelën e kodeve ka karaktere ascii. Kodimi ASCII (kodi standard amerikan për shkëmbimin e informacionit) - kodimi bazë i tekstit për latinisht

Dihet që në tabelën e kodeve ka karaktere ascii. Kodimi ASCII (kodi standard amerikan për shkëmbimin e informacionit) - kodimi bazë i tekstit për latinisht

Bashkësia e karaktereve me të cilat shkruhet teksti quhet alfabeti.

Numri i karaktereve në alfabet është i tij pushtetin.

Formula për përcaktimin e sasisë së informacionit: N = 2 b,

ku N është kardinaliteti i alfabetit (numri i karaktereve),

b - numri i biteve (pesha informative e karakterit).

Alfabeti me një kapacitet prej 256 karakteresh mund të strehojë pothuajse të gjitha karakteret e nevojshme. Ky alfabet quhet mjaftueshëm.

Sepse 256 = 2 8, atëherë pesha e 1 karakteri është 8 bit.

Njësia 8-bitëshe u emërua 1 bajt:

1 bajt = 8 bit.

Kodi binar i çdo karakteri në tekstin kompjuterik merr 1 bajt memorie.

Si paraqitet informacioni i tekstit në memorien e kompjuterit?

Lehtësia e kodimit të karaktereve me bajt është e dukshme, pasi një bajt është pjesa më e vogël e adresueshme e memories dhe, për rrjedhojë, procesori mund të aksesojë çdo karakter veç e veç, duke kryer përpunimin e tekstit. Nga ana tjetër, 256 karaktere është një numër mjaft i mjaftueshëm për të përfaqësuar një shumëllojshmëri të gjerë të informacionit të karaktereve.

Tani lind pyetja, çfarë lloj kodi binar tetë-bit të lidhet me secilin karakter.

Është e qartë se kjo është një çështje e kushtëzuar, ju mund të dilni me shumë metoda kodimi.

Të gjithë karakteret e alfabetit të kompjuterit numërohen nga 0 deri në 255. Çdo numër korrespondon me një kod binar tetë-bitësh nga 00000000 deri në 11111111. Ky kod është thjesht numri rendor i karakterit në sistemin e numrave binar.

Tabela në të cilën të gjithë karakteret e alfabetit të kompjuterit janë caktuar numra serialë quhet tabela e kodimit.

Për lloje të ndryshme kompjuterash përdoren tabela të ndryshme kodimi.

Standardi ndërkombëtar për PC është bërë tabela ASCII(lexo asci) (Kodi standard amerikan për shkëmbimin e informacionit).

Tabela ASCII është e ndarë në dy pjesë.

Standardi ndërkombëtar është vetëm gjysma e parë e tabelës, d.m.th. simbolet me numra nga 0 (00000000), deri në 127 (01111111).

Struktura e tabelës koduese ASCII

Numër serik

Kodi

Simboli

0 - 31

00000000 - 00011111

Simbolet me numra nga 0 në 31 zakonisht quhen karaktere kontrolli.
Funksioni i tyre është të kontrollojnë procesin e shfaqjes së tekstit në ekran ose të printimit, dhënien e një sinjali zanor, shënimin e tekstit, etj.

32 - 127

00100000 - 01111111

Pjesa standarde e tabelës (anglisht). Këtu përfshihen shkronjat e vogla dhe të mëdha të alfabetit latin, shifrat dhjetore, shenjat e pikësimit, të gjitha llojet e kllapave, simbolet tregtare dhe të tjera.
Karakteri 32 është një hapësirë, d.m.th. pozicion bosh në tekst.
Të gjitha të tjerat pasqyrohen në shenja të caktuara.

128 - 255

10000000 - 11111111

Pjesa alternative e tabelës (rusisht).
Gjysma e dytë e tabelës së kodeve ASCII, e quajtur faqja e kodit (128 kode, duke filluar nga 10000000 dhe duke përfunduar me 11111111), mund të ketë variante të ndryshme, secili variant ka numrin e vet.
Faqja e kodit përdoret kryesisht për të akomoduar alfabete kombëtare të ndryshme nga latinishtja. Në kodimet kombëtare ruse, kjo pjesë e tabelës përmban simbole të alfabetit rus.

Gjysma e parë e tabelës ASCII


Unë tërheq vëmendjen tuaj për faktin se në tabelën e kodimit, shkronjat (të mëdha dhe të vogla) janë renditur sipas rendit alfabetik, dhe numrat janë renditur në rendin rritës të vlerave. Ky respektim i rendit leksikografik në renditjen e karaktereve quhet parimi i kodimit sekuencial të alfabetit.

Për shkronjat e alfabetit rus, respektohet edhe parimi i kodimit sekuencial.

Gjysma e dytë e tabelës ASCII


Fatkeqësisht, aktualisht ekzistojnë pesë kodime të ndryshme cirilike (KOI8-R, Windows. MS-DOS, Macintosh dhe ISO). Për shkak të kësaj, shpesh lindin probleme me transferimin e tekstit rus nga një kompjuter në tjetrin, nga një sistem softuer në tjetrin.

Kronologjikisht, një nga standardet e para për kodimin e shkronjave ruse në kompjuter ishte KOI8 ("Kodi i shkëmbimit të informacionit, 8-bit"). Ky kodim u përdor përsëri në vitet '70 në kompjuterët e serisë kompjuterike ES, dhe nga mesi i viteve '80 filloi të përdoret në versionet e para të rusifikuara të sistemit operativ UNIX.

Që nga fillimi i viteve '90, koha e dominimit të sistemit operativ MS DOS, kodimi CP866 mbetet ("CP" do të thotë "Faqja e kodit").

Kompjuterët Apple me Mac OS përdorin kodimin e tyre Mac.

Për më tepër, Organizata Ndërkombëtare e Standardeve (ISO) ka miratuar një kodim tjetër të quajtur ISO 8859-5 si standard për gjuhën ruse.

Aktualisht, kodimi më i zakonshëm është Microsoft Windows, i shkurtuar si CP1251.

Që nga fundi i viteve '90, problemi i standardizimit të kodimit të karaktereve është zgjidhur me futjen e një standardi të ri ndërkombëtar të quajtur Unicode... Ky është një kodim 16-bit d.m.th. cakton 2 bajt memorie për çdo karakter. Sigurisht, kjo dyfishon sasinë e memories së përdorur. Por nga ana tjetër, një tabelë e tillë kodesh lejon përfshirjen deri në 65536 karaktere. Specifikimi i plotë i standardit Unicode përfshin të gjitha alfabetet ekzistuese, të zhdukura dhe të krijuara artificialisht të botës, si dhe shumë simbole matematikore, muzikore, kimike dhe të tjera.

Le të përpiqemi të përdorim një tabelë ASCII për të imagjinuar se si do të duken fjalët në kujtesën e kompjuterit.

Paraqitja e brendshme e fjalëve në kujtesën e kompjuterit

Ndonjëherë ndodh që një tekst i përbërë nga shkronja të alfabetit rus, i marrë nga një kompjuter tjetër, nuk mund të lexohet - një lloj "korrizi" është i dukshëm në ekranin e monitorit. Kjo për faktin se kompjuterët përdorin kodime të ndryshme të karaktereve të gjuhës ruse.

Excel për Office 365 Word për Office 365 Outlook për Office 365 PowerPoint për Office 365 Publisher për Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2007 Outlook 2007 PowerPoint 2007 Publisher 2007 Access 2007 Visio 2007 OneNote 2007 Office 2010 Visio Standard 2007 Visio Standard 2010 Më të vogla

Në këtë artikull

Futni një karakter ASCII ose Unicode në një dokument

Nëse ju duhet të futni vetëm disa karaktere ose simbole të veçanta, mund të përdorni ose shkurtoret e tastierës. Për një listë të karaktereve ASCII, shihni tabelat e mëposhtme ose artikullin Fut alfabetet kombëtare duke përdorur shkurtoret e tastierës.

Shënime:

Fut karaktere ASCII

Për të futur një karakter ASCII, shtypni dhe mbani tastin ALT ndërsa futni kodin e karakterit. Për shembull, për të futur një simbol të shkallës (º), shtypni dhe mbani tastin Alt, më pas futni 0176 në tastierën numerike.

Përdorni tastierën numerike për të futur numra në vend të numrave në tastierën kryesore. Nëse duhet të futni numra në tastierën numerike, sigurohuni që treguesi NUM LOCK të jetë i ndezur.

Futja e karaktereve Unicode

Për të futur një karakter Unicode, futni kodin e karakterit, më pas shtypni ALT dhe X në sekuencë. Për shembull, për të futur një shenjë dollari ($), futni 0024 dhe shtypni ALT dhe X me radhë. Për të gjitha kodet e karaktereve të Unicode, shihni.

E rëndësishme: Disa programe të Microsoft Office, të tilla si PowerPoint dhe InfoPath, nuk mbështesin konvertimin e kodeve të Unicode në karaktere. Nëse keni nevojë të futni një karakter Unicode në një nga këto programe, përdorni.

Shënime:

    Nëse shihni karakterin e gabuar të Unicode pasi shtypni ALT + X, zgjidhni kodin e duhur dhe më pas shtypni përsëri ALT + X.

    Për më tepër, "U +" duhet të futet përpara kodit. Për shembull, nëse futni "1U + B5" dhe shtypni Alt + X, shfaqet teksti "1µ", dhe nëse futni "1B5" dhe shtypni Alt + X, shfaqet karakteri "Ƶ".

Duke përdorur tabelën e simboleve

Symbol Map është një program i integruar në Microsoft Windows që ju lejon të shikoni simbolet e disponueshme për një font të zgjedhur.

Duke përdorur një tabelë simbolesh, mund të kopjoni simbole individuale ose një grup simbolesh në kujtesën e fragmenteve dhe t'i ngjisni në çdo program që mund t'i shfaqë ato simbole. Hapja e tabelës së simboleve

    Në Windows 10 Futni fjalën "simbol" në kutinë e kërkimit në shiritin e detyrave dhe zgjidhni një tabelë simbolesh nga rezultatet e kërkimit.

    Në Windows 8 Futni fjalën "karakter" në ekranin bazë dhe zgjidhni një tabelë karakteresh nga rezultatet e kërkimit.

    Në Windows 7 Shtyp butonin Filloni, zgjidhni në mënyrë sekuenciale Të gjitha programet, Standard, Shërbimi dhe klikoni tabela e simboleve.

Karakteret janë grupuar sipas fontit. Klikoni në listën e shkronjave për të zgjedhur grupin e duhur të karaktereve. Për të zgjedhur një simbol, klikoni mbi të dhe më pas klikoni Zgjidhni... Për të futur një simbol, klikoni me të djathtën në vendndodhjen e dëshiruar në dokument dhe zgjidhni Fut.

Kodet e simboleve të përdorura shpesh

Për një listë të plotë të karaktereve, shihni kompjuterin tuaj, tabelën e kodit të karaktereve ASCII ose tabelat e grupeve të karaktereve Unicode.

Glyph

Glyph

Njësitë monetare

Simbolet ligjore

Simbolet e matematikës

Thyesat

Simbolet e pikësimit dhe dialekteve

Forma simbole

Kodet diakritike të përdorura zakonisht

Për një listë të plotë të glifeve dhe kodeve përkatëse, shihni.

Glyph

Glyph

Karaktere kontrolli ASCII jo të printueshme

Karakteret e përdorura për të kontrolluar disa pajisje periferike, të tilla si printerët, numërohen 0–31 në tabelën ASCII. Për shembull, një karakter ushqimor / faqe e re është numri 12. Ky karakter i thotë printerit të shkojë në krye të faqes tjetër.

Tabela e karaktereve të kontrollit ASCII jo të printueshme

dhjetore

Shenjë

dhjetore

Shenjë

Lirimi i kanalit të të dhënave

Fillimi i titullit

Kodi i parë i kontrollit të pajisjes

Fillimi i tekstit

Kodi i dytë i kontrollit të pajisjes

Fundi i tekstit

Kodi i tretë i kontrollit të pajisjes

Fundi i transmetimit

Kodi i katërt i kontrollit të pajisjes

me pesë cepa

Konfirmim negativ

Konfirmimi

Mënyra e transmetimit sinkron

Sinjali i zërit

Fundi i bllokut të të dhënave të transmetuara

Skeda horizontale

Fundi i medias

Furnizimi i linjës / linjë e re

Karakteri zëvendësues

Skeda vertikale

tejkalojnë

Përkthimi i faqes / faqe e re

I dymbëdhjeti

Ndarës i skedarëve

Kthim ngarkese

Ndarës grupi

Zhvendos pa ruajtur shifra

Ndarës rekordesh

Zhvendosja me ruajtjen e shifrave

pesëmbëdhjetë

Ndarës i të dhënave

Nga rruga, në faqen tonë ju mund të përktheni çdo tekst në kodin dhjetor, heksadecimal, binar duke përdorur kalkulatorin e kodit në internet.

Tabela ASCII

ASCII (Kodi standard amerikan për shkëmbimin e informacionit)

Tabela përmbledhëse e kodeve ASCII

Tabela e kodit të karaktereve të Windows ASCII (Win-1251)

Simboli

specialist. Tab

specialist. LF (Kthimi me karrocë)

specialist. CR (Linja e re)

tufë SP (Hapësirë)

Simboli

Tabela e zgjeruar ASCII

Formatimi i karaktereve.

Backspace (Backspace një karakter). Tregon lëvizjen e mekanizmit të printimit ose të kursorit të ekranit prapa një pozicioni.

Tabela horizontale Tregon lëvizjen e motorit të printimit ose kursorit të ekranit në "stop ndalesën" tjetër të përshkruar.

Furnizimi i linjës. Tregon lëvizjen e motorit të printimit ose kursorit të ekranit në fillim të rreshtit tjetër (një rresht poshtë).

Tabela vertikale Tregon lëvizjen e motorit të printimit ose kursorit të ekranit në grupin vijues të rreshtave.

Furnizimi i formularit. Tregon lëvizjen e motorit të printimit ose kursorit të ekranit në pozicionin fillestar të faqes, formularit ose ekranit tjetër.

Kthim ngarkese. Tregon lëvizjen e mekanizmit të printimit ose kursorit të ekranit në pozicionin origjinal (më të majtë) të linjës aktuale.

Transferimi i të dhënave.

Fillimi i titullit. Përdoret për të identifikuar fillimin e një titulli, i cili mund të përmbajë informacione rutimi ose një adresë.

Fillimi i tekstit. Tregon fillimin e tekstit dhe në të njëjtën kohë fundin e titullit.

Fundi i tekstit. Zbatohet kur përfundon tekstin që fillon me karakterin STX.

hetim. Kërkesë për të dhëna identifikimi (si "Kush je ti?") Nga stacioni i largët.

pranoni. Pajisja marrëse ia transmeton këtë karakter dërguesit si konfirmim për marrjen e suksesshme të të dhënave.

Mirënjohja negative. Pajisja marrëse ia transmeton këtë karakter dërguesit në rast të refuzimit (dështimit) të marrjes së të dhënave.

Sinkron / I papunë. Përdoret në sistemet e transmisionit të sinkronizuar. Kur nuk ka transmetim të të dhënave, sistemi dërgon vazhdimisht simbolet SYN për të siguruar sinkronizimin.

Fundi i bllokut të transmetimit. Tregon fundin e një blloku të dhënash për qëllime komunikimi. Përdoret për ndarjen e sasive të mëdha të të dhënave në blloqe të veçanta.

Ndarja e shenjave gjatë transferimit të informacionit.

Simbole të tjera.

I pavlefshëm. (Pa karakter - pa të dhëna). Përdoret për transmetim në mungesë të të dhënave.

zile Përdoret për të kontrolluar pajisjet e alarmit.

Zhvendos jashtë. Tregon që të gjitha fjalët e koduara pasuese duhet të interpretohen sipas grupit të karaktereve të jashtme përpara mbërritjes së karakterit SI.

Shift In. Tregon që fjalët e koduara pasuese duhet të interpretohen sipas grupit standard të karaktereve.

Arratisja e lidhjes së të dhënave Ndryshimi i kuptimit të karaktereve të mëposhtme. Përdoret për kontroll shtesë ose për transferimin e një modeli arbitrar bit.

DC1, DC2, DC3, DC4

Kontrollet e pajisjes. Simbolet për kontrollin e pajisjeve ndihmëse (funksione speciale).

Anulo. Tregon që të dhënat që i paraprinë këtij karakteri në një mesazh ose bllok duhet të injorohen (zakonisht nëse haset një gabim).

Fundi i Mediumit. Tregon fundin fizik të një shiriti ose mediumi tjetër ruajtës

Zëvendësues Përdoret për të zëvendësuar një karakter të gabuar ose të pavlefshëm.

Arratisje (Zgjerim). Përdoret për të zgjeruar kodin, duke treguar se karakteri pasues ka një kuptim alternativ.

Hapësirë Një karakter jo i printueshëm për të ndarë fjalët ose për të lëvizur motorin e printimit ose kursorin e ekranit një pozicion përpara.

Fshije. Përdoret për të fshirë (fshirë) karakterin e mëparshëm në mesazh

[Kodimi 8-bit: ASCII, KOI-8R dhe CP1251] Tabelat e para të grupeve të karaktereve të krijuara në SHBA nuk përdorën bitin e tetë në një bajt. Teksti u paraqit si një sekuencë bajtash, por biti i tetë nuk u mor parasysh (është përdorur për qëllime shërbimi).

Standardi i pranuar përgjithësisht është bërë tabela ASCII(Kodi standard amerikan për shkëmbimin e informacionit). 32 karakteret e para ASCII (00 deri në 1F) u përdorën për karaktere që nuk mund të printohen. Ato ishin krijuar për të kontrolluar një pajisje printimi dhe të ngjashme. Pjesa tjetër - nga 20 në 7 F - janë karaktere normale (të printueshme).

Tabela 1 - Kodimi ASCII

dhjetorHekstetorCharPërshkrim
0 0 000 i pavlefshëm
1 1 001 fillimi i titullit
2 2 002 fillimi i tekstit
3 3 003 fundi i tekstit
4 4 004 fundi i transmetimit
5 5 005 hetim
6 6 006 pranoj
7 7 007 zile
8 8 010 backspace
9 9 011 skedë horizontale
10 A 012 linjë e re
11 B 013 skedë vertikale
12 C 014 faqe e re
13 D 015 kthim ngarkese
14 E 016 zhvendosja jashtë
15 F 017 zhvendosje brenda
16 10 020 ikja e lidhjes së të dhënave
17 11 021 kontrolli i pajisjes 1
18 12 022 kontrolli i pajisjes 2
19 13 023 kontrolli i pajisjes 3
20 14 024 kontrolli i pajisjes 4
21 15 025 pranimi negativ
22 16 026 boshe sinkron
23 17 027 fundi i trans. bllokoj
24 18 030 anuloni
25 19 031 fundi i mesëm
26 1A 032 zëvendësues
27 1B 033 arratisje
28 1C 034 ndarës i skedarëve
29 1D 035 ndarës grupi
30 1E 036 ndarës rekord
31 1F 037 ndarës njësi
32 20 040 hapësirë
33 21 041 !
34 22 042 "
35 23 043 #
36 24 044 $
37 25 045 %
38 26 046 &
39 27 047 "
40 28 050 (
41 29 051 )
42 2A 052 *
43 2B 053 +
44 2C 054 ,
45 2D 055 -
46 2E 056 .
47 2F 057 /
48 30 060 0
49 31 061 1
50 32 062 2
51 33 063 3
52 34 064 4
53 35 065 5
54 36 066 6
55 37 067 7
56 38 070 8
57 39 071 9
58 3A 072 :
59 3B 073 ;
60 3C 074 <
61 3D 075 =
62 3E 076 >
63 3F 077 ?
dhjetorHekstetorChar
64 40 100 @
65 41 101 A
66 42 102 B
67 43 103 C
68 44 104 D
69 45 105 E
70 46 106 F
71 47 107 G
72 48 110 H
73 49 111 Unë
74 4A 112 J
75 4B 113 K
76 4C 114 L
77 4D 115 M
78 4E 116 N
79 4F 117 O
80 50 120 P
81 51 121 P
82 52 122 R
83 53 123 S
84 54 124 T
85 55 125 U
86 56 126 V
87 57 127 W
88 58 130 X
89 59 131 Y
90 5A 132 Z
91 5B 133 [
92 5C 134 \
93 5D 135 ]
94 5E 136 ^
95 5F 137 _
96 60 140 `
97 61 141 a
98 62 142 b
99 63 143 c
100 64 144 d
101 65 145 e
102 66 146 f
103 67 147 g
104 68 150 h
105 69 151 i
106 6A 152 j
107 6B 153 k
108 6C 154 l
109 6D 155 m
110 6E 156 n
111 6F 157 o
112 70 160 fq
113 71 161 q
114 72 162 r
115 73 163 s
116 74 164 t
117 75 165 u
118 76 166 v
119 77 167 w
120 78 170 x
121 79 171 y
122 7A 172 z
123 7B 173 {
124 7C 174 |
125 7D 175 }
126 7E 176 ~
127 7F 177 DEL

Siç mund ta shihni lehtësisht, ky kodim përmban vetëm shkronja latine dhe ato që përdoren në anglisht. Ekzistojnë gjithashtu simbole aritmetike dhe të tjera shërbimi. Por nuk ka shkronja ruse, madje as shkronja të veçanta latine për gjermanishten apo frëngjishten. Kjo është e lehtë për t'u shpjeguar - kodimi u zhvillua posaçërisht si një standard amerikan. Kur kompjuterët filluan të përdoren në të gjithë botën, u bë i nevojshëm kodimi i simboleve të tjera.

Për këtë, u vendos që të përdoret biti i tetë në çdo bajt. Kështu, 128 vlera të tjera ishin në dispozicion (nga 80 në FF), të cilat mund të përdoren për të koduar karakteret. E para nga tabelat me tetë bit është "ASCII e zgjeruar" ( ASCII i zgjeruar) - përfshinte variante të ndryshme të karaktereve latine të përdorura në disa gjuhë të Evropës Perëndimore. Ai gjithashtu përmbante simbole të tjera shtesë, duke përfshirë pseudografikë.

Karakteret pseudografike lejojnë, duke shfaqur vetëm karaktere teksti, të japin njëfarë pamjeje grafike. Për shembull, programi për menaxhimin e skedarëve FAR Manager funksionon me ndihmën e pseudografikës.

Nuk kishte shkronja ruse në tabelën e zgjeruar ASCII. Në Rusi (ish BRSS) dhe në shtetet e tjera, u krijuan kodimet e tyre, të cilat bënë të mundur përfaqësimin e karaktereve specifike "kombëtare" në skedarë teksti 8-bit - shkronja latine të gjuhëve polake dhe çeke, cirilike (përfshirë shkronjat ruse ) dhe alfabete të tjera.

Në të gjitha kodimet që janë bërë të përhapura, 127 karakteret e para (d.m.th., vlerat e bajtit me bitin e tetë të barabartë me 0) përkojnë me ASCII. Kështu, një skedar ASCII funksionon në cilindo nga këto kodime; shkronjat e gjuhës angleze përfaqësohen në të njëjtën mënyrë.

Organizimi ISO(Organizata Ndërkombëtare e Standardizimit) miratoi një grup standardesh ISO 8859... Ai përcakton kodimet 8-bit për grupe të ndryshme gjuhësh. Pra, ISO 8859-1 është Extended ASCII, një tabelë për Shtetet e Bashkuara dhe Evropën Perëndimore. Dhe ISO 8859-5 është një tabelë për cirilik (përfshirë rusishten).

Megjithatë, për arsye historike, kodimi ISO 8859-5 nuk ka arritur. Në realitet, kodimet e mëposhtme përdoren për gjuhën ruse:

Kodi Faqe 866 ( CP866), i njohur si "DOS", i njohur si "kodimi alternativ GOST". U përdor gjerësisht deri në mesin e viteve '90; tani përdoret në një masë të kufizuar. Praktikisht nuk përdoret për shpërndarjen e teksteve në internet.
- KOI-8. Zhvilluar në vitet '70 dhe '80. Është një standard përgjithësisht i pranuar për transmetimin e mesazheve postare në internetin rus. Përdoret gjithashtu gjerësisht në sistemet operative të familjes Unix, duke përfshirë Linux. Versioni KOI-8, i krijuar për gjuhën ruse, quhet KOI-8R; ka versione për gjuhë të tjera cirilike (për shembull, KOI8-U është një opsion për gjuhën ukrainase).
- Kodi Faqe 1251, CP1251, Windows-1251. Zhvilluar nga Microsoft për të mbështetur gjuhën ruse në Windows.

Avantazhi kryesor i CP866 ishte ruajtja e karaktereve pseudografike në të njëjtat vende si në Extended ASCII; prandaj, programet me tekst të huaj, për shembull, i famshëm Norton Commander, mund të funksiononin pa ndryshime. Në ditët e sotme CP866 përdoret për programet Windows që ekzekutohen në dritare me tekst ose në modalitetin e tekstit në ekran të plotë, duke përfshirë "FAR Manager".

Vitet e fundit, tekstet në CP866 janë mjaft të rralla (por përdoret për të koduar emrat e skedarëve rusë në Windows). Prandaj, do të ndalemi më në detaje në dy kodime të tjera - KOI-8R dhe CP1251.



Siç mund ta shihni, në tabelën e kodimit CP1251, shkronjat ruse janë rregulluar sipas rendit alfabetik (me përjashtim të shkronjës E). Ky rregullim e bën shumë të lehtë që programet kompjuterike të renditen sipas alfabetit.

Por në KOI-8R, renditja e shkronjave ruse duket të jetë e rastësishme. Por në fakt nuk është kështu.

Shumë programe të vjetra humbën bitin e 8-të gjatë përpunimit ose transmetimit të tekstit. (Tani programe të tilla praktikisht janë "shuar", por në fund të viteve '80 - fillimi i viteve '90 ato ishin të përhapura). Për të marrë një vlerë 7-bitësh nga një vlerë 8-bitësh, zbritni 8 nga shifra më e rëndësishme; për shembull E1 bëhet 61.

Tani krahasoni KOI-8R me tabelën ASCII (Tabela 1). Do të zbuloni se shkronjat ruse janë të lidhura qartë me ato latine. Nëse biti i tetë zhduket, shkronjat e vogla ruse kthehen në shkronja të mëdha latine dhe shkronjat e mëdha ruse kthehen në shkronja të vogla latine. Pra, E1 në KOI-8 është rusisht "A", ndërsa 61 në ASCII është latinisht "a".

Pra, KOI-8 ju lejon të ruani lexueshmërinë e tekstit rus duke humbur bitin e 8-të. "Përshëndetje të gjithëve" bëhet "pRIWET WSEM".

Kohët e fundit, si rendi alfabetik i karaktereve në tabelën e kodimit ashtu edhe lexueshmëria me humbjen e bitit të 8-të kanë humbur rëndësinë e tyre vendimtare. Biti i tetë në kompjuterët modernë nuk humbet as gjatë transmetimit dhe as gjatë përpunimit. Renditja sipas rendit alfabetik bazohet në kodim, dhe jo në krahasim të thjeshtë të kodeve. (Nga rruga, kodet CP1251 nuk janë plotësisht alfabetike - shkronja E nuk është në vendin e saj).

Për shkak të faktit se ekzistojnë dy kodime të zakonshme, kur punoni me internetin (mail, shfletimi i faqeve në internet), ndonjëherë mund të shihni një grup të pakuptimtë shkronjash në vend të tekstit rus. Për shembull, "Unë jam SBUFEMHEL". Këto janë vetëm fjalët "me respekt"; por ato ishin të koduara në kodimin CP1251, dhe kompjuteri deshifroi tekstin sipas tabelës KOI-8. Nëse të njëjtat fjalë ishin, përkundrazi, të koduara në KOI-8, dhe kompjuteri deshifroi tekstin sipas tabelës CP1251, rezultati do të jetë "У ХЧБЦЕОЙЕН".

Ndonjëherë ndodh që kompjuteri të deshifrojë fare shkronjat në gjuhën ruse sipas një tabele që nuk është menduar për gjuhën ruse. Pastaj, në vend të shkronjave ruse, shfaqet një grup simbolesh të pakuptimta (për shembull, shkronja latine të gjuhëve të Evropës Lindore); ata shpesh quhen "crocozyabras".

Në shumicën e rasteve, programet moderne përballen me përcaktimin e kodimeve të dokumenteve të Internetit (email dhe faqe në internet). Por ndonjëherë ata "shkojnë keq", dhe më pas mund të shihni sekuenca të çuditshme të shkronjave ruse ose "krokozyabra". Si rregull, për të shfaqur tekstin real në ekran, mjafton të zgjidhni kodimin manualisht në menunë e programit.

Për artikullin, u përdor informacioni nga faqja http://open-office.edusite.ru/TextProcessor/p5aa1.html.

Materiali i marrë nga faqja:

Artikujt kryesorë të lidhur