Kako podesiti pametne telefone i računare. Informativni portal
  • Dom
  • Savjet
  • Poznato je da u tablici kodova postoje ascii znakovi. ASCII (američki standardni kod za razmjenu informacija) kodiranje - osnovno kodiranje teksta za latinicu

Poznato je da u tablici kodova postoje ascii znakovi. ASCII (američki standardni kod za razmjenu informacija) kodiranje - osnovno kodiranje teksta za latinicu

Skup znakova kojim se piše tekst naziva se abeceda.

Broj znakova u abecedi je njegov moć.

Formula za određivanje količine informacija: N = 2 b,

gdje je N kardinalnost abecede (broj znakova),

b - broj bitova (informaciona težina karaktera).

Abeceda kapaciteta 256 znakova može primiti gotovo sve potrebne znakove. Ova abeceda se zove dovoljno.

Jer 256 = 2 8, tada je težina 1 znaka 8 bita.

8-bitna jedinica je dobila ime 1 bajt:

1 bajt = 8 bitova.

Binarni kod svakog znaka u kompjuterskom tekstu zauzima 1 bajt memorije.

Kako su tekstualne informacije predstavljene u memoriji računara?

Pogodnost bajt kodiranja znakova je očigledna, budući da je bajt najmanji adresabilni dio memorije i stoga procesor može pristupiti svakom karakteru zasebno, obavljajući obradu teksta. S druge strane, 256 znakova je sasvim dovoljan broj za predstavljanje širokog spektra informacija o znakovima.

Sada se postavlja pitanje kakvu vrstu osmobitnog binarnog koda povezati sa svakim znakom.

Jasno je da je ovo uslovna stvar, možete smisliti mnoge metode kodiranja.

Svi znakovi kompjuterske abecede su numerisani od 0 do 255. Svaki broj odgovara osmocifrenom binarnom kodu od 00000000 do 11111111. Ovaj kod je jednostavno redni broj znaka u binarnom sistemu.

Tabela u kojoj su svim znakovima kompjuterske abecede dodijeljeni serijski brojevi naziva se tabela kodiranja.

Za različite tipove računara koriste se različite tablice kodiranja.

Međunarodni standard za PC je postao stol ASCII(čitaj asci) (Američki standardni kod za razmjenu informacija).

ASCII tabela je podijeljena na dva dijela.

Međunarodni standard je samo prva polovina tabele, tj. simboli sa brojevima iz 0 (00000000), do 127 (01111111).

Struktura ASCII tablice kodiranja

Serijski broj

Kod

Simbol

0 - 31

00000000 - 00011111

Simboli sa brojevima od 0 do 31 obično se nazivaju kontrolni znakovi.
Njihova funkcija je kontrola procesa prikazivanja teksta na ekranu ili štampanja, davanja zvučnog signala, označavanja teksta itd.

32 - 127

00100000 - 01111111

Standardni dio tabele (engleski). Ovo uključuje mala i velika slova latinice, decimalne cifre, znakove interpunkcije, sve vrste zagrada, komercijalne i druge simbole.
Znak 32 je razmak, tj. prazna pozicija u tekstu.
Svi ostali se ogledaju u određenim znacima.

128 - 255

10000000 - 11111111

Alternativni dio tabele (ruski).
Druga polovina tabele kodova ASCII, nazvana kodna stranica (128 kodova, počevši od 10000000 i završavajući sa 11111111), može imati različite varijante, svaka varijanta ima svoj broj.
Kodna stranica se prvenstveno koristi za smještaj nacionalnih alfabeta osim latinice. U ruskim nacionalnim kodovima, ovaj dio tabele sadrži simbole ruskog alfabeta.

Prva polovina ASCII tabele


Skrećem vam pažnju da su u tablici kodiranja slova (velika i mala slova) raspoređena abecednim redom, a brojevi rastućim redoslijedom vrijednosti. Ovo poštovanje leksikografskog reda u rasporedu znakova naziva se princip sekvencijalnog kodiranja abecede.

Za slova ruske abecede također se poštuje princip sekvencijalnog kodiranja.

Druga polovina ASCII tabele


Nažalost, trenutno postoji pet različitih ćiriličkih kodiranja (KOI8-R, Windows. MS-DOS, Macintosh i ISO). Zbog toga često nastaju problemi sa prenosom ruskog teksta sa jednog računara na drugi, iz jednog softverskog sistema u drugi.

Hronološki, jedan od prvih standarda za kodiranje ruskih slova na računarima bio je KOI8 („Kod za razmjenu informacija, 8-bitni“). Ovo kodiranje se koristilo još 70-ih godina na računarima serije računara ES, a od sredine 80-ih počelo je da se koristi u prvim rusifikovanim verzijama UNIX operativnog sistema.

Od početka 90-ih, vremena dominacije operativnog sistema MS DOS, ostaje CP866 kodiranje („CP“ je skraćenica za „Code Page“).

Apple računari koji koriste Mac OS koriste vlastito Mac kodiranje.

Pored toga, Međunarodna organizacija za standardizaciju (International Standards Organization, ISO) odobrila je još jedno kodiranje pod nazivom ISO 8859-5 kao standard za ruski jezik.

Trenutno, najčešće kodiranje je Microsoft Windows, skraćeno CP1251.

Od kasnih 90-ih, problem standardizacije kodiranja znakova riješen je uvođenjem novog međunarodnog standarda tzv. Unicode... Ovo je 16-bitno kodiranje, tj. dodjeljuje 2 bajta memorije za svaki znak. Naravno, ovo udvostručuje količinu korištene memorije. Ali s druge strane, takva kodna tabela omogućava uključivanje do 65536 znakova. Kompletna specifikacija Unicode standarda uključuje sve postojeće, izumrle i umjetno stvorene alfabete svijeta, kao i mnoge matematičke, muzičke, hemijske i druge simbole.

Pokušajmo koristiti ASCII tablicu da zamislimo kako će riječi izgledati u memoriji računara.

Interno predstavljanje riječi u memoriji računara

Ponekad se desi da se tekst koji se sastoji od slova ruske abecede, primljen sa drugog računara, ne može pročitati - na ekranu monitora je vidljiva neka vrsta "brblja". To je zbog činjenice da računari koriste različito kodiranje znakova ruskog jezika.

Excel za Office 365 Word za Office 365 Outlook za Office 365 PowerPoint za Office 365 Publisher za Office 365 Excel 2019 Word 2019 Outlook 2019 PowerPoint 2019 OneNote 2016 Publisher 2019 Visio Professional 2019 Visio Standard 2019 Excel 2016 Word 2016 Outlook 2016 PowerPoint 2016 OneNote 2013 Publisher 2016 Visio 2013 Visio Professional 2016 Visio Standard 2016 Excel 2013 Word 2013 Outlook 2013 PowerPoint 2013 Publisher 2013 Excel 2010 Word 2010 Outlook 2010 PowerPoint 2010 OneNote 2010 Publisher 2010 Visio 2010 Excel 2007 Word 2010 Excel 2007 Word 2007 Visio07 Office2007 Power07 Office202 ​​Access07 Visio Standard 2007 Visio Standard 2010 Manje

U ovom članku

Umetnite ASCII ili Unicode znak u dokument

Ako trebate unijeti samo nekoliko posebnih znakova ili simbola, možete koristiti bilo koje tipkovne prečice. Za listu ASCII znakova, pogledajte sljedeće tabele ili članak Umetanje nacionalnih alfabeta pomoću prečica na tastaturi.

napomene:

Umetnite ASCII znakove

Da unesete ASCII znak, pritisnite i držite tipku ALT dok unosite kod karaktera. Na primjer, da biste umetnuli simbol stepena (º), pritisnite i držite tipku Alt, a zatim unesite 0176 na numeričkoj tastaturi.

Koristite numeričku tastaturu za unos brojeva umjesto brojeva na glavnoj tastaturi. Ako trebate unijeti brojeve na numeričkoj tastaturi, provjerite je li indikator NUM LOCK uključen.

Umetanje Unicode znakova

Da biste umetnuli Unicode znak, unesite kod karaktera, a zatim pritisnite ALT i X u nizu. Na primjer, da biste umetnuli znak dolara ($), unesite 0024 i pritisnite ALT i X u nizu. Za sve kodove Unicode znakova pogledajte.

Bitan: Neki Microsoft Office programi, kao što su PowerPoint i InfoPath, ne podržavaju pretvaranje Unicode kodova u znakove. Ako trebate umetnuti Unicode znak u jedan od ovih programa, koristite.

napomene:

    Ako vidite pogrešan Unicode znak nakon što pritisnete ALT + X, odaberite ispravan kod, a zatim ponovo pritisnite ALT + X.

    Osim toga, "U +" se mora unijeti prije koda. Na primjer, ako unesete "1U + B5" i pritisnete Alt + X, prikazuje se tekst "1µ", a ako unesete "1B5" i pritisnete Alt + X, prikazuje se znak "Ƶ".

Korišćenje tabele simbola

Symbol Map je program ugrađen u Microsoft Windows koji vam omogućava da vidite simbole dostupne za odabrani font.

Koristeći tablicu simbola, možete kopirati pojedinačne simbole ili grupu simbola u međuspremnik i zalijepiti ih u bilo koji program koji može prikazati te simbole. Otvaranje tabele simbola

    Na Windows 10 Unesite riječ "simbol" u okvir za pretraživanje na traci zadataka i odaberite tablicu simbola iz rezultata pretraživanja.

    Na Windows 8 Unesite riječ "znak" na početnom ekranu i odaberite tabelu znakova iz rezultata pretraživanja.

    Na Windows 7 pritisnite dugme Počni, uzastopno odaberite Svi programi, Standard, Servis i kliknite tabela simbola.

Znakovi su grupirani po fontu. Kliknite na listu fontova da odaberete odgovarajući skup znakova. Da biste odabrali simbol, kliknite na njega, a zatim kliknite Odaberite... Da biste umetnuli simbol, desnom tipkom miša kliknite željenu lokaciju u dokumentu i odaberite Insert.

Često korišteni kodovi simbola

Za kompletnu listu znakova pogledajte svoj računar, tabelu kodova ASCII znakova ili tabele skupova Unicode znakova.

Glif

Glif

Monetarne jedinice

Pravni simboli

Matematički simboli

Razlomci

Znakovi interpunkcije i dijalekatski simboli

Simboli obrazaca

Često korišteni dijakritički kodovi

Za kompletnu listu glifova i povezanih kodova, pogledajte.

Glif

Glif

ASCII kontrolni znakovi koji se ne mogu ispisati

Znakovi koji se koriste za kontrolu nekih perifernih uređaja, kao što su štampači, označeni su brojevima od 0 do 31 u ASCII tabeli. Na primjer, znak za feed / nova stranica je broj 12. Ovaj znak govori štampaču da ide na vrh sljedeće stranice.

ASCII tablica kontrolnih znakova koja se ne može ispisati

Decimala

Potpiši

Decimala

Potpiši

Oslobađanje kanala podataka

Početak naslova

Prvi kontrolni kod uređaja

Početak teksta

Drugi kontrolni kod uređaja

Kraj teksta

Kontrolni kod trećeg uređaja

Kraj prijenosa

Četvrti kontrolni kod uređaja

petokraka

Negativna potvrda

Potvrda

Sinhroni način prijenosa

Zvučni signal

Kraj bloka prenesenih podataka

Horizontalna kartica

Kraj medija

Prijelaz na red / novi red

Zamjenski karakter

Vertikalna kartica

premašiti

Prijevod stranice / nova stranica

Dvanaesti

File separator

Povrat kočije

Grupni separator

Shift bez pohranjivanja cifara

Razdjelnik zapisa

Pomak sa očuvanjem cifara

petnaest

Razdjelnik podataka

Usput, na našoj stranici možete prevesti bilo koji tekst u decimalni, heksadecimalni, binarni kod pomoću online kalkulatora kodova.

ASCII tabela

ASCII (američki standardni kod za razmjenu informacija)

Tabela sažetka ASCII kodova

ASCII Windows tablica kodova znakova (Win-1251)

Simbol

specijalista. Tab

specijalista. LF (povratak kočije)

specijalista. CR (nova linija)

kvačilo SP (prostor)

Simbol

Proširena ASCII tabela

Formatiranje znakova.

Backspace (Backspace jedan znak). Označava pomicanje mehanizma za štampanje ili pokazivača pokazivača unazad za jednu poziciju.

Horizontalna tabulacija Pokazuje kretanje mašine za štampanje ili pokazivača pokazivača do sledećeg propisanog "tab stop".

Line Feed. Pokazuje kretanje mašine za štampanje ili pokazivača na početku sledećeg reda (jedan red naniže).

Vertikalna tablica Pokazuje kretanje mašine za štampanje ili pokazivača na sljedeću grupu linija.

Form Feed. Označava pomeranje mašine za štampanje ili pokazivača na početnu poziciju sledeće stranice, obrasca ili ekrana.

Povrat kočije. Pokazuje pomicanje mehanizma za ispis ili pokazivača pokazivača na originalnu (krajnju lijevu) poziciju tekuće linije.

Prijenos podataka.

Početak naslova. Koristi se za identifikaciju početka zaglavlja, koje može sadržavati informacije o usmjeravanju ili adresu.

Početak teksta. Prikazuje početak teksta i istovremeno kraj naslova.

Kraj teksta. Primjenjuje se kada završava tekst koji je započeo STX znakom.

Upit. Zahtjev za identifikacijskim podacima (poput "Ko si ti?") sa udaljene stanice.

Priznati. Prijemni uređaj šalje ovaj znak pošiljaocu kao potvrdu uspješnog prijema podataka.

Negativna potvrda. Prijemni uređaj šalje ovaj znak pošiljaocu u slučaju odbijanja (neuspjeha) prijema podataka.

Sinhroni / Idle. Koristi se u sistemima sinhronizovanog prenosa. Kada nema prijenosa podataka, sistem kontinuirano šalje SYN simbole kako bi osigurao sinhronizaciju.

Kraj bloka prijenosa. Označava kraj bloka podataka za potrebe komunikacije. Koristi se za cijepanje velikih količina podataka u zasebne blokove.

Oznake za razdvajanje prilikom prenošenja informacija.

Ostali simboli.

Null. (Nema karaktera - nema podataka). Koristi se za prijenos u nedostatku podataka.

Bell Koristi se za kontrolu alarmnih uređaja.

Shift Out. Označava da sve naredne kodne riječi treba tumačiti prema vanjskom skupu znakova prije dolaska SI znaka.

Shift In. Označava da naredne kodne riječi treba tumačiti prema standardnom skupu znakova.

Data Link Escape Promjena značenja sljedećih znakova. Koristi se za dodatnu kontrolu ili za prijenos proizvoljnog uzorka bitova.

DC1, DC2, DC3, DC4

Kontrole uređaja. Simboli za upravljanje pomoćnim uređajima (posebne funkcije).

Otkaži. Označava da podatke koji su prethodili ovom znaku u poruci ili bloku treba zanemariti (obično ako dođe do greške).

Kraj srednjeg. Označava fizički kraj trake ili drugog medija za pohranu

Zamena Koristi se za zamjenu pogrešnog ili nevažećeg znaka.

Escape (Proširenje). Koristi se za proširenje koda, što ukazuje da sljedeći znak ima alternativno značenje.

Svemir Znak koji se ne može ispisati za razdvajanje riječi ili pomicanje stroja za štampanje ili pokazivača za jednu poziciju naprijed.

Izbriši. Koristi se za brisanje (brisanje) prethodnog karaktera u poruci

[8-bitna kodiranja: ASCII, KOI-8R i CP1251] Prve tabele skupova znakova kreirane u SAD-u nisu koristile osmi bit u bajtu. Tekst je predstavljen kao niz bajtova, ali osmi bit nije uzet u obzir (koristio se u servisne svrhe).

Općeprihvaćeni standard je postao tabela ASCII(Američki standardni kod za razmjenu informacija). Prva 32 ASCII znaka (00 do 1F) korištena su za znakove koji se ne mogu ispisati. Dizajnirani su za kontrolu uređaja za štampanje i slično. Ostatak - od 20 do 7F - su normalni (štampavi) znakovi.

Tabela 1 - ASCII kodiranje

decHexoktCharOpis
0 0 000 null
1 1 001 početak naslova
2 2 002 početak teksta
3 3 003 kraj teksta
4 4 004 kraj prenosa
5 5 005 upit
6 6 006 priznati
7 7 007 zvono
8 8 010 backspace
9 9 011 horizontalni jezičak
10 A 012 nova linija
11 B 013 vertikalna kartica
12 C 014 nova stranica
13 D 015 povrat kočije
14 E 016 prebaciti se
15 F 017 prebaciti se
16 10 020 bijeg podatkovne veze
17 11 021 kontrola uređaja 1
18 12 022 kontrola uređaja 2
19 13 023 kontrola uređaja 3
20 14 024 kontrola uređaja 4
21 15 025 negativno priznanje
22 16 026 sinhroni mirovanje
23 17 027 kraj trans. blok
24 18 030 otkaži
25 19 031 kraj medija
26 1A 032 zamjena
27 1B 033 bijeg
28 1C 034 separator fajlova
29 1D 035 separator grupe
30 1E 036 separator zapisa
31 1F 037 separator jedinice
32 20 040 svemir
33 21 041 !
34 22 042 "
35 23 043 #
36 24 044 $
37 25 045 %
38 26 046 &
39 27 047 "
40 28 050 (
41 29 051 )
42 2A 052 *
43 2B 053 +
44 2C 054 ,
45 2D 055 -
46 2E 056 .
47 2F 057 /
48 30 060 0
49 31 061 1
50 32 062 2
51 33 063 3
52 34 064 4
53 35 065 5
54 36 066 6
55 37 067 7
56 38 070 8
57 39 071 9
58 3A 072 :
59 3B 073 ;
60 3C 074 <
61 3D 075 =
62 3E 076 >
63 3F 077 ?
decHexoktChar
64 40 100 @
65 41 101 A
66 42 102 B
67 43 103 C
68 44 104 D
69 45 105 E
70 46 106 F
71 47 107 G
72 48 110 H
73 49 111 I
74 4A 112 J
75 4B 113 K
76 4C 114 L
77 4D 115 M
78 4E 116 N
79 4F 117 O
80 50 120 P
81 51 121 Q
82 52 122 R
83 53 123 S
84 54 124 T
85 55 125 U
86 56 126 V
87 57 127 W
88 58 130 X
89 59 131 Y
90 5A 132 Z
91 5B 133 [
92 5C 134 \
93 5D 135 ]
94 5E 136 ^
95 5F 137 _
96 60 140 `
97 61 141 a
98 62 142 b
99 63 143 c
100 64 144 d
101 65 145 e
102 66 146 f
103 67 147 g
104 68 150 h
105 69 151 i
106 6A 152 j
107 6B 153 k
108 6C 154 l
109 6D 155 m
110 6E 156 n
111 6F 157 o
112 70 160 str
113 71 161 q
114 72 162 r
115 73 163 s
116 74 164 t
117 75 165 u
118 76 166 v
119 77 167 w
120 78 170 x
121 79 171 y
122 7A 172 z
123 7B 173 {
124 7C 174 |
125 7D 175 }
126 7E 176 ~
127 7F 177 DEL

Kao što možete lako vidjeti, ovo kodiranje sadrži samo latinična slova, i to ona koja se koriste u engleskom jeziku. Tu su i aritmetički i drugi uslužni simboli. Ali ne postoje ruska slova, pa čak ni posebna latinična slova za njemački ili francuski. Ovo je lako objasniti - kodiranje je razvijeno posebno kao američki standard. Kada su kompjuteri počeli da se koriste širom sveta, postalo je neophodno kodiranje drugih simbola.

Za to je odlučeno da se koristi osmi bit u svakom bajtu. Tako je bilo dostupno još 128 vrijednosti (od 80 do FF), koje su se mogle koristiti za kodiranje znakova. Prva od osmobitnih tabela je "prošireni ASCII" ( Prošireni ASCII) - uključuje različite varijante latiničnih znakova koji se koriste u nekim jezicima zapadne Evrope. Sadržao je i druge dodatne simbole, uključujući pseudo grafiku.

Pseudografički znakovi omogućavaju, prikazujući samo tekstualne znakove, da pruže neki privid grafike. Na primjer, program za upravljanje datotekama FAR Manager radi uz pomoć pseudo-grafike.

U proširenoj ASCII tabeli nije bilo ruskih slova. U Rusiji (bivši SSSR) i drugim državama stvorena su vlastita kodiranja koja su omogućila predstavljanje specifičnih „nacionalnih“ znakova u 8-bitnim tekstualnim datotekama - latinična slova poljskog i češkog jezika, ćirilica (uključujući ruska slova ) i druga pisma.

U svim kodiranjima koja su postala široko rasprostranjena, prvih 127 znakova (to jest, vrijednosti bajta s osmim bitom jednakim 0) podudaraju se sa ASCII. Dakle, ASCII datoteka radi u bilo kojem od ovih kodiranja; slova engleskog jezika su predstavljena na isti način.

Organizacija ISO(Međunarodna organizacija za standardizaciju) usvojila je grupu standarda ISO 8859... Definira 8-bitna kodiranja za različite grupe jezika. Dakle, ISO 8859-1 je prošireni ASCII, tabela za Sjedinjene Države i Zapadnu Evropu. A ISO 8859-5 je tabela za ćirilicu (uključujući ruski).

Međutim, iz istorijskih razloga, ISO 8859-5 kodiranje se nije uhvatilo. U stvarnosti, za ruski jezik se koriste sljedeća kodiranja:

Kodna stranica 866 ( CP866), zvani “DOS”, zvani “alternativno GOST kodiranje”. Bio je u širokoj upotrebi do sredine 90-ih; sada se koristi u ograničenoj mjeri. Praktično se ne koristi za distribuciju tekstova na Internetu.
- KOI-8. Razvijen 70-ih i 80-ih godina. To je općeprihvaćeni standard za prijenos mail poruka na ruskom Internetu. Takođe se široko koristi u operativnim sistemima porodice Unix, uključujući Linux. Zove se verzija KOI-8, dizajnirana za ruski jezik KOI-8R; postoje verzije za druge ćiriličke jezike (na primjer, KOI8-U je opcija za ukrajinski jezik).
- Šifra 1251, CP1251, Windows-1251. Razvijen od strane Microsofta za podršku ruskom jeziku u Windows-u.

Glavna prednost CP866 bila je očuvanje pseudografskih znakova na istim mjestima kao u proširenom ASCII-u; stoga bi strani tekstualni programi, na primjer, čuveni Norton Commander, mogli raditi bez promjena. Danas se CP866 koristi za Windows programe koji rade u tekstualnim prozorima ili tekstualnom režimu preko celog ekrana, uključujući FAR Manager.

Poslednjih godina tekstovi u CP866 su prilično retki (ali se koristi za kodiranje ruskih imena datoteka u Windows-u). Stoga ćemo se detaljnije zadržati na dva druga kodiranja - KOI-8R i CP1251.



Kao što možete vidjeti, u tablici kodiranja CP1251 ruska slova su raspoređena po abecednom redu (osim, međutim, slova E). Ovaj raspored olakšava kompjuterskim programima da sortiraju po abecednom redu.

Ali u KOI-8R, redoslijed ruskih slova izgleda nasumičan. Ali zapravo nije.

Mnogi stariji programi izgubili su 8. bit prilikom obrade ili prijenosa teksta. (Sada su takvi programi praktički "izumrli", ali su kasnih 80-ih - ranih 90-ih bili široko rasprostranjeni). Da biste dobili 7-bitnu vrijednost od 8-bitne vrijednosti, oduzmite 8 od najznačajnije cifre; na primjer E1 postaje 61.

Sada uporedite KOI-8R sa ASCII tabelom (Tabela 1). Videćete da su ruska slova jasno usklađena sa latiničnim. Ako osmi bit nestane, mala ruska slova pretvaraju se u velika latinična slova, a velika ruska slova pretvaraju se u mala latinična slova. Dakle, E1 u KOI-8 je rusko "A", dok je 61 u ASCII latinično "a".

Dakle, KOI-8 vam omogućava da sačuvate čitljivost ruskog teksta dok gubite 8. bit. “Zdravo svima” postaje “pRIWET WSEM”.

Nedavno su i abecedni red znakova u tablici kodiranja i čitljivost sa gubitkom 8. bita izgubili odlučujuću važnost. Osmi bit se u savremenim računarima ne gubi ni tokom prenosa ni obrade. Sortiranje po abecednom redu zasniva se na kodiranju, a ne samo na upoređivanju kodova. (Usput, CP1251 kodovi nisu potpuno abecedni - slovo E nije na svom mjestu).

Zbog činjenice da postoje dva uobičajena kodiranja, kada radite sa Internetom (pošta, pregledavanje web stranica), ponekad možete vidjeti besmislen skup slova umjesto ruskog teksta. Na primjer, "Ja sam SBUFEMHEL". Ovo su samo riječi "s poštovanjem"; ali su bili kodirani u CP1251 kodiranju, a kompjuter je dekodirao tekst prema tabeli KOI-8. Ako su iste riječi bile, naprotiv, kodirane u KOI-8, a kompjuter je dekodirao tekst prema tabeli CP1251, rezultat će biti “U HČBCEOJEN”.

Ponekad se desi da kompjuter uopšte dešifruje slova ruskog jezika prema tabeli koja nije namenjena ruskom jeziku. Tada se umjesto ruskih slova pojavljuje besmislen skup simbola (na primjer, latinična slova istočnoevropskih jezika); često se nazivaju "krokozijabre".

U većini slučajeva, moderni programi se sami nose sa određivanjem kodiranja internetskih dokumenata (e-pošte i web stranica). Ali ponekad "zapadnu", i tada možete vidjeti čudne sekvence ruskih slova ili "krokozyabra". U pravilu, da bi se na ekranu prikazao pravi tekst, dovoljno je ručno odabrati kodiranje u meniju programa.

Za članak su korištene informacije sa stranice http://open-office.edusite.ru/TextProcessor/p5aa1.html.

Materijal preuzet sa sajta:

Top srodni članci