Lecția „Informații de codificare”.
Ne transmitem informații unul altuia oral și în scris, precum și sub formă de gesturi și semne.
Semnele pot fi de natură fizică diferită. ... De exemplu, pentru a reprezenta informații folosind limbajul în scris, semne care sunt imagini pe hârtie sau alți purtători, în vorbirea orală, deoarece sunt folosite semne de limbaj diverse sunete (foneme), iar la procesarea textului pe un computer, semnele sunt reprezentate sub formă de secvențe de impulsuri electrice ( coduri de calculator ).
Tipuri de informații
Informații despre cum este clasificat un obiect după tip. Există mai multe astfel de clasificări. Fiecare știință introduce propria sa clasificare. Pentru informatică, principalul lucru este modul în care informațiile sunt de intrare/ieșire, procesate, stocate folosind tehnologia computerizată. Prin urmare, în informatică se adoptă următoarea clasificare a tipurilor de informații:
Analogic - continuu (perceput uman) |
Discret - săritură (percepute de BT) |
|
|
||
Exemple: vioară televizor telefon o poză într-un muzeu grafice de funcții |
Exemple: pian monitor Centrul muzical telefon mobil |
Forme de prezentare a informaţiei
Deoarece o persoană percepe informații analogice cu ajutorul simțurilor sale, el caută să o repare în așa fel încât să devină de înțeles pentru ceilalți. Mai mult, aceleași informații pot fi prezentate sub diferite forme.
Sub orice formă, informațiile pentru noi exprimă informații despre cineva sau ceva. Reflectă ceea ce se întâmplă sau s-a întâmplat în lumea noastră, de exemplu: ce am făcut ieri sau ce vom face mâine, cum va arăta rochia de bal sau locul de muncă viitoare. Dar, în același timp, informațiile trebuie să primească în mod necesar o formă care este cea mai convenabilă pentru percepție:
· texte, imagini, fotografii, desene;
· gesturi și expresii faciale;
· mirosuri și gusturi;
· Unde radio;
· impulsuri electrice și nervoase;
· înregistrări magnetice;
Cromozomii
Obținerea de informații înseamnă, în cele din urmă, obținerea de fapte, informații și date despre proprietățile, structura sau interacțiunea obiectelor și fenomenelor lumii din jurul nostru.
Limbajul ca sistem de semne
În procesul de dezvoltare a societății umane, oamenii au dezvoltat un număr mare de limbi. Printre acestea se numără limbajul gesturilor și al expresiilor faciale, limbajul desenelor și al desenelor, limbajul muzicii și limbajul matematicii, limbajul vorbit, limbajul algoritmic etc.
Pentru a face schimb de informații cu alte persoane, o persoană folosește limbi naturale (rusă, engleză, chineză etc.), adică informațiile sunt prezentate folosind limbi naturale.
Exemple de alfabete: Limba rusă se bazează pe chirilic conţinând 33 de caractere, foloseşte limba engleză latin(26 de caractere), chineza folosește un alfabet de zeci de mii de caractere ( hieroglife).
Secvențe de caractere ale alfabetului conform regulilor gramatică formă obiectele de bază ale limbajului- cuvintele. Se numesc regulile conform cărora propozițiile sunt formate din cuvinte dintr-o limbă dată sintaxă ... Trebuie remarcat faptul că în limbile naturale gramatica și sintaxa limbii sunt formulate folosind un număr mare de reguli, de la care există excepții, deoarece astfel de reguli au fost formate istoric.
Schema de transfer de informații prin scris
DISCURSARE ORALĂ |
Þ |
Scrisoare |
TEXT |
Citind |
DISCURSARE ORALĂ |
CODARE DECODARE
Codificarea informațiilor
Schema generală de schimb de informații
Sursa de informare |
Codificator |
Transferul de informații |
Decodor |
Destinatarul informatiilor |
Codificarea informațiilor text
Limbi de prezentare a informațiilor |
|||||
Natural: Engleza franceza, … |
Formal: Matematică, programare, partituri,... |
||||
Codificarea informațiilor |
|||||
Codarea obiectivelor |
|||||
secretul informație |
mod rapid de înregistrare |
transmitere prin canale tehnice de comunicare |
efectuarea de calcule matematice |
||
Criptare |
Stenografia |
Cod telegrafic |
Sisteme numerice |
||
Algoritmi criptografici |
Un semn - un cuvânt sau o combinație de litere |
Codul Morse |
Cod Baudot |
Pentru o persoană: zecimal |
Pentru PC: binar |
Există multe moduri de a codifica, cum ar fi
Codul Morse:
Stenografia(din greacă στενός - îngustă, înghesuită și γράφειν - a scrie) - un mod de a scrie prin intermediul unor semne speciale și a unui număr de abrevieri, care face posibilă înregistrarea rapidă a vorbirii orale. Viteza de scriere a stenografiei este de 4-7 ori mai mare decât în mod normal.
Deoarece alegerea icoanelor pentru stenografie este în mare parte arbitrară, din combinațiile diferitelor icoane s-au format nenumărate sisteme stenografice, fiecare dintre ele având propriile avantaje și dezavantaje.
Arta stenografiei exista deja, după cum se poate concluziona din unele surse, egipteni antici , unde discursurile au fost înregistrate cu un semn convențional faraonii ; de la egipteni a trecut aceasta arta greci si romani care avea scriitori cursivi. 5 decembrie 63 î.Hr e. în Roma antică, prima utilizare cunoscută a stenografiei a avut loc în istorie.
În unele cazuri, este necesar să se clasifice un document sau un text. În acest caz, textul este criptat. În antichitate, textul cifrat era numit criptografie.
Criptare- o modalitate de a converti deschis informație închis și înapoi. Este folosit pentru a stoca informații importante în surse nesigure sau pentru a le transmite prin canale neprotejate comunicare.
Criptarea este, de asemenea, codificare, dar cu o metodă secretă cunoscută doar de destinatar și de sursă. Știința se ocupă de metodele de criptare criptografie .
Să luăm în considerare, ca exemplu de codare, corespondența codurilor digitale și a codurilor de bare ale unui produs. Astfel de coduri sunt disponibile pe fiecare produs și vă permit să identificați complet produsul (țara și compania producătorului, tipul de produs și codurile de bare ale produsului. Caracterele codurilor digitale (numerele) corespund grupului de caractere codurilor de bare (trăsuri înguste și largi, precum și dimensiunea spațiilor dintre ele). Un cod digital este convenabil pentru o persoană, iar un cod de bare este, de asemenea, convenabil pentru contabilitatea automată, care este citit folosind un fascicul de lumină îngust și este procesat în continuare în sistemele de contabilitate computerizate. |
Teme pentru acasă - veniți cu sau amintiți-vă unele informații și prezentați-le în diferite forme, creați o diagramă:
Creați o nouă melodie
30.10.2017 Narcolog Mihail Konstantinovici Tranziție 2
Cum să codificați pentru dependența de alcool
Codificarea alcoolismului este o metodă terapeutică de influențare a pacientului cu scopul de a dezvolta un sentiment de aversiune față de produsele care conțin alcool.
Prima metodă este administrarea pacientului de medicamente speciale care afectează atât nivelul fizic, cât și cel psihic. Deoarece, împreună cu alcoolul, aceste medicamente provoacă o intoxicație severă a organismului, persoana se abține în mod deliberat să bea pentru a nu se face rău.
Dar există și alte moduri de codificare, doar psihologice. Acestea includ efecte hipnotice și codare conform metodei Dovzhenko. În aceste cazuri, specialistul în timpul ședinței afectează subconștientul pacientului, dezvoltând o respingere psihologică la alcool. Această procedură este cea mai potrivită pentru persoanele care sunt ușor hipnotice. Succesul muncii efectuate poate fi garantat doar dacă pacientul s-a abținut de la consumul de alcool timp de 20 de zile.
Codificarea are o parte pozitivă - efect pe termen lung. Descrierea modului în care funcționează codarea este destul de simplă.
Este important de reținut că rezultatul dorit poate fi atins doar respectând cu strictețe regulile prescrise de medic.
Tratamentul prin injecție sau pilire trebuie efectuat într-un spital unde pacientul va fi complet restricționat de la băuturi alcoolice. Dacă dependentul a decis să fie codificat din alcool prin hipnoză sau prin metoda Dovzhenko, atunci este suficient să vină la ședințe. Dar, în același timp, o persoană ar trebui să fie pe deplin conștientă de toată responsabilitatea și să nu bea alcool pentru un anumit timp înainte de a începe tratamentul. În cazul codării Dovzhenko, aceasta este de cel puțin 14 zile.
Cu un set favorabil de circumstanțe, pacientul dezvoltă o respingere psihologică față de alcool. Alcoolicul nu are o senzație de plăcere, ci o aversiune față de băuturile care conțin alcool folosite, sau nu simte nicio poftă de ele, senzațiile depind de metoda aleasă. Gândirea logică este restabilită. Mintea devine mai limpede, corpul incepe sa lupte singur cu nevoile fiziologice de alcool.
Dezavantajul oricărei metode de codare este incapacitatea de a consuma alcool. Chiar și 100 de grame de alcool după tratament pot avea efecte negative.
Indicatii
Procedura are loc numai cu acordul deplin al pacientului. Este imposibil să salvezi pacientul de dependența psihologică fără dorința lui. Refuzul de a bea alcool este un șoc emoțional puternic. Dacă clientul nu este conștient sau nu dorește să se supună voluntar un tratament, există posibilitatea unei defecțiuni. Livrarea repetată a asistenței necesare va fi dificilă. Experții avertizează că în perioada de reabilitare sunt posibile izbucniri de furie și agresivitate. Înainte de ședință, alcoolicul este invitat la examinare de către un psihiatru. Este programată și o consultație cu un psiholog. Pe baza mărturiei medicilor se construiește un plan de reabilitare.
Este de dorit să se efectueze tratamentul într-un complex. Utilizarea codificării ca metodă auxiliară în lupta împotriva unei boli crește șansele de recuperare. Dacă utilizați această opțiune ca principală, atunci nu veți putea scăpa de boală pentru totdeauna. Băutura se va întoarce după un timp.
Scopul este de a ajuta pacientul să scape de dependența psihologică de alcool. Rezultatul procedurii este refuzul băuturilor alcoolice. Oamenii de știință susțin că această metodă nu este radicală, deoarece nu vindecă problema bolii în sine, ci previne utilizarea.
Metode de codificare a medicamentelor
Centrele de tratament pentru medicamente oferă acum multe modalități de a restabili sănătatea. În lupta împotriva dependenței de alcool, se folosesc metode medicinale de codificare a alcoolismului. Medicamentul se administrează:
- subcutanat (inserarea capsulei);
- intravenos (injectare, picurare)
- pilire sub omoplat.
Specialiștii au învățat aceste metode de mult timp și au dobândit o vastă experiență în tratamentul alcoolismului folosind droguri. Medicamentele se administrează de către medic numai după acordul pacientului.
Coaserea fiolei Esperal pentru codificarea împotriva alcoolului
Esperal este un medicament care este unul dintre cele mai cunoscute și frecvent utilizate medicamente pentru tratamentul dependenței de alcool. Durata acestui medicament este de la 1 la 5 ani.
Termenul final este stabilit de medic după consultarea pacientului. Medicamentul este inclus în grupul unuia dintre cele mai eficiente remedii, așa cum demonstrează recenziile medicilor și pacienților. Mai jos este o fotografie a ambalajului medicamentului:
Lista reacțiilor la alcool:
- durere de cap;
- ameţeală;
- creștere semnificativă a temperaturii, febră;
- Transpirație profundă;
- senzație de greață;
- presiune crescută;
- tulburare de ritm cardiac;
- dificultăți de respirație;
- dispnee;
- vărsături;
- durere la nivelul ficatului.
Aquilong
Medicamentul Aquilong este injectat direct în sânge. Agentul activ este disulfiram. Efectul medicamentului este de la 3 luni la 6 ani. Durata este aleasă de pacient în consultare cu medicul curant.
Efectele Aquilong asupra organismului:
- refuzul de la produse alcoolice;
- pacientul nu se bucură de utilizare;
- intoxicația nu se realizează;
- se formează o aversiune față de miros și gust.
disulfiram
Disulfiram este o substanță găsită în aproape toate medicamentele pentru dependența de alcool. Remediul care contine acest ingredient este radical si produce o aversiune puternica fata de alcool. În combinație cu alcoolul, provoacă un număr mare de reacții adverse. Medicamentul este utilizat sub formă de tablete, implantare, injecții intravenoase și intramusculare. Costul medicamentului depinde de metoda de administrare în organism.
Înainte de un curs de reabilitare, este necesară o examinare medicală.
Introducerea unor astfel de medicamente este denumită popular codificarea torpilelor. Medicamente similare care conțin disulfiram și alte substanțe au fost testate de mulți ani în practică și și-au dovedit eficacitatea. După cum am spus, metoda Torpedo are mai multe metode de introducere. Ele sunt codificate în astfel de moduri pentru o perioadă de 6 luni sau mai mult.
Important! Dacă codificatul ia o doză de alcool, atunci este necesar ajutorul medicilor. Prin urmare, nu amânați apelarea unui serviciu de ambulanță.
Codarea dublă este esența procedurii
Nu toți pacienții fac față poftei de alcool. Unii oameni încep să bea alcool chiar înainte de expirarea codului. În astfel de cazuri, medicii folosesc un bloc dublu. O combinație de două tipuri diferite de medicamente este utilizată pentru un efect mai mare al tratamentului.
Reacția la alcool este o deteriorare extrem de puternică a bunăstării, sunt posibile complicații grave, se manifestă otrăvirea acută a corpului.
Combinația de medicamente este selectată individual de către medicul curant, pe baza rezultatelor testului.
Codare cu laser
Utilizarea unui laser pentru codare este considerată cea mai eficientă. Șansa de recuperare tinde să fie de sută la sută. Acest tip de control al bolii și-a câștigat popularitate datorită absenței contraindicațiilor. Tratamentul cu laser vă permite să renunțați la alcool pentru totdeauna. Informațiile codificate sunt introduse în structura creierului, forțând pacientul să nu mai consume alcool. Inserarea are loc fără tăieturi sau înțepături, ceea ce facilitează transferul procedurii.
Psihoterapie și hipnoză
Tratamentul alcoolismului cu psihoterapie sau hipnoză este sugestia către pacient, la nivel subconștient, a absenței poftei de alcool. Pacientul poate fi pus într-o stare de somn profund - transă, sau poate acționa asupra acesteia în conștiință. Metoda depinde de metoda aleasă.
Pentru un efect pozitiv de la un alcoolic, o dorință puternică de a scăpa de o boală, încredere în medicul curant, este necesară perioada minimă permisă fără consumul de alcool.
Hipnoza
Metoda se bazează pe imersiunea pacientului într-o stare de transă și sugestie. Un hipnolog ajută la scăparea de complexe, depresie, agresivitate, dependență de alcool. Tratamentul are o rată mare de eficacitate și este cea mai veche metodă. Terapia se desfășoară în 3 etape:
- pregătirea pacientului;
- sesiune de reabilitare;
- menținerea și consolidarea unui efect pozitiv.
metoda Dovzhenko
Este considerată una dintre cele mai fiabile și eficiente tehnici de hipnoză, adoptată în 1985. Metoda lui Dovzhenko s-a impus ca fiind accesibilă, recenzii ale pacienților și ale medicilor curant. A primit aprobarea de la Organizația Mondială a Sănătății.
Avantaje:
- hipnoza este pozitivă în 92% din cazuri;
- nu depinde de religie;
- metoda vă permite să faceți fără umilirea demnității pacientului;
- apariția băuturilor alcoolice nu provoacă un reflex de gag;
- durata terapiei este de la două până la trei ore;
- un val de vivacitate și bunăstare îmbunătățită;
- pacientul este conștient.
metoda lui Shichko
Metoda se bazează pe conștientizarea de sine și susținerea cuvintelor, se dau convingeri științifice, pornind de la poziția încrezătoare a pacientului, se distrug atitudinile psihologice negative.
Această metodă este folosită pentru reabilitarea dependenței de alcool și tutun. O caracteristică distinctivă este disponibilitatea metodei. Programele de reabilitare sunt gratuite.
Cât face
Majoritatea pacienților se întreabă cât costă codificarea din alcool. Prețul serviciilor este direct dependent de metoda sau metoda aleasă de administrare a medicamentelor. După ce a vizitat consultația, specialistul va anunța costul serviciilor și va sugera cea mai eficientă modalitate de a face față bolii. În orice caz, medicamentele sunt ieftine și disponibile pentru toată lumea. În ceea ce privește ședințele de psihoterapie și hipnoză, atunci prețurile încep de la 3 mii de ruble.
Alegerea unei metode de codare
Dacă un pacient sau rudele sale încearcă să aleagă singuri o metodă de tratament pentru alcoolism, aceasta este o mare greșeală. Doar un specialist este capabil să selecteze corect o metodă de recuperare. În alte cazuri, succesul nu poate fi garantat.
Medicul curant va prescrie o metodă bazată pe datele individuale colectate în timpul trecerii medicilor și analizelor. De asemenea, o opțiune de terapie selectată incorect poate provoca daune ireparabile sănătății slăbite a unui alcoolic.
Contraindicații și consecințe ale codificării
Pericolul codificării unui pacient este că nu se știe pe deplin cum va reacționa organismul la o anumită metodă, mai ales când vine vorba de administrarea unui medicament. În plus, pericolul pentru viața și sănătatea pacientului apare în cazul unei „defecțiuni”, medicamentul are un efect dăunător asupra stării generale de sănătate, în unele cazuri au existat decese.
Înainte de a utiliza cutare sau cutare metodă de codare, medicul explică toate nuanțele tratamentului. Sunt discutate efectele secundare și consecințele. Procedura se efectuează numai după acordul deplin al pacientului.
Deci, în ce cazuri va trebui să abandonați orice metodă de codificare:
- prezența patologiilor cardiovasculare în anemneză (un atac de cord anterior, precum și o stare pre-infarct, hipertensiune arterială, angină pectorală);
- circulația sanguină afectată în zona creierului (mai ales după un accident vascular cerebral);
- boala tiroidiană;
- Diabet;
- ciroză acută și hepatită;
- epilepsie;
- sarcina și alăptarea;
- boală mintală.
Rezultatul codificării din alcoolism
După finalizarea cursului de tratament, se eliberează un certificat de alcoolism cu ștampila medicului.
În procesul de dezvoltare, omenirea a ajuns să realizeze nevoia de a stoca și transmite cutare sau cutare informație la distanță. În acest din urmă caz, a fost necesar să-l transforme în semnale. Acest proces se numește codificarea datelor. Informațiile text, precum și imaginile grafice pot fi convertite în numere. Articolul nostru vă va spune cum se poate face acest lucru.
Transmiterea de informații la distanță
- curier și oficiu poștal;
- acustic (de exemplu, printr-un difuzor);
- pe baza uneia sau alteia metode de telecomunicație (cablată, radio, optică, releu radio, satelit, fibră optică).
Cele mai comune în acest moment sunt sistemele de transmisie de acest din urmă tip. Cu toate acestea, pentru a le folosi, trebuie mai întâi să aplicați una sau alta metodă de codificare a informațiilor. Este extrem de dificil să faci acest lucru cu ajutorul numerelor din calculul zecimal familiar unei persoane moderne.
Criptare
Sistem de numere binar
În zorii erei computerelor, oamenii de știință erau preocupați să găsească un dispozitiv care să facă posibilă reprezentarea numerelor într-un computer cât mai simplu posibil. Problema a fost rezolvată când Claude Chenon a propus utilizarea sistemului de numere binar. Este cunoscut încă din secolul al XVII-lea, iar implementarea lui a necesitat un dispozitiv cu 2 stări stabile, corespunzătoare „1” logic și „0” logic. Erau o mulțime de ele în acel moment - de la un miez, care putea fi fie magnetizat, fie demagnetizat, până la un tranzistor capabil să fie fie într-o stare deschisă, fie într-o stare închisă.
Reprezentarea imaginilor color
Metoda de codificare a informațiilor folosind numere pentru astfel de imagini este ceva mai complicată. În acest scop, imaginea trebuie mai întâi descompusă în 3 culori primare (verde, roșu și albastru), deoarece în urma amestecării lor în anumite proporții se poate obține orice nuanță percepută de ochiul uman. Această metodă de codificare a unei imagini folosind numere folosind 24 de biți binari se numește RGB sau True Color.
Când vine vorba de imprimare, se folosește sistemul CMYK. Se bazează pe ideea că fiecare dintre componentele RGB de bază poate fi mapată la o culoare complementară cu alb. Acestea sunt cyan, magenta și galben. Deși sunt destule, pentru a reduce costurile de imprimare se adaugă și o a patra componentă - negru. Astfel, pentru a reprezenta grafica în sistemul CMYK, sunt necesari 32 de biți binari, iar modul în sine este de obicei numit full-color.
Reprezentarea sunetelor
Când este întrebat dacă există o modalitate de a codifica informațiile folosind numere, răspunsul ar trebui să fie da. Cu toate acestea, în acest moment, astfel de metode nu sunt considerate perfecte. Acestea includ:
- Metoda FM. Se bazează pe descompunerea oricărui sunet complex într-o secvență de semnale armonice elementare de diferite frecvențe, care pot fi descrise printr-un cod.
- Metoda tabel-undă. Mostrele sunt stocate în tabele pre-compilate - mostre de sunete pentru diverse instrumente muzicale. Codurile numerice exprimă tipul și numărul de model al instrumentului, înălțimea, intensitatea și durata sunetului etc.
Acum știți că codarea binară este una dintre modalitățile comune de reprezentare a informațiilor, care a jucat un rol imens în dezvoltarea tehnologiei computerelor.
22. CODIFICAREA INFORMAȚIILOR
22.1. Informatii generale
Codificarea- prezentarea informatiilor intr-o forma alternativa. În esență, sistemele de codare (sau pur și simplu codurile) sunt similare, în care elementele informațiilor codificate corespund denumirilor de cod. Diferența constă în faptul că cifrurile conțin o parte variabilă (cheie), care pentru un anumit mesaj inițial cu același algoritm de criptare poate produce texte cifrate diferite. Nu există o parte variabilă în sistemele de codificare. Prin urmare, același mesaj original, atunci când este codificat, de obicei arată întotdeauna același 1. O altă trăsătură distinctivă a codificării este utilizarea denumirilor de cod (substituții) în întregime pentru cuvinte, fraze sau numere (un set de numere). Înlocuirea elementelor informațiilor codificate cu desemnările codului poate fi efectuată pe baza tabelului corespunzător (ca un tabel de substituții de cifră) sau determinată prin intermediul unei funcții sau unui algoritm de codare.
La fel de elemente ale informaţiei codificate poate acționa:
Litere, cuvinte și expresii în limbaj natural;
Diverse simboluri precum semnele de punctuație, operații aritmetice și logice, operatori de comparație etc. Trebuie remarcat faptul că semnele de operare și operatorii de comparație înșiși sunt denumiri de cod;
Imagini audiovizuale;
Situații și fenomene;
Informații ereditare;
Denumiri de cod poate reprezenta:
Litere în limbaj natural și combinații de litere;
Simboluri grafice;
Impulsuri electromagnetice;
Semnale luminoase și sonore;
Un set și o combinație de molecule chimice;
Codarea se poate face în scopuri:
Comoditatea stocării, procesării și transmiterii informațiilor (de regulă, informațiile codificate sunt prezentate mai compact și sunt, de asemenea, potrivite pentru procesarea și transmiterea prin software și hardware automat);
Comoditatea schimbului de informații între subiecți;
Vizibilitatea afișajului;
Identificarea obiectelor și subiectelor;
Ascunderea informațiilor clasificate;
Codificarea informațiilor este unu-și pe mai multe niveluri... Un exemplu de codare cu un singur nivel sunt semnalele luminoase date de un semafor (roșu - oprire, galben - pregătiți-vă, verde - înainte). Ca codificare pe mai multe niveluri, puteți aduce reprezentarea unei imagini vizuale (grafice) sub forma unui fișier foto. În primul rând, imaginea vizuală este împărțită în elementele sale elementare constitutive (pixeli), adică. fiecare parte separată a imaginii vizuale este codificată de un element elementar. Fiecare element este reprezentat (codificat) ca un set de culori elementare (RGB: engleză roșu - roșu, verde - verde, albastru - albastru) cu intensitatea corespunzătoare, care la rândul său este reprezentată ca valoare numerică. Ulterior, seturile de numere, de regulă, sunt transformate (codificate) pentru a reprezenta informația mai compact (de exemplu, în jpeg, png etc.). Și în sfârșit, numerele totale sunt reprezentate (codate) sub formă de semnale electromagnetice pentru transmisie prin canale de comunicație sau zone de pe mediul de stocare. Trebuie remarcat faptul că numerele în sine în timpul procesării software sunt reprezentate în conformitate cu sistemul de codificare a numerelor adoptat.
Codificarea informațiilor poate fi reversibilși ireversibil... Cu codificarea reversibilă bazată pe mesajul codificat, este posibil să se recupereze fără ambiguitate (fără pierderea calității) mesajul codificat (imaginea originală). De exemplu, codificarea cu codul Morse sau codul de bare. Cu o codificare ireversibilă, este imposibilă o restaurare clară a imaginii originale. De exemplu, codificarea informațiilor audiovizuale (formate jpg, mp3 sau avi) sau.
Codul Morse- un mod de codificare a caracterelor (litere, cifre, semne de punctuație etc.) folosind o succesiune de „puncte” și „liniițe”. Durata unui punct este luată ca unitate de timp. Durata unei liniuțe este de trei puncte. O pauză între elementele aceluiași caracter este de un punct (aproximativ 1/25 de secundă), între caracterele dintr-un cuvânt - 3 puncte, între cuvinte - 7 puncte. Numit după Samuel Morse, un inventator și artist american.
Rusă scrisoare |
latin scrisoare |
Codul Morse | Rusă scrisoare |
latin scrisoare |
Codul Morse | Simbol | Codul Morse |
A | A | · - | R | R | · - · | 1 | · - - - - |
B | B | - · · · | CU | S | · · · | 2 | · · - - - |
V | W | · - - | T | T | - | 3 | · · · - - |
G | G | - - · | Avea | U | · · - | 4 | · · · · - |
D | D | - · · | F | F | · · - · | 5 | · · · · · |
A EI) | E | · | X | H | · · · · | 6 | - · · · · |
F | V | · · · - | C | C | - · - · | 7 | - - · · · |
Z | Z | - - · · | H | O | - - - · | 8 | - - - · · |
ȘI | eu | · · | SH | CH | - - - - | 9 | - - - - · |
Th | J | · - - - | SCH | Q | - - · - | 0 | - - - - - |
LA | K | - · - | B | N | - - · - - | Punct | · · · · · · |
L | L | · - · · | S | Y | - · - - | Virgulă | · - · - · - |
M | M | - - | B (b) | X | - · · - | - | · · - - · · |
N | N | - · | E | E | · · - · · | ! | - - · · - - |
O | O | - - - | YU | U | · · - - | @ | · - - · - · |
P | P | · - - · | EU SUNT | A | · - · - | Încheiați contactul | · · - · - |
Figura 22.1. Fragment de cod Morse
Inițial, codul Morse a fost folosit pentru a transmite mesaje prin telegraf. În acest caz, punctele și liniuțele erau transmise sub formă de semnale electrice care treceau prin fire. În prezent, codul Morse este folosit de obicei în locurile în care alte mijloace de comunicare nu sunt disponibile (de exemplu, în închisori).
Un fapt interesant este legat de inventatorul primului bec, Thomas Alva Edison (1847-1931). Era greu de auz și a comunicat cu soția sa, Mary Stiwell, folosind codul Morse. În timpul curtarii, Edison a cerut în căsătorie bătând cuvintele cu mâna, iar ea a răspuns în același mod. Codul telegrafic a devenit un mijloc comun de comunicare pentru soți. Chiar și atunci când au mers la teatru, Edison i-a pus mâna lui Mary pe genunchi pentru a-i „conecta” dialogurile actorilor.
Cod Baudot- cod digital pe 5 biți. A fost dezvoltat de Emile Baudot în 1870 pentru telegraful său. Codul a fost introdus direct cu o tastatură formată din cinci taste, apăsarea sau neapăsarea unei taste corespundea transmiterii sau netransmiterii unui bit într-un cod de cinci biți. Există mai multe varietăți (standarde) ale acestui cod (CCITT-1, CCITT-2, MTK-2 etc.) În special, MTK-2 este o modificare a standardului internațional CCITT-2 cu adăugarea de litere chirilice.
Personaje de control | ||||
Binar Codul |
Zecimal Codul |
Programare | ||
01000 | 8 | Retur transport | ||
00010 | 2 | Traducerea liniilor | ||
11111 | 31 | litere latine | ||
11011 | 27 | Numerele | ||
00100 | 4 | Spaţiu | ||
00000 | 0 | litere rusești | ||
Binar Codul |
Zecimal Codul |
latin scrisoare |
Rusă scrisoare |
Cifrele și alte simboluri |
00011 | 3 | A | A | - |
11001 | 25 | B | B | ? |
01110 | 14 | C | C | : |
01001 | 9 | D | D | Cine e acolo? |
00001 | 1 | E | E | Z |
01101 | 13 | F | F | E |
11010 | 26 | G | G | SH |
10100 | 20 | H | X | SCH |
00110 | 6 | eu | ȘI | 8 |
01011 | 11 | J | Th | YU |
01111 | 15 | K | LA | ( |
10010 | 18 | L | L | ) |
11100 | 28 | M | M | . |
01100 | 12 | N | N | , |
11000 | 24 | O | O | 9 |
10110 | 22 | P | P | 0 |
10111 | 23 | Q | EU SUNT | 1 |
01010 | 10 | R | R | 4 |
00101 | 5 | S | CU | " |
10000 | 16 | T | T | 5 |
00111 | 7 | U | Avea | 7 |
11110 | 30 | V | F | = |
10011 | 19 | W | V | 2 |
11101 | 29 | X | B | / |
10101 | 21 | Y | S | 6 |
10001 | 17 | Z | Z | + |
Figura 22.2. Cod standard Bodo MTK-2
Următoarea ilustrație prezintă o bandă de telemașină cu un mesaj transmis folosind codul Baudot.
Orez. 22.3. Bandă perforată cu cod Bodo
Există două fapte interesante de remarcat despre codul Baudot.
1. Angajații companiei de telegraf AT&T Gilberto Vernam și maiorul Joseph Maubourne au propus în 1917 ideea criptării automate a mesajelor telegrafice pe baza codului Baudot. Criptarea era în curs.
2. Corespondența dintre alfabetele engleză și rusă, adoptată în MTK-2, a fost folosită pentru a crea codificări computerizate KOI-7 și KOI-8.
ASCII și Unicode.
ASCII (English American Standard Code for Information Interchange) este tabelul de codificare standard american pentru caractere imprimabile și de control. A fost dezvoltat inițial ca pe 7 biți pentru a reprezenta 128 de caractere, atunci când este utilizat în computere, au fost alocați 8 biți (1 octet) pe caracter, unde al 8-lea bit a fost folosit pentru controlul integrității (bit de paritate). Mai târziu, odată cu utilizarea a 8 biți pentru a reprezenta caractere suplimentare (256 de caractere în total), de exemplu, literele alfabetelor naționale, a început să fie perceput ca jumătate din cei 8 biți. În special, pe baza ASCII, au fost dezvoltate codificări care conțin literele alfabetului rus: pentru sistemul de operare MS-DOS - cp866 (pagina de cod în engleză - pagina de cod), pentru sistemul de operare MS Windows - Windows 1251, pentru diverse sisteme de operare - KOI-8 (cod de schimb de informații, 8 biți), ISO 8859-5 și altele.
Codificare ASCII | Simboluri suplimentare | ||||||||||
Binar Codul |
Zecimal Codul |
Simbol | Binar Codul |
Zecimal Codul |
Simbol | Binar Codul |
Zecimal Codul |
Simbol | Binar Codul |
Zecimal Codul |
Simbol |
00000000 | 0 | NUL | 01000000 | 64 | @ | 10000000 | 128 | Ђ | 11000000 | 192 | A |
00000001 | 1 | DECI H | 01000001 | 65 | A | 10000001 | 129 | Ѓ | 11000001 | 193 | B |
00000010 | 2 | STX | 01000010 | 66 | B | 10000010 | 130 | ‚ | 11000010 | 194 | V |
00000011 | 3 | ETX | 01000011 | 67 | C | 10000011 | 131 | ѓ | 11000011 | 195 | G |
00000100 | 4 | EOT | 01000100 | 68 | D | 10000100 | 132 | „ | 11000100 | 196 | D |
00000101 | 5 | ENQ | 01000101 | 69 | E | 10000101 | 133 | … | 11000101 | 197 | E |
00000110 | 6 | ACK | 01000110 | 70 | F | 10000110 | 134 | † | 11000110 | 198 | F |
00000111 | 7 | BEL | 01000111 | 71 | G | 10000111 | 135 | ‡ | 11000111 | 199 | Z |
00001000 | 8 | BS | 01001000 | 72 | H | 10001000 | 136 | € | 11001000 | 200 | ȘI |
00001001 | 9 | Ht | 01001001 | 73 | eu | 10001001 | 137 | ‰ | 11001001 | 201 | Th |
00001010 | 10 | LF | 01001010 | 74 | J | 10001010 | 138 | Љ | 11001010 | 202 | LA |
00001011 | 11 | VT | 01001011 | 75 | K | 10001011 | 139 | ‹ | 11001011 | 203 | L |
00001100 | 12 | FF | 01001100 | 76 | L | 10001100 | 140 | Њ | 11001100 | 204 | M |
00001101 | 13 | CR | 01001101 | 77 | M | 10001101 | 141 | Ќ | 11001101 | 205 | N |
00001110 | 14 | ASA DE | 01001110 | 78 | N | 10001110 | 142 | Ћ | 11001110 | 206 | O |
00001111 | 15 | SI | 01001111 | 79 | O | 10001111 | 143 | Џ | 11001111 | 207 | P |
00010000 | 16 | DLE | 01010000 | 80 | P | 10010000 | 144 | ђ | 11010000 | 208 | R |
00010001 | 17 | DC1 | 01010001 | 81 | Q | 10010001 | 145 | ‘ | 11010001 | 209 | CU |
00010010 | 18 | DC2 | 01010010 | 82 | R | 10010010 | 146 | ’ | 11010010 | 210 | T |
00010011 | 19 | DC3 | 01010011 | 83 | S | 10010011 | 147 | “ | 11010011 | 211 | Avea |
00010100 | 20 | DC4 | 01010100 | 84 | T | 10010100 | 148 | ” | 11010100 | 212 | F |
00010101 | 21 | NAK | 01010101 | 85 | U | 10010101 | 149 | 11010101 | 213 | X | |
00010110 | 22 | SYN | 01010110 | 86 | V | 10010110 | 150 | – | 11010110 | 214 | C |
00010111 | 23 | ETB | 01010111 | 87 | W | 10010111 | 151 | - | 11010111 | 215 | H |
00011000 | 24 | POATE SA | 01011000 | 88 | X | 10011000 | 152 | |
11011000 | 216 | SH |
00011001 | 25 | EM | 01011001 | 89 | Y | 10011001 | 153 | ™ | 11011001 | 217 | SCH |
00011010 | 26 | SUB | 01011010 | 90 | Z | 10011010 | 154 | љ | 11011010 | 218 | B |
00011011 | 27 | ESC | 01011011 | 91 | [ | 10011011 | 155 | › | 11011011 | 219 | S |
00011100 | 28 | FS | 01011100 | 92 | \ | 10011100 | 156 | њ | 11011100 | 220 | B |
00011101 | 29 | GS | 01011101 | 93 | ] | 10011101 | 157 | ќ | 11011101 | 221 | E |
00011110 | 30 | Rs | 01011110 | 94 | ^ | 10011110 | 158 | ћ | 11011110 | 222 | YU |
00011111 | 31 | S.U.A. | 01011111 | 95 | _ | 10011111 | 159 | џ | 11011111 | 223 | EU SUNT |
00100000 | 32 | 01100000 | 96 | ` | 10100000 | 160 | |
11100000 | 224 | A | |
00100001 | 33 | ! | 01100001 | 97 | A | 10100001 | 161 | Ў | 11100001 | 225 | b |
00100010 | 34 | " | 01100010 | 98 | b | 10100010 | 162 | ў | 11100010 | 226 | v |
00100011 | 35 | # | 01100011 | 99 | c | 10100011 | 163 | Ј | 11100011 | 227 | G |
00100100 | 36 | $ | 01100100 | 100 | d | 10100100 | 164 | ¤ | 11100100 | 228 | d |
00100101 | 37 | % | 01100101 | 101 | e | 10100101 | 165 | Ґ | 11100101 | 229 | e |
00100110 | 38 | & | 01100110 | 102 | f | 10100110 | 166 | ¦ | 11100110 | 230 | f |
00100111 | 39 | " | 01100111 | 103 | g | 10100111 | 167 | § | 11100111 | 231 | s |
00101000 | 40 | ( | 01101000 | 104 | h | 10101000 | 168 | Eu | 11101000 | 232 | și |
00101001 | 41 | ) | 01101001 | 105 | i | 10101001 | 169 | © | 11101001 | 233 | al |
00101010 | 42 | * | 01101010 | 106 | j | 10101010 | 170 | Є | 11101010 | 234 | La |
00101011 | 43 | + | 01101011 | 107 | k | 10101011 | 171 | « | 11101011 | 235 | l |
00101100 | 44 | , | 01101100 | 108 | l | 10101100 | 172 | ¬ | 11101100 | 236 | m |
00101101 | 45 | - | 01101101 | 109 | m | 10101101 | 173 | ¬ | 11101101 | 237 | n |
00101110 | 46 | . | 01101110 | 110 | n | 10101110 | 174 | ® | 11101110 | 238 | O |
00101111 | 47 | / | 01101111 | 111 | o | 10101111 | 175 | Ї | 11101111 | 239 | P |
00110000 | 48 | 0 | 01110000 | 112 | p | 10110000 | 176 | ° | 11110000 | 240 | R |
00110001 | 49 | 1 | 01110001 | 113 | q | 10110001 | 177 | ± | 11110001 | 241 | Cu |
00110010 | 50 | 2 | 01110010 | 114 | r | 10110010 | 178 | І | 11110010 | 242 | T |
00110011 | 51 | 3 | 01110011 | 115 | s | 10110011 | 179 | і | 11110011 | 243 | la |
00110100 | 52 | 4 | 01110100 | 116 | t | 10110100 | 180 | ґ | 11110100 | 244 | f |
00110101 | 53 | 5 | 01110101 | 117 | u | 10110101 | 181 | µ | 11110101 | 245 | X |
00110110 | 54 | 6 | 01110110 | 118 | v | 10110110 | 182 | ¶ | 11110110 | 246 | c |
00110111 | 55 | 7 | 01110111 | 119 | w | 10110111 | 183 | · | 11110111 | 247 | h |
00111000 | 56 | 8 | 01111000 | 120 | X | 10111000 | 184 | e | 11111000 | 248 | w |
00111001 | 57 | 9 | 01111001 | 121 | y | 10111001 | 185 | № | 11111001 | 249 | SCH |
00111010 | 58 | : | 01111010 | 122 | z | 10111010 | 186 | є | 11111010 | 250 | b |
00111011 | 59 | ; | 01111011 | 123 | { | 10111011 | 187 | » | 11111011 | 251 | s |
00111100 | 60 | < | 01111100 | 124 | | | 10111100 | 188 | ј | 11111100 | 252 | b |
00111101 | 61 | = | 01111101 | 125 | } | 10111101 | 189 | Ѕ | 11111101 | 253 | eh |
00111110 | 62 | > | 01111110 | 126 | ~ | 10111110 | 190 | ѕ | 11111110 | 254 | Yu |
00111111 | 63 | ? | 01111111 | 127 | DEL | 10111111 | 191 | ї | 11111111 | 255 | eu sunt |
Orez. 22.4. Pagina de coduri Windows 1251
Unicode este un standard de codificare a caracterelor care permite reprezentarea caracterelor în aproape toate limbile scrise. Standardul a fost propus în 1991 de Unicode Consortium, Unicode Inc., o organizație non-profit. Utilizarea acestui standard vă permite să codificați mai multe caractere (decât în ASCII și alte codificări) datorită codificării caracterelor pe doi octeți (65536 caractere în total). În documentele Unicode pot coexista caractere chinezești, simboluri matematice, litere ale alfabetului grecesc, alfabet latin și chirilic.
Codurile din standardul Unicode sunt împărțite în mai multe secțiuni. Primele 128 de coduri corespund codificării ASCII. În plus, există secțiuni de litere din diferite scripturi, semne de punctuație și simboluri tehnice. În special, literele mari și mici ale alfabetului rus corespund codurilor 1025 (Ё), 1040-1103 (A-z) și 1105 (ё).
Braille- un font tactil cu punct de relief conceput pentru scrierea și citirea de către nevăzători. A fost dezvoltat în 1824 de francezul Louis Braille, fiul unui cizmar. Louis, la vârsta de trei ani, și-a pierdut vederea în urma unei inflamații oculare, care a pornit de la faptul că băiatul a fost rănit cu un cuțit de șa (asemănător cu o punteră) în atelierul tatălui său. La vârsta de 15 ani, și-a creat tipul punctat, inspirat de simplitatea „tipului de noapte” al căpitanului de artilerie Charles Barbier, care era folosit de militari la acea vreme pentru a citi rapoarte în întuneric.
Pentru a reprezenta caracterele (în principal litere și cifre) în Braille se folosesc 6 puncte, dispuse pe două coloane, câte 3 în fiecare.
Orez. 22.5. Numerotarea punctelor
Fiecare simbol are propriul său set unic de puncte ridicate. Acea. Braille este un sistem de codificare a 2 6 = 64 de caractere. Dar prezența caracterelor de control în font (de exemplu, tranziția la litere sau cifre) vă permite să creșteți numărul de caractere codificate.
Personaje de control | |||
Simbol font Braille |
Programare | ||
⠠ | Scrisori | ||
⠼ | Numerele | ||
Litere, cifre și alte simboluri | |||
Simbol font Braille |
latin scrisori |
rușii scrisori |
Numerele |
⠁ | A | A | 1 |
⠃ | B | B | 2 |
⠉ | C | C | 3 |
⠙ | D | D | 4 |
⠑ | E | E | 5 |
⠋ | F | F | 6 |
⠛ | G | G | 7 |
⠓ | H | X | 8 |
⠊ | eu | ȘI | 9 |
⠚ | J | F | 0 |
⠅ | K | LA | |
⠇ | L | L | |
⠍ | M | M | |
⠝ | N | N | |
⠕ | O | O | |
⠏ | P | P | |
⠟ | Q | H | |
⠗ | R | R | |
⠎ | S | CU | |
⠞ | T | T | |
⠥ | U | Avea | |
⠧ | V | ||
⠺ | W | V | |
⠭ | X | SCH | |
⠽ | Y | ||
⠵ | Z | Z | |
⠡ | Eu | ||
⠯ | Th | ||
⠱ | SH | ||
⠷ | B | ||
⠮ | S | ||
⠾ | B | ||
⠪ | E | ||
⠳ | YU | ||
⠫ | EU SUNT | ||
⠲ | Punct | ||
⠂ | Virgulă | ||
⠖ | Semn de exclamare | ||
⠢ | Semnul întrebării | ||
⠆ | Punct şi virgulă | ||
⠤ | Cratimă | ||
Spaţiu |
Orez. 22.6. Braille
Braille a devenit recent utilizat pe scară largă în viața publică și viața de zi cu zi, datorită atenției tot mai mari acordate persoanelor cu dizabilități.
Orez. 22.7. Litere braille „Soci 2014” pe medalia de aur paralimpică din 2014.
Cod de bare- informatii grafice aplicate pe suprafata, marcajul sau ambalajul produselor, care este o succesiune de dungi alb-negru sau alte forme geometrice in scopul citirii acesteia prin mijloace tehnice.
În 1948, Bernard Silver, un student absolvent la Institutul de Tehnologie de la Universitatea Drexel din Philadelphia, l-a auzit pe președintele unui lanț alimentar local cerându-i unuia dintre decani să dezvolte un sistem care citește automat informații despre un produs în timp ce el îl inspecta. Silver le-a spus prietenilor săi despre asta - Norman Joseph Woodland și Jordin Johanson. Cei trei au început să exploreze diferite sisteme de marcare. Primul lor sistem de lucru folosea cerneluri ultraviolete, dar erau destul de scumpe și s-au estompat în timp.
Convins că sistemul era funcțional, Woodland a părăsit Philadelphia și s-a mutat în Florida în apartamentul tatălui său pentru a continua să lucreze. Pe 20 octombrie 1949, Woodland and Silver au depus o cerere de invenție, care a fost acordată la 7 octombrie 1952. În locul liniilor cu care suntem obișnuiți, brevetul conținea o descriere a unui sistem de coduri de bare sub formă de cercuri concentrice.
Orez. 22.8. Brevet Woodland și Silver cu cercuri concentrice, precursori ai codurilor de bare moderne
Codurile de bare au fost folosite oficial pentru prima dată în 1974 în magazinele din Troy, Ohio. Sistemele de codare de bare sunt utilizate pe scară largă în viața publică: comerț, corespondență, sesizări financiare și judiciare, unități de stocare, identificare personală, informații de contact (linkuri web, adrese de e-mail, numere de telefon) etc.
Distingeți codurile de bare liniare (citite într-o singură direcție) și bidimensionale. Fiecare dintre soiuri diferă atât prin dimensiunea imaginii grafice, cât și prin cantitatea de informații prezentate. Următorul tabel oferă exemple ale unora dintre variațiile codurilor de bare.
Tabelul 22.1. Soiuri de coduri de bare
Nume | Exemplu de cod de bare | Note (editare) |
Liniar | ||
Cod universal de produs, UPC (cod universal de produs) |
(UPC-A) |
Standard american de coduri de bare conceput pentru a codifica identificatorii de produs și producător. Există varietăți: - UPC-E - 8 cifre sunt codificate; - UPC-A - 13 cifre codificate. |
Număr articol european, EAN (număr articol european) |
(EAN-13) |
Standard european de coduri de bare conceput pentru a codifica identificatorii de produs și producător. Există varietăți: - EAN-8 - 8 cifre sunt codificate; - EAN 13 - sunt codificate 13 cifre; - EAN-128 - orice număr de litere și numere combinate în grupuri reglementate este codificat. GOST ISO / IEC 15420-2001 „Identificare automată. Cod de bare. Specificație de simbolizare EAN/UPC”. |
Cod 128 (Cod 128) |
Include 107 caractere. Dintre care 103 simboluri de date, 3 simboluri de pornire și 1 simbol de oprire. Pentru a codifica toate cele 128 de caractere ASCII, există trei seturi de caractere - A, B și C, care pot fi utilizate într-un singur cod de bare. EAN-128 Codifică alfabetic codul 128 GOST 30743-2001 (ISO / IEC 15417-2000) „Identificare automată. Cod de bare. Specificația simbolului cod 128 (Cod 128) ”. |
|
Bidimensional | ||
DataMatrix (date matrice) |
Numărul maxim de caractere care se potrivesc într-un cod este de 2048 de octeți. GOST R ISO / IEC 16022-2008 „Identificare automată. Cod de bare. Specificația de simbolizare a matricei de date”. |
|
cod QR (Răspuns rapid în engleză - răspuns rapid) |
Pătratele din colțurile imaginii vă permit să normalizați dimensiunea și orientarea imaginii, precum și unghiul la care senzorul este legat de suprafața imaginii. Punctele sunt convertite în numere binare cu verificarea sumei de control. Numărul maxim de caractere care se potrivesc într-un cod QR: - numere - 7089; - cifre și litere (latine) - 4296; - cod binar - 2953 octeți; - hieroglife - 1817. |
|
MaxiCode (maxicod) |
Dimensiune - inch pe inch (1 inch = 2,54 cm). Folosit pentru sistemele de expediere și recepție. GOST R 51294.6-2000 „Identificare automată. Cod de bare. Specificația simbolului MaxiCode”. |
|
PDF147 (Fișier de date portabil în engleză - fișier de date portabil) |
Este folosit pentru identificarea personală, contabilizarea mărfurilor, la transmiterea rapoartelor către autoritățile de reglementare și alte domenii. Acceptă codificarea până la 2710 de caractere și poate conține până la 90 de linii. |
|
Eticheta Microsoft (etichetă Microsoft) |
Proiectat pentru a fi recunoscut de camerele încorporate în telefoanele mobile. Poate conține același număr de caractere ca și Code128. Conceput pentru identificarea și primirea rapidă a informațiilor pregătite în prealabil pe dispozitiv (linkuri web, text liber de până la 1000 de caractere, număr de telefon etc.) legate de un cod și stocate pe un server Microsoft. Conține 13 octeți plus un bit suplimentar pentru paritate. |
Reprezentarea binară a numerelor (în computer)... După cum știți, informațiile stocate și procesate în computere sunt reprezentate în formă binară. Pic(ing. bi nary digi t- număr binar; joaca si cu cuvintele: ing. bit - o bucată, o particulă) - o unitate pentru măsurarea cantității de informații, egală cu un bit în sistemul numeric binar. Folosind un bit, puteți codifica (reprezenta, distinge) două stări (0 sau 1; da sau nu). Prin creșterea numărului de biți (biți), puteți crește numărul de stări codificate. De exemplu, pentru un octet (octet englez), format din 8 biți, numărul de stări codificate este 2 8 = 256.
Numerele sunt codificate în așa-numitul. formate în virgulă fixă și în virgulă mobilă.
1. Format punct fix, folosit în principal pentru numere întregi, dar poate fi folosit și pentru numere reale, care au un număr fix de zecimale după virgulă. Pentru numere întregi, se presupune că „virgula” este la dreapta după bitul (cifra) cel mai puțin semnificativ, adică în afara grilei de biți. Există două reprezentări în acest format: nesemnate (pentru numere nenegative) și semnate.
Pentru nesemnat reprezentare, toate cifrele sunt rezervate pentru reprezentarea numărului în sine. De exemplu, folosind un octet, puteți reprezenta numere întregi fără semn de la 0 10 la 255 10 (00000000 2 - 11111111 2) sau numere reale cu o zecimală de la 0,0 10 la 25,5 10 (00000000 2 - 111111111). Pentru simbolic reprezentări, adică numere pozitive și negative, cel mai semnificativ bit este atribuit semnului (0 - număr pozitiv, 1 - negativ).
Distingeți codurile directe, inverse și suplimentare pentru scrierea numerelor semnate.
V directÎn cod, numerele pozitive și negative sunt scrise în același mod ca și în reprezentarea fără semn (cu excepția faptului că bitul cel mai semnificativ este atribuit semnului). Astfel, numerele 5 10 și -5 10 sunt scrise ca 00000101 2 și 10000101 2. În codul direct, există două coduri pentru numărul 0: „zero pozitiv” 00000000 2 și „zero negativ” 10000000 2.
Folosind verso cod, un număr negativ este scris ca un număr pozitiv inversat (0 se schimbă în 1 și invers). De exemplu, numerele 5 10 și -5 10 sunt scrise ca 00000101 2 și 11111010 2. Trebuie remarcat faptul că în codul invers, ca și în cel înainte, există „zero pozitiv” 00000000 2 și „zero negativ” 11111111 2. Utilizarea codului invers vă permite să scădeți un număr dintr-un altul utilizând operația de adunare, de exemplu. scăderea a două numere X - Y se înlocuiește cu suma lor X + (-Y). Aceasta folosește două reguli suplimentare:
Numărul scăzut este inversat (reprezentat ca cod invers);
Dacă numărul de biți ai rezultatului este mai mare decât numărul alocat pentru reprezentarea numerelor, atunci bitul din stânga (cel mai semnificativ) este eliminat și 1 2 este adăugat la rezultat.
Următorul tabel oferă exemple de scădere.
Tabelul 22.2. Exemple de scădere a două numere folosind codul invers
X Y | 5 – 5 | 6 – 5 | 5 – 6 | 5 – (-6) |
X 2 | 00000101 | 00000110 | 00000101 | 00000101 |
Y 2 | 00000101 | 00000101 | 00000110 | 11111001 |
Înlocuire prin adăugare | 5 + (-5) | 6 + (-5) | 5 + (-6) | 5 + 6 |
Cod invers pentru scădere (-Y 2) | 11111010 | 11111010 | 11111001 | 00000110 |
Plus | 00000101 + 11111010 11111111 |
00000110 + 11111010 100000000 |
00000101 + 11111001 11111110 |
00000101 + 00000110 00001011 |
nu este necesar | 00000000 + 00000001 00000001 |
nu este necesar | nu este necesar | |
Rezultat | -0 | 1 | -1 | 11 |
În ciuda faptului că codul invers simplifică foarte mult procedurile de calcul și, în consecință, viteza computerelor, prezența a două „zerouri” și alte convenții au dus la apariția adiţional cod. Când este reprezentat un număr negativ, modulul său este mai întâi inversat, ca în codul invers, apoi 1 2 este adăugat imediat la inversare.
Următorul tabel listează câteva dintre numerele din diferite reprezentări de cod.
Tabelul 22.3. Reprezentarea numerelor în diferite coduri
Zecimal reprezentare |
Cod de reprezentare binar (8 biți) | ||
Drept | înapoi | adiţional | |
127 | 01111111 | 01111111 | 01111111 |
6 | 00000110 | 00000110 | 00000110 |
5 | 00000101 | 00000101 | 00000101 |
1 | 00000001 | 00000001 | 00000001 |
0 | 00000000 | 00000000 | 00000000 |
-0 | 10000000 | 11111111 | --- |
-1 | 10000001 | 11111110 | 11111111 |
-5 | 10000101 | 11111010 | 11111011 |
-6 | 10000110 | 11111001 | 11111010 |
-127 | 11111111 | 10000000 | 10000001 |
-128 | --- | --- | 10000000 |
La reprezentarea numerelor negative în coduri complementare, a doua regulă este oarecum simplificată - dacă numărul de biți ai rezultatului este mai mare decât numărul alocat pentru reprezentarea numerelor, atunci doar bitul din stânga (cel mai semnificativ) este eliminat.
Tabelul 22.4. Exemple de scădere a două numere folosind codul de complement al lui
X Y | 5 – 5 | 6 – 5 | 5 – 6 | 5 – (-6) |
X 2 | 00000101 | 00000110 | 00000101 | 00000101 |
Y 2 | 00000101 | 00000101 | 00000110 | 11111010 |
Înlocuire prin adăugare | 5 + (-5) | 6 + (-5) | 5 + (-6) | 5 + 6 |
Cod suplimentar pentru scădere (-Y 2) | 11111011 | 11111011 | 11111010 | 00000110 |
Plus | 00000101 + 11111011 00000000 |
00000110 + 11111011 100000001 |
00000101 + 11111010 11111111 |
00000101 + 00000110 00001011 |
Scăderea celui mai semnificativ bit și adăugarea 1 2 | nu este necesar | 00000001 | nu este necesar | nu este necesar |
Rezultat | -0 | 1 | -1 | 11 |
Se poate susține că reprezentarea numerelor în coduri complementare necesită încă o operațiune (după inversare, este întotdeauna necesară adăugarea cu 1 2), care poate să nu fie necesară în viitor, ca în exemplele cu coduri inverse. În acest caz funcționează binecunoscutul „principiu ceainic”. Este mai bine să faceți procedura liniară decât să aplicați regulile „Dacă A, atunci B” (chiar dacă este una). Ceea ce, din punct de vedere uman, pare a fi o creștere a costurilor forței de muncă (complexitate computațională și de timp), din punct de vedere al implementării software și tehnic, se poate dovedi a fi mai eficient.
Un alt avantaj al codului suplimentar față de revers este capacitatea de a reprezenta cu un număr (stare) mai mult într-o unitate de informație, prin eliminarea „zerului negativ”. Prin urmare, de regulă, domeniul de reprezentare (stocare) pentru numere întregi cu semn cu o lungime de un octet este de la +127 la -128.
2. Format virgulă mobilă este folosit în principal pentru numere reale. Numărul în acest format este reprezentat în formă exponențială
X = e n * m, (22,1)
unde e este baza funcției exponențiale;
n - ordine de bază;
e n - caracteristica numărului;
m - mantisa (latină mantissa - creștere) - un factor prin care caracteristica unui număr trebuie înmulțită pentru a obține numărul în sine.
De exemplu, numărul zecimal 350 poate fi scris ca 3,5 * 10 2, 35 * 10 1, 350 * 10 0 etc. V evidență științifică normalizată, Ordin n este ales astfel încât valoarea absolută m a rămas cel puțin unul, dar strict mai puțin de zece (1 ≤ | m |< 10). Таким образом, в нормализованной научной записи число 350 выглядит, как 3.5 * 10 2 . При отображении чисел в программах, учитывая, что основание равно 10, их записывают в виде m E ± n, unde E înseamnă "* 10 ^" ("... înmulțit cu zece la puterea ..."). De exemplu, numărul 350 este 3,5E + 2, iar numărul 0,035 este 3,5E-2.
Deoarece numerele sunt stocate și procesate în computere în formă binară, în aceste scopuri se presupune că e = 2. Una dintre formele posibile de reprezentare binară a numerelor în virgulă mobilă este următoarea.
Orez. 22.9. Format binar în virgulă mobilă
Biții bn ± și bm ±, care indică semnul ordinului și mantisa, sunt codificați în mod similar numerelor cu virgulă fixă: pentru numerele pozitive „0”, pentru numerele negative - „1”. Valoarea de ordine este aleasă astfel încât valoarea părții întregi a mantisei în reprezentare zecimală (și, în consecință, în binară) să fie egală cu „1”, care va corespunde notației normalizate pentru numere binare. De exemplu, pentru numărul 350 10 ordinea este n = 8 10 = 001000 2 (350 = 1,3671875 * 2 8), iar pentru 576 10 - n = 9 10 = 001001 2 (576 = 1,125 * 2 9). Reprezentarea pe biți a cantității de comandă poate fi efectuată în cod direct, invers sau complement a doi (de exemplu, pentru n = 8 10 forma binară 001000 2). Mărimea mantisei afișează partea fracțională. Pentru a-l converti în binar, este înmulțit succesiv cu 2 până când este egal cu 0. De exemplu,
Orez. 22.10. Un exemplu de obținere a unei părți fracționale în formă binară
Părțile întregi obținute ca urmare a înmulțirii secvențiale sunt forma binară a părții fracționale (0,3671875 10 = 0101111 2). Restul cifrelor valorii mantisei sunt completate cu 0. Astfel, forma finală a numărului 350 în format virgulă mobilă, ținând cont de reprezentarea mantisei în notația normalizată
Orez. 22.11. Forma binară a numărului 350
În implementările software și hardware ale operațiilor aritmetice, standardul pentru reprezentarea numerelor în virgulă mobilă este larg răspândit IEEE 2 754(ultima ediție „754-2008 - IEEE Standard for Floating-Point Arithmetic”). Acest standard definește formate în virgulă mobilă pentru reprezentarea numerelor. singur(în engleză single, float) și dubla(engl. double) precizie. Structura generală a formatelor
Orez. 22.12. Format general pentru reprezentarea numerelor binare în standardul IEEE 754
Formatele de reprezentare diferă prin numărul de biți (octeți) alocați pentru reprezentarea numerelor și, în consecință, prin precizia reprezentării numerelor în sine.
Tabelul 22.5. Caracteristicile formatelor de reprezentare binară IEEE 754
Format | singur | dubla |
Dimensiunea totală, bit (octet) | 32 (4) | 64 (8) |
Numărul de biți pentru comandă | 8 | 11 |
Numărul de biți pentru mantise (excluzând bitul de semn) |
23 | 52 |
Mărimea comenzii | 2 128 .. 2 -127 (± 3,4 * 10 38 .. 1,7 * 10 -38) |
2 1024 .. 2 -1023 (± 1,8 * 10 308 .. 9,0 * 10 -307) |
Compensarea comenzii | 127 | 1023 |
Gama de reprezentare a numerelor (excluzând semnul) |
± 1,4 * 10 -45 .. 3,4 * 10 38 | ± 4,9 * 10 -324 .. 1,8 * 10 308 |
Numărul de cifre semnificative ale unui număr (nu mai) |
8 | 16 |
Particularitatea reprezentării numerelor conform standardului IEEE este absența unui bit sub semnul comenzii. În ciuda acestui fapt, mărimea comenzii poate lua atât valori pozitive, cât și valori negative. Acest moment este luat în considerare de așa-numitul. „Înlocuirea comenzii”. După conversia formei binare a ordinului (scrisă în cod direct) în zecimală, „offset-ul de comandă” se scade din valoarea obţinută. Rezultatul este o valoare „adevărată” de ordinul numărului. De exemplu, dacă ordinea lui 11111111 2 (= 255 10) este specificată pentru un singur număr de precizie, atunci valoarea comenzii este de fapt 128 10 (= 255 10 - 127 10) și dacă 00000000 2 (= 0 10) , apoi -127 10 (= 0 10 - 127 10).
Mărimea mantisei este indicată, ca și în cazul precedent, într-o formă normalizată.
Având în vedere cele de mai sus, numărul 350 10 în formatul de precizie unică IEEE 754 este scris după cum urmează.
Orez. 22.13. Forma binară a numărului 350 conform standardului IEEE
Alte caracteristici ale standardului IEEE includ capacitatea de a reprezenta numere speciale. Acestea includ valorile NaN (English Not a Number - nu un număr) și +/- INF (Englez Infinity - infinit), rezultate din operațiuni precum împărțirea la zero. Include, de asemenea, numere denormalizate cu o mantisă mai mică de unu.
În concluzie, despre numerele în virgulă mobilă, câteva cuvinte despre notoriile " eroare de rotunjire". pentru că doar câteva cifre semnificative sunt stocate în formă binară de reprezentare a unui număr; nu poate „acoperi” întreaga varietate de numere reale dintr-un interval dat. Ca urmare, dacă un număr nu poate fi reprezentat cu acuratețe în formă binară, acesta pare să fie cel mai apropiat posibil. De exemplu, dacă adăugați succesiv „1.7” unui număr de tip dublu „0.0”, puteți găsi următorul „model” de modificare a valorilor.
0.0
1.7
3.4
5.1
6.8
8.5
10.2
11.899999999999999
13.599999999999998
15.299999999999997
16.999999999999996
18.699999999999996
20.399999999999995
22.099999999999994
23.799999999999994
25.499999999999993
27.199999999999992
28.89999999999999
30.59999999999999
32.29999999999999
33.99999999999999
35.699999999999996
37.4
39.1
40.800000000000004
42.50000000000001
44.20000000000001
45.90000000000001
47.600000000000016
…
Orez. 22.14. Rezultatul adăugării secvenţiale a numărului 1.7 (Java 7)
O altă nuanță se găsește la adăugarea a două numere, care au o ordine semnificativ diferită. De exemplu, adăugând 10 10 + 10 -10 ar rezulta 10 10. Chiar dacă adăugați succesiv de 10 -10 până la 10 10 trilioane (10 12) de ori, rezultatul rămâne același 10 10. Dacă adăugăm la 10 10 produsul 10 -10 * 10 12, care din punct de vedere matematic este același, rezultatul devine 10000000100 (1,0000000100 * 10 10).
Cod genetic- secvența codificată de aminoacizi a proteinelor inerente tuturor organismelor vii. Codarea se realizează folosind nucleotidele 3, care fac parte din ADN (acid dezoxiribonucleic). DKN este o macromoleculă care asigură stocarea, transmiterea din generație în generație și implementarea programului genetic pentru dezvoltarea și funcționarea organismelor vii. Poate cel mai important cod din istoria omenirii.
În ADN se folosesc patru baze azotate - adenina (A), guanina (G), citozina (C), timina (T), care în literatura rusă sunt desemnate prin literele A, G, C și T. Aceste litere alcătuiesc alfabetul codului genetic. În moleculele de ADN, nucleotidele sunt aranjate în lanțuri și, astfel, se obțin secvențe de litere genetice.
Proteinele aproape tuturor organismelor vii sunt construite din aminoacizi ai unui total de 20 de specii. Acești aminoacizi sunt numiți canonici. Fiecare proteină este un lanț sau mai multe lanțuri de aminoacizi conectate într-o secvență strict definită. Această secvență determină structura proteinei și, prin urmare, toate proprietățile sale biologice. Sinteza proteinelor (adică implementarea informațiilor genetice în celulele vii) se realizează pe baza informațiilor stocate în ADN. Trei nucleotide consecutive (triplet) sunt suficiente pentru a codifica fiecare dintre cei 20 de aminoacizi, precum și semnalul stop, care indică sfârșitul secvenței de proteine.
Orez. 22.15. fragment de ADN
2 IEEE (Institute of Electrical and Electronics Engineers) - Institute of Electrical and Electronics Engineers.
3 Conține baze azotate combinate cu zahăr și acid fosforic.
22.3. Sisteme de coduri secrete
Codurile secrete, precum cifrurile, sunt concepute pentru a asigura confidențialitatea informațiilor. Inițial, sistemele de codificare secretă erau un sistem bazat pe un fel de cod de jargon. Ele au apărut pentru a ascunde numele unor persoane reale menționate în corespondență. Acestea erau liste mici în care erau scrise nume ascunse, iar opus acestora - substituții de cod (substituții). Codurile oficiale folosite de emisarii papali și ambasadorii din orașele-stat mediteraneene găsite în arhivele timpurii ale Vaticanului datează din secolul al XIV-lea pentru a ascunde conținutul rapoartelor. Pe măsură ce nevoia de securitate a corespondenței creștea, reprezentanții orașelor-stat aveau liste mai extinse, care includeau nu numai înlocuiri de coduri pentru numele oamenilor, ci și țări, orașe, tipuri de arme, dispoziții etc. Pentru a spori securitatea informațiilor, listelor pentru codificarea cuvintelor care nu au fost incluse în listă au fost adăugate alfabete cifrate, precum și reguli de utilizare a acestora, bazate pe diverse metode steganografice și criptografice. Astfel de colecții au fost numite „ nomenclatorii". Din secolul al XV-lea până la mijlocul secolului al XIX-lea. au fost principala formă de confidențialitate a informațiilor.
Până în secolul al XVII-lea, cuvintele în text simplu și înlocuirile lor de cod erau în ordine alfabetică în nomenclatoare, până când criptologul francez Antoine Rossignol a sugerat folosirea unor nomenclatoare mai persistente în două părți. În ele erau două secțiuni: într-una, elementele textului simplu erau enumerate în ordine alfabetică, iar elementele de cod erau amestecate. În a doua parte, listele de coduri erau în ordine alfabetică, iar elementele textului simplu erau deja amestecate.
Invenția telegrafului și a codului Morse, precum și așezarea cablului transatlantic la mijlocul secolului al XIX-lea. a extins semnificativ domeniul de aplicare al codurilor secrete. Pe lângă domeniile tradiționale de utilizare a acestora (în corespondența diplomatică și în scopuri militare), acestea au devenit utilizate pe scară largă în comerț și transport. Sistemele secrete de coduri din acea vreme în numele lor conțineau cuvântul „ Codul"(" Codul Departamentului de Stat (1867) "," Codul american pentru tranșee, "" Codurile fluviale: Potomac "," Codul negru ") sau" cifru"(" Codul Departamentului de Stat (1876) "," Codul verde "). Trebuie remarcat faptul că, în ciuda prezenței cuvântului „cifrare” în titlu, codificarea a fost luată ca bază a acestor sisteme.
Orez. 22.16. Fragment din „Codul Departamentului de Stat (1899)”
Dezvoltatorii de coduri, cum ar fi scriitorii de coduri, au adăugat adesea niveluri suplimentare de protecție pentru a face codurile lor mai dificil de spart. Acest proces se numește re-criptare... Ca urmare, sistemele de coduri secrete combinau atât metode steganografice, cât și cele criptografice de asigurare a confidențialității informațiilor. Cele mai populare sunt prezentate în tabelul următor.
Tabelul 22.6. Metode de asigurare a confidenţialităţii informaţiilor în sistemele de coduri secrete
Cale | Un fel | Note (editare) | Exemple de (cuvânt codificat - denumire cod) |
Înlocuirea unui cuvânt (expresie) cu un alt cuvânt de lungime arbitrară | steganografic | Analog -. |
1. Nomenclatorul orașului Siena (sec. XV): Cardinales (cardinal) - Florenus; Antonello da Furli - Forte. 2. Cod Departamentul de Stat 1899: Rusia (Rusia) - Promovează; Cabinetul Rusiei - Recomandări. 3. Codul șefului serviciului de comunicații (1871): 10:30 - Anna, Ida; 13 (al treisprezecelea) - Charles, Mason. |
Înlocuirea unui cuvânt (expresie) cu un șir de caractere de lungime fixă | steganografic | Analog -. | 1. Cod american pentru tranșee (1918): Patrol - RAL; Atacul - DIT. 2. Departamentul de Stat cod A-1 (1919): Diplomat (diplomat) - BUJOH; Corp diplomatic (corp diplomatic) - BEDAC. |
Înlocuirea unui cuvânt (expresie) cu un număr | steganografic | Analog -. Mai multe denumiri de cod ar putea fi utilizate pentru un cuvânt codificat. |
1. Nomenclatorul lui Benjamin Tolmadge (1779): Apărare - 143; Atac - 38. 2. Cod de difuzare pentru navele comerciale aliate din Al Doilea Război Mondial (BAMS): Insula - 36979; portul - 985. |
Înlocuirea unui cuvânt (expresie) cu un set de numere de lungime fixă | steganografic | Analog -. | 1. Cod american pentru tranșee (1918): Patrol (patrol) - 2307; Atacul - 1447. 2. American Service Radio Code # 1 (1918): Ulei - 001; Rău (rău) - 642. |
Înlocuirea literelor | criptografic | Analogii - cifr,. Literele, cifrele, simbolurile grafice pot fi folosite ca desemnare a codului. A fost folosit pentru cuvinte care nu sunt în lista codificată. |
1. Nomenclatorul orașului Siena (sec. XV): q -; s -. 2. Nomenclatorul lui James Madison (1781): o - 527; p - 941. 3. Cod american pentru tranșee (1918): a - 1332 .. 2795 sau CEW .. ZYR. De asemenea, conținea 30 de alfabete de substituții de cifr pentru re-criptarea desemnărilor de cod. |
Înlocuirea unei combinații de litere | criptografic | Analog -. Literele, cifrele, simbolurile grafice pot fi folosite ca desemnare a codului. |
1. Nomenclatorul orașului Siena (sec. XV): bb -; tt -. 2. Nomenclatorul X-Y-Z (1737): ce - 493; ab - 1194. |
Utilizarea caracterelor goale | steganografic | Analog -. Simbolurile de numire (latina nihil importantes) au fost folosite pentru a deruta criptoanalistii. |
1. Nomenclatorul orașului Siena (sec. XV):,. 2. Codurile fluviale: Potomac (1918): ASY. |
Utilizarea numerelor aditive | criptografic | Analog -. Numărul aditiv adăugat la denumirea codului numeric a servit ca parte variabilă a codului (cheie). |
Cifrul Departamentului de Stat din 1876: regula „Cal” de la începutul mesajului a însemnat că numărul aditiv 203 a fost folosit pentru a codifica codurile ulterioare; „Șoim” (șoim) - 100. |
Permutarea literelor (numerelor) în denumirile codurilor | criptografic | Analog -. | Cod telegrafic pentru a asigura secretul transmiterii telegramelor (1870): Una dintre reguli prevedea permutarea ultimelor trei cifre în denumirea codului digital, constând din cinci cifre. |
Permutarea codurilor | criptografic | Analog -. | Codul Departamentului de Stat 1876: regula „Tigru” de la începutul mesajului a însemnat că mesajul decodat trebuie citit de la ultimul cuvânt până la primul (înapoi); „Tapir” (tapir) - schimbând fiecare pereche de cuvinte (adică primul și al doilea, al treilea și al patrulea etc.). |
Combinarea diferitelor metode de codare și decriptare într-un sistem de coduri a fost o practică comună în rândul dezvoltatorilor de cod și a început să fie folosită aproape de la începutul apariției lor. Așadar, chiar și în nomenclatorul folosit în orașul Siena în secolul al XV-lea, pe lângă înlocuirile de cod pentru cuvinte, acestea erau folosite pentru a înlocui literele, caracterele lor și cele goale. Această practică a înflorit la sfârșitul secolului al XIX-lea și începutul secolului al XX-lea. În special, în „Codul Departamentului de Stat din 1876” (Cartea roșie engleză - Cartea roșie), constând din 1200 de pagini, și suplimentul său „Cod indecidabil: adăugare la cifrul Departamentului de Stat” au fost folosite:
Coduri sub formă de cuvinte și numere;
Aceeași informație poate fi prezentată (codificat) în mai multe forme. Odată cu apariția computerelor, a devenit necesară codificarea tuturor tipurilor de informații cu care se ocupă atât o persoană individuală, cât și umanitatea în ansamblu. Dar omenirea a început să rezolve problema codificării informațiilor cu mult înainte de apariția computerelor. Realizările extraordinare ale omenirii - scrisul și aritmetica - nu sunt altceva decât un sistem de codificare a vorbirii și a informațiilor numerice. Informația nu apare niciodată în forma ei pură, este întotdeauna prezentată cumva, cumva codificată.
Codarea binară este una dintre modurile comune de reprezentare a informațiilor. În calculatoare, roboți și mașini-unelte controlate numeric, de regulă, toate informațiile cu care se ocupă un dispozitiv sunt codificate sub formă de cuvinte într-un alfabet binar.
ASCII - [abrev. Engleză Cod standard american pentru schimbul de informații] Un set de coduri de 128 de caractere pentru litere, numere, caractere de control și alte caractere utilizate în multe sisteme de calcul.
Pentru codificarea informațiilor text, a fost adoptat standardul internațional ASCII (American Standard Code for Information Interchange), în tabelul de coduri din care sunt rezervate codificare 128 de coduri pe 7 biți:
- - Simboluri ale alfabetului latin
- - Cifre
- - Semne de punctuatie
- - Simboluri matematice
Adăugarea unui al 8-lea bit crește numărul de coduri ASCII la 255. Codurile de la 128 la 255 sunt o extensie a tabelului ASCII. Aceste coduri din tabelul ASCII sunt folosite pentru a codifica unele caractere care diferă de alfabetul latin și se găsesc în limbi cu scriere bazată pe alfabetul latin - germană, franceză, spaniolă etc. În plus, unele dintre coduri sunt utilizate pentru a codifica caractere pseudo-grafice care pot fi folosite, de exemplu, pentru proiectarea diferitelor cadre și tabele de text din text.
Pentru a codifica caracterele alfabetelor naționale, se folosește extensia tabelului de coduri ASCII, adică coduri de 8 biți de la 128 la 255.
În limbile care utilizează alfabetul chirilic, inclusiv rusă, a fost necesar să se schimbe complet a doua jumătate a tabelului ASCII, adaptându-l la alfabetul chirilic. Dar lipsa standardelor convenite a dus la apariția diferitelor tabele de coduri pentru codificarea textelor în limba rusă, printre care
- - Tabel alternativ de coduri CP-866
- - Standard international ISO 8859
- - Tabel de coduri Microsoft CP-1251 (codare Windows)
- - Tabelul de coduri folosit în Unix OS KOI 8-r
KOI-8 (cod pentru schimbul de informații, 8 biți), KOI8 - standard de opt biți pentru codarea caracterelor în informatică. Proiectat pentru a codifica litere în alfabetul chirilic. Există, de asemenea, o versiune pe șapte biți a codificării - KOI-7. KOI-7 și KOI-8 sunt descrise în GOST 19768-74 (acum invalid).
Dezvoltatorii KOI-8 au plasat caracterele alfabetului rus în partea de sus a tabelului ASCII extins în așa fel încât pozițiile caracterelor chirilice să corespundă omologilor lor fonetici din alfabetul englez din partea de jos a tabelului. Aceasta înseamnă că dacă al optulea bit al fiecărui caracter este eliminat din textul scris în KOI-8, atunci se obține un text „lizibil”, deși este scris cu caractere latine. De exemplu, cuvintele „Text rusesc” ar deveni „rUSSKIJ tEKST”. Ca efect secundar, caracterele chirilice nu erau în ordine alfabetică.
ISO 8859-5. Problema cu lipsa de caractere unice pentru alte limbi a fost rezolvată destul de rapid și relativ nedureros - tabelul standard de coduri ASCII pe 7 biți a dobândit un al 8-lea bit cu drepturi depline - sub auspiciile Organizației Internaționale pentru Standardizare (ISO) , a apărut o întreagă familie de standarde ISO 8859-X. Un bit suplimentar a făcut posibilă utilizarea acum a 256 de caractere, iar jumătatea inferioară a tabelului de coduri (caracterele cu codurile 0-127) repetă complet ASCII, iar jumătatea superioară conține elemente unice ale codificărilor naționale. Această organizare a tabelelor de coduri naționale vă permite să afișați și să procesați corect literele, cifrele și semnele de punctuație latine pe orice computer, indiferent de setările sale de limbă. În familia prietenoasă de codificări ISO, a existat și un loc pentru alfabetul nostru chirilic, care a primit denumirea de cod ISO 8859-5. Caracteristica sa caracteristică este plasarea strict alfabetică a literelor rusești în el, ceea ce este foarte convenabil pentru sortarea corectă a înregistrărilor în bazele de date. După cum s-a dovedit puțin mai târziu, copilul s-a dovedit a fi născut mort: ISO 8859-5 s-a ciocnit cu pseudo-grafică în DOS, care câștigase putere până atunci, și mai târziu nu a găsit înțelegere nici printre autorii Windows.
Windows-1251 este un set de caractere și o codificare care este codarea standard pe 8 biți pentru toate versiunile rusești ale Microsoft Windows. Este destul de popular. A fost creat pe baza codificărilor folosite la primele rusificatoare Windows „făcute în casă” în 1990-1991. împreună de reprezentanți ai Paragraph, Dialogue și ai filialei din Rusia a Microsoft. Versiunea originală a codificării a fost foarte diferită de cea prezentată în tabelul de mai jos (în special, a existat un număr semnificativ de „puncte goale”).
Windows-1251 se compară favorabil cu alte codificări chirilice de 8 biți (cum ar fi CP866, KOI8-R și ISO 8859-5) prin prezența aproape tuturor caracterelor folosite în tipografia rusă pentru textul obișnuit (lipsește doar pictograma accent); conține, de asemenea, toate simbolurile pentru limbile apropiate de limba rusă: ucraineană, belarusă, sârbă și bulgară.
Are două dezavantaje:
- - litera mică „i” are codul 0xFF (255 în zecimală). Este „vinovatul” unui număr de probleme neașteptate în programele fără suport pentru un al 8-lea bit pur, precum și (caz mult mai frecvent) folosirea acestui cod ca cod de serviciu (în CP437 înseamnă un „spațiu care nu se sparge” , în Windows-1252 - y, ambele variante nu sunt practic utilizate; numărul -1, care este reprezentat de numărul 255 în codul cu două complemente pe 8 biți, este adesea folosit în programare ca valoare specială, de exemplu, indicatorul de sfârșit de fișier EOF este adesea reprezentat de valoarea -1).
- - nu există simboluri pseudo-grafice disponibile în CP866 și KOI8 (deși nu a fost nevoie de ele chiar pentru Windows, pentru care a fost destinat, acest lucru a făcut mai vizibilă incompatibilitatea celor două codificări utilizate în ele).