Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ

Tabelat e kodit të informacionit të kodimit. Fondi kodues - term - enciklopedik

Ndër shumëllojshmërinë e informacionit të përpunuar në një kompjuter, një pjesë e konsiderueshme përbëhet nga informacione numerike, tekstuale, grafike dhe audio. Le të shohim disa mënyra për t'i koduar këto llojet e informacionit në kompjuter.

Numrat kodues

Ekzistojnë dy formate kryesore për paraqitjen e numrave në kujtesën e kompjuterit. Njëri prej tyre përdoret për të koduar numra të plotë, i dyti (i ashtuquajturi paraqitje me pikë lundruese të një numri) përdoret për të specifikuar një nëngrup të caktuar numrash realë.

Një tufë me numra të plotë, i përfaqësuar në memorien e kompjuterit, është i kufizuar. Gama e vlerave varet nga madhësia e zonës së kujtesës që përdoret për të ruajtur numrat. Një qelizë k-bit mund të ruajë 2 k vlera të ndryshme të numrave të plotë.

Për të marrë paraqitjen e brendshme të një numri të plotë pozitiv N të ruajtur në një fjalë makine k-bit, ju duhet:

  1. shndërroni numrin N në sistemin e numrave binar;
  2. rezultati që rezulton plotësohet në të majtë me zero të parëndësishme deri në k shifra.

Shembull. Merrni paraqitjen e brendshme të numrit të plotë 1607 në një qelizë 2 bajt.

Le ta kthejmë numrin në sistemin binar: 1607 10 = 11001000111 2. Paraqitja e brendshme e këtij numri në një qelizë do të jetë: 0000 0110 0100 0111.

Për të shkruar paraqitjen e brendshme të një numri të plotë negativ (-N), ju duhet:

  1. merrni një paraqitje të brendshme të një numri pozitiv N;
  2. kodi i kundërt i këtij numri duke zëvendësuar 0 me 1 dhe 1 me 0;
  3. shtoni 1 në numrin që rezulton.

Shembull. Le të marrim paraqitjen e brendshme të numrit të plotë negativ -1607. Le të përdorim rezultatin e shembullit të mëparshëm dhe të shkruajmë paraqitjen e brendshme të numrit pozitiv 1607: 0000 0110 0100 0111. Duke përmbysur marrim kodin e kundërt: 1111 1001 1011 1000. Le të shtojmë një: 1111 11101 është e brendshme. paraqitje binare numrat -1607.

Formati i pikës lundruese përdor paraqitjen e një numri real R si prodhim i mantisës m dhe bazës së sistemit të numrave n ndaj një fuqie të plotë p, e cila quhet rendi: R = m * n p.

Paraqitja e një numri në formën me pikë lundruese është e paqartë. Për shembull, barazitë e mëposhtme janë të vërteta:

12,345 = 0,0012345 x 10 4 = 1234,5 x 10 -2 = 0,12345 x 10 2

Më shpesh, kompjuterët përdorin një paraqitje të normalizuar të një numri në formën e pikës lundruese. Mantisa në këtë paraqitje duhet të plotësojë kushtin: 0.1 p<= m < 1 p . Иначе говоря, мантисса меньше 1 и первая значащая цифра - не ноль (p - основание системы счисления).

Në kujtesën e kompjuterit, mantisa përfaqësohet si një numër i plotë që përmban vetëm shifra të rëndësishme (0 numra të plotë dhe një presje nuk ruhen), kështu që për numrin 12.345, numri 12345 do të ruhet në qelizën e memories të caktuar për ruajtjen e mantisës. rivendosni numrin origjinal, mbetet vetëm për të ruajtur rendin e tij, në këtë shembull është 2.

Kodimi i tekstit

Grupi i karaktereve që përdoren për të shkruar tekst quhet alfabeti. Numri i karaktereve në alfabet quhet i tij pushtet.

Për të paraqitur informacionin e tekstit në një kompjuter, përdoret më shpesh një alfabet me një kapacitet prej 256 karaktere. Një karakter nga një alfabet i tillë mbart 8 bit informacion, pasi 2 8 = 256. Por 8 bit përbëjnë një bajt, prandaj, kodi binar i çdo karakteri merr 1 bajt memorie kompjuteri.

Të gjithë karakteret e një alfabeti të tillë numërohen nga 0 në 255 dhe çdo numër korrespondon me një kod binar 8-bitësh nga 00000000 deri në 11111111. Ky kod është numri serial i karakterit në sistemi binar i numrave.

Për lloje të ndryshme kompjuterash dhe sistemesh operative, përdoren tabela të ndryshme kodimi, të ndryshme në rendin e vendosjes personazhet e alfabetit në tabelën e kodeve. Standardi ndërkombëtar për kompjuterët personal është ai i përmendur tashmë tabela e kodimit ASCII.

Parimi i kodimit sekuencial të alfabetitështë se në tabelën e kodit ASCII, shkronjat latine (të mëdha dhe të vogla) janë renditur sipas rendit alfabetik. Renditja e numrave gjithashtu renditet duke rritur vlerat.

Vetëm 128 karakteret e para janë standarde në këtë tabelë, domethënë karaktere me numra nga zero (kodi binar 00000000) deri në 127 (01111111). Këtu përfshihen shkronjat e alfabetit latin, numrat, shenjat e pikësimit, kllapat dhe disa simbole të tjera. 128 kodet e mbetura, duke filluar me 128 (kodi binar 10000000) dhe duke përfunduar me 255 (11111111), përdoren për të koduar shkronjat e alfabeteve kombëtare, karakteret pseudografike dhe simbolet shkencore. RRETH kodimi i karaktereve Alfabeti rus përshkruhet në kapitullin "Përpunimi i dokumenteve".

Kodimi i informacionit grafik

memorie video përmban informacion binar në lidhje me imazhin e shfaqur në ekran. Pothuajse të gjitha imazhet e krijuara, të përpunuara ose të shikuara duke përdorur një kompjuter mund të ndahen në dy pjesë të mëdha - raster dhe grafika vektoriale.

Imazhet raster janë një rrjet pikash me një shtresë të quajtur piksel (piksel, nga elementi i figurës angleze). Kodi i pikselit përmban informacion për ngjyrën e tij.

Për një imazh bardh e zi (pa gjysmëtone), një piksel mund të marrë vetëm dy vlera: të bardhë dhe të zi (të ndezur ose jo të ndezur), dhe për ta koduar atë, mjafton një bit memorie: 1 - e bardhë, 0 - e zezë. .

Një piksel në një ekran me ngjyra mund të ketë ngjyra të ndryshme, kështu që një bit për piksel nuk mjafton. Kodimi i një imazhi me 4 ngjyra kërkon dy bit për piksel sepse dy bit mund të marrin 4 gjendje të ndryshme. Për shembull, mund të përdoret opsioni i mëposhtëm i kodimit të ngjyrave: 00 - e zezë, 10 - jeshile, 01 - e kuqe, 11 - kafe.

Në monitorët RGB, e gjithë larmia e ngjyrave merret nga një kombinim i ngjyrave bazë - e kuqe (E kuqe), jeshile (E gjelbër), blu (Blu), nga të cilat mund të merren 8 kombinime bazë:

R G B ngjyrë
1 0 0 e kuqe
1 0 1 rozë
1 1 0 kafe
1 1 1 të bardhë

Sigurisht, nëse keni aftësinë për të kontrolluar intensitetin (shkëlqimin) e shkëlqimit të ngjyrave bazë, atëherë numri i opsioneve të ndryshme për kombinimet e tyre, duke gjeneruar nuanca të ndryshme, rritet. Numri i ngjyrave të ndryshme - K dhe numri i biteve për kodimin e tyre - N lidhen me njëri-tjetrin me një formulë të thjeshtë: 2 N = K.

Në të kundërt grafika raster imazhi vektorial është me shumë shtresa. Çdo element i një imazhi vektor - një vijë, një drejtkëndësh, një rreth ose një pjesë teksti - ndodhet në shtresën e vet, pikselët e së cilës vendosen në mënyrë të pavarur nga shtresat e tjera. Çdo element i një imazhi vektor është një objekt që përshkruhet duke përdorur një gjuhë të veçantë (ekuacionet matematikore të vijave, harqeve, rrathëve, etj.). Objektet komplekse (vijat e thyera, forma të ndryshme gjeometrike) paraqiten si një grup objektesh elementare grafike.

Objektet e imazheve vektoriale, ndryshe nga grafika raster, mund të ndryshojnë madhësinë e tyre pa humbje të cilësisë (kur imazhi raster zmadhohet, kokrriza rritet). Më shumë informacion rreth formateve grafike përshkruhet në seksionin "Grafika në një kompjuter".

Kodimi audio

Nga kursi juaj i fizikës ju e dini këtë zëri- Këto janë dridhje ajri. Nëse e konvertoni audion në një DAC) dhe më pas zbutni sinjalin e shkallëzuar që rezulton.

Sa më i lartë të jetë shkalla e marrjes së mostrave (d.m.th., numri i mostrave për sekondë) dhe sa më shumë bit të alokohen për çdo mostër, aq më saktë do të përfaqësohet tingulli. Por kjo gjithashtu rrit madhësinë e skedarit të zërit. Prandaj, në varësi të natyrës së zërit, kërkesave për cilësinë e tij dhe sasisë së memories së zënë, zgjidhen disa vlera kompromisi.

Metoda e përshkruar e kodimit të informacionit të zërit është mjaft universale; ju lejon të përfaqësoni çdo tingull dhe ta transformoni atë në mënyra të ndryshme. Por ka raste kur është më e dobishme të veprosh ndryshe.

Njeriu ka përdorur prej kohësh një mënyrë mjaft kompakte për të përfaqësuar muzikën - shënimin muzikor. Ai përdor simbole të veçanta për të treguar se çfarë lartësie është tingulli, çfarë instrumenti duhet luajtur dhe si duhet luajtur. Në fakt, mund të konsiderohet një algoritëm për një muzikant, i regjistruar në një speciale gjuha formale. Në vitin 1983, prodhuesit kryesorë të kompjuterëve dhe sintetizuesve të muzikës zhvilluan një standard që përcaktonte një sistem të tillë kodi. Quhej MIDI.

Sigurisht, një sistem i tillë kodimi nuk ju lejon të regjistroni çdo tingull; ai është i përshtatshëm vetëm për muzikë instrumentale. Por ka gjithashtu avantazhe të pamohueshme: regjistrim jashtëzakonisht kompakt, natyrshmëri për muzikantin (pothuajse çdo redaktues MIDI ju lejon të punoni me muzikë në formën e notave të zakonshme), lehtësinë e ndryshimit të instrumenteve, ndryshimin e ritmit dhe çelësit të melodisë.

Vini re se ka formate të tjera, thjesht kompjuterike, për regjistrimin e muzikës. Ndër to, bie në sy formati MP3, i cili ju mundëson të kodoni muzikë me cilësi dhe raport kompresimi shumë të lartë. Në të njëjtën kohë, në vend të 18-20 kompozimeve muzikore, vendosen rreth 200 në një CD (CDROM) standard. Një këngë zë afërsisht 3.5 Mb, gjë që u mundëson përdoruesve të internetit të shkëmbejnë lehtësisht kompozime muzikore.

Përmbajtja

I. Historia e kodimit të informacionit………………………………..3

II. Kodimi i informacionit……………………………………………………4

III. Kodimi i informacionit të tekstit……………………………….4

IV. Llojet e tabelave koduese…………………………………………………………………………………………………………………

V. Llogaritja e sasisë së informacionit në tekst…………………………14

Lista e referencave………………………………..16

I . Historia e kodimit të informacionit

Njerëzimi ka përdorur enkriptimin (kodimin) e tekstit që nga momenti kur u shfaq informacioni i parë sekret. Këtu janë disa teknika të kodimit të tekstit që u shpikën në faza të ndryshme të zhvillimit të mendimit njerëzor:

Kriptografia është shkrim i fshehtë, një sistem i ndryshimit të shkrimit me qëllim që ta bëjë tekstin të pakuptueshëm për të painiciuarit;

Kodi Morse ose kodi i pabarabartë telegrafik, në të cilin çdo shkronjë ose shenjë përfaqësohet nga kombinimi i vet i shpërthimeve të shkurtra elementare të rrymës elektrike (pika) dhe shpërthimeve elementare me kohëzgjatje të trefishtë (dash);

Gjestet e nënshkrimit janë një gjuhë shenjash e përdorur nga njerëzit me dëmtim të dëgjimit.

Një nga metodat më të hershme të njohura të enkriptimit është emëruar pas perandorit romak Julius Caesar (shekulli I para Krishtit). Kjo metodë bazohet në zëvendësimin e secilës shkronjë të tekstit të koduar me një tjetër, duke zhvendosur alfabetin nga shkronja origjinale me një numër të caktuar karakteresh, dhe alfabeti lexohet në një rreth, domethënë pas shkronjës i, konsiderohet a. . Pra, fjala "byte", kur zhvendoset dy karaktere në të djathtë, kodohet si fjala "gwlf". Procesi i kundërt i deshifrimit të një fjale të caktuar është i nevojshëm për të zëvendësuar secilën shkronjë të koduar me të dytën në të majtë të saj.

II. Informacion kodues

Një kod është një grup konventash (ose sinjalesh) për regjistrimin (ose komunikimin) e disa koncepteve të paracaktuara.

Kodimi i informacionit është procesi i formimit të një përfaqësimi specifik të informacionit. Në një kuptim më të ngushtë, termi "kodim" shpesh kuptohet si një kalim nga një formë e përfaqësimit të informacionit në një tjetër, më i përshtatshëm për ruajtje, transmetim ose përpunim.

Zakonisht, çdo imazh kur kodohet (nganjëherë quhet enkriptim) përfaqësohet nga një shenjë e veçantë.

Një shenjë është një element i një grupi të fundëm elementësh të ndryshëm nga njëri-tjetri.

Në një kuptim më të ngushtë, termi "kodim" shpesh kuptohet si një kalim nga një formë e përfaqësimit të informacionit në një tjetër, më i përshtatshëm për ruajtje, transmetim ose përpunim.

Ju mund të përpunoni informacionin e tekstit në një kompjuter. Kur futet në një kompjuter, çdo shkronjë është e koduar me një numër të caktuar dhe kur del në pajisje të jashtme (ekran ose printim), imazhet e shkronjave ndërtohen nga këta numra për perceptimin e njeriut. Korrespondenca midis një grupi shkronjash dhe numrash quhet kodim i karaktereve.

Si rregull, të gjithë numrat në një kompjuter përfaqësohen duke përdorur zero dhe njëshe (jo dhjetë shifra, siç është zakonisht për njerëzit). Me fjalë të tjera, kompjuterët zakonisht funksionojnë në sistemin e numrave binar, pasi kjo i bën pajisjet për përpunimin e tyre shumë më të thjeshta. Futja e numrave në një kompjuter dhe nxjerrja e tyre për lexim njerëzor mund të bëhet në formën e zakonshme dhjetore dhe të gjitha konvertimet e nevojshme kryhen nga programet që funksionojnë në kompjuter.

III. Kodimi i informacionit të tekstit

I njëjti informacion mund të paraqitet (i koduar) në disa forma. Me ardhjen e kompjuterëve, lindi nevoja për të koduar të gjitha llojet e informacionit me të cilat merren si individi ashtu edhe njerëzimi në tërësi. Por njerëzimi filloi të zgjidhte problemin e kodimit të informacionit shumë përpara ardhjes së kompjuterëve. Arritjet madhështore të njerëzimit - shkrimi dhe aritmetika - nuk janë gjë tjetër veçse një sistem për kodimin e të folurit dhe informacionit numerik. Informacioni nuk shfaqet kurrë në formën e tij të pastër, ai gjithmonë paraqitet disi, disi i koduar.

Kodimi binar është një nga mënyrat e zakonshme të paraqitjes së informacionit. Në kompjuterë, robotë dhe makina të kontrolluara numerikisht, si rregull, i gjithë informacioni me të cilin merret pajisja kodohet në formën e fjalëve të alfabetit binar.

Që nga fundi i viteve '60, kompjuterët janë përdorur gjithnjë e më shumë për të përpunuar informacionin e tekstit, dhe aktualisht pjesa më e madhe e kompjuterëve personalë në botë (dhe shumicën e kohës) janë të zënë me përpunimin e informacionit të tekstit. Të gjitha këto lloje të informacionit në një kompjuter paraqiten në kod binar, domethënë përdoret një alfabet i fuqisë dy (vetëm dy karaktere 0 dhe 1). Kjo për faktin se është i përshtatshëm për të përfaqësuar informacionin në formën e një sekuence të impulseve elektrike: nuk ka impuls (0), ka një impuls (1).

Një kodim i tillë zakonisht quhet binar, dhe sekuencat logjike të zerove dhe njësheve quhen gjuhë makine.

Nga pikëpamja kompjuterike, teksti përbëhet nga karaktere individuale. Simbolet përfshijnë jo vetëm shkronja (të mëdha ose të vogla, latine ose ruse), por edhe numra, shenja pikësimi, karaktere të veçanta si "=", "(", "&", etj., dhe madje (kushtojini vëmendje të veçantë!) hapësira ndërmjet fjalëve.

Tekstet futen në kujtesën e kompjuterit duke përdorur tastierën. Shkronjat, numrat, shenjat e pikësimit dhe simbolet e tjera me të cilat jemi njohur janë të shkruara në taste. Ata futin RAM në kodin binar. Kjo do të thotë se çdo karakter përfaqësohet nga kodi binar 8-bit.

Tradicionalisht, për të koduar një karakter, përdoret një sasi informacioni e barabartë me 1 bajt, d.m.th. I = 1 bajt = 8 bit. Duke përdorur një formulë që lidh numrin e ngjarjeve të mundshme K dhe sasinë e informacionit I, mund të llogaritni se sa simbole të ndryshme mund të kodohen (duke supozuar se simbolet janë ngjarje të mundshme): K = 2 I = 2 8 = 256, d.m.th. përfaqësojnë informacionin e tekstit, ju mund të përdorni një alfabet me një kapacitet prej 256 karaktere.

Ky numër karakteresh është mjaft i mjaftueshëm për të përfaqësuar informacionin e tekstit, duke përfshirë shkronjat e mëdha dhe të vogla të alfabetit rus dhe latin, numrat, shenjat, simbolet grafike, etj.

Kodimi konsiston në caktimin e çdo karakteri të një kodi dhjetor unik nga 0 në 255 ose një kod binar korrespondues nga 00000000 në 11111111. Kështu, një person i dallon karakteret sipas skicës së tyre dhe një kompjuter nga kodi i tyre.

Lehtësia e kodimit të karaktereve byte-pas-byte është e dukshme sepse një bajt është pjesa më e vogël e adresueshme e memories dhe, për rrjedhojë, procesori mund të qaset në secilin karakter veçmas kur përpunon tekstin. Nga ana tjetër, 256 karaktere është një numër mjaft i mjaftueshëm për të përfaqësuar një shumëllojshmëri të gjerë informacionesh simbolike.

Në procesin e shfaqjes së një simboli në një ekran kompjuteri, kryhet procesi i kundërt - dekodimi, domethënë konvertimi i kodit të simbolit në imazhin e tij. Është e rëndësishme që caktimi i një kodi specifik për një simbol është një çështje marrëveshjeje, e cila regjistrohet në tabelën e kodit.

Tani lind pyetja, cilin kod binar tetë-bit t'i caktoni secilit karakter. Është e qartë se kjo është një çështje e kushtëzuar; ju mund të dilni me shumë metoda kodimi.

Të gjithë karakteret e alfabetit të kompjuterit numërohen nga 0 në 255. Çdo numër korrespondon me një kod binar tetë-bitësh nga 00000000 deri në 11111111. Ky kod është thjesht numri serial i karakterit në sistemin e numrave binar.

IV . Llojet e tabelave koduese

Një tabelë në të cilën të gjithë karakteret e alfabetit të kompjuterit u caktohen numra serialë quhet tabelë koduese.

Lloje të ndryshme kompjuterësh përdorin tabela të ndryshme kodimi.

Tabela e kodeve ASCII (Kodi standard amerikan për shkëmbimin e informacionit) është miratuar si një standard ndërkombëtar, duke koduar gjysmën e parë të karaktereve me kode numerike nga 0 në 127 (kodet nga 0 në 32 nuk u caktohen karaktereve, por tasteve të funksionit) .

Tabela e kodeve ASCII është e ndarë në dy pjesë.

Vetëm gjysma e parë e tabelës është standardi ndërkombëtar, d.m.th. karaktere me numra nga 0 (00000000), deri në 127 (01111111).

Struktura e tabelës koduese ASCII

Numër serik Kodi Simboli
0 - 31 00000000 - 00011111

Simbolet me numra nga 0 në 31 zakonisht quhen simbole kontrolli.

Funksioni i tyre është të kontrollojnë procesin e shfaqjes së tekstit në ekran ose printimit, tingullit të një sinjali zanor, shënimit të tekstit, etj.

32 - 127 0100000 - 01111111

Pjesa standarde e tabelës (anglisht). Këtu përfshihen shkronjat e vogla dhe të mëdha të alfabetit latin, numrat dhjetorë, shenjat e pikësimit, të gjitha llojet e kllapave, simbolet tregtare dhe të tjera.

Karakteri 32 është një hapësirë, d.m.th. pozicion bosh në tekst.

Të gjitha të tjerat pasqyrohen nga shenja të caktuara.

128 - 255 10000000 - 11111111

Pjesa alternative e tabelës (rusisht).

Gjysma e dytë e tabelës së kodeve ASCII, e quajtur faqja e kodit (128 kode, duke filluar nga 10000000 dhe duke përfunduar me 11111111), mund të ketë opsione të ndryshme, secili opsion ka numrin e vet.

Faqja e kodit përdoret kryesisht për të akomoduar alfabete kombëtare të ndryshme nga latinishtja. Në kodimet kombëtare ruse, karakteret nga alfabeti rus vendosen në këtë pjesë të tabelës.

Gjysma e parë e tabelës së kodit ASCII

Ju lutemi vini re se në tabelën e kodimit, shkronjat (të mëdha dhe të vogla) janë renditur sipas rendit alfabetik, dhe numrat janë renditur në rend rritës. Ky respektim i rendit leksikografik në renditjen e simboleve quhet parimi i kodimit sekuencial të alfabetit.

Për shkronjat e alfabetit rus, respektohet gjithashtu parimi i kodimit sekuencial.

Gjysma e dytë e tabelës së kodit ASCII

Për fat të keq, aktualisht ekzistojnë pesë kodime të ndryshme cirilike (KOI8-R, Windows. MS-DOS, Macintosh dhe ISO). Për shkak të kësaj, shpesh lindin probleme me transferimin e tekstit rus nga një kompjuter në tjetrin, nga një sistem softuer në tjetrin.

Kronologjikisht, një nga standardet e para për kodimin e shkronjave ruse në kompjuter ishte KOI8 ("Kodi i shkëmbimit të informacionit, 8-bit"). Ky kodim u përdor përsëri në vitet '70 në kompjuterët e serisë kompjuterike ES, dhe nga mesi i viteve '80 filloi të përdoret në versionet e para të rusifikuara të sistemit operativ UNIX.

Nga fillimi i viteve '90, koha e mbizotërimit të sistemit operativ MS DOS, kodimi CP866 mbetet ("CP" do të thotë "Faqja e kodit", "faqja e kodit").

Kompjuterët Apple që përdorin sistemin operativ Mac OS përdorin kodimin e tyre Mac.

Për më tepër, Organizata Ndërkombëtare e Standardeve (ISO) ka miratuar një kodim tjetër të quajtur ISO 8859-5 si standard për gjuhën ruse.

Kodimi më i zakonshëm që përdoret aktualisht është Microsoft Windows, shkurtuar CP1251. Prezantuar nga Microsoft; Duke marrë parasysh shpërndarjen e gjerë të sistemeve operative (OS) dhe produkteve të tjera softuerike të kësaj kompanie në Federatën Ruse, ajo ka gjetur një shpërndarje të gjerë.

Që nga fundi i viteve '90, problemi i standardizimit të kodimit të karaktereve është zgjidhur me prezantimin e një standardi të ri ndërkombëtar të quajtur Unicode.

Ky është një kodim 16-bit, d.m.th. cakton 2 bajt memorie për çdo karakter. Sigurisht, kjo rrit sasinë e kujtesës së zënë me 2 herë. Por një tabelë e tillë kodi lejon përfshirjen deri në 65536 karaktere. Specifikimi i plotë i standardit Unicode përfshin të gjitha alfabetet ekzistuese, të zhdukura dhe të krijuara artificialisht të botës, si dhe shumë simbole matematikore, muzikore, kimike dhe të tjera.

Paraqitja e brendshme e fjalëve në kujtesën e kompjuterit

duke përdorur një tabelë ASCII

Ndonjëherë ndodh që një tekst i përbërë nga shkronja të alfabetit rus të marrë nga një kompjuter tjetër nuk mund të lexohet - një lloj "abracadabra" është i dukshëm në ekranin e monitorit. Kjo ndodh sepse kompjuterët përdorin kodime të ndryshme të karaktereve për gjuhën ruse.

Kështu, çdo kodim specifikohet nga tabela e tij e kodit. Siç mund të shihet nga tabela, karaktere të ndryshme i caktohen të njëjtit kod binar në kodime të ndryshme.

Për shembull, sekuenca e kodeve numerike 221, 194, 204 në kodimin CP1251 formon fjalën "kompjuter", ndërsa në kodime të tjera do të jetë një grup i pakuptimtë karakteresh.

Për fat të mirë, në shumicën e rasteve përdoruesi nuk duhet të shqetësohet për transkodimin e dokumenteve tekstuale, pasi kjo bëhet nga programe të veçanta konvertuese të integruara në aplikacione.

V . Llogaritja e sasisë së informacionit të tekstit

Detyra 1: Kodoni fjalën "Romë" duke përdorur tabelat e kodimit KOI8-R dhe CP1251.

Zgjidhja:

Detyra 2: Duke supozuar se çdo karakter është i koduar në një bajt, vlerësoni vëllimin e informacionit të fjalisë së mëposhtme:

“Xhaxhai im ka rregullat më të ndershme,

Kur u sëmura rëndë,

Ai e detyroi veten të respektonte

Dhe nuk mund të mendoja për asgjë më të mirë.”

Zgjidhja: Kjo frazë ka 108 karaktere, duke përfshirë shenjat e pikësimit, thonjëzat dhe hapësirat. Ne e shumëzojmë këtë numër me 8 bit. Marrim 108*8=864 bit.

Detyra 3: Të dy tekstet përmbajnë të njëjtin numër karakteresh. Teksti i parë është shkruar në rusisht, dhe i dyti në gjuhën e fisit Naguri, alfabeti i të cilit përbëhet nga 16 karaktere. Teksti i kujt përmban më shumë informacion?

Zgjidhja:

1) I = K * a (vëllimi i informacionit të tekstit është i barabartë me produktin e numrit të karaktereve dhe peshës së informacionit të një karakteri).

2) Sepse Të dy tekstet kanë të njëjtin numër karakteresh (K), atëherë ndryshimi varet nga përmbajtja e informacionit të një karakteri të alfabetit (a).

3) 2 a1 = 32, d.m.th. a 1 = 5 bit, 2 a2 = 16, d.m.th. dhe 2 = 4 bit.

4) I 1 = K * 5 bit, I 2 = K * 4 bit.

5) Kjo do të thotë që teksti i shkruar në Rusisht përmban 5/4 herë më shumë informacion.

Detyra 4: Madhësia e mesazhit, që përmban 2048 karaktere, ishte 1/512 e një MB. Përcaktoni fuqinë e alfabetit.

Zgjidhja:

1) I = 1/512 * 1024 * 1024 * 8 = 16384 bit - konvertoi vëllimin e informacionit të mesazhit në bit.

2) a = I / K = 16384 /1024 = 16 bit - llogarit një karakter të alfabetit.

3) 2*16*2048 = 65536 karaktere – fuqia e alfabetit të përdorur.

Detyra 5: Printeri lazer Canon LBP printon me një shpejtësi mesatare prej 6,3 Kbps. Sa kohë do të duhet për të printuar një dokument me 8 faqe, nëse e dini se një faqe ka mesatarisht 45 rreshta dhe 70 karaktere për rresht (1 karakter - 1 bajt)?

Zgjidhja:

1) Gjeni sasinë e informacionit që përmban 1 faqe: 45 * 70 * 8 bit = 25200 bit

2) Gjeni sasinë e informacionit në 8 faqe: 25200 * 8 = 201600 bit

3) Ne reduktojmë në njësi të zakonshme matëse. Për ta bërë këtë, ne konvertojmë Mbit në bit: 6.3*1024=6451.2 bit/sek.

4) Gjeni kohën e printimit: 201600: 6451.2 =31 sekonda.

Bibliografi

1. Ageev V.M. Teoria e informacionit dhe kodimit: kampionimi dhe kodimi i informacionit të matjes. - M.: MAI, 1977.

2. Kuzmin I.V., Kedrus V.A. Bazat e teorisë dhe kodimit të informacionit. - Kiev, shkolla Vishcha, 1986.

3. Metodat më të thjeshta të kriptimit të tekstit / D.M. Zlatopolsky. – M.: Chistye Prudy, 2007 – 32 f.

4. Ugrinovich N.D. Shkenca kompjuterike dhe teknologjia e informacionit. Libër mësuesi për klasat 10-11 / N.D. Ugrinovich. – M.: BINOM. Laboratori i Dijes, 2003. – 512 f.

5. http://school497.spb.edu.ru/uchint002/les10/les.html#n

Përmbajtja

I. Historia e kodimit të informacionit………………………………..3

II. Kodimi i informacionit……………………………………………………4

III. Kodimi i informacionit të tekstit……………………………….4

IV. Llojet e tabelave koduese…………………………………………………………………………………………………………………

V. Llogaritja e sasisë së informacionit në tekst…………………………14

Lista e referencave………………………………..16

I . Historia e kodimit të informacionit

Njerëzimi ka përdorur enkriptimin (kodimin) e tekstit që nga momenti kur u shfaq informacioni i parë sekret. Këtu janë disa teknika të kodimit të tekstit që u shpikën në faza të ndryshme të zhvillimit të mendimit njerëzor:

Kriptografia është shkrim i fshehtë, një sistem i ndryshimit të shkrimit me qëllim që ta bëjë tekstin të pakuptueshëm për të painiciuarit;

Kodi Morse ose kodi i pabarabartë telegrafik, në të cilin çdo shkronjë ose shenjë përfaqësohet nga kombinimi i vet i shpërthimeve të shkurtra elementare të rrymës elektrike (pika) dhe shpërthimeve elementare me kohëzgjatje të trefishtë (dash);


gjuha e shenjave është një gjuhë e shenjave e përdorur nga njerëzit me dëmtim të dëgjimit.

Një nga metodat më të hershme të njohura të enkriptimit është emëruar pas perandorit romak Julius Caesar (shekulli I para Krishtit). Kjo metodë bazohet në zëvendësimin e secilës shkronjë të tekstit të koduar me një tjetër, duke zhvendosur alfabetin nga shkronja origjinale me një numër të caktuar karakteresh, dhe alfabeti lexohet në një rreth, domethënë pas shkronjës i, konsiderohet a. . Pra, fjala "byte", kur zhvendoset dy karaktere në të djathtë, kodohet si fjala "gwlf". Procesi i kundërt i deshifrimit të një fjale të caktuar është i nevojshëm për të zëvendësuar secilën shkronjë të koduar me të dytën në të majtë të saj.

II. Informacion kodues

Një kod është një grup konventash (ose sinjalesh) për regjistrimin (ose komunikimin) e disa koncepteve të paracaktuara.

Kodimi i informacionit është procesi i formimit të një përfaqësimi specifik të informacionit. Në një kuptim më të ngushtë, termi "kodim" shpesh kuptohet si një kalim nga një formë e përfaqësimit të informacionit në një tjetër, më i përshtatshëm për ruajtje, transmetim ose përpunim.

Zakonisht, çdo imazh kur kodohet (nganjëherë quhet enkriptim) përfaqësohet nga një shenjë e veçantë.

Një shenjë është një element i një grupi të fundëm elementësh të ndryshëm nga njëri-tjetri.

Në një kuptim më të ngushtë, termi "kodim" shpesh kuptohet si një kalim nga një formë e përfaqësimit të informacionit në një tjetër, më i përshtatshëm për ruajtje, transmetim ose përpunim.

Ju mund të përpunoni informacionin e tekstit në një kompjuter. Kur futet në një kompjuter, çdo shkronjë është e koduar me një numër të caktuar dhe kur del në pajisje të jashtme (ekran ose printim), imazhet e shkronjave ndërtohen nga këta numra për perceptimin e njeriut. Korrespondenca midis një grupi shkronjash dhe numrash quhet kodim i karaktereve.

Si rregull, të gjithë numrat në një kompjuter përfaqësohen duke përdorur zero dhe njëshe (jo dhjetë shifra, siç është zakonisht për njerëzit). Me fjalë të tjera, kompjuterët zakonisht funksionojnë në sistemin e numrave binar, pasi kjo i bën pajisjet për përpunimin e tyre shumë më të thjeshta. Futja e numrave në një kompjuter dhe nxjerrja e tyre për lexim njerëzor mund të bëhet në formën e zakonshme dhjetore dhe të gjitha konvertimet e nevojshme kryhen nga programet që funksionojnë në kompjuter.

III. Kodimi i informacionit të tekstit

I njëjti informacion mund të paraqitet (i koduar) në disa forma. Me ardhjen e kompjuterëve, lindi nevoja për të koduar të gjitha llojet e informacionit me të cilat merren si individi ashtu edhe njerëzimi në tërësi. Por njerëzimi filloi të zgjidhte problemin e kodimit të informacionit shumë përpara ardhjes së kompjuterëve. Arritjet madhështore të njerëzimit - shkrimi dhe aritmetika - nuk janë gjë tjetër veçse një sistem për kodimin e të folurit dhe informacionit numerik. Informacioni nuk shfaqet kurrë në formën e tij të pastër, ai gjithmonë paraqitet disi, disi i koduar.

Kodimi binar është një nga mënyrat e zakonshme të paraqitjes së informacionit. Në kompjuterë, robotë dhe makina të kontrolluara numerikisht, si rregull, i gjithë informacioni me të cilin merret pajisja kodohet në formën e fjalëve të alfabetit binar.

Që nga fundi i viteve '60, kompjuterët janë përdorur gjithnjë e më shumë për të përpunuar informacionin e tekstit, dhe aktualisht pjesa më e madhe e kompjuterëve personalë në botë (dhe shumicën e kohës) janë të zënë me përpunimin e informacionit të tekstit. Të gjitha këto lloje të informacionit në një kompjuter paraqiten në kod binar, domethënë përdoret një alfabet i fuqisë dy (vetëm dy karaktere 0 dhe 1). Kjo për faktin se është i përshtatshëm për të përfaqësuar informacionin në formën e një sekuence të impulseve elektrike: nuk ka impuls (0), ka një impuls (1).

Një kodim i tillë zakonisht quhet binar, dhe sekuencat logjike të zerove dhe njësheve quhen gjuhë makine.

Nga pikëpamja kompjuterike, teksti përbëhet nga karaktere individuale. Simbolet përfshijnë jo vetëm shkronja (të mëdha ose të vogla, latine ose ruse), por edhe numra, shenja pikësimi, karaktere të veçanta si "=", "(", "&", etj., dhe madje (kushtojini vëmendje të veçantë!) hapësira ndërmjet fjalëve.

Tekstet futen në kujtesën e kompjuterit duke përdorur tastierën. Shkronjat, numrat, shenjat e pikësimit dhe simbolet e tjera me të cilat jemi njohur janë të shkruara në taste. Ata futin RAM në kodin binar. Kjo do të thotë se çdo karakter përfaqësohet nga kodi binar 8-bit.

Tradicionalisht, për të koduar një karakter, përdoret një sasi informacioni e barabartë me 1 bajt, d.m.th. I = 1 bajt = 8 bit. Duke përdorur një formulë që lidh numrin e ngjarjeve të mundshme K dhe sasinë e informacionit I, mund të llogaritni se sa simbole të ndryshme mund të kodohen (duke supozuar se simbolet janë ngjarje të mundshme): K = 2 I = 2 8 = 256, d.m.th. përfaqësojnë informacionin e tekstit, ju mund të përdorni një alfabet me një kapacitet prej 256 karaktere.

Ky numër karakteresh është mjaft i mjaftueshëm për të përfaqësuar informacionin e tekstit, duke përfshirë shkronjat e mëdha dhe të vogla të alfabetit rus dhe latin, numrat, shenjat, simbolet grafike, etj.

Kodimi konsiston në caktimin e çdo karakteri të një kodi dhjetor unik nga 0 në 255 ose një kod binar korrespondues nga 00000000 në 11111111. Kështu, një person i dallon karakteret sipas skicës së tyre dhe një kompjuter nga kodi i tyre.

Lehtësia e kodimit të karaktereve byte-pas-byte është e dukshme sepse një bajt është pjesa më e vogël e adresueshme e memories dhe, për rrjedhojë, procesori mund të qaset në secilin karakter veçmas kur përpunon tekstin. Nga ana tjetër, 256 karaktere është një numër mjaft i mjaftueshëm për të përfaqësuar një shumëllojshmëri të gjerë informacionesh simbolike.

Në procesin e shfaqjes së një simboli në një ekran kompjuteri, kryhet procesi i kundërt - dekodimi, domethënë konvertimi i kodit të simbolit në imazhin e tij. Është e rëndësishme që caktimi i një kodi specifik për një simbol është një çështje marrëveshjeje, e cila regjistrohet në tabelën e kodit.

Tani lind pyetja, cilin kod binar tetë-bit t'i caktoni secilit karakter. Është e qartë se kjo është një çështje e kushtëzuar; ju mund të dilni me shumë metoda kodimi.

Të gjithë karakteret e alfabetit të kompjuterit numërohen nga 0 në 255. Çdo numër korrespondon me një kod binar tetë-bitësh nga 00000000 deri në 11111111. Ky kod është thjesht numri serial i karakterit në sistemin e numrave binar.

IV . Llojet e tabelave koduese

Një tabelë në të cilën të gjithë karakteret e alfabetit të kompjuterit u caktohen numra serialë quhet tabelë koduese.

Lloje të ndryshme kompjuterësh përdorin tabela të ndryshme kodimi.

Tabela e kodeve ASCII (Kodi standard amerikan për shkëmbimin e informacionit) është miratuar si një standard ndërkombëtar, duke koduar gjysmën e parë të karaktereve me kode numerike nga 0 në 127 (kodet nga 0 në 32 nuk u caktohen karaktereve, por tasteve të funksionit) .

Tabela e kodeve ASCII është e ndarë në dy pjesë.

Vetëm gjysma e parë e tabelës është standardi ndërkombëtar, d.m.th. karaktere me numra nga 0 (00000000), deri në 127 (01111111).

Struktura e tabelës koduese ASCII

Numër serik Kodi Simboli
0 - 31 00000000 - 00011111 Simbolet me numra nga 0 në 31 zakonisht quhen simbole kontrolli. Funksioni i tyre është të kontrollojnë procesin e shfaqjes së tekstit në ekran ose printimit, tingullit të një sinjali zanor, shënimit të tekstit, etj.
32 - 127 0100000 - 01111111 Pjesa standarde e tabelës (anglisht). Këtu përfshihen shkronjat e vogla dhe të mëdha të alfabetit latin, numrat dhjetorë, shenjat e pikësimit, të gjitha llojet e kllapave, simbolet tregtare dhe të tjera. Karakteri 32 është një hapësirë, d.m.th. pozicion bosh në tekst. Të gjitha të tjerat pasqyrohen nga shenja të caktuara.
128 - 255 10000000 - 11111111 Pjesa alternative e tabelës (rusisht). Gjysma e dytë e tabelës së kodeve ASCII, e quajtur faqja e kodit (128 kode, duke filluar nga 10000000 dhe duke përfunduar me 11111111), mund të ketë opsione të ndryshme, secili opsion ka numrin e vet. Faqja e kodit përdoret kryesisht për të akomoduar alfabete kombëtare të ndryshme nga latinishtja. Në kodimet kombëtare ruse, karakteret nga alfabeti rus vendosen në këtë pjesë të tabelës.

Gjysma e parë e tabelës së kodit ASCII

Ju lutemi vini re se në tabelën e kodimit, shkronjat (të mëdha dhe të vogla) janë renditur sipas rendit alfabetik, dhe numrat janë renditur në rend rritës. Ky respektim i rendit leksikografik në renditjen e simboleve quhet parimi i kodimit sekuencial të alfabetit.

Një kod është një grup konventash (ose sinjalesh) për regjistrimin (ose komunikimin) e disa koncepteve të paracaktuara.

Kodimi i informacionit është procesi i formimit të një përfaqësimi specifik të informacionit. Në një kuptim më të ngushtë, termi "kodim" shpesh kuptohet si një kalim nga një formë e përfaqësimit të informacionit në një tjetër, më i përshtatshëm për ruajtje, transmetim ose përpunim.

Zakonisht, çdo imazh kur kodohet (nganjëherë quhet enkriptim) përfaqësohet nga një shenjë e veçantë.

Një shenjë është një element i një grupi të fundëm elementësh të ndryshëm nga njëri-tjetri.

Në një kuptim më të ngushtë, termi "kodim" shpesh kuptohet si një kalim nga një formë e përfaqësimit të informacionit në një tjetër, më i përshtatshëm për ruajtje, transmetim ose përpunim.

Një kompjuter mund të përpunojë vetëm informacionin e paraqitur në formë numerike. Të gjitha informacionet e tjera (për shembull, tingujt, imazhet, leximet e instrumenteve, etj.) duhet të shndërrohen në formë numerike për përpunim në kompjuter. Për shembull, për të përcaktuar sasinë e një tingulli muzikor, mund të matet intensiteti i tingullit në frekuenca specifike në intervale të shkurtra, duke përfaqësuar rezultatet e secilës matje në formë numerike. Duke përdorur programe kompjuterike, ju mund të transformoni informacionin e marrë, për shembull, "superpozoni" tingujt nga burime të ndryshme mbi njëra-tjetrën.

Në mënyrë të ngjashme, informacioni i tekstit mund të përpunohet në një kompjuter. Kur futet në një kompjuter, çdo shkronjë është e koduar me një numër të caktuar dhe kur del në pajisje të jashtme (ekran ose printim), imazhet e shkronjave ndërtohen nga këta numra për perceptimin e njeriut. Korrespondenca midis një grupi shkronjash dhe numrash quhet kodim i karaktereve.

Si rregull, të gjithë numrat në një kompjuter përfaqësohen duke përdorur zero dhe njëshe (jo dhjetë shifra, siç është zakonisht për njerëzit). Me fjalë të tjera, kompjuterët zakonisht funksionojnë në sistemin e numrave binar, pasi kjo i bën pajisjet për përpunimin e tyre shumë më të thjeshta. Futja e numrave në një kompjuter dhe nxjerrja e tyre për lexim njerëzor mund të bëhet në formën e zakonshme dhjetore dhe të gjitha konvertimet e nevojshme kryhen nga programet që funksionojnë në kompjuter.

Metodat e kodimit të informacionit.

I njëjti informacion mund të paraqitet (i koduar) në disa forma. Me ardhjen e kompjuterëve, lindi nevoja për të koduar të gjitha llojet e informacionit me të cilat merren si individi ashtu edhe njerëzimi në tërësi. Por njerëzimi filloi të zgjidhte problemin e kodimit të informacionit shumë përpara ardhjes së kompjuterëve. Arritjet madhështore të njerëzimit - shkrimi dhe aritmetika - nuk janë gjë tjetër veçse një sistem për kodimin e të folurit dhe informacionit numerik. Informacioni nuk shfaqet kurrë në formën e tij të pastër, ai gjithmonë paraqitet disi, disi i koduar.

Kodimi binar është një nga mënyrat e zakonshme të paraqitjes së informacionit. Në kompjuterë, robotë dhe makina të kontrolluara numerikisht, si rregull, i gjithë informacioni me të cilin merret pajisja kodohet në formën e fjalëve të alfabetit binar.

Kodimi i informacionit simbolik (tekst).

Operacioni kryesor i kryer në karaktere individuale të tekstit është krahasimi i karaktereve.

Kur krahasoni karakteret, aspektet më të rëndësishme janë unike e kodit për çdo karakter dhe gjatësia e këtij kodi, dhe zgjedhja e parimit të kodimit në vetvete është praktikisht e parëndësishme.

Tabelat e ndryshme të konvertimit përdoren për të koduar tekstet. Është e rëndësishme që e njëjta tabelë të përdoret gjatë kodimit dhe dekodimit të të njëjtit tekst.

Tabela e konvertimit është një tabelë që përmban një listë të karaktereve të koduara të renditura në një farë mënyre, sipas të cilave karakteri konvertohet në kodin e tij binar dhe mbrapa.

Tabelat më të njohura të konvertimit: DKOI-8, ASCII, CP1251, Unicode.

Historikisht, 8 bit ose 1 bajt u zgjodh si gjatësia e kodit për kodimin e karaktereve. Prandaj, më shpesh një karakter i tekstit të ruajtur në një kompjuter korrespondon me një bajt memorie.

Me një gjatësi kodi prej 8 bit, mund të ketë 28 = 256 kombinime të ndryshme të 0 dhe 1, kështu që jo më shumë se 256 karaktere mund të kodohen duke përdorur një tabelë konvertimi. Me një gjatësi kodi prej 2 bajt (16 bit), mund të kodohen 65536 karaktere.

Kodimi i informacionit numerik.

Ngjashmëria në kodimin e informacionit numerik dhe tekstual është si më poshtë: për të krahasuar të dhënat e këtij lloji, numra të ndryshëm (si dhe karaktere të ndryshme) duhet të kenë një kod të ndryshëm. Dallimi kryesor midis të dhënave numerike dhe të dhënave simbolike është se përveç operacionit të krahasimit, në numra kryhen veprime të ndryshme matematikore: mbledhje, shumëzim, nxjerrje rrënjësh, llogaritje logaritmi etj. Rregullat për kryerjen e këtyre veprimeve në matematikë janë zhvilluar në detaje. për numrat e përfaqësuar në sistemin e numrave pozicional.

Sistemi bazë i numrave për paraqitjen e numrave në një kompjuter është sistemi i numrave pozicional binar.

Kodimi i informacionit të tekstit

Aktualisht, shumica e përdoruesve përdorin një kompjuter për të përpunuar informacionin e tekstit, i cili përbëhet nga simbole: shkronja, numra, shenja pikësimi, etj. Le të llogarisim sa simbole dhe sa bit na duhen.

10 numra, 12 shenja pikësimi, 15 simbole aritmetike, shkronja të alfabetit rus dhe latin, TOTALI: 155 karaktere, që korrespondojnë me 8 bit informacioni.

Njësitë e matjes së informacionit.

1 bajt = 8 bit

1 KB = 1024 bajt

1 MB = 1024 KB

1 GB = 1024 MB

1 TB = 1024 GB

Thelbi i kodimit është që çdo karakteri i caktohet një kod binar nga 00000000 në 11111111 ose një kod dhjetor përkatës nga 0 në 255.

Duhet mbajtur mend se aktualisht përdoren pesë tabela të ndryshme kodesh për të koduar shkronjat ruse (KOI - 8, CP1251, CP866, Mac, ISO), dhe tekstet e koduara duke përdorur një tabelë nuk do të shfaqen saktë në një tjetër

Shfaqja kryesore e kodimit të karaktereve është kodi ASCII - Kodi Standard Amerikan për Shkëmbimin e Informacionit, i cili është një tabelë 16 me 16 ku karakteret janë të koduar në shënimin heksadecimal.

Kodimi i informacionit grafik.

Një hap i rëndësishëm në kodimin e një imazhi grafik është ndarja e tij në elemente diskrete (kampionimi).

Mënyrat kryesore për të paraqitur grafikën për ruajtje dhe përpunim duke përdorur një kompjuter janë imazhet raster dhe vektoriale

Një imazh vektorial është një objekt grafik i përbërë nga forma gjeometrike elementare (më shpesh segmente dhe harqe). Pozicioni i këtyre segmenteve elementare përcaktohet nga koordinatat e pikave dhe rrezes. Për çdo rresht, kodet binare tregohen për llojin e linjës (të ngurtë, me pika, me pika), trashësinë dhe ngjyrën.

Një imazh raster është një koleksion pikash (pikselë) të marra si rezultat i kampionimit të imazhit në përputhje me parimin e matricës.

Parimi i matricës i kodimit të imazheve grafike është se imazhi ndahet në një numër të caktuar rreshtash dhe kolonash. Pastaj çdo element i rrjetit që rezulton kodohet sipas rregullit të zgjedhur.

Pixel (elementi i figurës) është njësia minimale e një imazhi, ngjyra dhe shkëlqimi i të cilit mund të vendosen në mënyrë të pavarur nga pjesa tjetër e figurës.

Në përputhje me parimin e matricës, imazhet ndërtohen, dalin në printer, shfaqen në ekranin e ekranit dhe merren duke përdorur një skaner.

Sa më e lartë të jetë cilësia e imazhit, aq më të dendura janë pikselët, domethënë, aq më e lartë është rezolucioni i pajisjes dhe aq më saktë është koduar ngjyra e secilës prej tyre.

Për një imazh bardh e zi, kodi i ngjyrave për çdo piksel specifikohet me një bit.

Nëse fotografia është me ngjyrë, atëherë për secilën pikë specifikohet një kod binar për ngjyrën e saj.

Meqenëse ngjyrat janë të koduara në kodin binar, nëse, për shembull, dëshironi të përdorni një foto me 16 ngjyra, atëherë do t'ju nevojiten 4 bit (16=24) për të koduar çdo piksel, dhe nëse është e mundur të përdorni 16 bit (2 bytes) për të koduar ngjyrën një piksel, atëherë mund të transmetoni 216 = 65536 ngjyra të ndryshme. Përdorimi i tre bajteve (24 bit) për të koduar ngjyrën e një pike të vetme ju lejon të pasqyroni 16,777,216 (ose rreth 17 milion) nuanca të ndryshme ngjyrash - e ashtuquajtura modaliteti "ngjyra e vërtetë". Vini re se këto përdoren aktualisht, por janë larg aftësive maksimale të kompjuterëve modernë.

Kodimi i informacionit audio.

Nga kursi juaj i fizikës ju e dini se tingulli është dridhje ajri. Nga natyra e tij, zëri është një sinjal i vazhdueshëm. Nëse e shndërrojmë tingullin në një sinjal elektrik (për shembull, duke përdorur një mikrofon), do të shohim që tensioni të ndryshojë pa probleme me kalimin e kohës.

Për përpunimin kompjuterik, një sinjal analog duhet disi të shndërrohet në një sekuencë numrash binarë, dhe për ta bërë këtë duhet të merret kampion dhe të digjitalizohet.

Mund të bëni sa më poshtë: matni amplituda e sinjalit në intervale të rregullta dhe shkruani vlerat numerike që rezultojnë në kujtesën e kompjuterit.

Kodimi i informacionit të tekstit në një kompjuter ndonjëherë është një kusht thelbësor për funksionimin e saktë të një pajisjeje ose shfaqjen e një fragmenti të caktuar. Si ndodh ky proces gjatë funksionimit të një kompjuteri me tekst dhe informacion vizual, zë - ne do t'i analizojmë të gjitha këto në këtë artikull.

Prezantimi

Një kompjuter elektronik (që ne e quajmë kompjuter në jetën e përditshme) e percepton tekstin në një mënyrë shumë specifike. Për të, kodimi i informacionit të tekstit është shumë i rëndësishëm, pasi ajo e percepton çdo fragment teksti si një grup simbolesh të izoluara nga njëri-tjetri.

Cilat janë simbolet?

Jo vetëm shkronjat ruse, anglisht dhe të tjera veprojnë si simbole për një kompjuter, por edhe shenjat e pikësimit dhe karaktere të tjera. Edhe hapësira që përdorim për të ndarë fjalët kur shtypim në kompjuter perceptohet nga pajisja si një simbol. Në një farë mënyre ajo të kujton shumë matematikën e lartë, sepse atje, sipas shumë profesorëve, zeroja ka një kuptim të dyfishtë: është edhe një numër dhe në të njëjtën kohë nuk do të thotë asgjë. Edhe për filozofët, çështja e hapësirës së bardhë mund të jetë një çështje urgjente. Një shaka, sigurisht, por, siç thonë ata, ka një të vërtetë në çdo shaka.

Çfarë lloj informacioni ka?

Pra, për të perceptuar informacionin, kompjuteri duhet të fillojë proceset e përpunimit. Çfarë lloj informacioni ka gjithsesi? Tema e këtij artikulli është kodimi i informacionit tekstual. Ne do t'i kushtojmë vëmendje të veçantë kësaj detyre, por do të merremi edhe me mikrotema të tjera.

Informacioni mund të jetë tekst, numerik, audio, grafik. Kompjuteri duhet të ekzekutojë procese që kodojnë informacionin tekstual në mënyrë që të shfaqë në ekran atë që ne, për shembull, shkruajmë në një tastierë. Do të shohim simbole dhe shkronja, kjo është e kuptueshme. Çfarë sheh makina? Ajo e percepton absolutisht të gjithë informacionin - dhe tani nuk po flasim vetëm për tekst - si një sekuencë të caktuar zero dhe njësh. Ato formojnë bazën e të ashtuquajturit kod binar. Prandaj, procesi që konverton informacionin e marrë nga pajisja në diçka që mund ta kuptojë quhet "kodim binar i informacionit të tekstit".

Parimi i shkurtër i funksionimit të kodit binar

Pse kodimi binar i informacionit është më i përhapur në makinat elektronike? Baza e tekstit, e cila është e koduar duke përdorur zero dhe njëshe, mund të jetë absolutisht çdo sekuencë simbolesh dhe shenjash. Megjithatë, ky nuk është avantazhi i vetëm që ka kodimi binar i tekstit të informacionit. Puna është se parimi mbi të cilin bazohet kjo metodë kodimi është shumë i thjeshtë, por në të njëjtën kohë mjaft funksional. Kur ka një impuls elektrik, ai shënohet (me kusht, natyrisht) me një njësi. Nuk ka impuls - të shënuar me zero. Kjo do të thotë, kodimi i tekstit të informacionit bazohet në parimin e ndërtimit të një sekuence të impulseve elektrike. Një sekuencë logjike e përbërë nga simbole të kodit binar quhet gjuhë makine. Në të njëjtën kohë, kodimi dhe përpunimi i informacionit të tekstit duke përdorur kodin binar lejon që operacionet të kryhen në një periudhë mjaft të shkurtër kohore.

Bit dhe bajt

Një numër i perceptuar nga një makinë përmban një sasi të caktuar informacioni. Është e barabartë me një bit. Kjo vlen për çdo një dhe çdo zero që përbëjnë një ose një sekuencë tjetër informacioni të koduar.

Prandaj, sasia e informacionit në çdo rast mund të përcaktohet thjesht duke ditur numrin e karaktereve në sekuencën e kodit binar. Ata do të jenë numerikisht të barabartë me njëri-tjetrin. 2 shifra në kod përmbajnë 2 bit informacion, 10 shifra - 10 bit, e kështu me radhë. Parimi i përcaktimit të vëllimit të informacionit që shtrihet në një fragment të veçantë të kodit binar është mjaft i thjeshtë, siç mund ta shihni.

Kodimi i informacionit të tekstit në një kompjuter

Tani për tani po lexoni një artikull që përbëhet nga një sekuencë, siç besojmë ne, shkronjat e alfabetit rus. Dhe kompjuteri, siç u përmend më herët, i percepton të gjitha informacionet (dhe në këtë rast gjithashtu) si një sekuencë jo shkronjash, por zero dhe njësh, që tregon mungesën dhe praninë e një impulsi elektrik.

Puna është se ju mund të kodoni një karakter që ne shohim në ekran duke përdorur një njësi matëse konvencionale të quajtur bajt. Siç është shkruar më sipër, kodi binar ka një të ashtuquajtur ngarkesë informacioni. Le të kujtojmë se numerikisht është i barabartë me numrin total të zerove dhe njësheve në fragmentin e kodit të zgjedhur. Pra, 8 bit bëjnë 1 bajt. Kombinimet e sinjaleve mund të jenë shumë të ndryshme, siç mund të shihet lehtësisht duke vizatuar një drejtkëndësh në letër të përbërë nga 8 qeliza me madhësi të barabartë.

Rezulton se informacioni i tekstit mund të kodohet duke përdorur një alfabet me një kapacitet prej 256 karakteresh. Ç'kuptim ka? Kuptimi qëndron në faktin se çdo karakter do të ketë kodin e tij binar. Kombinimet "të lidhura" me karaktere të caktuara fillojnë nga 00000000 dhe përfundojnë me 11111111. Nëse kaloni nga sistemi binar në atë dhjetor, atëherë mund të kodoni informacionin në një sistem të tillë nga 0 në 255.

Mos harroni se tani ka tabela të ndryshme që përdorin kodimin e shkronjave të alfabetit rus. Këto janë, për shembull, ISO dhe KOI-8, Mac dhe CP në dy variacione: 1251 dhe 866. Është e lehtë të sigurohesh që teksti i koduar në njërën nga këto tabela nuk do të shfaqet saktë në një kodim tjetër përveç këtij. Kjo për faktin se në tabela të ndryshme simbole të ndryshme korrespondojnë me të njëjtin kod binar.

Ky ishte një problem në fillim. Megjithatë, në ditët e sotme programet tashmë kanë të integruar algoritme speciale që konvertojnë tekstin, duke e sjellë atë në formën e duhur. 1997 u shënua nga krijimi i një kodimi të quajtur Unicode. Në të, çdo karakter ka 2 bajt në dispozicion të tij. Kjo ju lejon të kodoni tekstin me një numër shumë më të madh karakteresh. 256 dhe 65536: a ka ndonjë ndryshim?

Kodimi grafik

Teksti i kodimit dhe informacioni grafik ka disa ngjashmëri. Siç e dini, një pajisje periferike kompjuterike e quajtur "monitor" përdoret për të shfaqur informacionin grafik. Grafika tani (po flasim për grafikën kompjuterike tani) përdoret gjerësisht në fusha të ndryshme. Për fat të mirë, aftësitë harduerike të kompjuterëve personalë bëjnë të mundur zgjidhjen e problemeve mjaft komplekse grafike.

Përpunimi i informacionit video është bërë i mundur vitet e fundit. Por teksti është shumë "më i lehtë" se grafika, gjë që, në parim, është e kuptueshme. Për shkak të kësaj, madhësia përfundimtare e skedarëve grafikë duhet të rritet. Probleme të tilla mund të tejkalohen duke ditur thelbin në të cilin paraqitet informacioni grafik.

Së pari, le të kuptojmë se në cilat grupe ndahet ky lloj informacioni. Së pari, është raster. Së dyti, vektor.

Imazhet raster janë mjaft të ngjashme me letrën me kuadrate. Çdo qelizë në letër të tillë është e lyer me një ngjyrë ose një tjetër. Ky parim të kujton disi një mozaik. Kjo do të thotë, rezulton se në grafikat raster imazhi ndahet në pjesë të veçanta elementare. Ata quhen pixel. Përkthyer në Rusisht, pikselët do të thotë "pika". Është logjike që pikselët të renditen në lidhje me linjat. Rrjeti grafik përbëhet nga vetëm një numër i caktuar pikselësh. Quhet edhe raster. Duke marrë parasysh këto dy përkufizime, mund të themi se një imazh raster nuk është gjë tjetër veçse një koleksion pikselësh që shfaqen në një rrjet drejtkëndor.

Rasteri i monitorit dhe madhësia e pikselit ndikojnë në cilësinë e imazhit. Sa më i madh rasteri i monitorit, aq më i lartë do të jetë. Madhësitë e rasterëve janë rezolucioni i ekranit, për të cilin çdo përdorues ndoshta ka dëgjuar. Një nga karakteristikat më të rëndësishme që kanë ekranet e kompjuterëve është rezolucioni, jo vetëm rezolucioni. Tregon sa piksel ka për njësi gjatësi. Në mënyrë tipike, rezolucioni i monitorit matet në piksel për inç. Sa më shumë piksel për njësi gjatësi, aq më e lartë do të jetë cilësia, pasi "kokrriza" është zvogëluar.

Përpunimi i transmetimit të audios

Kodimi i informacionit të tekstit dhe audios, si llojet e tjera të kodimit, ka disa veçori. Tani do të flasim për procesin e fundit: kodimin e informacionit audio.

Paraqitja e një transmetimi audio (si dhe një tingull individual) mund të prodhohet duke përdorur dy metoda.

Forma analoge e paraqitjes së informacionit audio

Në këtë rast, sasia mund të marrë një numër vërtet të madh vlerash të ndryshme. Për më tepër, të njëjtat vlera nuk mbeten konstante: ato ndryshojnë shumë shpejt dhe ky proces është i vazhdueshëm.

Forma diskrete e paraqitjes së informacionit audio

Nëse flasim për metodën diskrete, atëherë në këtë rast sasia mund të marrë vetëm një numër të kufizuar vlerash. Në këtë rast, ndryshimi ndodh në mënyrë spazmatike. Ju mund të kodoni në mënyrë diskrete jo vetëm informacionin audio, por edhe grafik. Sa për formën analoge, nga rruga.

Informacioni audio analog ruhet, për shembull, në pllaka vinili. Por CD-ja është tashmë një mënyrë diskrete e paraqitjes së informacionit audio.

Në fillim folëm për faktin se kompjuteri i percepton të gjitha informacionet në gjuhën e makinës. Për ta bërë këtë, informacioni është i koduar në formën e një sekuence të impulseve elektrike - zero dhe njëshe. Kodimi i informacionit audio nuk bën përjashtim nga ky rregull. Për të përpunuar zërin në një kompjuter, së pari duhet ta ktheni atë në atë sekuencë. Vetëm pas kësaj mund të kryhen operacione në një rrymë ose një tingull të vetëm.

Kur ndodh procesi i kodimit, transmetimi i nënshtrohet kampionimit të kohës. Vala e zërit është e vazhdueshme; ajo zhvillohet në periudha të vogla kohore. Vlera e amplitudës vendoset veçmas për çdo interval specifik.

konkluzioni

Pra, çfarë zbuluam gjatë këtij artikulli? Së pari, absolutisht të gjitha informacionet që shfaqen në një monitor kompjuteri janë të koduara përpara se të shfaqen atje. Së dyti, ky kodim përfshin përkthimin e informacionit në gjuhën e makinës. Së treti, gjuha e makinës nuk është gjë tjetër veçse një sekuencë e impulseve elektrike - zero dhe njësh. Së katërti, ka tabela të veçanta për kodimin e karaktereve të ndryshme. Dhe, së pesti, informacioni grafik dhe zanor mund të paraqitet në formë analoge dhe diskrete. Këtu, ndoshta, janë pikat kryesore që kemi diskutuar. Një nga disiplinat që studion këtë fushë është shkenca kompjuterike. Kodimi i informacionit tekstual dhe bazat e tij shpjegohen në shkollë, pasi nuk ka asgjë të komplikuar në të.

Artikujt më të mirë mbi këtë temë