Kako podesiti pametne telefone i računare. Informativni portal
  • Dom
  • Programi
  • Sintaktička mjera informacije. Kodiranje tekstualnih podataka

Sintaktička mjera informacije. Kodiranje tekstualnih podataka

Prilikom implementacije informacionih procesa uvijek dolazi do prijenosa informacija u prostoru i vremenu od izvora informacije do primaoca (primaoca). Istovremeno, za prenošenje informacija koriste se različiti znakovi ili simboli, na primjer, prirodni ili umjetni (formalni) jezik, omogućavajući njihovo izražavanje u nekom obliku koji se zove poruka.

Poruka- oblik predstavljanja informacija u obliku skupa znakova (simbola) koji se koriste za prenos.

Poruka kao skup znakova sa stanovišta semiotike ( sa grčkog setneion - znak, znak) - nauka koja proučava svojstva znakova i znakovnih sistema - može se proučavati na tri nivoa:

1) sintaktički , gdje se razmatraju interna svojstva poruka, odnosno odnosi između znakova koji odražavaju strukturu datog znakovnog sistema. Eksterna svojstva se proučavaju na semantičkom i pragmatičkom nivou. Na ovom nivou razmatraju se problemi dostave poruke primaocu kao skupa znakova, uzimajući u obzir vrstu medija i način prezentovanja informacija, brzinu prenosa i obrade, veličinu kodova za predstavljanje informacija, pouzdanost. i tačnost konverzije ovih kodova itd., potpuno apstrahujući od semantičkog sadržaja poruka i njihove namjene. Na ovom nivou, informacije koje se razmatraju samo sa sintaktičkih pozicija obično se nazivaju podacima, pošto semantička strana u ovom slučaju nije bitna.

Moderna teorija informacija uglavnom istražuje probleme ovog nivoa. Oslanja se na koncept „količine informacija“, koji je mjera učestalosti upotrebe znakova, koja ni na koji način ne odražava ni značenje ni važnost poruka koje se prenose. S tim u vezi, ponekad se kaže da je moderna teorija informacija na sintaksičkom nivou.

2) semantički , koji analizira odnos između znakova i objekata, radnji, kvaliteta koje oni označavaju, odnosno semantički sadržaj poruke, njen odnos prema izvoru informacije. Problemi semantičkog nivoa odnose se na formalizaciju i uzimanje u obzir značenja prenesene informacije, određivanje stepena korespondencije između slike objekta i samog objekta. Na ovom nivou analiziraju se informacije koje informacije odražavaju, razmatraju semantički odnosi, formiraju pojmovi i ideje, otkriva se značenje i sadržaj informacije i vrši njena generalizacija.

3) pragmatičan , gdje se razmatra odnos između poruke i primaoca, odnosno potrošački sadržaj poruke, njen odnos prema primaocu.

Na ovom nivou, od interesa su posledice dobijanja i korišćenja ovih informacija od strane potrošača. Problemi na ovom nivou odnose se na utvrđivanje vrijednosti i korisnosti korištenja informacija u donošenju odluke potrošača za postizanje svog cilja. Glavna poteškoća ovdje je u tome što vrijednost, korisnost informacija može biti potpuno različita za različite primaoce i, osim toga, ovisi o nizu faktora, kao što je, na primjer, pravovremenost njihove dostave i korištenja.


Za svaki od navedenih nivoa problema prijenosa informacija postoje pristupi mjerenju količine informacija i vlastita mjerenja informacija. Postoje, respektivno, mjere informacija na sintaksičkom nivou, semantičkom nivou i pragmatičkom nivou.

Mjere informacija o sintaksičkom nivou. Kvantitativna procjena informacija na ovom nivou nije povezana sa sadržajem informacije, već operiše bezličnim informacijama koje ne izražavaju semantičku vezu prema objektu. S tim u vezi, ova mjera omogućava procjenu tokova informacija u objektima različite prirode kao što su komunikacioni sistemi, kompjuteri, sistemi upravljanja, nervni sistem živog organizma itd.

Za mjerenje informacija na sintaksičkom nivou uvode se dva parametra: količina informacija (podataka) - V d(volumetrijski pristup) i količina informacija - I(entropijski pristup).

Količina informacija V d (volumetrijski pristup). Prilikom implementacije informacijskih procesa, informacija se prenosi u obliku poruke, koja je skup znakova nekog alfabeta. Štaviše, svaki novi znak u poruci povećava količinu informacija predstavljenih nizom znakova date abecede. Ako se sada količina informacija sadržanih u poruci od jednog znaka uzme kao jedna, tada će količina informacija (podataka) V d u bilo kojoj drugoj poruci biti jednaka broju znakova (cifara) u ovoj poruci. Budući da se ista informacija može predstaviti na mnogo različitih načina (koristeći različite alfabete), jedinica informacije (podaci) će se u skladu s tim promijeniti.

Dakle, u decimalnom brojevnom sistemu, jedna cifra ima težinu jednaku 10, i, shodno tome, jedinica informacije će biti dit (decimalno mjesto P P dit. Na primjer, četverocifreni broj 2009 ima volumen podataka od V d = 4 dit.

U binarnom brojevnom sistemu, jedna cifra ima težinu jednaku 2 i, shodno tome, jedinica informacije će biti bit (bit (binarna cifra)). U ovom slučaju, poruka u obrascu n-bitni broj ima količinu podataka V d = P bit. Na primjer, osmobitni binarni kod 11001011 ima volumen podataka V d = 8 bita.

U modernom računarstvu, zajedno sa minimalnom jedinicom merenja podataka bit najčešće korištena agregirana mjerna jedinica bajt, jednako 8 bita. To je osam bitova koji su potrebni za kodiranje bilo kojeg od 256 znakova abecede kompjuterske tastature (256=28).

Kada se radi s velikim količinama informacija, za izračunavanje njihove količine koriste se veće mjerne jedinice:

1 kilobajt (KB) = 1024 bajta = 2 10 bajtova,

1 megabajt (MB) = 1024 KB = 220 bajtova = 1,048,576 bajtova;

1 gigabajt (GB) = 1024 MB = 230 bajtova = 1,073,741,824 bajtova;

U posljednje vrijeme, zbog povećanja obima obrađenih informacija, izvedene su jedinice kao što su:

1 terabajt (TB) = 1024 GB = 240 bajtova = 1,099,511,627,776 bajtova;

1 petabajt (PB) = 1024 TB = 250 bajtova = 1,125,899,906,842,624 bajtova.

Treba napomenuti da se u binarnom (kompjuterskom) sistemu mjerenja informacija, za razliku od metričkog sistema, jedinice s prefiksima "kilo", "mega" itd. dobijaju množenjem glavne jedinice ne sa 10 3 = 1000, 10 6 = 1.000.000, itd., a na 2 10 = 1024, 2 20 = 1.048.576, itd.

Količina informacija I (entropijski pristup). U teoriji informacija i kodiranja usvojen je entropijski pristup mjerenju informacija. Ovaj pristup se zasniva na činjenici da je činjenica dobijanja informacija uvek povezana sa smanjenjem diverziteta ili neizvesnosti (entropije) sistema. Na osnovu ovoga, količina informacija u poruci je definisana kao mjera za smanjenje nesigurnosti stanja datog sistema nakon prijema poruke. Nesigurnost se može tumačiti u smislu koliko malo posmatrač zna o datom sistemu. Čim je posmatrač identifikovao nešto u fizičkom sistemu, entropija sistema se smanjivala, jer je sistem postajao sve uređeniji za posmatrača.

Dakle, sa entropijskim pristupom Pod informacijom se podrazumijeva kvantitativna vrijednost nesigurnosti koja je nestala u toku nekog procesa (testiranja, mjerenja, itd.). U ovom slučaju, entropija se uvodi kao mjera neizvjesnosti H, a količina informacija je:

I = H apr – H aps

gdje je, H apr - a priori entropija o stanju sistema ili procesa koji se proučava;

H aps je a posteriori entropija.

A posteriori (od lat. a posteriori - iz sljedećeg) - proizilaze iz iskustva (testiranja, mjerenja).

A priori (od lat. a priori - iz prethodnog) je pojam koji karakterizira znanje koje prethodi iskustvu (test) i neovisno je o njemu.

U slučaju kada je tokom testa uklonjena postojeća nesigurnost (dobijen je specifičan rezultat, tj. H = 0), količina primljene informacije poklapa se sa početnom entropijom

Razmotrimo diskretni izvor informacija (izvor diskretnih poruka) kao sistem koji se proučava, pod kojim mislimo na fizički sistem koji ima konačan skup mogućih stanja ( a i}, i = .

Sve je spremno A \u003d (a 1, a 2, ... i n) stanja sistema u teoriji informacija naziva se apstraktna abeceda ili abeceda izvora poruke.

Odvojene države a 1 , a 2 ,..., a n nazivaju se slovima ili simbolima abecede.

Takav sistem može nasumično uzeti jedno od konačnih skupova mogućih stanja u svakom trenutku vremena a i. Kaže se da se različita stanja ostvaruju kao rezultat njihovog izbora od strane izvora.

Primalac informacije (poruke) ima određenu ideju o mogućem nastanku određenih događaja. Ove reprezentacije su uglavnom nepouzdane i izražene su verovatnoćama sa kojima on očekuje ovaj ili onaj događaj. Opću mjeru neizvjesnosti (entropiju) karakterizira neka matematička ovisnost o ovim vjerovatnoćama, količina informacija u poruci je određena time koliko se mjera nesigurnosti smanjuje nakon prijema poruke.

Objasnimo ovu ideju na primjeru.

Pretpostavimo da imamo 32 različite karte. Mogućnost izbora jedne karte iz špila je 32. Prije nego što napravite izbor, prirodno je pretpostaviti da su šanse za odabir određene karte jednake za sve karte. Donošenjem izbora eliminišemo ovu nesigurnost. U ovom slučaju, neizvjesnost se može okarakterizirati brojem mogućih jednako vjerovatnih izbora. Ako sada definiramo količinu informacija kao mjeru eliminacije nesigurnosti, tada se informacija dobijena kao rezultat izbora može okarakterizirati brojem 32. Međutim, prikladnije je koristiti ne sam ovaj broj, već logaritam procjena dobijena gore u bazi 2:

gdje je m broj mogućih jednako vjerovatnih izbora (Kada je m=2, dobijamo informaciju u jednom bitu). To jest, u našem slučaju

H = log 2 32 = 5.

Navedeni pristup pripada engleskom matematičaru R. Hartleyju (1928). Ima zanimljivo tumačenje. Odlikuje se brojem pitanja sa odgovorima „da“ ili „ne“, što vam omogućava da odredite koju je kartu osoba odabrala. 5 pitanja je dovoljno.

Ako pri odabiru kartice mogućnost pojave svake kartice nije ista (više vjerovatna), onda se dobija statistički pristup mjerenju informacija koji je predložio C. Shannon (1948). U ovom slučaju, mjera informacija se mjeri formulom:

gdje pi- vjerovatnoća izbora i znak abecede.

Lako je to vidjeti ako su vjerovatnoće p1, ..., p n su jednaki, onda je svaki od njih 1/N, a Shanonova formula se pretvara u Hartleyjevu formulu.

Mjere informacija na semantičkom nivou. Za mjerenje semantičkog sadržaja informacije, odnosno njenog kvantiteta na semantičkom nivou, najčešće se koristi mjera tezaurusa, koja povezuje semantička svojstva informacije sa mogućnošću korisnika da primi dolaznu poruku. Zaista, da bi razumio i koristio primljene informacije, primalac mora imati određenu količinu znanja. Potpuno nepoznavanje teme ne dozvoljava izvlačenje korisnih informacija iz primljene poruke o ovoj temi. Kako znanje o temi raste, raste i količina korisnih informacija izvučenih iz poruke.

Ako primateljevo znanje o datom predmetu nazovemo tezaurusom (tj. određeni skup riječi, pojmova, imena objekata povezanih semantičkim vezama), tada se količina informacija sadržana u određenoj poruci može procijeniti stepenom promjene. u individualnom tezaurusu pod uticajem ove poruke.

Tezaurus- skup informacija koje korisnik ili sistem ima.

Drugim riječima, količina semantičke informacije koju primatelj izdvaja iz dolaznih poruka zavisi od stepena pripremljenosti njegovog tezaurusa za percepciju takvih informacija.

Ovisno o odnosu semantičkog sadržaja informacija S i korisnički tezaurus Sp količina semantičkih informacija se mijenja I s, koje korisnik percipira i uključuje u budućnosti u svoj tezaurus. Priroda ove zavisnosti je prikazana na Sl. 2.1. Razmotrimo dva granična slučaja, kada je količina semantičke informacije Ic jednaka 0:

a) kada je Sp = 0, korisnik ne percipira (ne razumije) dolaznu informaciju;

b) za S -> ∞, korisnik „sve zna“, i nisu mu potrebne dolazne informacije.

Rice. 1.2. Ovisnost količine semantičkih informacija,

percipira potrošač, iz njegovog tezaurusa I c \u003d f (S p)

Potrošač stječe maksimalnu količinu semantičke informacije kada upari njen semantički sadržaj S sa svojim tezaurusom S p (S = S p opt), kada je dolazna informacija razumljiva korisniku i donosi mu ranije nepoznate (nedostajuće u njegovom tezaurusu) informacije.

Stoga je količina semantičkih informacija u poruci, količina novog znanja koje je primio korisnik, relativna vrijednost. Ista poruka može imati značenje za kompetentnog korisnika i biti besmislena za nekompetentnog korisnika.

Prilikom evaluacije semantičkog (smislenog) aspekta informacije potrebno je nastojati uskladiti vrijednosti S i Sp.

Relativna mjera količine semantičke informacije može biti faktor sadržaja C, koji je definiran kao omjer količine semantičke informacije i njenog volumena:

C \u003d I s / V d

Mjere informacija na pragmatičnom nivou. Ova mjera određuje korisnost informacija za postizanje cilja korisnika. Ova mjera je također relativna vrijednost, zbog specifičnosti korištenja ovih informacija u određenom sistemu.

Jedan od prvih ruskih naučnika, A.A. Kharkevich, koji je predložio da se kao mjera vrijednosti informacija uzme količina informacija neophodna za postizanje cilja, odnosno da se izračuna povećanje vjerovatnoće postizanja cilja. Dakle, ako je prije primanja informacije vjerovatnoća postizanja cilja bila jednaka p 0, a nakon prijema - p 1, tada se vrijednost informacije određuje kao logaritam omjera p 1 / p 0:

I \u003d log 2 p 1 - log 2 p 0 \u003d log 2 (p 1 / p 0)

Dakle, vrijednost informacije se mjeri u jedinicama informacija, u ovom slučaju u bitovima.

Kada se procjenjuje informacija, postoje njeni aspekti kao što su sintaktički, semantički, pragmatički. Sintaksički aspekt povezan sa načinom na koji se informacija prenosi, bez obzira na njene semantičke i potrošačke kvalitete. Na sintaksičkom nivou razmatraju se oblici njegovog prenošenja i skladištenja. Obično se informacija koja se prenosi naziva poruka. Poruka može biti predstavljena u obliku znakova i simbola, pretvorena u električni oblik i kodirana, tj. predstavljeni u obliku određenog niza električnih signala koji na jedinstven način prikazuju prenesene poruke. Karakteristike procesa transformacije poruka za prenos su određene sintaksičkim aspektom. Tokom skladištenja, sintaksički aspekt je određen drugim oblicima prezentacije informacija, koji omogućavaju najbolji način pretraživanja, snimanja, ažuriranja, promjene informacija u infobazi. Informacije koje se razmatraju samo s obzirom na sintaktički aspekt često se nazivaju podaci. Semantički aspekt prenosi semantički sadržaj informacija i povezuje ga s prethodno dostupnim informacijama. Odražavaju se semantičke veze između riječi i drugih elemenata jezika "tezaurus"(rečnik). Sastoji se od dva dijela: liste riječi i skupova fraza grupisanih po značenju, i nekog ključa (abecede) koji vam omogućava da poređate riječi određenim redoslijedom. Prilikom primanja informacija, tezaurus se može mijenjati, a stepen te promjene karakterizira količinu reproducirane informacije. Pragmatični aspekt utvrđuje mogućnost postizanja postavljenog cilja, uzimajući u obzir primljene informacije. Ovaj aspekt odražava potrošačka svojstva informacije - ako se informacija pokaže vrijednom, ponašanje potrošača se mijenja u pravom smjeru. Pragmatični aspekt se manifestuje u prisustvu jedinstva potrošača i cilja.

Dakle, informacija o njenom nastanku i transformaciji prolazi kroz 3 faze, koje određuju njen semantički, sintaktički i pragmatički aspekt. Osoba prvo promatra neke činjenice okolne stvarnosti, koje se odražavaju u obliku određenog skupa podataka u njegovom umu - ovdje se to manifestira sintaksički aspekt. Zatim, nakon strukturiranja ovih podataka u skladu sa predmetnim područjem, osoba formalizira znanje o strukturi objekta - ovo semantički aspekt primljene informacije. Informacije u obliku znanja imaju visok stepen strukturiranosti, što omogućava izdvajanje kompletnih informacija o okolnoj stvarnosti i kreiranje informacionih modela objekata koji se proučavaju. Osoba tada koristi znanje stečeno u svojoj praksi, odnosno za postizanje svojih ciljeva, što se odražava pragmatičan aspekt.

Sintaktička mjera informacije.

Ova mjera količine informacija operira s bezličnim informacijama koje ne izražavaju semantički odnos prema objektu. Volumen podataka Vd u ovom slučaju, poruka se mjeri brojem znakova (cifara) u poruci. U različitim brojevnim sistemima, jedna cifra ima različitu težinu i jedinica podataka se u skladu s tim mijenja.

Na primjer, u binarnom sistemu, jedinica mjere je bit (bit binarne cifre - binarna cifra). Bit je odgovor na jedno binarno pitanje (“da” ili “ne”; “0” ili “1”) koje se prenosi putem komunikacijskih kanala pomoću signala. Dakle, količina informacija sadržanih u poruci u bitovima određena je brojem binarnih riječi prirodnog jezika, brojem znakova u svakoj riječi, brojem binarnih signala potrebnih za izražavanje svakog znaka.

U savremenim računarima, uz minimalnu jedinicu podataka "bit", uveliko se koristi i uvećana mjerna jedinica "bajt", jednaka 8 bita. U decimalnom brojevnom sistemu, jedinica mjere je “bit” (decimalno mjesto).

Količina informacija I na sintaksičkom nivou nemoguće je odrediti bez razmatranja koncepta nesigurnosti stanja sistema (entropije sistema). Zaista, dobijanje informacija o sistemu uvijek je povezano sa promjenom stepena neznanja primaoca o stanju ovog sistema, tj. količina informacija se mjeri promjenom (smanjenjem) neizvjesnosti stanja sistema.

Koeficijent (stepen) informativnosti(konciznost) poruke određuje se odnosom količine informacija i količine podataka, tj.

Y= I / Vd, sa 0

Sa povećanjem Y smanjen je obim posla na transformaciji informacija (podataka) u sistemu. Stoga nastoje povećati sadržaj informacija, za što se razvijaju posebne metode optimalnog kodiranja informacija.

Semantička mjera informacije

Za mjerenje semantičkog sadržaja informacije, tj. Od njegove količine na semantičkom nivou, najpoznatija je mera tezaurusa, koja povezuje semantička svojstva informacije sa sposobnošću korisnika da primi dolaznu poruku. Za to se koristi koncept korisnikov tezaurus.

Tezaurus je zbirka informacija koju korisnik ili sistem ima.

Ovisno o odnosu semantičkog sadržaja informacija S i korisnički tezaurus Sp količina semantičkih informacija se mijenja Ic, koje korisnik percipira i uključuje u budućnosti u svoj tezaurus.

Priroda ove zavisnosti je prikazana na Sl. 1. Razmotrimo dva ograničavajuća slučaja, kada je količina semantičke informacije Ic je 0:

at Sp= 0 korisnik ne percipira, ne razumije dolazne informacije;

At Sp korisnik sve zna, i nisu mu potrebne dolazne informacije.

Kao što je već napomenuto, koncept informacije se može posmatrati pod različitim ograničenjima nametnutim njegovim svojstvima, tj. na različitim nivoima razmatranja. U osnovi, postoje tri nivoa - sintaktički, semantički i pragmatički. Shodno tome, na svakom od njih se koriste različite procjene za određivanje količine informacija.

Na sintaksičkom nivou, za procjenu količine informacija, koriste se probabilističke metode koje uzimaju u obzir samo probabilistička svojstva informacija i ne uzimaju u obzir druge (semantički sadržaj, korisnost, relevantnost itd.). Razvijena sredinom XX veka. matematičke, a posebno probabilističke metode omogućile su formiranje pristupa procjeni količine informacija kao mjere smanjenja nesigurnosti znanja.

Ovaj pristup, koji se također naziva probabilistički, postulira princip da ako poruka dovodi do smanjenja nesigurnosti našeg znanja, onda se može tvrditi da takva poruka sadrži informaciju. U ovom slučaju, poruke sadrže informacije o svim događajima koji se mogu realizovati sa različitim vjerovatnoćama.

Formulu za određivanje količine informacija za događaje sa različitim vjerovatnoćama i primljene iz diskretnog izvora informacija predložio je američki naučnik C. Shannon 1948. godine. Prema ovoj formuli, količina informacija se može odrediti na sljedeći način:

Gdje I– količina informacija; N– broj mogućih događaja (poruka); pi– vjerovatnoća pojedinačnih događaja (poruka).

Količina informacija određena formulom (2.1) uzima samo pozitivnu vrijednost. Budući da je vjerovatnoća pojedinačnih događaja manja od jedan, onda je, shodno tome, izraz log 2 negativna vrijednost, a da bi se dobila pozitivna vrijednost za količinu informacija u formuli (2.1), ispred se nalazi znak minus znak zbira.

Ako je vjerovatnoća nastanka pojedinačnih događaja ista i oni čine kompletnu grupu događaja, tj.

tada se formula (2.1) transformiše u formulu R. Hartleyja:

U formulama (2.1) i (2.2), odnos između količine informacija I i, shodno tome, vjerovatnoća (ili broj) pojedinačnih događaja se izražava pomoću logaritma.

Upotreba logaritama u formulama (2.1) i (2.2) može se objasniti na sljedeći način. Radi jednostavnosti zaključivanja koristimo relaciju (2.2). Argumentu ćemo dodijeliti sekvencijalno N vrijednosti odabrane, na primjer, iz niza brojeva: 1, 2, 4, 8, 16, 32, 64, itd. Da odredite koji događaj N Dogodili su se podjednako vjerovatni događaji, za svaki broj serije potrebno je sekvencijalno izvršiti selekciju od dva moguća događaja.

Da, u N= 1, broj operacija će biti 0 (vjerovatnoća događaja je 1), s N= 2, broj operacija će biti jednak 1, sa N= 4 broj operacija će biti 2, sa N= 8, broj operacija će biti 3, i tako dalje. Tako dobijamo sljedeću seriju brojeva: 0, 1, 2, 3, 4, 5, 6, itd., koji se mogu smatrati odgovarajućim vrijednostima funkcije I u odnosu (2.2).

Niz numeričkih vrijednosti koje uzima argument N, je niz poznat u matematici kao niz brojeva koji čine geometrijsku progresiju, i niz vrijednosti brojeva koje funkcija uzima I, će biti niz koji formira aritmetičku progresiju. Dakle, logaritam u formulama (2.1) i (2.2) uspostavlja odnos između niza koji predstavlja geometrijsku i aritmetičku progresiju, što je prilično dobro poznato u matematici.

Za kvantificiranje (procjenu) bilo koje fizičke veličine potrebno je odrediti mjernu jedinicu koja se u teoriji mjerenja naziva mjere .


Kao što je već napomenuto, informacije moraju biti kodirane prije obrade, prijenosa i skladištenja.

Kodiranje se vrši pomoću posebnih alfabeta (znakovnih sistema). U računarskoj nauci, koja proučava procese prijema, obrade, prenosa i skladištenja informacija pomoću računarskih (računarskih) sistema, uglavnom se koristi binarno kodiranje koje koristi sistem znakova koji se sastoji od dva znaka 0 i 1. Iz tog razloga formule (2.1. ) i (2.2) kao osnova logaritma koristi se broj 2.

Na osnovu probabilističkog pristupa određivanju količine informacija, ova dva simbola binarnog sistema znakova mogu se posmatrati kao dva različita moguća događaja, pa se kao jedinica količine informacija uzima tolika količina informacija koja sadrži poruka koja smanjuje nesigurnost znanja za polovinu (prije prijema događaja, njihova vjerovatnoća je 0,5, nakon prijema - 1, nesigurnost se shodno tome smanjuje: 1 / 0,5 = 2, tj. 2 puta). Takva jedinica informacije naziva se bit (od engleske riječi binarna cifra je binarna cifra). Dakle, kao mjera za procjenu količine informacija na sintaksičkom nivou, pod uslovom binarnog kodiranja, uzima se jedan bit.

Sledeća najveća jedinica mere količine informacija je bajt, koji je niz od osam bitova, tj.:

1 bajt = 2 3 bita = 8 bita.

U informatici su u širokoj upotrebi i jedinice mjerenja količine informacija koje su višestruke od bajta, međutim, za razliku od metričkog sistema mjera, gdje se koeficijent 10n koristi kao faktor višestrukih jedinica, gdje je n = 3, 6, 9, itd., u više mjernih jedinica količine informacije koristi se koeficijent 2n. Ovaj izbor se objašnjava činjenicom da računar u osnovi radi sa brojevima ne u decimalnom, već u binarnom brojevnom sistemu.

Umnošci bajtova jedinice za mjerenje količine informacija unose se na sljedeći način:

1 kilobajt (KB) = 210 bajtova = 1024 bajta;

1 megabajt (MB) = 210 KB = 1024 KB;

1 gigabajt (GB) = 210 MB = 1024 MB;

1 terabajt (TB) = 210 GB = 1024 GB;

1 petabajt (PB) = 210 TB = 1024 TB;

1 eksabajt (ebajt) = 210 PB = 1024 PB.

Jedinice mjerenja količine informacija u čijem nazivu se nalaze prefiksi "kilo", "mega" itd., sa stanovišta teorije mjerenja, nisu tačne, jer se ovi prefiksi koriste u metričkom sistemu. mjera, u kojima se koeficijent koristi kao višekratnik više jedinica 10 n , gdje je n = 3, 6, 9, itd. Da otkloni ovu neispravnost, međunarodna organizacija Međunarodna elektrotehnička komisija, koja kreira standarde za industriju elektronske tehnologije, odobrila je niz novih prefiksa za jedinice mjerenja količine informacija: kibi (kibi), mebi (mebi), gibi (gibi), tebi (tebi), peti (peti ), exbi (exbi). Međutim, i dalje se koriste stare oznake za mjerne jedinice količine informacija, a potrebno je vrijeme da novi nazivi postanu široko korišteni.

Vjerovatni pristup se također koristi u određivanju količine informacija predstavljenih korištenjem znakovnih sistema. Ako simbole abecede posmatramo kao skup mogućih poruka N, tada se količina informacija koju nosi jedan znak abecede može odrediti formulom (2.1). Uz jednaku vjerovatnoću pojavljivanja svakog znaka abecede u tekstu poruke, formula (2.2) se može koristiti za određivanje količine informacija.

Količina informacija koju nosi jedan znak abecede, što je više, to je više znakova uključeno u ovu abecedu. Broj znakova uključenih u abecedu naziva se kardinalnost abecede. Količina informacija (volumen informacija) sadržana u poruci kodiranoj pomoću znakovnog sistema i koja sadrži određeni broj znakova (simbola) određuje se pomoću formule:

gdje V– informativni obim poruke; I= log 2 N, količina informacija jednog simbola (znaka); TO– broj simbola (karaktera) u poruci; N– snaga abecede (broj znakova u abecedi).

U bazi podataka, informacije se bilježe i reproduciraju korištenjem posebno kreiranih leksičkih sredstava i na osnovu prihvaćenih sintaksičkih pravila i ograničenja.

Sintaksičkom analizom utvrđuju se najvažniji parametri tokova informacija, uključujući potrebne kvantitativne karakteristike, za odabir skupa tehničkih sredstava za prikupljanje, registrovanje, prenošenje, obradu, akumuliranje, čuvanje i zaštitu informacija.

Sintaktička analiza servisiranih tokova informacija nužno prethodi svim fazama projektovanja informacionih sistema.

Semantička analiza omogućava proučavanje informacija sa stanovišta semantičkog sadržaja pojedinih elemenata, pronalaženje načina jezičke korespondencije (ljudski jezik, kompjuterski jezik) uz nedvosmisleno prepoznavanje poruka unesenih u sistem.

Pragmatska analiza se sprovodi kako bi se utvrdila korisnost informacija koje se koriste za upravljanje, da bi se identifikovao praktični značaj poruka koje se koriste za razvoj kontrolnih radnji.

Trajne informacije ostaju nepromijenjene ili su podložne manjim prilagodbama u dužem ili kraćem vremenskom periodu. To su razne referentne informacije, standardi, cijene itd.

Varijabilne informacije odražavaju rezultate izvođenja proizvodnih i ekonomskih operacija, odgovaraju njihovoj dinamici i po pravilu učestvuju u jednom tehnološkom ciklusu mašinske obrade.

Prilikom unosa i obrade informacija koriste se paketni i interaktivni načini rada.

Batch način rada bio je najčešći u praksi centraliziranog rješavanja ekonomskih problema, kada su veliki udio zauzimali zadaci izvještavanja o proizvodnji i privrednim aktivnostima privrednih objekata različitih nivoa upravljanja. Organizacija računarskog procesa u batch modu izgrađena je bez pristupa korisnika računaru.

Njegove funkcije bile su ograničene na pripremu početnih podataka za set informacijskih zadataka i njihovo prebacivanje u procesni centar, gdje je formiran paket koji je uključivao zadatak za računar za obradu, programe, početne, regulatorne i referentne podatke. Paket je unet u računar i implementiran u automatskom režimu bez učešća korisnika i operatera, što je omogućilo da se minimizira vreme izvršavanja zadatog skupa zadataka. Grupni način rada je trenutno implementiran u e-mail ili masovno ažuriranje baze podataka.

Interaktivni način rada omogućava direktnu interakciju korisnika sa informaciono-računarskim sistemom, može biti u obliku zahtjeva ili dijaloga sa sistemom.

Režim zahtjeva je neophodan da korisnici komuniciraju sa sistemom preko značajnog broja pretplatničkih terminalnih uređaja, uključujući i one udaljene na znatnoj udaljenosti od procesnog centra.

Primjer: Zadatak rezervacije karata u prijevozu.

Informacioni sistem implementira masovnu uslugu, radi u režimu podjele vremena, u kojem nekoliko nezavisnih korisnika uz pomoć terminala direktno i praktično

istovremeni pristup informacionom sistemu. Ovaj način vam omogućava da svakom korisniku omogućite vrijeme da komunicira sa sistemom na diferenciran i strogo utvrđen način, te da nakon završetka sesije izađe iz njega.

Interaktivni režim otvara mogućnost korisniku da direktno stupi u interakciju sa informaciono-računarskim sistemom za njega prihvatljivim tempom rada, realizujući repetitivni ciklus izdavanja zadatka, primanja i analize odgovora.

Više o temi Sintaktički, semantički, pragmatički aspekti informacionog procesa:

  1. Struktura aktivnosti masovnih informacija: prikupljanje, obrada, sređivanje, prijenos, percepcija, transformacija, skladištenje i korištenje masovnih informacija. Potencijalne, prihvaćene i stvarne informacije. Semantički, sintaktički i pragmatički aspekti masovnih informativnih tekstova.
  2. Jedinice i metode konceptualizacije u semantičkom, sintaksičkom i pragmatičkom aspektu
  3. 7. KRITERIJI NOVINARSKOG TEKSTA ZA ADEKSATNOST NOVINARSKOG TEKSTA SEMANTIČKI, SINTAKSIČKI, PRAGMATIČKI ASPEKTI NOVINARSKOG TEKSTA SPECIFIČNOST EFIKASNOSTI NOVINARSKOG TEKSTA

Top Related Articles