Kako postaviti pametne telefone i računala. Informativni portal
  • Dom
  • Programi
  • Sintaktička mjera informacije. Kodiranje tekstualnih podataka

Sintaktička mjera informacije. Kodiranje tekstualnih podataka

Pri provedbi informacijskih procesa informacija se uvijek prenosi u prostoru i vremenu od izvora informacije do primatelja (primatelja). Istodobno, za prenošenje informacija koriste se različiti znakovi ili simboli, na primjer, prirodni ili umjetni (formalni) jezik, omogućujući njihovo izražavanje u nekom obliku, koji se zove poruka.

Poruka- oblik prezentiranja informacija u obliku skupa znakova (simbola) koji se koriste za prijenos.

Poruka kao skup znakova sa stanovišta semiotike ( iz grčkog. setneion - znak, znak) – znanost koja proučava svojstva znakova i znakovnih sustava – može se proučavati na tri razine:

1) sintaktičkim , gdje se razmatraju unutarnja svojstva poruka, odnosno odnos između znakova, koji odražava strukturu danog znakovnog sustava. Vanjska svojstva proučavaju se na semantičkoj i pragmatičkoj razini. Na ovoj razini razmatraju se problemi dostave poruke primatelju kao skupa znakova, uzimajući u obzir vrstu medija i način prezentiranja informacija, brzinu prijenosa i obrade, veličinu kodova za prezentaciju informacija, pouzdanost. te točnost pretvorbe tih kodova itd., potpuno apstrahirajući od semantičkog sadržaja poruka i njihove namjene. Na ovoj razini, informacije koje se razmatraju samo sa sintaktičke točke gledišta obično se nazivaju podacima, budući da semantička strana nije važna.

Moderna teorija informacija proučava uglavnom probleme ove razine. Temelji se na konceptu "količine informacija", što je mjera učestalosti korištenja znakova, koja ni na koji način ne odražava ni značenje ni važnost poruka koje se prenose. S tim u vezi, ponekad se kaže da je moderna teorija informacija na sintaktičkoj razini.

2) semantičke , koji analizira odnos između znakova i objekata, radnji, osobina koje oni označavaju, odnosno semantički sadržaj poruke, njezin odnos prema izvoru informacije. Problemi semantičke razine povezani su s formalizacijom i uzimanjem u obzir značenja prenesenih informacija, određivanjem stupnja podudarnosti između slike objekta i samog objekta. Na ovoj razini analiziraju se informacije koje odražavaju informaciju, razmatraju semantičke veze, formiraju pojmovi i prikazi, otkriva se značenje, sadržaj informacija i vrši se njihova generalizacija.

3) pragmatičan , gdje se razmatra odnos između poruke i primatelja, odnosno potrošački sadržaj poruke, njezin odnos prema primatelju.

Na ovoj su razini zanimljive posljedice primanja i korištenja ovih informacija od strane potrošača. Problemi na ovoj razini povezani su s određivanjem vrijednosti i korisnosti korištenja informacija kada potrošač razvija rješenje za postizanje svog cilja. Glavna poteškoća ovdje je u tome što vrijednost, korisnost informacija može biti potpuno različita za različite primatelje, a osim toga ovisi o nizu čimbenika, poput pravovremenosti njihove dostave i korištenja.


Za svaku od razina problema prijenosa informacija o kojima je gore raspravljano, postoje pristupi mjerenju količine informacija i vlastite mjere informacija. Razlikovati, odnosno, mjere informacija na sintaktičkoj razini, semantičkoj razini i pragmatičkoj razini.

Informacijske mjere sintaktičke razine. Kvantitativna procjena informacija ove razine nije povezana sa sadržajnom stranom informacije, već operira s neosobnom informacijom koja ne izražava semantički odnos prema objektu. U tom smislu, ova mjera omogućuje procjenu tokova informacija u objektima različite prirode kao što su komunikacijski sustavi, računala, sustavi upravljanja, živčani sustav živog organizma itd.

Za mjerenje informacija na sintaktičkoj razini uvode se dva parametra: količina informacija (podataka) - V d(volumetrijski pristup) i količina informacija - ja(entropijski pristup).

Volumen informacija V d (volumetrijski pristup). Prilikom provedbe informacijskih procesa, informacija se prenosi u obliku poruke, koja je skup simbola abecede. Štoviše, svaki novi znak u poruci povećava količinu informacija predstavljenih nizom znakova dane abecede. Ako se sada količina informacija sadržanih u poruci od jednog znaka uzme kao jedinica, tada će količina informacija (podataka) V d u bilo kojoj drugoj poruci biti jednaka broju znakova (bitova) u ovoj poruci. Budući da se iste informacije mogu predstaviti na mnogo različitih načina (koristeći različite abecede), mjerna jedinica informacije (podaci) će se u skladu s tim promijeniti.

Dakle, u decimalnom brojevnom sustavu jedna znamenka ima težinu jednaku 10, te će, sukladno tome, jedinica mjerenja informacija biti dit (decimalno mjesto P P dit. Na primjer, četveroznamenkasti broj 2009 ima volumen podataka od V d = 4 dit.

U binarnom sustavu jedna znamenka ima težinu jednaku 2, te će, sukladno tome, jedinica mjerenja informacija biti malo (bit (binary digit) - binarna znamenka). U ovom slučaju, poruka u obrascu n-bitni broj ima volumen podataka V d = P malo. Na primjer, osmobitni binarni kod 11001011 ima veličinu podataka V d = 8 bita.

U modernom računarstvu, zajedno s minimalnom mjernom jedinicom podataka malo velika mjerna jedinica se široko koristi bajt jednako 8 bita. Točno osam bitova je potrebno da bi se kodirao bilo koji od 256 znakova abecede računalne tipkovnice (256 = 2 8).

Kada radite s velikim količinama informacija, za izračunavanje njihove količine koriste se veće mjerne jedinice:

1 kilobajt (KB) = 1024 bajta = 2 10 bajta,

1 megabajt (MB) = 1024 KB = 2 20 bajtova = 1.048.576 bajtova;

1 gigabajt (GB) = 1024 MB = 2 30 bajtova = 1,073,741,824 bajta;

Nedavno, u vezi s povećanjem količine obrađenih informacija, izvedene su jedinice kao što su:

1 terabajt (TB) = 1024 GB = 2 40 bajtova = 1 099 511 627 776 bajtova;

1 petabajt (PB) = 1024 TB = 2 50 bajtova = 1 125 899 906 842 624 bajta.

Treba napomenuti da se u sustavu mjerenja binarnih (kompjuterskih) informacija, za razliku od metričkog sustava, jedinice s prefiksima "kilo", "mega" itd. dobivaju množenjem osnovne jedinice ne s 10 3 = 1000. , 10 6 = 1.000.000, itd., i 2 10 = 1024, 2 20 = 1.048.576, itd.

Količina informacija I (entropijski pristup). U teoriji informacija i kodiranja usvojen je entropijski pristup mjerenju informacija. Ovaj pristup temelji se na činjenici da je činjenica dobivanja informacija uvijek povezana sa smanjenjem raznolikosti ili nesigurnosti (entropije) sustava. Na temelju ovoga, količina informacija u poruci definirana je kao mjera smanjenja neizvjesnosti stanja danog sustava nakon primitka poruke. Neizvjesnost se može tumačiti u smislu koliko malo promatrač zna o danom sustavu. Čim je promatrač identificirao nešto u fizičkom sustavu, entropija sustava se smanjivala, jer je sustav postajao uređeniji za promatrača.

Dakle, s entropijskim pristupom Pod informacijom se podrazumijeva kvantitativna vrijednost nesigurnosti koja je nestala tijekom procesa (ispitivanje, mjerenje, itd.). U ovom slučaju, entropija se uvodi kao mjera nesigurnosti N, a količina informacija jednaka je:

I = H apr - H aps

gdje je, H apr - a priori entropija o stanju istraživanog sustava ili procesa;

H aps - posteriorna entropija.

A posteriori (od lat. a posteriori - iz sljedećeg) - proizlaze iz iskustva (testiranja, mjerenja).

Apriorno (od lat. a priori – od prethodnog) Je pojam koji karakterizira znanje koje prethodi iskustvu (test) i neovisno je o njemu.

U slučaju kada se tijekom testa ukloni postojeća nesigurnost (dobije se specifičan rezultat, tj. H = 0), količina primljenih informacija podudara se s početnom entropijom

Razmotrimo diskretni izvor informacija (izvor diskretnih poruka) kao sustav koji se proučava, pri čemu mislimo na fizički sustav koji ima konačan skup mogućih stanja ( i ja}, i = .

Cijeli set A = (a 1, a 2, ..., a n) stanja sustava u teoriji informacija naziva se apstraktna abeceda ili abeceda izvora poruke.

Pojedinačne države a 1, a 2, ... i n nazivaju se slovima ili simbolima abecede.

Takav sustav može u bilo kojem trenutku nasumično pretpostaviti jedno od konačnih skupova mogućih stanja a i... Pritom se kaže da se izborom izvora ostvaruju različita stanja.

Primatelj informacije (poruke) ima određenu ideju o mogućem nastanku određenih događaja. Te su ideje općenito nepouzdane i izražene su vjerojatnostima s kojima on očekuje ovaj ili onaj događaj. Opću mjeru nesigurnosti (entropiju) karakterizira određena matematička ovisnost o tim vjerojatnostima; količina informacija u poruci određena je time koliko se mjera nesigurnosti smanjuje nakon primitka poruke.

Objasnimo ovu ideju na primjeru.

Recimo da imamo 32 različite karte. Mogućnost odabira jedne karte iz špila je 32. Prije izbora, prirodno je sugerirati da su šanse za odabir određene karte jednake za sve karte. Odabirom eliminiramo tu neizvjesnost. Istodobno, nesigurnost se može okarakterizirati brojem mogućih jednako vjerojatnih izbora. Ako sada definiramo količinu informacija kao mjeru eliminacije nesigurnosti, tada se informacija dobivena kao rezultat izbora može okarakterizirati brojem 32. Međutim, prikladnije je koristiti ne sam taj broj, već logaritam gornja procjena na temelju baze 2:

gdje je m broj mogućih jednakovjerojatnih izbora (Za m = 2, dobivamo informaciju u jednom bitu). Odnosno, u našem slučaju

H = log 2 32 = 5.

Navedeni pristup pripada engleskom matematičaru R. Hartleyju (1928). Ima zanimljivo tumačenje. Karakterizira ga broj pitanja s odgovorima "da" ili "ne", čime se može odrediti koju je karticu odabrala osoba. Ima dovoljno takvih pitanja 5.

Ako pri odabiru kartice mogućnosti pojavljivanja svake kartice nisu iste (različito vjerojatne), tada dobivamo statistički pristup mjerenju informacija koji je predložio K. Shannon (1948). U ovom slučaju, mjera informacija se mjeri formulom:

gdje p i- vjerojatnost izbora i znak abecede.

Lako je vidjeti da ako su vjerojatnosti p 1, ..., p n su jednaki, onda je svaki od njih jednak 1 / N, a Shanonova formula postaje Hartleyjeva formula.

Informacijske mjere semantičke razine. Za mjerenje semantičkog sadržaja informacije, odnosno njezine količine na semantičkoj razini, najraširenija je mjera tezaurusa koja povezuje semantička svojstva informacije s korisnikovom sposobnošću primanja dolazne poruke. Doista, da bi razumio i koristio primljene informacije, primatelj mora imati određenu količinu znanja. Potpuno nepoznavanje teme ne dopušta nam da iz primljene poruke izvučemo korisne informacije o ovoj temi. Kako znanje o temi raste, raste i količina korisnih informacija izvučenih iz poruke.

Ako se primateljevo znanje o određenom predmetu naziva tezaurusom (tj. određenim skupom riječi, pojmova, naziva objekata povezanih semantičkim vezama), tada se količina informacija sadržana u određenoj poruci može procijeniti stupnjem promjena u individualnom tezaurusu pod utjecajem ove poruke.

Tezaurus- skup informacija koje drži korisnik ili sustav.

Drugim riječima, količina semantičkih informacija koju primatelj dohvaća iz dolaznih poruka ovisi o stupnju pripremljenosti njegova tezaurusa za percepciju takve informacije.

Ovisno o odnosu semantičkog sadržaja informacija S i korisnički tezaurus S str količina semantičkih informacija se mijenja Ja sa, koje je korisnik uočio i uključio u budućnosti u svoj tezaurus. Priroda ove ovisnosti prikazana je na Sl. 2.1. Razmotrimo dva granična slučaja kada je količina semantičke informacije I s jednaka 0:

a) kada je S p = 0, korisnik ne percipira (ne razumije) dolaznu informaciju;

b) za S -> ∞, korisnik “sve zna” i ne treba mu dolazne informacije.

Riža. 1.2. Ovisnost količine semantičkih informacija,

percipira potrošač, iz njegovog tezaurusa I c = f (S p)

Potrošač stječe maksimalnu količinu semantičkih informacija kada je njegov semantički sadržaj S usklađen s njegovim tezaurusom S p (S = S p opt), kada su dolazne informacije razumljive korisniku i nose mu dosad nepoznate (odsutne u njegovom tezaurusu) informacije .

Posljedično, količina semantičkih informacija u poruci, količina novog znanja koje je primio korisnik je relativna vrijednost. Jedna te ista poruka može imati smislen sadržaj za kompetentnog korisnika, a biti besmislena za nekompetentnog korisnika.

Prilikom procjene semantičkog (smislenog) aspekta informacije potrebno je težiti slaganju vrijednosti S i Sp.

Relativna mjera količine semantičke informacije može biti koeficijent sadržaja C, koji je definiran kao omjer količine semantičke informacije i njezinog volumena:

C = I s / V d

Mjere informacija na pragmatičnoj razini. Ova mjera određuje korisnost informacija za postizanje cilja korisnika. Ova mjera je također relativna vrijednost, zbog osobitosti korištenja ovih informacija u određenom sustavu.

Jedan od prvih ruskih znanstvenika koji se pozabavio problemom evaluacije pragmatičnih informacija bio je A.A. Kharkevich, koji je predložio da se kao mjera vrijednosti informacija uzme količina informacija nužna za postizanje postavljenog cilja, odnosno da se izračuna povećanje vjerojatnosti postizanja cilja. Dakle, ako je prije dobivanja informacija vjerojatnost postizanja cilja bila jednaka p 0, a nakon primanja - p 1, tada se vrijednost informacije definira kao logaritam omjera p 1 / p 0:

I = log 2 p 1 - log 2 p 0 = log 2 (p 1 / p 0)

Dakle, vrijednost informacije se mjeri u jedinicama informacija, u ovom slučaju u bitovima.

Prilikom ocjenjivanja informacija razlikuju se aspekti kao što su sintaktički, semantički, pragmatički. Sintaktički aspekt povezana s načinom prijenosa informacija, bez obzira na njegove semantičke i potrošačke kvalitete. Na sintaktičkoj razini razmatraju se oblici njegova prijenosa i pohranjivanja. Obično se informacija koja se prenosi zove poruka. Poruka se može prikazati u obliku znakova i simbola pretvorenih u električni oblik i kodiranih, tj. predstavljeni u obliku određenog niza električnih signala koji nedvosmisleno predstavljaju odaslane poruke. Karakteristike procesa pretvaranja poruka za prijenos određene su sintaktičkim aspektom. Tijekom pohrane sintaktički aspekt određen je drugim oblicima prezentiranja informacija koji omogućuju pretraživanje, snimanje, ažuriranje i promjenu informacija u bazi podataka na najbolji način. Informacije koje se razmatraju samo s obzirom na sintaktički aspekt često se nazivaju podaci. Semantički aspekt prenosi semantički sadržaj informacije i korelira ga s prethodno dostupnim informacijama. Semantičke veze između riječi i drugih elemenata jezika odražavaju "tezaurus"(rječnik). Sastoji se od dva dijela: popisa riječi i stabilnih fraza grupiranih po značenju i ključa (abecede) koji vam omogućuje da riječi poredate određenim redoslijedom. Po primitku informacija, tezaurus se može mijenjati, a stupanj te promjene karakterizira količinu informacija koje se reproduciraju. Pragmatični aspekt utvrđuje mogućnost postizanja zadanog cilja, uzimajući u obzir primljene informacije. Ovaj aspekt odražava potrošačka svojstva informacije - ako se informacija pokaže vrijednom, ponašanje potrošača mijenja se u pravom smjeru. Pragmatični aspekt očituje se u prisutnosti jedinstva potrošača i postavljenog cilja.

Dakle, informacija o njenom nastanku i transformacijama prolazi kroz 3 faze, koje određuju njezin semantički, sintaktički i pragmatički aspekt. Osoba prvo promatra neke činjenice okolne stvarnosti, koje se odražavaju u obliku određenog skupa podataka u njegovom umu - ovdje se pojavljuje sintaksički aspekt... Zatim, nakon strukturiranja ovih podataka u skladu s predmetnim područjem, osoba formalizira znanje o strukturi objekta - to je semantički aspekt primljene informacije. Informacija u obliku znanja ima visok stupanj strukturiranosti, što omogućuje isticanje cjelovitih informacija o okolnoj stvarnosti i stvaranje informacijskih modela objekata koji se proučavaju. Osoba tada koristi stečeno znanje u svojoj praksi, odnosno za postizanje postavljenih ciljeva, što se odražava pragmatični aspekt.

Sintaktička mjera informacije.

Ova mjera količine informacija operira s neosobnim informacijama koje ne izražavaju semantički odnos prema objektu. Volumen podataka Vd u ovom slučaju, poruka se mjeri brojem znakova (bitova) u poruci. U različitim brojevnim sustavima jedna znamenka ima različitu težinu i mjerna jedinica podataka se u skladu s tim mijenja.

Na primjer, u binarnom sustavu mjerna jedinica je bit (bit-binarna znamenka - bit). Bit je odgovor na jedno binarno pitanje (“da” ili “ne”; “0” ili “1”), koje se prenosi komunikacijskim kanalima pomoću signala. Dakle, količina informacija sadržanih u poruci u bitovima određena je brojem binarnih riječi prirodnog jezika, brojem znakova u svakoj riječi i brojem binarnih signala potrebnih za izražavanje svakog znaka.

U modernim računalima, uz minimalnu podatkovnu jedinicu "bit", naširoko se koristi povećana jedinica mjere "bajt", jednaka 8 bita. U decimalnom zapisu, jedinica mjere je “bit” (decimalno mjesto).

Količina informacija I na sintaktičkoj razini nemoguće je definirati bez razmatranja pojma neizvjesnosti stanja sustava (entropije sustava). Doista, dobivanje informacija o nekom sustavu uvijek je povezano s promjenom stupnja primateljevog neznanja o stanju ovog sustava, t.j. količina informacija mjeri se promjenom (smanjenjem) nesigurnosti stanja sustava.

Koeficijent (stupanj) sadržaja informacija(konciznost) poruke određena je omjerom količine informacija i količine podataka, t.j.

Y = I / Vd, i 0

Uz povećanje Y smanjuje se količina posla na transformaciji informacija (podataka) u sustavu. Stoga nastoje povećati informacijski sadržaj, za što se razvijaju posebne metode optimalnog kodiranja informacija.

Semantička mjera informacije

Za mjerenje semantičkog sadržaja informacije, t.j. Najveće priznanje dobila je njezina količina na semantičkoj razini, mjera tezaurusa, koja povezuje semantička svojstva informacije s sposobnošću korisnika da primi dolaznu poruku. Za to se koristi koncept korisnički tezaurus.

Tezaurus je zbirka informacija koje drži korisnik ili sustav.

Ovisno o odnosu semantičkog sadržaja informacija S i korisnički tezaurus Sr količina semantičkih informacija se mijenja je, percipira korisnik i on ga u budućnosti uključuje u svoj tezaurus.

Priroda ove ovisnosti prikazana je na Sl. 1. Razmotrimo dva ograničavajuća slučaja kada je količina semantičkih informacija Is jednako 0:

na Sr= 0 korisnik ne percipira, ne razumije dolazne informacije;

Na Sr korisnik sve zna, a dolazne informacije mu nisu potrebne.

Kao što je već napomenuto, pojam informacije može se promatrati pod različitim ograničenjima nametnutim njegovim svojstvima, tj. na različitim razinama razmatranja. U osnovi, postoje tri razine - sintaktička, semantička i pragmatička. Sukladno tome, na svakom od njih se koriste različite procjene za određivanje količine informacija.

Na sintaktičkoj razini, za procjenu količine informacija, koriste se probabilističke metode koje uzimaju u obzir samo vjerojatnosna svojstva informacija, a ne uzimaju u obzir ostala (semantički sadržaj, korisnost, relevantnost itd.). Razvijena sredinom XX stoljeća. matematičke, a posebno probabilističke metode omogućile su formiranje pristupa procjeni količine informacija kao mjere smanjenja nesigurnosti znanja.

Ovaj pristup, koji se također naziva probabilistički, postulira načelo: ako neka poruka dovodi do smanjenja nesigurnosti našeg znanja, onda se može tvrditi da takva poruka sadrži informaciju. U tom slučaju poruke sadrže informacije o svim događajima koji se mogu realizirati s različitim vjerojatnostima.

Formulu za određivanje količine informacija za događaje s različitim vjerojatnostima i dobivene iz diskretnog izvora informacija predložio je američki znanstvenik K. Shannon 1948. godine. Prema ovoj formuli, količina informacija može se odrediti na sljedeći način:

Gdje ja- količina informacija; N- broj mogućih događaja (poruka); p i- vjerojatnost pojedinih događaja (poruka).

Količina informacija određena formulom (2.1) ima samo pozitivnu vrijednost. Budući da je vjerojatnost pojedinačnih događaja manja od jedan, tada je, odnosno, izraz log 2, - negativna vrijednost, a za dobivanje pozitivne vrijednosti količine informacija u formuli (2.1), predznak minus je ispred znak zbroja.

Ako je vjerojatnost nastanka pojedinih događaja jednaka i oni čine cjelovitu grupu događaja, tj.:

tada se formula (2.1) transformira u formulu R. Hartleyja:

U formulama (2.1) i (2.2), odnos između količine informacija ja te se, sukladno tome, vjerojatnost (ili broj) pojedinačnih događaja izražava pomoću logaritma.

Korištenje logaritama u formulama (2.1) i (2.2) može se objasniti na sljedeći način. Radi jednostavnosti zaključivanja koristimo relaciju (2.2). Argumentu ćemo dodijeliti sekvencijalno N vrijednosti odabrane, na primjer, iz niza brojeva: 1, 2, 4, 8, 16, 32, 64, itd. Kako bi se utvrdilo s kojeg je događaja N dogodili su se jednako vjerojatni događaji, za svaki broj serije potrebno je uzastopno izvršiti selekcijske operacije od dva moguća događaja.

Dakle, za N= 1 broj operacija bit će jednak 0 (vjerojatnost događaja je 1), za N= 2, broj operacija će biti jednak 1, za N= 4 broj operacija bit će jednak 2, za N= 8, broj operacija će biti 3, itd. Tako dobivamo sljedeći niz brojeva: 0, 1, 2, 3, 4, 5, 6, itd., koji se može smatrati odgovarajućim vrijednostima funkcije ja u odnosu (2.2).

Niz brojevnih vrijednosti koje uzima argument N, je niz, poznat u matematici kao niz brojeva koji tvore geometrijsku progresiju, i niz vrijednosti brojeva koje funkcija uzima ja, bit će niz koji tvori aritmetičku progresiju. Dakle, logaritam u formulama (2.1) i (2.2) uspostavlja odnos između niza koji predstavlja geometrijsku i aritmetičku progresiju, što je dobro poznato u matematici.

Za kvantificiranje (vrednovanje) bilo koje fizičke veličine potrebno je odrediti mjernu jedinicu koja se u teoriji mjerenja naziva mjere .


Kao što je već napomenuto, informacije se moraju kodirati prije obrade, prijenosa i pohrane.

Kodiranje se vrši pomoću posebnih abeceda (sustava znakova). U informatici, koja proučava procese primanja, obrade, prijenosa i pohranjivanja informacija pomoću računalnih (računalnih) sustava, uglavnom se koristi binarno kodiranje u kojem se koristi znakovni sustav koji se sastoji od dva simbola 0 i 1. Zbog toga se u formulama (2.1) i (2.2) kao baza logaritma koristi se broj 2.

Na temelju probabilističkog pristupa određivanju količine informacija, ova dva simbola binarnog znakovnog sustava mogu se smatrati dvama različitim mogućim događajima, stoga kao jedinicu količine informacija prihvaćamo količinu informacija koja sadrži poruku koja se prepolovi nesigurnost znanja (prije nego što su događaji primljeni, njihova je vjerojatnost 0, 5, nakon primanja - 1, nesigurnost se smanjuje u skladu s tim: 1 / 0,5 = 2, tj. 2 puta). Takva mjerna jedinica informacije naziva se bit (od engleske riječi binarna znamenka- binarna znamenka). Dakle, kao mjera za procjenu količine informacija na sintaktičkoj razini, pod uvjetom binarnog kodiranja, usvaja se jedan bit.

Sljedeća najveća jedinica za mjerenje količine informacija je bajt, koji je niz sastavljen od osam bitova, tj.:

1 bajt = 2 3 bita = 8 bita.

U informatici se višebajtne jedinice za mjerenje količine informacija također široko koriste, međutim, za razliku od metričkog sustava mjera, gdje se koeficijent 10n koristi kao množitelj više jedinica, gdje je n = 3, 6, 9, itd., u više jedinica mjerenja količine informacija koristi se faktor 2n. Ovaj izbor objašnjava se činjenicom da računalo u osnovi ne radi s brojevima u decimalnom, već u binarnom brojevnom sustavu.

Višekratnici bajtova mjerne jedinice količine informacija unose se na sljedeći način:

1 kilobajt (KB) = 210 bajtova = 1024 bajta;

1 megabajt (MB) = 210 KB = 1024 KB;

1 gigabajt (GB) = 210 MB = 1024 MB;

1 terabajt (TB) = 210 GB = 1024 GB;

1 petabajt (PB) = 210 TB = 1024 TB

1 eksabajt (ebajt) = 210 PB = 1024 PB.

Jedinice za mjerenje količine informacija, u čijem se nazivu nalaze prefiksi "kilo", "mega" itd., sa stajališta teorije mjerenja nisu točne, jer se ti prefiksi koriste u metričkom sustavu mjera, u kojima se koeficijent koristi kao množitelji višestrukih jedinica 10 n, gdje je n = 3, 6, 9, itd. Kako bi se otklonila ova netočnost, međunarodna organizacija Međunarodna elektrotehnička komisija, koji stvara standarde za industriju elektroničke tehnologije, odobrio je niz novih prefiksa za mjerne jedinice količine informacija: kibi, mebi, gibi, tebi, peti, exbi. Međutim, i dalje se koriste stare oznake za mjerne jedinice količine informacija, a potrebno je vrijeme da se novi nazivi počnu masovno koristiti.

Vjerojatnostni pristup također se koristi za određivanje količine informacija prezentiranih pomoću znakovnih sustava. Ako simbole abecede promatramo kao skup mogućih poruka N, tada se količina informacija koju nosi jedan znak abecede može odrediti formulom (2.1). Ako je svako slovo abecede jednako vjerojatno u tekstu poruke, možete koristiti formulu (2.2) da odredite količinu informacija.

Količina informacija koju nosi jedan znak abecede, što je više, to je više znakova uključeno u ovu abecedu. Broj znakova uključenih u abecedu naziva se snaga abecede. Količina informacija (volumen informacija) sadržana u poruci kodiranoj znakovnim sustavom i koja sadrži određeni broj znakova (simbola) određuje se pomoću formule:

gdje V- informativni volumen poruke; ja= log 2 N, volumen informacija jednog simbola (znaka); DO- broj znakova (znakova) u poruci; N- snaga abecede (broj znakova u abecedi).

U bazi se podaci bilježe i reproduciraju korištenjem posebno kreiranih leksičkih sredstava i na temelju prihvaćenih sintaktičkih pravila i ograničenja.

Sintaktičkom analizom utvrđuju se najvažniji parametri tokova informacija, uključujući i potrebne kvantitativne karakteristike, za odabir skupa tehničkih sredstava za prikupljanje, registraciju, prijenos, obradu, akumuliranje, pohranu i zaštitu informacija.

Sintaktička analiza opsluženih informacijskih tokova nužno prethodi svim fazama projektiranja informacijskih sustava.

Semantička analiza omogućuje vam proučavanje informacija s gledišta semantičkog sadržaja pojedinih elemenata, pronalaženje načina jezične korespondencije (ljudski jezik, računalni jezik) uz jednoznačno prepoznavanje poruka unesenih u sustav.

Provodi se pragmatična analiza kako bi se utvrdila korisnost informacija koje se koriste za upravljanje, kako bi se identificirao praktični značaj poruka koje se koriste za razvoj kontrolnih radnji.

Trajne informacije ostaju nepromijenjene ili se podvrgavaju manjim prilagodbama tijekom manje-više dugog vremenskog razdoblja. To su razne referentne informacije, standardi, cijene itd.

Varijabilne informacije odražavaju rezultate proizvodnje i poslovanja, odgovaraju njihovoj dinamici i u pravilu sudjeluju u jednom tehnološkom ciklusu obrade.

Prilikom unosa i obrade informacija koriste se paketni i interaktivni načini rada.

Batch način rada bio je najrašireniji u praksi centraliziranog rješavanja gospodarskih problema, kada su veliki udio zauzimali poslovi izvještavanja o proizvodnji i gospodarskim aktivnostima gospodarskih objekata različitih razina upravljanja. Organizacija računskog procesa u batch načinu rada izgrađena je bez pristupa korisnika računalu.

Njegove funkcije bile su ograničene na pripremu početnih podataka o kompleksu informacijskih zadataka i njihov prijenos u procesni centar, gdje je formiran paket koji je uključivao računalni zadatak za obradu, programe, početne, normativno-troškovne i referentne podatke. Paket je unesen u računalo i implementiran u automatskom načinu rada bez sudjelovanja korisnika i operatera, što je omogućilo minimiziranje vremena izvršavanja zadanog skupa zadataka. Trenutno je paketni način rada implementiran za e-poštu ili za masovna ažuriranja baze podataka.

Interaktivni način rada omogućuje izravnu interakciju korisnika s informacijsko-računalnim sustavom, može biti u obliku zahtjeva ili dijaloga sa sustavom.

Način upita neophodan je korisnicima za interakciju sa sustavom putem značajnog broja pretplatničkih terminalnih uređaja, uključujući i one udaljene na znatnoj udaljenosti od centra za obradu.

Primjer: Zadatak rezervacije karata za prijevoz.

Informacijski sustav implementira masovnu uslugu, radi u načinu dijeljenja vremena, u kojem nekoliko neovisnih korisnika uz pomoć terminala ima izravnu i praktičnu

istovremeni pristup informacijskom sustavu. Ovaj način rada omogućuje svakom korisniku da na diferenciran način komunicira sa sustavom na strogo utvrđen način, a nakon završetka sesije napusti ga.

Dijaloški način rada omogućuje korisniku izravnu interakciju s informacijskim i računalnim sustavom prihvatljivim tempom rada, ostvarujući ponavljajući ciklus izdavanja zadatka, primanja i analize odgovora.

Više o temi Sintaktički, semantički, pragmatički aspekti informacijskog procesa:

  1. Struktura aktivnosti masovnih informacija: prikupljanje, obrada, slaganje, prijenos, percepcija, transformacija, pohrana i korištenje masovnih informacija. Potencijalne, prihvaćene i stvarne informacije. Semantički, sintaktički i pragmatički aspekti masovnih informativnih tekstova.
  2. Jedinice i metode konceptualizacije u semantičkom, sintaktičkom i pragmatičkom aspektu
  3. 7. NOVINARSKI TEKST KRITERIJI ADEKSATNOSTI NOVINARSKOG TEKSTA SEMANTIČKI, SINTAKSIČKI, PRAGMATIČKI ASPEKTI NOVINARSKOG TEKSTA

Vrhunski povezani članci