Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ
  • në shtëpi
  • Lajme
  • Masa semantike e informacionit. Masat e informacionit të hartës

Masa semantike e informacionit. Masat e informacionit të hartës

Për të matur përmbajtjen semantike të informacionit, d.m.th. sasia e tij në nivelin semantik, më e njohura është masa e thesarit, e cila lidh vetitë semantike të informacionit me aftësinë e përdoruesit për të marrë mesazhin në hyrje. Për këtë përdoret koncepti thesaurus i përdoruesit.

Thesaurusështë një koleksion informacioni që ka një përdorues ose sistem.

Në varësi të marrëdhënies ndërmjet përmbajtjes semantike të informacionit S dhe thesaurus i përdoruesit Sp sasia e informacionit semantik ndryshon Unë C , perceptohet nga përdoruesi dhe përfshihet prej tij në të ardhmen në thesarin e tij. Natyra e një varësie të tillë është paraqitur në Figurën 2.2. Konsideroni dy raste kufizuese, kur sasia e informacionit semantik Unë Cështë 0:

S p 0 përdoruesi nuk e percepton, nuk e kupton informacionin në hyrje;

sp; përdoruesi di gjithçka, ai nuk ka nevojë për informacionin hyrës.

Oriz. 2.2. Varësia e sasisë së informacionit semantik. perceptuar nga konsumatori, nga thesaurus i tij Ic=f(Sp)

Sasia maksimale e informacionit semantik Unë C konsumatori fiton kur bie dakord për përmbajtjen e tij semantike S me thesarin tuaj S p (S f = Sp opt), kur informacioni në hyrje është i kuptueshëm për përdoruesin dhe i sjell atij informacion të panjohur më parë (të munguar në thesarin e tij).

Prandaj, sasia e informacionit semantik në mesazh, sasia e njohurive të reja të marra nga përdoruesi, është një vlerë relative. I njëjti mesazh mund të ketë përmbajtje semantike për një përdorues kompetent dhe të jetë i pakuptimtë (zhurmë semantike) për një përdorues të paaftë.

Kur vlerësoni aspektin semantik (kuptimor) të informacionit, është e nevojshme të përpiqeni të harmonizoni vlerat S Dhe S p.

Një masë relative e sasisë së informacionit semantik mund të jetë koeficienti i pasurisë NGA, i cili përcaktohet si raporti i sasisë së informacionit semantik me vëllimin e tij:

Masa pragmatike e informacionit

Kjo masë përcakton dobinë e informacionit (vlerës) për të arritur qëllimin e përdoruesit. Kjo masë është gjithashtu një vlerë relative, për shkak të veçorive të përdorimit të këtij informacioni në një sistem të caktuar. Është e këshillueshme që të matet vlera e informacionit në të njëjtat njësi (ose afër tyre) në të cilat matet funksioni objektiv.



Shembulli 2.5. Në një sistem ekonomik, vetitë (vlera) pragmatike të informacionit mund të përcaktohen nga rritja e efektit ekonomik të funksionimit, i arritur përmes përdorimit të këtij informacioni për të menaxhuar sistemin:

Inb(g)=P(g /b)-P(g),

ku Inb(g)- vlera e mesazhit informativ b për sistemin e kontrollit g,

П(g)- efekti ekonomik i pritshëm a priori i funksionimit të sistemit të kontrollit g ,

П(g/b)- efekti i pritshëm i funksionimit të sistemit g, me kusht që informacioni që përmban mesazhi b të përdoret për kontroll.

Për krahasim, masat e paraqitura të informacionit do të paraqiten në Tabelën 2.1.

Tabela 2.1. Njësi informacioni dhe shembuj

CILËSIA E INFORMACIONIT

Mundësia dhe efikasiteti i përdorimit të informacionit përcaktohet nga konsumatori kryesor i tij treguesit e cilësisë, si përfaqësuese, përmbajtje, mjaftueshmëri, aksesueshmëri, rëndësi, kohëzgjatje, saktësi, besueshmëri, stabilitet.

  • Përfaqësueshmëria informacioni lidhet me korrektësinë e përzgjedhjes dhe formimit të tij në mënyrë që të pasqyrojë në mënyrë adekuate vetitë e objektit. Më të rëndësishmet këtu janë:
  • korrektësinë e konceptit mbi bazën e të cilit është formuluar koncepti origjinal;
  • vlefshmëria e përzgjedhjes së veçorive thelbësore dhe marrëdhënieve të dukurisë së shfaqur.
  • Shkelja e përfaqësimit të informacionit shpesh çon në gabime të rëndësishme të tij.
  • mendjelehtësi informacioni pasqyron kapacitetin semantik të barabartë me raportin e sasisë së informacionit semantik në mesazh me sasinë e të dhënave që përpunohen, d.m.th. C=Ic/Vd.

Me rritjen e përmbajtjes së informacionit, rritet kapaciteti semantik i sistemit të informacionit, pasi për të marrë të njëjtin informacion, është e nevojshme të konvertohet një sasi më e vogël e të dhënave.

Krahas faktorit të përmbajtjes C, i cili pasqyron aspektin semantik, mund të përdoret edhe faktori i përmbajtjes së informacionit, i cili karakterizohet nga raporti i sasisë së informacionit sintaksor (sipas Shannon) me sasinë e të dhënave. Y=I/Vd.

  • Mjaftueshmëria (plotësia) informacion do të thotë që ai përmban një përbërje minimale, por të mjaftueshme (grup treguesish) për të marrë vendimin e duhur. Koncepti i plotësisë së informacionit është i lidhur me përmbajtjen e tij semantike (semantikën) dhe pragmatikën. Si e paplotë, d.m.th. i pamjaftueshëm për marrjen e vendimit të duhur, dhe informacioni i tepërt zvogëlon efektivitetin e vendimeve të marra nga përdoruesi.
  • Disponueshmëria informacioni për perceptimin e përdoruesit sigurohet nga zbatimi i procedurave të duhura për marrjen dhe transformimin e tij. Për shembull, në një sistem informacioni, informacioni konvertohet në një formë të aksesueshme dhe të përshtatshme për përdoruesit. Kjo arrihet, veçanërisht, duke bashkërenduar formën e tij semantike me thesarin e përdoruesit.
  • Rëndësia informacioni përcaktohet nga shkalla e ruajtjes së vlerës së informacionit për menaxhimin në kohën e përdorimit të tij dhe varet nga dinamika e ndryshimeve në karakteristikat e tij dhe nga intervali kohor që ka kaluar që nga shfaqja e këtij informacioni.
  • Kohëzgjatja informacion nënkupton marrjen e tij jo më vonë se një moment i paracaktuar në kohë, në përputhje me kohën e zgjidhjes së detyrës.
  • Saktësia informacioni përcaktohet nga shkalla e afërsisë së informacionit të marrë me gjendjen reale të objektit, procesit, dukurisë, etj. Për informacionin e shfaqur nga një kod dixhital, njihen katër koncepte klasifikimi të saktësisë:
  • saktësi formale, e matur me vlerën e njësisë së shifrës më pak të rëndësishme të një numri;
  • saktësi reale, e përcaktuar nga vlera e njësisë së shifrës së fundit të numrit, saktësia e së cilës është e garantuar;
  • saktësia maksimale që mund të merret në kushte specifike të funksionimit të sistemit;
  • saktësinë e kërkuar, të përcaktuar nga qëllimi funksional i treguesit.

Besueshmëria informacioni përcaktohet nga vetia e tij për të pasqyruar objektet e jetës reale me saktësinë e kërkuar. Besueshmëria e informacionit matet me nivelin e besueshmërisë së saktësisë së kërkuar, d.m.th. probabiliteti që vlera e parametrit të shfaqur nga informacioni të ndryshojë nga vlera e vërtetë e këtij parametri brenda saktësisë së kërkuar.

Qëndrueshmëria informacioni pasqyron aftësinë e tij për t'iu përgjigjur ndryshimeve në të dhënat burimore pa kompromentuar saktësinë e kërkuar. Stabiliteti i informacionit, si dhe përfaqësimi, është për shkak të metodës së zgjedhur të përzgjedhjes dhe formimit të tij.

Si përfundim, duhet të theksohet se parametra të tillë të cilësisë së informacionit si përfaqësimi, pasuria, mjaftueshmëria, aksesueshmëria, stabiliteti, përcaktohen plotësisht në nivelin metodologjik të zhvillimit të sistemeve të informacionit. Parametrat e rëndësisë, kohëzgjatjes, saktësisë dhe besueshmërisë përcaktohen në një masë më të madhe edhe në nivelin metodologjik, megjithatë, vlera e tyre ndikohet ndjeshëm edhe nga natyra e funksionimit të sistemit, kryesisht nga besueshmëria e tij. Në të njëjtën kohë, parametrat e rëndësisë dhe saktësisë janë të lidhura rreptësisht me parametrat e afateve kohore dhe besueshmërisë, përkatësisht.

Masa sintaksore e informacionit

Si masë sintaksore, sasia e informacionit paraqet sasinë e të dhënave.

RRETH vëllimi i të dhënave V d në mesazhin "in" matet me numrin e karaktereve (shifrave) në këtë mesazh. Siç e përmendëm, në sistemin binar, njësia matëse është biti. Në praktikë, së bashku me këtë njësi "më të vogël" të matjes së të dhënave, përdoret më shpesh një njësi më e madhe - bajt i barabartë me 8 bit. Për lehtësi, kilo- (10 3), mega- (10 6), giga- (10 9) dhe tera- (10 12) bajt, etj. përdoren si matës. Në bajt të njohur, matet vëllimi i mesazheve të shkruara të shkurtra, librave të trashë, veprave muzikore, imazheve dhe produkteve softuerike. Është e qartë se kjo masë nuk mund të karakterizojë në asnjë mënyrë se çfarë dhe pse mbartin këto njësi informacioni. Matni në kilobajt romanin e L.N. "Lufta dhe Paqja" e Tolstoit është e dobishme, për shembull, për të kuptuar nëse mund të përshtatet në hapësirën e lirë të një hard disk. Kjo është po aq e dobishme sa matja e madhësisë së një libri - lartësia, trashësia dhe gjerësia e tij - për të parë nëse do të përshtatet në një raft librash, ose peshimi i tij për të parë nëse çantë do të mbajë peshën e kombinuar.

Kështu që. Një masë sintaksore e informacionit nuk mjafton qartë për të karakterizuar mesazhin: në shembullin tonë të motit, në rastin e fundit, mesazhi i mikut përmbante një sasi jo zero të dhënash, por nuk përmbante informacionin që na nevojitej. Përfundimi për dobinë e informacionit rrjedh nga shqyrtimi i përmbajtjes së mesazhit. Për të matur përmbajtjen semantike të informacionit, d.m.th. sasinë e tij në nivel semantik, prezantojmë konceptin e "tezaurit të marrësit të informacionit".

Thesaurus është një koleksion informacioni dhe lidhjesh ndërmjet tyre që ka marrësi i informacionit. Mund të themi se thesaurus është njohuria e akumuluar e marrësit.

Në një rast shumë të thjeshtë, kur marrësi është një pajisje teknike - një kompjuter personal, thesaurus formohet nga "armatimi" i kompjuterit - programet dhe pajisjet e ngulitura në të që ju lejojnë të merrni, përpunoni dhe prezantoni mesazhe me tekst në gjuhë të ndryshme duke përdorur alfabete të ndryshme, fonte, si dhe informacione audio dhe video nga një rrjet lokal ose mbarëbotëror. Nëse kompjuteri nuk është i pajisur me një kartë rrjeti, nuk mund të prisni që të merrni mesazhe në të nga përdoruesit e tjerë të rrjetit në çfarëdo forme. Mungesa e drejtuesve me fontet ruse nuk do t'ju lejojë të punoni me mesazhe në Rusisht, etj.

Nëse marrësi është një person, thesaurus i tij është gjithashtu një lloj armatimi intelektual i një personi, një arsenal i njohurive të tij. Ai gjithashtu formon një lloj filtri për mesazhet hyrëse. Mesazhi në hyrje përpunohet duke përdorur njohuritë ekzistuese për të marrë informacion. Nëse thesaurus është shumë i pasur, atëherë arsenali i njohurive është i thellë dhe i larmishëm, ai do t'ju lejojë të nxirrni informacion nga pothuajse çdo mesazh. Një thesaurus i vogël që përmban një sasi të vogël njohurish mund të bëhet pengesë për të kuptuar mesazhet që kërkojnë përgatitje më të mirë.


Megjithatë, vini re se vetëm të kuptuarit e një mesazhi nuk mjafton për të ndikuar në vendimmarrje - ai duhet të përmbajë informacionin e nevojshëm për këtë, i cili nuk është në thesarin tonë dhe që ne duam ta përfshijmë në të. Në rastin e motit, thesaurus ynë nuk kishte informacionin më të fundit, "të përditësuar" për motin në zonën e universitetit. Nëse mesazhi i marrë ndryshon thesarin tonë, zgjedhja e zgjidhjes gjithashtu mund të ndryshojë. Një ndryshim i tillë në thesaurus shërben si një masë semantike e sasisë së informacionit, një lloj matës i dobisë së mesazhit të marrë.

Formalisht, sasia e informacionit semantik unë jam, i përfshirë më tej në thesaurus përcaktohet nga raporti i tezaurit të marrësit S i, dhe përmbajtjen e informacionit të transmetuar në mesazhin "në" S. Pamja grafike e kësaj varësie është paraqitur në Fig.1.

Konsideroni rastet kur sasia e informacionit semantik Unë s e barabartë me ose afër zeros:

Për S i= 0 marrësi nuk e percepton informacionin në hyrje;

Në 0< Si< S 0 получатель воспринимает, но не понимает поступившую в сообщении информацию;

Për S i-» ∞ Marrësi ka njohuri shteruese dhe informacioni i ardhur nuk mund të plotësojë thesarin e tij.

Oriz. Varësia e sasisë së informacionit semantik nga thesaurus i marrësit

Me një thesaurus S i>S0 sasia e informacionit semantik Unë s Mesazhi i marrë nga mesazhi i ngulitur β informacion Sduke u rritur me shpejtësi në fillim me rritjen e thesarit të vetë marrësit, dhe atëherë - duke u nisur nga ndonjë vlerë S i - bie . Rënia e sasisë së informacionit të dobishëm për marrësin është për faktin se baza e njohurive të marrësit është bërë mjaft solide dhe po bëhet gjithnjë e më e vështirë ta befasosh atë me diçka të re.

Kjo mund të ilustrohet me shembullin e studentëve që studiojnë shkenca kompjuterike ekonomike dhe lexojnë materiale nga faqet e internetit të IP të korporatave. . Në fillim, kur formohen njohuritë e para për sistemet e informacionit, leximi jep pak - shumë terma të pakuptueshëm, shkurtesat, madje edhe titujt nuk janë të gjithë të qartë. Këmbëngulja në leximin e librave, ndjekja e leksioneve dhe seminareve, komunikimi me profesionistët ndihmojnë në rimbushjen e tezaurit. Me kalimin e kohës, leximi i materialeve të faqes bëhet i këndshëm dhe i dobishëm, dhe deri në fund të karrierës suaj profesionale - pasi keni shkruar shumë artikuj dhe libra - marrja e informacioneve të reja të dobishme nga një faqe e njohur do të ndodhë shumë më rrallë.

Mund të flasim për optimalin për këtë informacion S thesaurus i marrësit, në të cilin ai do të marrë informacionin maksimal është, si dhe informacionin optimal në mesazhin "in" për këtë tezaur. sj. Në shembullin tonë, kur marrësi është një kompjuter, thesaurus optimal do të thotë që hardueri i tij dhe softveri i instaluar perceptojnë dhe interpretojnë saktë për përdoruesin të gjitha simbolet që përmbahen në mesazhin "për" që përcjellin kuptimin e informacionit. S. Nëse mesazhi përmban karaktere që nuk korrespondojnë me përmbajtjen e tezaurit, disa informacione do të humbasin dhe vlera Unë s zvogëlohet.

Nga ana tjetër, nëse e dimë se marrësi nuk është në gjendje të marrë tekste në rusisht (kompjuteri i tij nuk ka drejtuesit e nevojshëm), dhe gjuhë të huaja në të cilat mund të dërgohet mesazhi ynë, as ai dhe as ne nuk kemi studiuar në transmetojmë informacionin e nevojshëm që mund t'i drejtohemi transliterimit - shkrimi i teksteve ruse duke përdorur shkronja të një alfabeti të huaj që perceptohet mirë nga kompjuteri i marrësit. Në këtë mënyrë, ne do të përputhim informacionin tonë me thesarin e kompjuterit të marrësit. Mesazhi do të duket i shëmtuar, por marrësi do të jetë në gjendje të lexojë të gjithë informacionin e nevojshëm.

Kështu, sasia maksimale e informacionit semantik është nga mesazhi β marrësi fiton me marrëveshje përmbajtjen semantike të tij S c thesaurus Si,(në Si = Sjopt). Informacioni nga i njëjti mesazh mund të jetë kuptimplotë për një përdorues kompetent dhe të jetë i pakuptimtë për një përdorues të paaftë. Sasia e informacionit semantik në një mesazh të marrë nga përdoruesi është një vlerë individuale, e personalizuar, në kontrast me informacionin sintaksor. Sidoqoftë, informacioni semantik matet në të njëjtën mënyrë si informacioni sintaksor - në bit dhe bajt.

Një masë relative e sasisë së informacionit semantik është faktori i përmbajtjes C, i cili përcaktohet si raporti i sasisë së informacionit semantik me vëllimin e tij të të dhënave. V d, të përfshira në mesazh β:

C \u003d Is / Vd

Leksioni 2 ne disiplinen "Informatike dhe TIK"

Masa sintaksore e informacionit.

Kjo masë e sasisë së informacionit vepron me informacion jopersonal që nuk shpreh një marrëdhënie semantike me objektin. Vëllimi i të dhënave Vd në këtë rast mesazhi matet me numrin e karaktereve (shifrave) në mesazh. Në sisteme të ndryshme numrash, një shifër ka një peshë të ndryshme dhe njësia e të dhënave ndryshon në përputhje me rrethanat.

Për shembull, në sistemin binar, njësia e matjes është bit (shifra binare bit - shifra binare). Një bit është përgjigja për një pyetje binare ("po" ose "jo"; "0" ose "1") e transmetuar përmes kanaleve të komunikimit duke përdorur një sinjal. Kështu, sasia e informacionit që përmban mesazhi në bit përcaktohet nga numri i fjalëve binare të një gjuhe natyrore, numri i karaktereve në secilën fjalë, numri i sinjaleve binare që kërkohen për të shprehur çdo karakter.

Në kompjuterët modernë, së bashku me njësinë minimale të të dhënave "bit", përdoret gjerësisht njësia e zmadhuar e matjes "byte", e barabartë me 8 bit. Në sistemin e numrave dhjetorë, njësia matëse është "bit" (vend dhjetor).

Sasia e informacionit I në nivelin sintaksor është e pamundur të përcaktohet pa marrë parasysh konceptin e pasigurisë së gjendjes së sistemit (entropia e sistemit). Në të vërtetë, marrja e informacionit për një sistem shoqërohet gjithmonë me një ndryshim në shkallën e injorancës së marrësit për gjendjen e këtij sistemi, d.m.th. sasia e informacionit matet me ndryshimin (uljen) e pasigurisë së gjendjes së sistemit.

Koeficienti (shkalla) e informativitetit(konciziteti) i një mesazhi përcaktohet nga raporti i sasisë së informacionit me sasinë e të dhënave, d.m.th.

Y= I / Vd, me 0

Me rritjen Y zvogëlohet vëllimi i punës për transformimin e informacionit (të dhënave) në sistem. Prandaj, ata përpiqen të rrisin përmbajtjen e informacionit, për të cilën po zhvillohen metoda të veçanta të kodimit optimal të informacionit.

Masa semantike e informacionit

Për të matur përmbajtjen semantike të informacionit, d.m.th. sasia e tij në nivelin semantik, më e njohura është masa e thesarit, e cila lidh vetitë semantike të informacionit me aftësinë e përdoruesit për të marrë mesazhin në hyrje. Për këtë përdoret koncepti thesaurus i përdoruesit.

Thesaurusështë një koleksion informacioni që ka një përdorues ose sistem.

Në varësi të marrëdhënies ndërmjet përmbajtjes semantike të informacionit S dhe thesaurus i përdoruesit Sp sasia e informacionit semantik ndryshon Unë C, perceptohet nga përdoruesi dhe përfshihet prej tij në të ardhmen në thesarin e tij.

Natyra e kësaj varësie është paraqitur në Fig. 1. Konsideroni dy raste kufizuese, kur sasia e informacionit semantik Unë Cështë 0:

Sp= 0 përdoruesi nuk e percepton, nuk e kupton informacionin në hyrje;

Sp përdoruesi di gjithçka, dhe ai nuk ka nevojë për informacionin hyrës.

Tema 2. Bazat e përfaqësimit dhe përpunimit të informacionit në një kompjuter

Letërsia

1. Informatika në Ekonomi: Teksti mësimor / Ed. B.E. Odintsova, A.N. Romanova. - M .: Libri shkollor Vuzovsky, 2008.

2. Informatikë: Lëndë bazë: Teksti mësimor / Ed. S.V. Simonovich. - Shën Petersburg: Peter, 2009.

3. Shkenca kompjuterike. Lëndë e përgjithshme: Libër mësuesi / Bashkëautor: A.N. Guda, M.A. Butakova, N.M. Nechitailo, A.V. Chernov; Nën total ed. NË DHE. Kolesnikov. – M.: Dashkov i K, 2009.

4. Informatika për ekonomistët: Teksti mësimor / Ed. Matyushka V.M. - M.: Infra-M, 2006.

5. Informatika ekonomike: Hyrje në analizën ekonomike të sistemeve të informacionit - M.: INFRA-M, 2005.

Masat e informacionit (sintaksore, semantike, pragmatike)

Qasje të ndryshme mund të përdoren për të matur informacionin, por më të zakonshmet janë statistikore(probabilist), semantike dhe n ragmatike metodat.

Statistikore Metoda (probabiliste) e matjes së informacionit u zhvillua nga C. Shannon në vitin 1948, i cili propozoi të konsiderohej sasia e informacionit si një masë e pasigurisë së gjendjes së sistemit, e hequr si rezultat i marrjes së informacionit. Pasiguria sasiore quhet entropi. Nëse, pas marrjes së një mesazhi, vëzhguesi ka marrë informacion shtesë për sistemin X, pasiguria zvogëlohet. Sasia shtesë e informacionit të marrë përcaktohet si:

ku është një sasi shtesë informacioni rreth sistemit X marrë në formën e një mesazhi;

Pasiguria fillestare (entropia) e sistemit X;

Pasiguria e fundme (entropia) e sistemit x, pas marrjes së mesazhit.

Nëse sistemi X mund të jetë në një nga gjendjet diskrete, numri i të cilave n, dhe probabiliteti për të gjetur sistemin në secilën prej tyre është i barabartë me dhe shuma e probabiliteteve të të gjitha gjendjeve është e barabartë me një, atëherë entropia llogaritet me formulën Shannon:

ku është entropia e sistemit X;

por- baza e logaritmit, e cila përcakton njësinë e matjes së informacionit;

n– numri i gjendjeve (vlerave) në të cilat mund të vendoset sistemi.

Entropia është një vlerë pozitive, dhe meqenëse probabilitetet janë gjithmonë më pak se një, dhe logaritmi i tyre është negativ, prandaj, shenja minus në formulën e K. Shannon-it e bën entropinë pozitive. Kështu, e njëjta entropi, por me shenjë të kundërt, merret si masë e sasisë së informacionit.

Marrëdhënia midis informacionit dhe entropisë mund të kuptohet si më poshtë: marrja e informacionit (rritja e tij) njëkohësisht nënkupton një ulje të injorancës ose pasigurisë së informacionit (entropia).

Kështu, qasja statistikore merr parasysh probabilitetin e shfaqjes së mesazheve: mesazhi që është më pak i mundshëm konsiderohet më informativ, d.m.th. më pak e pritur. Sasia e informacionit arrin vlerën maksimale nëse ngjarjet janë po aq të mundshme.

R. Hartley propozoi formulën e mëposhtme për matjen e informacionit:

I=log2n ,

ku n- numri i ngjarjeve po aq të mundshme;

Unë– masa e informacionit në mesazh për ndodhjen e një prej n ngjarjet

Matja e informacionit shprehet në vëllimin e tij. Më shpesh kjo ka të bëjë me sasinë e memories së kompjuterit dhe sasinë e të dhënave të transmetuara përmes kanaleve të komunikimit. Një njësi merret si një sasi e tillë informacioni në të cilën pasiguria është përgjysmuar, një njësi e tillë informacioni quhet pak .

Nëse logaritmi natyror () përdoret si bazë e logaritmit në formulën Hartley, atëherë njësia e informacionit është nat ( 1 bit = ln2 ≈ 0,693 nat). Nëse numri 3 përdoret si bazë e logaritmit, atëherë - i rëndomtë, nëse 10, atëherë - dit (hartley).

Në praktikë, një njësi më e madhe përdoret më shpesh - bajt(bajt) është tetë bit. Kjo njësi u zgjodh sepse mund të përdoret për të koduar cilindo nga 256 karakteret e alfabetit të tastierës së kompjuterit (256=28).

Përveç bajteve, informacioni matet me gjysmë fjalë (2 bajt), fjalë (4 bajt) dhe dy fjalë (8 bajt). Njësi edhe më të mëdha informacioni përdoren gjithashtu gjerësisht:

1 kilobajt (KB - kilobajt) = 1024 bajte = 210 bajte,

1 megabajt (MB - megabajt) = 1024 KB = 220 bajt,

1 Gigabajt (GB - gigabajt) = 1024 MB = 230 bajt.

1 terabajt (TB - terabajt) = 1024 GB = 240 bajt,

1 Petabajt (PB - petabyte) = 1024 TB = 250 bajt.

Në vitin 1980, matematikani rus Yu. Manin propozoi idenë e ndërtimit të një kompjuteri kuantik, në lidhje me të cilin një njësi e tillë informacioni u shfaq si kubit ( bit kuantik, kubit ) - "bit kuantik" - një masë e sasisë së kujtesës në një formë teorikisht të mundshme të një kompjuteri që përdor bartës kuantikë, për shembull, rrotullimet e elektroneve. Një kubit mund të marrë jo dy vlera të ndryshme ("0" dhe "1"), por disa, që korrespondojnë me kombinimet e normalizuara të dy gjendjeve bazë të rrotullimit, gjë që jep një numër më të madh kombinimesh të mundshme. Kështu, 32 kubit mund të kodojnë rreth 4 miliardë gjendje.

qasje semantike. Një masë sintaksore nuk mjafton nëse doni të përcaktoni jo sasinë e të dhënave, por sasinë e informacionit të nevojshëm në mesazh. Në këtë rast, merret parasysh aspekti semantik, i cili lejon përcaktimin e përmbajtjes së informacionit.

Për të matur përmbajtjen semantike të informacionit, mund të përdorni thesaurusin e marrësit të tij (konsumatorit). Ideja e metodës së tezaurit u propozua nga N. Wiener dhe u zhvillua nga shkencëtari ynë vendas A.Yu. Schrader.

thesaurus thirrur trupi i informacionit mbajtur nga marrësi i informacionit. Ndërlidhja e thesarit me përmbajtjen e mesazhit të marrë ju lejon të zbuloni se sa e redukton pasigurinë.

Varësia e sasisë së informacionit semantik të mesazhit nga thesaurus i marrësit

Sipas varësisë së treguar në grafik, nëse përdoruesi nuk ka ndonjë thesaurus (njohuri për thelbin e mesazhit në hyrje, domethënë = 0), ose prania e një thesaurus të tillë që nuk ka ndryshuar si rezultat i mesazhi (), atëherë sasia e informacionit semantik në të është e barabartë me zero. Tesaurus optimal () do të jetë i tillë, në të cilin sasia e informacionit semantik do të jetë maksimale (). Për shembull, informacioni semantik në një mesazh në hyrje gjuha e huaj e panjohur do të jetë zero, por situata do të jetë e njëjtë nëse nëse mesazhi nuk është më lajm, sepse përdoruesi tashmë di gjithçka.

masë pragmatike informacion përcakton dobinë e tij në arritjen e qëllimeve të konsumatorit. Për ta bërë këtë, mjafton të përcaktoni probabilitetin e arritjes së qëllimit para dhe pas marrjes së mesazhit dhe t'i krahasoni ato. Vlera e informacionit (sipas A.A. Kharkevich) llogaritet me formulën:

ku është probabiliteti për të arritur qëllimin përpara se të merrni mesazhin;

Probabiliteti i arritjes së fushës së qëllimit të marrjes së mesazhit;

Sasia dhe cilësia e informacionit

Nivelet e problemeve të komunikimit

Gjatë zbatimit të proceseve të informacionit, ka gjithmonë një transferim të informacionit në hapësirë ​​dhe kohë nga burimi i informacionit te marrësi (marrësi) duke përdorur sinjale. Sinjali - një proces (dukuri) fizik që mbart një mesazh (informacion) për një ngjarje ose gjendjen e një objekti vëzhgimi.

Mesazh- forma e paraqitjes së informacionit në formën e një grupi shenjash (simbolesh) që përdoren për transmetim.

Një mesazh si një grup shenjash nga pikëpamja e semiotikës - një shkencë që studion vetitë e shenjave dhe sistemeve të shenjave - mund të studiohet në tre nivele:

1) sintaksore, ku merren parasysh vetitë e brendshme të mesazheve, d.m.th., marrëdhëniet ndërmjet shenjave që pasqyrojnë strukturën e një sistemi të caktuar shenjash.

2) semantike, ku analizohet marrëdhënia ndërmjet shenjave dhe objekteve, veprimeve, cilësive që ato përcaktojnë, pra përmbajtja semantike e mesazhit, lidhja e tij me burimin e informacionit;

3) pragmatike, ku merret parasysh marrëdhënia ndërmjet mesazhit dhe marrësit, pra përmbajtja konsumatore e mesazhit, raporti i tij me marrësin.

Problemet nivel sintaksor kanë të bëjnë me krijimin e bazave teorike për ndërtimin e sistemeve të informacionit. Në këtë nivel, merren parasysh problemet e dërgimit të mesazheve te marrësi si një grup karakteresh, duke marrë parasysh llojin e medias dhe mënyrën e paraqitjes së informacionit, shpejtësinë e transmetimit dhe përpunimit, madhësitë e kodeve të përfaqësimit të informacionit, besueshmërinë. dhe saktësinë e konvertimit të këtyre kodeve, etj., duke abstraguar plotësisht nga përmbajtja semantike e mesazheve dhe qëllimi i tyre i synuar. Në këtë nivel, informacioni i marrë vetëm nga pozicionet sintaksore zakonisht quhet të dhëna, pasi ana semantike nuk ka rëndësi në këtë rast.

Problemet niveli semantik janë të lidhura me formalizimin dhe duke marrë parasysh kuptimin e informacionit të transmetuar, duke përcaktuar shkallën e korrespondencës midis imazhit të objektit dhe vetë objektit. Në këtë nivel, analizohet informacioni që pasqyron informacioni, merren parasysh marrëdhëniet semantike, formohen koncepte dhe ide, zbulohet kuptimi dhe përmbajtja e informacionit dhe kryhet përgjithësimi i tij.



Në nivel pragmatik të interesuar për pasojat e marrjes dhe përdorimit të këtij informacioni nga konsumatori. Problemet në këtë nivel lidhen me përcaktimin e vlerës dhe dobisë së përdorimit të informacionit në zhvillimin e një vendimi nga ana e konsumatorit për të arritur qëllimin e tij. Vështirësia kryesore këtu është se vlera, dobia e informacionit mund të jetë krejtësisht e ndryshme për marrës të ndryshëm dhe, përveç kësaj, varet nga një sërë faktorësh, të tillë si, për shembull, afati kohor i dorëzimit dhe përdorimit të tij.

Masat e Informacionit

Masat e informacionit të nivelit sintaksor

Për të matur informacionin në nivelin sintaksor, futen dy parametra: sasia e informacionit (të dhënave) - V D(qasja vëllimore) dhe sasia e informacionit - Unë(qasja e entropisë).

Sasia e informacionit V D. Gjatë zbatimit të proceseve të informacionit, informacioni transmetohet në formën e një mesazhi, i cili është një grup karakteresh të një alfabeti. Nëse sasia e informacionit që përmban një mesazh me një karakter merret si një, atëherë sasia e informacionit (të dhënave) V D në çdo mesazh tjetër do të jetë i barabartë me numrin e karaktereve (shifrave) në këtë mesazh.

Pra, në sistemin e numrave dhjetorë, një shifër ka një peshë të barabartë me 10, dhe, në përputhje me rrethanat, njësia e informacionit do të jetë dit (shifër dhjetore). Në këtë rast, një mesazh në formë n V D= P dit. Për shembull, numri katërshifror 2003 ka një madhësi të dhënash V D = 4 dit.

Në sistemin e numrave binar, një shifër ka një peshë të barabartë me 2, dhe, në përputhje me rrethanat, njësia e informacionit do të jetë pak (bit (shifër binare)- shifra binare). Në këtë rast, një mesazh në formë n-numri bit ka vëllim të dhënash V D \u003d n pak. Për shembull, kodi binar tetë-bit 11001011 ka një madhësi të dhënash V D= 8 bit.

Në teknologjinë moderne kompjuterike, së bashku me bitin minimal të njësisë së të dhënave, përdoret gjerësisht njësia e zmadhuar e bajtit e barabartë me 8 bit. Kur punoni me sasi të mëdha informacioni, përdoren njësi më të mëdha matëse për të llogaritur sasinë e tij, si kilobajt (kbajt), megabajt (MB), gigabajt (GB), terabajt (TB):

1 kbajt = 1024 bajte = 2 10 bajte;

1 MB = 1024 kB = 220 byte = 1048576 bajte;

1 GB = 1024 MB = 230 byte = 1,073,741,824 bytes; .

1 TB = 1024 GB = 240 byte = 1,099,511,627,776 byte.

Sasia e informacionit I (qasja e entropisë). Në teorinë e informacionit dhe kodimit, është miratuar një qasje entropike për matjen e informacionit. Kjo qasje bazohet në faktin se fakti i marrjes së informacionit shoqërohet gjithmonë me një ulje të diversitetit ose pasigurisë (entropisë) të sistemit. Bazuar në këtë, sasia e informacionit në një mesazh përcaktohet si një masë për të reduktuar pasigurinë e gjendjes së një sistemi të caktuar pas marrjes së mesazhit. Sapo vëzhguesi identifikonte diçka në sistemin fizik, entropia e sistemit zvogëlohej, pasi sistemi bëhej më i rregulluar për vëzhguesin.

Kështu, me qasjen e entropisë, informacioni kuptohet si vlera sasiore e pasigurisë që është zhdukur gjatë çdo procesi (teste, matje, etj.). Në këtë rast, entropia futet si masë e pasigurisë H, dhe sasia e informacionit është:

ku H prill - entropi a priori për gjendjen e sistemit në studim;

Happs- entropi a posteriori.

A posteriori- që vijnë nga përvoja (teste, matje).

A priori- një koncept që karakterizon njohuritë që i paraprijnë përvojës (testit), dhe të pavarur nga ajo.

Në rastin kur gjatë testimit hiqet pasiguria ekzistuese (fitohet një rezultat specifik, d.m.th. Happs = 0), sasia e informacionit të marrë përkon me entropinë fillestare

Le të konsiderojmë një burim diskret informacioni (një burim mesazhesh diskrete) si sistemin në studim, me të cilin nënkuptojmë një sistem fizik që ka një grup të kufizuar gjendjesh të mundshme. Ky grup POR= (a 1, a 2 , ..., a p) gjendjet e sistemit në teorinë e informacionit quhet alfabeti abstrakt ose alfabeti i burimit të mesazhit.

Shtetet e ndara a 1, a 2,..., a " quhen shkronja ose simbole të alfabetit.

Një sistem i tillë mund të marrë rastësisht një nga grupet e fundme të gjendjeve të mundshme në çdo moment të kohës edhe une .

Meqenëse disa gjendje zgjidhen nga burimi më shpesh, ndërsa të tjerat janë më pak të zakonshme, në rastin e përgjithshëm karakterizohet nga një ansambël POR, d.m.th., një grup i plotë gjendjesh me probabilitetet e shfaqjes së tyre, të cilat mblidhen deri në një:

, dhe (2.2)

Le të paraqesim një masë të pasigurisë në zgjedhjen e gjendjes së burimit. Mund të konsiderohet gjithashtu si një masë e sasisë së informacionit të marrë me eliminimin e plotë të pasigurisë në lidhje me gjendjet ekuiprobabile të burimit.

Pastaj në N=1 marrim NË)= 0.

Kjo masë u propozua nga shkencëtari amerikan R. Hartley në vitin 1928. Baza e logaritmit në formulën (2.3) nuk ka rëndësi themelore dhe përcakton vetëm shkallën ose njësinë matëse.Në varësi të bazës së logaritmit, njësitë e mëposhtme të matjes janë përdorur.

1. Bit - ndërsa baza e logaritmit është 2:

(2.4)

2. Thitrat - ndërsa baza e logaritmit është e:

3. Dita - ndërsa baza e logaritmit është 10:

Në shkencat kompjuterike, formula (2.4) zakonisht përdoret si masë e pasigurisë. Në këtë rast, njësia e pasigurisë quhet njësi binare, ose bit, dhe përfaqëson pasigurinë e zgjedhjes nga dy ngjarje po aq të mundshme.

Formula (2.4) mund të merret në mënyrë empirike: për të hequr pasigurinë në një situatë të dy ngjarjeve njësoj të mundshme, nevojitet një përvojë dhe, në përputhje me rrethanat, një grimë informacioni, me një pasiguri të përbërë nga katër ngjarje po aq të mundshme, mjaftojnë 2 bit informacioni. për të marrë me mend faktin e dëshiruar. Për të përcaktuar një kartë nga një kuvertë me 32 letra, mjaftojnë 5 bit informacioni, domethënë mjafton të bëni pesë pyetje po ose jo për të përcaktuar kartën e dëshiruar.

Masa e propozuar lejon zgjidhjen e problemeve të caktuara praktike kur të gjitha gjendjet e mundshme të burimit të informacionit kanë të njëjtën probabilitet.

Në rastin e përgjithshëm, shkalla e pasigurisë në zbatimin e gjendjes së burimit të informacionit varet jo vetëm nga numri i gjendjeve, por edhe nga probabilitetet e këtyre gjendjeve. Nëse një burim informacioni ka, për shembull, dy gjendje të mundshme me probabilitet 0.99 dhe 0.01, atëherë pasiguria e tij e zgjedhjes është shumë më e vogël se ajo e një burimi që ka dy gjendje po aq të mundshme, pasi në këtë rast rezultati është praktikisht një përfundim i paracaktuar ( realizimi shtetëror, probabiliteti i cili është i barabartë me 0,99).

Shkencëtari amerikan K. Shannon përgjithësoi konceptin e masës së pasigurisë së zgjedhjes H në rastin kur H varet jo vetëm nga numri i gjendjeve, por edhe nga probabilitetet e këtyre gjendjeve (probabilitetet p i përzgjedhja e personazheve a i, alfabeti A). Kjo masë, e cila është pasiguria për shtet mesatarisht, quhet entropia e një burimi diskret informacioni:

(2.5)

Nëse përsëri përqendrohemi në matjen e pasigurisë në njësi binare, atëherë baza e logaritmit duhet të merret e barabartë me dy:

(2.6)

Në një zgjedhje po aq të mundshme, probabiliteti p i =1/N formula (2.6) është shndërruar në formulën e R. Hartley (2.3):

Masa e propozuar u quajt entropi jo rastësisht. Çështja është se struktura formale e shprehjes (2.5) përkon me entropinë e sistemit fizik, të përcaktuar më herët nga Boltzmann.

Duke përdorur formulat (2.4) dhe (2.6), mund të përcaktojmë tepricën D alfabeti i burimit të mesazhit POR, e cila tregon se sa racionalisht përdoren simbolet e një alfabeti të caktuar:

ku H max (A) - entropia maksimale e mundshme, e përcaktuar me formulën (2.4);

NË) - entropia e burimit, e përcaktuar me formulën (2.6).

Thelbi i kësaj mase është se me një zgjedhje po aq të mundshme, e njëjta ngarkesë informacioni në shenjë mund të sigurohet duke përdorur një alfabet të një vëllimi më të vogël sesa në rastin e një zgjedhjeje jo të mundshme.

Artikujt kryesorë të lidhur