Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ
  • në shtëpi
  • Këshilla
  • Masat sintaksore, semantike dhe pragmatike të informacionit. Masat dhe njësitë e sasisë dhe vëllimit të informacionit

Masat sintaksore, semantike dhe pragmatike të informacionit. Masat dhe njësitë e sasisë dhe vëllimit të informacionit

Masa sintaksore e informacionit

Si masë sintaksore, sasia e informacionit përfaqëson sasinë e të dhënave.

O madhësia e të dhënave V d në mesazhin "in" matet numri i karaktereve (biteve) në këtë mesazh. Siç e përmendëm, në sistemin binar, njësia matëse është biti. Në praktikë, së bashku me këtë njësi "më të vogël" të matjes së të dhënave, shpesh përdoret një njësi më e madhe - bajt i barabartë me 8 bit... Për lehtësi, kilo- (10 3), mega- (10 6), giga- (10 9) dhe tera- (10 12) bajt, etj. përdoren si matës. Bajtët, të njohur për të gjithë, masin vëllimin e mesazheve të shkruara të shkurtra, librave të trashë, veprave muzikore, fotografive, si dhe produkteve softuerike. Është e qartë se kjo masë nuk mund të karakterizojë në asnjë mënyrë se çfarë dhe pse mbartin këto njësi informacioni. Matni në kilobajt romanin e L.N. "Lufta dhe Paqja" e Tolstoit është e dobishme, për shembull, për të kuptuar nëse ai mund të përshtatet në hapësirën e lirë të një hard disk. Kjo është po aq e dobishme sa matja e madhësisë së një libri - lartësia, trashësia dhe gjerësia e tij - për të vlerësuar nëse do të përshtatet në një raft librash apo do ta peshojë atë për të parë nëse portofoli do të mbajë peshën e kombinuar.

Kështu që. Një masë sintaksore e informacionit nuk mjafton qartë për të karakterizuar mesazhin: në shembullin tonë me motin, në rastin e fundit, mesazhi i shokut përmbante një sasi jo zero të dhënash, por nuk përmbante informacionin që na nevojitej. Përfundimi për dobinë e informacionit rrjedh nga shqyrtimi i përmbajtjes së mesazhit. Për të matur përmbajtjen semantike të informacionit, d.m.th. sasinë e tij në nivel semantik, do të prezantojmë konceptin e "tezaurit të marrësit të informacionit".

Një thesaurus është një koleksion informacioni dhe lidhjesh ndërmjet tyre, të cilat i ka marrësi i informacionit. Mund të themi se thesaurus është njohuria e akumuluar e marrësit.

Në një rast shumë të thjeshtë, kur marrësi është një pajisje teknike - një kompjuter personal, thesaurus formohet nga "arma" e kompjuterit - programe dhe pajisje të ngulitura në të që ju lejojnë të merrni, përpunoni dhe prezantoni mesazhe me tekst në të ndryshme. gjuhë që përdorin alfabete të ndryshme, fonte, si dhe informacione audio dhe video nga një rrjet lokal ose mbarëbotëror. Nëse kompjuteri juaj nuk ka një kartë ndërfaqe rrjeti, nuk mund të prisni të merrni mesazhe nga përdoruesit e tjerë të rrjetit në çfarëdo forme. Mungesa e drejtuesve me fontet ruse nuk do të lejojë punën me mesazhe në Rusisht, etj.

Nëse marrësi është një person, thesaurus i tij është gjithashtu një lloj armatimi intelektual i një personi, një arsenal i njohurive të tij. Ai gjithashtu formon një lloj filtri për mesazhet hyrëse. Mesazhi i marrë përpunohet duke përdorur njohuritë e disponueshme për të marrë informacion. Nëse thesaurus është shumë i pasur, atëherë arsenali i njohurive është i thellë dhe i larmishëm, ai do t'ju lejojë të nxirrni informacion nga pothuajse çdo mesazh. Një thesar i vogël me pak njohuri mund të bëhet pengesë për të kuptuar mesazhet që kërkojnë përgatitje më të mirë.


Sidoqoftë, vini re se vetëm të kuptuarit e mesazhit nuk mjafton për të ndikuar në vendimmarrje - ai duhet të përmbajë informacionin e nevojshëm për këtë, i cili nuk është në thesarin tonë dhe që ne duam ta përfshijmë në të. Në rastin e motit, thesaurus ynë nuk kishte informacionin më të fundit, "të përditësuar" për motin në zonën e universitetit. Nëse mesazhi që marrim ndryshon thesarin tonë, zgjedhja jonë e zgjidhjes mund të ndryshojë. Një ndryshim i tillë në thesaurus shërben si një masë semantike e sasisë së informacionit, një lloj matës i dobisë së mesazhit të marrë.

Formalisht, sasia e informacionit semantik Unë jam, i përfshirë më tej në thesaurus, përcaktohet nga lidhja e tezaurit të marrësit S i, dhe përmbajtjen e informacionit të transmetuar në mesazhin "në" S. Një pamje grafike e kësaj varësie është paraqitur në Fig. 1.

Konsideroni rastet kur sasia e informacionit semantik Unë s e barabartë me ose afër zeros:

Për S i= 0 marrësi nuk e percepton informacionin në hyrje;

Në 0< Si< S 0 получатель воспринимает, но не понимает поступившую в сообщении информацию;

Për S i- »∞marrësi ka njohuri gjithëpërfshirëse dhe informacioni i ardhur nuk mund të plotësojë thesarin e tij.

Oriz. Varësia e sasisë së informacionit semantik nga thesaurus i marrësit

Me një thesaurus S i> S 0 sasia e informacionit semantik Unë s marrë nga mesazhi i bashkangjitur β informacion Snë fillim rritet me shpejtësi me rritjen e thesarit të vetë marrësit, dhe atëherë - duke u nisur nga një vlerë S i - ... Rënia e sasisë së informacionit të dobishëm për marrësin është për faktin se baza e njohurive të marrësit është bërë mjaft solide dhe bëhet gjithnjë e më e vështirë ta befasosh atë me diçka të re.

Kjo mund të ilustrohet me shembullin e studentëve që studiojnë informatikë ekonomike dhe lexojnë materiale nga faqet në IP të korporatës. . Në fillim, kur formohen njohuritë e para për sistemet e informacionit, leximi jep pak - ka shumë terma të pakuptueshëm, shkurtesa, madje edhe titujt nuk janë të gjithë të qartë. Këmbëngulja në leximin e librave, ndjekja e leksioneve dhe seminareve, komunikimi me profesionistët ndihmojnë në rimbushjen e tezaurit. Me kalimin e kohës, leximi i materialeve të faqes bëhet i këndshëm dhe i dobishëm, dhe deri në fund të karrierës suaj profesionale - pasi keni shkruar shumë artikuj dhe libra - marrja e informacionit të ri të dobishëm nga një faqe e njohur do të ndodhë shumë më rrallë.

Mund të flasim për optimalin për këtë informacion S thesaurus i marrësit, në të cilin ai do të marrë informacionin maksimal Is, si dhe informacionin optimal në mesazhin "c" për këtë thesaurus. Sj. Në shembullin tonë, kur marrësi është një kompjuter, thesaurus optimal do të thotë që hardueri i tij dhe softueri i instaluar perceptojnë dhe interpretojnë saktë për përdoruesin të gjithë karakteret që përmbahen në mesazhin "B" që përcjellin kuptimin e informacionit. S. Nëse mesazhi përmban karaktere që nuk korrespondojnë me përmbajtjen e tezaurit, disa informacione do të humbasin dhe vlera Unë s do të ulet.

Nga ana tjetër, nëse e dimë se marrësi nuk është në gjendje të marrë tekste në rusisht (kompjuteri i tij nuk ka drejtuesit e nevojshëm), dhe gjuhët e huaja në të cilat mund të dërgohet mesazhi ynë, as ai dhe as ne nuk kemi studiuar, transmetojmë informacionin e nevojshëm ne mund t'i drejtohemi transliterimit - shkrimi i teksteve ruse duke përdorur shkronja të një alfabeti të huaj që perceptohet mirë nga kompjuteri i marrësit. Kjo do të sjellë informacionin tonë në përputhje me thesarin e kompjuterit të marrësit. Mesazhi do të duket i shëmtuar, por marrësi do të jetë në gjendje të lexojë të gjithë informacionin e nevojshëm.

Kështu, sasia maksimale e informacionit semantik është nga mesazhi β marrësi fiton kur bie dakord për përmbajtjen semantike të tij S c thesaurus Si,(në Si = Sj zgjedh). Informacioni nga i njëjti mesazh mund të ketë përmbajtje domethënëse për një përdorues kompetent dhe të jetë i pakuptimtë për një përdorues të paaftë. Sasia e informacionit semantik në një mesazh të marrë nga përdoruesi është një vlerë individuale, e personalizuar - në kontrast me informacionin sintaksor. Sidoqoftë, informacioni semantik matet në të njëjtën mënyrë si informacioni sintaksor - në bit dhe bajt.

Masa relative e sasisë së informacionit semantik është koeficienti i përmbajtjes C, i cili përcaktohet si raporti i sasisë së informacionit semantik me vëllimin e tij të të dhënave. V d, të përfshira në mesazh β:

C = Is / Vd

Leksioni 2 ne disiplinen "Informatike dhe TIK"

Ndërveprimi i informacionit. Metodat e transferimit të informacionit. Klasifikimi i informacionit.

Koncepti i informacionit. Vetitë e informacionit. Format e paraqitjes së informacionit.

Informacion (nga lat. Informatio - "shpjegim, prezantim, vetëdije") - informacion për diçka, pavarësisht nga forma e paraqitjes së tyre.

Informacioni mund të ndahet në lloje sipas kritereve të ndryshme:

nga mënyra e perceptimit:

Vizual - perceptohet nga organet e vizionit.

Auditori - perceptohet nga organet e dëgjimit.

Prek - Perceptohet nga receptorët e prekshëm.

I nuhatur - perceptohet nga receptorët e nuhatjes.

Gustatory - perceptohet nga buds shije.

nga forma e prezantimit:

Teksti - transmetohet në formën e simboleve të destinuara për të treguar shenjat e gjuhës.

Numerike - në formën e numrave dhe shenjave që tregojnë veprime matematikore.

Grafik - në formën e imazheve, objekteve, grafikëve.

Tingulli - gojor ose në formë regjistrimi dhe transmetimi të leksemave gjuhësore me mjete dëgjimore.

me takim:

Massive - përmban informacione të parëndësishme dhe funksionon me një sërë konceptesh që janë të kuptueshme për shumicën e shoqërisë.

Speciale - përmban një grup specifik konceptesh, kur përdoren, transmetohen informacione që mund të mos kuptohen nga pjesa më e madhe e shoqërisë, por janë të nevojshme dhe të kuptueshme brenda një grupi të ngushtë shoqëror ku përdoret ky informacion.

Sekret - transmetohet në një rreth të ngushtë njerëzish dhe përmes kanaleve të mbyllura (të mbrojtura).

Personal (privat) - një grup informacioni për një person që përcakton statusin shoqëror dhe llojet e ndërveprimeve shoqërore brenda popullatës.

sipas vlerës:

Relevant - informacion që është i vlefshëm në një kohë të caktuar.

I besueshëm - informacioni i marrë pa shtrembërim.

E kuptueshme - informacion i shprehur në një gjuhë që është e kuptueshme për personin të cilit i është menduar.

I plotë - informacion i mjaftueshëm për të marrë një vendim ose kuptim të saktë.

E dobishme - dobia e informacionit përcaktohet nga subjekti që ka marrë informacionin, në varësi të fushës së mundësive për përdorimin e tij.

ne te vertete:

e vërtetë

Në informatikë, lënda e studimit të informacionit janë pikërisht të dhënat: mënyrat e krijimit, ruajtjes, përpunimit dhe transmetimit të tyre.

Transferimi i informacionit është procesi i transferimit të tij hapësinor nga burimi te marrësi (adresuesi). Një person mësoi të transmetojë dhe të marrë informacion edhe para se ta ruante atë. Fjalimi është një metodë transmetimi që paraardhësit tanë të largët e përdornin në kontakt të drejtpërdrejtë (bisedë) - ne ende e përdorim atë tani. Për të transmetuar informacion në distanca të gjata, është e nevojshme të përdoren procese informacioni shumë më komplekse.



Për të realizuar një proces të tillë, informacioni duhet të zyrtarizohet (prezantohet) në një farë mënyre. Për të përfaqësuar informacionin, përdoren sisteme të ndryshme shenjash - grupe simbolesh semantike të dakorduara paraprakisht: objekte, fotografi, fjalë të shkruara ose të shtypura të një gjuhe natyrore. Informacioni semantik për një objekt, fenomen ose proces të paraqitur me ndihmën e tyre quhet mesazh.

Natyrisht, për të transmetuar një mesazh në një distancë, informacioni duhet të transferohet në një lloj transportuesi celular. Mediat mund të lëvizin nëpër hapësirë ​​duke përdorur automjete, siç është rasti me letrat e dërguara me postë. Kjo metodë siguron besueshmëri të plotë të transferimit të informacionit, pasi adresuesi merr mesazhin origjinal, por kërkon një kohë të konsiderueshme për të transferuar. Që nga mesi i shekullit të 19-të, metodat e transmetimit të informacionit janë bërë të përhapura, duke përdorur një mjet informacioni që përhapet natyrshëm - lëkundjet elektromagnetike (lëkundjet elektrike, valët e radios, dritën). Pajisjet që zbatojnë procesin e transmetimit të të dhënave formojnë sisteme komunikimi. Në varësi të mënyrës së paraqitjes së informacionit, sistemet e komunikimit mund të ndahen në shenja (telegraf, telefaks), zë (telefon), video dhe sisteme të kombinuara (televizion). Sistemi më i zhvilluar i komunikimit në kohën tonë është Interneti.

Njësitë e informacionit përdoren për të matur karakteristika të ndryshme që lidhen me informacionin.

Më shpesh, matja e informacionit ka të bëjë me matjen e kapacitetit të memories kompjuterike (pajisjet e ruajtjes) dhe matjen e sasisë së të dhënave të transmetuara përmes kanaleve të komunikimit dixhital. Më rrallë, sasia e informacionit matet.

Biti (shifra binar në anglisht - një numër binar; gjithashtu lojë me fjalë: bit anglisht - një copë, një grimcë) është një njësi për matjen e sasisë së informacionit, e barabartë me një bit në sistemin e numrave binar. Përcaktuar në përputhje me GOST 8.417-2002

Claude Shannon në 1948 sugjeroi përdorimin e fjalës bit për të treguar njësinë më të vogël të informacionit:

Biti është logaritmi binar i probabilitetit të ngjarjeve ekuiprobabile ose shuma e produkteve të probabilitetit dhe logaritmi binar i probabilitetit për ngjarjet ekuiprobabile; shih entropinë e informacionit.

Biti është njësia bazë e matjes së sasisë së informacionit, e barabartë me sasinë e informacionit që përmban një eksperiment që ka dy rezultate po aq të mundshme; shih entropinë e informacionit. Kjo është identike me sasinë e informacionit në përgjigjen e një pyetjeje që lejon përgjigjet "po" ose "jo" dhe asnjë tjetër (d.m.th., sasia e informacionit që ju lejon t'i përgjigjeni pa mëdyshje pyetjes së parashtruar).

Masa sintaksore e informacionit

Shfaqja e informologjisë si shkencë mund t'i atribuohet fundit të viteve 50 të shekullit tonë, kur inxhinieri amerikan R. Hartley bëri një përpjekje për të futur një masë sasiore të informacionit të transmetuar përmes kanaleve të komunikimit. Le të shqyrtojmë një situatë të thjeshtë loje. Përpara se të marrë një mesazh në lidhje me rezultatin e një hedhjeje monedhe, një person është në një gjendje pasigurie për rezultatin e hedhjes së ardhshme. Mesazhi i partnerit jep informacion që e largon këtë pasiguri. Vini re se numri i rezultateve të mundshme në situatën e përshkruar është i barabartë me 2, ato janë të barabarta (njëlloj të mundshme) dhe sa herë që informacioni i transmetuar largon plotësisht pasigurinë që rezulton. Hartley mori "sasinë e informacionit" të transmetuar në kanalin e komunikimit në lidhje me dy rezultate të barabarta dhe largon pasigurinë duke ia dhënë njërit prej tyre, si një njësi informacioni të quajtur "bit".

Masa semantike e informacionit

Një fazë e re në zgjerimin teorik të konceptit të informacionit lidhet me kibernetikën - shkencën e kontrollit dhe komunikimit në organizmat e gjallë, shoqërinë dhe makinat. Duke mbetur në pozicionet e qasjes së Shannon-it, kibernetika formulon parimin e unitetit të informacionit dhe kontrollit, i cili është veçanërisht i rëndësishëm për analizimin e thelbit të proceseve që ndodhin në sistemet biologjike dhe sociale vetëqeverisëse, vetëorganizuese. Koncepti i zhvilluar në veprat e N. Wiener supozon se procesi i kontrollit në këto sisteme është një proces i përpunimit (transformimit) nga një pajisje qendrore e informacionit të marrë nga burimet e informacionit parësor (receptorët ndijor) dhe transferimi i tij në ato pjesë të sistemi ku perceptohet nga elementet e tij si urdhër për të kryer një veprim. Pas përfundimit të vetë veprimit, receptorët ndijor janë gati të transmetojnë informacione për situatën e ndryshuar në mënyrë që të kryejnë një cikël të ri kontrolli. Kështu organizohet një algoritëm ciklik (sekuencë veprimesh) për menaxhimin dhe qarkullimin e informacionit në sistem. Është e rëndësishme këtu që rolin kryesor luan këtu përmbajtja e informacionit të transmetuar nga receptorët dhe pajisja qendrore. Informacioni, sipas Wiener, është "përcaktimi i përmbajtjes së marrë nga bota e jashtme në procesin e përshtatjes sonë me të dhe shqisave tona që përshtaten me të".

Masa pragmatike e informacionit

Në konceptet pragmatike të informacionit, ky aspekt është qendror, gjë që çon në nevojën për të marrë parasysh vlerën, dobinë, efikasitetin, ekonominë e informacionit, d.m.th. ato nga cilësitë e tij që ndikojnë në mënyrë vendimtare në sjelljen e sistemeve kibernetike vetëorganizuese, vetëqeverisëse, të qëllimshme (biologjike, sociale, njerëzore-makineri).

Një nga përfaqësuesit më të ndritshëm të teorive pragmatike të informacionit është modeli i sjelljes së komunikimit - modeli biheviorist i Ackoff-Miles. Pika fillestare në këtë model është synimi i marrësit të informacionit për të zgjidhur një problem specifik. Marrësi është në një "gjendje të qëllimshme" nëse ai përpiqet për diçka dhe ka mënyra alternative të efektivitetit të pabarabartë për të arritur qëllimin. Një mesazh i dërguar një marrësi është informativ nëse ndryshon "gjendjen e tij të qëllimshme".

Meqenëse "gjendja e qëllimshme" karakterizohet nga sekuenca e veprimeve të mundshme (alternativat), efektiviteti i veprimit dhe rëndësia e rezultatit, mesazhi i transmetuar te marrësi mund të ndikojë në të tre komponentët në shkallë të ndryshme. Në përputhje me këtë, informacioni i transmetuar ndryshon në lloje në "informues", "udhëzues" dhe "motivues". Kështu, për marrësin, vlera pragmatike e mesazhit qëndron në faktin se ai e lejon atë të përvijojë një strategji sjelljeje në arritjen e qëllimit duke ndërtuar përgjigje për pyetjet: çfarë, si dhe pse të bëjë në çdo hap tjetër? Për çdo lloj informacioni, modeli i sjelljes ofron masën e vet dhe vlera totale pragmatike e informacionit përcaktohet si funksion i diferencës midis këtyre sasive në "gjendjen e qëllimshme" para dhe pas ndryshimit të tij në një "gjendje të re të qëllimshme". .

Sasia dhe cilësia e informacionit

Nivelet e problemeve të komunikimit

Gjatë zbatimit të proceseve të informacionit, informacioni gjithmonë transferohet në hapësirë ​​dhe kohë nga burimi i informacionit te marrësi (marrësi) duke përdorur sinjale. Sinjali - një proces (dukuri) fizik që mbart një mesazh (informacion) për një ngjarje ose gjendje të një objekti vëzhgimi.

Mesazh- forma e paraqitjes së informacionit në formën e një koleksioni të shenjave (simboleve) të përdorura për transmetim.

Komunikimi si një grup shenjash nga pikëpamja e semiotikës - një shkencë që studion vetitë e shenjave dhe sistemeve të shenjave - mund të studiohet në tre nivele:

1) sintaksore, ku merren parasysh vetitë e brendshme të mesazheve, domethënë, marrëdhënia midis shenjave, duke pasqyruar strukturën e një sistemi të caktuar shenjash.

2) semantike, ku analizohet marrëdhënia midis shenjave dhe objekteve, veprimeve, cilësive të përcaktuara prej tyre, domethënë përmbajtja semantike e mesazhit, lidhja e tij me burimin e informacionit;

3) pragmatike, ku merret parasysh marrëdhënia ndërmjet mesazhit dhe marrësit, pra përmbajtja konsumatore e mesazhit, raporti i tij me marrësin.

Problemet nivel sintaksor kanë të bëjnë me krijimin e bazave teorike për ndërtimin e sistemeve të informacionit. Në këtë nivel, merren parasysh problemet e dërgimit të mesazheve te marrësi si një grup karakteresh, duke marrë parasysh llojin e mediumit dhe mënyrën e paraqitjes së informacionit, shpejtësinë e transmetimit dhe përpunimit, madhësinë e kodeve të prezantimit të informacionit, besueshmërinë. dhe saktësia e konvertimit të këtyre kodeve, etj., duke abstraguar plotësisht nga përmbajtja semantike e mesazheve dhe qëllimi i tyre i synuar. Në këtë nivel, informacioni i konsideruar vetëm nga pikëpamja sintaksore zakonisht quhet të dhëna, pasi ana semantike nuk ka rëndësi.

Problemet niveli semantik shoqërohen me formalizimin dhe marrjen parasysh të kuptimit të informacionit të transmetuar, duke përcaktuar shkallën e korrespondencës midis imazhit të objektit dhe vetë objektit. Në këtë nivel analizohet informacioni që pasqyron informacionin, merren parasysh lidhjet semantike, formohen koncepte dhe përfaqësime, zbulohet kuptimi, përmbajtja e informacionit dhe kryhet përgjithësimi i tij.



Në nivel pragmatik të interesuar për pasojat e marrjes dhe përdorimit të këtij informacioni nga konsumatori. Problemet në këtë nivel lidhen me përcaktimin e vlerës dhe dobisë së përdorimit të informacionit kur konsumatori zhvillon një zgjidhje për të arritur qëllimin e tij. Vështirësia kryesore këtu është se vlera, dobia e informacionit mund të jetë krejtësisht e ndryshme për marrës të ndryshëm dhe, përveç kësaj, varet nga një sërë faktorësh, siç është koha e dorëzimit dhe përdorimit të tij.

Masat e informacionit

Masat e informacionit të nivelit sintaksor

Për të matur informacionin në nivelin sintaksor, futen dy parametra: sasia e informacionit (të dhënave) - V D(qasja vëllimore) dhe sasia e informacionit - Unë(qasja e entropisë).

Sasia e informacionit V D. Gjatë zbatimit të proceseve të informacionit, informacioni transmetohet në formën e një mesazhi, i cili është një koleksion simbolesh të një alfabeti. Nëse sasia e informacionit që përmban një mesazh me një karakter merret si njësi, atëherë sasia e informacionit (të dhënave) V D në çdo mesazh tjetër do të jetë i barabartë me numrin e karaktereve (shifrave) në këtë mesazh.

Pra, në sistemin e numrave dhjetorë, një shifër ka një peshë të barabartë me 10, dhe në përputhje me rrethanat njësia e matjes së informacionit do të jetë dit (vend dhjetor). Në këtë rast, mesazhi në formë n V D= P dit. Për shembull, numri katërshifror 2003 ka sasinë e të dhënave V D = 4 dit.

Në sistemin binar, një bit ka një peshë të barabartë me 2, dhe në përputhje me rrethanat njësia e informacionit do të jetë pak (bit (shifër binare)- shifra binare). Në këtë rast, mesazhi në formë n-numri bit ka sasinë e të dhënave V D = n pak. Për shembull, binar 11001011 me tetë bit ka një madhësi të dhënash V D= 8 bit.

Në informatikë moderne, së bashku me njësinë minimale të matjes së bitave të të dhënave, përdoret gjerësisht një njësi matëse e zmadhuar e bajteve, e barabartë me 8 bit. Kur punoni me sasi të mëdha informacioni, për të llogaritur sasinë e tij, përdoren njësi më të mëdha matëse, si kilobajt (KB), megabajt (MB), gigabajt (GB), terabajt (TB):

1 kbajt = 1024 bajte = 2 10 bajte;

1 MB = 1024 kB = 2 20 bajte = 1 048 576 bajte;

1 GB = 1024 MB = 2 30 bajt = 1 073 741 824 bajte; ...

1 TB = 1024 GB = 2 40 bajte = 1,099 511 627 776 bajte.

Sasia e informacionit I (qasja e entropisë). Në teorinë e informacionit dhe kodimit, është miratuar një qasje entropike për matjen e informacionit. Kjo qasje bazohet në faktin se fakti i marrjes së informacionit shoqërohet gjithmonë me një ulje të diversitetit ose pasigurisë (entropisë) të sistemit. Bazuar në këtë, sasia e informacionit në një mesazh përcaktohet si një masë e reduktimit të pasigurisë së gjendjes së një sistemi të caktuar pas marrjes së një mesazhi. Sapo vëzhguesi identifikonte diçka në sistemin fizik, entropia e sistemit zvogëlohej, pasi sistemi bëhej më i rregulluar për vëzhguesin.

Kështu, me qasjen e entropisë, informacioni kuptohet si vlera sasiore e pasigurisë që u zhduk gjatë një procesi (testimi, matja, etj.). Në këtë rast, entropia futet si masë e pasigurisë H, dhe sasia e informacionit është e barabartë me:

ku H prill - entropi a priori për gjendjen e sistemit në studim;

H apsështë entropia e pasme.

A posteriori- me origjinë nga përvoja (teste, matje).

A priori- një koncept që karakterizon njohuritë para përvojës (testit), dhe të pavarur nga ajo.

Në rastin kur gjatë testimit hiqet pasiguria ekzistuese (fitohet një rezultat specifik, d.m.th. H aps = 0), sasia e informacionit të marrë përkon me entropinë fillestare

Le të konsiderojmë një burim diskret informacioni (një burim mesazhesh diskrete) si sistemin në studim, me të cilin nënkuptojmë një sistem fizik që ka një grup të kufizuar gjendjesh të mundshme. Kjo turmë A= (a 1, a 2 , ..., a n) gjendjet e sistemit në teorinë e informacionit quhet alfabeti abstrakt ose alfabeti i burimit të mesazhit.

Shtetet individuale a 1, a 2, ..., a " quhen shkronja ose simbole të alfabetit.

Një sistem i tillë në çdo kohë mund të supozojë rastësisht një nga grupet e fundme të gjendjeve të mundshme a i.

Meqenëse disa gjendje zgjidhen nga burimi më shpesh dhe të tjera më rrallë, atëherë në rastin e përgjithshëm karakterizohet nga ansambli A, domethënë një grup i plotë gjendjesh me probabilitetet e shfaqjes së tyre, të cilat mblidhen deri në një:

, dhe (2.2)

Le të paraqesim një masë të pasigurisë në zgjedhjen e gjendjes burimore. Mund të konsiderohet gjithashtu si një masë e sasisë së informacionit të marrë me eliminimin e plotë të pasigurisë për gjendjet ekuiprobabile të burimit.

Pastaj në N = 1 marrim NË)= 0.

Kjo masë u propozua nga shkencëtari amerikan R. Hartley në vitin 1928. Baza e logaritmit në formulën (2.3) nuk ka rëndësi themelore dhe përcakton vetëm shkallën ose njësinë matëse.Në varësi të bazës së logaritmit, njësitë e mëposhtme të matjes janë përdorur.

1. Bit - ndërsa baza e logaritmit është 2:

(2.4)

2. Thitrat - ndërsa baza e logaritmit është e:

3. Dits - ndërsa baza e logaritmit është 10:

Në shkencat kompjuterike, formula (2.4) zakonisht përdoret si masë e pasigurisë. Në këtë rast, njësia e pasigurisë quhet një njësi binare, ose bit, dhe përfaqëson pasigurinë e zgjedhjes së dy ngjarjeve po aq të mundshme.

Formula (2.4) mund të merret në mënyrë empirike: për të hequr pasigurinë në një situatë me dy ngjarje të barabarta, kërkohet një eksperiment dhe, në përputhje me rrethanat, një bit informacioni, me një pasiguri të përbërë nga katër ngjarje të barabarta, mjaftojnë 2 bit informacioni për të hamendësuar. faktin e dëshiruar. Për të përcaktuar një kartë nga një kuvertë me 32 letra, mjaftojnë 5 bit informacioni, domethënë mjafton të bëni pesë pyetje me përgjigje "po" ose "jo" për të përcaktuar kartën e dëshiruar.

Masa e propozuar lejon që dikush të zgjidhë disa probleme praktike kur të gjitha gjendjet e mundshme të burimit të informacionit kanë të njëjtin probabilitet.

Në rastin e përgjithshëm, shkalla e pasigurisë në realizimin e gjendjes së burimit të informacionit varet jo vetëm nga numri i gjendjeve, por edhe nga probabilitetet e këtyre gjendjeve. Nëse burimi i informacionit ka, për shembull, dy gjendje të mundshme me probabilitet 0,99 dhe 0,01, atëherë pasiguria e zgjedhjes është shumë më e vogël se ajo e burimit që ka dy gjendje të barabarta, pasi në këtë rast rezultati është praktikisht një përfundim i paramenduar ( realizimi i gjendjes, probabiliteti i cili është 0.99).

Shkencëtari amerikan K. Shannon përgjithësoi konceptin e masës së pasigurisë së zgjedhjes H në rast se H varet jo vetëm nga numri i gjendjeve, por edhe nga probabilitetet e këtyre gjendjeve (probabilitetet p i përzgjedhja e personazheve edhe une, alfabeti A). Kjo masë, e cila është pasiguria mesatare për shtet, quhet entropia e një burimi diskret informacioni:

(2.5)

Nëse përsëri fokusohemi në matjen e pasigurisë në njësitë binare, atëherë baza e logaritmit duhet të merret e barabartë me dy:

(2.6)

Me zgjedhje të barabarta, probabiliteti p i = 1 / N formula (2.6) është shndërruar në formulën e R. Hartley (2.3):

Masa e propozuar u quajt entropi për një arsye. Çështja është se struktura formale e shprehjes (2.5) përkon me entropinë e sistemit fizik, të përcaktuar më herët nga Boltzmann.

Duke përdorur formulat (2.4) dhe (2.6), mund të përcaktohet teprica D alfabeti i burimit të mesazhit A, e cila tregon se sa racionalisht janë përdorur simbolet e këtij alfabeti:

ku H max (A) - entropia maksimale e mundshme, e përcaktuar me formulën (2.4);

NË) - entropia e burimit, e përcaktuar me formulën (2.6).

Thelbi i kësaj mase është se me një zgjedhje të barabartë të mundshme, e njëjta ngarkesë informative në një karakter mund të sigurohet duke përdorur një alfabet më të vogël sesa në rastin e një zgjedhjeje të pabarabartë.

Klasifikimi i masave

Masat e informacionit

Format e mjaftueshmërisë së informacionit

Përshtatshmëria e informacionit mund të shprehet në tre forma: semantike, sintaksore, pragmatike.

Mjaftueshmëria sintaksore. Ai pasqyron karakteristikat formale dhe strukturore të informacionit dhe nuk ndikon në përmbajtjen e tij semantike. Në rrafshin sintaksor merret parasysh lloji i mediumit dhe mënyra e paraqitjes së informacionit, shpejtësia e transmetimit dhe e përpunimit, madhësia e kodeve për paraqitjen e tij, besueshmëria dhe saktësia e konvertimit të këtyre kodeve etj. në këtë rast ana semantike nuk ka rëndësi.

Përshtatshmëria semantike (semantike). Kjo formë përcakton shkallën e korrespondencës midis imazhit të objektit dhe vetë objektit. Aspekti semantik përfshin marrjen parasysh të përmbajtjes semantike të informacionit. Në këtë nivel analizohet informacioni që pasqyron informacionin, merren parasysh lidhjet semantike. Në informatikë krijohen lidhje semantike ndërmjet kodeve për paraqitjen e informacionit. Kjo formë shërben për të formuar koncepte dhe paraqitje, për të identifikuar kuptimin, përmbajtjen e informacionit dhe përgjithësimin e tij.

Përshtatshmëria pragmatike (konsumatore). pasqyron marrëdhënien e informacionit dhe konsumatorit të tij, përputhshmërinë e informacionit me qëllimin e menaxhimit, i cili zbatohet në bazë të tij. Vetitë pragmatike të informacionit manifestohen vetëm në prani të unitetit të informacionit (objektit), përdoruesit dhe qëllimit të menaxhimit. Aspekti pragmatik i konsideratës lidhet me vlerën, dobinë e përdorimit të informacionit në zhvillimin e një zgjidhjeje konsumatore për të arritur qëllimin e tij.

Për të matur informacionin prezantohen dy parametra: sasia e informacionit I dhe sasia e të dhënave V. Këta parametra kanë shprehje dhe interpretime të ndryshme në varësi të formës së konsideruar të përshtatshmërisë. Çdo formë e përshtatshmërisë ka masën e vet të sasisë së informacionit dhe sasisë së të dhënave (Fig. 2.1).

Vëllimi i të dhënave V d në një mesazh matet me numrin e karaktereve (biteve) në këtë mesazh. Në sisteme të ndryshme numrash, një shifër ka një peshë të ndryshme dhe njësia e matjes së të dhënave ndryshon në përputhje me rrethanat:

  • në sistemin binar, njësia e matjes është pak (bit - shifër binare);
  • në shënimin dhjetor, njësia matëse është dit (vend dhjetor).


Oriz. 2.1. Masat e informacionit

Sasia e informacionit Unë në nivelin sintaksor nuk mund të përkufizohet pa marrë parasysh konceptin e pasigurisë së gjendjes së sistemit (entropia e sistemit). Në të vërtetë, marrja e informacionit për një sistem shoqërohet gjithmonë me një ndryshim në shkallën e injorancës së marrësit për gjendjen e këtij sistemi. Le të shqyrtojmë këtë koncept.


Le të, përpara marrjes së informacionit, konsumatori të ketë disa informacione paraprake (apriori) për sistemin a. Masa e mosnjohjes së tij ndaj sistemit është funksioni H (a), i cili në të njëjtën kohë shërben si masë e pasigurisë së gjendjes së sistemit.

Pas marrjes së një mesazhi b, marrësi mori disa informacione shtesë I b (a), të cilat reduktuan injorancën e tij të mëparshme, kështu që pasiguria a posteriori (pas marrjes së mesazhit b) për gjendjen e sistemit u bë Hb (a).

Pastaj sasia e informacionit I b (a) për sistemin e marrë në mesazhin b do të përcaktohet si

I b (a) = H (a) -H b (a),

ato. sasia e informacionit matet duke ndryshuar (ulur) pasigurinë e gjendjes së sistemit.

Nëse pasiguria përfundimtare e sistemit H b (a) zhduket, atëherë njohuritë fillestare jo të plota do të zëvendësohen me njohuri të plotë dhe sasinë e informacionit I b (a) = H (a). Me fjale te tjera, entropia e sistemit H (a) mund të shihet si një masë e informacionit që mungon.

Entropia e sistemit H (a), i cili ka N gjendje të mundshme, sipas formulës së Shannon-it, është

,

ku P i është probabiliteti që sistemi të jetë në gjendjen i-të.

Për rastin kur të gjitha gjendjet e sistemit janë njëlloj të mundshme, d.m.th. probabilitetet e tyre janë të barabarta me P i =, entropia e saj përcaktohet nga relacioni

.

Informacioni shpesh kodohet me kode numerike në një ose një sistem tjetër numrash, kjo është veçanërisht e rëndësishme kur paraqitni informacion në një kompjuter. Natyrisht, i njëjti numër shifrash në sisteme të ndryshme numrash mund të përcjellë një numër të ndryshëm gjendjesh të objektit të shfaqur, i cili mund të përfaqësohet si një relacion

ku N është numri i gjendjeve të ndryshme të shfaqura;

m - baza e sistemit të numrave (larmia e simboleve të përdorura në alfabet);

n është numri i shifrave (karaktereve) në mesazh.

Logaritmet më të përdorura janë binar dhe dhjetor. Njësitë matëse në këto raste do të jenë përkatësisht bit dhe dit.

Koeficienti (shkalla) e përmbajtjes së informacionit(konciziteti) i mesazhit përcaktohet nga raporti i sasisë së informacionit me sasinë e të dhënave, d.m.th.

Y = 1 / V d dhe 0

Me një rritje në Y, sasia e punës për të transformuar informacionin (të dhënat në sistem) zvogëlohet. Prandaj, ata përpiqen të rrisin përmbajtjen e informacionit, për të cilën po zhvillohen metoda të veçanta të kodimit optimal të informacionit.


Për të matur përmbajtjen semantike të informacionit, d.m.th. sasia e tij në nivelin semantik, masa e thesarit, e cila lidh vetitë semantike të informacionit me aftësinë e përdoruesit për të marrë një mesazh në hyrje, mori njohjen më të madhe. Për këtë përdoret koncepti thesaurus përdorues.

Thesaurusështë një koleksion informacioni i mbajtur nga një përdorues ose një sistem.

Në varësi të marrëdhënies midis përmbajtjes semantike të informacionit S dhe tezaurit të përdoruesit S p, sasia e informacionit semantik I c, të perceptuar nga përdoruesi dhe më pas të përfshira prej tij në thesarin e tij, ndryshon. Natyra e kësaj varësie është paraqitur në Fig. 2.2.



Oriz. 2.2. Varësia e sasisë së informacionit semantik të perceptuar nga konsumatori

Konsideroni dy raste kufizuese kur sasia e informacionit semantik I c
është e barabartë me 0:

  • kur S p = 0, përdoruesi nuk e percepton, nuk e kupton informacionin në hyrje;
  • për S p ® ¥, përdoruesi di gjithçka dhe nuk ka nevojë për informacionin hyrës.

Konsumatori fiton sasinë maksimale të informacionit semantik I c kur përmbajtja e tij semantike S është e koordinuar me tezaurin e tij S p (S p = S p opt), kur informacioni hyrës është i kuptueshëm për përdoruesin dhe e mban atë të panjohur më parë (mungon në të thesaurus) informacion.

Rrjedhimisht, sasia e informacionit semantik në mesazh, sasia e njohurive të reja të marra nga përdoruesi është një vlerë relative. I njëjti mesazh mund të ketë përmbajtje semantike për një përdorues kompetent dhe të jetë i pakuptimtë (zhurmë semantike) për një përdorues të paaftë.

Kur vlerësoni aspektin semantik (kuptimor) të informacionit, është e nevojshme të përpiqeni të pajtoni vlerat e S dhe S p.

Faktori i përmbajtjes C mund të shërbejë si një masë relative e sasisë së informacionit semantik, i cili përcaktohet si raporti i sasisë së informacionit semantik me vëllimin e tij:


Masa sintaksore e informacionit.

Kjo masë e sasisë së informacionit vepron me informacion jopersonal që nuk shpreh një marrëdhënie semantike me objektin. Vëllimi i të dhënave Vd në këtë rast mesazhi matet me numrin e karaktereve (biteve) në mesazh. Në sisteme të ndryshme numrash, një shifër ka një peshë të ndryshme dhe njësia matëse e të dhënave ndryshon në përputhje me rrethanat.

Për shembull, në sistemin binar, njësia e matjes është bit (shifra bit-binare - pak). Pak është përgjigjja për një pyetje binare ("po" ose "jo"; "0" ose "1"), e transmetuar përmes kanaleve të komunikimit duke përdorur një sinjal. Kështu, sasia e informacionit që përmban mesazhi në bit përcaktohet nga numri i fjalëve binare të gjuhës natyrore, numri i karaktereve në secilën fjalë dhe numri i sinjaleve binare të nevojshme për të shprehur çdo karakter.

Në kompjuterët modernë, së bashku me njësinë minimale të të dhënave "bit", përdoret gjerësisht një njësi matëse e zgjeruar "byte", e barabartë me 8 bit. Në shënimin dhjetor, njësia matëse është "bit" (vend dhjetor).

Sasia e informacionit I në nivel sintaksor, është e pamundur të përkufizohet pa marrë parasysh konceptin e pasigurisë së gjendjes së sistemit (entropia e sistemit). Në të vërtetë, marrja e informacionit për një sistem shoqërohet gjithmonë me një ndryshim në shkallën e injorancës së marrësit për gjendjen e këtij sistemi, d.m.th. sasia e informacionit matet duke ndryshuar (ulur) pasigurinë e gjendjes së sistemit.

Koeficienti (shkalla) e përmbajtjes së informacionit(konciziteti) i mesazhit përcaktohet nga raporti i sasisë së informacionit me sasinë e të dhënave, d.m.th.

Y = I / Vd, dhe 0

Me zmadhim Y zvogëlohet sasia e punës për transformimin e informacionit (të dhënave) në sistem. Prandaj, ata përpiqen të rrisin përmbajtjen e informacionit, për të cilën po zhvillohen metoda të veçanta të kodimit optimal të informacionit.

Masa semantike e informacionit

Për të matur përmbajtjen semantike të informacionit, d.m.th. sasia e tij në nivelin semantik, masa e thesarit, e cila lidh vetitë semantike të informacionit me aftësinë e përdoruesit për të marrë një mesazh në hyrje, mori njohjen më të madhe. Për këtë përdoret koncepti thesaurus i përdoruesit.

Thesaurusështë një koleksion informacioni i mbajtur nga një përdorues ose një sistem.

Në varësi të marrëdhënies ndërmjet përmbajtjes semantike të informacionit S dhe thesaurus i përdoruesit Sr sasia e informacionit semantik ndryshon është, perceptohet nga përdoruesi dhe përfshihet prej tij në të ardhmen në thesarin e tij.

Natyra e kësaj varësie është paraqitur në Fig. 1. Konsideroni dy raste kufizuese kur sasia e informacionit semantik Isështë e barabartë me 0:

Sr= 0 përdoruesi nuk e percepton, nuk e kupton informacionin në hyrje;

Sr përdoruesi di gjithçka, dhe ai nuk ka nevojë për informacionin hyrës.

Artikujt kryesorë të lidhur