Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ

Masa sintaksore e informacionit. Kodimi i të dhënave të tekstit

Gjatë zbatimit të proceseve të informacionit, ka gjithmonë një transferim të informacionit në hapësirë ​​dhe kohë nga burimi i informacionit te marrësi (marrësi). Në të njëjtën kohë, shenja ose simbole të ndryshme përdoren për të transmetuar informacion, për shembull, gjuhë natyrore ose artificiale (formale), duke lejuar që ajo të shprehet në një formë të quajtur mesazh.

Mesazh- forma e paraqitjes së informacionit në formën e një grupi shenjash (simbolesh) që përdoren për transmetim.

Mesazhi si një grup shenjash nga pikëpamja e semiotikës ( nga greqishtja setneion - shenjë, shenjë) - një shkencë që studion vetitë e shenjave dhe sistemeve të shenjave - mund të studiohet në tre nivele:

1) sintaksor , ku merren parasysh vetitë e brendshme të mesazheve, d.m.th., marrëdhëniet midis shenjave që pasqyrojnë strukturën e një sistemi të caktuar shenjash. Vetitë e jashtme studiohen në nivele semantike dhe pragmatike. Në këtë nivel, merren parasysh problemet e dërgimit të mesazheve te marrësi si një grup karakteresh, duke marrë parasysh llojin e medias dhe mënyrën e paraqitjes së informacionit, shpejtësinë e transmetimit dhe përpunimit, madhësitë e kodeve të përfaqësimit të informacionit, besueshmërinë. dhe saktësinë e konvertimit të këtyre kodeve, etj., duke abstraguar plotësisht nga përmbajtja semantike e mesazheve dhe qëllimi i tyre i synuar. Në këtë nivel, informacioni i marrë vetëm nga pozicionet sintaksore zakonisht quhet të dhëna, pasi ana semantike nuk ka rëndësi në këtë rast.

Teoria moderne e informacionit hulumton kryesisht problemet e këtij niveli. Ai mbështetet në konceptin e "sasës së informacionit", që është një masë e shpeshtësisë së përdorimit të shenjave, e cila në asnjë mënyrë nuk pasqyron as kuptimin dhe as rëndësinë e mesazheve të transmetuara. Në këtë drejtim, ndonjëherë thuhet se teoria moderne e informacionit është në nivelin sintaksor.

2) semantike , i cili analizon marrëdhëniet midis shenjave dhe objekteve, veprimeve, cilësive që ato tregojnë, d.m.th. përmbajtjen semantike të mesazhit, lidhjen e tij me burimin e informacionit. Problemet e nivelit semantik shoqërohen me formalizimin dhe marrjen në konsideratë të kuptimit të informacionit të transmetuar, duke përcaktuar shkallën e korrespondencës midis imazhit të objektit dhe vetë objektit. Në këtë nivel, analizohet informacioni që pasqyron informacioni, merren parasysh marrëdhëniet semantike, formohen koncepte dhe ide, zbulohet kuptimi dhe përmbajtja e informacionit dhe kryhet përgjithësimi i tij.

3) pragmatike , ku merret parasysh marrëdhënia ndërmjet mesazhit dhe marrësit, pra përmbajtja konsumatore e mesazhit, raporti i tij me marrësin.

Në këtë nivel janë me interes pasojat e marrjes dhe përdorimit të këtij informacioni nga konsumatori. Problemet në këtë nivel lidhen me përcaktimin e vlerës dhe dobisë së përdorimit të informacionit në zhvillimin e një vendimi nga ana e konsumatorit për të arritur qëllimin e tij. Vështirësia kryesore këtu është se vlera, dobia e informacionit mund të jetë krejtësisht e ndryshme për marrës të ndryshëm dhe, përveç kësaj, varet nga një sërë faktorësh, të tillë si, për shembull, afati kohor i dorëzimit dhe përdorimit të tij.


Për secilin nga nivelet e mësipërme të problemeve të transmetimit të informacionit, ekzistojnë qasje për matjen e sasisë së informacionit dhe masat e tyre të informacionit. Ekzistojnë, përkatësisht, masa të informacionit të nivelit sintaksor, semantik dhe nivelit pragmatik.

Masat e informacionit të nivelit sintaksor. Vlerësimi sasior i informacionit në këtë nivel nuk lidhet me përmbajtjen e informacionit, por funksionon me informacion jopersonal që nuk shpreh një marrëdhënie semantike me objektin. Në këtë drejtim, kjo masë bën të mundur vlerësimin e flukseve të informacionit në objekte të natyrës së ndryshme si sistemet e komunikimit, kompjuterët, sistemet e kontrollit, sistemi nervor i një organizmi të gjallë etj.

Për të matur informacionin në nivelin sintaksor, futen dy parametra: sasia e informacionit (të dhënave) - V d(qasja vëllimore) dhe sasia e informacionit - Unë(qasja e entropisë).

Vëllimi i informacionit V d (qasja vëllimore). Gjatë zbatimit të proceseve të informacionit, informacioni transmetohet në formën e një mesazhi, i cili është një grup karakteresh të një alfabeti. Për më tepër, çdo karakter i ri në mesazh rrit sasinë e informacionit të përfaqësuar nga sekuenca e karaktereve të alfabetit të dhënë. Nëse tani sasia e informacionit që përmban një mesazh me një karakter merret si një, atëherë sasia e informacionit (të dhënave) V d në çdo mesazh tjetër do të jetë e barabartë me numrin e karaktereve (shifrave) në këtë mesazh. Meqenëse i njëjti informacion mund të përfaqësohet në mënyra të ndryshme (duke përdorur alfabete të ndryshme), njësia e informacionit (të dhënat) do të ndryshojë në përputhje me rrethanat.

Pra, në sistemin e numrave dhjetorë, një shifër ka një peshë të barabartë me 10, dhe, në përputhje me rrethanat, njësia e informacionit do të jetë dit (vend decimal P P dit. Për shembull, një numër katërshifror 2009 ka një vëllim të dhënash V d = 4 dit.

Në sistemin e numrave binar, një shifër ka një peshë të barabartë me 2, dhe, në përputhje me rrethanat, njësia e informacionit do të jetë pak (bit (shifër binare)). Në këtë rast, një mesazh në formë n-numri bit ka sasinë e të dhënave V d = P pak. Për shembull, kodi binar me tetë bit 11001011 ka një vëllim të dhënash V d = 8 bit.

Në informatikë moderne, së bashku me njësinë minimale të matjes së të dhënave pak Njësi matëse e përmbledhur e përdorur zakonisht bajt, e barabartë me 8 bit. Janë tetë bit që kërkohen për të koduar cilindo nga 256 karakteret e alfabetit të tastierës së kompjuterit (256=28).

Kur punoni me sasi të mëdha informacioni, njësi më të mëdha matëse përdoren për të llogaritur sasinë e tij:

1 Kilobyte (KB) = 1024 byte = 2 10 bytes,

1 Megabajt (MB) = 1024 KB = 220 byte = 1,048,576 byte;

1 Gigabajt (GB) = 1024 MB = 230 byte = 1,073,741,824 byte;

Kohët e fundit, për shkak të rritjes së vëllimit të informacionit të përpunuar, janë nxjerrë njësi të tilla si:

1 Terabajt (TB) = 1024 GB = 240 byte = 1,099,511,627,776 byte;

1 Petabyte (PB) = 1024 TB = 250 byte = 1,125,899,906,842,624 bytes.

Duhet të theksohet se në sistemin e matjes së informacionit binar (kompjuterik), ndryshe nga sistemi metrik, njësitë me prefikset "kilo", "mega", etj. fitohen duke shumëzuar njësinë kryesore jo me 10 3 \u003d 1000, 10 6 \u003d 1,000,000, etj., dhe në 2 10 = 1024, 2 20 = 1,048,576, etj.

Sasia e informacionit I (qasja e entropisë). Në teorinë e informacionit dhe kodimit, është miratuar një qasje entropike për matjen e informacionit. Kjo qasje bazohet në faktin se fakti i marrjes së informacionit shoqërohet gjithmonë me një ulje të diversitetit ose pasigurisë (entropisë) të sistemit. Nisur nga kjo, sasia e informacionit në një mesazh përcaktohet si një masë për të reduktuar pasigurinë e gjendjes së një sistemi të caktuar pas marrjes së mesazhit. Pasiguria mund të interpretohet në kuptimin se sa pak di një vëzhgues për një sistem të caktuar. Sapo vëzhguesi identifikonte diçka në sistemin fizik, entropia e sistemit zvogëlohej, pasi sistemi bëhej më i rregulluar për vëzhguesin.

Kështu, me qasjen e entropisë informacioni kuptohet si vlera sasiore e pasigurisë që është zhdukur gjatë rrjedhës së çdo procesi (teste, matje, etj.). Në këtë rast, entropia futet si masë e pasigurisë H, dhe sasia e informacionit është:

I = H apr – H aps

ku, H apr - entropi a priori për gjendjen e sistemit ose procesit në studim;

H aps është entropia a posteriori.

A posteriori (nga lat. a posteriori - nga sa vijon) - me origjinë nga përvoja (teste, matje).

A priori (nga lat. a priori - nga e mëparshmja) është një koncept që karakterizon njohuritë që i paraprijnë përvojës (testit), dhe janë të pavarura prej saj.

Në rastin kur gjatë testit u hoq pasiguria ekzistuese (është marrë një rezultat specifik, d.m.th. H = 0), sasia e informacionit të marrë përkon me entropinë fillestare.

Le të konsiderojmë një burim diskret informacioni (një burim mesazhesh diskrete) si sistemi në studim, me të cilin nënkuptojmë një sistem fizik që ka një grup të kufizuar gjendjesh të mundshme ( a i}, i = .

Të vendosur të gjithë A \u003d (a 1, a 2, ... dhe n) gjendjet e sistemit në teorinë e informacionit quhet alfabeti abstrakt ose alfabeti i burimit të mesazhit.

Shtetet e ndara a 1, a 2,..., a n quhen shkronja ose simbole të alfabetit.

Një sistem i tillë mund të marrë rastësisht një nga grupet e fundme të gjendjeve të mundshme në çdo moment të kohës a i. Thuhet se gjendje të ndryshme realizohen si rezultat i zgjedhjes së tyre nga burimi.

Marrësi i informacionit (mesazhit) ka një ide të caktuar për ndodhjen e mundshme të ngjarjeve të caktuara. Këto paraqitje janë përgjithësisht jo të besueshme dhe shprehen me probabilitetet me të cilat ai pret këtë apo atë ngjarje. Masa e përgjithshme e pasigurisë (entropia) karakterizohet nga njëfarë varësie matematikore nga këto probabilitete, sasia e informacionit në mesazh përcaktohet nga sa zvogëlohet masa e pasigurisë pas marrjes së mesazhit.

Le ta shpjegojmë këtë ide me një shembull.

Supozoni se kemi 32 karta të ndryshme. Mundësia për të zgjedhur një kartë nga kuverta është 32. Përpara se të bëni një zgjedhje, është e natyrshme të supozoni se shanset për të zgjedhur një kartë të veçantë janë të njëjta për të gjitha letrat. Duke bërë një zgjedhje, ne e eliminojmë këtë pasiguri. Në këtë rast, pasiguria mund të karakterizohet nga numri i zgjedhjeve të mundshme ekuiprobabile. Nëse tani përcaktojmë sasinë e informacionit si masë për eliminimin e pasigurisë, atëherë informacioni i marrë si rezultat i zgjedhjes mund të karakterizohet me numrin 32. Megjithatë, është më i përshtatshëm të përdoret jo vetë ky numër, por logaritmi i vlerësimi i marrë më sipër në bazën 2:

ku m është numri i zgjedhjeve të mundshme po aq të mundshme (Kur m=2, marrim informacion në një bit). Kjo është, në rastin tonë

H = log 2 32 = 5.

Qasja e deklaruar i përket matematikanit anglez R. Hartley (1928). Ka një interpretim interesant. Karakterizohet nga numri i pyetjeve me përgjigje "po" ose "jo", duke ju lejuar të përcaktoni se cilën kartë ka zgjedhur personi. Mjaftojnë 5 pyetje.

Nëse, kur zgjedh një kartë, mundësia e shfaqjes së secilës kartë nuk është e njëjtë (shumë e mundshme), atëherë marrim një qasje statistikore për matjen e informacionit të propozuar nga C. Shannon (1948). Në këtë rast, masa e informacionit matet me formulën:

ku pi- probabiliteti i zgjedhjes i personazhi i alfabetit.

Është e lehtë të shihet se nëse probabilitetet p1, ..., p n janë të barabarta, atëherë secili prej tyre është 1/N, dhe formula e Shannon-it kthehet në formulën e Hartley-t.

Masat e informacionit në nivelin semantik. Për të matur përmbajtjen semantike të informacionit, d.m.th., sasinë e tij në nivelin semantik, më i përdoruri është masa e thesarit, e cila lidh vetitë semantike të informacionit me aftësinë e përdoruesit për të marrë një mesazh në hyrje. Në të vërtetë, për të kuptuar dhe përdorur informacionin e marrë, marrësi duhet të ketë një sasi të caktuar njohurish. Injoranca e plotë e temës nuk lejon nxjerrjen e informacionit të dobishëm nga mesazhi i marrë për këtë temë. Me rritjen e njohurive rreth temës, rritet edhe sasia e informacionit të dobishëm që nxirret nga mesazhi.

Nëse njohuritë e marrësit për një subjekt të caktuar i quajmë një thesaurus (d.m.th., një grup i caktuar fjalësh, konceptesh, emrash objektesh të lidhur me lidhje semantike), atëherë sasia e informacionit që përmban një mesazh i caktuar mund të vlerësohet nga shkalla e ndryshimit. në thesarin individual nën ndikimin e këtij mesazhi.

Thesaurus- një grup informacioni që ka një përdorues ose sistem.

Me fjalë të tjera, sasia e informacionit semantik të nxjerrë nga marrësi nga mesazhet hyrëse varet nga shkalla e gatishmërisë së thesarit të tij për perceptimin e një informacioni të tillë.

Në varësi të marrëdhënies ndërmjet përmbajtjes semantike të informacionit S dhe thesaurus i përdoruesit Sp sasia e informacionit semantik ndryshon Unë s, e perceptuar nga përdoruesi dhe e përfshirë prej tij në të ardhmen në thesarin e tij. Natyra e kësaj varësie është paraqitur në Fig. 2.1. Konsideroni dy raste kufizuese, kur sasia e informacionit semantik Ic është e barabartë me 0:

a) kur Sp = 0, përdoruesi nuk e percepton (nuk e kupton) informacionin hyrës;

b) për S -> ∞, përdoruesi "di gjithçka" dhe ai nuk ka nevojë për informacionin hyrës.

Oriz. 1.2. Varësia e sasisë së informacionit semantik,

perceptuar nga konsumatori, nga thesaurus i tij I c \u003d f (S p)

Konsumatori fiton sasinë maksimale të informacionit semantik kur përputhet me përmbajtjen e tij semantike S me thesarin e tij S p (S = S p opt), kur informacioni i marrë është i kuptueshëm për përdoruesin dhe i sjell atij informacion të panjohur më parë (që mungon në thesarin e tij).

Prandaj, sasia e informacionit semantik në mesazh, sasia e njohurive të reja të marra nga përdoruesi, është një vlerë relative. I njëjti mesazh mund të ketë kuptim për një përdorues kompetent dhe të jetë i pakuptimtë për një përdorues të paaftë.

Kur vlerësoni aspektin semantik (kuptimor) të informacionit, është e nevojshme të përpiqeni të harmonizoni vlerat e S dhe Sp.

Një masë relative e sasisë së informacionit semantik mund të jetë faktori i përmbajtjes C, i cili përcaktohet si raporti i sasisë së informacionit semantik me vëllimin e tij:

C \u003d I s / V d

Masat e informacionit në nivel pragmatik. Kjo masë përcakton dobinë e informacionit për të arritur qëllimin e përdoruesit. Kjo masë është gjithashtu një vlerë relative, për shkak të veçorive të përdorimit të këtij informacioni në një sistem të caktuar.

Një nga shkencëtarët e parë rusë, A.A. Kharkevich, i cili propozoi të merret si masë e vlerës së informacionit sasinë e informacionit të nevojshëm për të arritur qëllimin, domethënë të llogaritet rritja në probabilitetin e arritjes së qëllimit. Pra, nëse para marrjes së informacionit, probabiliteti i arritjes së qëllimit ishte p 0, dhe pas marrjes së tij - p 1, atëherë vlera e informacionit përcaktohet si logaritmi i raportit p 1 / p 0:

I \u003d log 2 p 1 - log 2 p 0 \u003d log 2 (p 1 / p 0)

Kështu, vlera e informacionit matet në njësi informacioni, në këtë rast në bit.

Kur vlerësoni informacionin, ka aspekte të tilla si sintaksore, semantike, pragmatike. Aspekti sintaksor lidhet me mënyrën e transmetimit të informacionit, pavarësisht nga cilësitë e tij semantike dhe konsumatore. Në rrafshin sintaksor merren parasysh format e transmetimit dhe të ruajtjes së tij. Në mënyrë tipike, informacioni që do të transmetohet quhet mesazh. Mesazhi mund të përfaqësohet në formën e shenjave dhe simboleve, të shndërrohet në formë elektrike dhe të kodohet, d.m.th. paraqitet në formën e një sekuence të caktuar sinjalesh elektrike që shfaqin në mënyrë unike mesazhet e transmetuara. Karakteristikat e proceseve të transformimit të mesazhit për transmetim përcaktohen nga aspekti sintaksor. Gjatë ruajtjes, aspekti sintaksor përcaktohet nga forma të tjera të paraqitjes së informacionit, të cilat lejojnë mënyrën më të mirë të kërkimit, regjistrimit, përditësimit, ndryshimit të informacionit në infobazë. Informacioni i konsideruar vetëm në lidhje me aspektin sintaksor shpesh referohet si të dhëna. Aspekti semantik përcjell përmbajtjen semantike të informacionit dhe e lidh atë me informacionin e disponueshëm më parë. Lidhjet semantike ndërmjet fjalëve dhe elementeve të tjera të gjuhës pasqyrojnë "tezaur"(Fjalor). Ai përbëhet nga dy pjesë: një listë fjalësh dhe frazash të grupuara sipas kuptimit, dhe një çelës (alfabet) që ju lejon të renditni fjalët në një rend të caktuar. Kur merrni informacion, thesaurus mund të ndryshohet, dhe shkalla e këtij ndryshimi karakterizon sasinë e informacionit të riprodhuar. Aspekti pragmatik përcakton mundësinë e arritjes së qëllimit të caktuar, duke marrë parasysh informacionin e marrë. Ky aspekt pasqyron vetitë e konsumatorit të informacionit - nëse informacioni rezulton i vlefshëm, sjellja e konsumatorit të tij ndryshon në drejtimin e duhur. Aspekti pragmatik manifestohet në praninë e unitetit të konsumatorit dhe qëllimit.

Kështu, informacioni për origjinën dhe shndërrimet e tij kalon në 3 faza, të cilat përcaktojnë aspektet semantike, sintaksore dhe pragmatike të tij. Një person së pari vëzhgon disa fakte të realitetit përreth, të cilat pasqyrohen në formën e një grupi të caktuar të dhënash në mendjen e tij - këtu manifestohet aspekti sintaksor. Pastaj, pas strukturimit të këtyre të dhënave në përputhje me fushën lëndore, një person zyrtarizon njohuritë për strukturën e objektit - kjo aspekti semantik mori informacion. Informacioni në formën e njohurive ka një shkallë të lartë strukturimi, gjë që bën të mundur nxjerrjen e informacionit të plotë për realitetin përreth dhe krijimin e modeleve të informacionit të objekteve në studim. Njeriu më pas përdor njohuritë e marra në praktikën e tij, pra për të arritur qëllimet e tij, gjë që reflekton aspekti pragmatik.

Masa sintaksore e informacionit.

Kjo masë e sasisë së informacionit vepron me informacion jopersonal që nuk shpreh një marrëdhënie semantike me objektin. Vëllimi i të dhënave Vd në këtë rast mesazhi matet me numrin e karaktereve (shifrave) në mesazh. Në sisteme të ndryshme numrash, një shifër ka një peshë të ndryshme dhe njësia e të dhënave ndryshon në përputhje me rrethanat.

Për shembull, në sistemin binar, njësia e matjes është bit (shifra binare bit - shifra binare). Një bit është përgjigja për një pyetje binare ("po" ose "jo"; "0" ose "1") e transmetuar përmes kanaleve të komunikimit duke përdorur një sinjal. Kështu, sasia e informacionit që përmban mesazhi në bit përcaktohet nga numri i fjalëve binare të një gjuhe natyrore, numri i karaktereve në secilën fjalë, numri i sinjaleve binare që kërkohen për të shprehur çdo karakter.

Në kompjuterët modernë, së bashku me njësinë minimale të të dhënave "bit", përdoret gjerësisht njësia e zmadhuar e matjes "byte", e barabartë me 8 bit. Në sistemin e numrave dhjetorë, njësia matëse është "bit" (vend dhjetor).

Sasia e informacionit I në nivelin sintaksor është e pamundur të përcaktohet pa marrë parasysh konceptin e pasigurisë së gjendjes së sistemit (entropia e sistemit). Në të vërtetë, marrja e informacionit për një sistem shoqërohet gjithmonë me një ndryshim në shkallën e injorancës së marrësit për gjendjen e këtij sistemi, d.m.th. sasia e informacionit matet me ndryshimin (uljen) e pasigurisë së gjendjes së sistemit.

Koeficienti (shkalla) e informativitetit(konciziteti) i një mesazhi përcaktohet nga raporti i sasisë së informacionit me sasinë e të dhënave, d.m.th.

Y= I / Vd, me 0

Me rritjen Y zvogëlohet vëllimi i punës për transformimin e informacionit (të dhënave) në sistem. Prandaj, ata përpiqen të rrisin përmbajtjen e informacionit, për të cilën po zhvillohen metoda të veçanta të kodimit optimal të informacionit.

Masa semantike e informacionit

Për të matur përmbajtjen semantike të informacionit, d.m.th. sasia e tij në nivel semantik, më e njohura është masa e thesarit, e cila lidh vetitë semantike të informacionit me aftësinë e përdoruesit për të marrë mesazhin në hyrje. Për këtë përdoret koncepti thesaurus i përdoruesit.

Thesaurusështë një koleksion informacioni që ka një përdorues ose sistem.

Në varësi të marrëdhënies ndërmjet përmbajtjes semantike të informacionit S dhe thesaurus i përdoruesit Sp sasia e informacionit semantik ndryshon Unë C, perceptohet nga përdoruesi dhe përfshihet prej tij në të ardhmen në thesarin e tij.

Natyra e kësaj varësie është paraqitur në Fig. 1. Konsideroni dy raste kufizuese, kur sasia e informacionit semantik Unë Cështë 0:

Sp= 0 përdoruesi nuk e percepton, nuk e kupton informacionin në hyrje;

Sp përdoruesi di gjithçka, dhe ai nuk ka nevojë për informacionin hyrës.

Siç është përmendur tashmë, koncepti i informacionit mund të konsiderohet nën kufizime të ndryshme të vendosura në vetitë e tij, d.m.th. në nivele të ndryshme shqyrtimi. Në thelb, ekzistojnë tre nivele - sintaksore, semantike dhe pragmatike. Prandaj, për secilën prej tyre, përdoren vlerësime të ndryshme për të përcaktuar sasinë e informacionit.

Në nivelin sintaksor, për të vlerësuar sasinë e informacionit, përdoren metoda probabilistike që marrin parasysh vetëm vetitë probabiliste të informacionit dhe nuk marrin parasysh të tjerët (përmbajtja semantike, dobia, rëndësia, etj.). Zhvilluar në mesin e shekullit XX. metodat matematikore dhe, veçanërisht, probabilistike kanë bërë të mundur formimin e një qasjeje për vlerësimin e sasisë së informacionit si një masë për reduktimin e pasigurisë së njohurive.

Kjo qasje, e quajtur edhe probabiliste, postulon parimin se nëse një mesazh çon në një ulje të pasigurisë së njohurive tona, atëherë mund të argumentohet se një mesazh i tillë përmban informacion. Në këtë rast, mesazhet përmbajnë informacion për çdo ngjarje që mund të realizohet me probabilitete të ndryshme.

Formula për përcaktimin e sasisë së informacionit për ngjarje me probabilitete të ndryshme dhe të marra nga një burim diskret informacioni u propozua nga shkencëtari amerikan C. Shannon në 1948. Sipas kësaj formule, sasia e informacionit mund të përcaktohet si më poshtë:

ku Unë- sasia e informacionit; N– numri i ngjarjeve të mundshme (mesazheve); pi– probabiliteti i ngjarjeve (mesazheve) individuale.

Sasia e informacionit e përcaktuar duke përdorur formulën (2.1) merr vetëm një vlerë pozitive. Meqenëse probabiliteti i ngjarjeve individuale është më i vogël se një, atëherë, në përputhje me rrethanat, shprehja log 2 , është një vlerë negative, dhe për të marrë një vlerë pozitive për sasinë e informacionit në formulën (2.1), ka një shenjë minus përpara shenjën e shumës.

Nëse probabiliteti i ndodhjes së ngjarjeve individuale është i njëjtë dhe ato formojnë një grup të plotë ngjarjesh, d.m.th.

atëherë formula (2.1) shndërrohet në formulën e R. Hartley:

Në formulat (2.1) dhe (2.2), raporti ndërmjet sasisë së informacionit Unë dhe, në përputhje me rrethanat, probabiliteti (ose numri) i ngjarjeve individuale shprehet duke përdorur logaritmin.

Përdorimi i logaritmeve në formulat (2.1) dhe (2.2) mund të shpjegohet si më poshtë. Për thjeshtësi të arsyetimit, përdorim relacionin (2.2). Ne do t'i caktojmë në mënyrë sekuenciale argumentit N vlerat e zgjedhura, për shembull, nga një seri numrash: 1, 2, 4, 8, 16, 32, 64, etj. Për të përcaktuar se cila ngjarje N Ngjarje po aq të mundshme kanë ndodhur, për çdo numër të serisë është e nevojshme të kryhen në mënyrë sekuenciale operacionet e përzgjedhjes nga dy ngjarje të mundshme.

Po, në N= 1, numri i operacioneve do të jetë 0 (probabiliteti i ngjarjes është 1), me N= 2, numri i operacioneve do të jetë i barabartë me 1, me N= 4 numri i operacioneve do të jetë 2, me N= 8, numri i operacioneve do të jetë 3, e kështu me radhë. Kështu, marrim serinë e mëposhtme të numrave: 0, 1, 2, 3, 4, 5, 6, etj., Të cilat mund të konsiderohen si korresponduese me vlerat e funksionit Unë në relacionin (2.2).

Sekuenca e vlerave numerike që merr argumenti N, është një seri, e njohur në matematikë si një seri numrash që formojnë një progresion gjeometrik dhe sekuencën e vlerave të numrave që merr funksioni. Unë, do të jetë një seri që formon një progresion aritmetik. Kështu, logaritmi në formulat (2.1) dhe (2.2) vendos marrëdhënien ndërmjet serive që përfaqësojnë progresionet gjeometrike dhe aritmetike, e cila është mjaft e njohur në matematikë.

Për të vlerësuar (vlerësuar) sasinë e çdo madhësie fizike, është e nevojshme të përcaktohet njësia matëse, e cila në teorinë e matjeve quhet masat .


Siç është përmendur tashmë, informacioni duhet të kodohet përpara përpunimit, transmetimit dhe ruajtjes.

Kodimi bëhet duke përdorur alfabete të veçanta (sisteme të shenjave). Në shkencën kompjuterike, e cila studion proceset e marrjes, përpunimit, transmetimit dhe ruajtjes së informacionit duke përdorur sisteme kompjuterike (kompjuterike), përdoret kryesisht kodimi binar, i cili përdor një sistem shenjash të përbërë nga dy karaktere 0 dhe 1. Për këtë arsye, formulat (2.1 ) dhe (2.2) numri 2 përdoret si bazë e logaritmit.

Bazuar në qasjen probabiliste për përcaktimin e sasisë së informacionit, këto dy simbole të një sistemi të shenjave binar mund të konsiderohen si dy ngjarje të ndryshme të mundshme, prandaj, si njësi e sasisë së informacionit, merret një sasi e tillë informacioni që përmban një mesazh që zvogëlon përgjysmë pasigurinë e njohurive (përpara marrjes së ngjarjeve, probabiliteti i tyre është 0,5, pas marrjes - 1, pasiguria zvogëlohet në përputhje me rrethanat: 1 / 0,5 = 2, d.m.th. 2 herë). Një njësi e tillë informacioni quhet bit (nga fjala angleze shifra binareështë një shifër binare). Kështu, si masë për vlerësimin e sasisë së informacionit në nivel sintaksor, në kushtet e kodimit binar, merret një bit.

Njësia tjetër më e madhe e matjes së sasisë së informacionit është një bajt, i cili është një sekuencë prej tetë bitësh, d.m.th.

1 bajt = 2 3 bit = 8 bit.

Në informatikë, njësitë matëse të sasisë së informacionit që janë shumëfisha të një bajt përdoren gjithashtu gjerësisht, megjithatë, ndryshe nga sistemi metrik i matjeve, ku koeficienti 10n përdoret si faktorë të njësive të shumta, ku n = 3, 6, 9, etj., në njësi të shumta matëse të sasisë së informacionit përdoret koeficienti 2n. Kjo zgjedhje shpjegohet me faktin se kompjuteri në thelb funksionon me numra jo në dhjetor, por në sistemin e numrave binar.

Shumëfishat e bajtit të njësisë për matjen e sasisë së informacionit futen si më poshtë:

1 kilobajt (KB) = 210 byte = 1024 bajte;

1 megabajt (MB) = 210 KB = 1024 KB;

1 gigabajt (GB) = 210 MB = 1024 MB;

1 terabajt (TB) = 210 GB = 1024 GB;

1 petabajt (PB) = 210 TB = 1024 TB;

1 ekzabajt (Ebajt) = 210 PB = 1024 PB.

Njësitë matëse të sasisë së informacionit, në emër të të cilave ka parashtesa "kilo", "mega", etj., nga pikëpamja e teorisë së matjes, nuk janë të sakta, pasi këto parashtesa përdoren në sistemin metrik. të masave, në të cilat koeficienti përdoret si shumëfish i njësive të shumëfishta 10 n , ku n = 3, 6, 9, etj. Për të eliminuar këtë pasaktësi, një organizatë ndërkombëtare Komisioni Ndërkombëtar Elektroteknik, e cila krijon standarde për industrinë e teknologjisë elektronike, ka miratuar një sërë prefiksesh të reja për njësitë matëse të sasisë së informacionit: kibi (kibi), mebi (mebi), gibi (gibi), tebi (tebi), peti (peti). ), exbi (exbi). Megjithatë, emërtimet e vjetra për njësitë matëse të sasisë së informacionit përdoren ende, dhe duhet kohë që emrat e rinj të përdoren gjerësisht.

Qasja probabilistike përdoret gjithashtu në përcaktimin e sasisë së informacionit të paraqitur duke përdorur sistemet e shenjave. Nëse i konsiderojmë simbolet e alfabetit si një grup mesazhesh të mundshme N, atëherë sasia e informacionit që mbart një karakter i alfabetit mund të përcaktohet me formulën (2.1). Me paraqitjen e barabartë të çdo karakteri të alfabetit në tekstin e mesazhit, formula (2.2) mund të përdoret për të përcaktuar sasinë e informacionit.

Sasia e informacionit që mbart një karakter i alfabetit, aq më shumë, aq më shumë karaktere përfshihen në këtë alfabet. Numri i karaktereve të përfshira në alfabet quhet kardinaliteti i alfabetit. Sasia e informacionit (vëllimi i informacionit) që përmbahet në një mesazh të koduar duke përdorur një sistem shenjash dhe që përmban një numër të caktuar karakteresh (simbolesh) përcaktohet duke përdorur formulën:

ku V– vëllimi i informacionit të mesazhit; Unë= log 2 N, vëllimi i informacionit të një simboli (shenje); TE– numri i simboleve (personazheve) në mesazh; N– fuqia e alfabetit (numri i karaktereve në alfabet).

Në bazën e të dhënave, informacioni regjistrohet dhe riprodhohet duke përdorur mjete leksikore të krijuara posaçërisht dhe bazuar në rregulla dhe kufizime sintaksore të pranuara.

Analiza sintaksore përcakton parametrat më të rëndësishëm të rrjedhave të informacionit, duke përfshirë karakteristikat e nevojshme sasiore, për të zgjedhur një grup mjetesh teknike për mbledhjen, regjistrimin, transmetimin, përpunimin, grumbullimin, ruajtjen dhe mbrojtjen e informacionit.

Analiza sintaksore e flukseve të informacionit të servisuar domosdoshmërisht paraprin të gjitha fazat e projektimit të sistemeve të informacionit.

Analiza semantike bën të mundur studimin e informacionit nga pikëpamja e përmbajtjes semantike të elementeve individuale, gjetjen e mënyrave të korrespondencës gjuhësore (gjuha njerëzore, gjuha kompjuterike) me njohjen e paqartë të mesazheve të futura në sistem.

Analiza pragmatike kryhet për të përcaktuar dobinë e informacionit të përdorur për menaxhimin, për të identifikuar rëndësinë praktike të mesazheve të përdorura për të zhvilluar veprime kontrolli.

Informacioni i përhershëm mbetet i pandryshuar ose i nënshtrohet rregullimeve të vogla për një periudhë më të gjatë ose më të shkurtër kohore. Këto janë informacione të ndryshme referencë, standarde, çmime, etj.

Informacioni i ndryshueshëm pasqyron rezultatet e performancës së prodhimit dhe operacioneve ekonomike, korrespondon me dinamizmin e tyre dhe, si rregull, merr pjesë në një cikël teknologjik të përpunimit të makinerive.

Kur futni dhe përpunoni informacionin, përdoren mënyrat e grupit dhe interaktive.

Mënyra e grumbullimit ishte më e zakonshme në praktikën e zgjidhjes së centralizuar të problemeve ekonomike, kur një pjesë e madhe zinin detyrat e raportimit të prodhimit dhe aktiviteteve ekonomike të objekteve ekonomike të niveleve të ndryshme të menaxhimit. Organizimi i procesit të llogaritjes në modalitetin e grupit u ndërtua pa akses të përdoruesit në kompjuter.

Funksionet e tij ishin të kufizuara në përgatitjen e të dhënave fillestare për një sërë detyrash të lidhura me informacionin dhe transferimin e tyre në një qendër përpunimi, ku u formua një paketë që përfshinte një detyrë për një kompjuter për përpunim, programe, të dhëna fillestare, rregullatore dhe referencë. Paketa u fut në kompjuter dhe u zbatua automatikisht pa pjesëmarrjen e përdoruesit dhe operatorit, gjë që bëri të mundur minimizimin e kohës së ekzekutimit të një grupi të caktuar detyrash. Modaliteti i grupit zbatohet aktualisht në përditësime të dhënash me email ose në masë.

Mënyra interaktive siguron ndërveprimin e drejtpërdrejtë të përdoruesit me sistemin informatik të informacionit, mund të jetë në natyrën e një kërkese ose një dialogu me sistemin.

Modaliteti i kërkesës është i nevojshëm që përdoruesit të ndërveprojnë me sistemin përmes një numri të konsiderueshëm pajisjesh terminale të pajtimtarëve, duke përfshirë ato të largëta në një distancë të konsiderueshme nga qendra e përpunimit.

Shembull: Detyra e prenotimit të biletave për transport.

Sistemi i informacionit zbaton shërbimin masiv, funksionon në një modalitet të ndarjes së kohës, në të cilin disa përdorues të pavarur me ndihmën e terminaleve kanë drejtpërdrejt dhe praktikisht

akses të njëkohshëm në sistemin e informacionit. Kjo mënyrë lejon që çdo përdoruesi t'i jepet kohë për të komunikuar me sistemin në një mënyrë të diferencuar dhe të vendosur rreptësisht, dhe pas përfundimit të seancës, të dalë prej tij.

Modaliteti interaktiv hap mundësinë që përdoruesi të ndërveprojë drejtpërdrejt me sistemin informatik-informativ me një ritëm pune të pranueshëm për të, duke realizuar një cikël të përsëritur të lëshimit të një detyre, marrjes dhe analizimit të një përgjigjeje.

Më shumë për temën Aspektet sintaksore, semantike, pragmatike të procesit të informacionit:

  1. Struktura e veprimtarisë së informacionit masiv: mbledhja, përpunimi, rregullimi, transmetimi, perceptimi, transformimi, ruajtja dhe përdorimi i informacionit masiv. Informacion i mundshëm, i pranuar dhe real. Aspektet semantike, sintaksore dhe pragmatike të teksteve të informacionit masiv.
  2. Njësitë dhe metodat e konceptualizimit në aspektin semantik, sintaksor dhe pragmatik
  3. 7. KRITERET E TEKSTIT GAZETARI PËR MJAFTUESHMËRITË E TEKSTIT GAZETARISË ASPEKTET SEMANTIKE, SINTAKSIKE, PRAGMATIKE TË TEKSTIT GAZETARI SPECIFICITETI E EFIÇENCAVE TË TEKSTIT GAZETARI

Artikujt kryesorë të lidhur