Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ
  • në shtëpi
  • Televizionet (Smart TV)
  • Sisteme shumëdimensionale me humbje. STATISTICA Teknikat hulumtuese me shumë variacione Teknologjitë e analizës së të dhënave me shumë variacione

Sisteme shumëdimensionale me humbje. STATISTICA Teknikat hulumtuese me shumë variacione Teknologjitë e analizës së të dhënave me shumë variacione

Faqe 513-523

Proceset shumëdimensionale

Deri më tani, ne kemi shqyrtuar modele që përbëhen nga vetëm një marrëdhënie që lidh seritë kohore. Në këtë rast, ne zgjodhëm një nga variablat si endogjen, dhe pjesa tjetër e variablave ishin ekzogjenë. Një ndarje e tillë nuk është gjithmonë e natyrshme, shpesh është e nevojshme të merren parasysh njëkohësisht disa marrëdhënie, në të cilat të njëjtat variabla përfshihen si endogjenë ashtu edhe si ekzogjenë. Siç mund ta shihni nga leksioni i fundit, një ndryshore nuk mund të konsiderohet gjithmonë ekzogjene, dhe ne në fakt duhet të marrim parasysh një model DGP që përbëhet nga disa ekuacione. Kjo nënkupton modelimin e disa serive kohore në të njëjtën kohë, me fjalë të tjera - modelimin e një procesi të rastësishëm shumëdimensional.

Le të fillojmë me përkufizimin. Konsideroni një vektor = (xt 1, xt 2, ..., xtk)T, çdo komponent i të cilit është një seri kohore. mbishkrimi do të tregojë numrin e komponentit, dhe ai më i ulët, si më parë, momentin në kohë. shpërndarja e komponentëve karakterizohet nga një familje e densiteteve të përbashkëta të shpërndarjes të formës: f n ( Xt1i1, xt2i2, ..., xtn) ‚N = 1, 2, .... Kushti i stacionaritetit në kuptimin e ngushtë është ende pavarësia e zhvendosjes kohore të të gjithë familjes së densiteteve të përbashkëta të shpërndarjes. Vetëm tani, përveç të gjitha kombinimeve të mundshme të vlerave të një procesi të rastësishëm në kohë të ndryshme, argumentet e densitetit të probabilitetit janë gjithashtu të gjitha llojet e kombinimeve të përbërësve të ndryshëm në kohë të ndryshme. Për shembull, për një dendësi dy-dimensionale, marrim nga kushti i stacionaritetit: f 2 (Xt 1 , Xt 2 ) = f 2 (x 1t + r, x 2t + r) për çdo τ. Shpërndarja e përbashkët e komponentëve për të njëjtin moment në kohë nuk varet nga koha. Konsideroni një funksion tjetër të shpërndarjes, për shembull, një tredimensional, i cili përfshin vlerat e komponentit të parë në dy pika të ndryshme në kohë dhe komponentit të dytë në një moment të tretë në kohë. Stacionariteti do të thotë se f 3 (Xt 1 , Xt + h 1 , Xt + s 2 ) = f 3 (x 1t + τ , x 2t + s + τ ) ... Mund të themi se kjo është veti e pandryshueshmërisë ndaj një zhvendosjeje në kohë. Kjo do të thotë, nëse vlera e τ shtohet në çdo moment të kohës, atëherë funksioni i densitetit nuk do të ndryshojë. Është e qartë se stacionariteti i një procesi shumëdimensional përfshin stacionaritetin e secilit prej përbërësve të tij.

Ashtu si në rastin njëdimensional, stacionariteti në kuptimin e ngushtë përfshin një sërë vetive të karakteristikave të proceseve të rastësishme. Para së gjithash, le të fillojmë me vlerën e pritur. Pritshmëria matematikore për çdo komponent është e pavarur nga komponentët e tjerë. Prandaj, nëse procesi shumëdimensional është i palëvizshëm, pritshmëria matematikore e secilit komponent nuk varet nga koha. Vektori i pritjeve matematikore E ( nuk varet nga koha.

Tani le të shqyrtojmë momentet e rendit të dytë. Çdo komponent karakterizohet nga varianca dhe funksioni i autokorrelacionit. Nëse një seri njëdimensionale është e palëvizshme, funksionet e saj të autokorrelacionit dhe autokovariancës varen vetëm nga zhvendosja τ: Corr (τ) = Corr ( Xti, Xjt + r) = р i (τ), por tani mund të marrim parasysh momentin e dytë të përzier për komponentë të ndryshëm, si dhe Corr ( Xti, Xjt + r). Është e natyrshme ta quajmë një vlerë të tillë funksion ndër-korrelacioni. Nëse komponentët formojnë një proces stacionar shumëdimensional, atëherë korrelacioni i kryqëzuar do të jetë një funksion i zhvendosjes në kohë τ. Ne shënojmë këtë funksion R ij (τ) ... Është shumë e qartë se R ij (τ) = R ji (-τ) ... Për një vlerë fikse të τ, elementet R ij (τ) formojnë një matricë R në varësi të τ. Vlera τ e barabartë me zero korrespondon me matricën e korrelacionit të vektorit

Në seksionin e mëparshëm, ne shikuam një diagramë të tranzicionit të gjendjes 2D. Për një numër në rritje të flukseve të ngarkesës, numri i gjendjeve (dhe si rrjedhim ekuacioneve) rritet shumë shpejt. Megjithatë, ju mund ta thjeshtoni problemin duke përdorur një strukturë diagrami të tranzicionit të gjendjes. Konsideroni diagramin e tranzicionit të gjendjes dydimensionale të paraqitur në Fig. 10.2. Për katër shtete ngjitur, rrjedha në drejtim të akrepave të orës duhet të jetë e barabartë me rrjedhën e kundërt (Kingman, 1969), (Sutton, 1980). Hidhini një sy fig. 10.2.


Oriz. 10.2.

Në drejtim të akrepave të orës:


Në drejtim të kundërorës:


Ne mund t'i anulojmë të dyja shprehjet për probabilitetet e gjendjes dhe më pas të marrim kushtin (10.12). Një kusht i domosdoshëm dhe i mjaftueshëm për kthyeshmërinë është që dy shprehjet e mëposhtme të jenë të barabarta.

Në drejtim të akrepave të orës:

(10.12)

Në drejtim të kundërorës:

Nëse këto dy shprehje janë të barabarta, atëherë ka ekuilibër lokal ose i pjesshëm... Kështu, një kusht i domosdoshëm për kthyeshmërinë është që nëse ka një rrjedhë (shigjeta) nga gjendja i në gjendjen j, atëherë duhet të ketë edhe një rrjedhje (shigjeta) nga gjendja j në gjendjen i. Ne mund të aplikojmë ekuacione të seksioneve midis çdo dy gjendjesh të lidhur. Pra, nga Figura 10.2 marrim:

(10.13)

Ne mund të shprehim çdo probabilitet të një gjendjeje në termat e probabilitetit të një gjendjeje, duke zgjedhur çdo rrugë midis këtyre dy gjendjeve ( Kriteret e Kolmogorovit). Ne, për shembull, mund të zgjedhim një rrugë:

Pastaj marrim ekuacionin e mëposhtëm të ekuilibrit:

(10.17)

Nëse marrim parasysh një sistem shumëdimensional me humbje me flukse N ngarkesë, atëherë çdo rrjedhë e ngarkesës mund të jetë një proces Poisson i varur nga gjendja. Në një fije të veçantë, mund të ketë ngarkesa të llojit BPP(Bernoulli, Poisson, Pascal). Për N - dimensionale Sistemet, kushtet e kthyeshmërisë janë të ngjashme me (10.12). Kriteri i Kolmogorovit duhet të plotësohet për të gjitha rrugët e mundshme. Në praktikë, ne nuk hasim asnjë problem, sepse zgjidhja e marrë sipas supozimit të kthyeshmërisë do të jetë zgjidhja e saktë nëse dhe vetëm nëse plotësohen ekuacionet e ekuilibrit të nyjës. Në seksionin tjetër, ne do ta përdorim këtë si bazë për të prezantuar një model gjenerik të ngarkesës shumëdimensionale.

Sisteme shumëdimensionale me humbje

Në këtë seksion, ne konsiderojmë përgjithësime të teorisë klasike të teletrafikut për sistemet që përbëhen nga disa lloje rrymash ngarkese që arrijnë në një kanal të vetëm ose grup kanalesh ose grupe kanalesh. Çdo rrjedhë ngarkese mund të ketë parametra të veçantë dhe mund të jetë flukse thirrjesh Poisson të varura nga gjendja me klasa të kufizuara dhe trafik shumëslot. Kjo klasë e përgjithshme e modeleve është e pandjeshme ndaj shpërndarjes së kohës së qëndrimit që mund të jetë një klasë. Ne prezantojmë përgjithësime një nga një dhe paraqesim një rast të vogël studimor për të ilustruar idetë kryesore.

Kufizimi i klasës

Krahasuar me rastin e diskutuar në seksionin 10.1, tani do të kufizojmë numrin e kërkesave të njëkohshme për çdo thread të ngarkesës (klasë). Kështu, nuk do të ketë disponueshmëri të plotë, por ndryshe nga sistemet e mbingarkesës, ku fizikisht ka akses vetëm në kanalet e specifikuara, tashmë është e mundur të përdoren të gjitha kanalet, por në çdo kohë mund të zëmë vetëm një numër të kufizuar të tyre. Kjo siguron mbrojtje të shërbimit (mbrojtja e numrit të QV-ve = kufizim për klasën e shërbimit = strategjia e pragut të përparësisë). Kështu, ne prezantojmë kufizime në numrin e thirrjeve të njëkohshme në klasën j si më poshtë:

(10.18)

Nëse kufizimi i fundit nuk plotësohet, atëherë marrim grupe të veçanta që korrespondojnë me N njëdimensionale të zakonshme të pavarura sistemet me humbje... Për shkak të kufizimeve, diagrami i tranzicionit të gjendjes është shkurtuar. Për dy rryma ngarkese, është paraqitur në Figurën 10.3.


Oriz. 10.3.

Vini re se diagrami i tranzicionit të gjendjes së cunguar është ende i kthyeshëm dhe se vlera në lidhje me vlerën nuk ndryshon kur shkurtohet. Ndryshon vetëm konstanta e normalizimit. Në fakt, për shkak të vetive të ekuilibrit lokal, ne mund të heqim çdo gjendje pa ndryshuar vetitë e lartpërmendura. Ju mund të konsideroni kufizime më të përgjithshme të klasës për grupet e flukseve të ngarkesës në mënyrë që çdo rrjedhë e ngarkesës të ketë një numër minimal (të garantuar) të kanaleve të alokuara.

Proceset e përgjithësuara të shërbimit të ngarkesës

Ne mund të konsiderojmë PCT -I ngarkoni vetëm si në seksionin 10.1. Çdo rrjedhë ngarkese mund të jetë e varur nga gjendja, për shembull, rrjedha e thirrjes Poisson me varësi lineare të gjendjes dhe shkallën e saj të daljes (vdekjen), shih (10.16) dhe (10.17)

Sistemi plotëson kushtet e kthyeshmërisë, shih (10.12). Kështu, forma e veprës ekziston edhe për BPP-rrjedhjet e ngarkesës dhe proceset më të përgjithshme Poisson të varura nga shteti. Nëse të gjitha rrjedhat e ngarkesës janë procese Engset (binomiale), atëherë marrim formulën shumëdimensionale Engset (Jensen, 1948). Siç u përmend më lart, sistemi është i pandjeshëm ndaj shpërndarjeve të kohërave të qëndrimit në sistem. Çdo rrjedhë ngarkese mund të ketë shpërndarjen e vet të veçantë të kohës së qëndrimit.

Ngarkesa me shumë slota

Në sistemet e shërbimeve të integruara, gjerësia e brezit të kërkuar mund të varet nga lloji i shërbimit. Për shembull, një kanal (slot) kërkohet për të shërbyer një lidhje telefonike vetëm me zë, ndërsa, për shembull, transmetimi i videos mund të kërkojë kanale në të njëjtën kohë. Ne marrim kufizime shtesë:

(10.19)
(10.20)

ku është numri aktual i thirrjeve të tipit. Diagrami i tranzicionit të gjendjes që rezulton do të jetë i kthyeshëm dhe do të jetë në formën e një produkti.


A.L. Pomerantsev, O.E. Rodionova


Në literaturën vendase shkencore dhe teknike, shprehja "kontroll statistikor shumëdimensional i proceseve" - ​​MSPC (Kontrolli i procesit statistikor me shumë ndryshime).
MSPC është një qasje moderne për modelimin e proceseve shumëdimensionale (multifaktoriale), bazuar në përdorimin e metodave matematikore të projektimit që ju lejojnë të nënvizoni të fshehura në grupe të mëdha të dhënash. (latent) variablat dhe analizojnë lidhjet që ekzistojnë në sistemin në studim. MSPC është një evolucion natyror i qasjes së njohur si SPC (Kontrolli i Procesit Statistikor)- kontrolli statistikor i proceseve, me kalimin në një nivel më të lartë të përpunimit të të dhënave të grumbulluara.
Çfarë procesesh analizon MSPC? Para së gjithash, natyrisht, prodhimi. Megjithatë, ai mund të jetë i dobishëm edhe për ndërmarrjet tregtare, sferat bankare dhe të sigurimeve etj., domethënë aty ku është e nevojshme të merren rregullisht vendime që ndikojnë në efikasitetin e ndërmarrjes. MSPC i referohet një aktiviteti të shumëanshëm që lidhet me monitorimin, modelimin dhe menaxhimin e procesit me shumë faktorë, i cili synon stabilizimin e funksionimit të një ndërmarrje, rritjen e efikasitetit të saj dhe përfundimisht prodhimin e produkteve cilësore ose ofrimin e shërbimeve cilësore.
Kontrolli i cilësisë- kjo tani është një temë në modë, megjithëse vetë puna me cilësi të lartë ka qenë gjithmonë e rëndësishme për çdo ndërmarrje. Fjala "cilësi" ka shumë kuptime dhe përdoret gjerësisht si në jetën e përditshme ashtu edhe në literaturën e veçantë. Për shembull, "cilësia" është një nga sinonimet e fjalës "pronë" - domethënë një karakteristikë e natyrshme e diçkaje. Shpesh termi "cilësi" pasqyron një vlerësim subjektiv të një produkti ose shërbimi.
Merrni parasysh këndvështrimin e prodhuesit, për të cilin cilësisë- kjo është përputhshmëri me një standard të caktuar me një kosto minimale.
Pikërisht për arritjen e kësaj cilësie shërben kontrolli statistikor shumëdimensional i proceseve.
Ndërmarrja mund të ndahet në katër nivele kryesore të kontrollit të cilësisë.
Kontroll intuitiv ekspert ... Ekziston në çdo ndërmarrje kur një ekspert-teknolog, në rolin e të cilit mund të veprojë çdo person përgjegjës, vendos personalisht nëse produkti i prodhuar është i cilësisë së lartë apo jo. Prandaj, ai vendos gjithashtu se çfarë ndikimi duhet të ushtrohet në proces për të marrë produkte cilësore. Kjo qasje, për shembull, përdoret në një restorant të mirë, ku vetë shefi i kuzhinës vlerëson cilësinë e pjatave dhe rregullon recetat për përgatitjen e tyre. Ky nivel kontrolli jep rezultat në bizneset e vogla dhe vetëm me një ekspert të kualifikuar. Zëvendësimi ose thjesht sëmundja e një eksperti mund të çojë në një rënie katastrofike të cilësisë së produktit. Sapo ndërmarrja rritet dhe një ekspert (ose një grup ekspertësh) nuk është më në gjendje të kontrollojë personalisht të gjithë procesin teknologjik, ndërmarrja duhet të kalojë në një nivel tjetër të kontrollit të cilësisë.
Kontrolli përshkrues ... Me një organizim të tillë të punës, për çdo vend pune ekziston një udhëzim që përshkruan se çfarë, si, me çfarë mjetesh është e nevojshme të bëhet dhe rregullon saktësinë e kryerjes së operacioneve të caktuara. Kjo është qasja që ekziston, për shembull, në pikat e ushqimit të shpejtë. (Ushqim i Shpejtë), si rezultat i së cilës prodhojnë produkte me cilësi të ngjashme në të gjithë botën. Aktualisht, kjo qasje është e përhapur, veçanërisht, përmes certifikimit të ndërmarrjeve për pajtueshmërinë me kërkesat e ISO 9001.
Monitorimi statistikor ... Metodat SPC u propozuan nga Schuhart në fillim të viteve '30, por ato filluan të zbatohen gjerësisht në ndërmarrje vetëm nga mesi i viteve '50. Në terma të përgjithshëm, ideja e kësaj qasjeje është si më poshtë. Disa tregues të paracaktuar të procesit maten rregullisht në impiant. Nëse këta tregues luhaten brenda kufijve të vendosur (nivelet kritike), atëherë konsiderohet se procesi është i kontrollueshëm, nëse jo, cenohet kontrolli dhe ka ndodhur një ngjarje që kërkon ndërhyrje për të rivendosur funksionimin normal. Për një monitorim të tillë përdoren Listat e kontrollit të Shewhart, kartat e shumave të grumbulluara etj. Kartat plotësohen drejtpërdrejt në vendin e prodhimit, prandaj përfundimet e nxjerra me ndihmën e tyre lejojnë, nëse është e nevojshme, të merren masa të menjëhershme.
Ka disa arsye pse metodat e mësipërme të kontrollit janë të nevojshme, por jo masa të mjaftueshme për të marrë një produkt përfundimtar të cilësisë së duhur. Së pari, është e nevojshme të kontrollohet jo vetëm cilësia e produktit përfundimtar, por edhe vetë procesi i prodhimit. Së dyti, kontrolli i treguesve individualë, pa ndërlidhjen e tyre, ose nuk siguron cilësinë e duhur të produktit të prodhimit, ose mbivlerëson tepër treguesit e prodhimit, duke çuar në alarme të shumta false.
Kontrolli statistikor me shumë variacione (MSPC) ... Procesi i prodhimit është një sistem kompleks, shumëdimensional, i cili karakterizohet, si rregull, nga dhjetëra, qindra apo edhe mijëra tregues, dhe një person nuk mund të ndjekë njëkohësisht ndryshimet në secilin tregues. Ka dy zgjidhje të mundshme për këtë problem. Së pari, kompjuteri mund të informojë operatorin vetëm për ata tregues që "shkojnë" përtej vlerës kritike. Së dyti, metodat multivariate mund të përdoren për të gjeneruar grafikët e kontrollit të përgjithësuar për analiza e komponentit kryesor.
Metodat e kontrollit me shumë variacione prodhojnë më pak alarme false, dhe ato janë gjithashtu një mjet i fuqishëm për analizimin e situatave të mundshme emergjente. Për të kuptuar thelbin e MSPC dhe, duke pasur parasysh se një person luan një rol të rëndësishëm në këtë qasje, përvojën e tij, merrni parasysh një shembull i modelimit të veprimeve të kapitenit të anijes, i cili merr të gjitha vendimet në anije dhe udhëzimet e të cilit kryhen pa diskutim.
Efikasiteti i një kompanie detare, e angazhuar në transportin e rregullt të planifikuar të pasagjerëve dhe ngarkesave, përcaktohet, së pari, nga saktësia e punës, domethënë nga ashpërsia e orarit dhe së dyti, nga përdorimi ekonomik i karburantit, i cili varet drejtpërdrejt nga veprimet e kualifikuara të kapitenit.
Në njërën prej këtyre rrugëve, për një kohë mjaft të gjatë, u mblodhën dhe u regjistruan parametra të ndryshëm që karakterizojnë procesin e lundrimit (tabela). Ishin gjithsej 20 tregues të tillë (vetëm disa janë paraqitur në tabelë), mes tyre të pamenaxhuara dhe të menaxhuara variablat si dhe variablat - përgjigjet që karakterizon efikasitetin (cilësinë) e punës.
Port Variabla të pamenaxhuara Variablat e kontrolluar Feedback
Moti Mënyrat e lëvizjes Rezultati
Era kau-
ne
rrjedhje-
jo
Numri
kaloj-
yndyrë
Pesha e ngarkesës Shpejtësia e motorit Draft i anijes Ndrysho-
qira
Konsumi
pikëllim -
çfarë
Me vonesë
Danimarka
Bergen 10 5 30 123 452 5000 25 10 120 0
Larviku 12 4 35 85 523 4500 40 5 150 0
Maloy 8 5 25 142 384 5000 50 0 180 -2
Volda 2 2 10 102 412 4500 20 5 190 0
Alesund 5 3 14 56 235 4000 -50 5 120 3
Molde 2 1 2 86 341 4000 -30 3 50 0
Kristiansund 1 5 3 140 120 4000 -35 5 85 -5
Trondheim 5 5 15 112 462 5000 20 8 320 0
Malm 6 6 3 50 385 4500 -25 10 105 1
Narvik 7 6 6 75 225 4500 -50 5 85 5
Namsos 8 7 5 94 302 3500 -60 3 95 -4

Analiza matematikore e të dhënave të marra tregoi se ky sistem nuk ka 20 gradë lirie, siç mund të pritej, por vetëm 5. Me fjalë të tjera, numri i sasive të pavarura (jo fizike specifike, por të fshehura, "latente" të qenësishme vetëm ndaj këtij sistemi) është më i vogël se numri i karakteristikave të matura. Kjo për faktin se sistemi ka lidhje të brendshme (korrelacione) ndërmjet treguesve. Natyra e këtyre lidhjeve është e dyfishtë. Nga njëra anë, ato krijohen nga arsye objektive - për shembull, forca e erës dhe lartësia e valës janë padyshim të lidhura. Nga ana tjetër, korrelacionet lindin edhe për arsye subjektive - në fund të fundit, kapiteni nuk ndryshoi rastësisht vlerat e variablave të kontrolluar, por u drejtua nga qëllime të caktuara, të cilat çuan në shfaqjen e lidhjeve shtesë mjaft të ngurtë. Si rezultat, u bë e mundur të ndërtohej një model matematikor në varësi të pesë variablave latente, të cilat përshkruanin sjelljen e kapitenit të anijes në një gamë të gjerë kushtesh të jashtme. Nëse futni vlera specifike të ndryshoreve të pakontrolluara në këtë model, mund të llogaritni vlerat e variablave të kontrolluar, domethënë mund t'i sugjeroni kapitenit se cilat mënyra duhet të zgjidhni për të mbërritur në destinacionin e ardhshëm në kohë. me konsum minimal të karburantit. Nga ana tjetër, vetë kapiteni mund të fusë vlerat e parametrave të kontrolluar në sistem për të marrë një vlerësim të veprimeve të tij të synuara, për shembull, për të zbuluar se sa karburant do të shpenzojë.
Pse arritët të ndërtoni këtë model? Modeli i sjelljes nga kjo kapiten, menaxher me këtë anija në këto kushte, ishte e mundur të ndërtohej vetëm sepse u studiua aktiviteti i qëllimshëm me përvojë kapiten. Kjo është arsyeja pse sistemi në studim, si rezultat, doli të kishte jo aq shumë shkallë të brendshme lirie. Nëse në vend të një kapiteni me përvojë, për shembull, vendosej një fëmijë, i cili do të tërhiqte rastësisht dorezat dhe do të ndryshonte parametrat e kontrolluar, asnjë model nuk do të mund të krijonte, pasi sistemi nuk do të përmbante logjikën e brendshme dhe numrin e shkallëve të lirisë. do të kishte do të ishte i madh. Në të njëjtën kohë, ishte e nevojshme të bindej kapitenin të kryente ndonjëherë të paarsyeshme, nga këndvështrimi i tij, veprime, për shembull, të shkonin më larg se zakonisht në det të hapur, të zgjidhnin shtrimin e gabuar të anijes, etj. Të dhëna të tilla janë e nevojshme për të studiuar sjelljen e sistemit në maksimum një gamë të gjerë kushtesh - vetëm atëherë modeli i ndërtuar do të përshkruajë në mënyrë adekuate sistemin në studim.
Zbatimi praktik i këtij sistemi ka dhënë rezultate të prekshme - megjithë skepticizmin e konsiderueshëm, kompania e transportit në fund përfitoi nga përdorimi i tij. Në të njëjtën kohë, vëmendje duhet t'i kushtohet pikave themelore të mëposhtme: së pari, askush nuk u nis për të hequr kapitenin nga anija - detyra ishte të krijonte një sistem që do të jepte vetëm rekomandime; së dyti, për zgjidhjen janë përdorur vetëm modele të thjeshta, "formale", që lidhin variablat hyrëse dhe dalëse dhe nuk janë përdorur varësi fizike komplekse që përshkruajnë efektin e forcave të ndryshme në anije, trajektoren e anijes, etj. Së treti, Zbatimi praktik i këtij sistemi dha rezultate të prekshme - pavarësisht nga një sasi e madhe skepticizmi, kompania e transportit detar përfundimisht përfitoi nga përdorimi i tij. Në të njëjtën kohë, vëmendje duhet t'i kushtohet pikave themelore të mëposhtme: së pari, askush nuk u nis për të hequr kapitenin nga anija - detyra ishte të krijonte një sistem që do të jepte vetëm rekomandime; së dyti, për zgjidhjen janë përdorur vetëm modele të thjeshta, "formale", që lidhin variablat hyrëse dhe dalëse, dhe nuk janë përdorur varësi fizike komplekse, duke përshkruar efektin e forcave të ndryshme në anije, trajektoren e anijes, etj. Së treti, Problemi nuk u shtrua në ndërtimin e një modeli universal që përshkruan veprimet e çdo kapiteni në çdo anije - ishte vetëm për një klasë shumë specifike anijesh që kalonin një rrugë të caktuar.
Na duket se shembulli i analizuar, me gjithë ekzotikën e tij, ilustron me sukses idenë kryesore të MSPC. Në të vërtetë, qëllimi i kapitenit është të arrijë standardin, domethënë të arrijë në çdo port në kohë me një kosto minimale, domethënë konsumin e karburantit. Veprimet e kapitenit, në fakt, nuk ndryshojnë shumë nga veprimet e teknologut: ka tregues të pakontrolluar, të kontrolluar dhe dalës që karakterizojnë mënyrat e funksionimit të sistemit.
Pse nevojitet MSPC? Kjo është një alternativë reale ndaj metodave të kushtueshme të përmirësimit të cilësisë në kushtet kur një kompani nuk mund të blejë pajisje të reja, nuk ka lëndë të para hyrëse me veti të qëndrueshme dhe nuk mund të instalojë pajisje të shtrenjta kontrolli. Çfarë ofron MSPC? Studioni, përmblidhni dhe përdorni përvojën tuaj në kushte normale, mbi pajisjet ekzistuese dhe me lëndët e para në dispozicion. Kjo qasje mund të përmblidhet në mënyrë shumë të përmbledhur duke përdorur stilin e sloganit tani popullor.
Synimi. Mësoni nga vetja për të marrë vendimet e duhura në situata të ndryshme.
Objektet. Mbledhja e rregullt e treguesve realë dhe analiza matematikore e tyre.
Rezultati. Cilësia duke mbajtur të ulëta kostot për prodhim të qëndrueshëm.
Duhet të theksohet se MSPC nuk është një program specifik kompjuterik që thjesht duhet ta blini dhe instaloni në ndërmarrje. Kjo është një qasje e caktuar, madje mund të thuhet, një filozofi që kërkon përpjekje të përbashkëta nga njëra anë - specialistë që punojnë në një ndërmarrje të caktuar dhe të aftë për procesin teknologjik dhe pengesat e tij, dhe nga ana tjetër - matematikanë të aftë. në metodat që lejojnë zgjidhjen e problemeve të tilla. Në të njëjtën kohë, fusha e aktiviteteve të përbashkëta përfshin: vendosjen e problemit, përcaktimin dhe mbledhjen e treguesve, testimin e modeleve të ndërtuara në prodhim.
Për të kuptuar thelbin e një sistemi ose procesi të caktuar, është e nevojshme të matet dhe të grumbullohet të dhëna... Duke marrë parasysh që analiza e të dhënave me shumë variacione në përgjithësi dhe MSPC në veçanti bazohen jo në modele funksionale (kuptimplote), por në modelimin formal të të dhënave, çështja se çfarë të dhënash të mblidhen kërkon një konsideratë të veçantë. Le të ndalemi vetëm në disa pika themelore.
Gjithçka fillon me një numër të madh matjesh, d.m.th., me mbledhjen e të dhënave (shih tabelën). Në një tabelë, çdo kolonë përmban të gjitha vlerat e një ndryshoreje dhe çdo rresht (të quajtur një mostër) - vlerat e të gjitha variablave për një mostër. Një mostër mund të konsiderohet si momenti në kohë, numri i grupit, dhe emri i klientit, domethënë çdo ngjarje karakteristike e sistemit në studim. Pra, në shembullin e konsideruar, kampioni është një traget midis dy porteve të kursit të anijes.
E ndryshueshme mund të jetë çdo vlerë që karakterizon funksionimin e sistemit. Për shembull, aciditeti i një pije të prodhuar mund të matet ( pH), por mund të përcaktohet në mënyrë cilësore ("i ëmbël", "gjysmë i ëmbël", etj.).
Të dhënat e nevojshme të mbledhura në tabelë nuk do të thotë se ne kemi studiuar fenomenin, pasi kjo tabelë duhet të analizohet duke përdorur metoda të përshtatshme për të nxjerrë informacion sistematik. Nëse ka pak variabla, për shembull, dy ose tre, atëherë analiza mund të kryhet duke përdorur metoda tradicionale, duke ndërtuar grafikë për të dhëna dy dhe tre-dimensionale (Fig. 1, 2). Sapo të ketë shumë tregues të tillë, atëherë është e nevojshme të aplikohet analiza e të dhënave me shumë variacione, e cila qëndron në zemër të MSPC.

Është e rëndësishme të kuptohet se të dhënat fillestare përmbajnë gjithmonë të dy informacionet thelbësore, të cilat quhen sinjal, dhe e rastësishme, e cila quhet zhurma... Zhurma, para së gjithash, kuptohet si gabime në matje, karakteristika individuale të mostrave të matura, gabime modelimi, etj. Në qasjen e konsideruar, zhurma përfshin gjithashtu informacione sistematike që nuk kanë të bëjnë me procesin në studim. Ndarja e të dhënave në sinjal dhe zhurmë është një problem qendror i modelimit, zgjidhja e të cilit është balancimi i saktë i tyre. Nga njëra anë, niveli i zhurmës nuk mund të nënvlerësohet, domethënë modeli duhet të jetë shumë i detajuar, pasi në këtë rast modeli do të bëhet i paqëndrueshëm. Nga ana tjetër, duke mbivlerësuar zhurmën, ne humbasim pjesën kuptimplotë të të dhënave dhe modeli humbet fuqinë e tij parashikuese. Metodat e analizës së të dhënave me shumë variacione, së pari, e bëjnë relativisht të lehtë trajtimin e grupeve të mëdha dhe së dyti, ndarjen e sinjalit dhe zhurmës.
Për të ndërtuar një model që jo vetëm që funksionon në mënyrë adekuate në një gamë të ngushtë kushtesh, por është i aftë të simulojë procese të ndryshme, për shembull, kur përdoren lëndë të para të cilësive të ndryshme, kërkohet përvoja më e gjerë e mundshme. Përvoja e keqe, lëshimi i refuzimeve nuk mund të hidhet jashtë të dhënave, pasi ky informacion është gjithashtu i nevojshëm për të ndërtuar modelin. Nuk është e nevojshme të kryhet një përzgjedhje paraprake e mostrave ose variablave, duke zgjedhur ato më të rëndësishmet - kjo vendoset në procesin e analizimit të sistemit. Variablat shpesh janë të ndërlidhur, dhe informacioni bazë - një sinjal - gjendet në këtë sistem lidhjesh. Nëse një pjesë e të dhënave hidhet poshtë për ndonjë arsye, atëherë rrezikojmë të humbim informacion të rëndësishëm.
Sigurisht, modeli (sado i ndërlikuar që të jetë) nuk do të jetë kurrë plotësisht i saktë. Por një model i mirë është një mjet efektiv për të kuptuar, dhe për rrjedhojë për të menaxhuar procesin. Për të ndërtuar një model të tillë, kërkohen të dhëna informuese dhe beninje.
Le të kthehemi te diagrami që përshkruan katër nivelet e kontrollit të cilësisë. Duke përdorur shembullin e kapitenit të anijes, pamë se prania e nivelit të parë, intuitiv-ekspert, është një parakusht për ndërtimin e një modeli MSPC. Niveli i dytë, përshkrues është gjithashtu i nevojshëm, edhe pse ndoshta jo mbi bazën e gjerë të ndërmarrjes, por vetëm për të rregulluar procedurën e mbledhjes së të dhënave, përshkrimi duhet t'i përgjigjet në mënyrë të plotë pyetjeve të mëposhtme: çfarë dhe kur të matet; që bën matje; si ruhen rezultatet. Niveli i tretë i kontrollit - monitorimi statistikor - jep përgjigje për të gjitha këto pyetje dhe përgatit kalimin në MSPC, për të cilin nevojitet shumë pak - për të aplikuar analizën matematikore multivariate në të dhënat ekzistuese, e cila bazohet në një qasje projeksioni.
Ne do të përshkruajmë MSPC nga këndvështrimi i një punonjësi prodhimi dhe nuk do të shpërqendrohemi nga detaje të parëndësishme matematikore që mund të gjenden, për shembull, në, por do të përpiqemi të përcjellim thelbin e qasjes së projeksionit duke përdorur një interpretim gjeometrik.
Le të fillojmë me shembullin më të thjeshtë: kur ka vetëm dy ndryshore të matshme në sistem, atëherë të dhënat e mbledhura mund të vizatohen në një plan (shih Fig. 1). Çdo rresht i tabelës së burimit (d.m.th., modeli) korrespondon me një pikë në rrafshin e variablave me koordinatat përkatëse. Le të prezantojmë një bosht të ri (komponenti i parë kryesor - PC1) në mënyrë që ndryshimi maksimal i të dhënave të ndodhë përgjatë tij dhe të projektojmë të gjitha pikat në këtë bosht të ri. Nëse supozojmë një situatë ideale në të cilën vlerat e sinjalit janë të vendosura përgjatë kësaj linje të drejtë, dhe shpërndarja është për shkak të zhurmës, atëherë, duke projektuar të dhënat fillestare në boshtin GK1, ne zgjedhim një strukturë kuptimplote të të dhënave dhe e përshkruajmë atë vetëm me një ndryshore e re. Dhe pjesa tjetër e të dhënave, e cila nuk shpjegohet me këtë përshkrim - distanca nga pika në boshtin e ri - mund të konsiderohet zhurmë. Kjo zhurmë mund të analizohet më tej, duke kërkuar për një pjesë kuptimplotë në të - përbërësin e dytë kryesor, etj. derisa zhurma të bëhet me të vërtetë zhurmë, domethënë një grup i rastësishëm kaotik i sasive.
Në përgjithësi, procesi i projeksionit kalon nëpër fazat e mëposhtme (shih Fig. 2):
1) ndodhet qendra e resë së të dhënave dhe origjina e re e koordinatave transferohet atje - ky është komponenti kryesor zero (PC0);
2) zgjidhet drejtimi i ndryshimit maksimal të të dhënave - ky është komponenti i parë kryesor (PC1);
3) nëse të dhënat nuk përshkruhen plotësisht (zhurma është e madhe), atëherë zgjidhet një drejtim tjetër (GK2) - pingul me të parën, për të përshkruar ndryshimin e mbetur në të dhëna, etj.
Si rezultat, analiza e komponentit kryesor paraqet mostrat në një hapësirë ​​të re me dimensione më të ulëta. Kjo jo vetëm që zëvendëson një sistem koordinativ me një tjetër, por gjithashtu zvogëlon nivelin e zhurmës (d.m.th., ndikimin e faktorëve të ndryshëm të jashtëm) në sistem. Në fig. 2 tregon një ulje të dimensionit të sistemit nga tre në dy, që nuk është një rënie e konsiderueshme e dimensionit. Shpesh ka një ulje sipas rendit të madhësisë, për shembull, nga 300 ndryshore fillestare në 3-5 komponentë kryesorë.
Një shembull i një kontrolli të procesit të prodhimit ndërtuar nga të dhënat e marra në një fabrikë të vërtetë kimike, por disi e thjeshtuar për qëllime ilustruese. Për disa kohë u hetua procesi teknologjik (53 gjendje të sistemit - mostër), i cili u monitorua nga 17 sensorë (variabla). Për secilin tregues, u vendosën kufijtë e sipërm dhe të poshtëm të vlerave të pranueshme. Sipas qasjes SPC, çdo variabël ka grafikun e vet të kontrollit (Fig. 3). Kur treguesi shkon përtej nivelit kritik, operatori merr një sinjal paralajmërues.

Nëse do të kishte pak variabla, atëherë kjo qasje nuk do të krijonte probleme. Megjithatë, është e vështirë për një operator që të kontrollojë njëkohësisht dinamikën e ndryshimeve në të gjitha (në këtë rast, 17) variablat (Fig. 4).

Analiza më e thjeshtë ju lejon të bëni transformime të dukshme të të dhënave fillestare:
1) zhvendosni secilën variabël në mënyrë që mesatarja të jetë zero;
2) normalizoni secilën variabël në mënyrë që t'i çoni në nivelin e përgjithshëm kritik, për shembull + 1.
Transformime të thjeshta të ngjashme, të quajtura në metodën MSPC përgatitjen e të dhënave, ju lejon të thjeshtoni ndjeshëm perceptimin vizual të informacionit rreth procesit.
Si rezultat, operatori do të shohë në ekran një foto që pasqyron gjendjen e sistemit në një moment të caktuar kohor (lexime të normalizuara të sensorëve), e cila tashmë është e lehtë për t'u kontrolluar (Fig. 5). Në të, vlera e secilës variabël të normalizuar përshkruhet nga një grafik me shtylla, lartësia e të cilit ndryshon gjatë procesit. Këtu tashmë është e qartë se sa larg është secili tregues nga nivelet kritike.

Sidoqoftë, një transformim i tillë nuk zgjidh një problem tjetër të rëndësishëm që lind gjatë monitorimit të një numri të madh treguesish - si t'i përgjigjemi sinjaleve paralajmëruese. Midis 17 variablave të matur, ka disa variabla të kontrolluar. Nëse njëri prej tyre i afrohet nivelit të sipërm kritik, atëherë është e natyrshme që të zvogëlohet, nëse në nivelin më të ulët, atëherë të rritet. Por çfarë ndodh me variablat e pamenaxhuar, vlerat e të cilave nuk mund të ndryshohen drejtpërdrejt? Ndihmon këtu që të gjithë treguesit në sistem janë të ndërlidhura. Për shembull, sa më e lartë të jetë temperatura, aq më i lartë është presioni, etj. Prandaj, operatori mund të ndryshojë në mënyrë indirekte variablat e pakontrolluar përmes rregullimit të atyre të kontrolluar. Në përgjithësi, në sisteme të tilla komplekse, të përshkuara nga lidhje të brendshme, veprimi i secilit operator shkakton një ndryshim të njëkohshëm në të gjithë treguesit, dhe jo gjithmonë të dëshirueshëm. Idealisht, për të arritur rezultatin e kërkuar, është e nevojshme të ndryshohen në mënyrë strikte vlerat e të gjithë variablave të kontrolluar në të njëjtën kohë, gjë që është praktikisht e pamundur. Prandaj, lindin gabime që çojnë në martesë.
Prania e lidhjeve të brendshme në qasjen e zakonshme ndaj detyrës së menaxhimit shkakton probleme, por për MSPC-në, përkundrazi, është një bekim. Gjatë zbatimit të tij, metodat e projeksionit përdoren për të dalluar variablat latente të përgjithësuara në sistem. Pra, në shembullin në shqyrtim, doli se mund të përshkruhet vetëm me dy komponentë kryesorë. Në fig. 6 tregon projeksionet e të 53 gjendjeve të matura të sistemit (mostrat) në rrafshin e dy komponentëve kryesorë.

Në të njëjtën kohë, niveli i zhurmës, pra pjesa e të dhënave të pashpjegueshme, është vetëm 4%. Kjo do të thotë që çdo vëzhgim - një varg prej 17 numrash - mund të rindërtohet nga dy vlera të projeksioneve në boshtin e komponentëve kryesorë me një saktësi relative jo më të keqe se 0.04. Përveç kësaj, ishte e mundur të krijohej një marrëdhënie e paqartë midis daljes së vlerës së çdo sensori përtej nivelit të referencës dhe daljes së një pike në planin PC përtej kufijve të elipsit kritik (shih Fig. 6). Tani operatori mund të ndjekë ndryshimin në pozicionin e pikës që karakterizon gjendjen e sistemit në aeroplan, gjë që, natyrisht, është shumë më e lehtë.
Problemi i menaxhimit është gjithashtu shumë i thjeshtuar. Operatori mund të kontrollojë tashmë vetëm dy variabla "latente", duke i rregulluar ato nëse është e nevojshme. Në këtë rast, ka një ndryshim sinkron të njëkohshëm të të gjitha variablave origjinale, "fizike". Nga rruga, një teknikë e tillë përdoret në mënyrë implicite në shumë pajisje shtëpiake komplekse, për shembull, në marrës televizivë, ku përdoruesi ka në dispozicion një numër të kufizuar butonash kontrolli që kontrollojnë një numër të madh të ndryshoreve fizike të fshehura prej tij. Në mënyrë që një sistem i tillë kontrolli të jetë i përshtatshëm dhe efektiv, së pari duhet të konfigurohet. Ky proces quhet kalibrimi(ose diplomime) - në analogji me procedurën për vendosjen e instrumenteve matëse - prandaj, analiza e të dhënave shumëvariate quhet edhe kalibrim shumëvariak.
Para se të përdoret praktikisht modeli matematik i ndërtuar gjatë kalibrimit, ai i nënshtrohet procedurës çeqe, domethënë, duhet të siguroheni që është në gjendje të parashikojë saktë gjendjen e sistemit. Për ta bërë këtë, matni dhe mblidhni të reja (verifikimi) të dhëna për procesin në studim dhe përdorin modelin e ndërtuar për të parashikuar këto vlera. Nëse vlerat e parashikuara ndryshojnë pak nga ato të matura, atëherë modeli konsiderohet se e ka kaluar testin dhe mund të përdoret në praktikë. Nëse jo, atëherë duhet të kryeni një kalibrim të ri, më të saktë. Shpesh, vetitë e një sistemi të simuluar mund të ndryshojnë në mënyrë dramatike (kalimi në lëndë të para të reja) ose gradualisht (veshja e pajisjeve). Në këtë rast, modeli i ndërtuar më parë bëhet i papërdorshëm dhe duhet të rafinohet. Me këtë formulim, detyra e MSPC nuk është një veprim një herë, por një program i synuar për analizimin dhe përmirësimin e cilësisë së punës së ndërmarrjes.
Në dekadën e fundit, MSPC është përdorur gjerësisht në mbarë botën në zona të ndryshme industriale për procese të vazhdueshme si:
kontrolli dhe parashikimi i cilësisë së letrës së gazetave në varësi të përbërjes së lëndës së parë;
kontrolli i cilësisë së prodhimit të bakrit dhe analiza e përbërjes së papastërtive;
kontrolli i cilësisë së benzinës.
Përveç kësaj, MSPC përdoret gjithashtu në rastet kur procesi përbëhet nga faza të veçanta, dhe për të marrë produkte me cilësi të lartë, është e nevojshme të kontrollohet kinetika e proceseve brenda një ose disa fazave, për shembull:
kontrolli mbi prodhimin e majave të furrës;
kontrolli i procesit të polimerizimit në prodhimin e polietilenit me densitet të ulët.
konkluzione. MSPC është një qasje moderne e përdorur në mbarë botën për të monitoruar proceset e prodhimit, për të përmirësuar funksionimin e tyre, për të përmirësuar cilësinë e produktit dhe për të zhvilluar teknologji dhe produkte të reja. Modelimi matematik i përdorur në MSPC nuk bazohet në ndërtimin e modeleve komplekse fizike (kimike, etj.), por në një analizë të thjeshtë të të dhënave hyrëse dhe dalëse. Procedura e aplikimit MSPC kalon nëpër fazat kryesore të mëposhtme:
1) deklarimi i problemit, ndërtimi i një plani vëzhgimi;
2) monitorimi i procesit, mbledhja e të dhënave;
3) analiza e të dhënave, vendosja e lidhjeve të fshehura ndërmjet treguesve;
3) ndërtimi dhe kontrollimi i modelit;
4) aplikimi praktik i modelit për zgjidhjen e problemeve aktuale;
5) analiza e praktikës së aplikimit dhe korrigjimit të modelit.
Dy fazat e fundit nuk janë një herë, por duhet të zbatohen vazhdimisht për të arritur rezultate optimale të prodhimit.
MSPC paraqet gjendjen e procesit të prodhimit në një formë të thjeshtë dhe vizuale dhe është një vazhdim dhe zhvillim logjik i metodave standarde të kontrollit statistikor të procesit. Kjo qasje ju lejon të arrini rezultate të qëndrueshme edhe me pajisje të vjetruara dhe cilësi të paqëndrueshme të lëndëve të para. Duke iu rikthyer klasifikimit të niveleve të kontrollit të cilësisë, të dhëna në fillim të artikullit, mund të shihni se MSPC, në një farë kuptimi, "mbyll rrethin", duke e kthyer prodhimin në kontrollin origjinal "patriarkal", por në një ndryshim cilësor dhe sasior. niveli i sistemit. Nuk është sekret që kontrolli intuitiv dhe ekspert i prodhimit (një gjyshe në kuzhinën e saj) mund të sigurojë cilësinë më të lartë që nuk mund të krahasohet me prodhimin në linjë. Duke përdorur MSPC, është e mundur të përgjithësohet dhe formalizohet matematikisht përvoja individuale, e paçmuar e çdo specialisti dhe në këtë mënyrë ta shtrihet në proceset e prodhimit masiv. Na duket se Rusia, me specialistët e saj të shumtë me përvojë, të aftë për të siguruar prodhim të qëndrueshëm në kushte të paqëndrueshme, është një temë unike për këtë qasje. Është këtu që ai duhet të sjellë rezultatet më mbresëlënëse, veçanërisht pasi kostot që lidhen me zbatimin e MSPC janë shumë më të ulëta sesa, të themi, blerja e pajisjeve të reja.

LISTA E LITERATURËS SË PËRDORUR
1. Shewhart W.A. Kontrolli ekonomik i cilësisë së produktit të prodhuar. - Van Nostrand, Nju Jork, 1931.
2. MacGregor J., Kourti Th. Procesi statistikor Kontrolli i proceseve multivariate // Praktika inxhinierike e kontrollit, 1995 (3), F. 403-413.
3. Kourti Th., MacGregor J. Zhvillimet e fundit në Metodat SPC Multivariate për Monitorimin dhe Diagnostifikimin e Procesit dhe Performancës së Produktit // J. i Teknologjisë së Cilësisë. 1996 28 (4), F. 309-323.
4. Hцskuldsson A. Metodat e parashikimit në shkencë dhe teknologji. Thor Publication, Danimarkë 1996.
5. Eriksson L., Johansson E., Kettaneh-Wold N., Wold S. Analiza e të dhënave me shumë dhe megavariate, Umetrics AB, Umea, 2001.
6. Esbensen K.H. Analiza shumëvariate e të dhënave - Në praktikë Ed. 4, CAMO, 2000.
7. Martens H. dhe Nzhs T. Kalibrimi me shumë variacione, John Wiley & Sons, Chichester, 1989.
8. Buletini INFOMetrix 11-4 / 91. Vlerësimi i oktanit të benzinës nga spektroskopia e afërt infra të kuqe. Infometix, Inc. Seattle, Uashington, SHBA.
9. Kourti Th., MacGregor J. Analiza e procesit, monitorimi dhe diagnostikimi, duke përdorur metoda të projeksionit multivariate. Kimik. inteligjencë. Laboratori. Sistemet. 1995 (28), F. 3-21.

Përgatitur në bazë të materialeve të RIA "Standardet dhe Cilësia"

Modeli i të dhënave relacionale, i cili u propozua nga E.F. Codd në vitin 1970, dhe për të cilin ai mori çmimin Turing një dekadë më vonë, shërben si themeli i industrisë së sotme të bazës së të dhënave shumë miliardë dollarëshe. Gjatë dhjetë viteve të fundit, është zhvilluar një model shumëdimensional i të dhënave, i cili përdoret kur qëllimi është analizimi i të dhënave dhe jo ekzekutimi i transaksioneve. Teknologjia shumëdimensionale e bazës së të dhënave është një mundësi kyçe e analizës ndërvepruese të grupeve të mëdha të të dhënave për të mbështetur vendimmarrjen. Baza e të dhënave të tilla i trajtojnë të dhënat si kube shumëdimensionale, gjë që është shumë e përshtatshme për analizën e tyre.

Modelet multivariate i trajtojnë të dhënat ose si fakte me parametra numerikë të përshtatshëm ose si dimensione tekstuale që karakterizojnë ato fakte. Në shitje me pakicë, për shembull, një blerje është një fakt, vëllimi dhe kostoja e blerjes janë parametra, dhe lloji i produktit të blerë, koha dhe vendi i blerjes janë matje. Pyetjet grumbullojnë vlerat e parametrave në një sërë matjesh, duke rezultuar në vlera të tilla si shitjet totale mujore të një produkti të caktuar. Modelet shumëdimensionale të të dhënave kanë tre aplikime të rëndësishme që lidhen me çështjet e analizës së të dhënave.

  • Depot e të dhënave janë të integruara për të analizuar informacionin nga burime të shumta në një ndërmarrje.
  • Sistemet e përpunimit analitik në internet (OLAP) ofrojnë përgjigje të shpejta për pyetjet që përfshijnë sasi të mëdha të dhënash në kërkim të tendencave të përgjithshme.
  • Aplikacionet e nxjerrjes së të dhënave shërbejnë për të zbuluar njohuritë duke kërkuar gjysmë-automatikisht modele dhe marrëdhënie të panjohura më parë në bazat e të dhënave.

Studiuesit propozuan modele formale matematikore për bazat e të dhënave shumëdimensionale, dhe më pas këto propozime u rafinuan në mjete të veçanta softuerike që zbatojnë këto modele. Shiriti anësor përshkruan evolucionin e modelit të të dhënave shumëdimensionale.

Tabelat dhe marrëdhëniet

Spreadsheets, si ai i paraqitur në Tabelën 1, janë një mjet i dobishëm për të analizuar të dhënat e shitjeve: cilat produkte janë shitur, sa marrëveshje janë bërë dhe ku. Një tabelë kryesore është një tabelë dydimensionale me nëntotalet dhe totalet përkatëse që përdoret për të parë të dhëna më komplekse duke vendosur dimensione të shumta x dhe y dhe duke shfaqur të dhënat në faqe të shumta. Tabelat kryesore zakonisht mbështesin zgjedhjen përsëritëse të nëngrupeve të të dhënave dhe ndryshojnë në nivelin e shfaqur të detajeve.

Spreadsheets nuk janë të përshtatshme për menaxhimin dhe ruajtjen e të dhënave shumëdimensionale, sepse ato i lidhin shumë ngushtë të dhënat me pamjen e tyre, pa e ndarë informacionin strukturor nga prezantimi i dëshiruar i informacionit. Për shembull, shtimi i një dimensioni të tretë si koha, ose grupimi i të dhënave sipas llojeve gjenerike të produkteve, kërkon personalizim shumë më kompleks. Zgjidhja e qartë është përdorimi i një spreadsheet të veçantë për çdo dimension. Por një vendim i tillë justifikohet vetëm në një masë të kufizuar, pasi analiza e grupeve të tilla tabelash bëhet shpejt e rëndë.

Përdorimi i bazave të të dhënave që mbështesin SQL rrit shumë fleksibilitetin e trajtimit të të dhënave të strukturuara. Megjithatë, është e vështirë, nëse jo e pamundur, të formulohen shumë llogaritje, të tilla si agregatet (shitjet vjetore deri më sot), kombinimi i totaleve dhe rezultateve të ndërmjetme, dhe renditja, si përcaktimi i dhjetë produkteve më të shitura, duke përdorur standardin SQL. . Kur riorganizoni rreshtat dhe kolonat, duhet të specifikoni dhe kombinoni manualisht pamjet e ndryshme. Zgjerimet SQL si operatori i kubeve të të dhënave dhe dritaret e pyetjeve i zgjidhin pjesërisht këto probleme; në përgjithësi, një model i pastër relacional nuk lejon punën me dimensionet hierarkike në një nivel të pranueshëm.

Spreadsheets dhe bazat e të dhënave relacionale trajtojnë në mënyrë adekuate grupe të dhënash që kanë pak dimensione, por ato nuk i plotësojnë plotësisht kërkesat e nxjerrjes së të dhënave. Zgjidhja është përdorimi i teknologjisë që mbështet gamën e plotë të mjeteve të modelimit të të dhënave shumëdimensionale.

Kuba

Bazat e të dhënave shumëdimensionale i mendojnë të dhënat si kube, të cilat janë përgjithësime të spreadsheets për çdo numër dimensionesh. Për më tepër, kubet ruajnë një hierarki dimensionesh dhe formulash pa dubluar përkufizimet e tyre. Një grup kubesh përkatës përbën një bazë të dhënash shumëdimensionale (ose ruajtje të dhënash).

Kubet janë të lehta për t'u menaxhuar duke shtuar vlera të reja të dimensioneve. Në përdorim të zakonshëm, ky term tregon një figurë me tre dimensione, megjithatë, në teori, një kub mund të ketë çdo numër dimensionesh. Në praktikë, më shpesh kubet e të dhënave kanë 4 deri në 12 dimensione. Instrumentimi modern shpesh përballet me mungesë të performancës kur i ashtuquajturi hiperkubi ka më shumë se 10-15 dimensione.

Kombinimet e vlerave të dimensioneve përcaktojnë qelizat në kub. Në varësi të aplikimit specifik, qelizat në kub mund të vendosen ose të shpërndara ose të dendura. Kubet priren të copëtohen me rritjen e numrit të dimensioneve dhe granularitetit të vlerave të dimensioneve.

Në fig. 1 tregon një kub që përmban të dhëna shitjesh për dy qytete daneze të treguara në tabelën 1 me një dimension shtesë - "Koha". Të dhënat e shitjeve ruhen në qelizat përkatëse. Në shembull, mund të gjeni një "fakt" - një qelizë jo bosh që përmban parametrat numerikë përkatës - për çdo kombinim të kohës, produktit dhe qytetit ku është bërë të paktën një shitje. Qeliza përmban vlerat numerike të lidhura me faktin - në këtë rast, është vëllimi i shitjeve - parametri i vetëm.

Në përgjithësi, një kub ju lejon të përfaqësoni vetëm dy ose tre dimensione në të njëjtën kohë, por ju mund të tregoni më shumë duke futur një dimension në një tjetër. Kështu, duke projektuar një kub në një hapësirë ​​dy ose tre-dimensionale, mund të zvogëlohet dimensioni i kubit duke grumbulluar disa nga dimensionet, gjë që çon në punë me vlera më komplekse të parametrave. Për shembull, duke parë shitjet sipas qytetit dhe kohës, ne grumbullojmë informacion për çdo kombinim të qytetit dhe kohës. Pra, në fig. 1, duke shtuar fushat 127 dhe 211 jep shitjet totale për Kopenhagen në 2001.

Matjet

Matjet janë një koncept kyç në bazat e të dhënave shumëdimensionale. Modelimi me shumë variacione përfshin përdorimin e dimensioneve për të ofruar kontekstin më të madh të mundshëm për faktet. Ndryshe nga bazat e të dhënave relacionale, teprica e kontrolluar në bazat e të dhënave shumëdimensionale përgjithësisht konsiderohet e justifikuar nëse rrit vlerën e informacionit. Për shkak se të dhënat në një kub shumëdimensional shpesh mblidhen nga burime të tjera, si p.sh. një sistem transaksioni, çështjet e tepricës që lidhen me përditësimet mund të jenë shumë më të lehta për t'u zgjidhur. Si rregull, nuk ka tepricë në fakte, ajo ekziston vetëm në dimensione.

Dimensionet përdoren për të zgjedhur dhe grumbulluar të dhëna në nivelin e kërkuar të detajeve. Dimensionet organizohen në një hierarki të niveleve të shumëfishta, secila prej të cilave përfaqëson nivelin e detajeve të kërkuara për analizën shoqëruese.

Ndonjëherë është e dobishme të përcaktohen hierarki të shumta për një dimension. Për shembull, një model mund të përcaktojë kohën si në vitet fiskale ashtu edhe në ato kalendarike. Disa hierarki ndajnë një ose më shumë nivele të zakonshme, më të ulëta, si dita dhe muaji, dhe modeli i grupon ato në disa nivele më të larta - tremujori fiskal dhe tremujori kalendarik. Për të shmangur përkufizimet e dyfishta, metadata shumëdimensionale e bazës së të dhënave përcakton hierarkinë e dimensionit.

Në fig. Figura 2 tregon skemën e vendndodhjes për të dhënat e shitjeve nga Tabela 1. Nga tre nivelet e dimensioneve të vendndodhjes, më i ulëti është Qyteti. Vlerat e nivelit të qytetit grupohen në vlera të nivelit të vendit, për shembull, Aalborg dhe Kopenhagen janë në Danimarkë. Niveli T përfaqëson të gjitha dimensionet.

Në disa modele shumëdimensionale, një nivel ka disa veti të lidhura që përmbajnë informacion të thjeshtë, johierarkik. Për shembull, madhësia e paketës mund të jetë një veti e nivelit në dimensionin Produkt. Dimensioni i madhësisë së paketës mund ta marrë gjithashtu këtë informacion. Përdorimi i mekanizmit të vetive nuk rrit numrin e dimensioneve në kub.

Ndryshe nga hapësirat lineare, me të cilat merret algjebra matricore, modelet shumëdimensionale në përgjithësi nuk ofrojnë funksione renditjeje ose distancë për vlerat e dimensioneve. E vetmja "renditje" është që vlerat e nivelit më të lartë të përmbajnë vlerat e nivelit më të ulët. Megjithatë, për disa dimensione, të tilla si koha, renditja e vlerave të dimensioneve mund të përdoret për të llogaritur informacionin agregat si shitjet totale gjatë një periudhe të caktuar. Shumica e modeleve kërkojnë që të përcaktohet një hierarki dimensionesh për të formuar pemë të balancuara - hierarkitë duhet të kenë të njëjtën lartësi në të gjitha degët dhe çdo vlerë jo rrënjë duhet të ketë vetëm një prind.

Fakte

Faktet përfaqësojnë një subjekt - një model ose ngjarje që duhet analizuar. Në shumicën e modeleve të të dhënave shumëdimensionale, faktet përcaktohen në mënyrë unike nga një kombinim i vlerave të dimensionit; një fakt ekziston vetëm kur qeliza për një kombinim të caktuar vlerash nuk është bosh. Megjithatë, disa modele i trajtojnë faktet si "objekte të klasit të parë" me veti të veçanta. Shumica e modeleve shumëdimensionale gjithashtu kërkojnë që çdo fakt të ketë një vlerë në nivelin më të ulët të secilit dimension, por në disa modele kjo nuk kërkohet.

Secili fakt ka një shkallë të caktuar, të përcaktuar nga nivelet nga të cilat krijohet kombinimi i tyre i vlerave të dimensioneve. Për shembull, granulariteti i një fakti në kubin e paraqitur në Fig. 1 është (Viti x Produkt x Qyteti). (Viti x Lloji x Qyteti) dhe (Dita x Produkt x Qyteti) janë respektivisht grimca më të trashë dhe më të imët.

Ruajtjet e të dhënave zakonisht përmbajnë tre llojet e mëposhtme të fakteve.

  • Ngjarjet (ngjarje), të paktën në nivelin e shkallës më të madhe, si rregull, simulohen ngjarje të botës reale, ku secili fakt përfaqëson një shembull specifik të fenomenit në studim. Shembujt përfshijnë shitjet, klikimet në një faqe interneti ose lëvizjen e artikujve në një magazinë.
  • Fotot e çastit modeloni gjendjen e një objekti në një moment të caktuar kohor, siç janë nivelet e disponueshmërisë së mallrave në një dyqan ose magazinë dhe numri i përdoruesve të një faqe interneti. I njëjti shembull i një fenomeni të botës reale, siç është një kanaçe e veçantë fasule, mund të ndodhë në shumë fakte.
  • Foto kumulative përmbajnë informacione për aktivitetet e organizatës për një periudhë të caktuar kohore. Për shembull, shitjet kumulative për periudhën e mëparshme, duke përfshirë muajin aktual, mund të krahasohen lehtësisht me muajt korrespondues të vitit të kaluar.

Depoja e të dhënave shpesh përmban të tre llojet e fakteve. Të njëjtat të dhëna të papërpunuara, për shembull, lëvizja e mallrave në magazinë, mund të përmbahen në tre lloje të ndryshme kubesh: fluksi i mallrave në magazinë, lista e mallrave dhe fluksi për vitin e deritanishëm.

Parametrat

Parametrat përbëhen nga dy komponentë:

  • karakteristikat numerike të faktit, për shembull, çmimi ose të ardhurat nga shitjet;
  • një formulë, zakonisht një funksion i thjeshtë agregat, le të themi një shumë, që mund të kombinojë vlera të shumta parametrash në një.

Në një bazë të dhënash shumëdimensionale, parametrat zakonisht përfaqësojnë vetitë e faktit që përdoruesi dëshiron të ekzaminojë. Parametrat marrin vlera të ndryshme për kombinime të ndryshme matjesh. Vetia dhe formula janë zgjedhur për të përfaqësuar një vlerë domethënëse për të gjitha kombinimet e niveleve të grumbullimit. Për shkak se meta të dhënat përcaktojnë një formulë, të dhënat, ndryshe nga rasti i tabelave, nuk përsëriten.

Tre klasat e ndryshme të parametrave sillen shumë ndryshe në llogaritje.

  • Parametrat shtesë mund të kombinohen kuptimisht në çdo dimension. Për shembull, ka kuptim të përmblidhen shitjet totale për produktin, vendndodhjen dhe kohën, pasi kjo nuk shkakton një mbivendosje midis fenomeneve të botës reale që gjenerojnë secilën nga këto vlera.
  • Parametrat gjysmë shtues, të cilat nuk mund të kombinohen në një ose më shumë dimensione. Për shembull, mbledhja e stoqeve për mallra dhe magazina të ndryshme ka kuptim, por mbledhja e stoqeve të mallrave në kohë të ndryshme është e pakuptimtë, pasi i njëjti fenomen fizik mund të numërohet disa herë.
  • Parametrat jo shtues mos kombinoni në asnjë dimension, zakonisht sepse formula e zgjedhur nuk kombinon mesataret e nivelit të ulët në mesataren e nivelit më të lartë.

Parametrat shtues dhe jo shtues mund të përshkruajnë fakte të çdo lloji, ndërsa parametrat gjysmë shtues zakonisht përdoren me pamjet e çastit ose fotografitë e përgjithshme.

Hetimet

Një bazë të dhënash shumëdimensionale është krijuar natyrshëm për lloje të caktuara të pyetjeve.

  • Pyetje me feta dhe zare bëni një zgjedhje që zvogëlon kubin. Për shembull, mund të merrni parasysh seksionin kryq të kubit në Fig. 1, duke marrë parasysh vetëm ato qeliza që prekin bukën dhe më pas e shkurtojnë edhe më shumë, duke i lënë qelizat vetëm të vitit 2000. Ngrirja e një vlere dimensioni zvogëlon dimensionin e kubit, por operacione më të përgjithshme të përzgjedhjes janë të mundshme.
  • Pyetje përmbledhëse dhe përmbledhëse- operacionet reciproke që përdorin një hierarki dimensionesh dhe parametrash për grumbullim. Përgjithësimi në vlera më të larta korrespondon me eliminimin e dimensionit. Për shembull, konvolucioni nga niveli i qytetit në nivelin e vendit në Fig. 2 grumbullon vlerat për Aalborg dhe Kopenhagen në një vlerë, Danimarkë.
  • Stërvitni pyetje të ndryshme kombinoni kube që kanë një ose më shumë dimensione të përbashkëta. Nga pikëpamja e algjebrës relacionale, një operacion i tillë kryen një bashkim.
  • Pyetjet e renditjes kthen vetëm ato qeliza që shfaqen në krye ose në fund të një liste të renditur, si p.sh. 10 produktet më të shitura të Kopenhagës në 2000.
  • Rrotulloje (duke rrotulluar) një kub u jep përdoruesve mundësinë për të parë të dhënat e grupuara sipas dimensioneve të tjera.

Zbatimi

Bazat e të dhënave shumëdimensionale vijnë në dy forma kryesore.

  • Sistemet shumëdimensionale të përpunimit analitik në linjë (MOLAP) ruajnë të dhënat në struktura të specializuara shumëdimensionale. Sistemet MOLAP zakonisht përfshijnë përpunim të rrallë të grupeve dhe përdorin indeksimin dhe hashimin e avancuar për të gjetur të dhëna kur kërkoni.
  • Sistemet relacionale OLAP (ROLAP) përdorin bazat e të dhënave relacionale për të ruajtur të dhënat, dhe gjithashtu përdorin struktura të specializuara të indeksit si bitmaps për të arritur performancë të lartë të pyetjeve.

Sistemet MOLAP në përgjithësi lejojnë përdorim më efikas të hapësirës në disk, si dhe kohë më të shpejta të përgjigjes kur përpunohen kërkesat.

Koha e reduktuar e përgjigjes gjatë përpunimit të kërkesave

Teknikat më të rëndësishme për përmirësimin e performancës në bazat e të dhënave shumëdimensionale janë llogaritja paraprake. Homologu i tyre i specializuar është para-agregacioni, i cili ju lejon të zvogëloni kohën e përgjigjes ndaj pyetjeve që mbulojnë sasi potencialisht të mëdha të dhënash, në masën e mjaftueshme për analizën ndërvepruese të të dhënave.

Llogaritja dhe ruajtja, ose "materializimi" i shitjeve agregate sipas vendit dhe muajit është një shembull i grumbullimit paraprak. Kjo qasje ju lejon të merrni shpejt përgjigje për pyetjet në lidhje me shitjet totale, për shembull, në një muaj, në një vend ose sipas tremujorit dhe vendit në të njëjtën kohë. Këto përgjigje mund të merren nga të dhënat e llogaritura paraprakisht dhe nuk ka nevojë t'i referoheni informacionit të vendosur në depon e të dhënave.

Bazat e të dhënave relacionale tregtare moderne, si dhe sistemet e specializuara shumëdimensionale, përmbajnë mjete të optimizimit të pyetjeve të bazuara në agregatët e parallogaritur (agregate) dhe rillogaritjen automatike të agregatëve të ruajtur kur përditësohen të dhënat themelore.

Para-grumbullimi i plotë - materializimi i të gjitha kombinimeve të agregateve - është i pamundur, pasi kërkon shumë hapësirë ​​në disk dhe kohë për llogaritjet paraprake. Në vend të kësaj, sistemet moderne OLAP ndjekin një qasje më praktike ndaj grumbullimit paraprak, duke materializuar vetëm kombinime të zgjedhura të agregateve dhe më pas duke i përdorur ato për të llogaritur agregatët e tjerë në mënyrë më efikase. Ripërdorimi i agregateve kërkon mbajtjen e një strukture të saktë shumëdimensionale të të dhënave.

Letërsia
  1. R. Winter, “Bazat e të dhënave: Kthehu në lojën OLAP”, Revista Intelligent Enterprise, vëll. 1, nr. 4, 1998
  2. E. Thomsen, G. Spofford, D. Chase, Microsoft OLAP Solutions, John Wiley & Sons, Nju Jork, 1999

Torben Bach Pedersen, Christian S. Jensen, Teknologjia shumëdimensionale e bazës së të dhënave. IEEE Computer, dhjetor 2001. E drejta e autorit IEEE Computer Society, 2001. Të gjitha të drejtat e rezervuara. Ribotuar me leje.

Teoria e ndryshoreve të rastësishme studion fenomenet probabiliste “në statikë”, duke i konsideruar ato si disa rezultate fikse eksperimentesh. Metodat e teorisë klasike të probabilitetit janë të pamjaftueshme për të përshkruar sinjalet që pasqyrojnë fenomene të rastësishme që evoluojnë në kohë. Probleme të tilla studiohen nga një degë e veçantë e matematikës që quhet teoria e proceseve të rastësishme.

Sipas përkufizimit, një proces i rastësishëm është një lloj i veçantë funksioni, i karakterizuar nga fakti se në çdo moment të kohës vlerat që merr janë variabla të rastësishme.

Ansamblet e zbatimeve.

Kur kemi të bëjmë me sinjale përcaktuese, ne i shfaqim ato me varësi funksionale ose oshilograme. Nëse po flasim për procese të rastësishme, atëherë situata është më e ndërlikuar. Duke rregulluar vlerat e menjëhershme të një sinjali të rastësishëm në një interval të caktuar kohor, marrim vetëm një realizim të vetëm të një procesi të rastësishëm. Një proces i rastësishëm është një koleksion i pafund i realizimeve të tilla që formojnë një ansambël statistikor. Për shembull, një ansambël është një grup sinjalesh që mund të vëzhgohen njëkohësisht në daljet e gjeneratorëve të tensionit të zhurmës saktësisht të njëjtë.

Nuk është aspak e nevojshme që zbatimet e një procesi të rastësishëm të përfaqësohen nga funksione me sjellje komplekse, të parregullt në kohë. Shpesh është e nevojshme të merren parasysh proceset e rastësishme të formuara, për shembull, nga të gjitha llojet e sinjaleve harmonike, në të cilat një nga tre parametrat është një ndryshore e rastësishme që merr një vlerë të caktuar në çdo zbatim. Natyra e rastësishme e një sinjali të tillë qëndron në pamundësinë e përcaktimit të vlerës së këtij parametri paraprakisht, përpara eksperimentit.

Proceset e rastësishme të formuara nga realizimet që varen nga një numër i kufizuar parametrash zakonisht quhen procese të rastësishme kuazi-përcaktuese.

Dendësia e probabilitetit të proceseve të rastësishme.

Le të jetë një proces i rastësishëm, i dhënë nga një ansambël realizimesh, një moment arbitrar në kohë. Duke fiksuar vlerat e marra në zbatime individuale, ne kryejmë një seksion kryq njëdimensional të një procesi të rastësishëm të caktuar dhe vëzhgojmë një ndryshore të rastësishme. Dendësia e probabilitetit të tij quhet densiteti i probabilitetit njëdimensional të procesit në momentin e kohës.

Sipas përkufizimit, sasia është probabiliteti që realizimet e procesit të rastësishëm në momentin kohor të marrin vlera që qëndrojnë në interval.

Informacioni që mund të nxirret nga dendësia njëdimensionale është i pamjaftueshëm për të gjykuar natyrën e zhvillimit të realizimeve të një procesi të rastësishëm në kohë. Shumë më tepër informacion mund të merret duke pasur dy seksione të një procesi të rastësishëm në momente të papërputhshme kohore. llogarit probabilitetin e një ngjarjeje që zbatimi i një procesi të rastësishëm në të zhvillohet në një lagje të vogël të një pike dhe për - në një lagje të vogël të pikës

Një përgjithësim natyror është seksioni -dimensional i një procesi të rastësishëm që çon në densitetin e probabilitetit -dimensional

Dendësia shumëdimensionale e probabilitetit të një procesi të rastësishëm duhet të plotësojë kushtet e zakonshme të vendosura në densitetin e probabilitetit të një koleksioni variablash të rastësishëm (shih § 6.2). Për më tepër, vlera nuk duhet të varet nga rendi në të cilin janë vendosur argumentet e tij (kushti i simetrisë).

Ndonjëherë, në vend të densitetit të probabilitetit -dimensionale, është e përshtatshme të përdoret funksioni karakteristik -dimensional, i cili lidhet me densitetin përkatës nga transformimi Furier:

Përshkrimi i vetive të proceseve të rastësishme duke përdorur densitet të probabilitetit shumëdimensional të lartë mund të jetë shumë i detajuar. Megjithatë, gjatë kësaj rruge shpesh hasen vështirësi serioze matematikore.

Funksioni moment i proceseve të rastësishme.

Më pak të detajuara, por, si rregull, mjaft të kënaqshme në kuptimin praktik, karakteristikat e proceseve të rastësishme mund të merren duke llogaritur momentet e atyre variablave të rastësishëm që vërehen në seksionet kryq të këtyre proceseve. Meqenëse, në rastin e përgjithshëm, këto momente varen nga argumentet kohore, ato quhen funksione momenti.

Për inxhinierinë statistikore të radios, tre funksione momentale të rendit më të ulët kanë rëndësinë më të madhe, të quajtura funksioni i pritjes matematikore, variancës dhe korrelacionit.

Vlera e pritshme

është vlera mesatare e procesit X (t) në kohën aktuale; mesatarizimi kryhet në të gjithë ansamblin e realizimeve të procesit.

Dispersion

bën të mundur gjykimin e shkallës së shpërndarjes së vlerave të menjëhershme të marra nga realizimet individuale në një seksion fiks t, në raport me vlerën mesatare.

Momenti qendror 2D

quhet funksion korrelacioni i një procesi të rastësishëm Ky funksion moment karakterizon shkallën e lidhjes statistikore të atyre variablave të rastësishëm që vërehen kur krahasojmë formulat (6.37), (6.38), vërejmë se kur seksionet tërthore kombinohen, funksioni i korrelacionit është numerikisht e barabartë me variancën:

Proceset stokastike stacionare.

Pra, është zakon të quhen procese të rastësishme, karakteristikat statistikore të të cilave janë të njëjta në të gjitha seksionet.

Ata thonë se një proces i rastësishëm është i palëvizshëm në kuptimin e ngushtë; nëse ndonjë prej densitetit të probabilitetit të tij -dimensional është i pandryshueshëm në lidhje me zhvendosjen kohore

Nëse i kufizojmë kërkesat në mënyrë që pritshmëria matematikore dhe varianca e procesit të mos varen nga koha, dhe funksioni i korrelacionit varet vetëm nga ndryshimi -, atëherë një proces i tillë i rastësishëm do të jetë i palëvizshëm në një kuptim të gjerë. Është e qartë se stacionariteti në kuptimin e ngushtë nënkupton stacionaritet në kuptimin e gjerë, por jo anasjelltas.

Siç vijon nga përkufizimi, funksioni i korrelacionit të një procesi të rastësishëm të palëvizshëm është i barabartë:

Për më tepër, vlerat absolute të këtij funksioni për asnjë nuk e kalojnë vlerën e tij për:

Metoda e vërtetimit është si vijon: nga pabarazia e dukshme

vijon se

nga ku pason drejtpërdrejt pabarazia (6.41).

Shpesh është i përshtatshëm për të përdorur funksionin e korrelacionit të normalizuar

per cilin .

Për të ilustruar konceptin e një procesi stokastik stacionar, merrni parasysh dy shembuj.

Shembulli 6.5. Një proces i rastësishëm formohet nga realizimet e formës ku dihen paraprakisht, ndërsa këndi i fazës është një ndryshore e rastësishme e shpërndarë në mënyrë uniforme në intervalin -

Që nga dendësia e probabilitetit të këndit të fazës, pritja matematikore e procesit

Në mënyrë të ngjashme, ju mund të gjeni variancën:

Së fundi, funksioni i korrelacionit

Pra, ky proces i rastësishëm plotëson të gjitha kushtet që janë të nevojshme për të siguruar stacionaritet në një kuptim të gjerë.

Shembulli 6.6. Një proces i rastësishëm ka realizime të formës dhe, për më tepër, numrave të dhënë. - një ndryshore e rastësishme me një ligj të shpërndarjes arbitrare. Vlera e pritshme

do të jetë i pavarur nga koha vetëm për. Prandaj, në rastin e përgjithshëm, procesi i rastësishëm i konsideruar do të jetë jostacionar.

Pronë ergodike.

Një proces i rastësishëm i palëvizshëm quhet ergodik nëse, kur gjejmë funksionet e tij momentale, mesatarja mbi një grup statistikor mund të zëvendësohet me mesataren me kalimin e kohës. Operacioni mesatar kryhet në një zbatim të vetëm, kohëzgjatja e të cilit T teorikisht mund të jetë arbitrarisht e gjatë,

Duke treguar mesataren me kalimin e kohës me kllapa këndore, ne shkruajmë pritshmërinë matematikore të një procesi të rastësishëm ergodik:

e cila është e barabartë me komponentin konstant të zbatimit të zgjedhur.

Shpërndarja e një procesi të ngjashëm

Meqenëse sasia është fuqia mesatare e realizimit, dhe sasia është fuqia e komponentit konstant, varianca ka një kuptim vizual të fuqisë së komponentit të luhatjes së procesit ergodik.

Funksioni i korrelacionit gjendet në mënyrë të ngjashme:

Një kusht i mjaftueshëm për ergodicitetin e një procesi të rastësishëm stacionar në një kuptim të gjerë është tendenca për zero të funksionit të korrelacionit me një rritje të pakufizuar në zhvendosjen e kohës:

Është treguar në matematikë se kjo kërkesë mund të jetë disi e relaksuar. Rezulton se një proces i rastësishëm është ergodik nëse kushti Slutsky plotësohet:

Kështu, barazia (6.47) është e vlefshme për një proces harmonik me një fazë fillestare të rastësishme (shih Shembullin 6.5).

Matja e karakteristikave të proceseve të rastësishme.

Nëse një proces i rastësishëm është ergodik, atëherë realizimi i tij me gjatësi të mjaftueshme është një përfaqësues "tipik" i një ansambli statistikor. Duke studiuar këtë zbatim në mënyrë eksperimentale, mund të merrni shumë informacione që karakterizojnë këtë proces të rastësishëm.

Pajisja për matjen e densitetit të probabilitetit njëdimensional të një procesi të rastësishëm mund të kryhet si më poshtë. Dendësia e probabilitetit njëdimensional të një procesi të rastësishëm ergodik është një sasi në përpjesëtim me kohën relative të qëndrimit të realizimit të tij në nivelin ndërmjet Supozojmë se ekziston një pajisje me dy hyrje, njëra prej të cilave është e pajisur me realizimin e studiuar x (t) , dhe tjetra është një tension konstant referues, niveli i të cilit mund të rregullohet. Në daljen e pajisjes, shfaqen impulse video drejtkëndore me amplitudë konstante, fillimi dhe fundi i të cilave përcaktohen nga momentet në kohë kur vlerat aktuale të sinjalit të rastit përkojnë ose me nivelin ose me nivelin e kësaj pajisjeje. do të jetë proporcionale me densitetin e probabilitetit

Çdo pajisje treguese mjaftueshëm inerciale mund të përdoret për të matur pritshmërinë matematikore të një procesi të rastësishëm [shih. formula (6.43)].

Një pajisje që mat variancën e një procesi të rastësishëm, siç vijon nga (6.44), duhet të ketë një kondensator në hyrje që ndan komponentin DC. Hapat e mëtejshëm në procesin e matjes - kuadrimi dhe mesatarizimi me kalimin e kohës - kryhen me një voltmetër kuadratik inercial.

Parimi i funksionimit të njehsorit të funksionit të korrelacionit (korrelometri) rrjedh nga formula (6.45). Këtu, vlerat e menjëhershme të sinjalit të rastësishëm pas filtrimit të komponentit konstant, duke u ndarë në kanale, futen në shumëzues dhe në një nga kanalet sinjali vonohet për një kohë. Për të marrë vlerën e funksionit të korrelacionit, sinjali nga dalja e shumëzuesit përpunohet nga një njësi inerciale, e cila kryen mesataren.

Pavarësisht nga madhësia

Këtu, të njëjtat emërtime janë miratuar si në formulën (6.26). Elementet e matricës së korrelacionit të këtij procesi të rastësishëm përcaktohen nga funksioni i korrelacionit të normalizuar:

Në atë që vijon, ne shpesh do të përdorim densitetin Gaussian dydimensional

Një proces i palëvizshëm Gaussian zë një vend ekskluziv midis proceseve të tjera të rastësishme - çdo densitet i probabilitetit të tij shumëdimensional përcaktohet nga dy karakteristika: pritshmëria matematikore dhe funksioni i korrelacionit.

Artikujt kryesorë të lidhur