Kako podesiti pametne telefone i računare. Informativni portal

Tehnologija multidimenzionalnih baza podataka.

Relacioni model podataka, koji je predložio E.F. Codd 1970. godine, a za koju je deset godina kasnije dobio Turingovu nagradu, temelj je današnje industrije baza podataka vrijedne više milijardi dolara. U proteklih deset godina razvio se višedimenzionalni model podataka koji se koristi kada je cilj upravo analiza podataka, a ne izvršenje transakcije. Tehnologija višedimenzionalne baze podataka - ključni faktor interaktivna analiza velikih nizova podataka za podršku donošenju odluka. Takve baze podataka tretiraju podatke kao višedimenzionalne kocke, što je vrlo zgodno za njihovu analizu.

Višedimenzionalni modeli razmatraju podatke ili kao činjenice sa odgovarajućim numeričkim parametrima, ili kao tekstualne dimenzije koje karakterišu ove činjenice. U maloprodaji, na primjer, kupovina je činjenica, obim kupovine i trošak su parametri, a vrsta kupljenog proizvoda, vrijeme i mjesto kupovine su mjere. Upiti agregiraju vrijednosti parametara u cijelom rasponu mjerenja, što rezultira vrijednostima kao što je ukupna mjesečna prodaja datog proizvoda. Multidimenzionalni modeli podataka imaju tri važna područja primjene vezane za probleme analize podataka.

  • Skladišta podataka su integrisana za analizu informacija iz više izvora u preduzeću.
  • Operativni sistemi analitička obrada(online analitička obrada - OLAP) omogućava vam da brzo dobijete odgovore na upite koji pokrivaju velike količine podataka u potrazi za uobičajenim trendovima.
  • Aplikacije za rudarenje podataka služe za otkrivanje znanja poluautomatskim traženjem prethodno nepoznatih obrazaca i odnosa u bazama podataka.

Istraživači su predložili formalne matematički modeli multidimenzionalne baze podataka, a zatim su ovi prijedlozi dorađeni u specifičnu softverski alati koji implementira ove modele. Bočna traka opisuje evoluciju višedimenzionalnog modela podataka.

Tabele i odnosi

Tabele slične onima prikazanim u tabeli 1 su zgodan alat analizirati podatke o prodaji: koji proizvodi se prodaju, koliko transakcija je obavljeno i gdje. Zaokretna tabela je dvodimenzionalna tabela sa povezanim srednjim i konačnim rezultatima koja se koristi za pregled složenijih podataka ugnježđivanjem više x i y dimenzija i prikazivanjem podataka na više stranica. Glavne tabele općenito podržavaju iterativni odabir podskupova podataka i promjenu prikazanog nivoa detalja.

Proračunske tablice nisu prikladne za upravljanje i pohranjivanje višedimenzionalnih podataka jer suviše čvrsto vezuju podatke za njihov izgled bez razdvajanja strukturne informacije od željenog prikaza informacija. Na primjer, dodavanje treće dimenzije, kao što je vrijeme, ili grupiranje podataka u generičke tipove proizvoda zahtijeva mnogo složeniju postavku. Očigledno rješenje je korištenje posebne tabele za svaku dimenziju. Ali takvo rješenje je opravdano samo u ograničenoj mjeri, budući da analiza takvih skupova tabela brzo postaje preglomazna.

Upotreba baza podataka koje podržavaju SQL uvelike povećava fleksibilnost obrade strukturiranih podataka. Međutim, da se formulišu mnoge kalkulacije, kao što su agregati (obim prodaje za godinu do danas), kombinacija konačnih i međurezultata, rangiranje, na primjer, određivanje deset najprodavanijih proizvoda, kroz standardna varijanta SQL je veoma težak, ako ne i nemoguć. Kada preuređujete redove i stupce, morate ručno specificirati i kombinirati različite reprezentacije. SQL ekstenzije kao što su Data Cube Operator i Query Windows djelimično rješavaju ove probleme, ali su općenito čiste. relacioni model ne dozvoljava rad sa hijerarhijskim dimenzijama na prihvatljivom nivou.

Tabele i relacione osnove skupovi podataka adekvatno obrađuju skupove podataka koji imaju mali broj dimenzija, ali ne zadovoljavaju u potpunosti zahtjeve dubinske analize podataka. Rješenje je korištenje tehnologije koja podržava cijeli niz višedimenzionalnih alata za modeliranje podataka.

Kuba

Višedimenzionalne baze podataka tretiraju podatke kao kocke koje su generalizacija tabele za bilo koji broj dimenzija. Osim toga, kocke podržavaju hijerarhiju dimenzija i formula bez dupliciranja njihovih definicija. Skup odgovarajućih kocki čini višedimenzionalnu bazu podataka (ili skladište podataka).

Kockama je lako upravljati dodavanjem novih vrijednosti dimenzija. U uobičajenoj upotrebi, ovaj izraz se odnosi na figuru sa tri dimenzije, ali teoretski kocka može imati bilo koji broj dimenzija. U praksi najčešće kocke podataka imaju od 4 do 12 dimenzija. Savremeni alat često nailazi na probleme u performansama kada takozvana hiperkocka ima više od 10-15 dimenzija.

Kombinacije vrijednosti dimenzije definiraju ćelije kocke. U zavisnosti od specifičnu primjenuĆelije u kocki mogu biti raštrkane ili guste. Kocke imaju tendenciju da se razdvoje kako se broj dimenzija i granularnost vrijednosti dimenzija povećavaju.

Na sl. Slika 1 prikazuje kocku koja sadrži podatke o prodaji za dva danska grada navedena u Tabeli 1 s dodatnom dimenzijom, Vrijeme. Odgovarajuće ćelije pohranjuju podatke o prodaji. U primjeru možete pronaći "činjenicu" - nepraznu ćeliju koja sadrži odgovarajuće numeričke parametre - za svaku kombinaciju vremena, proizvoda i grada u kojem je obavljena barem jedna prodaja. Ćelija sadrži numeričke vrijednosti povezane s činjenicom - u ovom slučaju to je obim prodaje - jedini parametar.

Općenito, kocka može istovremeno prikazati samo dvije ili tri dimenzije, ali više se može prikazati ugniježđenjem jedne dimenzije u drugu. Dakle, projektiranjem kocke na dvo- ili trodimenzionalni prostor, moguće je smanjiti dimenziju kocke agregiranjem nekih dimenzija, što dovodi do složenijih vrijednosti parametara. Na primjer, uzimajući u obzir prodaju po gradu i vremenu, prikupljamo informacije za svaku kombinaciju grada i vremena. Dakle, na sl. 1, dodajući polja 127 i 211, dobijamo ukupnu prodaju za Kopenhagen 2001. godine.

mjerenja

Dimenzije su ključni koncept u višedimenzionalnim bazama podataka. Multidimenzionalno modeliranje uključuje korištenje dimenzija kako bi se činjenicama pružilo što je moguće više konteksta. Za razliku od relacijskih baza podataka, kontrolirana redundantnost u višedimenzionalnim bazama podataka općenito je opravdana ako povećava vrijednost informacija. Budući da se podaci u višedimenzionalnoj kocki često prikupljaju iz drugih izvora, kao što je transakcioni sistem, problemi redundantnosti povezani sa ažuriranjima mogu se rešiti mnogo lakše. U pravilu nema suvišnosti u činjenicama, već samo u mjerenjima.

Dimenzije se koriste za odabir i agregiranje podataka na potrebnom nivou detalja. Dimenzije su organizovane u hijerarhiju koja se sastoji od nekoliko nivoa, od kojih svaki predstavlja nivo detalja potreban za odgovarajuću analizu.

Ponekad je korisno definirati višestruke hijerarhije za dimenziju. Na primjer, model može definirati vrijeme i u fiskalnim i u kalendarskim godinama. Nekoliko hijerarhija dijeli jedan ili više zajedničkih, najnižih nivoa, kao što su dan i mjesec, a model ih grupiše u nekoliko viših nivoa, fiskalni kvartal i kalendarski kvartal. Kako bi se izbjeglo dupliciranje definicija, metapodaci višedimenzionalne baze podataka definiraju hijerarhiju dimenzija.

Na sl. Slika 2 prikazuje šemu "Lokacija" za podatke o prodaji iz Tabele 1. Od tri nivoa dimenzije lokacije, najniži je "Grad". Vrijednosti na nivou grada su grupisane u vrijednosti na nivou države, na primjer Aalborg i Kopenhagen su u Danskoj. Nivo T predstavlja sve dimenzije.

U nekim višedimenzionalnim modelima, nivo ima nekoliko povezanih svojstava koja sadrže jednostavne, nehijerarhijske informacije. Na primjer, veličina serije može biti svojstvo razine u dimenziji proizvoda. Dimenzija Veličina paketa također može primiti ove informacije. Korištenje mehanizma svojstava ne povećava broj dimenzija u kocki.

Za razliku od linearni prostori, sa kojom se bavi matrična algebra, višedimenzionalni modeli općenito ne pružaju funkcije reda ili udaljenosti za vrijednosti dimenzija. Jedina "naredba" je da su vrijednosti više visoki nivo sadrže vrijednosti nižih nivoa. Međutim, za neke dimenzije, kao što je vrijeme, poredak vrijednosti dimenzija može se koristiti za izračunavanje kumulativnih informacija, kao što je ukupna prodaja za dati period. Većina modela zahtijeva definiciju hijerarhije dimenzija kako bi se formirala uravnotežena stabla - hijerarhije moraju imati iste visine na svim granama, i svaka vrijednost ne-korijenskog nivoa - samo jedan roditelj.

Podaci

Činjenice predstavljaju predmet – određeni obrazac ili događaj koji treba analizirati. U većini multidimenzionalnih modela podataka, činjenice su jedinstveno određene kombinacijom vrijednosti dimenzija; činjenica postoji samo kada ćelija za određenu kombinaciju vrijednosti nije prazna. Međutim, neki modeli tretiraju činjenice kao "prvoklasne objekte" sa posebnim svojstvima. Većina multidimenzionalnih modela također zahtijeva da svaka činjenica ima jednu vrijednost na nižem nivou svake dimenzije, ali u nekim modelima to nije slučaj. obavezan uslov.

Svaka činjenica ima određenu granularnost definiranu razinama iz kojih se kreira njihova kombinacija vrijednosti dimenzija. Na primjer, činjenica granularnosti u kocki prikazanoj na Sl. 1 je (godina x proizvod x grad). (Godina x Vrsta x Grad) i (Dan x Proizvod x Grad) su grublje i finije granularnosti.

Skladišta podataka obično sadrže sljedeće tri vrste činjenica.

  • Događaji (događaj), barem na nivou najveće granularnosti, po pravilu se modeliraju događaji iz stvarnog svijeta, pri čemu svaka činjenica predstavlja određeni primjer fenomena koji se proučava. Primjeri su prodaja, klikovi na web stranicu ili kretanje robe u skladištu.
  • Snimci modelirati stanje objekta u datom trenutku, kao što su nivoi zaliha u prodavnici ili skladištu i broj korisnika web stranice. Isti primjer fenomena iz stvarnog svijeta, kao što je određena konzerva pasulja, može se pojaviti u više činjenica.
  • Kumulativni snimci sadrže informacije o aktivnostima organizacije za određeni vremenski period. Na primjer, kumulativni obim prodaje za prethodni period, uključujući i tekući mjesec, može se lako uporediti sa ciframa za odgovarajuće mjesece prethodne godine.

Skladište podataka često sadrži sve tri vrste činjenica. Isti izvorni podaci, kao što je kretanje robe u skladištu, mogu biti sadržani u tri različite vrste kocki: protok robe u skladištu, lista robe i tok za godinu do tekućeg datuma.

Parametri

Parametri imaju dvije komponente:

  • numerička karakteristika činjenice, kao što je cijena ili prihod od prodaje;
  • formula, obično jednostavna funkcija agregiranja, recimo zbroj, koja može kombinirati više vrijednosti parametara u jednu.

U višedimenzionalnoj bazi podataka, parametri obično predstavljaju svojstva činjenice koju korisnik želi da ispita. Parametri poprimaju različite vrijednosti za različite kombinacije mjerenja. Svojstvo i formula su odabrani da predstavljaju značajnu vrijednost za sve kombinacije nivoa agregacije. Budući da metapodaci definiraju formulu, podaci se, za razliku od proračunskih tablica, ne repliciraju.

Prilikom računanja tri druga klasa parametri se ponašaju potpuno drugačije.

  • Dodatni parametri mogu se smisleno kombinirati u bilo kojoj dimenziji. Na primjer, ima smisla zbrojiti ukupnu prodaju za proizvod, lokaciju i vrijeme, jer to ne uzrokuje preklapanje među pojavama u stvarnom svijetu koje svaka od ovih vrijednosti generiše.
  • poluaditivni parametri, koji se ne mogu kombinovati u jednoj ili više dimenzija. Na primjer, zbrajanje zaliha po različitim robama i skladištima ima smisla, ali zbrajanje zaliha robe u različito vrijeme je besmisleno, jer se isti fizički fenomen može prebrojati nekoliko puta.
  • Neaditivni parametri se ne kombinuju ni u jednoj dimenziji, obično zato što izabrana formula ne dozvoljava da se proseci niskog nivoa kombinuju u prosek višeg nivoa.

Aditivni i neaditivni parametri mogu opisati činjenice bilo koje vrste, dok se poluaditivni parametri obično koriste sa snimcima ili kumulativnim snimcima.

Zahtjevi

Višedimenzionalna baza podataka je prirodno dizajnirana da određene vrste zahtjevi.

  • zahtjevi za komadiće napraviti izbor koji smanjuje kocku. Na primjer, razmotrite presjek kocke na sl. 1, uzimajući u obzir samo one ćelije koje se tiču ​​kruha, a zatim ga dalje smanjivati, ostavljajući ćelije vezane samo za 2000. godinu. Fiksiranje vrijednosti dimenzije smanjuje dimenziju kocke, ali su moguće i općenitije operacije odabira.
  • Zahtjevi kao što su drill-down i roll-up- recipročne operacije koje koriste hijerarhiju dimenzija i parametara za agregaciju. Generalizacija na više vrijednosti odgovara eliminaciji dimenzije. Na primjer, konvolucija od nivoa "Grad" do nivoa "Država" na Sl. 2 agregira vrijednosti za Aalborg i Kopenhagen u jednu vrijednost, Danska.
  • drill-across upite kombinujte kocke koje imaju jednu ili više zajedničkih dimenzija. Sa stanovišta relacione algebre, takva operacija vrši spajanje (spajanje).
  • rangiranje upita vraća samo one ćelije koje se pojavljuju na vrhu ili dnu sortirane liste, kao što je 10 najprodavanijih proizvoda u Kopenhagenu 2000. godine.
  • Rotirajuće Kocka daje korisnicima mogućnost da vide podatke grupisane po drugim dimenzijama.

Implementacija

Multidimenzionalne baze podataka se implementiraju u dva glavna oblika.

  • Multidimenzionalni sistemi za analitičku obradu na mreži (MOLAP) pohranjuju podatke u specijalizovane višedimenzionalne strukture. MOLAP sistemi obično uključuju rukovanje rijetkim nizovima i koriste napredno indeksiranje i heširanje za traženje podataka prilikom pokretanja upita.
  • relacijski OLAP sistemi(ROLAP) koriste relacijske baze podataka za pohranjivanje podataka i također koriste specijalizirane strukture indeksa kao što su bitmape za postizanje velika brzina izvršenje zahtjeva.

MOLAP sistemi generalno omogućavaju efikasniju upotrebu prostor na disku, kao i brže vrijeme odgovora prilikom obrade zahtjeva.

Smanjenje vremena odgovora prilikom obrade zahtjeva

Najvažnije metode za poboljšanje performansi u višedimenzionalnim bazama podataka su predračunavanje. Njihov specijalizovani pandan je preagregacija, koja smanjuje vreme odgovora za upite koji uključuju potencijalno ogromne količine podataka do stepena dovoljnog za interaktivnu analizu podataka.

Izračunavanje i skladištenje, ili "materijalizacija", konsolidovanog obima prodaje po zemlji i mjesecu je primjer prethodnog združivanja. Ovaj pristup vam omogućava da brzo dobijete odgovore na upite u vezi sa ukupnom prodajom, na primjer, u jednom mjesecu, u jednoj zemlji ili istovremeno po kvartalu i zemlji. Ovi odgovori se mogu dobiti iz prethodno izračunatih podataka i nema potrebe da se pozivate na informacije pohranjene u skladištu podataka.

Savremene komercijalne relacione baze podataka, kao i specijalizovani višedimenzionalni sistemi, sadrže alate za optimizaciju upita zasnovane na unapred izračunatim agregatima (agregatima) i automatskom ponovnom izračunavanju uskladištenih agregata prilikom ažuriranja osnovnih podataka.

Potpuna predagregacija - materijalizacija svih kombinacija agregata - je nemoguća, jer zahtijeva previše prostora na disku i vremena za preliminarne proračune. Umjesto ovoga savremeni sistemi OLAP-ovi koriste praktičniji pristup prethodnom združivanju materijalizujući samo odabrane kombinacije agregiranja i zatim ih koriste za efikasnije izračunavanje drugih agregacija. Ponovna upotreba agregati zahtijeva održavanje ispravne višedimenzionalne strukture podataka.

Književnost
  1. R. Winter, "Baze podataka: Povratak u OLAP igru", Intelligent Enterprise Magazine, vol. 1, br. 4, 1998
  2. E. Thomsen, G. Spofford, D. Chase, Microsoft OLAP Solutions, John Wiley & Sons, New York, 1999.

Torben Bach Pedersen, Christian S. Jensen, Multidimensional Database Technology. IEEE Computer, decembar 2001. Autorsko pravo IEEE Computer Society, 2001. Sva prava zadržana. Preštampano uz dozvolu.

Modul Tehnologije multidimenzionalnog istraživanja za STATISTICA analizu(jedan od modula proizvoda STATISTIC Advanced) pruža širok spektar tehnologija istraživanja, od analize klastera do naprednih metoda stabla klasifikacije, u kombinaciji sa ogromnim spektrom interaktivnih alata za vizualizaciju za izgradnju modela. Modul uključuje:

U modulu klaster analiza implementirano full set metode analize podataka klastera, uključujući k-srednje vrednosti, hijerarhijsko grupisanje i metode spajanja sa dva ulaza. Podaci mogu doći kao originalni oblik, te u obliku matrice udaljenosti između objekata. Opažanja, varijable ili/ili zapažanja i varijable mogu se grupirati korištenjem različitih mjera udaljenosti (Euklid, Euklidski kvadrat, gradski blokovi (Manhattan), Čebišev, snaga, postotak neslaganja i Pearsonov 1-koeficijent korelacije) i različita pravila grupiranja (povezivanja) (pojedinačna, puna veza, neponderisani i ponderisani prosek grupe u paru, neponderisana, ponderisana udaljenost između centara, Wardova metoda i dr.).

Matrice udaljenosti mogu se sačuvati za dalju analizu u drugim sistemskim modulima STATISTIKA. Prilikom izvođenja klaster analize korištenjem metode k-means, korisnik ima puna kontrola iznad početna lokacija klaster centri. Mogu se izvesti ekstremno veliki planovi analize: na primjer, sa hijerarhijskim (stablom) povezivanjem, možete raditi sa matricom od 90 hiljada udaljenosti. Pored standardnih rezultata klaster analize, u modulu je dostupan i raznovrstan skup deskriptivnih statistika i naprednih dijagnostičkih metoda (kompletna šema udruživanja sa nivoima praga za hijerarhijsko grupisanje, ANOVA tabela za k-means klasterisanje). Informacije o pripadnosti objekata klasterima mogu se dodati u datoteku podataka i koristiti u daljoj analizi. Grafičke mogućnosti modula klaster analiza uključuju prilagodljive dendrograme, dvosmjerne dijagrame objedinjavanja, grafički dijagram objedinjavanja, k-means klastering srednji dijagram i još mnogo toga.

Modul Faktorska analiza sadrži širok spektar statističkih podataka i metoda faktorske analize (kao i hijerarhijske faktorske analize) sa naprednom dijagnostikom i velikim brojem dijagrama istraživanja i istraživanja. Ovdje možete izvršiti analizu (opšti i hijerarhijski kosi) glavnih komponenti i glavnih faktora za skupove podataka koji sadrže do 300 varijabli (veći modeli se mogu istražiti pomoću modula (SEPATH)).

Analiza i klasifikacija glavnih komponenti

STATISTIKA također uključuje program za analizu i klasifikaciju glavnih komponenti. Izlaz ovog programa je sopstvene vrijednosti(uobičajeno, kumulativno i relativno), faktorska opterećenja i koeficijenti skora faktora (koji se mogu dodati u datoteku ulaznih podataka, pogledati na ikoni i u interaktivni način rada recode), kao i neke specifičnije statistike i dijagnostike. Korisnik ima sledeće metode rotacije faktora: varimax, biquartimax, quartimax i equimax (prema normalizovanim ili početnim opterećenjima), kao i kose rotacije.

Faktorski prostor se može vizuelno posmatrati deo po deo na 2D ili 3D dijagramima rasejanja sa označenim tačkama podataka; između ostalih grafički alati- "scree" grafovi, razne vrste dijagrama raspršenja, histogrami, linijski grafovi i dr. Nakon što je faktorijalno rješenje određeno, korisnik može izračunati (reproducirati) matricu korelacije i ocijeniti konzistentnost faktorskog modela analizom rezidualne korelacijske matrice (ili matrice rezidualne varijanse/kovarijance). Na ulazu možete koristiti i originalne podatke i korelacijske matrice. Pomoću modula mogu se izvršiti potvrdna faktorska analiza i druge povezane vrste analiza Modeliranje strukturnih jednačina(SEPATH) iz bloka STATISTICA Opći linearni i nelinearni modeli, gdje će poseban čarobnjak za potvrdnu faktorsku analizu voditi korisnika kroz sve korake izgradnje modela.

Ovaj modul implementira kompletan skup metoda kanonske analize (dopunjujući metode kanonske analize ugrađene u druge module). Možete raditi i sa izvornim datotekama podataka i sa korelacionim matricama; izračunavaju se sve standardne statistike kanonske korelacije (svojstveni vektori i svojstvene vrijednosti, koeficijenti redundancije, kanonske težine, opterećenja, varijanse, testovi značajnosti za svaki od korijena, itd.), kao i neke proširene dijagnostike. Za svako opažanje mogu se izračunati vrijednosti kanonske varijable, koje se zatim mogu vidjeti na ugrađenim piktogramima (i također dodati u datoteku podataka).

Ovaj modul uključuje širok spektar procedura za dizajniranje i evaluaciju uzorka istraživanja i upitnika. Kao iu svim modulima sistema STATISTIKA, ovdje se mogu analizirati izuzetno veliki nizovi podataka (skala koja se sastoji od 300 pozicija može se obraditi u jednom pozivu programa).

Moguće je izračunati statistiku pouzdanosti za sve pozicije na skali, interaktivno odabrati podskupove i upoređivati ​​između podskupova pozicija pomoću poređenja podijeljenih na pola ili podijeljenih dijelova. U jednoj posjeti može se ocijeniti pouzdanost sumarne skale i podskala. Uz interaktivno brisanje pozicija, pouzdanost rezultirajuće skale se izračunava trenutno bez ponovnog pristupa datoteci podataka. Rezultati analize su: korelacijske matrice i deskriptivna statistika za pozicije, Cronbachova alfa, standardizirana alfa, prosječna korelacija pozicija-pozicija, kompletna ANOVA tabela za skalu, kompletan skup statistika zajedničkih za sve pozicije (uključujući višestruke koeficijente korelacije), split- polupouzdanost i korelacija između dvije polovine korigovane za slabljenje.

Postoji veliki izbor dijagrama (uključujući ugrađene dijagrame raspršivanja, histograme, linije i druge dijagrame) i skup interaktivnih rutina šta-ako koji će vam pomoći da razvijete skale. Na primjer, prilikom dodavanja određenog broja pitanja na skalu, korisnik može izračunati očekivanu pouzdanost ili procijeniti broj pitanja koja treba dodati na skalu da bi postigao željenu pouzdanost. Također je moguće ispraviti slabljenje između trenutne skale i drugog mjerenja (s obzirom na pouzdanost trenutne skale).

Modul sistemi STATISTIKA sadrži najpotpuniju implementaciju razvijenih U poslednje vreme metode za efikasnu konstrukciju i testiranje (metoda klasifikacionih stabala je određena („iterativna“) metoda za predviđanje klase kojoj objekat pripada, na osnovu vrednosti prediktorskih varijabli za ovaj objekat). Klasifikaciono stablo se može graditi na kategoričkim ili ordinalnim prediktorima, ili na mješavini oba tipa prediktora grananjem na pojedinačne varijable ili na njihove linearne kombinacije.

Modul takođe implementira: izbor između punog nabrajanja opcija grananja (kao u THAID i CART paketima) i diskriminantnog grananja; nepristrasan izbor varijabli grananja (kao u QUEST paketu); eksplicitno postavljanje pravila zaustavljanja (kao u paketu FACT) ili rezidbe od listova drveta do njegovog korijena (kao u paketu CART); odsječen udjelom grešaka u klasifikaciji ili funkcijom odstupanja; generalizirane mjere fit hi-kvadrata, G-kvadrata i Gini indeksa. Apriorne vjerovatnoće pripadnosti klasama i troškovi klasifikacijskih grešaka mogu se postaviti jednakim, procijeniti iz podataka ili postaviti ručno.

Korisnik također može podesiti višestrukost unakrsne provjere tokom izgradnje stabla i za procjenu greške, parametar SE-pravila, minimalni broj objekata na graničnoj tački, sjeme za generator slučajnih brojeva i alfa parametar za odabir varijabli. Ugrađeni grafički alati pomažu u istraživanju ulaznih i izlaznih podataka.

Ovaj modul sadrži potpunu implementaciju jednostavnih i multivarijantnih metoda analize korespondencije, može analizirati tabele vrlo velike veličine. Program prihvata sljedeće tipove datoteka podataka: datoteke koje sadrže kategorizirane varijable, koje se koriste za izgradnju matrice nepredviđenih okolnosti (unakrsna klasifikacija); datoteke podataka koje sadrže tablice frekvencija (ili bilo koje druge mjere korespondencije, povezanosti, sličnosti, nereda, itd.) i varijable koda koje definiraju (nabrajaju) ćelije ulazne tablice; datoteke podataka koje sadrže frekvencije (ili druge mjere korespondencije). Na primjer, korisnik može direktno kreirati i analizirati tablicu frekvencija. Osim toga, u slučaju multivarijantne korespondencije, moguće je direktno specificirati Burtovu matricu kao ulazne podatke.

Tokom rada, program izračunava različite tabele, uključujući tabelu procenata po redovima, po kolonama i procentima ukupan broj, očekivane vrijednosti, razlike između očekivanih i posmatranih vrijednosti, standardizirane devijacije i doprinosi hi-kvadrat statistici. Sve ove statistike mogu se iscrtati na 3D histogramima i pregledati upotrebom posebne tehnike dinamičkog slojevanja.

U modulu generalizirane svojstvene vrijednosti i svojstveni vektori se izračunavaju i izlaze standardni set dijagnostičke veličine, uključujući singularne vrijednosti, vlastite vrijednosti i udio inercije po mjerenju. Korisnik može odabrati broj mjerenja ili postaviti graničnu vrijednost za maksimalni kumulativni postotak inercije.

Program izračunava standardne koordinate za tačke redova i kolona. Korisnik može birati između standardizacije profila redova, standardizacije profila kolona, ​​standardizacije profila redova i stupaca ili kanonske standardizacije. Za svaku dimenziju i za svaku tačku reda i kolone program izračunava vrijednosti inercije, kvaliteta i kosinusa**2. Dodatno, korisnik može prikazati (u prozoru rezultata) matrice generaliziranih singularnih vektora. Kao i svaki podatak iz radnog prozora, ove matrice su dostupne za obradu pomoću programa na jeziku STATISTIKA Visual Basic, na primjer, za korištenje bilo kojeg nestandardne metode koordinatni proračuni.

Korisnik može izračunati koordinate i odgovarajuću statistiku (kvalitet i kosinus**2) za dodatne tačke (-kolone ili -redove) i uporediti rezultate sa originalnim tačkama reda i kolone. Dodatne točke se mogu koristiti u multivarijantnoj analizi korespondencije. Pored 3D histograma koji se mogu izračunati za sve tabele, korisnik može prikazati dijagrame svojstvenih vrijednosti, jedno-, dvo- i trodimenzionalne grafikone za tačke u redovima i kolonama. Tačke redova i tačke kolona mogu se istovremeno prikazati na istom grafikonu, zajedno sa svim dodatnim tačkama (svaka vrsta tačke koristi drugu boju i jedinstveni marker tako da će se različite tačke lako razlikovati na grafikonima). Sve tačke imaju markere, a korisnik ima mogućnost da podesi veličinu markera.

U modulu implementiran je kompletan skup metoda za (nemetričko) višedimenzionalno skaliranje. Ovdje se mogu analizirati matrice sličnosti, razlike i korelacije između varijabli, a dimenzija prostora skaliranja može biti do 9. Inicijalnu konfiguraciju može izračunati program (koristeći analizu glavnih komponenti) ili postaviti od strane korisnika. Količina stresa i faktor otuđenja se minimiziraju upotrebom posebne iterativne procedure.

Korisnik ima mogućnost da posmatra iteracije i prati promene ovih vrednosti. Konačna konfiguracija se može vidjeti u tabeli rezultata, kao i na 2D i 3D dijagramima raspršenosti u prostoru mjerila sa označenim tačkama objekta. Izlazni rezultati su: nestandardizirani napon (F), Kruskalov koeficijent naprezanja S i koeficijent isključenja. Nivo slaganja može se ocijeniti korištenjem Shepardovih grafikona (sa vrijednostima "d sa kapom" i "d sa zvjezdicom"). Kao i svi rezultati analize u sistemu STATISTIKA, konačna konfiguracija se može sačuvati kao datoteka sa podacima.

Modul sadrži potpunu implementaciju metoda postupne diskriminantne analize koristeći diskriminantne funkcije. STATISTIKA takođe uključuje modul Opći modeli Diskriminantna analiza (GDA) da se uklope u dizajne kategoričkih zavisnih varijabli sličnih ANOVA/ANCOVA, ili da se izvedu razne vrste analize (npr. najbolji izbor predviđanja, profilisanje posteriornih verovatnoća).

Program vam omogućava analizu uključivanje korak po korak ili isključivanjem varijabli ili uvođenjem korisnički definiranih blokova varijabli u model. Pored brojnih grafikona i statističkih podataka koji opisuju funkciju razdvajanja (diskriminacije), program takođe sadrži veliki skup alata i statistika za klasifikaciju starih i novih zapažanja (za procenu kvaliteta modela). Rezultati su: Wilksova lambda statistika za svaku varijablu, kvocijent lambda, F statistika za uključivanje (ili isključenje), p nivoi značajnosti, vrijednosti tolerancije i kvadrat koeficijenta višestruke korelacije. Program vrši potpunu kanonsku analizu i vraća sve svojstvene vrijednosti (direktne i kumulativne), nivoe njihove značajnosti p, koeficijente diskriminantne (kanonske) funkcije (u direktnom i standardiziranom obliku), koeficijente strukturne matrice (faktorska opterećenja), srednje vrijednosti diskriminantne funkcije i težine diskriminacije za svaki objekt (mogu se automatski dodati u datoteku podataka).

Ugrađena grafička podrška uključuje: histograme kanonskih težina za svaku grupu (i zajedničke za sve grupe), posebne dijagrame raspršenja za parove kanonskih varijabli (koje pokazuju kojoj grupi pripada svako opažanje), veliki skup kategoriziranih (višestrukih) dijagrama koji omogućavaju vam da istražite distribuciju i odnose između zavisnih varijabli za različite grupe (uključujući: višestruke dijagrame kao što su dijagrami okvira, histogrami, dijagrami raspršenja i dijagrami normalne vjerovatnoće) i još mnogo toga.

U modulu takođe se može izračunati standardne funkcije klasifikaciju za svaku grupu. Rezultati klasifikacije posmatranja mogu se prikazati u smislu Mahalanobisovih udaljenosti, posteriornih vjerovatnoća i samih rezultata klasifikacije, a vrijednosti diskriminantne funkcije za pojedinačna opažanja (kanonske vrijednosti) mogu se vidjeti na preglednim piktogramima i drugim multivarijantnim grafikonima dostupnim direktno iz tablica rezultata. Svi ovi podaci mogu se automatski dodati u trenutnu datoteku podataka za dalju analizu. Takođe možete prikazati konačnu matricu klasifikacije, koja pokazuje broj i procenat ispravno klasifikovanih zapažanja. Postoje različite opcije za postavljanje apriornih vjerovatnoća pripadnosti klasama, kao i uvjeti odabira koji vam omogućavaju da uključite ili isključite određena zapažanja iz postupka klasifikacije (na primjer, kako biste potom provjerili njen kvalitet na novom uzorku).

Opći modeli za diskriminantnu analizu (GDA)

Modul Opći modeli za diskriminantnu analizu STATISTICA (GDA) je aplikacija i proširenje Generale Linearni modeli klasificirati zadatke. Isto kao i modul Diskriminantna analiza, GDA vam omogućava da izvodite konvencionalne sekvencijalne diskriminantne analize. GDA predstavlja problem diskriminantne analize kao poseban slučaj generalni linearni model i time pruža izuzetno korisne nove prilagođene analitičke tehnologije.

Kao i konvencionalna diskriminantna analiza, GDA vam omogućava da odaberete željene kategorije zavisnih varijabli. U analizi se grupe elemenata evidentiraju kao indikatorske varijable i sve GRM metode se mogu lako primijeniti. Širok izbor GRM i GLM rezidualnih statistika je dostupan u dijalogu rezultata GDA.

GDA pruža niz efikasnih alata za rudarenje podataka i primijenjeno istraživanje. GDA izračunava sve standardne rezultate diskriminantne analize, uključujući koeficijente diskriminantnih funkcija, rezultate kanonske analize (standardizovane i neobrađene koeficijente, kanonske testove koraka, itd.), statistiku klasifikacije (uključujući Mahalanobisovu udaljenost, posteriorne vjerovatnoće, klasifikaciju zapažanja u prihvatljivim analizama, pogrešnu klasifikaciju matrice itd.). Za Dodatne informacije o jedinstvenim karakteristikama GDA

Teorija slučajnih varijabli proučava probabilističke pojave "u statici", smatrajući ih nekim fiksnim rezultatima eksperimenata. Za opis signala koji odražavaju slučajne pojave koje se razvijaju u vremenu, metode klasične teorije vjerovatnoće su se pokazale nedovoljnim. Takve probleme proučava posebna grana matematike koja se zove teorija slučajnih procesa.

Po definiciji, slučajni proces je posebna vrsta funkcije, koju karakterizira činjenica da su u svakom trenutku vrijednosti koje uzima slučajne varijable.

implementacioni ansambli.

Suočavanje sa deterministički signali, prikazujemo ih funkcionalne zavisnosti ili oscilograma. Kada su u pitanju slučajni procesi, situacija je složenija. Fiksiranje trenutnih vrijednosti za određeni vremenski period slučajni signal, dobijamo samo jednu realizaciju slučajnog procesa. Slučajni proces je beskonačan skup takvih realizacija koje čine statistički ansambl. Na primjer, ansambl je skup signala koji se može istovremeno posmatrati na izlazima potpuno istih generatora napona buke.

Uopšte nije neophodno da implementacije slučajnog procesa budu predstavljene funkcijama sa složenim, vremenski nepravilnim ponašanjem. Često je potrebno uzeti u obzir slučajne procese formirane, na primjer, od svih mogućih harmonijski signali, za koji je jedan od tri parametra slučajna varijabla koja uzima određenu vrijednost u svakoj implementaciji. Slučajna priroda takvog signala leži u nemogućnosti da se unaprijed zna vrijednost ovog parametra prije eksperimenta.

Slučajni procesi formirani realizacijama koje zavise od konačnog broja parametara obično se nazivaju kvazideterministički slučajni procesi.

Gustoće vjerovatnoće slučajnih procesa.

Neka je slučajni proces definisan ansamblom realizacija, neka je proizvoljan trenutak u vremenu. Fiksirajući vrijednosti dobijene u pojedinačnim implementacijama, izvodimo jednodimenzionalni dio ovog slučajnog procesa i promatramo slučajnu varijablu čija se gustina vjerovatnoće naziva jednodimenzionalna gustina vjerovatnoće procesa u trenutku

Prema definiciji, vrijednost je vjerovatnoća da će implementacija slučajnog procesa u jednom trenutku uzeti vrijednosti koje leže u intervalu

Informacije koje se mogu izvući iz jednodimenzionalnog denziteta nisu dovoljne da se sudi o prirodi razvoja realizacije slučajnog procesa u vremenu. Mnogo više informacija se može dobiti ako imate dva dijela slučajnog procesa u nepodudarnim vremenima. Dvodimenzionalna slučajna varijabla koja proizlazi iz takvog misaonog eksperimenta opisuje se dvodimenzionalnom gustinom vjerovatnoće. Ova karakteristika slučajnog procesa vam omogućava izračunati vjerovatnoću događaja da se implementacija slučajnog procesa u odvija u malom susjedstvu tačke i na - u maloj okolini tačke

Prirodna generalizacija je -dimenzionalni dio slučajnog procesa koji vodi do -dimenzionalne gustine vjerovatnoće

Multivarijantna gustina verovatnoće slučajnog procesa mora da zadovolji uobičajene uslove nametnute gustini verovatnoće skupa slučajnih varijabli (videti § 6.2). Osim toga, vrijednost ne bi trebala ovisiti o redoslijedu u kojem se nalaze njeni argumenti (uslov simetrije).

Ponekad, umjesto -dimenzionalne gustine vjerovatnoće, zgodno je koristiti -dimenzionalnu karakterističnu funkciju, koja je povezana s odgovarajućom gustinom pomoću Fourierove transformacije:

Opis svojstava slučajnih procesa koji koriste visokodimenzionalne višedimenzionalne gustine vjerovatnoće može biti prilično detaljan. Međutim, na tom putu često postoje ozbiljne matematičke poteškoće.

Momentne funkcije slučajnih procesa.

Manje detaljne, ali, po pravilu, sasvim zadovoljavajuće u praktičnom smislu, karakteristike slučajnih procesa mogu se dobiti izračunavanjem momenata onih slučajnih varijabli koje se uočavaju u poprečnim presjecima ovih procesa. Pošto u opštem slučaju ovi momenti zavise od vremenskih argumenata, nazivaju se momentnim funkcijama.

Za statističku radiotehniku, tri momentne funkcije nižeg reda, koje se nazivaju matematičko očekivanje, varijansa i korelacija, su od najveće važnosti.

Očekivana vrijednost

je prosječna vrijednost procesa X(t) u trenutnom vremenu; usrednjavanje se vrši po čitavom ansamblu procesnih realizacija.

Disperzija

omogućava da se proceni stepen disperzije trenutnih vrednosti koje uzimaju pojedinačne implementacije u fiksnom preseku t, u odnosu na prosečnu vrednost.

2D centralni moment

se naziva korelacionom funkcijom slučajnog procesa Ova funkcija momenta karakteriše stepen statistička povezanost one slučajne varijable koje se uočavaju u Upoređujući formule (6.37), (6.38), napominjemo da kada se sekcije kombinuju, korelacija je numerički jednaka disperziji:

Stacionarni slučajni procesi.

Stoga je uobičajeno nazivati ​​nasumične procese čije su statističke karakteristike iste u svim dijelovima.

Za slučajni proces se kaže da je stacionaran u užem smislu; ako je bilo koja od njegove -dimenzionalne gustine vjerovatnoće invarijantna pod vremenskim pomakom

Ako ograničimo zahtjeve tako da matematičko očekivanje i varijansa procesa ne zavise od vremena, a korelacijske funkcije ovisi samo o razlici - , tada će takav slučajni proces biti stacionaran u širem smislu. Jasno je da stacionarnost u užem smislu podrazumijeva stacionarnost u širem smislu, ali ne i obrnuto.

Kao što slijedi iz definicije, korelacijska funkcija stacionarnog slučajnog procesa je parna:

Osim toga, apsolutne vrijednosti ove funkcije za bilo koju ne prelaze njene vrijednosti za:

Metoda dokaza je sljedeća: iz očigledne nejednakosti

sledi to

odakle direktno slijedi nejednakost (6.41).

Često je zgodno koristiti normaliziranu funkciju korelacije

za koji .

Da biste ilustrirali koncept stacionarnog slučajnog procesa, razmotrite dva primjera.

Primjer 6.5. Slučajni proces se formira realizacijama oblika gde su unapred poznati, dok je fazni ugao slučajna varijabla ravnomerno raspoređena na segmentu -

Budući da je gustina vjerovatnoće faznog ugla matematičko očekivanje procesa

Slično, možete pronaći varijansu:

Konačno, funkcija korelacije

Dakle, ovaj slučajni proces zadovoljava sve uslove koji su neophodni da bi se osigurala stacionarnost u širem smislu.

Primjer 6.6. Slučajni proces ima realizacije oblika i, štaviše, datih brojeva. - slučajna varijabla sa proizvoljnim zakonom raspodjele. Očekivana vrijednost

će biti nezavisan od vremena samo za Stoga, u opštem slučaju, slučajni proces koji se razmatra će biti nestacionaran.

Ergodic property.

Stacionarni slučajni proces naziva se ergodičan ako se, prilikom pronalaženja njegovih trenutnih funkcija, usrednjavanje po statističkom ansamblu može zamijeniti usrednjavanjem tokom vremena. Operacija usrednjavanja se izvodi na jednoj implementaciji čije trajanje T teoretski može biti proizvoljno veliko,

Označavajući vrijeme u prosjeku ugaonim zagradama, pišemo matematičko očekivanje ergodičkog slučajnog procesa:

koja je jednaka konstantnoj komponenti odabrane implementacije.

Disperzija takvog procesa

Pošto je vrijednost prosječna implementaciona snaga, a vrijednost snaga konstantne komponente, disperzija ima jasno značenje snage fluktuacijske komponente ergodičkog procesa.

Korelaciona funkcija se nalazi na isti način:

Dovoljan uslov za ergodičnost slučajnog procesa, koji je stacionaran u širem smislu, je težnja korelacione funkcije ka nuli sa neograničenim povećanjem vremenskog pomaka:

Matematika pokazuje da se ovaj zahtjev može donekle ublažiti. Ispada da je slučajni proces ergodičan ako je zadovoljen uslov Slutskog:

Dakle, jednakost (6.47) vrijedi za harmonijski proces sa slučajnom početnom fazom (vidi primjer 6.5).

Mjerenje karakteristika slučajnih procesa.

Ako je slučajni proces ergodičan, onda je njegova realizacija dovoljne dužine "tipični" predstavnik statističkog ansambla. Eksperimentalno proučavajući ovu implementaciju, može se dobiti mnogo informacija koje karakterišu ovaj slučajni proces.

Uređaj za mjerenje jednodimenzionalne gustine vjerovatnoće slučajnog procesa može se izraditi na sljedeći način. Jednodimenzionalna gustina vjerovatnoće ergodičkog slučajnog procesa je veličina proporcionalna relativnom vremenu provedenom na njegovu implementaciju na nivou između. Pretpostavimo da postoji uređaj sa dva ulaza, od kojih je jedan snabdjeven implementacijom x(t) koji se proučava, a drugi je referentni jednosmerni napon čiji se nivo može regulisati. Na izlazu uređaja se pojavljuju pravougaoni video impulsi konstantne amplitude čiji su početak i kraj određeni trenucima u vremenu kada se trenutne vrijednosti slučajnog signala poklapaju ili sa nivoom ili sa nivoom. Ovaj uređaj će biti proporcionalan gustini vjerovatnoće

Bilo koji dovoljno inercijski pokazivački uređaj može se koristiti za mjerenje matematičkog očekivanja slučajnog procesa [vidi. formula (6.43)].

Uređaj koji mjeri disperziju slučajnog procesa, kao što slijedi iz (6.44), mora imati kondenzator na ulazu koji odvaja konstantnu komponentu. Dalje korake procesa mjerenja - kvadriranje i usrednjavanje tokom vremena - izvodi inercijski kvadratni voltmetar.

Princip rada merača korelacione funkcije (korelometra) sledi iz formule (6.45). Ovdje se trenutne vrijednosti slučajnog signala, nakon filtriranja konstantne komponente, dijele na kanale i upućuju u množitelj, a u jednom od kanala signal kasni s vremenom. Da bi se dobila vrijednost korelacijske funkcije, signal sa izlaza množitelja se obrađuje inercijskom vezom, koja vrši usrednjavanje.

Bez obzira na veličinu

Ovdje se koristi ista notacija kao u formuli (6.26). Elementi korelacione matrice ovog slučajnog procesa određeni su normalizovanom korelacionom funkcijom:

U nastavku ćemo često koristiti dvodimenzionalnu Gausovu gustinu

Stacionarni Gausov proces zauzima izuzetno mesto među ostalim slučajnim procesima - bilo koja njegova višedimenzionalna gustina verovatnoće je određena dvema karakteristikama: matematičkim očekivanjem i korelacionom funkcijom.

A. I. Saichev* i S. G. Utkin*

TRANZICIJA MULTIDIMENZIONALNIH SKOČNIH PROCESA SA ANOMALNE U LINEARNU DIFUZIJU

Razmatraju se višedimenzionalni procesi "kvazi-anomalnih" slučajnih šetnji, koji imaju asimptotiku linearne difuzije pri velikim vremenima i pokoravaju se zakonima anomalne difuzije u srednjim (također dovoljno velikim u odnosu na mikroskopske skale) vremenima. Prikazan je prijelaz skokovitog procesa iz anomalne u linearnu difuziju. Numerički proračuni potvrđuju valjanost analitičkih proračuna za dvodimenzionalne i trodimenzionalne slučajeve. , .....

Ključne riječi: anomalna subdifuzija, anomalna superdifuzija, parcijalne diferencijalne jednadžbe, asimptotika međutonova, kvazi-anomalna slučajna hodanja.

1. UVOD

Glavni znak anomalne difuzije je nelinearni rast srednjeg kvadrata slučajnog procesa s vremenom: >r: V» «

karakteristične, na primjer, za takve fizičke pojave kao što su turbulentna difuzija, haotična dinamika Hamiltonovih sistema, prijenos naboja u amorfnim poluvodičima, itd. skokovi i distribucije w (x) veličina skokova.

Također je poznato da do anomalne difuzije dolazi zbog kršenja središnje granične teoreme (CLT) ili zakona velikih brojeva (LLN) (vidi, na primjer, ). Zauzvrat, neprimjenjivost LSP-a je zbog beskonačnosti prvih trenutaka vremena čekanja za skokove, a kršenje CLT-a je povezano sa beskonačnošću drugih trenutaka skokova. Ove okolnosti služe kao predmet kritike teorije anomalne difuzije od strane fizičara, koji s pravom primjećuju da su za većinu fizičkih pojava naznačeni momenti ograničeni.

„Državni univerzitet Nižnji Novgorod, Nižnji Novgorod, Rusija. Email: [email protected]; [email protected]

Cijena 18 ^ub. Uvez 1 str.

456 A. I. SAICCHEV, S. G. UTKIN;

Svrha ovog rada je da pokaže činjenicu da se anomalna subdifuzija može javiti iu "klasičnom slučaju" kada su LBP i CLT validni. Naime, uz "čisto" anomalne difuzijske procese koji se detaljno proučavaju, postoje i "kvazi-anomalni" slučajni procesi koji se povinuju zakonima linearne difuzije u vrlo velikim vremenima i prostornim skalama, te pokazuju univerzalnu asimptotiku anomalne difuzije u "srednjim" vremenima. . Ovaj rad je posvećen analizi upravo takvih kvazi-anomalnih slučajnih procesa u prostorima različitih dimenzija. Utvrđeno je, posebno, da su, za razliku od klasične višedimenzionalne difuzije, slučajne koordinate procesa anomalnog difuzijskog skoka statistički zavisne čak i za nezavisne komponente vektora slučajnog skoka.

2. NASUMIČNE ŠETNJE

Razmotrimo tipičan proces slučajnog hoda koji se povinuje najjednostavnijoj stohastičkoj jednadžbi hh-.

*-----. < к 1

Bez gubitka opštosti, pretpostavljamo da su slučajni intervali čekanja za skokove m~k = tk - ifc-i i sami slučajni skokovi hk međusobno nezavisni i takođe imaju iste distribucije /(t) i w(x), respektivno. Očigledno je da

gdje je N(t) broj skokova do vremena t. Ovo je inverzna funkcija n-tog vremena skoka T(n):

t = T(n) = ] " "

Koristeći očiglednu relaciju ekvivalencije za ove funkcije ~ !! N(t)^n T(n)

a podjela jedinice - m. .„>”.. l ■>.

1= ^IIn(z) = ^, z>0, "Y ■

gdje je x(z) funkcija koraka, izvodimo jednačinu za karakterističnu funkciju razmatranog procesa X (f):

©(«; t) = (¿»HM) = £ /exp (w £ hk) V n=0 ^ ^ fc=1 " "

Cijena 18 hrast. Povezivanje Í str.

■ th) anomalni subdiff-i CLT su validni. I mi difuzija pro-l, podložna zakonitim skalama, nye anomalija-diffu-ali takva kvazi-anomalija-1. U prvom dijelu otkriveno je da su nasumične koordinate zavisne čak

proteo-

1ly čekaju skokove i također imaju jedan-)

1i n-tog skoka T(n):

r\u003e O, ^ "ic funkcija distribucije

TRANZICIJA MULTIDIMENZIONALNIH PROCESA SKOKA. ..

Primjenjujemo Laplaceovu transformaciju na oba dijela jednakosti i zbrajamo rezultirajuću geometrijsku progresiju:

Pronađeni izraz za Laplaceovu sliku 0(u; s) karakteristične funkcije je višedimenzionalni analog Monroll-Weissove jednadžbe. Ovdje je f(s) Laplaceova slika raspodjele intervala između skokova, a w(u) je karakteristična funkcija skokova. Iz posljednje jednačine se može vidjeti da Q(u; s) ispunjava jednačinu

0(u;s) - w(u)Q(u;s) =

........... ÎM (2-2)

Primjenjujući na njega inverzne Fourierove i Laplaceove transformacije, lako je dobiti (u zavisnosti od vrste raspodjela /(r) i w(x)) i klasičnu Kolmogorov-V-Fellerovu jednačinu i kinetičke jednačine anomalne difuzije.

3. ASIMPTOTSKE JEDNAČINE ZA GUSTOĆU VEROVATNOĆE ŠETANJA X(t)

Kao što je gore navedeno, oblik jednadžbe za gustinu vjerovatnoće W(x; t) zavisi od vrste distribucije f(r) i tu(x), odnosno od njihove Laplaceove slike f(s) i karakteristične funkcije w(u) . Zatim ćemo dobiti asimptotske jednadžbe za W(x; t), koje vrijede na različitim vremenskim skalama, u slučaju distribucije f(r) sa Laplaceovom transformacijom

V "I + sp" >

gdje je S mali parametar. Svi momenti /(r) su ograničeni, što ga čini fizički ispravnijim od povezane frakciono-eksponencijalne distribucije - (koja odgovara vrijednosti 6 = 0), što je jedan od ključnih u teoriji anomalne difuzije. Razmotrimo slučaj kada je parametar 6 toliko mali da je vremenski interval između 1 i 1/(5 dovoljno velik. Tada proces X(t) prolazi kroz tri uzastopne faze. U početku, u trenucima t 1, ponašanje proces ovisi o finoj strukturi distribucija / (r ) u(x) uae odražava univerzalne zakone difuzije. Nadalje, u trenucima između 1 i 1/6, zbog polako padajućih repova potencijskog zakona distribucije / (t), proces se pokorava anomalnim zakonima difuzije. Zatim, pri t 3> 1/6, proces se povinuje normalnom zakonu linearne difuzije zbog repova distribucije /(r) koji se eksponencijalno smanjuju pri m 1/6.

Zamjenjujemo f(s) (3.1) u jednačinu (2.2) i raspravljamo o njenom asimptotičkom ponašanju kao s 1, što odgovara vjerojatnosnim svojstvima procesa skoka u velikim vremenima.

Kao primijenjen na Laplaceovu sliku raspodjele /(m), izdvajamo slučaj s oo kao i slučaj 6 s 1 odgovoran za "srednji" način rada 1

Cijena 18 ^ub. Uvez 1 str.

i (2.2) poprima oblik

A. I. Saichev, S. G. Utkin

u ©(«;«) + - w(«)]v(«; 5) = 1,

a u drugom / (c) ~ 1 - (1 + 8 $) i, shodno tome,

"" § ("; e) + (1 + - d (")] u (u; ") \u003d u "-1.

Primjenom inverzne Fourierove i Laplaceove transformacije na dobijene jednakosti dolazimo do Kolmogorov-Fellerove jednačine

> + [tsg(x.^ _ * Z*)] =< оо,

ili na generalizovanu Kolmogorov-Fellerovu jednačinu

A + b0) t * m) - x (x-l) * u (, x)) \u003d 1 "*"

karakteristika, na primjer, za multivarijantnu normalnu distribuciju sa nezavisnim koordinatama i istom disperzijom a2 duž svih osa. Zatim iz gornjih jednadžbi slijede jednadžbe linearne i anomalne difuzije za različite vremenske asimptotike, redom:

e-l".(< "■

T? 2h* ""h"#""" "g(1 -0)

Rješenje prvog od njih je dobro poznato:

hŠh), !«*<-. (3.3)

* "I" (x O- (1 + 1 + -

gdje je n dimenzija prostora slučajnog procesa. Rješenje druge jednačine je dato u sljedećem odjeljku.

Da bi h u n-dimenzionalnom w

komponente argumenta! /3-stabilan

Multidimenzionalni Tag-Leffle

Dakle, org difuzija

gdje , i .

Problem digitalnog modeliranja višedimenzionalnog normalnog slučajnog procesa treba formulirati na sljedeći način. Daje se korelacija ili spektralna matrica slučajnog procesa. Potrebno je pronaći algoritam za formiranje na digitalnom računaru diskretnih realizacija slučajnog procesa sa datim korelacionim (spektralnim) svojstvima.

Za rješavanje ovog problema koristimo, kao i prije, ideju linearnog filtera za oblikovanje. U slučaju koji se razmatra, radi se o sintezi višedimenzionalnog filtera za oblikovanje.

Dimenzionalni linearni filter je definisan kao linearni dinamički sistem sa ulazima i izlazima. Ako - ulazna akcija i je odgovor sistema, tada se odnos između ulaza i izlaza -dimenzionalnog linearnog kontinuiranog filtera opisuje korištenjem matrice prijenosa u obliku

gdje I - slike ulaznog i izlaznog signala, respektivno, u smislu Laplaceove transformacije; - matrica prijenosa -dimenzionalnog filtera, čiji su elementi prijenosne funkcije kanala -th input - -th output.

Ulazno-izlazna veza u diskretno-dimenzionalnim linearnim filterima opisana je slično:

,

gdje i - slike u smislu diskretne Laplaceove transformacije ulaznih i izlaznih signala; je matrica prijenosa diskretno-dimenzionalnog filtera.

Strukturni dijagram višedimenzionalnog filtera na primeru dvodimenzionalnog filtera prikazan je na sl. 2.9, prema kojem

(2.107)

Vidimo da je svaki od izlaznih signala i zbir linearnih operatora iz ulaznih signala i . Slične relacije postoje iu opštem slučaju. Ovo je identifikacija matrica prijenosa.

Neka akcija na ulazu -dimenzionalnog linearnog filtera bude -dimenzionalni bijeli šum, tj. slučajni proces s korelacijskom matricom oblika

za kontinuirano vrijeme i

za diskretno vrijeme, gdje - delta funkcija. -dimenzionalni bijeli šum je ovdje definiran kao skup neovisnih -koreliranih slučajnih procesa.

Može se pokazati (vidi, na primjer, ) da je pod utjecajem bijelog šuma, spektralna matrica procesa na izlazu - dimenzionalni filter za kontinuirano i diskretno vrijeme, povezana sa matricom prijenosa filtra pomoću odnosi

(2.108)

gdje simbol označava transponiranu matricu.

Stoga, da bi se dobio -dimenzionalni slučajni proces sa datom spektralnom matricom, potrebno je proći -dimenzionalni bijeli šum kroz -dimenzionalni filter oblikovanja čija prijenosna matrica zadovoljava jednačine (2.108). Da bismo pronašli matricu prijenosa iz date spektralne matrice, potrebno je podijeliti potonju na dva faktora oblika (2.108). Ovaj postupak se naziva faktorizacija spektralne matrice. Može se implementirati prema poznatim algoritmima.

Multidimenzionalno filtriranje bijelog šuma je prilično jednostavno: svaka komponenta nasumični proces na izlazu -dimenzionalnog filtera s matricom prijenosa dobiva se zbrajanjem po komponentama ulazni proces filtriran jednodimenzionalnim filterima sa funkcijama prijenosa [vidi. formula (2.107)]. Algoritmi jednodimenzionalnog filtriranja su razmotreni gore.

Ovom metodom modeliranja moguća su dva načina: 1) data spektralna matrica kontinuiranog dimenzionalnog slučajnog procesa može se direktno faktorizirati kako bi se dobila prijenosna matrica filtera za kontinuirano oblikovanje, a zatim, korištenjem egzaktnih ili aproksimativnih metoda diskretizacije gore opisani kontinuirani filteri za obavljanje višedimenzionalnog filtriranja kontinuiranog bijelog šuma; 2) s obzirom na spektralnu matricu kontinuiranog dimenzionalnog procesa, koristeći -transformaciju, možete pronaći spektralnu matricu odgovarajućeg diskretnog slučajnog procesa (vidi § 2.3), zatim pronaći funkciju prijenosa filtra za diskretno oblikovanje faktorizacijom, i zatim izvršite višedimenzionalno filtriranje diskretnog bijelog šuma.

Najveće poteškoće se susreću u faktorizaciji spektralnih matrica. Trenutno su algoritmi faktorizacije razvijeni samo za racionalne spektralne matrice, odnosno takve matrice čiji su elementi razlomke racionalne funkcije argumenata ili .

Opišimo, izostavljajući dokaze, jedan od algoritama za faktorizaciju racionalnih spektralnih matrica, preuzet iz .

Neka je data racionalna spektralna matrica

.

Matrica se može svesti na formu

kroz sledeće transformacije.

1. Određuje se rang matrice, tada se jedan od minora glavnog reda nalazi u gornjem lijevom uglu matrice.

2. Matrica se svodi na dijagonalni oblik. Da biste to učinili, prvi red pomnožen sa - dodaje se -tom redu matrice , , a zatim se prva kolona pomnožena sa - dodaje -toj koloni; matrica

, (2.109)

gdje su elementi matrice

izgleda kao

(2.110)

S matricom se izvode iste transformacije kao i s originalnom matricom . Nastavljajući ovaj proces u prvom koraku, dobijamo dijagonalnu matricu

takav da .

3. Pronađena je pomoćna matrica

čiji elementi izgledaju ovako:

(2.111)

gdje se određuju iz rekurentnih odnosa

(2.112)

4. Pronađeni su pomoćni polinomi

gdje - nule polinoma , koji leže u donjoj poluravni, broje se onoliko puta koliko je njihov maksimalni multiplicitet, i imenioci su razlomačno-racionalnih funkcija, koje su elementi matrice:

.

5. Prema metodi razmatranoj u § 2.9, tačka 2, razlomke racionalne funkcije

predstavljeni su u obliku

,

gdje su polinomi i nemaju nule u donjoj poluravni.

Ovo završava proces faktorizacije. Konačna matrica prijenosa filtera za oblikovanje je zapisana kao

(2.113)

Ovdje opisujemo algoritam faktorizacije za racionalne spektralne matrice kontinuiranih višedimenzionalnih procesa. Faktorizacija spektralnih matrica diskretnih procesa se provodi na sličan način, ali umjesto korijena koji se nalazi u donjoj poluravni uzimaju se korijeni koji se nalaze u jediničnom krugu.

Primjer 1 Neka je dvodimenzionalni kontinuirani stacionarni centrirani slučajni proces zadan sa korelacijskom matricom

, (2.114)

gdje su neke pozitivne konstante, i .

Korelaciona matrica koja odgovara spektralnoj matrici (2.114) ima oblik

, (2.115)

gdje I - autokorelacioni i krokorelacioni momenti procesa, odnosno; - koeficijent međusobne korelacije procesa i podudarnih tačaka u vremenu. Koeficijenti i predstavljaju u ovom slučaju širinu (na nivou od 0,5) energetskih spektra i međusobni energetski spektar procesa i .

Potrebno je faktorizirati spektralnu matricu (2.114) da bi se dobila matrica prijenosa filtera za oblikovanje.

Postupak faktorizacije ćemo provoditi korak po korak u skladu sa gore navedenim algoritmom faktorizacije.

1. U ovom slučaju, rang spektralne matrice .

2. Jedan korak je potreban da bi se napravila dijagonala matrice. Po formulama (2.109) i (2.110) dobijamo

.

3. U skladu sa izrazima (2.111) i (2.112), pomoćna matrica ima oblik

4. U slučaju koji se razmatra potrebno je pronaći samo jedan pomoćni polinom . Da biste to učinili, morate pronaći korijene nazivnika matričnog elementa, odnosno korijene polinoma. Ovi korijeni su

shodno tome,

.

5. U završnoj fazi potrebno je faktorizirati razlomke racionalnih funkcija

U ovom slučaju, korijeni brojnika i nazivnika frakcionih racionalnih funkcija i lako se izračunavaju. Koristeći korijene koji leže u gornjoj poluravni (korijeni s pozitivnim imaginarnim dijelovima), dobivamo i do varijable:

.

Na sl. Na slici 2.9 prikazan je blok dijagram dvodimenzionalnog filtera za oblikovanje, na čijem izlazu se formira dvodimenzionalni slučajni proces sa traženim spektralnim karakteristikama ako bijeli šum djeluje na ulaz filtera. Zamjenom kontinuiranog dvodimenzionalnog filtera odgovarajućim diskretnim filterom, dobijamo algoritam za generisanje diskretnih realizacija dvodimenzionalnog slučajnog normalnog procesa na digitalnom računaru, odnosno diskretne realizacije dva stacionarna i stacionarno povezana normalna slučajna procesa sa eksponencijalnim auto- i međukorelacijske funkcije oblika (2.115).

Sa drugim pristupom sintezi filtera za oblikovanje, prvo se mora pronaći spektralna matrica odgovarajućeg diskretnog višedimenzionalnog slučajnog procesa. U primjeru koji se razmatra ova matrica ima oblik

I matrice (2.116).

Razmatrani primjer pokazuje da se faktorizacija spektralnih matrica provodi relativno jednostavno ako je moguće analitički pronaći nule odgovarajućih polinoma. Kod faktorizacije spektralne matrice kontinuiranog dvodimenzionalnog procesa to nije bilo teško, jer je za određivanje nula bilo potrebno riješiti samo kvadratne i bikvadratne jednadžbe. Prilikom faktorizacije spektralne matrice diskretnog dvodimenzionalnog procesa, postojale su kvadratne jednačine i recipročna jednačina četvrtog stepena, koja takođe dozvoljava analitičko rešenje.

U drugim, složenijim slučajevima, nije uvijek moguće analitički pronaći nule polinoma. U tim slučajevima se pribegava numeričkim metodama za rešavanje jednačina th stepena. Generalno, proces faktorizacije se može implementirati na računaru kao standardni program. Za ovu svrhu mogu se koristiti i drugi algoritmi faktorizacije osim ovdje datog.

Treba napomenuti da su svi trenutno postojeći algoritmi spektralne matrične faktorizacije, generalno govoreći, veoma naporni.

Top Related Articles