Kako postaviti pametne telefone i računala. Informativni portal
  • Dom
  • Operacijski sustavi
  • Tehnologija višedimenzionalnih baza podataka. STATISTICA Multivarijatne istraživačke tehnike

Tehnologija višedimenzionalnih baza podataka. STATISTICA Multivarijatne istraživačke tehnike

Teorija slučajnih varijabli proučava vjerojatnosne pojave "u statici", smatrajući ih nekim fiksnim rezultatima pokusa. Za opisivanje signala koji odražavaju slučajne pojave koje se razvijaju u vremenu, pokazalo se da su metode klasične teorije vjerojatnosti nedovoljne. Takve probleme proučava posebna grana matematike koja se naziva teorija slučajnih procesa.

Po definiciji, slučajni proces je posebna vrsta funkcije, karakterizirana činjenicom da su u bilo kojem trenutku vrijednosti koje uzima slučajne varijable.

provedbeni ansambli.

Nositi se sa deterministički signali, prikazujemo ih kao funkcionalne ovisnosti ili oscilograme. Ako pričamo o slučajnim procesima, situacija je kompliciranija. Fiksiranjem trenutnih vrijednosti slučajnog signala za određeno vremensko razdoblje, dobivamo samo jednu implementaciju slučajnog procesa. Slučajni proces je beskonačan skup takvih realizacija koje tvore statistički skup. Na primjer, ansambl je skup signala koji se mogu istovremeno promatrati na izlazima potpuno istih generatora napona šuma.

Uopće nije nužno da implementacije slučajnog procesa budu predstavljene funkcijama sa složenim, nepravilnim vremenskim ponašanjem. Često je potrebno razmotriti slučajne procese nastale, na primjer, svim mogućim harmonijski signali, za koji je jedan od tri parametra slučajna varijabla koja u svakoj implementaciji poprima određenu vrijednost. Slučajna priroda takvog signala leži u nemogućnosti poznavanja vrijednosti ovog parametra unaprijed, prije eksperimenta.

Slučajni procesi formirani realizacijama koje ovise o konačnom broju parametara obično se nazivaju kvazi-deterministički slučajni procesi.

Gustoće vjerojatnosti slučajnih procesa.

Neka je slučajan proces definiran skupom realizacija, neka je proizvoljan trenutak u vremenu. Fiksirajući vrijednosti dobivene u pojedinačnim implementacijama, provodimo jednodimenzionalni presjek ovog slučajnog procesa i promatramo slučajnu varijablu. Njena gustoća vjerojatnosti naziva se jednodimenzionalna gustoća vjerojatnosti procesa u trenutku vremena.

Prema definiciji, vrijednost je vjerojatnost da će implementacija slučajnog procesa u jednom trenutku poprimiti vrijednosti koje leže u intervalu

Informacije koje se mogu izvući iz jednodimenzionalne gustoće nisu dovoljne za prosudbu prirode razvoja realizacija slučajnog procesa u vremenu. Mnogo više informacija može se dobiti ako imamo dva dijela slučajnog procesa u neusklađenim vremenima. Dvodimenzionalna slučajna varijabla koja proizlazi iz takvog misaonog eksperimenta opisuje se dvodimenzionalnom gustoćom vjerojatnosti. Ova karakteristika slučajnog procesa omogućuje nam izračunavanje vjerojatnost događaja da se realizacija slučajnog procesa na odvija u malom susjedstvu točke i na - u malom susjedstvu točke

Prirodna generalizacija je -dimenzionalni dio slučajnog procesa koji vodi do -dimenzionalne gustoće vjerojatnosti

Multivarijatna gustoća vjerojatnosti slučajnog procesa mora zadovoljiti uobičajene uvjete nametnute gustoći vjerojatnosti skupa slučajnih varijabli (vidi § 6.2). Osim toga, vrijednost ne bi trebala ovisiti o redoslijedu u kojem se nalaze njeni argumenti (uvjet simetrije).

Ponekad je umjesto -dimenzionalne gustoće vjerojatnosti zgodno koristiti -dimenzionalnu karakterističnu funkciju, koja je povezana s odgovarajućom gustoćom Fourierovom transformacijom:

Opis svojstava slučajnih procesa korištenjem visokodimenzionalnih višedimenzionalnih gustoća vjerojatnosti može biti prilično detaljan. Međutim, često postoje ozbiljne matematičke poteškoće na tom putu.

Momentne funkcije slučajnih procesa.

Manje detaljne, ali u pravilu sasvim zadovoljavajuće u praktičnom smislu karakteristike slučajnih procesa mogu se dobiti izračunavanjem momenata onih slučajnih varijabli koje se promatraju u presjecima tih procesa. Jer u opći slučaj ti momenti ovise o vremenskim argumentima, nazivaju se momentnim funkcijama.

Za statističku radiotehniku najveća vrijednost imaju tri momentne funkcije nižeg reda koje se nazivaju srednja vrijednost, varijanca i korelacijska funkcija.

Očekivana vrijednost

je prosječna vrijednost procesa X(t) u trenutnom trenutku; usrednjavanje se provodi na cjelokupnom skupu realizacija procesa.

Disperzija

omogućuje procjenu stupnja disperzije trenutnih vrijednosti uzetih pojedinačnim implementacijama u fiksnom odsječku t, u odnosu na prosječnu vrijednost.

2D središnji moment

naziva se korelacijskom funkcijom slučajnog procesa.Ova funkcija momenta karakterizira stupanj statistička povezanost one slučajne varijable koje se promatraju pri Uspoređujući formule (6.37), (6.38), primjećujemo da je kada se odjeljci kombiniraju korelacijska funkcija brojčano jednaka disperziji:

Stacionarni slučajni procesi.

Tako je uobičajeno nazvati slučajne procese, čije su statističke karakteristike iste u svim odjeljcima.

Za slučajni proces se kaže da je stacionaran u užem smislu; ako je bilo koja njegova -dimenzionalna gustoća vjerojatnosti nepromjenjiva u odnosu na vremenski pomak

Međutim, ako su zahtjevi ograničeni tako da matematičko očekivanje i varijanca procesa ne ovise o vremenu, a korelacijska funkcija ovisi samo o razlici - , tada će takav slučajni proces biti stacionaran u širem smislu. Jasno je da stacionarnost u užem smislu implicira stacionarnost u širem smislu, ali ne i obrnuto.

Kao što slijedi iz definicije, korelacijska funkcija stacionarnog slučajnog procesa je parna:

Osim toga, apsolutne vrijednosti ove funkcije za bilo koje ne prelaze njezine vrijednosti za:

Metoda dokazivanja je sljedeća: iz očite nejednakosti

slijedi to

odakle izravno slijedi nejednakost (6.41).

Često je zgodno koristiti normaliziranu korelacijsku funkciju

za koji .

Kako bismo ilustrirali koncept stacionarnog slučajnog procesa, razmotrimo dva primjera.

Primjer 6.5. Slučajni proces formiraju realizacije oblika gdje su unaprijed poznate, dok je fazni kut slučajna varijabla jednoliko raspoređena na segmentu -

Budući da je gustoća vjerojatnosti faznog kuta matematičko očekivanje procesa

Slično, možete pronaći varijancu:

Konačno, funkcija korelacije

Dakle, ovaj slučajni proces zadovoljava sve uvjete koji su potrebni da bi se osigurala stacionarnost u širem smislu.

Primjer 6.6. Slučajni proces ima realizacije oblika i, štoviše, zadane brojeve. - slučajna varijabla s proizvoljnim zakonom raspodjele. Očekivana vrijednost

bit će neovisan o vremenu samo za Stoga će u općem slučaju slučajni proces koji se razmatra biti nestacionaran.

Ergodičko svojstvo.

Stacionarni slučajni proces naziva se ergodičkim ako se, u pronalaženju njegovih funkcija momenta, usrednjavanje statističkog skupa može zamijeniti usrednjavanjem tijekom vremena. Operacija usrednjavanja izvodi se na jednoj implementaciji čije trajanje T može teoretski biti proizvoljno veliko,

Označavajući vremensko usrednjavanje uglastim zagradama, pišemo matematičko očekivanje ergodičkog slučajnog procesa:

koja je jednaka konstantnoj komponenti odabrane implementacije.

Disperzija takvog procesa

Budući da je vrijednost prosječna implementacijska snaga, a vrijednost snaga konstantne komponente, disperzija ima jasno značenje snage fluktuacijske komponente ergodičkog procesa.

Korelacijska funkcija se nalazi na isti način:

Dovoljan uvjet za ergodičnost slučajnog procesa, koji je u širem smislu stacionaran, jest težnja korelacijske funkcije nuli s neograničenim povećanjem vremenskog pomaka:

Matematika pokazuje da se ovaj zahtjev može donekle ublažiti. Ispada da je slučajni proces ergodičan ako je zadovoljen Slutskyjev uvjet:

Dakle, jednakost (6.47) vrijedi za harmonijski proces sa slučajnim početna faza(vidi primjer 6.5).

Mjerenje karakteristika slučajnih procesa.

Ako je slučajni proces ergodičan, tada je njegova realizacija dovoljne duljine "tipični" predstavnik statističkog skupa. Eksperimentalno proučavajući ovu implementaciju, može se dobiti mnogo informacija koje karakteriziraju ovaj slučajni proces.

Uređaj za mjerenje jednodimenzionalne gustoće vjerojatnosti slučajnog procesa može se napraviti na sljedeći način. Jednodimenzionalna gustoća vjerojatnosti ergodičkog slučajnog procesa je veličina proporcionalna relativnom vremenu utrošenom na njegovu implementaciju na razini između. Pretpostavimo da postoji uređaj s dva ulaza, od kojih je jedan opskrbljen implementacijom x(t) koji se proučava, a drugi je referentni istosmjerni napon čija se razina može regulirati. Na izlazu uređaja pojavljuju se pravokutni video impulsi konstantne amplitude, čiji su početak i kraj određeni trenucima u vremenu kada se trenutne vrijednosti slučajnog signala podudaraju s razinom ili razinom. ovaj uređaj će biti proporcionalan gustoći vjerojatnosti

Svaki dovoljno inercijalni pokazivač može se koristiti za mjerenje matematičkog očekivanja slučajnog procesa [vidi. formula (6.43)].

Uređaj koji mjeri disperziju slučajnog procesa, kako proizlazi iz (6.44), mora imati na ulazu kondenzator koji odvaja konstantnu komponentu. Daljnji koraci u procesu mjerenja - kvadriranje i usrednjavanje tijekom vremena - izvode se inercijalnim kvadratnim voltmetrom.

Princip rada mjerača korelacijske funkcije (korelometra) slijedi iz formule (6.45). Ovdje se trenutne vrijednosti slučajnog signala, nakon filtriranja DC komponente, dijele na kanale i unose u množitelj, au jednom od kanala signal kasni vremenom . Da bi se dobila vrijednost korelacijske funkcije, signal s izlaza množitelja obrađuje se inercijskom vezom koja vrši usrednjavanje.

Bez obzira na veličinu

Ovdje se koristi ista oznaka kao u formuli (6.26). Elementi korelacijske matrice ovog slučajnog procesa određeni su normaliziranom korelacijskom funkcijom:

U nastavku ćemo često koristiti dvodimenzionalnu Gaussovu gustoću

Stacionarni Gaussov proces zauzima izuzetno mjesto među ostalim slučajnim procesima - svaka njegova višedimenzionalna gustoća vjerojatnosti određena je dvjema karakteristikama: matematičkim očekivanjem i korelacijskom funkcijom.

Analitičko predviđanje višedimenzionalnih procesa.

Metoda generičkog parametra.

Cilj: proučavanje praktičnih tehnika za predviđanje stanja višeparametarskog objekta.

Kratke teorijske informacije:

Promjena stanja tehničkih sustava može se smatrati procesom karakteriziranim promjenama određenog skupa parametara. Položaj vektora stanja u prostoru određuje stupanj performansi sustava. Stanje sustava karakterizira vektor u k-dimenzionalnom prostoru, gdje su prostorne koordinate k parametara sustava , .

Predviđanje stanja svodi se na periodičnu preliminarnu kontrolu parametara; određivanje u trenucima t i T 1 kontrole funkcije stanja

Q=Q[ ] i izračunavanje vrijednosti funkcije Q stanja u rasponu vremenskih vrijednosti T 2 > T 1 .

U ovom slučaju, što je vektor stanja dalje od hiperpovršine dopuštenih vrijednosti stupnja performansi Q *, to je veća izvedba sustava koji se dijagnosticira. Što je manja razlika *, niža je razina performansi.

Korištenje analitičkih metoda predviđanja pretpostavlja pravilnost promjena komponenti procesa tijekom vremena.

Ideja metode generaliziranih parametara je da se proces karakteriziran mnogim komponentama opisuje jednodimenzionalnom funkcijom, čije numeričke vrijednosti ovise o kontroliranim komponentama procesa. Takva se funkcija smatra generaliziranim procesnim parametrom. U tom slučaju može se pokazati da generalizirani parametar nema određeno fizičko značenje, već je matematički izraz konstruiran umjetno iz kontroliranih komponenti predviđenog procesa.

Kada sumiramo parametre koji karakteriziraju stupanj operativnosti tehničkih sustava, potrebno je riješiti sljedeće probleme:

Definicije relativnih vrijednosti primarnih parametara;

Procjene značaja primarnog parametra za ocjenu stanja objekta;

Konstrukcija matematičkog izraza za generalizirani parametar.

Određivanje relativnih vrijednosti primarnih parametara je neophodno zbog činjenice da se stanje objekta može karakterizirati parametrima koji imaju različite dimenzije. Stoga sve nadzirane primarne parametre treba svesti u jedinstveni sustav izračuna u kojemu mogu biti usporedivi. Takav sustav je sustav bezdimenzionalnog (normaliziranog) relativnog računa.

U stvarnosti, za svaki parametar ,s = 1, 2, …, k, moguće je izdvojiti prihvatljivu vrijednost, * , pri čijem dostizanju objekt gubi svoju funkcionalnost, a optimalnu vrijednost opt ​​(često je jednaka nominalna vrijednost n).

Neka se promatra stanje tijekom rada objekta. Ako a , dovoljno je unijeti lokalni parametar i tada će traženi uvjet biti zadovoljen.

Bezdimenzionalni (normalizirani) parametar zapisujemo u obliku:

gdje , i na , i kada .

Dakle, korištenjem izraza (1), parametar se normalizira, a bezdimenzijska normalizirana vrijednost mijenja se od 1 do 0 tijekom vremena. Teoretski može, ali to znači da je objekt u praksi neispravan.

Možete odrediti različite normalizirane izraze koji su prikladni za rješavanje određenih problema, na primjer:

itd., gdje - struja, nula, mat. čeka S-ti parametar.

Korištenje normalizirajućih izraza omogućuje dobivanje skupa bezdimenzionalnih veličina koje karakteriziraju stanje objekta. Međutim, kvantitativno ista promjena ovih vrijednosti nije ekvivalentna u smislu stupnja utjecaja na promjenu performansi objekta, pa je potrebno razlikovati primarne parametre. Ovaj proces se provodi uz pomoć koeficijenata težine, čije vrijednosti karakteriziraju važnost odgovarajućih parametara za fizičku bit problema. Neka u ovom slučaju parametri objekta odgovaraju težinskim koeficijentima , zadovoljavanje jednog ili drugog zadanog kriterija, i .

Stupanj zdravlja objekta u smislu skupa kontroliranih parametara može se procijeniti pomoću generalizirajućeg izraza

Gdje je generalizirani parametar objekta.

Izraz (2) je linearni prosjek. Iz definicije generaliziranog parametra proizlazi da što je veća vrijednost i, to je veći doprinos S -tog člana (parametra) .

Generički parametar može se definirati pomoću izraza obrasca

, (3)

što je nelinearni prosjek. Ovaj model također zadovoljava sljedeći uvjet: što je veći i veći je doprinos člana u veličini.

U praksi se koriste i drugi oblici pisanja nelinearnog prosjeka, na primjer:

, (4)

, (5)

gdje bira tako da (5) daje najbolju aproksimaciju eksperimentalno dobivenih rezultata.

Pri razmatranju izraza za generalizirani parametar pretpostavljeno je da on ne mijenja predznak, tj. uvijek . Ako je potrebno uzeti u obzir predznak, izraz (2) se transformira u oblik

, (6)

Dakle, korištenje generaliziranog parametra omogućuje smanjenje problema predviđanja stanja višeparametarskog objekta na predviđanje jednodimenzionalne vremenske funkcije.

Primjer. Ispitivanje objekta u trajanju od 250 sati, kojim je kontrolirano 6 parametara, dalo je rezultate prikazane u tablici 1.

stol 1

I n, nom = 9,5

V g1 . nom = 120

I a, nom = 2,0

I g3, nom = 70

Nakon normalizacije vrijednosti parametara pomoću izraza (1), tablica poprima oblik (tablica2)

Tablica 2

Modul Višedimenzionalne tehnologije istraživanja za STATISTICA analizu(jedan od modula proizvoda STATISTIKA Napredno) pruža širok raspon tehnologija istraživanja, od analize klastera do naprednih metoda klasifikacijskog stabla, u kombinaciji s velikim rasponom alata za interaktivnu vizualizaciju za izgradnju modela. Modul uključuje:

U modulu analiza klastera implementiran je cijeli skup metoda analize podataka klastera, uključujući k-srednje vrijednosti, hijerarhijsko klasteriranje i metode spajanja s dva ulaza. Podaci mogu doći kao izvorni oblik, te u obliku matrice udaljenosti između objekata. Opažanja, varijable i/ili opažanja i varijable mogu se grupirati pomoću različitih mjera udaljenosti (euklidski, euklidski na kvadrat, gradski blokovi (Manhattan), Chebyshev, snaga, postotak neslaganja i Pearsonov koeficijent korelacije 1) i različita pravila klasteriranja (povezivanje) (pojedinačna, puna veza, neponderirani i ponderirani prosjek grupa po parovima, neponderirana, ponderirana udaljenost između središta, Wardova metoda i dr.).

Matrice udaljenosti mogu se spremiti za daljnju analizu u drugim modulima sustava STATISTIKA. Prilikom izvođenja analize klastera pomoću metode k-srednjih vrijednosti, korisnik ima potpuna kontrola preko početne lokacije središta klastera. Mogu se izvesti izuzetno veliki planovi analize: na primjer, s hijerarhijskim (stablom) povezivanjem možete raditi s matricom od 90 tisuća udaljenosti. Uz standardne rezultate analize klastera, u modulu je također dostupan raznolik skup deskriptivne statistike i naprednih dijagnostičkih metoda (potpuna shema udruživanja s razinama praga za hijerarhijsko klasteriranje, ANOVA tablica za k-srednje klasteriranje). Podaci o pripadnosti objekata klasterima mogu se dodati u podatkovnu datoteku i koristiti u daljnjoj analizi. Grafičke značajke modul analiza klastera uključuju prilagodljive dendrograme, dvosmjerne dijagrame skupljanja, grafički dijagram skupljanja, dijagram srednje vrijednosti klasteriranja k-srednjih vrijednosti i još mnogo toga.

Modul Faktorska analiza sadrži širok raspon statističkih i metoda faktorske analize (kao i hijerarhijsku faktorsku analizu) s naprednom dijagnostikom i velikim izborom istraživačkih i istraživačkih ploha. Ovdje možete izvršiti analizu (opću i hijerarhijsku kosu) glavnih komponenti i glavnih faktora za skupove podataka koji sadrže do 300 varijabli (veći modeli mogu se istražiti pomoću modula (SEPATH)).

Analiza i klasifikacija glavnih komponenti

STATISTIKA također uključuje program za analizu i klasifikaciju glavnih komponenti. Izlaz ovog programa je svojstvene vrijednosti(normalni, kumulativni i relativni), opterećenja faktora i koeficijenti rezultata faktora (koji se mogu dodati u datoteku ulaznih podataka, pregledati na piktogramu i interaktivno rekodirati), kao i neke specijalizirane statistike i dijagnostike. Korisnik ima na raspolaganju sljedeće metode faktori rotacije: varimax, biquartimax, quartimax i equimax (prema normaliziranim ili početnim opterećenjima), kao i kose rotacije.

Prostor faktora može se vizualno promatrati odsječak po odsjek na 2D ili 3D dijagramima raspršenosti s označenim podatkovnim točkama; ostali grafički alati uključuju "scree" dijagrame, razne vrste raspršenih dijagrama, histograme, linijski grafikoni i dr. Nakon što se odredi faktorsko rješenje, korisnik može izračunati (reproducirati) korelacijsku matricu i procijeniti konzistentnost faktorijelnog modela analizom rezidualne korelacijske matrice (ili rezidualne varijance/kovarijančne matrice). Na ulazu možete koristiti i izvorne podatke i korelacijske matrice. Potvrdna faktorska analiza i druge srodne vrste analiza mogu se provesti pomoću modula Modeliranje strukturnih jednadžbi(SEPATH) iz bloka STATISTICA Opći linearni i nelinearni modeli, gdje će poseban Confirmatory Factor Analysis Wizard voditi korisnika kroz sve korake izgradnje modela.

Ovaj modul implementira kompletan skup metoda kanonske analize (komplementirajući metode kanonske analize ugrađene u druge module). Možete raditi i s datotekama izvornih podataka i s korelacijskim matricama; izračunavaju se sve standardne kanoničke korelacijske statistike (svojstveni vektori i svojstvene vrijednosti, koeficijenti redundantnosti, kanoničke težine, opterećenja, varijance, testovi značajnosti za svaki od korijena itd.), kao i neka proširena dijagnostika. Za svako promatranje mogu se izračunati vrijednosti kanonske varijable, koje se zatim mogu vidjeti na ugrađenim piktogramima (i dodati u podatkovnu datoteku).

Ovaj modul uključuje širok raspon postupaka za izradu i evaluaciju uzoraka istraživanja i upitnika. Kao i u svim modulima sustava STATISTIKA, ovdje se mogu analizirati iznimno veliki nizovi podataka (ljestvica koja se sastoji od 300 pozicija može se obraditi u jednom pozivu programa).

Moguće je izračunati statistiku pouzdanosti za sve pozicije na ljestvici, interaktivno odabrati podskupove i usporediti između podskupova pozicija korištenjem usporedbe podijeljenog na pola ili podijeljenog dijela. U jednom posjetu može se procijeniti pouzdanost sumarne ljestvice i subskala. S interaktivnim brisanjem pozicija, pouzdanost rezultirajuće ljestvice izračunava se trenutno bez ponovnog pristupa datoteci s podacima. Rezultati analize su: korelacijske matrice i deskriptivna statistika za pozicije, Cronbachova alfa, standardizirana alfa, prosječna korelacija pozicija-pozicija, kompletna ANOVA tablica za ljestvicu, kompletan skup statistika zajedničkih za sve pozicije (uključujući višestruke korelacijske koeficijente), split- polovična pouzdanost i korelacija između dviju polovica ispravljena za prigušenje.

Dostupno veliki izbor grafikone (uključujući ugrađene dijagrame raspršenosti, histograme, linijske grafikone i druge grafikone) i skup interaktivnih rutina što ako će vam pomoći da razvijete ljestvice. Na primjer, prilikom dodavanja određenog broja stavki na ljestvicu, korisnik može izračunati očekivanu pouzdanost ili procijeniti broj stavki koje je potrebno dodati na ljestvicu kako bi se postigla željena pouzdanost. Također je moguće ispraviti prigušenje između trenutne ljestvice i drugog mjerenja (s obzirom na pouzdanost trenutne ljestvice).

Modul sustava STATISTIKA sadrži najpotpuniju implementaciju nedavno razvijenih metoda za učinkovitu konstrukciju i testiranje (metoda klasifikacijskog stabla je određena ("iterativna") metoda za predviđanje klase kojoj objekt pripada, na temelju vrijednosti prediktorskih varijabli za taj objekt ). Klasifikacijska stabla mogu se graditi na kategoričkim ili ordinalnim prediktorima, ili na mješavini obje vrste prediktora grananjem na pojedinačne varijable ili na njihovim linearnim kombinacijama.

Modul također implementira: izbor između punog popisa opcija grananja (kao u paketima THAID i CART) i diskriminirajućeg grananja; nepristran izbor varijabli grananja (kao u paketu QUEST); eksplicitno postavljanje pravila zaustavljanja (kao u paketu FACT) ili rezidbe od lišća do korijena (kao u paketu CART); odsječeno udjelom grešaka klasifikacije ili funkcijom odstupanja; generalizirane mjere fit hi-kvadrat, G-kvadrat i Gini indeks. Apriorne vjerojatnosti pripadnosti klasama i troškovi grešaka klasifikacije mogu se postaviti jednake, procijeniti iz podataka ili postaviti ručno.

Korisnik također može postaviti višestruku unakrsnu provjeru valjanosti tijekom izgradnje stabla i za procjenu pogreške, parametar SE-pravila, minimalni broj objekata na graničnoj točki, početnu vrijednost za generator slučajnih brojeva i alfa parametar za odabir varijabli. Ugrađeni grafički alati pomažu u istraživanju ulaznih i izlaznih podataka.

Ovaj modul sadrži potpunu implementaciju jednostavnih i viševarijantnih metoda analize korespondencije, može analizirati tablice vrlo velike veličine. Program prihvaća sljedeće vrste podatkovnih datoteka: datoteke koje sadrže kategorizirane varijable, koje se koriste za izradu matrice nepredviđenih okolnosti (unakrsna klasifikacija); podatkovne datoteke koje sadrže tablice učestalosti (ili bilo koje druge mjere podudarnosti, povezanosti, sličnosti, poremećaja itd.) i varijable koda koje definiraju (nabrajaju) ćelije ulazne tablice; podatkovne datoteke koje sadrže frekvencije (ili druge mjere korespondencije). Na primjer, korisnik može izravno kreirati i analizirati tablicu učestalosti. Osim toga, u slučaju multivarijantne analize korespondencije, moguće je izravno specificirati Burtovu matricu kao ulazni podatak.

Tijekom rada program izračunava različite tablice, uključujući tablicu postotaka po redovima, po stupcima i postotke ukupni broj, očekivane vrijednosti, razlike između očekivanih i promatranih vrijednosti, standardizirana odstupanja i doprinosi hi-kvadrat statistici. Sve te statistike mogu se iscrtati na 3D histogramima i pregledati pomoću posebne tehnike dinamičkog slojevitosti.

U modulu generalizirane svojstvene vrijednosti i svojstveni vektori se izračunavaju i izlaze standardni set dijagnostičke veličine, uključujući singularne vrijednosti, svojstvene vrijednosti i udio inercije po mjerenju. Korisnik može odabrati broj mjerenja ili postaviti graničnu vrijednost za maksimalni kumulativni postotak inercije.

Program izračunava standardne koordinate za točke retka i stupca. Korisnik može birati između standardizacije profila redaka, standardizacije profila stupca, standardizacije profila redaka i stupaca ili kanonske standardizacije. Za svaku dimenziju i za svaku točku retka i točku stupca program izračunava vrijednosti inercije, kvalitete i kosinusa**2. Dodatno, korisnik može prikazati (u prozoru rezultata) matrice generaliziranih singularnih vektora. Kao i svi podaci iz radnog prozora, ove matrice su dostupne za obradu pomoću programa u jeziku STATISTIKA Visual Basic, na primjer, koristiti bilo koji nestandardne metode proračuni koordinata.

Korisnik može izračunati koordinate i odgovarajuće statistike (kvaliteta i kosinus**2) za dodatne točke (-stupce ili -redove) i usporediti rezultate s izvornim točkama reda i stupca točkama. Dodatne točke mogu se koristiti u multivarijatnoj analizi korespondencije. Uz 3D histograme koji se mogu izračunati za sve tablice, korisnik može prikazati dijagrame svojstvenih vrijednosti, jedno-, dvo- i trodimenzionalne grafikone za točke retka i stupca. Točke retka i točke stupca mogu se prikazati istovremeno na istom grafikonu, zajedno sa svim dodatnim točkama (svaka vrsta točke koristi drugu boju i jedinstveni marker tako da se različite točke mogu lako razlikovati na grafikonima). Sve točke imaju markere, a korisnik ima mogućnost postavljanja veličine markera.

U modulu implementiran je kompletan skup metoda za (nemetričko) višedimenzionalno skaliranje. Ovdje se mogu analizirati matrice sličnosti, razlike i korelacije između varijabli, a dimenzija prostora skaliranja može biti do 9. Početnu konfiguraciju može izračunati program (koristeći analizu glavnih komponenti) ili postaviti korisnik. Količina stresa i faktor otuđenja minimizirani su posebnim iterativnim postupkom.

Korisnik ima mogućnost promatrati iteracije i pratiti promjene tih vrijednosti. Konačnu konfiguraciju moguće je vidjeti u tablici rezultata, kao i na 2D i 3D dijagramima raspršenosti u prostoru mjerila s označenim točkama objekata. Izlazni rezultati su: nestandardizirano naprezanje (F), Kruskalov koeficijent naprezanja S i koeficijent isključenja. Razina slaganja može se procijeniti pomoću Shepardovih dijagrama (s vrijednostima "d s velikim" i "d sa zvjezdicom"). Kao i svi rezultati analize u sustavu STATISTIKA, konačna konfiguracija može se spremiti kao podatkovna datoteka.

Modul sadrži potpunu implementaciju metoda postupne diskriminantne analize korištenjem diskriminantnih funkcija. STATISTIKA također uključuje modul Opći modeli diskriminativne analize (GDA) odgovarati ANOVA/ANCOVA dizajnu kategoričkih zavisnih varijabli ili izvoditi različite vrste analize (npr. najbolji izbor predviđanja, profiliranje posteriornih vjerojatnosti).

Program vam omogućuje analizu uključivanje korak po korak ili isključivanjem varijabli ili uvođenjem korisnički definiranih blokova varijabli u model. Osim brojnih grafikona i statistika koje opisuju funkciju razdvajanja (diskriminirajuće), program također sadrži veliki skup alata i statistike za klasificiranje starih i novih opažanja (za procjenu kvalitete modela). Izlazi su: Wilksova lambda statistika za svaku varijablu, kvocijent lambda, F statistika za uključivanje (ili isključenje), p razine značajnosti, vrijednosti tolerancije i kvadrat koeficijenta višestruke korelacije. Program provodi potpunu kanoničku analizu i vraća sve svojstvene vrijednosti (izravne i kumulativne), njihove razine značajnosti p, koeficijente diskriminativne (kanoničke) funkcije (u izravnom i standardiziranom obliku), koeficijente strukturne matrice (faktorska opterećenja), srednje vrijednosti diskriminativne funkcije i diskriminantne težine za svaki objekt (one se mogu automatski dodati u podatkovnu datoteku).

Ugrađena grafička podrška uključuje: histograme kanoničkih težina za svaku skupinu (i zajedničke u svim skupinama), posebne dijagrame raspršenosti za parove kanoničkih varijabli (koje pokazuju kojoj skupini svako opažanje pripada), veliki skup kategoriziranih (višestrukih) dijagrama za omogućuju vam da istražite distribuciju i odnose između zavisnih varijabli za različite skupine (uključujući: višestruke dijagrame kao što su okvirni dijagrami, histogrami, dijagrami raspršenosti i dijagrami normalne vjerojatnosti) i još mnogo toga.

U modulu također se može izračunati standardne karakteristike klasifikacija za svaku grupu. Rezultati klasifikacije slučajeva mogu se prikazati u smislu Mahalanobisovih udaljenosti, posteriornih vjerojatnosti i samih rezultata klasifikacije, a vrijednosti diskriminantne funkcije od slučaja do slučaja (kanoničke vrijednosti) mogu se vidjeti u sažetim piktogramima i drugim multivarijantnim dijagramima dostupnim izravno iz rezultata stolovi. Svi ti podaci mogu se automatski dodati u trenutnu podatkovnu datoteku za daljnju analizu. Također možete prikazati konačnu klasifikacijsku matricu, koja pokazuje broj i postotak ispravno klasificiranih opažanja. Dostupno razne opcije postavljanje apriornih vjerojatnosti pripadnosti razredima, kao i uvjeta odabira koji omogućuju uključivanje ili isključivanje određenih opažanja iz postupka klasifikacije (na primjer, kako bi se zatim provjerila njegova kvaliteta na novom uzorku).

Opći modeli za diskriminirajuću analizu (GDA)

Modul Opći modeli za diskriminacijsku analizu STATISTICA (GDA) je aplikacija i proširenje Općenito Linearni modeli klasificirati zadatke. Isto kao i modul Diskriminantna analiza, GDA vam omogućuje izvođenje konvencionalnih sekvencijalnih diskriminantnih analiza. GDA predstavlja problem diskriminantne analize kao poseban slučaj općeg linearnog modela i tako pruža iznimno korisne nove analitičke tehnologije definirane od strane korisnika.

Kao i konvencionalna diskriminantna analiza, GDA vam omogućuje odabir željene kategorije zavisne varijable. U analizi se skupine elemenata bilježe kao indikatorske varijable te se sve GRM metode mogu lako primijeniti. Širok izbor GRM i GLM rezidualne statistike dostupan je u dijaloškom okviru GDA rezultata.

GDA nudi niz učinkovitih alata za rudarenje podataka i primijenjeno istraživanje. GDA izračunava sve standardne rezultate diskriminantne analize, uključujući koeficijente diskriminantne funkcije, rezultate kanonske analize (standardizirani i neobrađeni koeficijenti, kanonski korijenski testovi koraka, itd.), statistiku klasifikacije (uključujući Mahalanobisovu udaljenost, posteriorne vjerojatnosti, klasifikaciju opažanja u prihvatljivim analizama, pogrešnu klasifikaciju matrice itd.). Za dodatne informacije oko jedinstvene značajke GDA

Višedimenzionalni stacionarni slučajni proces definiran je kao skup stacionarnih i stacionarno povezanih slučajnih procesa . Takav se proces obično označava kao slučajni vektor stupca ovisno o vremenu:

.

Višedimenzionalni slučajni procesi koriste se u opisu višedimenzionalnih (višekanalnih) sustava. U ovom dijelu razmatramo problem digitalnog modeliranja normalnih višedimenzionalnih stacionarnih slučajnih procesa. Rezultat rješavanja ovog problema, kao iu jednodimenzionalnom slučaju, je algoritam koji omogućuje formiranje višedimenzionalnih diskretnih realizacija zadanog procesa na digitalnom računalu. -dimenzionalni kontinuirani normalni stacionarni slučajni proces obično se specificira ili u obliku njegove korelacijske matrice

ili u obliku spektralne matrice

gdje - autokorelacijske (za ) i kros-korelacijske (za ) funkcije slučajnih procesa - Fourierova transformacija . Istovremeno, budući da , elementi i spektralna matrica su kompleksno konjugirani,

.

Diskretni višedimenzionalni normalni slučajni procesi definirani su slično kontinuiranim procesima korištenjem korelacijskih i spektralnih matrica (35, 70]

gdje , i .

Problem digitalnog modeliranja višedimenzionalnog normalnog slučajnog procesa treba formulirati na sljedeći način. Dana je korelacijska ili spektralna matrica slučajnog procesa. Potrebno je pronaći algoritam za formiranje na digitalnom računalu diskretnih realizacija slučajnog procesa sa zadanim korelacijskim (spektralnim) svojstvima.

Da bismo riješili ovaj problem, koristimo, kao i prije, ideju linearnog filtra za oblikovanje. U razmatranom slučaju govorimo o sintezi višedimenzionalnog filtra za oblikovanje.

Dimenzionalni linearni filtar definiran je kao linearni dinamički sustav s ulazima i izlazima. Ako a - ulazna radnja i je odziv sustava, tada je odnos između ulaza i izlaza -dimenzionalnog linearnog kontinuiranog filtra opisan pomoću matrice prijenosa u obliku

gdje i - slike ulaznog odnosno izlaznog signala u smislu Laplaceove transformacije; - prijenosna matrica -dimenzionalnog filtra, čiji su elementi prijenosne funkcije kanala -th input - -th output.

Ulazno-izlazna veza u diskretnim -dimenzionalnim linearnim filtrima opisana je na sličan način:

,

gdje i - slike u smislu diskretne Laplaceove transformacije ulaznog i izlaznog signala; je prijenosna matrica diskretnog -dimenzionalnog filtra.

Strukturni dijagram višedimenzionalnog filtra na primjeru dvodimenzionalnog filtra prikazan je na sl. 2.9, prema kojem

(2.107)

Vidimo da je svaki od izlaznih signala i zbroj linearni operatori od ulaznih signala i . Slične relacije vrijede iu općem slučaju. Ovo je identifikacija prijenosnih matrica.

Neka djelovanje na ulazu -dimenzionalnog linearnog filtra bude -dimenzionalni bijeli šum, tj. slučajni proces s korelacijskom matricom oblika

kontinuirano vrijeme i

za diskretno vrijeme, gdje - delta funkcija. -dimenzionalni bijeli šum se ovdje definira kao skup neovisnih -koreliranih slučajnih procesa.

Može se pokazati (vidi, na primjer, ) da je, pod utjecajem bijelog šuma, spektralna matrica procesa na izlazu - dimenzionalni filtar za kontinuirano, odnosno diskretno vrijeme, povezana s matricom prijenosa filtra pomoću odnosima

(2.108)

gdje simbol označava transponiranu matricu.

Stoga, da bi se dobio -dimenzionalni slučajni proces s danom spektralnom matricom, potrebno je propustiti -dimenzionalni bijeli šum kroz -dimenzionalni filtar za oblikovanje čija matrica prijenosa zadovoljava jednadžbe (2.108). Da bi se pronašla matrica prijenosa iz dane spektralne matrice, potrebno ju je podijeliti na dva faktora oblika (2.108). Taj se postupak naziva faktorizacija spektralne matrice. Može se implementirati prema poznatim algoritmima.

Višedimenzionalno filtriranje bijelog šuma vrlo je jednostavno: svaka komponenta slučajni proces na izlazu -dimenzionalnog filtra s prijenosnom matricom dobiva se zbrajanjem po komponentama ulazni proces filtriran jednodimenzionalnim filtrima s prijenosnim funkcijama [vidi. formula (2.107)]. Jednodimenzionalni algoritmi filtriranja su razmatrani gore.

Ovom metodom modeliranja moguća su dva načina: 1) data spektralna matrica kontinuiranog -dimenzionalnog slučajnog procesa može se izravno faktorizirati kako bi se dobila prijenosna matrica kontinuiranog filtra za oblikovanje, a zatim, koristeći točne ili približne metode diskretizacije gore opisani kontinuirani filtri za provođenje višedimenzionalnog filtriranja kontinuiranog bijelog šuma; 2) s obzirom na spektralnu matricu kontinuiranog -dimenzionalnog procesa, koristeći -transformaciju, možete pronaći spektralnu matricu odgovarajućeg diskretnog slučajnog procesa (vidi § 2.3), zatim pronaći funkciju prijenosa diskretnog filtra za oblikovanje faktorizacijom, i zatim izvesti višedimenzionalno filtriranje diskretnog bijelog šuma.

Najveće poteškoće nailazimo kod faktorizacije spektralnih matrica. Trenutno su algoritmi faktorizacije razvijeni samo za racionalne spektralne matrice, tj. takve matrice čiji su elementi frakcijske racionalne funkcije argumenata ili .

Opišimo, izostavljajući dokaze, jedan od algoritama za faktorizaciju racionalnih spektralnih matrica, preuzet iz .

Neka je dana racionalna spektralna matrica

.

Matrica se može svesti na formu

kroz sljedeće transformacije.

1. Određuje se rang matrice, a zatim se jedan od sporednih glavnih reda nalazi u gornjem lijevom kutu matrice.

2. Matrica je reducirana na dijagonalni oblik. Da biste to učinili, prvi redak pomnožen s - dodaje se -tom retku matrice , , zatim se prvi stupac pomnožen s - dodaje -tom stupcu; matrica

, (2.109)

gdje su elementi matrice

izgledati kao

(2.110)

S matricom se izvode iste transformacije kao i s izvornom matricom . Nastavljajući ovaj proces u th koraku, dobivamo dijagonalnu matricu

takav da .

3. Pronađena je pomoćna matrica

čiji elementi izgledaju ovako:

(2.111)

gdje se određuju iz relacija ponavljanja

(2.112)

4. Nađeni su pomoćni polinomi

gdje - nule polinoma , koji leže u donjoj poluravnini, izbrojani onoliko puta koliko im je najveća višestrukost, a nazivnici su razlomačko-racionalnih funkcija, koje su elementi matrice :

.

5. Prema metodi razmatranoj u § 2.9, točka 2, frakcijske racionalne funkcije

predstavljeni su u obliku

,

gdje polinomi i nemaju nule u donjoj poluravnini.

Time je proces faktorizacije dovršen. Konačna prijenosna matrica filtra za oblikovanje piše se kao

(2.113)

Ovdje opisujemo algoritam faktorizacije za racionalne spektralne matrice kontinuiranih višedimenzionalnih procesa. Faktorizacija spektralnih matrica diskretnih procesa provodi se na sličan način, ali se umjesto korijena koji se nalaze u donjoj poluravnini uzimaju korijeni koji se nalaze u jediničnom krugu.

Primjer 1 Neka je dvodimenzionalni kontinuirani stacionarni centrirani slučajni proces s korelacijskom matricom

, (2.114)

gdje su neke pozitivne konstante, i .

Korelacijska matrica koja odgovara spektralnoj matrici (2.114) ima oblik

, (2.115)

gdje i - autokorelacijski i kros-korelacijski momenti procesa odnosno; - koeficijent međusobne korelacije procesa i podudarnih točaka u vremenu. Koeficijenti i predstavljaju u ovom slučaju širinu (na razini 0,5) energetski spektri te međusobni energetski spektar procesa i .

Potrebno je faktorizirati spektralnu matricu (2.114) kako bi se dobila prijenosna matrica filtra za oblikovanje.

Provest ćemo postupak faktorizacije korak po korak u skladu s gornjim algoritmom faktorizacije.

1. Ulaz ovaj slučaj rang spektralne matrice .

2. Za izradu dijagonale matrice potreban je jedan korak. Formulama (2.109) i (2.110) dobivamo

.

3. U skladu s izrazima (2.111) i (2.112), pomoćna matrica ima oblik

4. U razmatranom slučaju potrebno je pronaći samo jedan pomoćni polinom . Da biste to učinili, morate pronaći korijene nazivnika elementa matrice, tj. korijene polinoma. Ovi korijeni su

Posljedično,

.

5. U završnoj fazi potrebno je faktorizirati razlomačke racionalne funkcije

U ovom slučaju, korijeni brojnika i nazivnika frakcijskih racionalnih funkcija i lako se izračunavaju. Koristeći korijene koji leže u gornjoj poluravnini (korijeni s pozitivnim imaginarnim dijelovima), dobivamo i na varijablu :

.

Na sl. Slika 2.9 prikazuje blok dijagram dvodimenzionalnog filtra za oblikovanje, na čijem se izlazu formira dvodimenzionalni slučajni proces sa traženim spektralnim karakteristikama ako bijeli šum djeluje na ulaz filtra. Zamjenom kontinuiranog dvodimenzionalnog filtra odgovarajućim diskretnim filtrom dobivamo algoritam za generiranje diskretnih realizacija dvodimenzionalnog slučajnog normalnog procesa na računalu, tj. diskretnih realizacija dvaju stacionarnih i stacionarno povezanih normalnih slučajnih procesa s eksponencijalnim auto - i unakrsne korelacijske funkcije oblika (2.115).

S drugim pristupom sintezi filtra za oblikovanje, prvo se mora pronaći spektralna matrica odgovarajućeg diskretnog višedimenzionalnog slučajnog procesa. U primjeru koji razmatramo ova matrica ima oblik

I matrice (2.116).

Razmatrani primjer pokazuje da se faktorizacija spektralnih matrica provodi relativno jednostavno ako je moguće analitički pronaći nulte točke odgovarajućih polinoma. Pri faktorizaciji spektralne matrice kontinuiranog dvodimenzionalnog procesa to nije bilo teško, budući da je za određivanje nula bilo potrebno riješiti samo kvadratne i bikvadratne jednadžbe. Pri faktorizaciji spektralne matrice diskretnog dvodimenzionalnog procesa, postojale su kvadratne jednadžbe i recipročna jednadžba četvrtog stupnja, koja također dopušta analitičko rješenje.

U drugim, kompliciranijim slučajevima, nije uvijek moguće analitički pronaći nulte točke polinoma. U tim slučajevima se pribjegava numeričkim metodama rješavanja jednadžbi th stupnja. Općenito, proces faktorizacije može se implementirati na računalu kao standardni program. U tu svrhu mogu se koristiti i drugi algoritmi faktorizacije osim ovdje danog.

Treba napomenuti da su svi trenutno postojeći algoritmi faktorizacije spektralne matrice, općenito govoreći, vrlo naporni.

Najpopularniji povezani članci