Kako podesiti pametne telefone i računare. Informativni portal
  • Dom
  • Greške
  • Ko je korisnik olap sistema. OLAP izvještaji

Ko je korisnik olap sistema. OLAP izvještaji

OLAP (OnLine Analytical Processing) nije naziv određenog proizvoda, već čitave tehnologije online analitičke obrade koja uključuje analizu podataka i izvještavanje. Korisnik dobija višedimenzionalnu tabelu koja automatski sumira podatke u različitim sekcijama i omogućava brzo upravljanje proračunima i formom izveštaja.

Iako se u nekim publikacijama analitička obrada naziva i onlajn i interaktivna, pridjev "online" najpreciznije odražava značenje OLAP tehnologije. Razvoj menadžerskih upravljačkih odluka spada u kategoriju oblasti koje su najpogrešnije podložne automatizaciji. Međutim, danas postoji prilika da se pomogne menadžeru u izradi odluka i, što je najvažnije, da se značajno ubrza proces izrade odluka, njihovog odabira i usvajanja.

Sistemi za podršku odlučivanju obično imaju sredstva da obezbede korisniku agregatne podatke za različite uzorke iz početnog skupa u obliku pogodnom za percepciju i analizu. Po pravilu, takav agregatne funkcije formiraju višedimenzionalni skup podataka, koji se često naziva hiperkocka ili metakocka, čije ose sadrže parametre, a ćelije sadrže agregatne podatke koji o njima ovise – i takvi podaci se mogu pohraniti i u relacijske tablice, ali u ovom slučaju mi pričamo o logička organizacija podatke, a ne o fizičkoj implementaciji njihovog skladištenja.

Duž svake ose, podaci se mogu organizirati u hijerarhiju koja predstavlja različite nivoe detalja.

Prema dimenzijama u višedimenzionalnom modelu, faktori koji utiču na aktivnosti preduzeća su stavljeni po strani (na primer: vreme, proizvodi, filijale kompanije itd.). Rezultirajuća OLAP-kocka se zatim popunjava indikatorima aktivnosti preduzeća (cijene, prodaja, plan, profit, novčani tok, itd.). Treba napomenuti da, za razliku od geometrijske kocke, lica OLAP kocke ne moraju imati istu veličinu. Ovo punjenje se može izvršiti kako sa stvarnim podacima operativnih sistema, tako i predvidjeti na osnovu istorijskih podataka. Dimenzije hiperkocke mogu biti složene, hijerarhijske i između njih se mogu uspostaviti odnosi. Tokom analize, korisnik može promijeniti tačku gledišta na podatke (tzv. operacija promjene logičkog pogleda), na taj način sagledavajući podatke u različitim dijelovima i rješavajući konkretne probleme. Na kockama se mogu izvesti razne operacije, uključujući predviđanje i uslovno zakazivanje (šta ako analiza).

Zahvaljujući ovom modelu podataka, korisnici mogu formulirati složene upite, generirati izvještaje i primati podskupove podataka. Operativna analitička obrada može značajno pojednostaviti i ubrzati proces pripreme i donošenja odluka od strane rukovodnog osoblja. Online analitička obrada služi za pretvaranje podataka u informacije. On se suštinski razlikuje od tradicionalnog procesa podrške odlučivanju, koji se zasniva, najčešće, na razmatranju strukturiranih izveštaja.


OLAP tehnologija se odnosi na vrstu intelektualne analize i uključuje 12 principa:

1. Konceptualno multidimenzionalni prikaz . Korisnički analitičar vidi svijet poduzeća kao višedimenzionalnu prirodu, odnosno, a OLAP model mora biti višedimenzionalan u svojoj srži.

2. Transparentnost. Arhitektura OLAP sistema treba da bude otvorena, omogućavajući korisniku, gde god da se nalazi, da komunicira pomoću analitičkog alata - klijenta - sa serverom.

3. Dostupnost. Korisnik OLAP analitičar mora biti u stanju da izvrši analizu na osnovu zajedničke konceptualne šeme koja sadrži podatke za cijelo preduzeće u relacijskoj bazi podataka, kao i podatke iz naslijeđenih naslijeđenih baza podataka, na uobičajenim metodama pristupa i na zajedničkom analitičkom modelu. OLAP sistem treba da pristupa samo podacima koji su stvarno potrebni, a ne da se primenjuju opšti princip"kuhinjski lijevak" koji podrazumijeva nepotrebne unose.

4. Dosljedan učinak u razvoju izvještaja. Sa povećanjem broja dimenzija ili veličine baze podataka, korisnik analitičar ne bi trebao doživjeti značajno smanjenje performansi.

5. Arhitektura klijent-server. Većina podataka potrebnih za online analitiku danas se nalazi na glavnim računarima s pristupom korisničkim radnim stanicama preko LAN-a. To znači da OLAP proizvodi moraju biti u mogućnosti da rade u klijent-server okruženju.

6. Opća multidimenzionalnost. Svaku dimenziju treba primijeniti bez obzira na njenu strukturu i operativne mogućnosti. Osnovne strukture podaci, formule i formati izvještavanja ne bi trebali biti pristrasni prema bilo kojoj dimenziji.

7. Dinamičko upravljanje rijetkim matricama. Fizički dizajn OLAP alata mora biti u potpunosti prilagodljiv specifičnom analitičkom modelu kako bi se optimalno upravljalo rijetkim matricama. Retkost (mjereno u postocima prazne ćelije na sve moguće) jedna je od karakteristika diseminacije podataka.

8. Podrška za više korisnika. OLAP alat mora pružiti tu mogućnost dijeljenje traženje i dopunjavanje više korisnika analitičara uz održavanje integriteta i sigurnosti.

9. Neograničene unakrsne operacije. Različite operacije, zbog svoje hijerarhijske prirode, mogu predstavljati zavisne odnose u OLAP modelu, odnosno međufunkcionalne su. Njihovo izvršenje ne bi trebalo da zahteva od korisnika analitičara da redefiniše ove proračune i operacije.

10. Intuitivna manipulacija podacima. Pogled korisnika analitičara na dimenzije definirane u analitičkom modelu mora sadržavati sve potrebne informacije izvršiti radnje na OLAP modelu, tj. ne bi trebalo da zahtevaju korišćenje sistema menija ili druge operacije višestrukog korisničkog interfejsa.

11. Fleksibilnost primanje izvještaja. Alati za izvještavanje trebaju biti sintetizirani podaci ili informacije koje proizlaze iz modela podataka u bilo kojoj mogućoj orijentaciji. To znači da redovi, kolone ili stranice izvještaja moraju istovremeno prikazati više dimenzija OLAP modela, s mogućnošću prikaza bilo kojeg podskupa elemenata (vrijednosti) sadržanih u dimenziji i bilo kojim redoslijedom.

12. Neograničena dimenzija i broj nivoa agregacije. Proučite mogući broj potrebna merenja potrebna u analitičkom modelu pokazala je da korisnik-analitičar može koristiti do 19 mjerenja istovremeno. Ovo dovodi do preporuke o broju dimenzija koje podržava OLAP sistem. Štaviše, svaka od zajedničkih dimenzija ne bi trebalo da bude ograničena brojem nivoa agregacije koje definiše korisnik-analitičar.

Kao specijalizovani OLAP sistemi koji se trenutno nude na tržištu, možete navesti CalliGraph, Business Intelligence.

Za rješavanje jednostavnih problema analize podataka moguće je koristiti budžetsko rešenje– ured Excel aplikacije i Access by Microsoft, koji sadrže elementarna sredstva OLAP tehnologije koje vam omogućavaju da kreirate pivot table i na osnovu njih praviti različite izvještaje.

Informacioni sistemi ozbiljnog preduzeća po pravilu sadrže aplikacije namenjene kompleksnoj analizi podataka, njihove dinamike, trendova itd. Shodno tome, najviši menadžment postaje glavni potrošač rezultata analize. Takva analiza ima za cilj da olakša donošenje odluka. A da bi se donijela bilo kakva upravljačka odluka, potrebno je imati za to potrebne informacije, najčešće kvantitativne. Da biste to učinili, potrebno je prikupiti ove podatke iz svih informacionih sistema preduzeća, dovesti ih u zajednički format i tek onda analizirati. Da biste to učinili, kreirajte skladišta podataka (Data Warehouses).

Šta je skladište podataka?

Obično - mjesto prikupljanja svih informacija od analitičke vrijednosti. Zahtjevi za takva skladišta slijede klasičnu definiciju OLAP-a i biće objašnjeni u nastavku.

Ponekad skladište ima drugu svrhu - integraciju svih podataka preduzeća, da održi integritet i relevantnost informacija unutar svih informacionih sistema. To. spremište akumulira ne samo analitičke, već gotovo sve informacije, i može ih izdati u obliku direktorija natrag u druge sisteme.

Tipično skladište podataka se obično razlikuje od tipične relacijske baze podataka. Prvo, konvencionalne baze podataka su dizajnirane da pomognu korisnicima da obavljaju svoj svakodnevni posao, dok su skladišta podataka dizajnirana da donose odluke. Na primjer, prodaja proizvoda i izdavanje računa vrše se pomoću baze podataka dizajnirane za obradu transakcija i analize dinamike prodaje tokom nekoliko godina, što vam omogućava da planirate rad sa dobavljačima, koristeći skladište podataka.

Drugo, redovne baze podataka su podložne stalnim promjenama u toku rada korisnika, a skladište podataka je relativno stabilno: podaci u njemu se obično ažuriraju po rasporedu (npr. sedmično, dnevno ili po satu, ovisno o potrebe). U idealnom slučaju, proces dopune je jednostavno dodavanje novih podataka tokom određenog vremenskog perioda bez promjene starih informacija koje su već u pohrani.

I, treće, konvencionalne baze podataka su najčešće izvor podataka koji ulaze u spremište. Osim toga, skladište se može dopuniti eksternih izvora kao što su statistički izvještaji.

Kako je izgrađeno skladište?

ETLosnovni koncept: Tri faze:
  • Ekstrakcija - izdvajanje podataka iz eksternih izvora u razumljivom formatu;
  • Transformacija - transformacija strukture izvornih podataka u strukture koje su pogodne za izgradnju analitičkog sistema;
Dodajmo još jednu fazu - čišćenje podataka ( čišćenje) - proces skrininga irelevantnih ili ispravljanja pogrešnih podataka na osnovu statističkih ili ekspertskih metoda. Kako ne bi generirali kasnije izvještaje poput "Prodaja za 20011. godinu".

Vratimo se analizi.

Šta je analiza i zašto je potrebna?

Analiza je proučavanje podataka u cilju donošenja odluka. Analitički sistemi se nazivaju tzv. sistemi za podršku odlučivanju ( DSS).

Ovde vredi istaći razliku između rada sa DSS-om i jednostavnog skupa regulisanih i neregulisanih izveštaja. Analiza u DSS-u je skoro uvek interaktivna i ponavljajuća. One. analitičar kopa po podacima, sastavlja i ispravlja analitičke upite i prima izvještaje čija struktura možda nije poznata unaprijed. Vratit ćemo se na ovo detaljnije u nastavku kada budemo raspravljali o jeziku upita. MDX.

OLAP

Sistemi za podršku odlučivanju obično imaju sredstva da obezbede korisniku zbirne podatke za različite uzorke iz početnog skupa u obliku pogodnom za percepciju i analizu (tabele, grafikoni, itd.). Tradicionalni pristup segmentaciji izvornih podataka koristi odabir jednog ili više višedimenzionalnih skupova podataka (često se nazivaju hiperkocka ili metakocka) iz izvornih podataka, čije osi sadrže atribute, a ćelije sadrže agregirane kvantitativne podatke. (Štaviše, takvi podaci se mogu pohraniti u relacijske tablice, ali u ovom slučaju govorimo o logičkoj organizaciji podataka, a ne o fizičkoj implementaciji njihovog skladištenja.) Duž svake ose atributi se mogu organizirati kao hijerarhije koje predstavljaju različite nivoe detalja. Zahvaljujući ovom modelu podataka, korisnici mogu formulirati složene upite, generirati izvještaje i primati podskupove podataka.

Tehnologija složene višedimenzionalne analize podataka naziva se OLAP (On-Line Analytical Processing). OLAP je ključna komponenta tradicionalnog skladištenja podataka. Koncept OLAP-a opisao je 1993. Edgar Codd, poznati istraživač i autor baza podataka. relacioni model podaci. Godine 1995., na osnovu zahtjeva koje je naveo Codd, formulisan je takozvani FASMI test (Fast Analysis of Shared Multidimensional Information – brza analiza zajedničkih multidimenzionalnih informacija), koji uključuje sljedeće zahtjeve za aplikacije za multidimenzionalnu analizu:

  • pružanje korisniku rezultata analize u prihvatljivom vremenu (obično ne duže od 5 s), čak i po cijenu manje detaljne analize;
  • mogućnost izvođenja bilo kakve logičke i statističke analize karakteristične za ovu aplikaciju, i sačuvajte ga u dostupnom krajnji korisnik forma;
  • višekorisnički pristup podacima uz podršku za odgovarajuće mehanizme zaključavanja i autorizovane alate za pristup;
  • višedimenzionalni konceptualni prikaz podataka, uključujući puna podrška za hijerarhije i višestruke hijerarhije (ovo je ključni zahtjev OLAP-a);
  • mogućnost pristupa svim potrebnim informacijama, bez obzira na njihov volumen i lokaciju pohranjivanja.
Treba napomenuti da se OLAP funkcionalnost može implementirati Različiti putevi, počevši od najjednostavnijih alata za analizu podataka u kancelarijske aplikacije i završava sa distribuiranim analitički sistemi baziran na serverskim proizvodima. One. OLAP nije tehnologija, ali ideologija.

Prije nego što počnemo govoriti o različitim implementacijama OLAP-a, pogledajmo pobliže šta su kocke sa logičke tačke gledišta.

Višedimenzionalni koncepti

Koristićemo Northwind bazu podataka uključenu u Microsoft da ilustrujemo OLAP principe. SQL Server i koja je tipična baza podataka koja pohranjuje informacije o trgovačkim operacijama kompanije koja se bavi veleprodajom prehrambenih proizvoda. Takvi podaci obuhvataju podatke o dobavljačima, kupcima, spisak isporučenih dobara i njihovih kategorija, podatke o narudžbi i naručenoj robi, spisak zaposlenih u kompaniji.

Kocka

Uzmimo za primjer tabelu Računi1 koja sadrži narudžbe kompanije. Polja u ovoj tabeli će biti sljedeća:
  • Datum narudžbe
  • Zemlja
  • Grad
  • Ime kupca
  • Kompanija za dostavu
  • ime proizvoda
  • Količina robe
  • Cijena narudžbe
Koje zbirne podatke možemo dobiti na osnovu ovog pogleda? Obično su to odgovori na pitanja kao što su:
  • Kolika je ukupna vrijednost narudžbi kupaca iz određene zemlje?
  • Koliki je ukupni trošak narudžbi kupaca iz određene zemlje i isporučenih od strane određene kompanije?
  • Kolika je ukupna vrijednost narudžbi koje su naručili kupci iz određene zemlje u datoj godini i koje je isporučila određena kompanija?
Svi ovi podaci se mogu dobiti iz ove tabele sa prilično očiglednim SQL upitima sa grupisanjem.

Rezultat ovog upita uvijek će biti kolona brojeva i lista atributa koji ga opisuju (na primjer, zemlja) - ovo je jednodimenzionalni skup podataka ili, matematički rečeno, vektor.

Zamislite da trebamo dobiti informacije o ukupnoj cijeni narudžbi iz svih zemalja i njihovoj distribuciji po kompanijama-prevoznicima - već ćemo dobiti tabelu (matricu) brojeva, gdje će zaglavlja kolona navoditi prijevoznike, zaglavlja redova će navoditi zemlje, a ćelije će sadržavati količinu narudžbi. Ovo je - dvodimenzionalni niz podaci. Takav skup podataka naziva se pivot tabela ( pivot table) ili unakrsna tabela.

Ako želimo da dobijemo iste podatke, ali u kontekstu godina, onda će doći do još jedne promjene, tj. skup podataka će postati trodimenzionalni (uslovni tenzor 3. reda ili 3-dimenzionalna "kocka").

Očigledno, maksimalni broj dimenzija je broj svih atributa (Datum, Država, Kupac, itd.) koji opisuju naše agregirane podatke (količina narudžbi, količina robe, itd.).

Tako dolazimo do koncepta multidimenzionalnosti i njegovog utjelovljenja - višedimenzionalna kocka. Ova tabela će biti pozvana tabela činjenica". Dimenzije ili osi kocke ( dimenzije) su atributi čije su koordinate izražene pojedinačnim vrijednostima tih atributa prisutnih u tabeli činjenica. One. na primjer, ako su se informacije o nalozima održavale u sistemu od 2003. do 2010. godine, tada će se ova osa godina sastojati od 8 odgovarajućih tačaka. Ako narudžbe dolaze iz tri zemlje, tada će osa zemlje sadržavati 3 točke, itd. Bez obzira na to koliko je zemalja uključeno u Imenik zemalja. Tačke na osi nazivaju se "članovi" ( Članovi).

Sami agregirani podaci u ovom slučaju će se zvati "mjere" ( mjera). Kako bi se izbjegla zabuna s "dimenzijama", poželjno je da se potonje nazivaju "osovine". Skup mjera formira drugu osu "Mjere" ( Mjere). Ima onoliko članova (točaka) koliko ima mjera (agregiranih kolona) u tabeli činjenica.

Članovi dimenzija ili osi mogu se grupirati zajedno u jednu ili više hijerarhija ( hijerarhija). Objasnimo šta je hijerarhija na primjeru: gradovi iz redova mogu se kombinirati u okruge, okruge u regiji, regije zemlje, zemlje u kontinente ili druge entitete. One. postoji hijerarhijska struktura - kontinent zemlja-regija-okrug-grad– 5 nivoa ( Nivo). Za okrug, podaci su agregirani za sve gradove koji su u njemu uključeni. Za područje za sve okruge koji sadrže sve gradove itd. Zašto nam treba više hijerarhija? Na primjer, na osi datuma narudžbe, mogli bismo htjeti grupirati točke (tj. dane) u hijerarhiji Godina-Mjesec-Dan ili od strane Godina-Sedmica-Dan: u oba slučaja tri nivoa. Očigledno sedmica i mjesec različito grupišu dane. Postoje i hijerarhije u kojima broj nivoa nije determinisan i zavisi od podataka. Na primjer, fascikle na disku računara.

Do agregacije podataka može doći korištenjem nekoliko standardne karakteristike: zbroj, min, max, prosjek, broj.

MDX

Pređimo na jezik upita u višedimenzionalnim podacima.
SQL jezik prvobitno nije dizajniran za programere, već za analitičare (i stoga ima sintaksu koja liči na prirodni jezik). Ali s vremenom je to postajalo sve komplikovanije i sada malo analitičara zna kako ga dobro koristiti, ako uopće može. Postao je alat za programere. MDX jezik upita, za koji se priča da ga je razvio naš bivši sunarodnik Moishe (ili Mosha) Posumansky u divljini Microsoft Corporation, također je prvobitno trebao biti usmjeren na analitičare, ali njegovi koncepti i sintaksa (koja maglovito podsjeća na SQL i potpuno uzalud, jer je ovo samo zbunjujuće), čak i komplikovanije od SQL-a. Ipak, njegove osnove je još uvijek lako razumjeti.

Razmotrićemo ga detaljno jer je to jedini jezik koji je dobio status standarda u okviru opšteg standarda XMLA protokola, i drugo, jer postoji njegova implementacija otvorenog koda u obliku Mondrian projekta iz kompanije Pentaho. Drugi sistemi za OLAP analizu (na primjer, Oracle OLAP opcija) obično koriste vlastite SQL sintaksne ekstenzije, međutim, oni također deklariraju podršku za MDX.

Rad sa analitičkim nizovima podataka podrazumijeva samo njihovo čitanje, a ne pisanje. To. u MDX jeziku ne postoje klauzule za promenu podataka, ali postoji samo jedna klauzula za izbor - select.

U OLAP-u možete napraviti od višedimenzionalnih kocki kriške– tj. kada se podaci filtriraju duž jedne ili više osa, ili projekcije- kada se kocka "sruši" duž jedne ili više osa, agregirajući podatke. Na primjer, naš prvi primjer sa zbirom naloga iz zemalja - postoji projekcija kocke na osu Zemlje. MDX upit za ovaj slučaj bi izgledao ovako:

Odaberite ...Djeca u redovima od
sta je sta je ovde?

Odaberite- ključna riječ je uključena u sintaksu isključivo za ljepotu.
je naziv ose. Sva vlastita imena u MDX-u su napisana u uglastim zagradama.
je naziv hijerarhije. U našem slučaju, ovo je hijerarhija Država-Grad.
je naziv člana ose na prvom nivou hijerarhije (tj. zemlja) All je meta član koji kombinuje sve članove ose. U svakoj osi postoji takav meta-član. Na primjer, na osi godina nalazi se "Sve godine" itd.
Djeca je funkcija člana. Svaki član ima nekoliko dostupnih funkcija. kao što je roditelj. Nivo, Hijerarhija, vraćajući pretka, nivo u hijerarhiji i samu hijerarhiju, kojoj član pripada u ovom slučaju. Djeca - Vraća skup podređenih članova ovog člana. One. u našem slučaju zemlje.
na redove– Određuje kako urediti ove podatke u tabeli sa sažetkom. U ovom slučaju, u zaglavlju reda. Moguće značenje ovdje: na stupcima, na stranicama, na paragrafima, itd. Također je moguće jednostavno specificirati pomoću indeksa, počevši od 0.
od je indikacija kocke iz koje se vrši odabir.

Šta ako nam ne trebaju sve zemlje, već samo nekoliko određenih? Da biste to učinili, možete eksplicitno naznačiti u zahtjevu one zemlje koje su nam potrebne, a ne odabrati sve s funkcijom Djeca.

Odaberite ( ..., ... ) na redovima od
Vitičaste zagrade u ovom slučaju su deklaracija skupa ( set). Skup je lista, nabrajanje članova sa jedne ose.

Sada napišimo upit za naš drugi primjer - izlaz u kontekstu dostavljača:

Odaberite ...Djeca u redovima .Članovi u kolonama iz
Dodano ovdje:
- osa;
.Članovi je funkcija osi koja vraća sve članove na njoj. Ista funkcija je dostupna za hijerarhiju i nivo. Jer postoji samo jedna hijerarhija u ovoj osi, onda se njena indikacija može izostaviti, jer nivo i hijerarhija su takođe isti, tada možete prikazati sve članove na jednoj listi.

Mislim da je već očigledno kako ovo možemo nastaviti na naš treći primjer s detaljima po godinama. Ali nemojmo detaljnije detaljizirati po godinama, već filtrirati - tj. izgraditi rez. Da biste to uradili, napišite sljedeći upit:

Odaberite ..Djeca u redovima .Članovi u kolonama odakle (.)
Gdje je filtriranje?

gdje- ključna riječ
je jedan od članova hijerarhije . Puno ime, uključujući sve termine, bi bilo: .. , ali zato ime ovog člana je jedinstveno unutar ose, tada se svi kvalifikatori srednjeg imena mogu izostaviti.

Zašto je član datuma u zagradama? Zagrade su tuple ( tuple). Tuple je jedna ili više koordinata duž razne sjekire. Na primjer, da bismo filtrirali duž dvije ose odjednom, u zagradama navodimo dva pojma iz drugačije mjere odvojene zarezima. To jest, tuple definira "slice" kocke (ili "filtriranje" ako je takva terminologija bliža).

Tuple se koristi za više od samo filtriranja. Torke također mogu biti u zaglavljima reda/kolone/stranica, itd.

Ovo je potrebno, na primjer, da bi se rezultat trodimenzionalnog upita prikazao u dvodimenzionalnoj tabeli.

Odaberite unakrsno spajanje(...Djeca, ..Djeca) na redove .Članove u kolonama odakle (.)
Crossjoin je funkcija. Vraća skup torki (da, skup može sadržavati torke!), koji je rezultat kartezijanskog proizvoda dva skupa. One. skup rezultata će sadržavati sve moguće kombinacije zemalja i godina. Zaglavlja reda će stoga sadržavati nekoliko vrijednosti: Država-Godina.

Pitanje je, gdje je indikacija koje numeričke karakteristike treba prikazati? U ovom slučaju se koristi zadana mjera specificirana za ovu kocku, tj. Cijena narudžbe. Ako želimo da prikažemo drugu meru, zapamtimo da su mere članovi dimenzije Mjere. I ponašamo se na isti način kao i sa ostalim osovinama. One. filtriranje upita prema jednoj od mjera će prikazati upravo ovu mjeru u ćelijama.

Pitanje: kako se filtriranje razlikuje od filtriranja specificiranjem članova osi u redovima. Odgovor: praktično ništa. Samo u tome gde je naznačen rez za one osovine koje ne učestvuju u formiranju naslova. One. iste ose ne mogu biti prisutan u isto vreme na redove, i u gdje.

Computed Members

Za složenije upite možete deklarirati izračunate članove. Članovi osi atributa i mjerne osi. One. Možete proglasiti, na primjer, novu mjeru koja će prikazati doprinos svake zemlje ukupan iznos narudžbe:

Sa članom. kao ‘.CurrentMember / ..’, FORMAT_STRING=‘0.00%’ odaberite ...Djeca u redovima odakle .
Proračun se odvija u kontekstu ćelije kojoj su poznati svi njeni koordinatni atributi. Odgovarajuće koordinate (članovi) mogu se dobiti funkcijom CurrentMember za svaku od osa kocke. Ovdje se mora shvatiti da izraz .CurrentMember / ..' ne dijeli jedan pojam drugim, već dijeli relevantne agregirane podatke kocke kriške! One. isječak za trenutnu teritoriju će se podijeliti na srez za sve teritorije, tj. ukupna vrijednost svih narudžbi. FORMAT_STRING - postavlja format za izlaz vrijednosti, tj. %.

Još jedan primjer izračunatog člana, ali već na osi godina:

Sa članom. kao'. - .'
Očigledno je da u izvještaju neće biti jedinica, već razlika odgovarajućih rezova, tj. razlika u iznosu narudžbi u ove dvije godine.

Prikaz u ROLAP-u

OLAP sistemi su nekako zasnovani na nekoj vrsti sistema skladištenja podataka i organizacije. Kada je u pitanju RDBMS, oni govore o ROLAP-u (ostavićemo MOLAP i HOLAP za samostalno učenje). ROLAP - OLAP na relacionoj bazi podataka, tj. opisane u obliku konvencionalnih dvodimenzionalnih tabela. ROLAP sistemi pretvaraju MDX upite u SQL. Glavni računski problem za bazu podataka je brzo agregiranje. Kako bi se brže agregirali, podaci u bazi su obično visoko denormalizirani, tj. nisu pohranjeni vrlo efikasno u smislu diskovnog prostora i kontrole integriteta baze podataka. Plus dodatno sadrže pomoćne tabele koje pohranjuju djelimično agregirane podatke. Stoga se za OLAP obično kreira posebna šema baze podataka, koja samo djelomično ponavlja strukturu originalnih transakcijskih baza podataka u smislu direktorija.

Navigacija

Mnogi OLAP sistemi nude alate za interaktivnu navigaciju kroz već formirani upit (i, shodno tome, odabrane podatke). U ovom slučaju se koristi takozvano "bušenje" ili "bušenje" (bušilica). Adekvatniji prijevod na ruski bila bi riječ "produbljivanje". Ali ovo je stvar ukusa.U nekim sredinama se zadržala riječ "bušenje".

Bušilica- ovo je preciziranje izvještaja smanjenjem stepena agregacije podataka, u kombinaciji sa filtriranjem duž neke druge ose (ili nekoliko osa). Bušenje je nekoliko vrsta:

  • drill-down– filtriranje po jednoj od početnih osa izvještaja sa izlazom detaljne informacije po potomcima unutar hijerarhije odabranog člana filtera. Na primjer, ako postoji izvještaj o raspodjeli narudžbi po zemljama i godinama, onda kada kliknete na 2007. godinu, prikazat će se izvještaj u kontekstu istih zemalja i mjeseci 2007. godine.
  • drill-side– filtriranje ispod jedne ili više odabranih osa i uklanjanje agregacije duž jedne ili više drugih osa. Na primjer, ako postoji izvještaj o raspodjeli narudžbi po zemljama i godinama, onda kada kliknete na 2007., prikazat će se drugi izvještaj u kontekstu, na primjer, zemalja i dobavljača filtriranih do 2007. godine.
  • bušiti kroz– uklanjanje agregacije na svim osama i istovremeno filtriranje na njima – omogućava vam da vidite originalne podatke iz tabele činjenica iz koje je dobijena vrednost u izveštaju. One. kada kliknete na vrijednost ćelije, prikazuje se izvještaj sa svim nalozima koji su dali taj iznos. Neka vrsta trenutnog bušenja u samu "utrobu" kocke.
To je sve. Sada, ako odlučite da se posvetite poslovnoj inteligenciji i OLAP-u, vrijeme je da počnete čitati ozbiljnu literaturu.

Tagovi:

  • OLAP
  • Mondrian
  • poslovne inteligencije
  • MDX
Dodaj oznake

Nakon što su podaci primljeni, očišćeni, dovedeni u jedinstveni obrazac i stavljeni u skladište, potrebno ih je analizirati. Za to se koristi OLAP tehnologija.

Dvanaest definirajućih principa OLAP-a formulirao je 1993. E.F. Codd, "izumitelj" relacijskih baza podataka. OLAP je on-line analitička obrada, odnosno onlajn analiza podataka. Kasnije je Coddova definicija prerađena u takozvani FASMI test (Fast Analysis of Shared Multidimensional Information – brza analiza zajedničkih multidimenzionalnih informacija), koji zahtijeva OLAP aplikaciju da pruži sledeće mogućnosti brza analiza zajedničkih višedimenzionalnih informacija: velika brzina; analiza; dijeljenje pristupa; multidimenzionalnost; rad sa informacijama.

Velika brzina. Analizu treba izvršiti podjednako brzo na svim aspektima informacija. U ovom slučaju, dozvoljeno vrijeme odgovora nije više od 5 sekundi.

Analiza. Trebalo bi biti moguće izvoditi osnovne tipove numeričke i statističke analize - ili unaprijed definirane od strane programera aplikacije ili proizvoljno definirane od strane korisnika.

Dijeljenje pristupa. Pristup podacima treba da bude višekorisnički, dok pristup povjerljivim informacijama treba biti kontrolisan.

Multidimenzionalnost. Glavna, najbitnija karakteristika OLAP-a.

Rad sa informacijama. Aplikacija mora biti u mogućnosti pristupiti svim potrebnim informacijama, bez obzira na njen volumen i lokaciju pohranjivanja.

Višedimenzionalni prikaz. OLAP pruža organizacijama najpovoljnije i brza sredstva pristupiti, pregledati i analizirati poslovne informacije. Ono što je najvažnije, OLAP pruža korisniku prirodan, intuitivan model podataka organizirajući ga u višedimenzionalne kocke (Cubes). sjekire (dimenzije) multidimenzionalni sistem koordinate su glavni atributi analiziranog poslovnog procesa. Na primjer, za prodajni proces, to može biti kategorija proizvoda, regija, tip kupca. Gotovo uvijek se vrijeme koristi kao jedno od mjera. Unutar kocke su podaci koji kvantitativno karakterišu proces – tzv. mere (Measures). To mogu biti obim prodaje u komadima ili u novcu, stanje zaliha, troškovi itd. Korisnik koji analizira informacije može "prerezati" kocku prema tome različitim pravcima, prima zbirne (na primjer, po godinama) ili, obrnuto, detaljne (po sedmicama) podatke i obavlja druge operacije koje su mu potrebne za analizu.

Skladištenje OLAP podataka . Prije svega, mora se reći da, budući da analitičar uvijek radi sa nekim zbirnim (a ne detaljnim) podacima, OLAP baze podataka gotovo uvijek uz detaljne podatke pohranjuju i takozvane agregate, odnosno unaprijed izračunate zbirne indikatore. Primjeri agregata su ukupna prodaja za godinu dana ili prosječno stanje zaliha. Pohranjivanje unaprijed izračunatih agregata je primarni način da se ubrzaju OLAP upiti.


Međutim, izgradnja agregata može dovesti do značajnog povećanja veličine baze podataka.

Drugi problem sa OLAP skladištenjem podataka je oskudnost višedimenzionalnih podataka. Na primjer, ako nije bilo prodaje u određenom regionu 2000. godine, onda neće biti vrijednosti na sjecištu odgovarajućih dimenzija kocke. Ako OLAP server u ovom slučaju pohrani neku nedostajuću vrijednost, tada uz značajnu oskudnost podataka, broj praznih ćelija (koje zahtijevaju, ipak, prostor za pohranu) može mnogo puta premašiti broj popunjenih, a kao rezultat toga, ukupni volumen će neopravdano povećati. Ponuđena rješenja za ovo od strane Microsofta su dati u nastavku.

Vrste OLAP-a. Za pohranjivanje OLAP podataka mogu se koristiti:

Specijalni višedimenzionalni DBMS (OLAP-serveri). U ovom slučaju se govori o MOLAP (Multidimenzionalni OLAP). Prilikom izvršavanja složenih upita koji analiziraju podatke u različitim dimenzijama, višedimenzionalni DBMS daje bolje performanse od relacijskih. Istovremeno, brzina izvršenja upita ne zavisi od toga na kojoj dimenziji je napravljen „rez“ višedimenzionalne kocke.

Tradicionalni relacioni DBMS - ROLAP (relacijski OLAP). Upotreba posebnih struktura podataka - shema "zvijezda" i "snježna pahulja", kao i skladištenje izračunatih agregata, omogućavaju višedimenzionalnu analizu relacijskih podataka. Relacioni DBMS-ovi su istorijski poznatiji i u njih se mnogo ulagalo, tako da je ROLAP do sada češći.

Kombinovana opcija - HOLAP (Hibridni OLAP), koji kombinuje oba tipa DBMS-a. Jedna od opcija za kombinovanje ova dva tipa DBMS-a je skladištenje agregata u višedimenzionalnom DBMS-u, a detaljnih podataka (koji imaju najveći volumen) u relacionom.

Microsoft nudi sljedeće alate za OLAP analizu:

Microsoft SQL Server 7.0 uključuje potpuno opremljen OLAP server - SQL Server OLAP usluge. Server je, naravno, dizajniran da služi zahtjevima klijenata, a to zahtijeva neku vrstu protokola interakcije i jezika zahtjeva. Na primjer, za interakciju klijenta sa serverskim relacijskim DBMS-om - SQL Server - ODBC ili OLE DB protokoli i jezik SQL upiti. Za pristup OLAP serveru, Microsoft je razvio OLE DB za OLAP protokol i jezik upita za višedimenzionalne podatke - MDX (MultiDimensional eXpression). Baš kao što je jednostavnost i praktičnost, sloj ADO (ActiveX Data Objects) objekata razvijen je preko OLE DB-a, ADO MD (MultiDimensional ADO) je izgrađen preko OLE DB-a za OLAP.

Alati za analizu podataka u microsoft office 2000. Microsoft Excel 2000 sadrži novi motor za zaokretnu tabelu - OLAP PivotTable, koji je zamenio prethodnu verziju istoimenog motora za zaokretnu tabelu. Zajedno sa prethodnim mogućnostima relacione analize podataka, motor zaokretne tabele sada uključuje mogućnosti OLAP analize podataka, odnosno deluje kao OLAP klijent. Microsoft SQL Server 7.0 se može koristiti kao server, kao i svaki proizvod koji podržava OLE DB za OLAP interfejs. Konsolidovani mehanizam Excel tabele in u cijelosti podržava funkcije koje pružaju usluge zaokretne tablice (PTS) opisane gore. Tako se analizirani OLAP podaci mogu locirati kako u lokalnim kockama tako i na OLAP serveru.

Microsoft Office 2000 takođe sadrži skup ActiveX komponenti tzv Office 2000 Web komponente, koji vam omogućavaju da organizirate analizu OLAP podataka koristeći Pretraživanje weba. One uključuju sljedeće četiri komponente:

Tabela- pribor ograničena funkcionalnost Excel list.

Zaokretna tabela- "blizanac" Excel pivot tabela; može raditi s podacima OLAP usluga.

grafikon- omogućava vam da napravite grafikone na osnovu relacionih i OLAP podataka.

izvor podataka- komponenta usluge za vezivanje ostalih komponenti za izvor podataka.

Kada rade sa OLAP podacima, Web komponente pristupaju uslugama zaokretne tabele.

5.5. TEHNOLOGIJA ANALIZE "DATA MINING"

Pojava Data Mining tehnologije povezana je sa potrebom da se izvuče znanje iz heterogenih podataka akumuliranih u informacionim sistemima. Postojao je koncept koji se na ruskom jeziku počeo zvati "rudarstvo", "vađenje" znanja. U inostranstvu se ustalio termin „data mining“.

Metode matematičke statistike koje su se naširoko koristile u prošlosti pokazale su se korisnim uglavnom za testiranje unaprijed formuliranih hipoteza (provjera-driven data mining) i za “grubu” istraživačku analizu, koja čini osnovu online analitičke obrade (OLAP) .

Ključna prednost rudarenje podataka u poređenju sa prethodnim metodama - mogućnost automatskog generisanja hipoteza o odnosu između razni parametri ili komponente podataka. Posao analitičara pri radu sa tradicionalnim paketom za obradu podataka zapravo se svodi na provjeru ili prečišćavanje jedne ili dvije hipoteze koje je on generirao. U slučajevima kada nema početnih pretpostavki, a količina podataka je značajna, postojeći sistemi gube svoju efikasnost i pretvaraju se u rasipnike vremena analitičara.

Drugi važna karakteristika Data Mining sistemi sposobnost obrade višedimenzionalnih upita i traženja višedimenzionalnih zavisnosti. Jedinstvena je i sposobnost sistemi podataka rudarenje automatski detektuje izuzetne situacije– tj. elementi podataka koji "ispadaju" iz opštih obrazaca.

Postoji pet standardnih tipova obrazaca koji vam omogućavaju da identifikujete metode rudarenja podataka

udruženje

podsekvenca

klasifikacija

grupisanje

prognoziranje

Potraga za obrascima provodi se metodama koje nisu ograničene apriornim pretpostavkama o strukturi uzorka i vrsti distribucija vrijednosti analiziranih indikatora. Primjeri zadataka za takvu pretragu kada koristeći podatke Rudarstvo je prikazano u tabeli 1.

Tabela 1 – Poređenje formulacija zadataka kada se koriste OLAP i Data Mining metode

Za rješavanje analitičkih problema vezanih za složene proračune, predviđanje, modeliranje scenarija "Šta ako..." koristi se tehnologija višedimenzionalne analize podataka - tehnologija OLAP. Koncept OLAP-a prvi je opisao 1993. Edgar Codd, poznati istraživač baze podataka i autor relacionog modela podataka, u knjizi "OLAP za korisnike analitičara: šta bi trebao biti", gdje je iznio 12 zakona analitičkih podataka. obrada, prema kojoj OLAP programeri - proizvodi sada žive:

1. Konceptualni višedimenzionalni prikaz podataka.

2. Transparentnost (transparentan pristup eksternim podacima za korisnika, omogućavajući mu, gdje god da se nalazi, da komunicira sa serverom pomoću analitičkog alata).

3. Dostupnost i detaljnost podataka.

4. Dosljedan učinak u razvoju izvještaja (ako se poveća broj dimenzija ili veličina baze podataka, korisnik analitičar ne bi trebao osjetiti bilo kakvu degradaciju u performansama).

5. Arhitektura klijent-server (OLAP je dostupan sa desktopa).

6. Opća multidimenzionalnost.

7. Dinamička kontrola rijetkih matrica.

8. Podrška za više korisnika. Često se dešava da više korisnika analitičara osjeća potrebu da rade zajedno na istom analitičkom modelu ili da kreiraju različite modele iz istih podataka. A OLAP alat mora obezbijediti dijeljenje (upit i dodavanje), integritet i sigurnosne mogućnosti.

9. Neograničene unakrsne operacije.

10. Intuitivna manipulacija podacima.

11. Fleksibilne opcije izvještavanja.

12. Neograničena dimenzija i broj nivoa agregacije (analitički alat mora istovremeno da obezbedi najmanje 15 dimenzija, a po mogućnosti 20).

Nedostaci konvencionalnih izvještaja za menadžera su očigledni: menadžer nema vremena da bira brojeve od interesa iz izvještaja, pogotovo jer ih može biti previše. Složenost izvještaja za razumijevanje, neugodnost rada s njima dovela je do potrebe za kreiranjem novog koncepta rada sa podacima.

Kada analitičar treba da dobije informaciju, on sam ili uz pomoć programera pravi odgovarajući SQL upit bazi podataka, prima podatke koji ga zanimaju u obliku izvještaja. Izvještaji se mogu graditi na zahtjev ili po ostvarenju određenih događaja ili vremena. Ovo stvara mnoge probleme. Prije svega, analitičar najčešće nema vještine programiranja na visokom nivou i ne može samostalno izvršiti SQL upit bazi podataka. Osim toga, analitičaru nije potreban jedan izvještaj, već mnogo njih i to u realnom vremenu. Programeri, koji lako mogu da postavljaju bilo kakve upite bazi podataka, ako mu pomognu, onda ne stalno, jer i oni imaju svoj posao. Masovni zahtjevi prema serveru baze podataka otežavaju rad onim zaposlenicima kompanije koji stalno rade sa bazama podataka.

Koncept OLAP-a se pojavio upravo da riješi takve probleme. OLAP (O n L ine A nalitički P rocessing) je operativna analitička obrada velikih količina podataka u realnom vremenu. Svrha OLAP sistema je da olakša rješavanje problema analize velikih količina podataka i brze obrade složenih upita baze podataka.

OLAP je:

    nije softverski proizvod

    nije programski jezik

    ne tehnologija

OLAP je skup koncepata, principa i zahtjeva koji analitičarima olakšavaju pristup podacima. To je alat za multidimenzionalnu dinamičku analizu velikih količina podataka u realnom vremenu.

Zadatak analitičara je da pronađe obrasce u velikim skupovima podataka. Analitičar neće obratiti pažnju ni na jednu činjenicu, potrebne su mu informacije o nekoliko desetina sličnih događaja. Pojedinačne činjenice u bazi podataka su od interesa, na primjer, za računovođu ili zaposlenika odjela prodaje u čijoj je nadležnosti transakcija. Analitičaru nije dovoljan jedan zapis – na primjer, možda će mu trebati sve transakcije date filijale ili predstavništva za mjesec ili godinu dana. Istovremeno, analitičar odbacuje nepotrebne detalje kao što su PIB kupca, njegova tačna adresa i broj telefona, indeks ugovora i slično. Istovremeno, podaci koje analitičar treba da radi nužno sadrže numeričke vrijednosti - to je zbog same suštine njegove aktivnosti.

Višedimenzionalni skup podataka se često predstavlja kao OLAP kocka (vidi sliku 26). Osi OLAP kocke sadrže parametre, a ćelije sadrže zbirne podatke koji zavise od njih.

Rice. 26OLAP - kocka

OLAP kocke su u suštini meta-izvještaji. Prednosti kocke su očigledne - podatke je potrebno zatražiti iz baze podataka samo jednom - prilikom izgradnje kocke. Budući da analitičari po pravilu ne rade s informacijama koje se dopunjuju i mijenjaju u hodu, generirana kocka je relevantna dosta dugo. Zahvaljujući tome, ne samo da su eliminisani prekidi u radu servera baze podataka (nema upita sa hiljadama i milionima linija odgovora), već se dramatično povećava i brzina pristupa podacima za samog analitičara.

Ali postoji i značajan nedostatak: OLAP kocka može zauzeti desetine ili čak stotine puta više prostora od originalnih podataka.

OLAP - kocka uopće ne mora biti trodimenzionalna. Može biti i dvodimenzionalni i višedimenzionalni - ovisno o problemu koji se rješava. Analitičarima će možda biti potrebno više od 20 mjerenja - ozbiljni OLAP proizvodi su dizajnirani za upravo takav broj. Jednostavnije desktop aplikacije podržavaju maksimalno 6 dimenzija.

Daleko od svih elemenata kocke treba popuniti: ako bilo koja informacija nedostaje, vrijednost u odgovarajućoj ćeliji jednostavno neće biti određena za nju. Također nije neophodno da OLAP aplikacija pohranjuje podatke nužno u višedimenzionalnoj strukturi - glavna stvar je da za korisnika ti podaci izgledaju upravo tako.

Popunjavanje OLAP kocke može se izvršiti kako stvarnim podacima iz operativnih sistema, tako i predvidjeti na osnovu istorijskih podataka. Dimenzije hiperkocke mogu biti složene, hijerarhijske i između njih se mogu uspostaviti odnosi. Tokom analize, korisnik može promijeniti tačku gledišta na podatke (tzv. operacija promjene logičkog pogleda), na taj način sagledavajući podatke u različitim dijelovima i rješavajući konkretne probleme. Na kockama se mogu izvesti razne operacije, uključujući predviđanje i uslovno zakazivanje (šta ako analiza).

Trodimenzionalna kocka se može lako nacrtati i zamisliti. Međutim, gotovo je nemoguće adekvatno predstaviti ili prikazati šesto- ili dvadesetdimenzionalnu kocku. Stoga se prije upotrebe obične dvodimenzionalne tablice izdvajaju iz višedimenzionalne kocke, tj. na neki način "izrezati" dimenzije kocke po oznakama. Rezanjem OLAP kocke po dimenzijama, analitičar dobija, u stvari, “obične dvodimenzionalne izveštaje” koji ga zanimaju (ne nužno izveštaje u uobičajenom smislu – govorimo o strukturama podataka sa istim funkcijama). Ova operacija se zove "rezanje" kocke. Na taj način analitičar prima dvodimenzionalni komad kocke i radi s njim. Rezovi koji su vam potrebni su izvještaji.

U interakciji sa OLAP sistemom, korisnik može izvršiti fleksibilan pregled informacija, dobiti proizvoljne rezove podataka i izvoditi analitičke operacije detaljisanja, konvolucije, distribucije od kraja do kraja i vremenskog poređenja (vidi sliku 27).

Rice. 27 strDobivanje proizvoljnih isječaka podataka kadasečenje OLAP kocke.

Klasifikacija OLAP proizvoda

Operacije sa podacima se izvode pomoću OLAP mašine. OLAP proizvodi su klasifikovani prema načinu pohranjivanja podataka i lokaciji OLAP mašine.

Prema načinu skladištenja podataka dijele se u tri kategorije MOLAP, ROLAP i HOLAP:

    MOLAP - izvorni i zbirni podaci se pohranjuju u multidimenzionalna baza podataka ili u višedimenzionalnoj lokalnoj kocki.

    ROLAP - izvorni podaci se pohranjuju u relacione baze podataka ili u ravnim lokalnim tablicama na serveru datoteka. Zbirni podaci se mogu postaviti u servisne tabele u istoj bazi podataka. Transformacija podataka iz relacione baze podataka u višedimenzionalne kocke se dešava na zahtev OLAP alata.

    HOLAP - originalni podaci ostaju unutra relacione baze podataka, a zbirni podaci se stavljaju u multidimenzionalna baza podataka. OLAP kocka se gradi na zahtjev OLAP alata zasnovanog na relacijskim i višedimenzionalnim podacima.

Na osnovu lokacije OLAP mašine, postoje dve glavne klase OLAP proizvoda: OLAP server i OLAP klijent.

OLAP server prima zahtjev, izračunava i pohranjuje zbirne podatke na serveru, dajući klijentskoj aplikaciji instaliranoj na klijentskom računaru samo rezultate upita višedimenzionalnim kockama koje su pohranjene na serveru. Mnogi moderni OLAP serveri podržavaju sve tri metode skladištenja podataka: MOLAP, ROLAP i HOLAP.

OLAP klijent gradi višedimenzionalnu kocku i OLAP kalkulacije ne na zasebnom serveru, već na samom korisnikovom klijentskom računaru. OLAP klijenti se također dijele na ROLAP i MOLAP.

Poznato je da OLAP server može obraditi značajnije količine podataka od OLAP klijenta sa jednakom snagom računara. To je zato što OLAP server pohranjuje tvrdi diskovi višedimenzionalnu bazu podataka koja sadrži unaprijed izračunate kocke. Klijentski programi upućuju zahtjeve serveru, primajući i kocku i njene fragmente. Karakteristike performansi OLAP servera su manje osjetljive na rast podataka.

OLAP klijent mora imati cijelu kocku u RAM-u u vrijeme rada. Stoga, količina podataka koje obrađuje OLAP klijent direktno zavisi od količine RAM-a na računaru korisnika. OLAP klijent generiše upit bazi podataka, koji opisuje uslove filtriranja i algoritam za preliminarno grupisanje primarnih podataka. Server pronalazi, grupiše zapise i vraća kompaktnu selekciju za dalje OLAP proračune. Veličina ovog uzorka može biti desetine i stotine puta manja od obima primarnih, neagregiranih zapisa. Shodno tome, potreba za takvim OLAP klijentom u računarskim resursima je značajno smanjena.

OLAP server predstavlja minimalni zahtjevi na snagu klijentskih računara. Zahtjevi OLAP klijenta su veći, jer obavlja proračune u svojoj RAM memoriji. Ako je kapacitet klijentskih računara nizak, tada će OLAP klijent raditi sporo ili uopće neće moći raditi. Kupovina jednog moćnog servera može biti jeftinija od nadogradnje svih računara.

Cijena OLAP servera je prilično visoka, a implementacija i održavanje OLAP servera zahtijeva visoko kvalifikovano osoblje. Cijena OLAP klijenta je za red veličine niža od cijene OLAP servera.

Uvođenjem OLAP-a značajno se povećava produktivnost i efikasnost upravljanja preduzećem. Glavna osoba u procesu analize podataka je ekspert- Specijalista u predmetnoj oblasti. Stručnjak postavlja hipoteze (pretpostavke) i, da bi ih analizirao, ili pregledava neke uzorke na različite načine, ili gradi modele za testiranje pouzdanosti hipoteza.

Analitički alati omogućavaju krajnjem korisniku, koji nema posebna znanja iz oblasti IT-a, rad sa velikim količinama podataka. Svrha analitičkih poslovnih sistema: podrška odlučivanju na svim nivoima upravljanja preduzećem.

Analitički sistemi operativni nivo obezbeđuju upravljanje preduzećem u „režinu rada“, tj. realizacija određenog proizvodnog programa. Analitički sistemi strateškom nivou pomoći menadžmentu preduzeća da razvije rješenja u "razvojnom modu". Sistemi strateškog upravljanja su analitički IS koji podržavaju odluku ključni zadaci strateško upravljanje kompanijom.

Mnogi članci o OLAP-u mogu se naći na web stranici: http://www.olap.ru/basic/oolap.asp

Možda će se nekima upotreba OLAP tehnologije (On-line Analytic Processing) pri izradi izvještaja činiti kao neka egzotika, pa upotreba OLAP-CUBE za njih uopće nije jedan od najvažnijih zahtjeva za automatizaciju budžetiranja. i upravljačko računovodstvo.

U stvari, vrlo je zgodno koristiti višedimenzionalnu CUBE kada radite sa izvještavanjem menadžmenta. Prilikom izrade budžetskih formata možete naići na problem multivarijantnih obrazaca (više o tome možete pronaći u knjizi 8 „Tehnologija za postavljanje budžetiranja u kompaniji“ i u knjizi „Postavljanje i automatizacija upravljačkog računovodstva“).

To je zbog činjenice da efikasno upravljanje kompanijom zahtijeva sve detaljnije izvještavanje menadžmenta. Odnosno, sistem koristi sve više različitih analitičkih rezova (in informacioni sistemi analitičari su definirani skupom direktorija).

Naravno, to dovodi do činjenice da menadžeri žele da primaju izvještaje u svim analitičkim dijelovima koji ih zanimaju. A to znači da izvještaje treba nekako natjerati da „dišu“. Drugim riječima, možemo reći da je u ovom slučaju riječ o tome da, u smislu značenja, isti izvještaj treba da pruži informacije u različitim analitičkim rubrikama. Stoga statični izvještaji više ne odgovaraju mnogim modernim menadžerima. Potrebna im je dinamika koju multidimenzionalna KOCKA može pružiti.

Tako je OLAP tehnologija već postala obavezan element u savremenim i perspektivnim informacionim sistemima. Stoga, prilikom odabira softverskog proizvoda, morate obratiti pažnju na to da li koristi OLAP tehnologiju.

I morate znati razlikovati prave KOCKE od imitacija. Pivot tabele u MS Excel-u su jedna takva imitacija. Da, ovaj alat izgleda kao CUBE, ali u stvari nije, jer su to statične, a ne dinamičke tabele. Osim toga, imaju mnogo lošiju implementaciju mogućnosti izrade izvještaja koji koriste elemente iz hijerarhijskih direktorija.

Za potvrdu važnosti korištenja CUBE prilikom izgradnje izvještavanje menadžmenta Najjednostavniji primjer je prodajni budžet. U ovom primjeru, sljedeće analitičke isječke su relevantne za kompaniju: proizvodi, grane i kanali distribucije. Ako su ove tri analitike važne za kompaniju, onda se prodajni budžet (ili izvještaj) može prikazati na nekoliko načina.

Treba napomenuti da ako kreirate budžetske linije na osnovu tri analitička odsječka (kao u primjeru koji se razmatra), to vam omogućava da kreirate prilično složene budžetski modeli i pravite detaljne izvještaje koristeći CUBE.

Na primjer, prodajni budžet se može sastaviti koristeći samo jednu analitiku (priručnik). Prikazan je primjer budžeta za prodaju zasnovan na jednoj analitici "Proizvodi". slika 1.

Rice. 1. Primjer prodajnog budžeta izgrađenog na osnovu jednog analitičkog "Proizvoda" u OLAP-CUBE

Isti budžet prodaje se može sastaviti pomoću dvije analitike (priručnika). Primjer prodajnog budžeta izgrađenog na osnovu dvije analitike "Proizvodi" i "Afilijacije" prikazan je na slika 2.

Rice. 2. Primjer prodajnog budžeta izgrađenog na osnovu dvije analitike "Proizvodi" i "Afilijacije" u OLAP-CUBE softverskog paketa INTEGRAL

.

Ako postoji potreba za izradom detaljnijih izvještaja, onda se isti budžet prodaje može sastaviti pomoću tri analitike (referenca). Primjer prodajnog budžeta izgrađenog na osnovu tri dimenzije "Proizvodi", "Povezane osobe" i "Kanali distribucije" prikazan je u slika 3.

Rice. 3. Primjer prodajnog budžeta izgrađenog na osnovu tri analitike "Proizvodi", "Filijale" i "Kanali distribucije" u OLAP-CUBE softverskog paketa INTEGRAL

Treba podsjetiti da KUB koji se koristi za generiranje izvještaja omogućava prikaz podataka u drugačijem redoslijedu. Na slika 3 prodajni budžet se prvo "raspoređuje" po proizvodu, zatim po grani, a zatim po kanalu distribucije.

Isti podaci se mogu prikazati različitim redoslijedom. Na slika 4 isti prodajni budžet se "razvaljuje" prvo po proizvodu, zatim po kanalu distribucije, a zatim po grani.

Rice. 4. Primjer prodajnog budžeta izgrađenog na osnovu tri analitike "Proizvodi", "Kanali distribucije" i "Povezane osobe" u OLAP-CUBE softverskog paketa INTEGRAL

Na slika 5 isti prodajni budžet se "razvaljuje" prvo po branši, zatim po proizvodu, a zatim po kanalu distribucije.

Rice. 5. Primjer prodajnog budžeta izgrađenog na osnovu tri analitike "Povezane osobe", "Proizvodi" i "Kanali distribucije" u OLAP-CUBE softverskog kompleksa "INTEGRAL"

Zapravo to nije sve moguće opcije izlaz prodajnog budžeta.

Osim toga, morate obratiti pažnju na činjenicu da vam KUB omogućava rad hijerarhijska struktura referentne knjige. U prikazanim primjerima hijerarhijski direktoriji su "Proizvodi" i "Kanali distribucije".

Sa stanovišta korisnika, on ovaj primjer prima nekoliko upravljačkih izvještaja (vidi Rice. 1-5), a u pogledu postavki u softverski proizvod je jedan izvještaj. Samo uz pomoć CUBE može se gledati na nekoliko načina.

Naravno, u praksi je moguć vrlo veliki broj izlaznih opcija za različite izvještaje menadžmenta ako su njihovi članci zasnovani na jednom ili više analitičara. A sam skup analitike zavisi od potreba korisnika za detaljima. Istina, ne treba zaboraviti da, s jedne strane, što je više analitičara, to se mogu napraviti detaljniji izvještaji. Ali, s druge strane, to znači da će finansijski model budžetiranja biti složeniji. U svakom slučaju, ukoliko postoji KUB, kompanija će moći da pregleda potrebna izvještavanja u različitim verzijama, u skladu sa analitičkim dijelovima od interesa.

Neophodno je spomenuti još nekoliko karakteristika OLAP-CUBE.

Postoji nekoliko dimenzija u višedimenzionalnoj hijerarhijskoj OLAP-KOCCI: tip reda, datum, redovi, pretraživanje 1, pretraživanje 2 i pretraživanje 3 (pogledajte sl. Rice. 6). Naravno, izveštaj prikazuje onoliko dugmadi sa direktorijumima koliko ih ima u liniji budžeta koja sadrži maksimalan broj direktorijuma. Ako ne postoji niti jedan direktorij u bilo kojoj liniji budžeta, onda izvještaj neće sadržavati nijedno dugme sa direktorijumima.

U početku, OLAP-CUBE je izgrađen na svim dimenzijama. Podrazumevano, kada se izveštaj inicijalno pravi, dimenzije se nalaze tačno u tim oblastima, kao što je prikazano u slika 6. Odnosno, takva dimenzija kao što je "Datum" nalazi se u području vertikalnih dimenzija (dimenzije u području kolona), dimenzija "Redovi", "Potraga 1", "Potraga 2" i "Pretraga 3 " - u području horizontalnih mjerenja (dimenzije u redovima područja) i dimenzija "Tip reda" u području "neproširenih" dimenzija (dimenzije u području stranice). Ako se dimenzija nalazi u posljednjoj oblasti, tada podaci u izvještaju neće biti "prošireni" tom dimenzijom.

Svaka od ovih dimenzija može se postaviti u bilo koju od tri oblasti. Nakon što se mjerenja prenesu, izvještaj se trenutno obnavlja prema novoj konfiguraciji mjerenja. Na primjer, možete zamijeniti datum i nizove s direktorijima. Ili možete prenijeti jednu od referentnih knjiga u područje vertikalnog mjerenja (pogledajte sl. Rice. 7). Drugim riječima, izvještaj u OLAP-CUBE može se "uvrnuti" i odabrati verziju izlaza izvještaja koja je najpogodnija za korisnika.

Rice. 7. Primjer rekonstrukcije izvještaja nakon promjene konfiguracije mjerenja programskog paketa "INTEGRAL".

Konfiguracija mjerenja se može promijeniti ili u glavnom obliku KUB-a ili u uređivaču karte promjena (vidi. Rice. osam). U ovom uređivaču također možete prevući i ispustiti mjerenja iz jednog područja u drugo pomoću miša. Osim toga, možete zamijeniti mjerenja u istom području.

Osim toga, u istom obliku možete konfigurirati neke mjerne parametre. Za svaku dimenziju možete prilagoditi lokaciju zbroja, redoslijed sortiranja elemenata i imena elemenata (vidi. Rice. osam). Također možete odrediti koji naziv elemenata će se prikazati u izvještaju: skraćeno (Name) ili puno (FullName).

Rice. 8. Urednik karte mjerenja softverskog kompleksa "INTEGRAL"

Parametri mjerenja mogu se uređivati ​​direktno u svakom od njih (vidi. Rice. devet). Da biste to uradili, kliknite na ikonu koja se nalazi na dugmetu pored naziva merenja.

Rice. 9. Primjer uređivanja direktorija 1 Proizvodi i usluge u

Pomoću ovog uređivača možete odabrati elemente koje želite prikazati u izvještaju. Podrazumevano, sve stavke se prikazuju u izveštaju, ali ako je potrebno, neke stavke ili fascikle se mogu izostaviti. Na primjer, ako trebate prikazati samo jednu grupu proizvoda u izvještaju, onda svi ostali moraju biti poništeni u uređivaču dimenzija. Nakon toga, izvještaj će sadržavati samo jednu grupu proizvoda (vidi Sl. Rice. deset).

Takođe možete sortirati stavke u ovom uređivaču. Osim toga, elementi se mogu preurediti na različite načine. Nakon takvog pregrupisavanja, izvještaj se trenutno obnavlja.

Rice. 10. Primjer prikaza samo jedne grupe proizvoda (fascikla) ​​u izvještaju u programskom paketu "INTEGRAL"

U uređivaču dimenzija možete brzo kreirati vlastite grupe, povlačiti elemente iz direktorija tamo itd. Podrazumevano, samo grupa Ostalo se automatski kreira, ali možete kreirati i druge grupe. Dakle, pomoću uređivača dimenzija možete konfigurirati koji elementi priručnika i kojim redoslijedom treba da se prikazuju u izvještaju.


Treba napomenuti da se sva takva prestrojavanja ne bilježe. Odnosno, nakon zatvaranja izvještaja ili nakon njegovog ponovnog izračunavanja, svi direktoriji će biti prikazani u izvještaju u skladu sa konfiguriranom metodologijom.

Zapravo, sve takve promjene su mogle biti napravljene na početku prilikom postavljanja stringova.

Na primjer, koristeći ograničenja, također možete odrediti koji elementi ili grupe direktorija trebaju biti prikazani u izvještaju, a koji ne.

Bilješka: tema ovog članka detaljnije je obrađena na radionicama "Upravljanje poslovnim budžetom" i "Postavljanje i automatizacija upravljačkog računovodstva" vodi autor ovog članka - Aleksandar Karpov.

Ako korisnik skoro redovno treba da prikazuje samo određene elemente ili fascikle direktorijuma u izveštaju, onda je bolje da takve postavke izvrši unapred prilikom kreiranja redova izveštaja. Ako je važno za korisnika razne kombinacije elemenata direktorija u izvještajima, tada pri postavljanju metodologije ne treba postavljati ograničenja. Sva takva ograničenja mogu se brzo konfigurirati pomoću uređivača dimenzija.

Top Related Articles