Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ
  • shtëpi
  • Gabimet
  • Kush është përdoruesi i sistemeve olap. raporton OLAP

Kush është përdoruesi i sistemeve olap. raporton OLAP

OLAP (OnLine Analytical Processing) është emri jo i një produkti specifik, por i një teknologjie të tërë për përpunimin analitik operacional, i cili përfshin analizimin e të dhënave dhe marrjen e raporteve. Përdoruesi pajiset me një tabelë shumëdimensionale që përmbledh automatikisht të dhënat në seksione të ndryshme dhe ju lejon të menaxhoni shpejt llogaritjet dhe formularin e raportit.

Megjithëse në disa botime përpunimi analitik quhet si në internet ashtu edhe interaktiv, mbiemri "online" pasqyron më saktë kuptimin e teknologjisë OLAP. Zhvillimi i zgjidhjeve të menaxhimit nga një menaxher bie në kategorinë e zonave më të ndjeshme ndaj automatizimit. Sidoqoftë, sot ekziston një mundësi për të ndihmuar menaxherin në zhvillimin e zgjidhjeve dhe, më e rëndësishmja, të përshpejtojë ndjeshëm procesin e zhvillimit të zgjidhjeve, përzgjedhjen dhe miratimin e tyre.

Sistemet e mbështetjes së vendimit zakonisht kanë mjetet për t'i siguruar përdoruesit të dhëna të përgjithshme për mostra të ndryshme nga grupi origjinal në një formë të përshtatshme për perceptim dhe analizë. Si rregull, të tilla funksionet agregate formojnë një grup të dhënash shumëdimensionale, shpesh të quajtur hiperkub ose metakub, boshtet e të cilit përmbajnë parametra, dhe qelizat përmbajnë të dhëna agregate që varen prej tyre - dhe të dhëna të tilla mund të ruhen edhe në tabela relacionale, por në këtë rast po flasim për O organizimi logjik të dhënat, dhe jo për zbatimin fizik të ruajtjes së tyre.

Përgjatë çdo boshti, të dhënat mund të organizohen në një hierarki, duke përfaqësuar nivele të ndryshme detajesh.

Sipas dimensioneve në modelin shumëdimensional, janë lënë mënjanë faktorët që ndikojnë në aktivitetet e ndërmarrjes (p.sh.: koha, produktet, degët e kompanisë etj.). Kubi OLAP që rezulton më pas mbushet me tregues të aktivitetit të ndërmarrjes (çmimet, shitjet, plani, fitimet, tepricat, etj.). Duhet të theksohet se, ndryshe nga një kub gjeometrik, faqet e një kubi OLAP nuk duhet të jenë domosdoshmërisht të njëjtën madhësi. Kjo mund të plotësohet me të dhëna reale nga sistemet operative dhe të dhëna parashikimi bazuar në të dhënat historike. Dimensionet e një hiperkubi mund të jenë komplekse, hierarkike dhe mund të vendosen marrëdhënie midis tyre. Gjatë procesit të analizës, përdoruesi mund të ndryshojë këndvështrimin mbi të dhënat (i ashtuquajturi operacioni i ndryshimit të pamjes logjike), duke parë kështu të dhënat nga këndvështrime të ndryshme dhe duke zgjidhur probleme specifike. Operacione të ndryshme mund të kryhen në kube, duke përfshirë parashikimin dhe planifikimin e kushtëzuar (çka-nëse analiza).

Falë këtij modeli të dhënash, përdoruesit mund të formulojnë pyetje komplekse, të gjenerojnë raporte dhe të marrin nëngrupe të dhënash. Përpunimi analitik operacional mund të thjeshtojë dhe shpejtojë ndjeshëm procesin e përgatitjes dhe vendimmarrjes nga personeli drejtues. Përpunimi analitik online i shërben qëllimit të shndërrimit të të dhënave në informacion. Ai është thelbësisht i ndryshëm nga procesi tradicional i mbështetjes së vendimeve, i cili më së shpeshti bazohet në rishikimin e raporteve të strukturuara.


Teknologjia OLAP i referohet një lloj analize inteligjente dhe përfshin 12 parime:

1. Konceptuale paraqitje shumëdimensionale . Përdoruesi-analist e sheh botën e ndërmarrjes si natyrë shumëdimensionale, dhe në përputhje me rrethanat, modeli OLAP duhet të jetë shumëdimensional në thelbin e tij.

2. Transparenca. Arkitektura e një sistemi OLAP duhet të jetë e hapur, duke i lejuar përdoruesit, kudo që të jetë, të komunikojë duke përdorur një mjet analitik - klientin - me serverin.

3. Disponueshmëria. Përdoruesi i analistit OLAP duhet të jetë në gjendje të kryejë analiza bazuar në një skemë të përbashkët konceptuale që përmban të dhëna për mbarë ndërmarrjen në një bazë të dhënash relacionale, si dhe të dhëna nga bazat e të dhënave të trashëgimisë, metodat e zakonshme të aksesit dhe një model të përbashkët analitik. Një sistem OLAP duhet të aksesojë vetëm të dhënat që nevojiten në të vërtetë dhe jo t'i përdorë parim i përgjithshëm"gyp kuzhine", i cili përfshin të dhëna të panevojshme.

4. Performancë konsistente në zhvillimin e raportit. Ndërsa numri i dimensioneve ose madhësia e bazës së të dhënave rritet, analisti përdorues nuk duhet të pësojë një rënie të ndjeshme të performancës.

5. Arkitektura klient-server. Shumica e të dhënave që sot duhet t'i nënshtrohen përpunimit analitik në internet përmbahen në mainframe me akses në stacionet e punës të përdoruesve nëpërmjet LAN. Kjo do të thotë që produktet OLAP duhet të jenë në gjendje të punojnë në një mjedis klient-server.

6. Shumëdimensionale e përgjithshme. Çdo dimension duhet të zbatohet pa marrë parasysh strukturën dhe aftësitë e tij operacionale. Strukturat bazë të dhënat, formulat dhe formatet e raportimit nuk duhet të jenë të njëanshme ndaj ndonjë dimensioni të vetëm.

7. Menaxhimi dinamik i matricave të rralla. Dizajni fizik i një mjeti OLAP duhet të përshtatet plotësisht me modelin specifik analitik për menaxhimin optimal të matricave të rralla. Spariteti (i matur si përqindje qeliza boshe për të gjitha të mundshme) është një nga karakteristikat e shpërndarjes së të dhënave.

8. Mbështetje për shumë përdorues. Një mjet OLAP duhet të ofrojë aftësi ndarjen pyetja dhe plotësimi i përdoruesve-analistëve të shumtë duke ruajtur integritetin dhe sigurinë.

9. Operacione kryq të pakufizuar. Për shkak të natyrës së tyre hierarkike, operacione të ndryshme mund të përfaqësojnë marrëdhënie të varura në modelin OLAP, domethënë ato janë ndërfunksionale. Ekzekutimi i tyre nuk duhet të kërkojë që përdoruesi analitik të ripërcaktojë këto llogaritje dhe operacione.

10. Manipulim intuitiv i të dhënave. Pamja e përdoruesit analist për dimensionet e përcaktuara në modelin analitik duhet të përmbajë të gjitha informacionin e nevojshëm për të kryer veprime në modelin OLAP, d.m.th. ato nuk duhet të kërkojnë përdorimin e një sistemi menuje ose operacione të tjera të ndërfaqes së përdoruesit.

11. Opsione fleksibël marrjen e raporteve. Mjetet e raportimit duhet të jenë të dhëna të sintetizuara ose informacione që rezultojnë nga modeli i të dhënave në çdo orientim të mundshëm. Kjo do të thotë që rreshtat, kolonat ose faqet e raportit duhet të shfaqin dimensione të shumta të modelit OLAP në të njëjtën kohë, me aftësinë për të treguar çdo nëngrup të anëtarëve (vlerave) të përmbajtura në dimension, në çdo renditje.

12. Dimensioni dhe numri i pakufizuar i niveleve të grumbullimit. Hulumtimi për numrin e mundshëm matjet e nevojshme të kërkuara në modelin analitik, tregoi se deri në 19 dimensione mund të përdoren njëkohësisht nga analisti përdorues. Kjo çon në një rekomandim për numrin e dimensioneve të mbështetura nga sistemi OLAP. Për më tepër, secili nga dimensionet e përbashkëta nuk duhet të kufizohet në numrin e niveleve të grumbullimit të përcaktuara nga analisti përdorues.

Sistemet e specializuara OLAP që ofrohen aktualisht në treg përfshijnë CalliGraph dhe Business Intelligence.

Për të zgjidhur probleme të thjeshta të analizës së të dhënave është e mundur të përdoret zgjidhje buxhetore- zyrë aplikacionet Excel dhe Access nga Microsoft, të cilat përmbajnë mjetet bazë Teknologjitë OLAP që ju lejojnë të krijoni tabelat kryesore dhe mbi bazën e tyre ndërtoni raporte të ndryshme.

Sistemet e informacionit të një ndërmarrje serioze, si rregull, përmbajnë aplikacione të dizajnuara për analiza komplekse të të dhënave, dinamikën e tyre, tendencat, etj. Prandaj, menaxhmenti i lartë bëhet konsumatori kryesor i rezultateve të analizës. Një analizë e tillë synon përfundimisht të mbështesë vendimmarrjen. Dhe për të marrë ndonjë vendim drejtues, është e nevojshme të keni informacionin e nevojshëm, zakonisht sasior. Për ta bërë këtë, është e nevojshme të mblidhen këto të dhëna nga të gjitha sistemet e informacionit të ndërmarrjes, t'i sjellin ato në një format të përbashkët dhe vetëm atëherë t'i analizojnë ato. Për këtë qëllim, krijohen Depot e të Dhënave.

Çfarë është një depo e të dhënave?

Zakonisht - vendi ku mblidhen të gjitha informacionet me vlerë analitike. Kërkesat për dyqane të tilla korrespondojnë me përkufizimin klasik të OLAP dhe do të shpjegohen më poshtë.

Ndonjëherë Magazina ka një qëllim tjetër - integrimin e të gjitha të dhënave të ndërmarrjes, për të ruajtur integritetin dhe rëndësinë e informacionit brenda të gjitha sistemeve të informacionit. Se. depoja grumbullon jo vetëm informacionin analitik, por pothuajse të gjithë informacionin, dhe mund ta sigurojë atë në formën e drejtorive përsëri në sisteme të tjera.

Një depo tipike e të dhënave është zakonisht e ndryshme nga një bazë e të dhënave tipike relacionale. Së pari, bazat e të dhënave të rregullta janë krijuar për të ndihmuar përdoruesit të kryejnë punën e përditshme, ndërsa magazinat e të dhënave janë krijuar për vendimmarrje. Për shembull, shitja e mallrave dhe lëshimi i faturave kryhen duke përdorur një bazë të dhënash të krijuar për përpunimin e transaksioneve, dhe analiza e dinamikës së shitjeve gjatë disa viteve, e cila lejon planifikimin e punës me furnitorët, kryhet duke përdorur një depo të dhënash.

Së dyti, ndërsa bazat e të dhënave tradicionale janë subjekt i ndryshimeve të vazhdueshme ndërsa përdoruesit punojnë, depoja e të dhënave është relativisht e qëndrueshme: të dhënat në të zakonisht përditësohen sipas një orari (për shembull, javore, ditore ose për orë, në varësi të nevojave). Në mënyrë ideale, procesi i pasurimit është thjesht shtimi i të dhënave të reja gjatë një periudhe kohore pa ndryshuar informacionin e mëparshëm tashmë në depo.

Dhe së treti, bazat e të dhënave të rregullta janë më shpesh burimi i të dhënave që përfundojnë në magazinë. Përveç kësaj, magazinimi mund të rimbushet nga burimet e jashtme, për shembull raportet statistikore.

Si ndërtohet një depo?

ETLkoncepti bazë: Tre faza:
  • Nxjerrja - nxjerrja e të dhënave nga burime të jashtme në një format të kuptueshëm;
  • Transformimi - shndërrimi i strukturës së të dhënave burimore në struktura të përshtatshme për ndërtimin e një sistemi analitik;
Le të shtojmë një fazë tjetër - pastrimin e të dhënave ( Pastrimi) – procesi i filtrimit të të dhënave të parëndësishme ose korrigjimit të të dhënave të gabuara bazuar në metoda statistikore ose ekspertësh. Për të mos gjeneruar raporte si "Shitjet për 20011" më vonë.

Le të kthehemi te analiza.

Çfarë është analiza dhe pse është e nevojshme?

Analiza është studimi i të dhënave me qëllim të marrjes së vendimeve. Sistemet analitike quhen sisteme të mbështetjes së vendimeve ( DSS).

Këtu vlen të theksohet ndryshimi midis punës me DSS dhe një grupi të thjeshtë raportesh të rregulluara dhe të parregulluara. Analiza në DSS është pothuajse gjithmonë interaktive dhe përsëritëse. ato. analisti gërmon në të dhënat, duke kompozuar dhe rregulluar pyetje analitike dhe merr raporte, struktura e të cilave mund të jetë e panjohur paraprakisht. Ne do t'i kthehemi kësaj më në detaje më poshtë kur të diskutojmë gjuhën e pyetjes. MDX.

OLAP

Sistemet e mbështetjes së vendimeve zakonisht kanë mjetet për t'i siguruar përdoruesit të dhëna të përgjithshme për mostra të ndryshme nga grupi origjinal në një formë të përshtatshme për perceptim dhe analizë (tabela, grafiku, etj.). Qasja tradicionale për segmentimin e të dhënave burimore përfshin nxjerrjen nga të dhënat burimore një ose më shumë grupe të dhënash shumëdimensionale (shpesh të quajtur hiperkub ose metakub), boshtet e të cilave përmbajnë atribute dhe qelizat përmbajnë të dhëna sasiore të grumbulluara. (Të tilla të dhëna mund të ruhen edhe në tabela relacionale, por në këtë rast bëhet fjalë për organizimin logjik të të dhënave, dhe jo për zbatimin fizik të ruajtjes së tyre.) Përgjatë çdo boshti, atributet mund të organizohen në formën e hierarkive. që përfaqësojnë nivele të ndryshme të detajeve të tyre. Falë këtij modeli të dhënash, përdoruesit mund të formulojnë pyetje komplekse, të gjenerojnë raporte dhe të marrin nëngrupe të dhënash.

Teknologjia për analizën komplekse shumëdimensionale të të dhënave quhet OLAP (On-Line Analytical Processing). OLAP është një komponent kyç i ruajtjes tradicionale të të dhënave. Koncepti i OLAP u përshkrua në 1993 nga Edgar Codd, një studiues dhe autor i njohur i bazës së të dhënave. modeli relacional të dhëna. Në vitin 1995, bazuar në kërkesat e përcaktuara nga Codd, u formulua i ashtuquajturi test FASMI (Fast Analysis of Shared Multidimensional Information), duke përfshirë kërkesat e mëposhtme për aplikimet për analiza shumëdimensionale:

  • duke i ofruar përdoruesit rezultatet e analizës në një kohë të pranueshme (zakonisht jo më shumë se 5 s), edhe me koston e një analize më pak të detajuar;
  • aftësia për të kryer çdo analizë logjike dhe statistikore karakteristike të të këtij aplikacioni, dhe duke e mbajtur atë të aksesueshme për përdoruesi përfundimtar formë;
  • akses për shumë përdorues në të dhëna me mbështetje për mekanizmat e duhur të kyçjes dhe mjetet e autorizuara të aksesit;
  • paraqitje konceptuale shumëdimensionale e të dhënave, duke përfshirë mbështetje të plotë për hierarkitë dhe hierarkitë e shumëfishta (kjo është një kërkesë kryesore e OLAP);
  • aftësia për të hyrë në çdo informacion të nevojshëm, pavarësisht nga vëllimi dhe vendndodhja e tij e ruajtjes.
Duhet të theksohet se funksionaliteti OLAP mund të zbatohet menyra te ndryshme, duke filluar me mjetet më të thjeshta të analizës së të dhënave në aplikacionet e zyrës dhe duke përfunduar me të shpërndara sistemet analitike bazuar në produktet e serverit. ato. OLAP nuk është një teknologji, por ideologjisë.

Përpara se të flasim për implementimet e ndryshme OLAP, le të hedhim një vështrim më të afërt se çfarë janë kubet nga një këndvështrim logjik.

Konceptet shumëdimensionale

Ne do të përdorim bazën e të dhënave Northwind të përfshirë me Microsoft për të ilustruar parimet OLAP. SQL Server dhe e cila është një bazë të dhënash tipike që ruan informacion në lidhje me operacionet tregtare të një kompanie të angazhuar në furnizimin me shumicë të ushqimit. Të dhëna të tilla përfshijnë informacione për furnitorët, klientët, një listë të mallrave të furnizuar dhe kategoritë e tyre, të dhëna për porositë dhe mallrat e porositura, një listë të punonjësve të kompanisë.

Kub

Le të marrim për shembull tabelën Faturat1, e cila përmban porositë e kompanisë. Fushat në këtë tabelë do të jenë si më poshtë:
  • Data e porosisë
  • Nje vend
  • Qyteti
  • Emri i Klientit
  • Kompania e dërgesave
  • Emri i produktit
  • Sasia e mallit
  • Çmimi i porosisë
Çfarë të dhënash agregate mund të marrim nga kjo pikëpamje? Zakonisht këto janë përgjigje për pyetjet si:
  • Sa është vlera totale e porosive të bëra nga klientët nga një vend i caktuar?
  • Sa është vlera totale e porosive të bëra nga klientët në një vend të caktuar dhe të dorëzuara nga një kompani e caktuar?
  • Sa është vlera totale e porosive të bëra nga klientët në një vend të caktuar në një vit të caktuar dhe të dorëzuara nga një kompani e caktuar?
Të gjitha këto të dhëna mund të merren nga kjo tabelë duke përdorur pyetje mjaft të dukshme SQL me grupim.

Rezultati i kësaj pyetjeje do të jetë gjithmonë një kolonë numrash dhe një listë atributesh që e përshkruajnë atë (për shembull, vendi) - ky është një grup i të dhënave njëdimensionale ose, në gjuhën matematikore, një vektor.

Le të imagjinojmë se duhet të marrim informacion mbi koston totale të porosive nga të gjitha vendet dhe shpërndarjen e tyre midis kompanive të dërgesave - do të marrim një tabelë (matricë) numrash, ku kompanitë e dërgesave do të renditen në titujt e kolonës, vendet në rresht titujt, dhe në qeliza do të ketë sasi të porosive. kjo - grup dydimensional të dhëna. Ky grup i të dhënave quhet një tabelë kryesore ( Tabela strumbullar) ose tërthore.

Nëse duam të marrim të njëjtat të dhëna, por edhe sipas vitit, atëherë do të shfaqet një ndryshim tjetër, d.m.th. grupi i të dhënave do të bëhet tre-dimensionale (një tensor i kushtëzuar i rendit të tretë ose një "kub" 3-dimensional).

Natyrisht, numri maksimal i dimensioneve është numri i të gjitha atributeve (Data, Vendi, Klienti, etj.) që përshkruajnë të dhënat tona të grumbulluara (sasia e porosive, numri i produkteve, etj.).

Kështu arrijmë te koncepti i shumëdimensionalitetit dhe mishërimi i tij - kub shumëdimensional. Ne do ta quajmë një tabelë të tillë " tabela e fakteve" Dimensionet ose boshtet e kubit ( dimensionet) janë atribute, koordinatat e të cilave shprehen me vlerat individuale të këtyre atributeve të pranishme në tabelën e fakteve. ato. për shembull, nëse informacioni për porositë është ruajtur në sistem nga viti 2003 deri në vitin 2010, atëherë boshti i këtij viti do të përbëhet nga 8 pika përkatëse. Nëse porositë vijnë nga tre shtete, atëherë boshti i vendit do të përmbajë 3 pika, etj. Pavarësisht se sa vende janë të përfshira në drejtorinë e shteteve. Pikat në një bosht quhen "anëtarë" të tij ( Anëtarët).

Në këtë rast, vetë të dhënat e grumbulluara do të quhen "masa" ( Masa). Për të shmangur konfuzionin me "dimensionet", këto të fundit preferohet të quhen "akset". Grupi i masave formon një bosht tjetër "Masash" ( Masat). Ai ka aq anëtarë (pika) sa ka masa (kolona të grumbulluara) në tabelën e fakteve.

Anëtarët e dimensioneve ose boshteve mund të kombinohen nga një ose më shumë hierarki ( hierarkia). Le të shpjegojmë se çfarë është hierarkia me një shembull: qytetet nga rendet mund të bashkohen në rrethe, rrethe në rajone, rajone të një vendi, vendet në kontinente ose entitete të tjera. ato. ka një strukturë hierarkike - kontinent- vend-rajon-rreth-qytet- 5 nivele ( Niveli). Për një rajon, të dhënat grumbullohen për të gjitha qytetet që përfshihen në të. Për një rajon në të gjitha rrethet që përmbajnë të gjitha qytetet, etj. Pse na duhen hierarki të shumta? Për shembull, në boshtin e datës së rendit, mund të dëshirojmë të grupojmë pikat (d.m.th. ditët) në një hierarki Viti-Muaji-Dita ose nga Viti-Javë-Ditë: në të dyja rastet janë tre nivele. Natyrisht, ditët e grupit të javës dhe të muajit janë ndryshe. Ka edhe hierarki, numri i niveleve në të cilat nuk është përcaktues dhe varet nga të dhënat. Për shembull, dosjet në një disk kompjuteri.

Grumbullimi i të dhënave mund të ndodhë duke përdorur disa karakteristika standarde: shuma, minimumi, maksimumi, mesatarja, sasia.

MDX

Le të kalojmë te gjuha e pyetjes në të dhënat shumëdimensionale.
Gjuha SQL fillimisht nuk u krijua për programuesit, por për analistët (dhe për këtë arsye ka një sintaksë që i ngjan gjuhës natyrore). Por me kalimin e kohës ajo u bë gjithnjë e më e ndërlikuar dhe tani pak analistë dinë ta përdorin mirë, nëse fare. Është bërë një mjet për programuesit. Gjuha e pyetjeve MDX, e përfolur se ishte zhvilluar nga ish-bashkatdhetari ynë Mosha (ose Mosha) Posumansky në natyrën e Microsoft-it, fillimisht ishte synuar gjithashtu të synohej te analistët, por konceptet dhe sintaksa e saj (që në mënyrë të paqartë të kujton SQL, dhe krejtësisht kot, d.m.th sepse vetëm ngatërron), edhe më i ndërlikuar se SQL. Megjithatë, bazat e tij janë ende të lehta për t'u kuptuar.

Ne do ta shikojmë atë në detaje sepse është e vetmja gjuhë që ka marrë statusin standard brenda kornizës së standardit të përgjithshëm të protokollit XMLA, dhe së dyti sepse ka një zbatim të saj me kod të hapur në formën e projektit Mondrian nga kompania. Pentaho. Sistemet e tjera të analizës OLAP (për shembull, Oracle OLAP Option) zakonisht përdorin zgjerimet e tyre të sintaksës SQL, megjithatë, ata gjithashtu deklarojnë mbështetje për MDX.

Të punosh me grupe të dhënash analitike nënkupton vetëm leximin e tyre dhe nuk do të thotë t'i shkruash. Se. MDX nuk ka klauzola për ndryshimin e të dhënave, por vetëm një klauzolë përzgjedhëse - zgjidhni.

Në OLAP mund të bëni kube shumëdimensionale feta– d.m.th. kur të dhënat filtrohen përgjatë një ose më shumë akseve, ose projeksionet– kur kubi “shembet” përgjatë një ose më shumë akseve, duke grumbulluar të dhëna. Për shembull, shembulli ynë i parë me sasinë e porosive nga vendet është një projeksion i kubit në boshtin e vendit. Pyetja MDX për këtë rast do të duket kështu:

Zgjidhni ...Fëmijët në rreshta nga
Çfarë është këtu?

Zgjidhni– fjala kyçe përfshihet në sintaksë vetëm për bukurinë.
është emri i boshtit. Të gjithë emrat e duhur në MDX shkruhen në kllapa katrore.
është emri i hierarkisë. Në rastin tonë, kjo është hierarkia Vend-Qytet
– ky është emri i anëtarit të boshtit në nivelin e parë të hierarkisë (d.m.th. vendi) Të gjithë – ky është një meta-anëtar që bashkon të gjithë anëtarët e boshtit. Ekziston një meta-term i tillë në çdo bosht. Për shembull, në boshtin e vitit ka "Të gjitha vitet", etj.
Fëmijëtështë një funksion anëtar. Çdo anëtar ka disa funksione në dispozicion. Të tilla si Prindi. Niveli, Hierarkia, duke kthyer përkatësisht paraardhësin, nivelin në hierarki dhe vetë hierarkinë të cilës anëtari i përket në këtë rast. Fëmijët - Kthen një grup anëtarësh fëmijë të këtij anëtari. ato. në rastin tonë – vendet.
në rreshta– Tregon se si të renditen këto të dhëna në tabelën që rezulton. Në këtë rast - në kokën e rreshtave. Vlerat e mundshme këtu: në kolona, ​​në faqe, në paragrafë, etj. Është gjithashtu e mundur që thjesht të tregohet me indeks, duke filluar nga 0.
nga– ky është një tregues i kubit nga i cili është bërë përzgjedhja.

Po sikur të mos na duhen të gjitha vendet, por vetëm disa të veçanta? Për ta bërë këtë, ne mund të specifikojmë në mënyrë eksplicite në kërkesë vendet që na duhen, në vend që të zgjedhim gjithçka duke përdorur funksionin Fëmijët.

Zgjidhni ( ..., ... ) në rreshtat nga
Kllapat kaçurrelë në këtë rast janë deklarata e grupit ( Set). Një grup është një listë, një numërim i anëtarëve nga një aks.

Tani le të shkruajmë një pyetje për shembullin tonë të dytë - prodhimi në kontekstin e një personi dërgues:

Zgjidhni ...Fëmijët në rreshta .Anëtarët në kolona nga
Shtuar këtu:
– boshti;
.Anëtarët– një funksion boshti që kthen të gjitha termat në të. Hierarkia dhe niveli kanë të njëjtin funksion. Sepse Ekziston vetëm një hierarki në këtë bosht, atëherë treguesi i saj mund të hiqet, sepse niveli dhe hierarkia janë gjithashtu të njëjta, atëherë mund t'i shfaqni të gjithë anëtarët në një listë.

Unë mendoj se tashmë është e qartë se si mund ta vazhdojmë këtë me shembullin tonë të tretë me detaje për vit. Por le të mos stërvitemi sipas vitit, por të filtrohemi - d.m.th. ndërto një fetë Për ta bërë këtë, ne do të shkruajmë pyetjen e mëposhtme:

Zgjidhni ..Fëmijët në rreshta .Anëtarët në kolona nga ku (.)
Ku është filtrimi këtu?

ku- fjalë kyçe
është një anëtar i hierarkisë . Emri i plotë, duke përfshirë të gjitha termat, do të ishte: .. , por sepse Meqenëse emri i këtij anëtari është unik brenda boshtit, të gjitha sqarimet e ndërmjetme të emrit mund të hiqen.

Pse termi i datës është në kllapa? Kllapat janë një tufë ( dyfishtë). Një tup është një ose më shumë koordinata së bashku të ndryshme sëpata Për shembull, për të filtruar përgjatë dy boshteve njëherësh, në kllapa renditim dy terma nga të ndryshme matjet e ndara me presje. Kjo do të thotë, tuple përcakton një "fetë" të kubit (ose "filtrim", nëse një terminologji e tillë është më afër).

Tupleja përdoret për më shumë sesa thjesht filtrim. Tuples mund të jenë gjithashtu në titujt e rreshtave / kolonave / faqeve, etj.

Kjo është e nevojshme, për shembull, për të shfaqur rezultatin e një pyetje tre-dimensionale në një tabelë dy-dimensionale.

Zgjidhni ndërlidhjen (...Fëmijët, ..Fëmijët) në rreshta .Anëtarët në kolona nga ku (.)
Bashkim kryqëzorështë një funksion. Ai kthen një grup tuplesh (po, një grup mund të përmbajë tuples!) që rezultojnë nga produkti kartezian i dy grupeve. ato. grupi që rezulton do të përmbajë të gjitha kombinimet e mundshme të vendeve dhe viteve. Kështu, titujt e rreshtave do të përmbajnë një palë vlerash: Vendi-Viti.

Pyetja është, ku është treguesi se cilat karakteristika numerike duhet të shfaqen? Në këtë rast, përdoret masa e paracaktuar e përcaktuar për këtë kub, d.m.th. Çmimi i porosisë. Nëse duam të nxjerrim një masë tjetër, atëherë kujtojmë se masat janë anëtarë të një dimensioni Masat. Dhe ne veprojmë saktësisht në të njëjtën mënyrë si me akset e tjera. ato. filtrimi i një pyetësori sipas njërës prej masave do të shfaqë pikërisht këtë masë në qeliza.

Pyetje: Cili është ndryshimi midis filtrimit në ku dhe filtrimit duke specifikuar anëtarët e boshtit në rreshta. Përgjigje: praktikisht asgjë. Thjesht aty ku tregohet një pjesë për ato akse që nuk marrin pjesë në formimin e titujve. ato. të njëjtin aks nuk mundet të jetë i pranishëm në të njëjtën kohë në rreshta, dhe ne ku.

Anëtarët e llogaritur

Për pyetje më komplekse, mund të deklaroni anëtarë të llogaritur. Anëtarët e boshteve të atributit dhe të masës. ato. Ju mund të shpallni, për shembull, një masë të re që do të pasqyronte kontributin e secilit vend shuma totale porosit:

Me anëtar. si '.CurrentAmber / ..', FORMAT_STRING='0,00%' zgjidhni ...Fëmijët në rreshtat nga ku .
Llogaritja ndodh në kontekstin e një qelize në të cilën njihen të gjitha atributet e saj koordinative. Koordinatat (anëtarët) përkatës mund të merren nga funksioni CurrentMember për secilin prej boshteve të kubit. Këtu duhet të kuptojmë se shprehja .Anëtari aktual/..’ nuk ndan një term me një tjetër, por ndan të dhënat përkatëse të grumbulluara feta kubike! ato. feta për territorin aktual do të ndahet në një fetë për të gjitha territoret, d.m.th. vlera totale e të gjitha porosive. FORMAT_STRING – vendos formatin për shfaqjen e vlerave, d.m.th. %.

Një shembull tjetër i një anëtari të llogaritur, por në boshtin e viteve:

Me anëtar. si '. -.'
Natyrisht, raporti nuk do të përmbajë një njësi, por dallimin e seksioneve përkatëse, d.m.th. diferenca në sasinë e porosive në këto dy vite.

Shfaq në ROLAP

Sistemet OLAP bazohen në një mënyrë ose në një tjetër në një lloj sistemi të ruajtjes dhe organizimit të të dhënave. Kur flasim për RDBMS, flasim për ROLAP (do të lëmë MOLAP dhe HOLAP për vete studim). ROLAP – OLAP në një bazë të dhënash relacionale, d.m.th. të përshkruara në formën e tabelave të zakonshme dydimensionale. Sistemet ROLAP konvertojnë pyetjet MDX në SQL. Problemi kryesor i llogaritjes për bazat e të dhënave është grumbullimi i shpejtë. Për t'u grumbulluar më shpejt, të dhënat në bazën e të dhënave zakonisht janë shumë të denormalizuara, d.m.th. nuk ruhen në mënyrë shumë efikase për sa i përket hapësirës së zënë në disk dhe monitorimit të integritetit të bazës së të dhënave. Plus, ato përmbajnë gjithashtu tabela ndihmëse që ruajnë të dhëna pjesërisht të grumbulluara. Prandaj, për OLAP, zakonisht krijohet një skemë e veçantë e bazës së të dhënave, e cila vetëm pjesërisht përsërit strukturën e bazave të të dhënave origjinale të transaksioneve për sa i përket drejtorive.

Navigimi

Shumë sisteme OLAP ofrojnë mjete lundrimi interaktive për një pyetje të krijuar tashmë (dhe të dhëna të zgjedhura në përputhje me rrethanat). Në këtë rast, përdoret i ashtuquajturi "shpim" ose "shpim". Një përkthim më adekuat në rusisht do të ishte fjala "thellim". Por kjo është çështje shije, në disa mjedise ka ngelur fjala “shpim”.

Stërvitja– ky është detajimi i raportit duke reduktuar shkallën e grumbullimit të të dhënave, të kombinuara me filtrimin përgjatë disa akseve të tjera (ose disa akseve). Ekzistojnë disa lloje të shpimit:

  • shpim-poshtë– filtrim sipas një prej boshteve burimore të raportit me dalje informacion i detajuar nga pasardhësit brenda hierarkisë së anëtarit të filtrit të zgjedhur. Për shembull, nëse ka një raport mbi shpërndarjen e porosive të ndara sipas vendeve dhe viteve, atëherë duke klikuar në vitin 2007 do të shfaqet një raport i ndarë sipas të njëjtave vende dhe muaj të 2007-ës.
  • ana e shpimit– filtrimi nën një ose më shumë akse të zgjedhura dhe heqja e grumbullimit përgjatë një ose më shumë akseve të tjera. Për shembull, nëse ka një raport mbi shpërndarjen e porosive të ndara sipas vendeve dhe viteve, atëherë duke klikuar në vitin 2007 do të shfaqet një raport tjetër i ndarë, për shembull, sipas vendeve dhe furnizuesve me filtrim deri në vitin 2007.
  • shpuese– heqja e grumbullimit përgjatë të gjitha akseve dhe filtrimi i njëkohshëm përgjatë tyre – ju lejon të shihni të dhënat burimore nga tabela e fakteve nga e cila është marrë vlera në raport. ato. Kur klikoni mbi një vlerë qelize, shfaqet një raport me të gjitha porositë që kanë dhënë këtë shumë. Një lloj shpimi i menjëhershëm në vetë "thellësitë" e kubit.
Kjo eshte e gjitha. Tani, nëse vendosni t'i përkushtoheni Business Intelligence dhe OLAP, është koha të filloni të lexoni literaturë serioze.

Etiketa:

  • OLAP
  • Mondrian
  • Inteligjenca e Biznesit
  • MDX
Shto etiketa

Pasi të dhënat të merren, pastrohen, sillen në një formë të vetme dhe vendosen në ruajtje, ato duhet të analizohen. Për këtë qëllim përdoret teknologjia OLAP.

Dymbëdhjetë parimet përcaktuese të OLAP u formuluan në 1993 nga E. F. Codd, "shpikësi" i bazave të të dhënave relacionale. OLAP është Përpunimi Analitik OnLine, domethënë analiza operacionale e të dhënave. Përkufizimi i Codd u zhvillua më vonë në të ashtuquajturin test FASMI (Fast Analysis of Shared Multidimensional Information), i cili kërkon që aplikacioni OLAP të sigurojë mundësitë e mëposhtme analiza e shpejtë e informacionit shumëdimensional të përbashkët: shpejtësi e lartë; analiza; ndarja e aksesit; shumëdimensionale; duke punuar me informacione...

Shpejtësi e lartë. Analiza duhet të kryhet po aq shpejt në të gjitha aspektet e informacionit. Në këtë rast, koha e pranueshme e përgjigjes nuk është më shumë se 5 sekonda.

Analiza. Duhet të jetë e mundur të kryhen lloje bazë të analizave numerike dhe statistikore - ose të paracaktuara nga zhvilluesi i aplikacionit ose të përcaktuara lirisht nga përdoruesi.

Qasja ndaj ndarjes. Qasja në të dhëna duhet të jetë me shumë përdorues dhe qasja në informacione konfidenciale duhet të kontrollohet.

Shumëdimensionale. Karakteristika kryesore, më thelbësore e OLAP.

Puna me informacion. Aplikacioni duhet të jetë në gjendje të aksesojë çdo informacion të nevojshëm, pavarësisht vëllimit dhe vendndodhjes së tij të ruajtjes.

Paraqitje shumëdimensionale. OLAP u ofron organizatave më të përshtatshmet dhe mjetet juridike të shpejta aksesoni, shikoni dhe analizoni informacionin e biznesit. Më e rëndësishmja, OLAP i ofron përdoruesit një model të dhënash natyrale, intuitive, duke e organizuar atë në kube shumëdimensionale. Akset (dimensionet) sistem shumëdimensional Koordinatat janë atributet kryesore të procesit të analizuar të biznesit. Për shembull, për një proces shitjeje, kjo mund të jetë një kategori produkti, rajon ose lloj blerësi. Koha përdoret pothuajse gjithmonë si një nga dimensionet. Brenda kubit ka të dhëna që karakterizojnë në mënyrë sasiore procesin - të ashtuquajturat Masa. Këto mund të jenë vëllime të shitjeve në copa ose në terma monetarë, bilancet e aksioneve, kostot, etj. Një përdorues që analizon informacionin mund të "presë" një kub në drejtime të ndryshme, merrni të dhëna përmbledhëse (për shembull, sipas vitit) ose, anasjelltas, të detajuara (për javë) dhe kryeni operacione të tjera që janë të nevojshme për analizë.

Ruajtja e të dhënave OLAP . Para së gjithash, duhet thënë se meqenëse analisti operon gjithmonë me disa të dhëna përmbledhëse (dhe jo të detajuara), bazat e të dhënave OLAP pothuajse gjithmonë ruajnë, së bashku me të dhënat e detajuara, të ashtuquajturat agregate, domethënë tregues përmbledhës të parallogaritur. Shembujt e agregateve përfshijnë vëllimin total të shitjeve për vitin ose bilancin mesatar të mallrave në magazinë. Ruajtja e grumbullimeve të parallogaritura është mënyra kryesore për të përmirësuar shpejtësinë e pyetjeve OLAP.


Megjithatë, ndërtimi i agregateve mund të çojë në një rritje të konsiderueshme në madhësinë e bazës së të dhënave.

Një problem tjetër me ruajtjen e të dhënave OLAP është pakësia e të dhënave shumëdimensionale. Për shembull, nëse nuk ka pasur shitje në një rajon të caktuar në vitin 2000, atëherë nuk do të ketë vlerë në kryqëzimin e dimensioneve përkatëse të kubit. Nëse serveri OLAP ruan një vlerë të caktuar që mungon në këtë rast, atëherë nëse të dhënat janë dukshëm të pakta, numri i qelizave boshe (të cilat megjithatë kërkojnë hapësirë ​​ruajtëse) mund të jetë shumë herë më i madh se numri i atyre të mbushura, dhe si rezultat, vëllimi i përgjithshëm do të rritet në mënyrë të pajustifikueshme. Zgjidhjet e ofruara për këtë nga Microsoft, janë dhënë më poshtë.

Llojet e OLAP. Më poshtë mund të përdoren për të ruajtur të dhënat OLAP:

DBMS speciale shumëdimensionale (serverët OLAP). Në këtë rast ata flasin për MOLAP (OLAP shumëdimensionale). Kur ekzekutohen pyetje komplekse që analizojnë të dhënat në dimensione të shumta, DBMS-të shumëdimensionale ofrojnë performancë më të mirë se ato relacionale. Në të njëjtën kohë, shpejtësia e ekzekutimit të pyetjes nuk varet nga cili dimension është bërë "feta" e kubit shumëdimensional.

DBMS relacionale tradicionale - ROLAP (OLAP relacionale). Përdorimi i strukturave të veçanta të të dhënave - skemave të yjeve dhe flokeve të borës, si dhe ruajtja e agregateve të llogaritura, bën të mundur analizën shumëdimensionale të të dhënave relacionale. DBMS-të relacionale kanë qenë historikisht më të zakonshme dhe në to janë bërë investime të konsiderueshme, kështu që tani për tani ROLAP është më i zakonshëm.

Opsioni i kombinuar - HOLAP (Hybrid OLAP), duke kombinuar të dy llojet e DBMS. Një opsion për kombinimin e dy llojeve të DBMS është ruajtja e agregateve në një DBMS shumëdimensionale dhe të dhënat e detajuara (që kanë vëllimin më të madh) në një relacional.

Microsoft ofron mjetet e mëposhtme të analizës OLAP:

Microsoft SQL Server 7.0 përfshin një server OLAP me funksione të plota - Shërbimet OLAP të Serverit SQL. Serveri, natyrisht, është krijuar për t'u shërbyer kërkesave të klientit, dhe kjo kërkon një protokoll të caktuar ndërveprimi dhe një gjuhë pyetjesh. Për shembull, për ndërveprimin e klientit me një server DBMS relacional - SQL Server - përdoren protokollet dhe gjuha ODBC ose OLE DB Pyetjet SQL. Për të hyrë në serverin OLAP, Microsoft zhvilloi OLE DB për protokollin OLAP dhe një gjuhë pyetjesh për të dhënat shumëdimensionale - MDX (shprehje shumëdimensionale). Ashtu si një shtresë e objekteve ADO (ActiveX Data Objects) u zhvillua mbi OLE DB për thjeshtësi dhe lehtësi, ADO MD (Multidimensional ADO) u ndërtua mbi OLE DB për OLAP.

Mjetet e analizës së të dhënave në Microsoft Office 2000. Microsoft Excel 2000 përmban një mekanizëm të ri të tabelës kryesore - OLAP PivotTable, i cili zëvendësoi mekanizmin me të njëjtin emër në versionet e mëparshme. Së bashku me aftësitë e mëparshme për analizimin e të dhënave relacionale, motori PivotTable tani përfshin aftësi për të analizuar të dhënat OLAP, domethënë vepron si një klient OLAP. Microsoft SQL Server 7.0 mund të përdoret si server, si dhe çdo produkt që mbështet ndërfaqen OLE DB për OLAP. Mekanizmi përmbledhës Tabelat Excel V në mënyrë të plotë mbështet aftësitë e ofruara nga Shërbimet e Tabelës Pivot (PTS) të përshkruara më sipër. Kështu, të dhënat e analizuara OLAP mund të vendosen si në kube lokale ashtu edhe në serverin OLAP.

Microsoft Office 2000 përmban gjithashtu një grup komponentësh ActiveX të quajtur Komponentët e Uebit të Office 2000, të cilat ju lejojnë të organizoni analizën e të dhënave OLAP duke përdorur Shfletimi në ueb. Këto përfshijnë katër komponentët e mëposhtëm:

Fletëllogaritëse- zbaton funksionalitet të kufizuar Fletë Excel.

Tabela strumbullar- “binjak” i tabelave kryesore të Excel; mund të punojë me të dhënat e Shërbimeve OLAP.

Grafiku- ju lejon të ndërtoni diagrame bazuar në të dhënat relacionale dhe OLAP.

Burim i të dhënave- një komponent shërbimi për lidhjen e komponentëve të tjerë me burimin e të dhënave.

Kur punoni me të dhënat OLAP, Komponentët e Uebit hyjnë në Shërbimet e Tabelës Pivot.

5.5. TEKNOLOGJIA E ANALIZËS “DATAMINING”

Shfaqja e teknologjisë Data Mining shoqërohet me nevojën për të nxjerrë njohuri nga të dhënat heterogjene të grumbulluara nga sistemet e informacionit. U ngrit një koncept që në rusisht filloi të quhej "nxjerrja", "nxjerrja" e njohurive. Termi “Data Mining” është vendosur jashtë vendit.

Metodat e përdorura gjerësisht të statistikave matematikore rezultuan të ishin të dobishme kryesisht për testimin e hipotezave të para-formuluara (minimi i të dhënave të drejtuara nga verifikimi) dhe për analizën "e përafërt" eksploruese, e cila përbën bazën e përpunimit analitik në internet (OLAP).

Avantazhi kryesor "Minhja e të dhënave" krahasuar me metodat e mëparshme - aftësia për të gjeneruar automatikisht hipoteza për marrëdhëniet ndërmjet parametra të ndryshëm ose komponentët e të dhënave. Puna e një analisti kur punon me një paketë tradicionale të përpunimit të të dhënave në fakt zbret në testimin ose sqarimin e një ose dy hipotezave të krijuara prej tij. Në rastet kur nuk ka supozime fillestare dhe sasia e të dhënave është e rëndësishme, sistemet ekzistuese humbasin aftësinë e tyre për të punuar dhe kthehen në humbje kohe për analistin.

Nje tjeter tipar i rëndësishëm Sistemet e minierës së të dhënave aftësia për të përpunuar pyetje shumëdimensionale dhe për të kërkuar varësi shumëdimensionale. Gjithashtu unike është aftësia sistemet e të dhënave minierat zbulojnë automatikisht situata të jashtëzakonshme– d.m.th. elementet e të dhënave që "bien jashtë" nga modelet e përgjithshme.

Ekzistojnë pesë lloje standarde të modeleve që ju lejojnë të identifikoni metodat e marrjes së të dhënave

shoqata

pasues

klasifikimi

grumbullimi

parashikimi

Kërkimi i modeleve kryhet duke përdorur metoda që nuk kufizohen nga supozimet apriori në lidhje me strukturën e mostrës dhe llojin e shpërndarjeve të vlerave të treguesve të analizuar. Shembuj detyrash për një kërkim të tillë kur duke përdorur të dhënat Minierat janë dhënë në tabelën 1.

Tabela 1 - Krahasimi i formulimeve të problemit gjatë përdorimit të metodave OLAP dhe Data Mining

Për të zgjidhur problemet analitike që lidhen me llogaritjet komplekse, parashikimi, modelimi i skenarëve “What if...”, përdoret teknologjia e analizës shumëdimensionale të të dhënave - Teknologjia OLAP. Koncepti i OLAP u përshkrua për herë të parë në 1993 nga Edgar Codd, një studiues i famshëm i bazës së të dhënave dhe autor i modelit të të dhënave relacionale, në librin "OLAP për analistët e përdoruesve: Çfarë duhet të jetë", ku ai përshkroi 12 ligje të përpunimit analitik të të dhënave. sipas të cilit produktet e zhvilluesve OLAP jetojnë edhe sot:

1. Paraqitja konceptuale shumëdimensionale e të dhënave.

2. Transparenca (qasje transparente në të dhënat e jashtme për përdoruesin, duke e lejuar atë, kudo që të jetë, të komunikojë me serverin duke përdorur një mjet analitik).

3. Disponueshmëria dhe detajet e të dhënave.

4. Performanca e qëndrueshme gjatë zhvillimit të raporteve (Nëse numri i dimensioneve ose madhësia e bazës së të dhënave rritet, analisti përdorues nuk duhet të pësojë ulje të performancës).

5. Arkitektura klient-server (OLAP i aksesueshëm nga desktopi).

6. Shumëdimensionale e përgjithshme.

7. Kontroll dinamik i matricave të rralla.

8. Mbështetje me shumë përdorues. Ndodh shpesh që disa përdorues analitikë të ndjejnë nevojën të punojnë së bashku me një model analitik ose të krijojnë modele të ndryshme nga të njëjtat të dhëna. Dhe mjeti OLAP duhet të ofrojë ndarje (pyetje dhe plotësim), integritet dhe aftësi sigurie.

9. Operacione kryq të pakufizuar.

10. Manipulim intuitiv i të dhënave.

11. Opsione fleksibël për marrjen e raporteve.

12. Dimensioni dhe numri i pakufizuar i niveleve të grumbullimit (mjeti analitik duhet të sigurojë të paktën 15 dimensione njëkohësisht, dhe mundësisht 20).

Disavantazhet e raporteve konvencionale për një menaxher janë të dukshme: menaxheri nuk ka kohë të zgjedhë numrat e interesit nga raporti, veçanërisht pasi mund të ketë shumë prej tyre. Kompleksiteti i raporteve për të kuptuar dhe shqetësimi i punës me to çuan në nevojën për të krijuar një koncept të ri për të punuar me të dhënat.

Kur një analist duhet të marrë informacion, ai, në mënyrë të pavarur ose me ndihmën e një programuesi, bën pyetjen e duhur SQL në bazën e të dhënave dhe merr të dhënat që i interesojnë në formën e një raporti. Raportet mund të ndërtohen sipas kërkesës ose pas arritjes së ngjarjeve ose kohëve të caktuara. Kjo ngre shumë probleme. Para së gjithash, analisti më shpesh nuk ka aftësi programimi të nivelit të lartë dhe nuk mund të zbatojë në mënyrë të pavarur një pyetje SQL në bazën e të dhënave. Për më tepër, analistit i nevojitet jo vetëm një raport, por shumë prej tyre në kohë reale. Programuesit, të cilët mund të kryejnë lehtësisht çdo pyetje në bazën e të dhënave, edhe nëse e ndihmojnë atë, nuk do të jenë gjatë gjithë kohës, sepse edhe ata kanë punën e tyre. Kërkesat masive në serverin e bazës së të dhënave komplikojnë punën e atyre punonjësve të kompanisë që vazhdimisht punojnë me bazat e të dhënave.

Koncepti i OLAP u shfaq pikërisht për të zgjidhur probleme të tilla. OLAP (O n L ine A nalitike P procesimi) është përpunimi analitik operacional i vëllimeve të mëdha të të dhënave në kohë reale. Qëllimi i sistemeve OLAP është të lehtësojë zgjidhjen e problemeve të analizimit të vëllimeve të mëdha të të dhënave dhe përpunimit të shpejtë të pyetjeve komplekse të bazës së të dhënave.

OLAP është:

    jo një produkt softuerësh

    jo një gjuhë programimi

    jo teknologji

OLAP është një grup konceptesh, parimesh dhe kërkesash që e bëjnë më të lehtë për analistët aksesin e të dhënave. Është një mjet për analizën dinamike shumëdimensionale të vëllimeve të mëdha të të dhënave në kohë reale.

Detyra e analistit është të gjejë modele në sasi të mëdha të dhënash. Analisti nuk do t'i kushtojë vëmendje një fakti të vetëm, ai ka nevojë për informacione për disa dhjetëra ngjarje të ngjashme. Faktet e vetme në bazën e të dhënave janë me interes, për shembull, për një kontabilist ose punonjës të departamentit të shitjeve që është përgjegjës për transaksionin. Për një analist, një rekord nuk është i mjaftueshëm - ai, për shembull, mund të ketë nevojë për të gjitha transaksionet e një dege ose zyre përfaqësuese të caktuar për një muaj ose një vit. Në të njëjtën kohë, analisti hedh poshtë detaje të panevojshme si numrin e identifikimit tatimor të blerësit, adresën dhe numrin e telefonit të tij të saktë, indeksin e kontratës dhe të ngjashme. Në të njëjtën kohë, të dhënat që kërkon një analist për punën e tij domosdoshmërisht përmbajnë vlera numerike - kjo është për shkak të vetë thelbit të veprimtarisë së tij.

Një grup të dhënash shumëdimensionale shpesh paraqitet si një kub OLAP (shih Fig. 26). Akset e një kubi OLAP përmbajnë parametra dhe qelizat përmbajnë të dhëna agregate që varen prej tyre.

Oriz. 26OLAP - kub

Kubet OLAP janë në thelb raporte meta. Përparësitë e kubeve janë të dukshme - të dhënat duhet të kërkohen nga baza e të dhënave vetëm një herë - kur ndërtohet një kub. Meqenëse analistët, si rregull, nuk punojnë me informacione që plotësohen dhe ndryshohen në fluturim, kubi i krijuar është i rëndësishëm për një kohë mjaft të gjatë. Falë kësaj, jo vetëm që eliminohen ndërprerjet në funksionimin e serverit të bazës së të dhënave (nuk ka pyetje me mijëra e miliona linja përgjigjeje), por shpejtësia e aksesit në të dhëna për vetë analistin gjithashtu rritet ndjeshëm.

Por ka gjithashtu një pengesë domethënëse: një kub OLAP mund të zërë dhjetëra apo edhe qindra herë më shumë hapësirë ​​se të dhënat origjinale.

OLAP - një kub nuk duhet të jetë tre-dimensionale. Mund të jetë dy-dimensionale dhe shumëdimensionale - në varësi të problemit që zgjidhet. Analistët mund të kenë nevojë për më shumë se 20 dimensione, produkte serioze OLAP janë krijuar vetëm për këtë shumë. Aplikacionet më të thjeshta të desktopit mbështesin një maksimum prej 6 dimensionesh.

Jo të gjithë elementët e kubit duhet të plotësohen: nëse mungon ndonjë informacion, vlera në qelizën përkatëse thjesht nuk do të përcaktohet për të. Gjithashtu nuk është aspak e nevojshme që një aplikacion OLAP domosdoshmërisht të ruajë të dhënat në një strukturë shumëdimensionale - gjëja kryesore është që këto të dhëna të duken pikërisht kështu për përdoruesit.

Kubi OLAP mund të mbushet me të dhëna reale nga sistemet operative dhe të dhëna parashikimi bazuar në të dhënat historike. Dimensionet e një hiperkubi mund të jenë komplekse, hierarkike dhe mund të vendosen marrëdhënie midis tyre. Gjatë procesit të analizës, përdoruesi mund të ndryshojë këndvështrimin mbi të dhënat (i ashtuquajturi operacioni i ndryshimit të pamjes logjike), duke parë kështu të dhënat nga këndvështrime të ndryshme dhe duke zgjidhur probleme specifike. Operacione të ndryshme mund të kryhen në kube, duke përfshirë parashikimin dhe planifikimin e kushtëzuar (çka-nëse analiza).

Një kub tredimensional mund të përshkruhet dhe vizualizohet lehtësisht. Sidoqoftë, është pothuajse e pamundur të imagjinohet ose të përshkruhet në mënyrë adekuate një kub gjashtë ose njëzet-dimensional. Prandaj, para përdorimit, tabelat e zakonshme dydimensionale nxirren nga kubi shumëdimensional, d.m.th. sikur “i prenë” përmasat e kubit sipas shenjave. Duke prerë kubet OLAP sipas dimensioneve, analisti në të vërtetë merr "raportet e zakonshme dy-dimensionale" me interes për të (jo domosdoshmërisht raporte në kuptimin e zakonshëm të termit - ne po flasim për struktura të dhënash me të njëjtat funksione). Ky operacion quhet "prerja" e kubit. Në këtë mënyrë, analisti merr një fetë dydimensionale të kubit dhe punon me të. Seksionet e nevojshme janë raporte.

Duke ndërvepruar me sistemin OLAP, përdoruesi mund të kryejë shikim fleksibël të informacionit, të marrë pjesë arbitrare të të dhënave dhe të kryejë operacione analitike të detajimit, konvolucionit, shpërndarjes nga skaji në skaj, krahasimit me kalimin e kohës (shih Fig. 27).

Oriz. 27 Pmarrjen e pjesëve arbitrare të të dhënave duke përdorurprerja e një kubi OLAP.

Klasifikimi i produkteve OLAP

Operacionet mbi të dhënat kryhen nga një motor OLAP. Produktet OLAP klasifikohen sipas metodës së ruajtjes së të dhënave dhe vendndodhjes së motorit OLAP.

Bazuar në mënyrën e ruajtjes së të dhënave, ato ndahen në tre kategori: MOLAP, ROLAP dhe HOLAP:

    MOLAP - të dhënat burimore dhe të përgjithshme ruhen në baza e të dhënave shumëdimensionale ose në një kub lokal shumëdimensional.

    ROLAP - të dhënat burimore ruhen në baza e të dhënave relacionale ose në tabela lokale të sheshta në serverin e skedarëve. Të dhënat e përmbledhura mund të vendosen në tabelat e shërbimit në të njëjtën bazë të dhënash. Shndërrimi i të dhënave nga një bazë të dhënash relacionale në kube shumëdimensionale ndodh me kërkesë të një mjeti OLAP.

    HOLAP - të dhënat origjinale mbeten në baza e të dhënave relacionale, dhe të dhënat agregate vendosen në baza e të dhënave shumëdimensionale. Një kub OLAP ndërtohet me kërkesë të një vegle OLAP bazuar në të dhëna relacionale dhe shumëdimensionale.

Bazuar në vendndodhjen e motorit OLAP, mund të dallohen dy klasa kryesore të produkteve OLAP: serveri OLAP dhe klienti OLAP.

Serveri OLAP merr një kërkesë, llogarit dhe ruan të dhënat agregate në server, duke i dhënë aplikacionit të klientit të instaluar në kompjuterin e klientit vetëm rezultatet e pyetjeve në kube shumëdimensionale që ruhen në server. Shumë serverë modernë OLAP mbështesin të tre metodat e ruajtjes së të dhënave: MOLAP, ROLAP dhe HOLAP.

Klienti OLAP ndërton një kub shumëdimensional dhe llogaritjet OLAP jo në një server të veçantë, por në vetë kompjuterin e klientit të përdoruesit. Klientët OLAP ndahen gjithashtu në ROLAP dhe MOLAP.

Dihet se një server OLAP mund të përpunojë sasi më të mëdha të dhënash sesa një klient OLAP me fuqi të barabartë kompjuteri. Kjo është për shkak se serveri OLAP ruan hard disqet një bazë të dhënash shumëdimensionale që përmban kube të llogaritura paraprakisht. Programet e klientëve bëjnë kërkesa në server, duke marrë kubin dhe fragmentet e tij. Karakteristikat e shpejtësisë së një serveri OLAP janë më pak të ndjeshme ndaj rritjes së të dhënave.

Klienti OLAP duhet të ketë të gjithë kubin në RAM në momentin e funksionimit. Prandaj, sasia e të dhënave të përpunuara nga një klient OLAP varet drejtpërdrejt nga sasia e RAM-it në kompjuterin e përdoruesit. Klienti OLAP gjeneron një pyetje në bazën e të dhënave, e cila përshkruan kushtet e filtrimit dhe algoritmin për grupimin paraprak të të dhënave primare. Serveri gjen, grupon regjistrimet dhe kthen një përzgjedhje kompakte për llogaritjet e mëtejshme OLAP. Madhësia e këtij kampioni mund të jetë dhjetëra ose qindra herë më e vogël se vëllimi i regjistrimeve parësore, jo të grumbulluara. Rrjedhimisht, nevoja për një klient të tillë OLAP në burimet kompjuterike është zvogëluar ndjeshëm.

Serveri OLAP paraqet kerkesa minimale për fuqinë e kompjuterëve të klientëve. Kërkesat e klientit OLAP janë më të larta, sepse... ai kryen llogaritjet në RAM-in e tij. Nëse fuqia e kompjuterëve të klientit është e ulët, klienti OLAP do të funksionojë ngadalë ose nuk do të jetë në gjendje të punojë fare. Blerja e një serveri të fuqishëm mund të jetë më e lirë se sa të përmirësoni të gjithë kompjuterët tuaj.

Kostoja e një serveri OLAP është mjaft e lartë, dhe zbatimi dhe mirëmbajtja e një serveri OLAP kërkon personel shumë të kualifikuar. Kostoja e një klienti OLAP është një rend i madhësisë më i ulët se kostoja e një serveri OLAP.

Me prezantimin e OLAP, produktiviteti dhe efikasiteti i menaxhimit të ndërmarrjes rritet ndjeshëm. Personi kryesor në procesin e analizës së të dhënave është ekspert– specialist i lëndës. Eksperti parashtron hipoteza (supozime) dhe, për t'i analizuar ato, ose shikon disa mostra në mënyra të ndryshme, ose ndërton modele për të testuar besueshmërinë e hipotezave.

Mjetet analitike lejojnë përdoruesin përfundimtar, i cili nuk ka njohuri të veçanta IT, të punojë me vëllime të mëdha të dhënash. Qëllimi i sistemeve analitike të biznesit: të mbështesë vendimmarrjen në të gjitha nivelet e menaxhimit të ndërmarrjes.

Sistemet analitike niveli operacional të sigurojë menaxhimin e ndërmarrjes në "mënyrë operacionale", d.m.th. zbatimin e një programi specifik prodhimi. Sistemet analitike nivel strategjik ndihmoni menaxhmentin e ndërmarrjes të zhvillojë vendime në "modalitetin e zhvillimit". Sistemet e menaxhimit strategjik janë sisteme informacioni analitik që mbështesin vendimet detyrat kryesore menaxhimin strategjik të kompanisë.

Shumë artikuj mbi OLAP mund të lexohen në faqen e internetit: http://www.olap.ru/basic/oolap.asp

Ndoshta për disa, përdorimi i teknologjisë OLAP (Përpunimi analitik në linjë) gjatë krijimit të raporteve do të duket disi ekzotik, kështu që përdorimi i OLAP-CUBE për ta nuk është aspak një nga kërkesat më të rëndësishme kur automatizon buxhetimin dhe kontabilitetin e menaxhimit.

Në fakt, është shumë i përshtatshëm për të përdorur një CUBE shumëdimensionale kur punoni me raportimin e menaxhimit. Kur zhvilloni formate buxhetore, mund të hasni problemin e formave me shumë variacione (mund të lexoni më shumë për këtë në Librin 8, "Teknologjia për vendosjen e buxhetimit në një kompani" dhe në librin "Konfigurimi dhe automatizimi i kontabilitetit të menaxhimit").

Kjo për faktin se menaxhimi efektiv i një kompanie kërkon raportim gjithnjë e më të detajuar të menaxhimit. Kjo do të thotë, sistemi përdor gjithnjë e më shumë seksione të ndryshme analitike (në sistemet e informacionit analitika përkufizohet nga një grup librash referencë).

Natyrisht, kjo çon në faktin se menaxherët duan të marrin raporte në të gjitha seksionet analitike që u interesojnë. Kjo do të thotë që raportet duhet të bëhen për të "marrë frymë" disi. Me fjalë të tjera, mund të themi se në këtë rast bëhet fjalë për faktin se i njëjti raport duhet të japë informacion në aspekte të ndryshme analitike. Prandaj, raportet statike nuk u përshtaten më shumë menaxherëve modernë. Ata kanë nevojë për dinamikën që mund të sigurojë një KUBE shumëdimensionale.

Kështu, teknologjia OLAP tashmë është bërë element i detyrueshëm në sistemet moderne dhe të avancuara të informacionit. Prandaj, kur zgjidhni një produkt softuer, duhet t'i kushtoni vëmendje nëse ai përdor teknologjinë OLAP.

Për më tepër, ju duhet të jeni në gjendje të dalloni KUBET e vërtetë nga ato imituese. Një simulim i tillë janë tabelat kryesore në MS Excel. Po, ky mjet duket si një CUBE, por në fakt nuk është një, pasi këto janë tabela statike, jo dinamike. Përveç kësaj, ata kanë një zbatim shumë më të keq të aftësisë për të ndërtuar raporte duke përdorur elementë nga drejtoritë hierarkike.

Për të konfirmuar rëndësinë e përdorimit të CUBE-së gjatë ndërtimit raportimi i menaxhmentit Ju mund të jepni një shembull të thjeshtë me një buxhet shitjesh. Në shembullin në shqyrtim, seksionet e mëposhtme analitike janë të rëndësishme për kompaninë: produktet, degët dhe kanalet e shitjes. Nëse këto tre analiza janë të rëndësishme për kompaninë, atëherë buxheti i shitjeve (ose raporti) mund të shfaqet në disa versione.

Duhet të theksohet se nëse krijoni linja buxhetore bazuar në tre seksione analitike (si në shembullin në shqyrtim), kjo ju lejon të krijoni mjaft komplekse modelet e buxhetit dhe krijoni raporte të detajuara duke përdorur CUBE.

Për shembull, një buxhet shitjesh mund të përpilohet duke përdorur vetëm një analitikë (disaportë). Një shembull i një buxheti shitjesh të ndërtuar në bazë të një analitike "Produkte" është paraqitur në Figura 1.

Oriz. 1. Një shembull i një buxheti shitjesh të ndërtuar mbi bazën e një analitike "Produkte" në OLAP-CUBE

I njëjti buxhet i shitjeve mund të përpilohet duke përdorur dy analitikë (drejtori). Një shembull i një buxheti shitjesh të ndërtuar mbi bazën e dy analitikave "Produkte" dhe "Degë" është paraqitur në Figura 2.

Oriz. 2. Një shembull i një buxheti shitjesh të ndërtuar mbi bazën e dy analitikave "Produkte" dhe "Degë" në OLAP-CUBE të paketës softuerike INTEGRAL

.

Nëse ka nevojë për të ndërtuar raporte më të detajuara, atëherë i njëjti buxhet i shitjeve mund të përpilohet duke përdorur tre analitikë (drejtori). Një shembull i një buxheti shitjesh të ndërtuar mbi bazën e tre analitikave "Produkte", "Degë" dhe "Kanalet e Shitjes" është paraqitur në Figura 3.

Oriz. 3. Një shembull i një buxheti shitjesh të ndërtuar mbi bazën e tre analitikave "Produkte", "Degë" dhe "Kanale të Shitjes" në OLAP-CUBE të paketës softuerike INTEGRAL

Duhet të kujtojmë se CUBE i përdorur për të gjeneruar raporte ju lejon të shfaqni të dhëna në sekuenca të ndryshme. Aktiv Figura 3 Buxheti i shitjeve fillimisht “zgjerohet” sipas produktit, më pas sipas degës dhe më pas sipas kanalit të shitjes.

Të njëjtat të dhëna mund të paraqiten në një sekuencë të ndryshme. Aktiv Figura 4 i njëjti buxhet i shitjeve “zgjerohet” fillimisht sipas produktit, më pas sipas kanalit të shitjes dhe më pas sipas degëve.

Oriz. 4. Një shembull i një buxheti shitjesh të ndërtuar mbi bazën e tre analitikave "Produkte", "Kanale të Shpërndarjes" dhe "Degë" në OLAP-CUBE të paketës softuerike INTEGRAL

Aktiv Figura 5 i njëjti buxhet i shitjeve “shpaloset” fillimisht nga degët, më pas nga produktet dhe më pas nga kanalet e shitjes.

Oriz. 5. Një shembull i një buxheti shitjesh të ndërtuar mbi bazën e tre analitikave "Degët", "Produktet" dhe "Kanalet e Shitjes" në paketën softuerike OLAP-CUBE "INTEGRAL"

Në fakt kjo nuk është e gjitha opsionet e mundshme tërheqja e buxhetit të shitjeve.

Përveç kësaj, duhet t'i kushtoni vëmendje faktit që CUBE ju lejon të punoni me të struktura hierarkike libra referencë. Në shembujt e paraqitur drejtoritë hierarkike janë "Produktet" dhe "Kanalet e Shpërndarjes".

Nga këndvështrimi i përdoruesit, ai është në këtë shembull merr disa raporte të menaxhimit (shih Oriz. 1-5), dhe nga pikëpamja e cilësimeve në produkt software- ky është një raport. Thjesht duke përdorur CUBE-në mund ta shikoni atë në disa mënyra.

Natyrisht, në praktikë, një numër shumë i madh opsionesh për nxjerrjen e raporteve të ndryshme të menaxhimit është i mundur nëse artikujt e tyre bazohen në një ose më shumë analistë. Dhe vetë grupi i analitikës varet nga nevojat e përdoruesve për detaje. Vërtetë, nuk duhet të harrojmë se, nga njëra anë, sa më i madh të jetë analisti, aq më të detajuara mund të ndërtohen raporte. Por, nga ana tjetër, kjo do të thotë se modeli i buxhetimit financiar do të jetë më kompleks. Në çdo rast, nëse ka një KUB, kompania do të ketë mundësinë të shikojë raportimet e nevojshme në versione të ndryshme, në përputhje me seksionet analitike me interes.

Është e nevojshme të përmenden disa veçori të tjera të OLAP-CUBE.

Në një OLAP-CUBE hierarkik shumëdimensional ka disa dimensione: lloji i rreshtit, data, rreshtat, drejtoria 1, drejtoria 2 dhe drejtoria 3 (shih. Oriz. 6). Natyrisht, raporti shfaq po aq butona me direktori sa ka në linjën e buxhetit që përmban numrin maksimal të drejtorive. Nëse nuk ka një libër të vetëm referimi në asnjë linjë buxhetore, atëherë raporti nuk do të ketë një buton të vetëm me libra referencë.

Fillimisht, OLAP-CUBE është ndërtuar përgjatë të gjitha dimensioneve. Si parazgjedhje, kur raporti është ndërtuar fillimisht, dimensionet janë të vendosura saktësisht në zonat e treguara Figura 6. Kjo do të thotë, një dimension i tillë si "Data" ndodhet në zonën e dimensioneve vertikale (dimensionet në zonën e kolonës), dimensionet "Rreshtat", "Direktoria 1", "Direktoria 2" dhe "Direktoria 3" - në zona e dimensioneve horizontale (dimensionet në rreshtat e zonës), dhe dimensioni "Lloji i rreshtit" është në zonën e dimensioneve "të pazgjeruara" (dimensionet në zonën e faqes). Nëse një dimension është në zonën e fundit, atëherë të dhënat në raport nuk do të "zgjerohen" në atë dimension.

Secila prej këtyre dimensioneve mund të vendoset në cilëndo nga tre zonat. Pasi të transferohen matjet, raporti rindërtohet menjëherë për të përputhur me konfigurimin e ri të matjes. Për shembull, ju mund të ndërroni datën dhe rreshtat me librat e referencës. Ose mund të zhvendosni një nga librat e referencës në zonën vertikale të matjes (shih. Oriz. 7). Me fjalë të tjera, ju mund të "përdredhni" raportin në OLAP-CUBE dhe të zgjidhni opsionin e daljes së raportit që është më i përshtatshëm për përdoruesin.

Oriz. 7. Një shembull i rindërtimit të një raporti pas ndryshimit të konfigurimit të matjes së paketës softuerike INTEGRAL

Konfigurimi i matjes mund të ndryshohet ose në formën kryesore CUBE ose në redaktuesin e hartës së ndryshimit (shih. Oriz. 8). Në këtë redaktues, ju gjithashtu mund të tërhiqni dhe lëshoni matjet nga një zonë në tjetrën me miun. Përveç kësaj, ju mund të ndërroni matjet në një zonë.

Përveç kësaj, në të njëjtën formë mund të konfiguroni disa parametra matëse. Për çdo dimension, mund të personalizoni vendndodhjen e totaleve, renditjen e renditjes së elementeve dhe emrat e elementeve (shih. Oriz. 8). Ju gjithashtu mund të specifikoni se cili emër elementi të shfaqet në raport: i shkurtuar (Emri) ose i plotë (Emri i plotë).

Oriz. 8. Redaktori i hartës matëse të paketës softuerike INTEGRAL

Ju mund të modifikoni parametrat e matjes drejtpërdrejt në secilën prej tyre (shih. Oriz. 9). Për ta bërë këtë, klikoni në ikonën e vendosur në butonin pranë emrit të matjes.

Oriz. 9. Shembull i redaktimit të drejtorisë 1 Produktet dhe shërbimet në

Duke përdorur këtë redaktues, mund të zgjidhni elementet që dëshironi të shfaqni në raport. Si parazgjedhje, të gjithë elementët shfaqen në raport, por nëse është e nevojshme, disa elementë ose dosje mund të hiqen. Për shembull, nëse duhet të shfaqni vetëm një grup produktesh në raport, atëherë duhet të zgjidhni të gjithë të tjerët në redaktuesin e matjeve. Pas kësaj, raporti do të përmbajë vetëm një grup produktesh (shih. Oriz. 10).

Ju gjithashtu mund të renditni elementet në këtë redaktues. Për më tepër, elementët mund të riorganizohen në mënyra të ndryshme. Pas një rigrupimi të tillë, raporti rindërtohet menjëherë.

Oriz. 10. Shembull i prodhimit në një raport të vetëm një grupi produktesh (dosje) në paketën e softuerit INTEGRAL

Në redaktuesin e dimensioneve, mund të krijoni shpejt grupet tuaja, tërhiqni dhe lëshoni elementë nga drejtoritë atje, etj. Si parazgjedhje, vetëm grupi Tjetër krijohet automatikisht, por grupe të tjera mund të krijohen. Kështu, duke përdorur redaktuesin e dimensioneve, mund të konfiguroni se cilët elementë të librave të referencës dhe në çfarë rendi duhet të shfaqen në raport.


Duhet të theksohet se të gjitha këto rirregullime nuk janë regjistruar. Kjo do të thotë, pas mbylljes së raportit ose pas rillogaritjes së tij, të gjitha drejtoritë do të shfaqen në raport në përputhje me metodologjinë e konfiguruar.

Në fakt, të gjitha këto ndryshime mund të ishin bërë fillimisht gjatë vendosjes së linjave.

Për shembull, duke përdorur kufizimet mund të specifikoni gjithashtu se cilët elementë ose grupe drejtorish duhet të shfaqen në raport dhe cilët jo.

shënim: tema e këtij artikulli diskutohet më në detaje në seminare "Menaxhimi i buxhetit të një ndërmarrje" Dhe "Organizimi dhe automatizimi i kontabilitetit të menaxhimit" kryer nga autori i këtij artikulli, Alexander Karpov.

Nëse përdoruesi pothuajse rregullisht duhet të shfaqë vetëm disa elementë ose dosje direktorie në raport, atëherë është më mirë të bëni cilësime të tilla paraprakisht kur krijoni linja raporti. Nëse është e rëndësishme për përdoruesin kombinime të ndryshme elementet e librave të referencës në raporte, atëherë nuk ka nevojë të vendosni ndonjë kufizim gjatë vendosjes së metodologjisë. Të gjitha kufizimet e tilla mund të konfigurohen shpejt duke përdorur redaktuesin e matjes.

Artikujt më të mirë mbi këtë temë