Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ

Sistemet OLAP. Pamje shumëdimensionale e të dhënave

OLAP(nga anglishtja OnLine Analytical Processing - përpunimi i të dhënave analitike operacionale, gjithashtu: përpunimi analitik i të dhënave në kohë reale, përpunimi interaktiv analitik i të dhënave) - një qasje ndaj përpunimit analitik të të dhënave bazuar në paraqitjen e tyre hierarkike shumëdimensionale, e cila është pjesë e një fushe më të gjerë të teknologjisë së informacionit - biznes -analytics().

Shihni katalogun e zgjidhjeve dhe projekteve OLAP në seksionin OLAP në TAdviser.

Nga këndvështrimi i përdoruesit, OLAP-sistemet ofrojnë mjete për shikim fleksibël të informacionit në seksione të ndryshme, marrjen automatike të të dhënave të grumbulluara, kryerjen e operacioneve analitike të konvolucionit, detajimin, krahasimin me kalimin e kohës. E gjithë kjo i bën sistemet OLAP një zgjidhje me avantazhe të dukshme në fushën e përgatitjes së të dhënave për të gjitha llojet e raportimit të biznesit, duke përfshirë prezantimin e të dhënave në seksione të ndryshme dhe nivele të ndryshme hierarkie - për shembull, raportet e shitjeve, forma të ndryshme buxheti, etj. në. Përparësitë e një prezantimi të tillë janë të dukshme edhe në format e tjera të analizës së të dhënave, duke përfshirë parashikimin.

Kërkesat për sistemet OLAP. FASMI

Kërkesa kryesore për sistemet OLAP është shpejtësia, e cila i lejon ato të përdoren në procesin e punës ndërvepruese të një analisti me informacion. Në këtë kuptim, sistemet OLAP i kundërvihen, së pari, RDBMS tradicionale, zgjedhjet nga të cilat me pyetje tipike për analistët që përdorin grupimin dhe grumbullimin e të dhënave zakonisht janë të shtrenjta për sa i përket kohës së pritjes dhe ngarkimit të RDBMS, prandaj, puna ndërvepruese me ta me ndonjë vëllim të rëndësishëm. të dhënat janë komplekse. Së dyti, sistemet OLAP kundërshtojnë gjithashtu paraqitjen e zakonshme të të dhënave me skedarë të sheshtë, për shembull, në formën e fletëllogarive tradicionale të përdorura zakonisht, prezantimin e të dhënave shumëdimensionale në të cilat është e vështirë dhe jo intuitive, dhe operacionet për të ndryshuar pjesën - pika shikimi mbi të dhënat - gjithashtu kërkojnë kohë dhe përpjekje.ndërlikojnë punën ndërvepruese me të dhënat.

Në të njëjtën kohë, nga njëra anë, kërkesat e të dhënave specifike për sistemet OLAP zakonisht nënkuptojnë ruajtjen e të dhënave në struktura të veçanta të optimizuara për detyra tipike OLAP, nga ana tjetër, nxjerrja e drejtpërdrejtë e të dhënave nga sistemet ekzistuese gjatë procesit të analizës do të çonte në një rënie të konsiderueshme. në performancën e tyre.

Prandaj, një kërkesë e rëndësishme është të sigurohet lidhja më fleksibël e import-eksportit midis sistemeve ekzistuese që veprojnë si burim të dhënash dhe sistemit OLAP, si dhe sistemit OLAP dhe aplikacioneve të analizës dhe raportimit të të dhënave të jashtme.

Në të njëjtën kohë, një lidhje e tillë duhet të plotësojë kërkesat e dukshme për mbështetjen e import-eksportit nga disa burime të dhënash, zbatimin e procedurave për pastrimin dhe transformimin e të dhënave dhe unifikimin e klasifikuesve dhe drejtorive të përdorura. Përveç kësaj, këto kërkesa plotësohen nga nevoja për të marrë parasysh ciklet e ndryshme të përditësimit të të dhënave në sistemet ekzistuese të informacionit dhe për të unifikuar nivelin e kërkuar të detajeve të të dhënave. Kompleksiteti dhe shkathtësia e këtij problemi ka çuar në shfaqjen e konceptit të depove të të dhënave dhe, në një kuptim të ngushtë, në shpërndarjen e një klase të veçantë të shërbimeve të konvertimit dhe transformimit të të dhënave - ETL (Ngarkesa e Transformimit të Ekstraktit).

Modelet aktive të ruajtjes së të dhënave

Më lart, ne treguam se OLAP supozon një paraqitje hierarkike shumëdimensionale të të dhënave dhe, në një farë kuptimi, është kundër sistemeve të bazuara në RDBMS.

Megjithatë, kjo nuk do të thotë që të gjitha sistemet OLAP përdorin një model shumëdimensional për të ruajtur të dhënat aktive të sistemit "punues". Meqenëse modeli aktiv i ruajtjes së të dhënave ndikon në të gjitha kërkesat e diktuara nga testi FASMI, rëndësia e tij theksohet nga fakti se mbi këtë bazë dallohen tradicionalisht nëntipet OLAP - shumëdimensionale (MOLAP), relacionale (ROLAP) dhe hibride (HOLAP).

Megjithatë, disa ekspertë, të udhëhequr nga të lartpërmendurit Nigel Pends, tregojnë se klasifikimi i bazuar në një kriter nuk është mjaftueshëm i plotë. Për më tepër, shumica dërrmuese e sistemeve ekzistuese OLAP do të jenë të një lloji hibrid. Prandaj, ne do të ndalemi në modelet aktive të ruajtjes së të dhënave, duke përmendur se cilat prej tyre korrespondojnë me cilin nga nëntipet tradicionale OLAP.

Ruajtja e të dhënave aktive në një bazë të dhënash shumëdimensionale

Në këtë rast, të dhënat OLAP ruhen në DBMS shumëdimensionale që përdorin konstruksione të optimizuara për këtë lloj të dhënash. Në mënyrë tipike, DBMS shumëdimensionale gjithashtu mbështet të gjitha operacionet tipike OLAP, duke përfshirë grumbullimin sipas niveleve të kërkuara të hierarkisë, e kështu me radhë.

Ky lloj i ruajtjes së të dhënave në njëfarë kuptimi mund të quhet klasik për OLAP. Për të, megjithatë, të gjitha hapat për përgatitjen paraprake të të dhënave janë plotësisht të nevojshme. Në mënyrë tipike, të dhënat shumëdimensionale DBMS ruhen në disk, megjithatë, në disa raste, për të shpejtuar përpunimin e të dhënave, sisteme të tilla ju lejojnë të ruani të dhëna në RAM. Për të njëjtat qëllime, ndonjëherë përdoret ruajtja në bazën e të dhënave të vlerave agregate të parallogaritura dhe vlerave të tjera të llogaritura.

DBMS-të shumëdimensionale që mbështesin plotësisht aksesin e shumë përdoruesve me transaksione të njëkohshme leximi dhe shkrimi janë mjaft të rralla, mënyra e zakonshme për DBMS të tilla është qasja e shkrimit për një përdorues me lexim për shumë përdorues, ose vetëm për lexim me shumë përdorues.

Ndër mangësitë e kushtëzuara karakteristike të disa zbatimeve të sistemeve shumëdimensionale DBMS dhe OLAP të bazuara në to, mund të vërehet ndjeshmëria e tyre ndaj një rritje të sasisë së hapësirës së zënë nga baza e të dhënave, e cila është e paparashikueshme nga këndvështrimi i përdoruesit. Ky efekt shkaktohet nga dëshira për të minimizuar kohën e përgjigjes së sistemit, duke diktuar ruajtjen e vlerave të parallogaritura të treguesve agregat dhe sasive të tjera në bazën e të dhënave, gjë që shkakton një rritje jolineare të sasisë së informacionit të ruajtur në bazën e të dhënave me shtimi i vlerave ose matjeve të reja të të dhënave në të.

Shkalla e manifestimit të këtij problemi, si dhe problemet e lidhura me ruajtjen efikase të kubeve të pakta të të dhënave, përcaktohet nga cilësia e qasjeve dhe algoritmeve të aplikuara për implementime specifike të sistemeve OLAP.

Ruajtja e të dhënave aktive në një bazë të dhënash relacionale

Të dhënat OLAP gjithashtu mund të ruhen në një RDBMS tradicionale. Në shumicën e rasteve, kjo qasje përdoret kur përpiqeni të integroni "pa dhimbje" OLAP me sistemet ekzistuese të kontabilitetit ose magazinat e të dhënave të bazuara në RDBMS. Në të njëjtën kohë, kjo qasje kërkon disa veçori shtesë nga RDBMS për të siguruar përmbushjen efektive të kërkesave të testit FASMI (në veçanti, duke siguruar kohën minimale të përgjigjes së sistemit). Në mënyrë tipike, të dhënat OLAP ruhen në një formë të denormalizuar, dhe disa nga agregatet dhe vlerat e parallogaritura ruhen në tabela të veçanta. Kur ruhet në një formë të normalizuar, efektiviteti i RDBMS si një metodë për ruajtjen e të dhënave aktive zvogëlohet.

Problemi i zgjedhjes së qasjeve dhe algoritmeve efikase për ruajtjen e të dhënave të parallogaritura është gjithashtu i rëndësishëm për sistemet OLAP të bazuara në RDBMS, kështu që prodhuesit e sistemeve të tilla zakonisht fokusohen në meritat e qasjeve të përdorura.

Në përgjithësi, besohet se sistemet OLAP të bazuara në RDBMS janë më të ngadalta se sistemet e bazuara në DBMS shumëdimensionale, duke përfshirë për shkak të strukturave të ruajtjes së të dhënave që janë më pak efikase për detyrat OLAP, por në praktikë kjo varet nga karakteristikat e një sistemi të caktuar.

Ndër avantazhet e ruajtjes së të dhënave në RDBMS zakonisht quhet shkallëzueshmëria më e madhe e sistemeve të tilla.

Ruajtja e të dhënave aktive në skedarë "të sheshtë".

Kjo qasje përfshin ruajtjen e pjesëve të të dhënave në skedarë të rregullt. Zakonisht përdoret si shtesë e njërës prej dy qasjeve kryesore për të përshpejtuar punën duke ruajtur të dhënat e përditësuara në disk ose në RAM-in e kompjuterit të klientit.

Qasja hibride e ruajtjes

Shumica e prodhuesve të sistemeve OLAP që promovojnë zgjidhjet e tyre të integruara, shpesh duke përfshirë, përveç vetë sistemit OLAP, një DBMS, ETL (Ngarkesa e Transformimit të Ekstraktimit) dhe mjete raportimi, aktualisht po përdorin një qasje hibride për organizimin e ruajtjes së të dhënave aktive të sistemit. shpërndarja e tyre në një mënyrë ose në një tjetër midis RDBMS dhe ruajtjes së specializuar, si dhe midis strukturave të diskut dhe caching në memorie.

Meqenëse efektiviteti i një zgjidhjeje të tillë varet nga qasjet dhe algoritmet specifike të përdorura nga prodhuesi për të përcaktuar nëse çfarë të dhënash dhe ku të ruani, pastaj nxirrni me ngut përfundime për efikasitetin fillimisht më të madh të zgjidhjeve të tilla si një klasë pa vlerësuar veçoritë specifike të sistemit në shqyrtim.

OLAP(anglisht përpunimi analitik on-line) - një grup metodash për përpunimin dinamik të pyetjeve shumëdimensionale në bazat e të dhënave analitike. Burime të tilla të të dhënave janë zakonisht mjaft të mëdha, dhe në mjetet e përdorura për përpunimin e tyre, një nga kërkesat më të rëndësishme është shpejtësia e lartë. Në bazat e të dhënave relacionale, informacioni ruhet në tabela të veçanta që janë normalizuar mirë. Por pyetjet komplekse me shumë tabela janë mjaft të ngadalta në to. Performanca dukshëm më e mirë për sa i përket shpejtësisë së përpunimit në sistemet OLAP arrihet për shkak të veçorive të strukturës së ruajtjes së të dhënave. I gjithë informacioni është i organizuar qartë dhe përdoren dy lloje të ruajtjes së të dhënave: matjet(përmbajnë drejtori të ndara në kategori, si pikat e shitjes, klientët, punonjësit, shërbimet, etj.) dhe fakte(karakterizoni ndërveprimin e elementeve të dimensioneve të ndryshme, për shembull, më 3 mars 2010, shitësi A i ofroi një shërbim klientit B në dyqanin C për shumën e njësive monetare G). Masat përdoren për të llogaritur rezultatet në një kub analitik. Masat janë koleksione faktesh të grumbulluara sipas dimensioneve përkatëse të përzgjedhura dhe anëtarëve të tyre. Për shkak të këtyre veçorive, pyetjet komplekse me të dhëna shumëdimensionale kërkojnë shumë më pak kohë sesa burimet relacionale.

Një nga shitësit kryesorë të sistemeve OLAP është Microsoft Corporation. Le të shqyrtojmë zbatimin e parimeve OLAP duke përdorur shembuj praktikë të krijimit të një kubi analitik në aplikacionet Microsoft SQL Server Business Intelligence Development Studio (BIDS) dhe Microsoft Office PerformancePoint Server Planning Business Modeler (PPS) dhe të njihemi me mundësitë e paraqitjes vizuale të të dhënave shumëdimensionale. në formën e grafikëve, grafikëve dhe tabelave.

Për shembull, në BIDS, ju duhet të krijoni një kub OLAP bazuar në të dhënat për një kompani sigurimesh, punonjësit e saj, partnerët (klientët) dhe pikat e shitjes. Le të supozojmë se kompania ofron një lloj shërbimi, kështu që matja e shërbimeve nuk është e nevojshme.

Le të përcaktojmë së pari dimensionet. Subjektet e mëposhtme (kategoritë e të dhënave) janë të lidhura me aktivitetet e kompanisë:

  • Pikat e shitjes
    - Punonjësit
    - Partnerët
Krijon gjithashtu dimensionet Koha dhe Skenari, të cilat janë të detyrueshme për çdo kub.
Më pas, ju nevojitet një tabelë për të ruajtur faktet (tabela e fakteve).
Informacioni në tabela mund të futet manualisht, por mënyra më e zakonshme është ngarkimi i të dhënave duke përdorur magjistarin e importit nga burime të ndryshme.
Figura e mëposhtme tregon rrjedhën e procesit për krijimin dhe plotësimin manual të tabelave të dimensioneve dhe fakteve:

Fig.1. Tabelat e matjeve dhe faktet në një bazë të dhënash analitike. Sekuenca e krijimit
Pas krijimit të një burimi shumëdimensional të të dhënave në BIDS, mund të shikoni paraqitjen e tij (Pamje e burimit të të dhënave). Në shembullin tonë, marrim qarkun e treguar në figurën më poshtë.


Fig.2. Pamja e burimit të të dhënave në Studion e Zhvillimit të Inteligjencave të Biznesit (BIDS)

Siç mund ta shihni, tabela e fakteve lidhet me tabelat e dimensioneve përmes një korrespondence një-për-një të fushave identifikuese (PartnerID, EmployeeID, etj.).

Le të shohim rezultatin. Në skedën e shfletuesit kubik, duke tërhequr masat dhe dimensionet në fushat e totaleve, rreshtave, kolonave dhe filtrave, mund të marrim një pamje të të dhënave me interes (për shembull, kontratat e sigurimit të lidhura nga një punonjës i caktuar në 2005).

Në vitin 1993, themeluesi i qasjes relacionale për ndërtimin e bazave të të dhënave, Edgar Codd dhe partnerët (Edgar Codd, matematikan dhe bashkëpunëtor i IBM), botoi një artikull të iniciuar nga kompania "Arbor Software" (sot është kompania e famshme "Hyperion Solutions"). , me titull "Sigurimi i OLAP (Përpunimi Analitik Operacional) për Përdoruesit Analist", i cili formuloi 12 veçori të teknologjisë OLAP, të cilat më pas u plotësuan nga gjashtë të tjera. Këto dispozita janë bërë përmbajtja kryesore e një teknologjie të re dhe shumë premtuese.

Karakteristikat kryesore të teknologjisë OLAP (Basic):

  • paraqitje konceptuale shumëdimensionale e të dhënave;
  • manipulimi intuitiv i të dhënave;
  • disponueshmëria dhe detajet e të dhënave;
  • nxjerrja e të dhënave në grup kundrejt interpretimit;
  • Modelet e analizës OLAP;
  • arkitektura klient-server (OLAP është i aksesueshëm nga desktopi);
  • transparencë (qasje transparente në të dhënat e jashtme);
  • mbështetje për shumë përdorues.

Karakteristikat e veçanta (Special):

  • përpunimi i të dhënave të paformalizuara;
  • ruajtja e rezultateve OLAP: ruajtja e tyre veçmas nga të dhënat origjinale;
  • përjashtimi i vlerave që mungojnë;
  • trajtimi i vlerave që mungojnë.

Karakteristikat e raportimit (Raport):

  • fleksibilitet në raportim;
  • performanca standarde e raportimit;
  • konfigurimi automatik i shtresës fizike të nxjerrjes së të dhënave.

Menaxhimi i dimensioneve:

  • universaliteti i matjeve;
  • numër i pakufizuar i dimensioneve dhe niveleve të grumbullimit;
  • numër i pakufizuar i operacioneve ndërmjet dimensioneve.

Historikisht, sot termi "OLAP" nënkupton jo vetëm një pamje shumëdimensionale të të dhënave nga përdoruesi fundor, por edhe një paraqitje shumëdimensionale të të dhënave në bazën e të dhënave të synuar. Pikërisht me këtë lidhet dukja si terma të pavarur "OLAP Relacionale" (ROLAP) dhe "OLAP shumëdimensionale" (MOLAP).

Një shërbim OLAP është një mjet për analizimin e sasive të mëdha të të dhënave në kohë reale. Duke ndërvepruar me sistemin OLAP, përdoruesi do të jetë në gjendje të kryejë shikim fleksibël të informacionit, të marrë pjesë arbitrare të të dhënave dhe të kryejë operacione analitike të detajimit, konvolucionit, shpërndarjes nga fundi në fund, krahasimi me kalimin e kohës në shumë parametra njëkohësisht. E gjithë puna me sistemin OLAP zhvillohet për sa i përket fushës së temës dhe ju lejon të ndërtoni modele të vlefshme statistikisht të situatës së biznesit.

Softueri OLAP është një mjet për analizën online të të dhënave që gjenden në magazinë. Karakteristika kryesore është se këto mjete janë të destinuara për t'u përdorur jo nga një specialist i teknologjisë së informacionit, jo nga një statisticien ekspert, por nga një profesionist në fushën e aplikuar të menaxhimit - një menaxher i një departamenti, departamenti, menaxhimi dhe, së fundi, një drejtor. Mjetet janë krijuar për të lejuar analistin të komunikojë me problemin, jo me kompjuterin. Në fig. 6.14 tregon një kub elementar OLAP që ju lejon të vlerësoni të dhënat në tre dimensione.


Një kub shumëdimensional OLAP dhe një sistem i algoritmeve përkatëse matematikore për përpunimin statistikor ju lejon të analizoni të dhëna të çdo kompleksiteti në çdo interval kohor.

Oriz. 6.14. Kubi elementar OLAP

Duke pasur në dispozicion mekanizma fleksibël të manipulimit dhe vizualizimit të të dhënave (Fig. 6.15, Fig. 6.16), menaxheri fillimisht shqyrton të dhënat nga këndvështrime të ndryshme, të cilat mund (ose jo) të lidhen me problemin që zgjidhet.

Më pas, ai krahason tregues të ndryshëm të biznesit me njëri-tjetrin, duke u përpjekur të identifikojë marrëdhëniet e fshehura; mund t'i shikojë më nga afër të dhënat, duke i grimcuar ato, për shembull, duke i zbërthyer sipas kohës, rajonit ose klientit, ose anasjelltas, të përgjithësojë më tej paraqitjen e informacionit për të hequr detajet shpërqendruese. Pas kësaj, duke përdorur modulin e vlerësimit statistikor dhe simulimit, ndërtohen disa skenarë dhe prej tyre zgjidhet opsioni më i pranueshëm.

Oriz. 6.15.

Një menaxher kompanie, për shembull, mund të dalë me një hipotezë se përhapja e rritjes së aseteve në degë të ndryshme të kompanisë varet nga raporti i specialistëve me arsim teknik dhe ekonomik në to. Për të testuar këtë hipotezë, menaxheri mund të kërkojë nga magazina dhe të shfaqë në grafik raportin e interesit ndaj tij për ato degë, rritja e aktiveve të të cilave për tremujorin aktual është ulur me më shumë se 10% në krahasim me vitin e kaluar, dhe për ato, aktivet e të cilave janë rritur. me më shumë se 25%. Ai duhet të jetë në gjendje të përdorë një përzgjedhje të thjeshtë nga menyja e ofruar. Nëse rezultatet e marra bien dukshëm në dy grupe përkatëse, atëherë kjo duhet të bëhet një stimul për testimin e mëtejshëm të hipotezës së paraqitur.

Aktualisht, një drejtim i quajtur Simulimi Dinamik ka marrë zhvillim të shpejtë, i cili zbaton plotësisht parimin e mësipërm FASMI.

Duke përdorur modelimin dinamik, analisti ndërton një model të një situate biznesi që zhvillohet me kalimin e kohës, sipas disa skenarëve. Në të njëjtën kohë, rezultati i një modelimi të tillë mund të jenë disa situata të reja biznesi që gjenerojnë një pemë vendimesh të mundshme me një vlerësim të probabilitetit dhe perspektivave të secilit.

Oriz. 6.16. IS analitik për nxjerrjen, përpunimin e të dhënave dhe paraqitjen e informacionit

Tabela 6.3 tregon karakteristikat krahasuese të analizës statike dhe dinamike.

Koncepti i teknologjisë OLAP u formulua nga Edgar Codd në 1993.

Kjo teknologji bazohet në ndërtimin e grupeve të të dhënave shumëdimensionale - të ashtuquajturat kube OLAP (jo domosdoshmërisht tre-dimensionale, siç mund të konkludohet nga përkufizimi). Qëllimi i përdorimit të teknologjive OLAP është të analizojë të dhënat dhe ta paraqesë këtë analizë në një formë të përshtatshme për perceptimin nga personeli drejtues dhe marrjen e vendimeve bazuar në to.

Kërkesat themelore për aplikacionet për analizë shumëvariate:

  • - sigurimin e përdoruesit me rezultatet e analizës në një kohë të arsyeshme (jo më shumë se 5 s.);
  • - qasja me shumë përdorues në të dhëna;
  • - paraqitje shumëdimensionale e të dhënave;
  • - aftësia për të hyrë në çdo informacion, pavarësisht nga vendndodhja dhe vëllimi i tij i ruajtjes.

Mjetet e sistemit OLAP ofrojnë mundësinë për të renditur dhe përzgjedhur të dhënat sipas kushteve të specifikuara. Mund të vendosen kushte të ndryshme cilësore dhe sasiore.

Modeli kryesor i të dhënave që përdoret në mjete të shumta për krijimin dhe mirëmbajtjen e bazave të të dhënave - DBMS, është modeli relacional. Të dhënat në të paraqiten në formën e një grupi tabelash dydimensionale-marrëdhënie të lidhura me fusha kyçe. Për të eliminuar dyfishimin, mospërputhjen dhe për të reduktuar kostot e punës për mirëmbajtjen e bazave të të dhënave, përdoret një aparat formal për normalizimin e tabelave të entiteteve. Sidoqoftë, përdorimi i tij shoqërohet me kohën shtesë të shpenzuar për gjenerimin e përgjigjeve ndaj pyetjeve në bazat e të dhënave, megjithëse burimet e memories ruhen.

Një model shumëdimensional i të dhënave përfaqëson objektin në studim në formën e një kubi shumëdimensional, më shpesh përdoret një model tredimensional. Përgjatë boshteve ose faqeve të kubit, matjet ose atributet e atributeve vizatohen. Detajet e bazës janë mbushja e qelizave të kubit. Një kub shumëdimensional mund të përfaqësohet nga një kombinim i kubeve tredimensionale në mënyrë që të lehtësojë perceptimin dhe prezantimin kur gjeneron raportime dhe dokumente analitike dhe prezantime multimediale bazuar në materialet e punës analitike në një sistem të mbështetjes së vendimeve.

Në kuadrin e teknologjive OLAP, bazuar në faktin se një paraqitje shumëdimensionale e të dhënave mund të organizohet si me anë të DBMS-ve relacionale ashtu edhe me mjete të specializuara shumëdimensionale, ekzistojnë tre lloje të sistemeve shumëdimensionale OLAP:

  • - shumëdimensionale (Multidimensionale) OLAP-MOLAP;
  • - relacionale (Relation) OLAP-ROLAP;
  • - i përzier ose hibrid (Hybrid) OLAP-HOLAP.

Në DBMS shumëdimensionale, të dhënat organizohen jo në formën e tabelave relacionale, por në formën e vargjeve shumëdimensionale të renditura në formën e hiperkubeve, kur të gjitha të dhënat e ruajtura duhet të kenë të njëjtin dimension, që nënkupton nevojën për të formuar bazën më të plotë të matjet. Të dhënat mund të organizohen në formën e polikubeve, në këtë opsion ruhen vlerat e secilit tregues me grupin e tyre të matjeve, përpunimi i të dhënave kryhet nga mjeti i vetë sistemit. Struktura e ruajtjes në këtë rast është thjeshtuar, sepse nuk ka nevojë për një zonë të ruajtjes së të dhënave në një formë shumëdimensionale ose të orientuar nga objekti. Kostot e mëdha të punës për krijimin e modeleve dhe sistemeve për konvertimin e të dhënave nga një model relacional në një model reduktohen.

Përparësitë e MOLAP janë:

  • - përgjigje më e shpejtë ndaj kërkesave sesa me ROLAP - koha e shpenzuar është një ose dy rend të madhësisë më pak;
  • - për shkak të kufizimeve të SQL, zbatimi i shumë funksioneve të integruara është i vështirë.

Kufizimet e MOLAP përfshijnë:

  • - madhësi relativisht e vogël e bazave të të dhënave;
  • - për shkak të denormalizimit dhe grumbullimit paraprak, grupet shumëdimensionale përdorin 2,5-100 herë më shumë memorie sesa të dhënat origjinale (konsumi i memories rritet në mënyrë eksponenciale me një rritje të numrit të dimensioneve);
  • - nuk ka standarde për ndërfaqen dhe mjetet e manipulimit të të dhënave;
  • - Ka kufizime gjatë ngarkimit të të dhënave.

Përpjekja e nevojshme për të krijuar të dhëna shumëdimensionale rritet në mënyrë dramatike si në këtë situatë, praktikisht nuk ka mjete të specializuara për objektivizimin e modelit relacional të të dhënave që përmban magazina e informacionit. Koha e përgjigjes ndaj pyetjeve shpesh nuk mund të plotësojë kërkesat për sistemet OLAP.

Përparësitë e sistemeve ROLAP janë:

  • - aftësia për të analizuar shpejt të dhënat e përfshira drejtpërdrejt në ruajtje, sepse shumica e bazave të të dhënave burimore janë relacionale;
  • - me një dimension të ndryshueshëm të problemit, RO-LAP fiton, sepse nuk kërkohet riorganizim fizik i bazës së të dhënave;
  • - Sistemet ROLAP mund të përdorin stacione dhe serverë më pak të fuqishëm klientësh, dhe serverët mbajnë barrën kryesore të përpunimit të pyetjeve komplekse SQL;
  • - Niveli i mbrojtjes së informacionit dhe i diferencimit të të drejtave të aksesit në DBMS relacionale është pakrahasueshëm më i lartë se në ato shumëdimensionale.

Disavantazhi i sistemeve ROLAP është performanca më e ulët, nevoja për studim të kujdesshëm të skemave të bazës së të dhënave, akordimi i veçantë i indeksit, analiza e statistikave të pyetjeve dhe marrja parasysh e përfundimeve të analizës kur modifikohen skemat e bazës së të dhënave, gjë që çon në kosto të konsiderueshme shtesë të punës.

Plotësimi i këtyre kushteve lejon që gjatë përdorimit të sistemeve ROLAP të arrihen tregues të ngjashëm me sistemet MOLAP për sa i përket kohës së aksesit, si dhe të tejkalohen në kursimet e memories.

Sistemet hibride OLAP janë një kombinim i mjeteve që zbatojnë një model të dhënash relacionale dhe shumëdimensionale. Kjo ju lejon të ulni në mënyrë drastike koston e burimeve për krijimin dhe mirëmbajtjen e një modeli të tillë, kohën e përgjigjes ndaj kërkesave.

Kjo qasje përdor avantazhet e dy qasjeve të para dhe kompenson të metat e tyre. Ky parim zbatohet në produktet softuerike më të zhvilluara të këtij qëllimi.

Përdorimi i një arkitekture hibride në sistemet OLAP është mënyra më e përshtatshme për të zgjidhur problemet që lidhen me përdorimin e mjeteve softuerike në analizat shumëdimensionale.

Mënyra e zbulimit të modelit bazohet në përpunimin inteligjent të të dhënave. Detyra kryesore këtu është identifikimi i modeleve në proceset në studim, marrëdhëniet dhe ndikimi i ndërsjellë i faktorëve të ndryshëm, kërkimi i devijimeve të mëdha "të pazakonta" dhe parashikimi i rrjedhës së proceseve të ndryshme domethënëse. Kjo zonë i përket minierave të të dhënave.

4. Klasifikimi i produkteve OLAP.

5. Parimet e funksionimit të klientëve OLAP.

7. Sferat e aplikimit të teknologjive OLAP.

8. Një shembull i përdorimit të teknologjive OLAP për analiza në fushën e shitjeve.

1. Vendi i OLAP në strukturën e informacionit të ndërmarrjes.

Termi "OLAP" është i lidhur pazgjidhshmërisht me termin "depo të dhënave" (Data Warehouse).

Të dhënat në ruajtje vijnë nga sistemet operative (Sistemet OLTP), të cilat janë krijuar për të automatizuar proceset e biznesit. Përveç kësaj, depoja mund të plotësohet nga burime të jashtme, siç janë raportet statistikore.

Detyra e magazinës është të sigurojë "lëndën e parë" për analizë në një vend dhe në një strukturë të thjeshtë dhe të kuptueshme.

Ekziston një arsye tjetër që justifikon shfaqjen e një ruajtjeje të veçantë - pyetjet komplekse analitike për informacionin operacional ngadalësojnë punën aktuale të kompanisë, bllokojnë tabelat për një kohë të gjatë dhe kapin burimet e serverit.

Nën ruajtje mund të kuptohet jo domosdoshmërisht një akumulim gjigant i të dhënave - gjëja kryesore është që të jetë i përshtatshëm për analizë.

Centralizimi dhe strukturimi i përshtatshëm janë larg nga gjithçka që i nevojitet një analisti. Në fund të fundit, ai ende ka nevojë për një mjet për shikimin, vizualizimin e informacionit. Raporteve tradicionale, madje të ndërtuara mbi bazën e një depoje të vetme, u mungon një gjë - fleksibiliteti. Ato nuk mund të "përdredhen", "zgjerohen" apo "shemben" për të marrë pamjen e dëshiruar të të dhënave. Do të doja që ai të kishte një mjet të tillë që do t'i lejonte atij të zgjeronte dhe kolapsonte të dhënat thjesht dhe me lehtësi! OLAP është një mjet i tillë.

Megjithëse OLAP nuk është një atribut i domosdoshëm i një magazine të dhënash, ai përdoret gjithnjë e më shumë për të analizuar informacionin e grumbulluar në këtë depo të dhënash.

Vendi i OLAP në strukturën e informacionit të ndërmarrjes (Fig. 1).

Foto 1. VendiOLAP në strukturën e informacionit të ndërmarrjes

Të dhënat operative mblidhen nga burime të ndryshme, pastrohen, integrohen dhe vendosen në një dyqan relacional. Në të njëjtën kohë, ato janë tashmë të disponueshme për analiza duke përdorur mjete të ndryshme raportimi. Pastaj të dhënat (në tërësi ose pjesërisht) përgatiten për analizën OLAP. Ato mund të ngarkohen në një bazë të dhënash të veçantë OLAP ose të lihen në një dyqan relacional. Elementi më i rëndësishëm i tij janë metadatat, d.m.th. informacioni për strukturën, vendosjen dhe transformimin e të dhënave. Falë tyre, sigurohet ndërveprimi efektiv i përbërësve të ndryshëm të ruajtjes.

Duke përmbledhur, ne mund ta përkufizojmë OLAP si një grup mjetesh për analizën shumëdimensionale të të dhënave të grumbulluara në një depo.

2. Përpunimi i të dhënave analitike operative.

Koncepti i OLAP bazohet në parimin e paraqitjes shumëdimensionale të të dhënave. Në vitin 1993, EF Codd trajtoi mangësitë e modelit relacional, duke vënë në dukje fillimisht pamundësinë për të "kombinuar, parë dhe analizuar të dhënat në terma të dimensioneve të shumëfishta, domethënë në mënyrën më të kuptueshme për analistët e korporatave", dhe identifikoi kërkesat e përgjithshme për Sistemet OLAP që zgjerojnë funksionalitetin relacional DBMS dhe duke përfshirë analizën shumëdimensionale si një nga karakteristikat e tij.

Sipas Codd, një pamje konceptuale shumëdimensionale e të dhënave është një perspektivë e shumëfishtë, e përbërë nga disa dimensione të pavarura përgjatë të cilave mund të analizohen grupe të caktuara të dhënash.

Analiza e njëkohshme në dimensione të shumta përkufizohet si analizë multivariate. Çdo dimension përfshin drejtimet e konsolidimit të të dhënave, të përbërë nga një seri nivelesh të njëpasnjëshme përgjithësime, ku çdo nivel më i lartë korrespondon me një shkallë më të madhe të grumbullimit të të dhënave për dimensionin përkatës.

Kështu, dimensioni Kontraktor mund të përcaktohet nga drejtimi i konsolidimit, i përbërë nga nivelet e përgjithësimit "ndërmarrje - nënndarje - departament - punonjës". Dimensioni Koha madje mund të përfshijë dy drejtime të konsolidimit - "vit - tremujor - muaj - ditë" dhe "javë - ditë", pasi llogaritja e kohës sipas muajit dhe javës nuk është e përputhshme. Në këtë rast, bëhet e mundur që në mënyrë arbitrare të zgjidhni nivelin e dëshiruar të detajeve të informacionit për secilën nga matjet.

Operacioni i zbritjes (shpimi poshtë) korrespondon me lëvizjen nga nivelet më të larta të konsolidimit në ato më të ulëta; përkundrazi, funksionimi i ngritjes (rrokullisjes) nënkupton lëvizjen nga nivelet më të ulëta në nivelet më të larta (Fig. 2).


Figura 2.Dimensionet dhe drejtimet e konsolidimit të të dhënave

3. Kërkesat për mjetet e përpunimit analitik operacional.

Qasja shumëdimensionale u ngrit pothuajse njëkohësisht dhe paralelisht me qasjen relacionale. Megjithatë, vetëm duke filluar nga mesi i viteve nëntëdhjetë, ose më mirë nga
1993, interesi për MDBMS filloi të bëhej i përgjithshëm. Ishte në këtë vit që u shfaq një artikull i ri i politikës së një prej themeluesve të qasjes relacionale E. Codda, në të cilën ai formuloi 12 kërkesa bazë për mjetet e zbatimit OLAP(Tabela 1).

Tabela 1.

Pamje shumëdimensionale e të dhënave

Mjetet duhet të mbështesin një pamje shumëdimensionale të të dhënave në një nivel konceptual.

Transparenca

Përdoruesi nuk ka nevojë të dijë se çfarë mjetesh specifike përdoren për të ruajtur dhe përpunuar të dhënat, si janë organizuar të dhënat dhe nga vijnë ato.

Disponueshmëria

Vetë mjetet duhet të zgjedhin dhe të lidhen me burimin më të mirë të të dhënave për të formuar një përgjigje ndaj një kërkese të caktuar. Mjetet duhet të ofrojnë hartëzimin automatik të skemës së tyre logjike në burime të ndryshme heterogjene të të dhënave.

Performanca e qëndrueshme

Performanca duhet të jetë praktikisht e pavarur nga numri i dimensioneve në pyetje.

Mbështetje për arkitekturën klient-server

Mjetet duhet të funksionojnë në një arkitekturë klient-server.

Barazia e të gjitha dimensioneve

Asnjë nga dimensionet nuk duhet të jetë bazë, të gjitha duhet të jenë të barabarta (simetrike).

Trajtimi dinamik i matricave të rralla

Vlerat null duhet të ruhen dhe të trajtohen në mënyrën më efikase.

Mbështetje për mënyrën e punës me shumë përdorues të të dhënave

Mjetet duhet të lejojnë më shumë se një përdorues të punojnë.

Mbështetje për operacione të bazuara në matje të ndryshme

Të gjitha operacionet shumëdimensionale (p.sh. Agregimi) duhet të zbatohen në mënyrë uniforme dhe të qëndrueshme për çdo numër të çdo dimensioni.

Lehtësia e manipulimit të të dhënave

Mjetet duhet të kenë ndërfaqen më të përshtatshme, natyrale dhe të rehatshme të përdoruesit.

Mjete të avancuara të prezantimit të të dhënave

Mjetet duhet të mbështesin mënyra të ndryshme të vizualizimit (përfaqësimit) të të dhënave.

Numri i pakufizuar i dimensioneve dhe niveleve të grumbullimit të të dhënave

Nuk duhet të ketë kufi për numrin e Dimensioneve të mbështetura.

Rregullat për vlerësimin e produkteve të softuerit të klasës OLAP

Kompleti i këtyre kërkesave që shërbeu si përkufizim de fakto i OLAP duhet të konsiderohet si rekomandime dhe produktet individuale duhet të gjykohen nga shkalla e përafrimit për të përmbushur në mënyrë ideale të gjitha kërkesat.

Më vonë, përkufizimi i Codd u ripërpunua në të ashtuquajturin test FASMI, duke kërkuar që një aplikacion OLAP të sigurojë aftësinë për të analizuar shpejt informacionin e përbashkët shumëdimensional.

Të kujtosh 12 rregullat e Codd-it është shumë e rëndë për shumicën e njerëzve. Doli që ju mund të përmblidhni përkufizimin OLAP me vetëm pesë fjalë kyçe: Analiza e shpejtë e informacionit shumëdimensional të përbashkët - ose, shkurt - FASMI (përkthyer nga anglishtja:F ast A analiza e S të përbashkëta M ultradimensionale Unë informacion).

Ky përkufizim u formulua për herë të parë në fillim të vitit 1995 dhe që atëherë nuk ka pasur nevojë për rishikim.

SHPEJTE ( Shpejt) - do të thotë që sistemi duhet të sigurojë shumicën e përgjigjeve për përdoruesit brenda përafërsisht pesë sekondash. Në të njëjtën kohë, kërkesat më të thjeshta përpunohen brenda një sekonde dhe shumë pak - më shumë se 20 sekonda. Hulumtimet kanë treguar se përdoruesit përfundimtarë e perceptojnë një proces të dështuar nëse rezultatet nuk merren pas 30 sekondash.

Në pamje të parë, mund të duket e habitshme që kur merr një raport në një minutë, i cili jo shumë kohë më parë zgjati ditë, përdoruesi mërzitet shumë shpejt gjatë pritjes dhe projekti rezulton të jetë shumë më pak i suksesshëm sesa në rastin e një përgjigje e menjëhershme, edhe me koston e një analize më pak të detajuar.

ANALIZA (Analizë)do të thotë që sistemi mund të trajtojë çdo analizë logjike dhe statistikore specifike për një aplikacion të caktuar dhe siguron që ai të mbahet në një formë të aksesueshme për përdoruesin përfundimtar.

Nuk është aq e rëndësishme nëse kjo analizë kryhet në mjetet e vetë shitësit ose në një produkt softuerësh të jashtëm të lidhur, si p.sh. një fletëllogaritëse, është thjesht që i gjithë funksionaliteti i kërkuar i analizës duhet të sigurohet në një mënyrë intuitive për përdoruesit përfundimtarë. Mjetet e analizës mund të përfshijnë procedura specifike të tilla si analiza e serive kohore, shpërndarja e kostos, transfertat e monedhës, kërkimi i qëllimeve, ndryshimi i strukturave shumëdimensionale, modelimi joprocedural, zbulimi i përjashtimeve, nxjerrja e të dhënave dhe operacione të tjera specifike për aplikim. Aftësi të tilla ndryshojnë shumë midis produkteve, në varësi të orientimit të synuar.

SHARED (E ndarë) do të thotë që sistemi zbaton të gjitha kërkesat e mbrojtjes së konfidencialitetit (ndoshta deri në nivelin e qelisë) dhe, nëse kërkohet akses i shumëfishtë i shkrimit, zbaton bllokimin e modifikimit në nivelin e duhur. Jo të gjitha aplikacionet kanë nevojë të shkruajnë të dhëna. Megjithatë, numri i aplikacioneve të tilla po rritet dhe sistemi duhet të jetë në gjendje të trajtojë modifikime të shumta në kohën e duhur dhe të sigurt.

SHUMËDIMENSIONALE - kjo është një kërkesë kyçe. Nëse do të duhej të përcaktonim OLAP-in me një fjalë, do ta zgjidhnim atë. Sistemi duhet të sigurojë një paraqitje konceptuale shumëdimensionale të të dhënave, duke përfshirë mbështetjen e plotë për hierarkitë dhe hierarkitë e shumta, pasi kjo është padyshim mënyra më logjike për të analizuar biznesin dhe organizatat. Nuk ka një numër minimal dimensionesh që duhet të përpunohen sepse varet edhe nga aplikacioni, dhe shumica e produkteve OLAP kanë dimensione të mjaftueshme për tregjet që synojnë.

INFORMACION - është e gjitha. Informacioni i nevojshëm duhet të merret aty ku është e nevojshme. Megjithatë, shumë varet nga aplikimi. Fuqia e produkteve të ndryshme matet në kuptimin e sasisë së inputeve që mund të përballojnë, jo sa gigabajt mund të ruajnë. Fuqia e produkteve ndryshon shumë - produktet më të mëdha OLAP mund të trajtojnë të paktën një mijë herë më shumë të dhëna se sa më të voglat. Ka shumë faktorë për t'u marrë parasysh në këtë drejtim, duke përfshirë dyfishimin e të dhënave, RAM-in e kërkuar, përdorimin e hapësirës në disk, performancën, integrimin me dyqanet e informacionit, etj.

Testi FASMI është një përkufizim i arsyeshëm dhe i kuptueshëm i qëllimeve në të cilat fokusohet OLAP.

4. KlasifikimiOLAP- produkte.

Pra, thelbi i OLAP qëndron në faktin se informacioni fillestar për analizë paraqitet në formën e një kubi shumëdimensional, dhe është e mundur të manipulohet në mënyrë arbitrare dhe të merren seksionet e nevojshme të informacionit - raportet. Në të njëjtën kohë, përdoruesi përfundimtar e sheh kubin si një tabelë dinamike shumëdimensionale që përmbledh automatikisht të dhënat (faktet) në seksione (dimensione) të ndryshme dhe ju lejon të menaxhoni në mënyrë interaktive llogaritjet dhe formën e raportit. Këto operacione kryhen OLAP makinë (ose makinë llogaritja OLAP).

Deri më sot, në botë janë zhvilluar shumë produkte që zbatojnë OLAP -teknologjitë. Për ta bërë më të lehtë lundrimin midis tyre, përdorni klasifikimet OLAP -produktet: me anë të ruajtjes së të dhënave për analizë dhe sipas vendndodhjes OLAP - makina. Le të hedhim një vështrim më të afërt në secilën kategori. Produktet OLAP.

Klasifikimi sipas metodës së ruajtjes së të dhënave

Kubet shumëdimensionale ndërtohen në bazë të të dhënave burimore dhe të përgjithshme. Të dhënat burimore dhe të përgjithshme për kubet mund të ruhen si në bazat e të dhënave relacionale ashtu edhe në shumëdimensionale. Prandaj, aktualisht ekzistojnë tre mënyra për të ruajtur të dhënat: MOLAP (OLAP shumëdimensionale), ROLAP (OLAP relacionale) dhe HOLAP (OLAP hibride ). Përkatësisht, OLAP -produktet sipas metodës së ruajtjes së të dhënave ndahen në tri kategori të ngjashme:

1. Në rastin e PZHVL , burimi dhe të dhënat e përmbledhura ruhen në një bazë të dhënash shumëdimensionale ose në një kub lokal shumëdimensional.

2. Në ROLAP -produktet, të dhënat burimore ruhen në bazat e të dhënave relacionale ose në tabela lokale të sheshta në serverin e skedarëve. Të dhënat e përmbledhura mund të vendosen në tabelat e shërbimit në të njëjtën bazë të dhënash. Konvertimi i të dhënave nga një bazë të dhënash relacionale në kube shumëdimensionale ndodh sipas kërkesës Mjetet OLAP.

3. Në rast përdorimi HOLAP arkitektura, të dhënat burimore mbeten në bazën e të dhënave relacionale, ndërsa agregatet vendosen në atë shumëdimensionale. Ndërtesa OLAP -kubi kryhet sipas kërkesës OLAP -mjete të bazuara në të dhëna relacionale dhe shumëdimensionale.

Klasifikimi i vendndodhjes OLAP- makina.

Mbi këtë bazë OLAP -Produktet ndahen në Serverët OLAP dhe klientët OLAP:

· Në server OLAP -Mjetet e llogaritjes dhe të ruajtjes së të dhënave agregate kryhen nga një proces i veçantë - serveri. Aplikacioni i klientit merr vetëm rezultatet e pyetjeve kundrejt kubeve shumëdimensionale që ruhen në server. Disa OLAP -serverët mbështesin ruajtjen e të dhënave vetëm në bazat e të dhënave relacionale, disa - vetëm në ato shumëdimensionale. Shumë moderne OLAP -serverët mbështesin të tre mënyrat e ruajtjes së të dhënave:MOLAP, ROLAP dhe HOLAP.

MOLAP.

MOLAP është Përpunimi analitik shumëdimensional në linjë, dmth OLAP shumëdimensionale.Kjo do të thotë që serveri përdor një bazë të dhënash shumëdimensionale (MBD) për të ruajtur të dhënat. Kuptimi i përdorimit të MDB është i qartë. Ai mund të ruajë në mënyrë efikase të dhëna që janë shumëdimensionale në natyrë, duke ofruar një mjet për shërbimin e shpejtë të pyetjeve të bazës së të dhënave. Të dhënat transferohen nga burimi i të dhënave në bazën e të dhënave shumëdimensionale, dhe më pas baza e të dhënave grumbullohet. Parallogaritja është ajo që shpejton pyetjet OLAP sepse të dhënat përmbledhëse tashmë janë llogaritur. Koha e pyetjes bëhet një funksion vetëm i kohës së nevojshme për të hyrë në një pjesë të caktuar të të dhënave dhe për të kryer një llogaritje. Kjo metodë mbështet konceptin se puna kryhet një herë, dhe rezultatet përdoren përsëri dhe përsëri. Bazat e të dhënave shumëdimensionale janë një teknologji relativisht e re. Përdorimi i MDB ka të njëjtat të meta si shumica e teknologjive të reja. Domethënë, ato nuk janë aq të qëndrueshme sa bazat e të dhënave relacionale (RDB), dhe nuk janë të optimizuara në të njëjtën masë. Një pikë tjetër e dobët e MDB-së është pamundësia për të përdorur shumicën e bazave të të dhënave shumëdimensionale në procesin e grumbullimit të të dhënave, kështu që kërkon kohë që informacioni i ri të bëhet i disponueshëm për analizë.

ROLAP.

ROLAP është Përpunimi analitik relacional në linjë, domethënë OLAP relacionale.Termi ROLAP do të thotë që serveri OLAP bazohet në një bazë të dhënash relacionale. Të dhënat burimore futen në një bazë të dhënash relacionale, zakonisht në një skemë ylli ose bore, për të ndihmuar në reduktimin e kohës së marrjes. Serveri ofron një model të dhënash shumëdimensionale duke përdorur pyetje të optimizuara SQL.

Ka një numër arsyesh për zgjedhjen e një baze të dhënash relacionale mbi një bazë të dhënash shumëdimensionale. RDB është një teknologji e mirë-krijuar me shumë mundësi për optimizim. Përdorimi në botën reale rezultoi në një produkt më të pjekur. Për më tepër, RDB-të mbështesin sasi më të mëdha të dhënash sesa MDB-të. Ato janë krijuar vetëm për vëllime të tilla. Argumenti kryesor kundër RDB-ve është kompleksiteti i pyetjeve që kërkohen për të tërhequr informacionin nga një bazë të dhënash e madhe duke përdorur SQL. Një programues i papërvojë SQL mund të ngarkojë lehtësisht burimet e vlefshme të sistemit duke u përpjekur të ekzekutojë disa pyetje të tilla, që është shumë më e lehtë për t'u kryer në një MDB.

Të dhëna të grumbulluara/përmbledhura paraprakisht.

Zbatimi i shpejtë i pyetjeve është një imperativ për OLAP. Ky është një nga parimet bazë të OLAP - aftësia për të manipuluar të dhënat në mënyrë intuitive kërkon rikthim të shpejtë të informacionit. Në përgjithësi, sa më shumë llogaritje që duhen bërë për të marrë një informacion, aq më i ngadalshëm është përgjigja. Prandaj, për të kursyer një kohë të vogël të zbatimit të pyetjes, fragmentet e informacionit që zakonisht aksesohen më shpesh, por që kërkojnë llogaritje, grumbullohen paraprakisht. Domethënë, ato numërohen dhe më pas ruhen në bazën e të dhënave si të dhëna të reja. Një shembull i llojit të të dhënave që mund të llogariten paraprakisht janë të dhënat përmbledhëse, të tilla si shifrat e shitjeve mujore, tremujore ose vjetore, për të cilat të dhënat aktuale të futura janë shifra ditore.

Shitës të ndryshëm kanë metoda të ndryshme për zgjedhjen e parametrave, duke kërkuar grumbullim paraprak dhe një numër vlerash të llogaritura paraprakisht. Qasja ndaj grumbullimit ndikon si në bazën e të dhënave ashtu edhe në kohën e ekzekutimit të pyetjeve. Nëse llogariten më shumë vlera, probabiliteti që përdoruesi të kërkojë vlerën e llogaritur tashmë rritet, dhe për këtë arsye koha e përgjigjes do të reduktohet, pasi vlera fillestare nuk do të duhet të kërkohet për llogaritje. Sidoqoftë, nëse llogaritni të gjitha vlerat e mundshme - kjo nuk është zgjidhja më e mirë - në këtë rast, madhësia e bazës së të dhënave do të rritet ndjeshëm, gjë që do ta bëjë atë të pamenaxhueshme dhe koha e grumbullimit do të jetë shumë e gjatë. Përveç kësaj, kur vlerat numerike shtohen në bazën e të dhënave, ose nëse ato ndryshohen, ky informacion duhet të pasqyrohet në vlerat e parallogaritura që varen nga të dhënat e reja. Kështu, përditësimi i bazës së të dhënave mund të marrë gjithashtu një kohë të gjatë në rastin e një numri të madh vlerash të parallogaritura. Meqenëse baza e të dhënave zakonisht funksionon jashtë linje gjatë grumbullimit, është e dëshirueshme që koha e grumbullimit të mos jetë shumë e gjatë.

OLAP Klienti është konfiguruar ndryshe. Ndërtimi i një kubi shumëdimensional dhe OLAP -llogaritjet kryhen në memorien e kompjuterit klient.OLAP -konsumatorët ndahen gjithashtu në ROLAP dhe MOLAP.Dhe disa mund të mbështesin të dy opsionet e aksesit të të dhënave.

Secila prej këtyre qasjeve ka të mirat dhe të këqijat e saj. Ndryshe nga besimi popullor për avantazhet e mjeteve të serverit mbi ato të klientit, në një numër rastesh përdorimi i OLAP -klienti për përdoruesit mund të jetë më efikas dhe më fitimprurës për t'u përdorur Serverët OLAP.

Zhvillimi i aplikacioneve analitike duke përdorur mjetet e klientit OLAP është një proces i shpejtë dhe nuk kërkon trajnim të veçantë të interpretuesit. Një përdorues që njeh zbatimin fizik të bazës së të dhënave mund të zhvillojë vetë një aplikacion analitik, pa përfshirjen e një specialisti IT.

Kur përdorni një server OLAP, ju duhet të mësoni 2 sisteme të ndryshme, ndonjëherë nga shitës të ndryshëm, për të krijuar kube në server dhe për të zhvilluar një aplikacion klienti.

Klienti OLAP ofron një ndërfaqe të vetme vizuale për përshkrimin e kubeve dhe përshtatjen e ndërfaqeve të përdoruesit për to.

Pra, në cilat raste përdorimi i një klienti OLAP për përdoruesit mund të jetë më efikas dhe më i dobishëm sesa përdorimi i një serveri OLAP?

· Fizibiliteti ekonomik i aplikimit OLAP - serveri ndodh kur sasia e të dhënave është shumë e madhe dhe e padurueshme për të OLAP -klienti, përndryshe përdorimi i këtij të fundit është më i justifikuar. Në këtë rast OLAP -Klienti kombinon karakteristikat e performancës së lartë dhe koston e ulët.

· Kompjuterët e fuqishëm të analistëve janë një tjetër argument në favor të OLAP -klientët. Kur aplikohet OLAP -server këto kapacitete nuk përdoren.

Përfitimet e tjera të klientëve OLAP përfshijnë:

· Kostot e zbatimit dhe mirëmbajtjes OLAP -klienti është dukshëm më i ulët se kostoja e Serveri OLAP.

· Duke përdorur OLAP -klienti me makineri të integruar transferimi i të dhënave përmes rrjetit bëhet një herë. Duke bërë OLAP -operacionet nuk krijohen rrjedha të reja të të dhënave.

5. Parimet e funksionimit OLAP-klientët.

Merrni parasysh procesin e krijimit të një aplikacioni OLAP duke përdorur mjetin e klientit (Fig. 1).

Foto 1.Krijoni një aplikacion OLAP duke përdorur mjetin e klientit ROLAP

Parimi i funksionimit të klientëve ROLAP është një përshkrim paraprak i shtresës semantike, pas së cilës fshihet struktura fizike e të dhënave burimore. Në këtë rast, burimet e të dhënave mund të jenë: tabelat lokale, RDBMS. Lista e burimeve të të dhënave të mbështetura përcaktohet nga produkti specifik i softuerit. Pas kësaj, përdoruesi mund të manipulojë në mënyrë të pavarur objektet që ai kupton për sa i përket zonës së temës për të krijuar kube dhe ndërfaqe analitike.

Parimi i funksionimit të klientit të serverit OLAP është i ndryshëm. Në serverin OLAP, kur krijon kube, përdoruesi manipulon përshkrimet fizike të bazës së të dhënave. Kjo krijon përshkrime të personalizuara në vetë kubin. Klienti i Serverit OLAP është konfiguruar vetëm për kub.

Kur krijoni një shtresë semantike, burimet e të dhënave - tabelat e shitjeve dhe marrëveshjeve - përshkruhen në terma të kuptueshëm për përdoruesin përfundimtar dhe shndërrohen në "Produkte" dhe "Marrëveshje". Fusha "ID" nga tabela "Produkte" riemërohet në "Kodi", dhe "Emri" - në "Produkt", etj.

Pastaj krijohet një objekt biznesi i shitjeve. Një objekt biznesi është një tryezë e sheshtë mbi bazën e së cilës formohet një kub shumëdimensional. Kur krijoni një objekt biznesi, tabelat "Produkte" dhe "Oferta" kombinohen nga fusha "Kodi" i produktit. Meqenëse të gjitha fushat e tabelave nuk do të kërkohet të shfaqen në raport, objekti i biznesit përdor vetëm fushat "Artikulli", "Data" dhe "Shuma".

Në shembullin tonë, bazuar në objektin e biznesit "Shitje", është krijuar një raport për shitjet e mallrave sipas muajve.

Kur punon me një raport interaktiv, përdoruesi mund të vendosë kushtet e filtrimit dhe grupimit me të njëjtat lëvizje të thjeshta të miut. Në këtë pikë, klienti ROLAP akseson të dhënat në cache. Klienti i serverit OLAP gjeneron një pyetje të re në bazën e të dhënave shumëdimensionale. Për shembull, duke aplikuar një filtër produkti në raportin e shitjeve, mund të merrni një raport mbi shitjet e produkteve me interes për ne.

Të gjitha cilësimet për një aplikacion OLAP mund të ruhen në një depo të dedikuar të meta të dhënave, në një aplikacion ose në një depo të sistemit shumëdimensional të bazës së të dhënave.Zbatimi varet nga produkti specifik i softuerit.

Gjithçka që përfshihet në këto aplikacione është një pamje standarde e ndërfaqes, funksione dhe strukturë të paracaktuara dhe rregullime të shpejta për situata pak a shumë standarde. Për shembull, paketat financiare janë të njohura. Aplikacionet financiare të ndërtuara paraprakisht do t'i lejojnë profesionistët të përdorin instrumente financiare të njohura pa pasur nevojë të hartojnë një strukturë bazë të dhënash ose forma dhe raporte të zakonshme.

Interneti është një formë e re e klientit. Përveç kësaj, ajo mban vulën e teknologjive të reja; një tufë me zgjidhjet e internetit ndryshojnë ndjeshëm në aftësitë e tyre në përgjithësi dhe në cilësinë e një zgjidhjeje OLAP në veçanti. Ka shumë përparësi për të gjeneruar raporte OLAP përmes internetit. Më e rëndësishmja është mungesa e nevojës për softuer të specializuar për aksesimin e informacionit. Kjo i kursen kompanisë shumë kohë dhe para.

6. Zgjedhja e arkitekturës së aplikacionit OLAP.

Kur zbatoni një sistem informacioni-analitik, është e rëndësishme të mos bëni gabim në zgjedhjen e arkitekturës së një aplikacioni OLAP. Përkthimi fjalë për fjalë i termit Proces Analitik On-Line - "përpunimi analitik on-line" - shpesh merret fjalë për fjalë në kuptimin që të dhënat që hyjnë në sistem analizohen shpejt. Ky është një mashtrim - efikasiteti i analizës nuk lidhet në asnjë mënyrë me kohën reale të përditësimit të të dhënave në sistem. Kjo karakteristikë i referohet kohës së përgjigjes së sistemit OLAP ndaj kërkesave të përdoruesve. Në të njëjtën kohë, të dhënat e analizuara shpesh janë një fotografi e informacionit "për dje", nëse, për shembull, të dhënat në depo përditësohen një herë në ditë.

Në këtë kontekst, përkthimi i OLAP si "përpunim analitik interaktiv" është më i saktë. Është aftësia për të analizuar të dhënat në një mënyrë interaktive që dallon sistemet OLAP nga sistemet për përgatitjen e raporteve të rregulluara.

Një veçori tjetër e përpunimit interaktiv në formulimin e themeluesit të OLAP, E. Codd, është aftësia për të "kombinuar, parë dhe analizuar të dhënat në terma të dimensioneve të shumëfishta, domethënë në mënyrën më të kuptueshme për analistët e korporatave". Për vetë Codd, termi OLAP tregon një mënyrë jashtëzakonisht specifike të paraqitjes së të dhënave në një nivel konceptual - shumëdimensionale. Në nivelin fizik, të dhënat mund të ruhen në baza të të dhënave relacionale, por në realitet, mjetet OLAP tentojnë të punojnë me baza të të dhënave shumëdimensionale në të cilat të dhënat organizohen në formën e një hiperkubi (Figura 1).

Foto 1. OLAP- kub (hiperkub, metakub)

Në të njëjtën kohë, rëndësia e këtyre të dhënave përcaktohet nga momenti kur hiperkubi mbushet me të dhëna të reja.

Është e qartë se koha e formimit të një baze të dhënash shumëdimensionale varet ndjeshëm nga sasia e të dhënave të ngarkuara në të, kështu që është e arsyeshme të kufizohet kjo sasi. Por si të mos ngushtohen mundësitë e analizës dhe të privohen përdoruesi nga aksesi në të gjitha informacionet me interes? Ka dy rrugë alternative: Analizo pastaj pyet ("Analizo së pari - pastaj kërko informacion shtesë") dhe Pyet pastaj analizo ("Së pari kërko të dhënat - pastaj analizo").

Ndjekësit e rrugës së parë sugjerojnë ngarkimin e informacionit të përgjithësuar në një bazë të dhënash shumëdimensionale, për shembull, rezultatet mujore, tremujore, vjetore për departamentet. Dhe nëse është e nevojshme për të rafinuar të dhënat, përdoruesi kërkohet të gjenerojë një raport në një bazë të dhënash relacionale që përmban përzgjedhjen e kërkuar, për shembull, sipas ditëve për një departament të caktuar ose sipas muajve dhe punonjësve të një departamenti të zgjedhur.

Përkrahësit e mënyrës së dytë, përkundrazi, sugjerojnë që përdoruesi, para së gjithash, të vendosë për të dhënat që do të analizojë dhe t'i ngarkojë ato në një mikrokub - një bazë të dhënash të vogël shumëdimensionale. Të dyja qasjet ndryshojnë në nivelin konceptual dhe kanë avantazhet dhe disavantazhet e tyre.

Përparësitë e qasjes së dytë përfshijnë "freskinë" e informacionit që përdoruesi merr në formën e një raporti shumëdimensional - "mikrokubi". Mikrokubi formohet në bazë të informacionit të kërkuar nga databaza aktuale relacionale. Puna me një mikrokub kryhet në një mënyrë interaktive - marrja e pjesëve të informacionit dhe detajimi i tij brenda kornizës së një mikrokubi kryhet menjëherë. Një tjetër pikë pozitive është se projektimi i strukturës dhe mbushja e mikrokubit kryhet nga përdoruesi "në fluturim", pa pjesëmarrjen e një administratori të bazës së të dhënave. Megjithatë, qasja gjithashtu vuan nga mangësi serioze. Përdoruesi nuk e sheh pamjen e madhe dhe duhet të vendosë paraprakisht për drejtimin e kërkimit të tij. Përndryshe, mikrokubi i kërkuar mund të jetë shumë i vogël dhe të mos përmbajë të gjitha të dhënat me interes, dhe përdoruesi do të duhet të kërkojë një mikrokub të ri, pastaj një të ri, pastaj një tjetër dhe një tjetër. Më pas, qasja e analizës Query zbaton mjetin BusinessObjects të kompanisë me të njëjtin emër dhe mjetet e platformës Company ContourIntersoft laboratori.

Me qasjen Analyze then query, sasia e të dhënave të ngarkuara në një bazë të dhënash shumëdimensionale mund të jetë mjaft e madhe, mbushja duhet të kryhet sipas rregullave dhe mund të marrë shumë kohë. Sidoqoftë, të gjitha këto mangësi shpërblehen më vonë, kur përdoruesi ka qasje në pothuajse të gjitha të dhënat e nevojshme në çdo kombinim. Referimi i të dhënave origjinale në bazën e të dhënave relacionale kryhet vetëm si mjeti i fundit, kur nevojitet informacion i detajuar, për shembull, në një faturë specifike.

Funksionimi i një baze të dhënash të vetme shumëdimensionale praktikisht nuk ndikohet nga numri i përdoruesve që hyjnë në të. Ata lexojnë vetëm të dhënat e disponueshme atje, ndryshe nga qasja Query pastaj analizojnë, në të cilën numri i mikrokubeve në rastin limit mund të rritet me të njëjtin ritëm si numri i përdoruesve.

Me këtë qasje rritet ngarkesa në shërbimet e IT, të cilat përveç atyre relacionale detyrohen të shërbejnë edhe baza të të dhënave shumëdimensionale.Janë këto shërbime që janë përgjegjëse për përditësimin automatik në kohë të të dhënave në bazat e të dhënave shumëdimensionale.

Përfaqësuesit më të shquar të qasjes "Analizo pastaj pyet" janë mjetet PowerPlay dhe Impromptu të Cognos.

Zgjedhja e qasjes dhe e mjetit që e zbaton varet kryesisht nga qëllimi i ndjekur: gjithmonë duhet të balanconi ndërmjet kursimit të buxhetit dhe përmirësimit të cilësisë së shërbimit të përdoruesit përfundimtar. Njëkohësisht duhet pasur parasysh se në planin strategjik krijimi i sistemeve informative dhe analitike synon arritjen e një avantazhi konkurrues dhe jo shmangien e kostos së automatizimit. Për shembull, një sistem informacioni dhe analitik i korporatës mund të sigurojë informacionin e nevojshëm, në kohë dhe të besueshëm për një kompani, publikimi i të cilave për investitorët e mundshëm do të sigurojë transparencën dhe parashikueshmërinë e kësaj kompanie, e cila do të bëhet në mënyrë të pashmangshme një kusht për atraktivitetin e saj investues.

7. Sferat e aplikimit të teknologjive OLAP.

OLAP është i zbatueshëm kudo ku ka një detyrë të analizimit të të dhënave multifaktoriale. Në përgjithësi, nëse keni një tabelë me të dhëna që ka të paktën një kolonë përshkruese (dimension) dhe një kolonë me numra (masa ose fakte), një mjet OLAP zakonisht do të jetë një mjet efektiv për analizimin dhe gjenerimin e raporteve.

Konsideroni disa fusha të aplikimit të teknologjive OLAP të marra nga jeta reale.

1. Shitjet.

Bazuar në analizën e strukturës së shitjeve, zgjidhen çështjet e nevojshme për marrjen e vendimeve menaxheriale: ndryshimi i gamës së mallrave, çmimet, mbyllja dhe hapja e dyqaneve, degëve, përfundimi dhe nënshkrimi i kontratave me tregtarët, kryerja ose përfundimi i fushatave reklamuese, etj.

2. Blerja.

Detyra është e kundërta e analizës së shitjeve. Shumë ndërmarrje blejnë komponentë dhe materiale nga furnitorët. Tregtarët blejnë mallra për rishitje. Ka shumë detyra të mundshme në analizën e blerjeve, nga planifikimi i parave të gatshme bazuar në përvojën e kaluar, deri te kontrollin mbi menaxherët duke zgjedhur furnitorët.

3. Çmimet.

Analiza e blerjeve shkrihet me analizën e çmimeve të tregut. Qëllimi i kësaj analize është të optimizojë kostot, të zgjedhë ofertat më të favorshme.

4. Marketingu.

Me analizë marketingu nënkuptojmë vetëm fushën e analizës së blerësve ose klientëve-konsumatorëve të shërbimeve. Detyra e kësaj analize është pozicionimi i saktë i mallrave, identifikimi i grupeve të blerësve për reklamat e synuara dhe optimizimi i asortimentit. Detyra e OLAP në këtë rast është t'i japë përdoruesit një mjet që shpejt, me shpejtësinë e mendimit, të marrë përgjigje për pyetjet që lindin në mënyrë intuitive gjatë analizës së të dhënave.

5. Magazina.

Analiza e strukturës së bilanceve të stokut në magazinë sipas llojeve të mallrave, magazina, analiza e jetëgjatësisë së mallrave, analiza e dërgesës nga marrësit dhe shumë lloje të tjera të analizave të rëndësishme për ndërmarrjen janë të mundshme nëse organizata ka kontabilitet depo.

6. Rrjedha e parasë.

Kjo është një fushë e tërë e analizës që ka shumë shkolla dhe metoda. Teknologjia OLAP mund të shërbejë si një mjet për zbatimin ose përmirësimin e këtyre teknikave, por jo një zëvendësim për to. Flukset monetare të fondeve jo-monetare dhe ato të parave të gatshme analizohen në kontekstin e operacioneve të biznesit, palëve, monedhave dhe kohës për të optimizuar flukset, për të siguruar likuiditet, etj. Përbërja e matjeve varet fuqishëm nga karakteristikat e biznesit, industrisë, metodologjisë.

7. Buxheti.

Një nga fushat më pjellore të aplikimit të teknologjive OLAP. Jo më kot asnjë sistem buxhetor modern nuk konsiderohet i plotë pa praninë e një pakete mjetesh OLAP për analizën e buxhetit në përbërjen e tij. Shumica e raporteve buxhetore ndërtohen lehtësisht në bazë të sistemeve OLAP. Në të njëjtën kohë, raportet i përgjigjen një gamë shumë të gjerë pyetjesh: analiza e strukturës së shpenzimeve dhe të ardhurave, krahasimi i shpenzimeve për artikuj të caktuar në departamente të ndryshme, analiza e dinamikës dhe tendencave të shpenzimeve për artikuj të caktuar, analiza e kostos dhe fitimit. .

8. Llogaritë e kontabilitetit.

Një bilanc klasik i përbërë nga një numër llogarie dhe që përmban bilancet hyrëse, qarkullimet dhe bilancet dalëse mund të analizohet në mënyrë të përsosur në një sistem OLAP. Përveç kësaj, sistemi OLAP mund të llogarisë automatikisht dhe shumë shpejt bilancet e konsoliduara të një organizate shumë-degëshe, bilancet mujore, tremujore dhe vjetore, bilancet e agreguara sipas hierarkisë së llogarisë, bilancet analitike bazuar në karakteristikat analitike.

9. Raportimi financiar.

Një sistem raportimi i ndërtuar teknologjikisht nuk është gjë tjetër veçse një grup treguesish të emërtuar me vlera për datën që duhet të grupohen dhe përmblidhen në seksione të ndryshme për të marrë raporte specifike. Kur është kështu, shfaqja dhe printimi i raporteve zbatohet më lehtë dhe më lirë në sistemet OLAP. Në çdo rast, sistemi i raportimit të brendshëm të ndërmarrjes nuk është aq konservator dhe mund të ridizajnohet për të kursyer punën teknike në raportim dhe për të fituar aftësi shumëdimensionale të analizës operacionale.

10. Trafiku i faqes.

Skedari i regjistrit të serverit të Internetit është shumëdimensional në natyrë, dhe për këtë arsye i përshtatshëm për analizën OLAP. Faktet janë: numri i vizitave, numri i vizitave, koha e kaluar në faqe dhe informacione të tjera të disponueshme në regjistër.

11. Vëllimet e prodhimit.

Ky është një shembull tjetër i analizës statistikore. Kështu, është e mundur të analizohen vëllimet e patateve të rritura, çelikut të shkrirë, mallrave të prodhuara.

12. Konsumi i materialeve harxhuese.

Imagjinoni një fabrikë të përbërë nga dhjetëra punishte që konsumojnë ftohës, lëngje shpëlarëse, vajra, lecka, letër zmerile - qindra artikuj të konsumit. Planifikimi i saktë dhe optimizimi i kostos kërkojnë një analizë të plotë të konsumit aktual të materialeve harxhuese.

13. Përdorimi i ambienteve.

Një tjetër lloj analize statistikore. Shembuj: analiza e ngarkesës së klasave, ndërtesave dhe ambienteve të marra me qira, përdorimi i sallave të konferencave, etj.

14. Qarkullimi i personelit në ndërmarrje.

Analiza e qarkullimit të stafit në ndërmarrje në kontekstin e degëve, departamenteve, profesioneve, nivelit të arsimimit, gjinisë, moshës, kohës.

15. Transporti i pasagjerëve.

Analiza e numrit të biletave të shitura dhe shumave sipas sezonit, destinacionit, llojeve të vagonave (klasave), llojeve të trenave (avionëve).

Kjo listë nuk është e kufizuar në fushat e aplikimit. OLAP - teknologjitë. Për shembull, merrni parasysh teknologjinë OLAP - analiza e shitjeve.

8. Shembull përdorimi OLAP -teknologji për analiza në fushën e shitjeve.

Projektimi i paraqitjes shumëdimensionale të të dhënave për OLAP -analiza fillon me formimin e një harte të matjeve. Për shembull, kur analizohen shitjet, mund të jetë e dobishme të identifikohen segmentet individuale të tregut (klientët në zhvillim, të qëndrueshëm, të mëdhenj dhe të vegjël, gjasat e klientëve të rinj, etj.) dhe të vlerësohen vëllimet e shitjeve sipas produkteve, territoreve, klientëve, segmenteve të tregut, shpërndarjes kanalet dhe madhësitë e porosive. Këto drejtime formojnë rrjetin koordinativ të paraqitjes shumëdimensionale të shitjeve - strukturën e dimensioneve të saj.

Duke qenë se veprimtaria e çdo ndërmarrjeje ecën në kohë, pyetja e parë që lind në analizë është çështja e dinamikës së zhvillimit të biznesit. Organizimi i saktë i boshtit kohor do t'i japë një përgjigje cilësore kësaj pyetjeje. Zakonisht boshti kohor ndahet në vite, tremujorë dhe muaj. Ndoshta edhe më shumë duke u ndarë në javë dhe ditë. Struktura e dimensionit kohor është formuar duke marrë parasysh shpeshtësinë e marrjes së të dhënave; mund të përcaktohet edhe nga shpeshtësia e kërkimit të informacionit.

Dimensioni i "grupit të mallrave" është krijuar për të pasqyruar strukturën e produkteve të shitura sa më shumë që të jetë e mundur. Në të njëjtën kohë, është e rëndësishme të ruani një ekuilibër të caktuar në mënyrë që nga njëra anë të shmangni detajet e tepërta (numri i grupeve duhet të jetë i dukshëm), dhe nga ana tjetër, të mos humbasë një segment i rëndësishëm tregu.

Dimensioni "Klientë" pasqyron strukturën e shitjeve sipas zonës gjeografike. Çdo dimension mund të ketë hierarkitë e veta, për shembull, në këtë dimension mund të jetë një strukturë: Vendet - Rajonet - Qytetet - Klientët.

Për të analizuar performancën e departamenteve, duhet të krijoni dimensionin tuaj. Për shembull, mund të dallohen dy nivele të hierarkisë: departamentet dhe departamentet e përfshira në to, të cilat duhet të pasqyrohen në dimensionin "Nënndarjet".

Në fakt, dimensionet "Koha", "Produktet", "Klientë" përcaktojnë plotësisht hapësirën e zonës së temës.

Për më tepër, është e dobishme që kjo hapësirë ​​të ndahet në zona të kushtëzuara, duke marrë si bazë karakteristikat e llogaritura, për shembull, diapazonin e vëllimit të transaksionit në terma të vlerës. Më pas, i gjithë biznesi mund të ndahet në një numër vargjesh kostosh në të cilat kryhet. Në këtë shembull, ju mund të kufizoni veten në treguesit e mëposhtëm: sasia e shitjeve të mallrave, numri i mallrave të shitura, shuma e të ardhurave, numri i transaksioneve, numri i klientëve, vëllimi i blerjeve nga prodhuesit.

OLAP - kubi për analizë do të duket si (Fig. 2):


Figura 2.OLAP– një kub për analizimin e vëllimit të shitjeve

Është pikërisht një grup i tillë tredimensional për sa i përket OLAP që quhet kub. Në fakt, nga pikëpamja e matematikës strikte, një grup i tillë nuk do të jetë gjithmonë një kub: për një kub real, numri i elementeve në të gjitha dimensionet duhet të jetë i njëjtë, ndërsa kubet OLAP nuk kanë një kufizim të tillë. Një kub OLAP nuk duhet të jetë fare 3D. Mund të jetë dy-dimensionale dhe shumëdimensionale - në varësi të problemit që zgjidhet. Produktet serioze OLAP janë të dizajnuara për rreth 20 dimensione. Aplikacionet më të thjeshta desktop mbështesin rreth 6 dimensione.

Larg nga të gjithë elementët e kubit duhet të plotësohen: nëse nuk ka informacion në lidhje me shitjet e Produktit 2 te Klienti 3 në tremujorin e tretë, vlera në qelizën përkatëse thjesht nuk do të përcaktohet.

Sidoqoftë, vetë kubi nuk është i përshtatshëm për analizë. Nëse është ende e mundur të përfaqësohet ose të përshkruhet në mënyrë adekuate një kub tredimensional, atëherë nga gjashtë ose nëntëmbëdhjetë dimensionale gjërat janë shumë më keq. Prandaj, tabelat e zakonshme dydimensionale nxirren nga një kub shumëdimensional përpara përdorimit. Ky operacion quhet "prerja" e kubit. Analisti, si të thuash, merr dhe "pret" përmasat e kubit sipas shenjave me interes për të. Në këtë mënyrë, analisti merr një fetë dydimensionale të kubit (raport) dhe punon me të. Struktura e raportit është paraqitur në Figurën 3.

Figura 3Struktura e raportit analitik

Le të presim kubin tonë OLAP dhe të marrim një raport shitjesh për tremujorin e tretë, do të duket kështu (Fig. 4).

Figura 4Raporti i Shitjeve të Tremujorit të Tretë

Mund ta prisni kubin përgjatë boshtit tjetër dhe të merrni një raport mbi shitjet e grupit të produkteve 2 gjatë vitit (Fig. 5).

Figura 5Raporti tremujor i shitjeve të produktit 2

Në mënyrë të ngjashme, ju mund të analizoni marrëdhënien me klientin 4, prerja e kubit sipas etiketës Klientë(Fig. 6)

Figura 6Raport mbi furnizimin e mallrave për konsumatorin 4

Mund të detajoni raportin sipas muajit ose të flisni për furnizimin e mallrave në një degë specifike të klientit.

Dallimi kryesor midis fakteve dhe informacionit është se ne i marrim dhe i mbajmë shënim të dhënat, por ne mund ta përdorim informacionin në avantazhin tonë. Përafërsisht, informacioni analizohet dhe sistemohet të dhëna. Falë informacionit të marrë në kohë, shumë firma arrijnë të mbijetojnë si në kushtet e krizës financiare ashtu edhe përballë konkurrencës së ashpër. Nuk mjafton të mbledhësh fakte dhe të kesh të gjitha të dhënat e nevojshme. Ju ende duhet të jeni në gjendje t'i analizoni ato. Për të lehtësuar punën e njerëzve të thirrur për të marrë vendime të rëndësishme biznesi, janë zhvilluar sisteme të ndryshme mbështetëse. Është për këtë qëllim që janë zhvilluar sisteme të ndryshme komplekse që lejojnë analizimin e grupeve të mëdha të të dhënave heterogjene dhe shndërrimin e tyre në informacion të dobishëm për një përdorues biznesi. Fusha në zhvillim e inteligjencës së biznesit synon të përmirësojë kontrollin e procesit të sistemeve të biznesit, nëpërmjet përdorimit të ruajtjes së të dhënave dhe teknologjisë.

Tregu i sistemeve të informacionit të biznesit ofron sot një gamë të larmishme zgjidhjesh që ndihmojnë një ndërmarrje të organizojë kontabilitetin e menaxhimit, të sigurojë menaxhimin operacional të prodhimit dhe shitjeve dhe të ndërveprojë në mënyrë efektive me klientët dhe furnitorët.

Një vend i veçantë në tregun e sistemeve të biznesit është i zënë nga produkte softuerësh analitikë të krijuar për të mbështetur vendimmarrjen në nivelin strategjik të menaxhimit të ndërmarrjes. Dallimi kryesor midis mjeteve të tilla dhe sistemeve të menaxhimit operacional është se këto të fundit ofrojnë menaxhimin e ndërmarrjes në "mënyrën e funksionimit", domethënë zbatimin e një programi prodhimi të mirëpërcaktuar, ndërsa sistemet analitike të nivelit strategjik ndihmojnë menaxhimin e ndërmarrjes për të zhvilluar vendimet në "mënyrën e zhvillimit".

Shkalla e ndryshimeve të kryera mund të ndryshojë nga ristrukturimi i thellë deri tek rinovimi i pjesshëm i teknologjive në vendet e prodhimit individual, por, në çdo rast, vendimmarrësit po shqyrtojnë alternativat e zhvillimit nga të cilat varet fati i ndërmarrjes në planin afatgjatë.

Sado i fuqishëm dhe i zhvilluar të jetë sistemi informativ i një ndërmarrje, ai nuk mund të ndihmojë në zgjidhjen e këtyre çështjeve, së pari, sepse ai është i akorduar me procese biznesi të palëvizshme, të vendosura, dhe së dyti, nuk ka dhe nuk mund të ketë informacione për marrjen e vendimeve në lidhje me të rejat. fushat e biznesit, teknologjitë e reja, vendimet e reja organizative.

Falë teknologjisë së përpunimit dhe analizës së të dhënave OLAP (Përpunimi Analitik On-Line), çdo organizatë mund të marrë pothuajse menjëherë (brenda pesë sekondave) të dhënat e nevojshme për punë. OLAP mund të përkufizohet shkurtimisht me pesë fjalë kyçe.

FAST (Fast) - kjo do të thotë që koha e kërkimit dhe lëshimit të informacionit të nevojshëm nuk zgjat më shumë se pesë sekonda. Kërkesat më të thjeshta përpunohen në një sekondë, dhe vetëm disa kërkesa komplekse kanë një kohë përpunimi prej më shumë se njëzet sekondash. Për të arritur këtë rezultat përdoren metoda të ndryshme, nga format e veçanta të ruajtjes së të dhënave deri tek llogaritjet e gjera paraprake. Kështu, ju mund të merrni një raport në një minutë, të cilit më parë duheshin ditë për t'u përgatitur.

ANALIZA (Analytic) thotë se sistemi mund të kryejë çdo analizë, statistikore dhe logjike, dhe më pas e ruan atë në një formë të aksesueshme.

SHARED (Shared) do të thotë që sistemi ofron privatësinë e kërkuar, deri në nivelin e qelizës

MULTIDIMENSIONAL (Multidimensional) - është karakteristika kryesore e OLAP. Sistemi duhet të mbështesë plotësisht hierarkitë dhe hierarkitë e shumta, pasi kjo është mënyra më logjike për të analizuar si biznesin ashtu edhe aktivitetet e organizatave.

INFORMACION (Informacion). Informacioni i duhur duhet të dorëzohet aty ku nevojitet.

Puna e një organizate grumbullon gjithmonë të dhëna në lidhje me fushëveprimin e aktiviteteve të saj, të cilat ndonjëherë ruhen në vende krejtësisht të ndryshme dhe bashkimi i tyre është i vështirë dhe kërkon shumë kohë. Është në mënyrë që të përshpejtohet përvetësimi i të dhënave për të testuar hipotezat e biznesit në zhvillim që është zhvilluar teknologjia e përpunimit interaktiv analitik të të dhënave, ose OLAP. Qëllimi kryesor i sistemeve të tilla OLAP është t'i përgjigjet shpejt kërkesave arbitrare të përdoruesve. Një nevojë e tillë shpesh lind kur zhvillohet një projekt i rëndësishëm biznesi, kur zhvilluesi ka nevojë për një hipotezë pune që ka lindur. Më shpesh, informacioni që i nevojitet përdoruesit duhet të paraqitet në formën e një lloj varësie - për shembull, se si vëllimi i shitjeve varet nga kategoria e produktit, nga rajoni i shitjeve, nga sezoni, etj. Falë OLAP, ai është në gjendje të marrë menjëherë të dhënat e nevojshme në paraqitjen e dëshiruar për periudhën e zgjedhur.

Teknologjia interaktive OLAP ju lejon të transformoni grumbuj të mëdhenj raportesh dhe masa të dhënash në informacione të dobishme dhe të sakta që do të ndihmojnë një punonjës të marrë një vendim të informuar biznesi ose financiar në kohën e duhur.

Përveç kësaj, falë OLAP, efikasiteti i përpunimit rritet dhe përdoruesi mund të marrë sasi të mëdha informacionesh të renditura (të grumbulluara) pothuajse menjëherë. Falë OLAP, përdoruesi mund të shohë qartë se sa me efikasitet funksionon organizata e tij, ka aftësinë për t'iu përgjigjur shpejt dhe fleksibël ndryshimeve të jashtme dhe ka aftësinë për të minimizuar humbjet financiare të organizatës së tij. OLAP ofron informacion të saktë që përmirëson vendimmarrjen.

E vetmja pengesë e sistemeve të inteligjencës së biznesit është kostoja e tyre e lartë. Krijimi i një magazine informacioni personal kërkon kohë dhe shumë para.

Përdorimi i teknologjisë OLAP në biznes ju lejon të merrni shpejt informacionin e nevojshëm, i cili, me kërkesë të përdoruesit, mund të paraqitet në formën e zakonshme - raporte, grafikë ose tabela.

Procedurat për integrimin e sistemit të strukturave të biznesit bazohen në përdorimin e zgjidhjeve të përbashkëta të ERP, CRM dhe SCM. Në shumë raste, sistemet furnizohen nga prodhues të ndryshëm, dhe të dhënat e importuara duhet të kalojnë përmes një procesi rakordimi dhe prezantimi të të dhënave si të dhëna heterogjene. Në një mjedis biznesi, supozohet një kërkesë e paqartë - një analizë e plotë e të dhënave, e cila përfshin shikimin e raporteve të konsoliduara nga këndvështrime të ndryshme.

Prodhues të ndryshëm kanë mekanizma të ndryshëm të paraqitjes së të dhënave. Procedura e paraqitjes heterogjene përfshin ekstraktin, transformimin dhe ngarkesën (ETL). Për shembull, në Shërbimet e Analizës së Microsoft SQL Server 2005, problemi i konsolidimit të të dhënave zbatohet duke përdorur Pamjet e burimit të të dhënave - llojet e burimeve të të dhënave që përshkruajnë modelet e paraqitjes analitike.

Aplikacione biznesi të bazuara në teknologjitë OLAP, shembuj të produkteve. Aplikimet më të zakonshme të teknologjive OLAP janë:

Analiza e të dhënave.

Detyra për të cilën u përdorën fillimisht mjetet OLAP dhe ende mbeten më të njohurat. Një model shumëdimensional i të dhënave, aftësia për të analizuar sasi të mëdha të dhënash dhe përgjigje e shpejtë ndaj kërkesave i bëjnë sisteme të tilla të domosdoshme për analizimin e shitjeve, aktiviteteve të marketingut, shpërndarjes dhe detyrave të tjera me një sasi të madhe të dhënash fillestare.

Shembuj produkti: Microsoft Excel Pivot Tables, Microsoft Analysis Services, SAP BW, Oracle Essbase, Oracle OLAP, Cognos PowerPlay, MicroStrategy, Business Objects.

Planifikimi-buxhetimi financiar.

Një model shumëdimensional ju lejon të futni njëkohësisht të dhëna dhe t'i analizoni lehtësisht ato (për shembull, planifikoni analizën e fakteve). Prandaj, një numër produktesh moderne të klasës CPM (Corporate Performance Management) përdorin modele OLAP%. Një detyrë e rëndësishme është llogaritja e pasme shumëdimensionale (backsolve, breakback, writeback), e cila ju lejon të llogaritni ndryshimet e kërkuara në qelizat e detajuara kur ndryshon vlera e grumbulluar. Është një mjet për analizën çfarë-nëse (çka-nëse), d.m.th. për të luajtur variante të ndryshme ngjarjesh gjatë planifikimit.

Shembuj produkti: Microsoft PerformancePint, Oracle EPB, Oracle OFA, Oracle Hyperion Planning, SAP SEM, Cognos Enterprise Planning, Geac.

konsolidimi financiar.

Konsolidimi i të dhënave në përputhje me standardet ndërkombëtare të kontabilitetit, duke marrë parasysh aksionet e pronësisë, monedhat e ndryshme dhe xhiron e brendshme, është një detyrë urgjente për shkak të kërkesave shtrënguese të organeve inspektuese (SOX, Basel II) dhe IPO-ve të kompanive. Teknologjitë OLAP bëjnë të mundur përshpejtimin e llogaritjes së raporteve të konsoliduara dhe rritjen e transparencës së të gjithë procesit.

Shembuj produkti: Oracle FCH, Oracle Hyperion FM, Cognos Controller.

Teknologjitë e ruajtjes së të dhënave dhe të përpunimit analitik në linjë (OLAP).
janë elementë të rëndësishëm të mbështetjes së vendimeve të biznesit, të cilat po bëhen gjithnjë e më shumë pjesë përbërëse e çdo industrie. Përdorimi i teknologjive OLAP si një mjet për inteligjencën e biznesit jep më shumë kontroll dhe akses në kohë në strategji
informacion që kontribuon në marrjen e vendimeve efektive.
Kjo ofron një mundësi për të modeluar parashikime realiste dhe përdorim më efikas të burimeve. OLAP i mundëson një organizate të përgjigjet më shpejt ndaj kërkesave të tregut.

Bibliografi:

1. Erik Tomsen. Zgjidhjet OLAP: Ndërtimi i sistemeve shumëdimensionale të informacionit Botimi i dytë. Wiley Computer Publishing John Wiley & Sons, Inc., 2002.

2. Letër e bardhë e këshillit të OLAP, http://www.olapcouncil.org/research/whtpaply.htm

3. Gerd Stumme dhe Bernhard Ganter. Analiza e konceptit formal _ Bazat matematikore.

Artikujt kryesorë të lidhur