Cum se configurează smartphone-uri și PC-uri. Portal informativ
  • Acasă
  • Erori
  • Cine este utilizatorul sistemelor olap. rapoartele OLAP

Cine este utilizatorul sistemelor olap. rapoartele OLAP

OLAP (OnLine Analytical Processing) nu este numele unui produs anume, ci o întreagă tehnologie de procesare analitică online, care presupune analiza și raportarea datelor. Utilizatorului i se pune la dispoziție un tabel multidimensional care rezumă automat datele în diverse secțiuni și vă permite să gestionați rapid calculele și forma raportului.

Deși în unele publicații procesarea analitică este numită atât online, cât și interactiv, adjectivul „operațional” reflectă cel mai exact sensul tehnologiei OLAP. Dezvoltarea de soluții de management de către un manager se încadrează în categoria zonelor cele mai fals susceptibile de automatizare. Cu toate acestea, astăzi există o oportunitate de a ajuta un manager în elaborarea deciziilor și, cel mai important, de a accelera semnificativ procesul de elaborare a deciziilor, selecția și adoptarea acestora.

Sistemele de asistență pentru decizii au de obicei mijloace de a furniza utilizatorului date agregate pentru diverse mostre din setul inițial într-o formă care este convenabilă pentru percepție și analiză. De regulă, așa funcții agregate formează un set de date multidimensionale, numit adesea hipercub sau metacub, ale cărui axe conțin parametri, iar celulele - datele agregate care depind de aceștia - și astfel de date pot fi stocate în tabele relaționale, dar în acest caz este vorba O organizare logica date, și nu despre implementarea fizică a stocării acestora.

De-a lungul fiecărei axe, datele pot fi organizate într-o ierarhie reprezentând diferite niveluri de detaliu.

În funcție de dimensiunile din modelul multidimensional, factorii care afectează activitățile întreprinderii (de exemplu: timpul, produsele, ramurile companiei etc.) sunt amânați. Cubul OLAP rezultat este apoi completat cu indicatori ai activităților întreprinderii (prețuri, vânzări, plan, profit, gospodării etc.). Trebuie remarcat faptul că, spre deosebire de un cub geometric, fețele unui cub OLAP nu trebuie să fie de aceeași dimensiune. Această completare poate fi efectuată atât cu date reale ale sistemelor operaționale, cât și previzionate pe baza datelor istorice. Dimensiunile hipercubului pot fi complexe, ierarhice, iar între ele pot fi stabilite relații. În procesul de analiză, utilizatorul poate schimba punctul de vedere asupra datelor (așa-numita operațiune de schimbare a perspectivei logice), vizând astfel datele în diferite secțiuni și rezolvând probleme specifice. Pe cuburi pot fi efectuate diferite operații, inclusiv prognoza și planificarea condiționată (analiza ce se întâmplă dacă).

Datorită acestui model de date, utilizatorii pot formula interogări complexe, pot genera rapoarte și pot prelua subseturi de date. Procesarea analitică operațională vă permite să simplificați și să accelerați semnificativ procesul de pregătire și luare a deciziilor de către personalul de conducere. Prelucrarea analitică online are scopul de a transforma datele în informații. Este fundamental diferit de procesul tradițional de sprijinire a deciziilor, care se bazează cel mai adesea pe luarea în considerare a rapoartelor structurate.


Tehnologia OLAP se referă la tipul de minerit și implică 12 principii:

1. Conceptual reprezentare multidimensională ... Utilizatorul analist vede lumea întreprinderii ca fiind de natură multidimensională și, în consecință, modelul OLAP ar trebui să fie multidimensional în esența sa.

2. Transparenţă... Arhitectura sistemului OLAP ar trebui să fie deschisă, permițând utilizatorului, oriunde s-ar afla, să comunice folosind un instrument analitic – clientul – către server.

3. Disponibilitate... Un utilizator analist OLAP ar trebui să poată efectua analize bazate pe o schemă conceptuală comună care conține date la nivel de întreprindere într-o bază de date relațională, precum și date din bazele de date moștenite, metode de acces partajat și un model analitic comun. Sistemul OLAP ar trebui să acceseze numai datele care sunt efectiv necesare, nu să se aplice principiu general„pâlnie de bucătărie”, care implică o introducere inutilă.

4. Productivitate constantă la elaborarea rapoartelor... Pe măsură ce numărul de dimensiuni sau dimensiunea bazei de date crește, utilizatorul analitic nu ar trebui să simtă o degradare semnificativă a performanței.

5. Arhitectura client-server... Majoritatea datelor care trebuie procesate online astăzi sunt pe mainframe cu acces la stațiile de lucru ale utilizatorilor printr-o rețea LAN. Aceasta înseamnă că produsele OLAP trebuie să poată rula într-un mediu client-server.

6. Multidimensionalitate generală... Fiecare dimensiune ar trebui aplicată indiferent de structura și capacitățile sale operaționale. Structuri de bază datele, formulele și formatele de rapoarte nu ar trebui să fie mutate către nicio dimensiune.

7. Managementul dinamic al matricelor rare... Designul fizic al unui instrument OLAP trebuie să fie pe deplin adaptat modelului analitic specific pentru gestionarea optimă a matricelor rare. Rarețea (măsurată ca procent celule goale toate posibile) este una dintre caracteristicile diseminării datelor.

8. Suport multiplayer... Instrumentul OLAP trebuie să ofere capabilități partajarea solicitarea și completarea mai multor utilizatori analiști, menținând în același timp integritatea și securitatea.

9. Încrucișări nelimitate... Diverse operații, datorită naturii lor ierarhice, pot reprezenta relații de dependență în modelul OLAP, adică sunt încrucișate. Implementarea lor nu ar trebui să solicite utilizatorului analist să redefinească aceste calcule și operațiuni.

10. Manipularea intuitivă a datelor... Vizualizarea utilizatorului analitică a dimensiunilor definite în modelul analitic ar trebui să conțină toate informatie necesara pentru a efectua acțiuni pe modelul OLAP, i.e. nu ar trebui să necesite utilizarea unui sistem de meniu sau a altor operațiuni cu interfețe cu utilizatorul multiple.

11. Opțiuni flexibile primirea rapoartelor... Instrumentul de raportare ar trebui să fie sintetizate date sau informații rezultate din modelul de date în orice orientare posibilă. Aceasta înseamnă că rândurile, coloanele sau paginile raportului trebuie să afișeze mai multe dimensiuni ale modelului OLAP în același timp cu posibilitatea de a afișa orice subset de elemente (valori) conținute în dimensiune, și în orice ordine.

12. Dimensiune și număr nelimitat de niveluri de agregare... Cercetare asupra numărului posibil măsurătorile necesare cerute în modelul analitic au arătat că până la 19 măsurători pot fi utilizate simultan de către analistul utilizator. De aici recomandarea cu privire la numărul de dimensiuni suportate de sistemul OLAP. Mai mult, fiecare dintre dimensiunile generale nu ar trebui să fie limitată de numărul de niveluri de agregare definite de utilizator.

CalliGraph, Business Intelligence poate fi specificat ca sisteme OLAP specializate oferite în prezent pe piață.

Pentru a rezolva sarcini simple de analiză a datelor, este posibil să se utilizeze solutie bugetara- birou aplicații Excelși Microsoft Access, care conțin mijloace elementare Tehnologii OLAP care vă permit să creați tabele pivotși să construiască diverse rapoarte pe baza acestora.

Sistemele informatice ale unei întreprinderi serioase, de regulă, conțin aplicații concepute pentru analiza complexă a datelor, dinamica acestora, tendințele etc. În consecință, managementul de vârf devine principalii consumatori ai rezultatelor analizei. Această analiză are scopul în cele din urmă de a facilita luarea deciziilor. Iar pentru a lua orice decizie de management este necesar să avem informațiile necesare pentru aceasta, de obicei cantitative. Pentru a face acest lucru, este necesar să colectați aceste date din toate sistemele informaționale ale întreprinderii, să le aduceți într-un format comun și abia apoi să le analizați. Pentru aceasta, sunt create depozite de date.

Ce este un depozit de date?

De obicei, locul unde sunt colectate toate informațiile cu valoare analitică. Cerințele pentru astfel de stocări corespund definiției clasice OLAP, care va fi explicată mai jos.

Uneori, Depozitul are un alt scop - integrarea tuturor datelor întreprinderii, pentru a menține integritatea și relevanța informațiilor în cadrul tuturor sistemelor informaționale. Acea. stocarea acumulează nu numai informații analitice, ci aproape toate informațiile și le poate emite sub formă de directoare înapoi către restul sistemelor.

Un depozit de date tipic este de obicei diferit de o bază de date relațională tipică. În primul rând, bazele de date obișnuite sunt concepute pentru a ajuta utilizatorii să-și facă munca de zi cu zi, în timp ce depozitele de date sunt concepute pentru a lua decizii. De exemplu, vânzările de mărfuri și facturarea se realizează folosind o bază de date pentru procesarea tranzacțiilor, iar analiza dinamicii vânzărilor pe mai mulți ani, care vă permite să planificați lucrul cu furnizorii, se face folosind un depozit de date.

În al doilea rând, bazele de date obișnuite sunt supuse unor schimbări constante în timpul lucrului utilizatorului, iar depozitul de date este relativ stabil: datele din acesta sunt de obicei actualizate conform unui program (de exemplu, săptămânal, zilnic sau orar, în funcție de nevoi. ). În mod ideal, procesul de reaprovizionare este pur și simplu adăugarea de date noi pentru o anumită perioadă de timp, fără a modifica informațiile vechi aflate deja în depozit.

Și în al treilea rând, bazele de date obișnuite sunt cel mai adesea sursa datelor care intră în depozit. În plus, depozitul poate fi completat prin surse externe precum rapoartele statistice.

Cum este construit depozitul?

ETLconcept de bază: Trei pasi:
  • Extracție - extragerea datelor din surse externe într-un format ușor de înțeles;
  • Transformare - transformarea structurii datelor sursă în structuri care sunt convenabile pentru construirea unui sistem analitic;
Să mai adăugăm o etapă - curățarea datelor ( Curatenie) - procesul de eliminare a datelor irelevante sau de corectare a datelor eronate pe baza metodelor statistice sau expertizate. Pentru a nu genera ulterior rapoarte de tip „Vânzări pe anul 20011”.

Să revenim la analiză.

Ce este analiza și pentru ce este?

Analiza - explorarea datelor în scopul luării deciziilor. Sistemele analitice sunt numite așa - sisteme de sprijinire a deciziei ( DSS).

Aici merită să subliniem diferența dintre lucrul cu DSS dintr-un set simplu de rapoarte reglementate și ad-hoc. Analiza în DSS este aproape întotdeauna interactivă și iterativă. Acestea. analistul se adâncește în date, compunând și corectând interogări analitice și primește rapoarte, a căror structură poate să nu fie cunoscută în prealabil. Vom reveni la aceasta mai detaliat mai jos când discutăm despre limbajul de interogare. MDX.

OLAP

Sistemele de sprijinire a deciziei au de obicei mijloace de a furniza utilizatorului date agregate pentru diverse mostre din setul inițial într-o formă convenabilă pentru percepție și analiză (tabele, diagrame etc.). Abordarea tradițională a segmentării datelor sursă folosește extragerea unuia sau mai multor seturi de date multidimensionale (deseori numite hipercub sau metacub) din datele sursă, ale căror axe conțin atribute și ale căror celule sunt date cantitative agregate. (Mai mult, astfel de date pot fi stocate în tabele relaționale, dar în acest caz vorbim despre organizarea logică a datelor, și nu despre implementarea fizică a stocării acestora.) De-a lungul fiecărei axe, atributele pot fi organizate sub formă de ierarhii. reprezentând diferite niveluri de detaliu a acestora. Datorită acestui model de date, utilizatorii pot formula interogări complexe, pot genera rapoarte și pot prelua subseturi de date.

Tehnologia pentru analiza complexă a datelor multivariate se numește OLAP (On-Line Analytical Processing). OLAP este o componentă cheie a organizării tradiționale a depozitului de date. Conceptul OLAP a fost descris în 1993 de Edgar Codd, un renumit cercetător și autor de baze de date. model relațional date. În 1995, pe baza cerințelor stabilite de Codd, a fost formulat așa-numitul test Fast Analysis of Shared Multidimensional Information (FASMI), care include următoarele cerințe pentru aplicațiile de analiză multivariată:

  • furnizarea utilizatorului a rezultatelor analizei într-un timp rezonabil (de obicei nu mai mult de 5 s), chiar și cu prețul unei analize mai puțin detaliate;
  • capacitatea de a efectua orice analiză logică și statistică caracteristică a acestei aplicații, și salvându-l disponibil pentru Utilizator final formă;
  • acces multiutilizator la date cu suport de mecanisme de blocare adecvate si mijloace de acces autorizate;
  • reprezentarea conceptuală multidimensională a datelor, inclusiv sprijin deplin pentru ierarhii și ierarhii multiple (aceasta este o cerință cheie a OLAP);
  • capacitatea de a accesa orice informație necesară, indiferent de volumul și locația de stocare.
Trebuie remarcat faptul că funcționalitatea OLAP poate fi implementată căi diferiteîncepând cu cele mai simple instrumente de analiză a datelor în aplicații de birouși se termină cu distribuit sisteme analitice bazate pe produse server. Acestea. OLAP nu este o tehnologie, dar ideologie.

Înainte de a vorbi despre diferitele implementări OLAP, să aruncăm o privire mai atentă la ce sunt cuburile din punct de vedere logic.

Concepte multidimensionale

Vom folosi baza de date Northwind inclusă cu Microsoft pentru a ilustra principiile OLAP. SQL Serverși este o bază de date tipică care stochează informații despre tranzacțiile comerciale ale unui angro de produse alimentare. Aceste date includ informații despre furnizori, clienți, o listă de bunuri furnizate și categoriile acestora, date despre comenzi și bunuri comandate, o listă a angajaților companiei.

cub

Luați, de exemplu, tabelul Facturi1, care conține comenzile firmei. Câmpurile din acest tabel vor fi după cum urmează:
  • Data comandă
  • Țară
  • Oraș
  • Numele clientului
  • Companie de livrări
  • numele produsului
  • Cantitatea de bunuri
  • Pretul comenzii
Ce date agregate putem obține din această vedere? De obicei, acestea sunt răspunsuri la întrebări precum:
  • Care este valoarea totală a comenzilor efectuate de clienți dintr-o anumită țară?
  • Care este valoarea totală a comenzilor efectuate de clienți într-o anumită țară și livrate de o anumită companie?
  • Care este valoarea totală a comenzilor făcute de clienți dintr-o anumită țară într-un anumit an și livrate de o anumită companie?
Toate aceste date pot fi obținute din acest tabel cu interogări SQL grupate destul de evidente.

Rezultatul acestei interogări va fi întotdeauna o coloană de numere și o listă de atribute care o descriu (de exemplu, țara) - acesta este un set de date unidimensional sau, în termeni matematici, un vector.

Imaginați-vă că trebuie să obținem informații despre costul total al comenzilor din toate țările și distribuția acestora de către companiile furnizori - vom primi deja un tabel (matrice) de numere, unde furnizorii vor fi enumerați în titlurile coloanei, țările din titluri de rând și cantitatea de comenzi. Aceasta - matrice bidimensională date. Un astfel de set de date se numește tabel pivot ( masă rotativă) sau tabel încrucișat.

Dacă vrem să obținem aceleași date, dar tot în contextul anilor, atunci va apărea o altă modificare, adică. setul de date va deveni tridimensional (tensorul condiționat de ordinul 3 sau „cubul”) tridimensional.

Evident, numărul maxim de dimensiuni este numărul tuturor atributelor (Data, Țara, Client, etc.) care descriu datele noastre agregate (cantitatea de comenzi, cantitatea de bunuri etc.).

Așa că ajungem la conceptul de multidimensionalitate și întruchiparea lui - cub multidimensional... Vom numi o astfel de masă „ tabel de fapte". Dimensiuni sau axe cuburilor ( dimensiuni) Sunt atribute ale căror coordonate sunt exprimate prin valorile individuale ale acestor atribute prezente în tabelul de fapte. Acestea. de exemplu, dacă informațiile privind comenzile au fost menținute în sistem din 2003 până în 2010, atunci axa din acest an va consta din 8 puncte corespunzătoare. Dacă comenzile vin din trei țări, atunci axa țării va conține 3 puncte etc. Indiferent de câte țări sunt incluse în Directorul de țări. Punctele de pe axă sunt numite „membrii” acesteia ( Membrii).

În acest caz, datele agregate în sine vor fi numite „măsuri” ( Măsura). Pentru a evita confuzia cu „dimensiuni”, acestea din urmă sunt de preferință denumite „axe”. Un set de măsuri formează o altă axă „Măsuri” ( Măsuri). Există la fel de mulți membri (puncte) în ea câte măsuri (coloane agregate) sunt în tabelul de fapte.

Membrii dimensiunilor sau axelor pot fi combinați prin una sau mai multe ierarhii ( ierarhie). Să explicăm ce este o ierarhie cu un exemplu: orașele din ordine pot fi combinate în districte, districte dintr-o regiune, regiune a unei țări, țări în continente sau alte formațiuni. Acestea. există o structură ierarhică - continent- tara-regiune-raion-oras- 5 niveluri ( Nivel). Pentru raion, datele sunt agregate pentru toate orașele care sunt incluse în acesta. Pentru o regiune din toate districtele care conțin toate orașele etc. De ce aveți nevoie de mai multe ierarhii? De exemplu, pe axa cu data comenzii, putem dori să grupăm puncte (adică zile) într-o ierarhie An lună zi sau prin An-Săptămâna-Ziu: în ambele cazuri, trei niveluri. Evident, săptămâna și luna grupează zilele diferit. Există și ierarhii, numărul de niveluri în care nu este determinist și depinde de date. De exemplu, folderele de pe unitatea computerului.

Agregarea datelor poate avea loc folosind mai multe funcții standard: cantitate, minim, maxim, medie, cantitate.

MDX

Să trecem la limbajul interogărilor în datele multidimensionale.
SQL a fost conceput inițial nu pentru programatori, ci pentru analiști (și, prin urmare, are o sintaxă care seamănă cu un limbaj natural). Dar, cu timpul, a devenit din ce în ce mai complicat și acum puțini analiști știu să-l folosească bine, dacă este deloc. A devenit un instrument pentru programatori. Limbajul de interogare MDX, despre care se zvonește fostul nostru compatriot Mosha (sau Mosha) Posumansky, în sălbăticia Microsoft, a fost de asemenea intenționat inițial să fie orientat spre analist, dar conceptele și sintaxa lui (care seamănă vag cu SQL și complet în zadar, de exemplu. pentru că doar încurcă), chiar mai complicat decât SQL. Cu toate acestea, elementele de bază sunt încă ușor de înțeles.

O vom lua în considerare în detaliu pentru că este singura limbă care a primit statutul de standard în cadrul standardului general al protocolului XMLA și, în al doilea rând, pentru că există implementarea sa open-source sub forma proiectului Mondrian de la companie. Pentaho... Alte sisteme de analiză OLAP (de exemplu, Oracle OLAP Option) folosesc de obicei propriile extensii de sintaxă SQL, cu toate acestea, declară și suport pentru MDX.

Lucrul cu seturi de date analitice presupune doar citirea acestora și nu presupune scriere. Acea. nu există clauze de modificare a datelor în limbajul MDX, ci o singură clauză select - select.

În OLAP, cuburile multidimensionale pot fi felii- adica când datele sunt filtrate de-a lungul uneia sau mai multor axe sau proiecții- când cubul „se prăbușește” de-a lungul uneia sau mai multor axe, agregând date. De exemplu, primul nostru exemplu cu suma comenzilor din țări este o proiecție a unui cub pe axa Țări. Solicitarea MDX pentru acest caz va arăta astfel:

Selectați... Copii pe rânduri din
Ce e ce?

Selectați- cuvântul cheie și este inclus în sintaxă numai pentru frumusețe.
Este numele axei. Toate numele proprii în MDX sunt scrise între paranteze drepte.
Este numele ierarhiei. În cazul nostru, aceasta este ierarhia Țară-Oraș
Este numele membrului axei de la primul nivel al ierarhiei (adică țara) All este meta-membrul care unește toți membrii axei. Fiecare axă are un astfel de meta-membru. De exemplu, axa anilor are „Toți anii”, etc.
Copii Este o funcție de membru. Fiecare membru are mai multe funcții disponibile. Cum ar fi Parent. Nivel, Ierarhie, revenind respectiv strămoșul, nivelul din ierarhie și ierarhia în sine, căreia îi aparține membrul în acest caz. Copii - Returnează setul de membri copii ai acestui membru. Acestea. în cazul nostru, țările.
pe rânduri- Indică modul de aranjare a acestor date în tabelul rezumativ. În acest caz, în antetul rândurilor. Sensuri posibile aici: pe coloane, pe pagini, pe paragrafe etc. Se poate indica si simplu prin indici, incepand de la 0.
din Este o indicație a cubului din care se face selecția.

Ce se întâmplă dacă nu avem nevoie de toate țările, ci avem nevoie doar de câteva specifice? Pentru a face acest lucru, putem specifica în mod explicit țările de care avem nevoie în cerere și nu selectam totul cu funcția Copii.

Selectați (..., ...) pe rândurile din
Acoladele în acest caz sunt declarația setului ( A stabilit). Un set este o listă, o enumerare a membrilor dintr-o axă.

Acum să scriem o solicitare pentru al doilea exemplu - rezultatul în contextul furnizorului:

Selectați... Copii pe rânduri Membrii pe coloane din
Adăugat aici:
- axa;
.Membri Este o funcție de axă care returnează toți termenii de pe ea. Ierarhia și nivelul au aceeași funcție. pentru că există o singură ierarhie în această axă, atunci indicarea ei poate fi omisă, întrucât nivelul și ierarhia sunt, de asemenea, aceleași, atunci puteți afișa toți membrii într-o singură listă.

Cred că este deja evident cum putem continua acest lucru cu al treilea exemplu, cu o defalcare pe ani. Dar haideți să nu detaliem pe an, ci să filtram - adică. construi o felie. Pentru a face acest lucru, scrieți următoarea interogare:

Selectați ..Copii pe rânduri .Membri pe coloane de unde (.)
Unde este filtrarea?

Unde- cuvânt cheie
Este un membru al ierarhiei ... Numele complet, luând în considerare toți termenii, ar fi astfel: .. , dar de atunci numele acestui membru este unic în cadrul axei, atunci toate calificările intermediare ale numelui pot fi omise.

De ce termenul de dată este între paranteze? Parantezele sunt un tuplu ( tuplu). Un tuplu este una sau mai multe coordonate în variat axe. De exemplu, pentru a filtra de-a lungul a două axe simultan, în paranteze, enumerăm doi termeni din diferit măsurătorile separate prin virgule. Adică, un tuplu definește o „felie” a cubului (sau „filtrare”, dacă o astfel de terminologie este mai apropiată).

Un tuplu este folosit pentru mai mult decât pentru filtrare. Tuplurile pot fi și în anteturile de rânduri/coloane/pagini etc.

Acest lucru este necesar, de exemplu, pentru a afișa rezultatul unei interogări tridimensionale într-un tabel bidimensional.

Selectați combinarea încrucișată (... Copii, ..Copii) pe rânduri. Membrii pe coloane de unde (.)
Unire încrucișată Este o funcție. Returnează un set de tupluri (da, un set poate conține tupluri!) Rezultat din produsul cartezian a două mulțimi. Acestea. setul de rezultate va conține toate combinațiile posibile de țări și ani. Antetele rândurilor vor conține astfel o pereche de valori: Țara-An.

Întrebarea este, unde este indicația despre care caracteristici numerice trebuie afișate? În acest caz, este utilizată măsura implicită specificată pentru acest cub, adică. Pretul comenzii. Dacă vrem să derivăm o altă măsură, atunci ne amintim că măsurile sunt membri ai dimensiunii Măsuri... Și acționăm la fel ca și cu restul axelor. Acestea. filtrarea unei interogări după una dintre măsuri va afișa exact această măsură în celule.

Întrebare: care este diferența dintre filtrarea în unde și filtrarea prin specificarea membrilor axelor în rânduri. Răspuns: practic nimic. Unde specifică pur și simplu o felie pentru acele axe care nu sunt implicate în formarea titlurilor. Acestea. aceeași axă nu poti fi prezent în același timp pe rânduri, si in Unde.

Membrii calculati

Pentru interogări mai complexe, puteți declara membri calculati. Membrii axelor de atribut și de măsură. Acestea. De exemplu, ar putea fi declarată o nouă măsură care să reflecte contribuția fiecărei țări la valoare totală Comenzi:

Cu membru. ca „.CurrentMember / ..”, FORMAT_STRING = „0,00%” ​​selectați ... Copii pe rânduri de unde.
Calculul are loc în contextul unei celule în care sunt cunoscute toate coordonatele atributelor acesteia. Coordonatele (membrii) corespunzătoare pot fi obținute prin funcția CurrentMember pentru fiecare dintre axele cubului. Aici trebuie să înțelegeți că expresia .CurrentMember / ..„Nu împarte un termen cu altul, ci împarte date agregate relevante felii cuburi! Acestea. o felie pentru teritoriul curent va fi împărțită într-o felie pentru toate teritoriile, adică valoarea totală a tuturor comenzilor. FORMAT_STRING - setează formatul pentru ieșirea valorilor, de ex. %.

Un alt exemplu de membru calculat, dar deja pe axa anilor:

Cu membru. la fel de'. -.’
Evident, raportul va conține nu o unitate, ci diferența feliilor corespunzătoare, i.e. diferența în cantitatea comenzilor în acești doi ani.

Afișare în ROLAP

Sistemele OLAP, într-un fel sau altul, se bazează pe un fel de sistem de stocare și organizare a datelor. Când vine vorba de RDBMS, se vorbește despre ROLAP (vom lăsa MOLAP și HOLAP pentru auto-studiu). ROLAP - OLAP pe o bază de date relațională, de ex. descrise sub forma unor tabele convenționale bidimensionale. Sistemele ROLAP traduc interogările MDX în SQL. Principala problemă de calcul pentru o bază de date este agregarea rapidă. Pentru a agrega mai rapid, datele din baza de date sunt de obicei puternic denormalizate, de exemplu. stocate nu foarte eficient în ceea ce privește spațiul pe disc și controlul integrității bazei de date. În plus, ele conțin în plus tabele auxiliare care stochează date parțial agregate. Prin urmare, pentru OLAP, se creează de obicei o schemă de bază de date separată, care repetă doar parțial structura bazelor de date tranzacționale originale în ceea ce privește cărțile de referință.

Navigare

Multe sisteme OLAP oferă instrumente pentru navigarea interactivă pe o interogare deja formată (și, în consecință, datele selectate). Aceasta folosește așa-numita „găurire” sau „găurire” (găurire). O traducere mai adecvată în limba rusă ar fi cuvântul „aprofundare”. Dar aceasta este o chestiune de gust.În unele medii, cuvântul „foraj” s-a blocat.

Burghiu- aceasta este analiza în jos a raportului prin reducerea gradului de agregare a datelor, combinată cu filtrarea de-a lungul unei alte axe (sau mai multor axe). Există mai multe tipuri de foraj:

  • drill-down- filtrarea dupa una din axele originale ale raportului cu iesire informatii detaliate de descendenți din ierarhia membrului de filtru selectat. De exemplu, dacă există un raport privind distribuția comenzilor în contextul Țărilor și Anilor, atunci făcând clic pe 2007 se va afișa un raport în contextul acelorași Țări și luni ale anului 2007.
  • foraj deoparte- filtrarea sub una sau mai multe axe selectate și dezagregarea de-a lungul uneia sau mai multor alte axe. De exemplu, dacă există un raport privind distribuția comenzilor în contextul Țărilor și Anilor, atunci când faceți clic pe 2007, va fi afișat un alt raport cu o defalcare, de exemplu, Țări și Furnizori cu filtrare până în 2007.
  • jgheab de foraj- eliminarea agregării pe toate axele și filtrarea simultană de către acestea - vă permite să vedeți datele inițiale din tabelul de fapte, din care a fost obținută valoarea din raport. Acestea. când dați clic pe o valoare a celulei, este afișat un raport cu toate comenzile care au dat această sumă. Un fel de găurire instantanee în chiar „intestinele” cubului.
Asta e tot. Acum, dacă ați decis să vă dedicați Business Intelligence și OLAP, este timpul să începeți să citiți niște literatură serioasă.

Etichete:

  • OLAP
  • Mondrian
  • Business intelligence
  • MDX
Adaugă etichete

După ce datele sunt primite, curățate, aduse într-o singură formă și plasate în depozit, acestea trebuie analizate. Pentru aceasta se folosește tehnologia OLAP.

Cele douăsprezece principii definitorii ale OLAP au fost formulate în 1993 de EF Codd, „inventatorul” bazelor de date relaționale. OLAP înseamnă OnLine Analytical Processing, adică analiza datelor operaționale. Mai târziu, definiția lui Codd a fost reluată în așa-numitul test Fast Analysis of Shared Multidimensional Information (FASMI), care necesită o aplicație OLAP pentru a furniza următoarele posibilități analiza rapidă a informațiilor multidimensionale partajate: de mare viteză; analiză; partajarea accesului; multidimensionalitate; lucreaza cu informatii..

De mare viteză. Analiza trebuie efectuată la fel de rapid pentru toate aspectele informației. În acest caz, timpul de răspuns acceptabil nu este mai mare de 5 secunde.

Analiză. Ar trebui să fie posibil să se efectueze tipuri de bază de analiză numerică și statistică - fie predefinite de dezvoltatorul aplicației, fie definite arbitrar de utilizator.

Partajarea accesului. Accesul la date ar trebui să fie multi-utilizator, în timp ce accesul la informațiile confidențiale ar trebui controlat.

Multidimensionalitate. Caracteristica principală, cea mai esențială a OLAP.

Lucrul cu informații. Aplicația ar trebui să poată accesa orice informație necesară, indiferent de volumul și locația de stocare.

Reprezentare multidimensională. OLAP oferă organizațiilor cele mai convenabile și mijloace rapide accesați, vizualizați și analizați informațiile comerciale. Cel mai important, OLAP oferă utilizatorului un model de date natural, intuitiv, organizându-le ca cuburi multidimensionale. Axe (dimensiuni) sistem multidimensional coordonatele sunt principalele atribute ale procesului de afaceri analizat. De exemplu, pentru un proces de vânzare, acesta poate fi o categorie de produs, o regiune, un tip de client. Timpul este aproape întotdeauna folosit ca una dintre măsurători. În interiorul cubului sunt date care caracterizează cantitativ procesul - așa-numitele Măsuri. Acestea pot fi volume de vânzări pe bucăți sau în termeni monetari, solduri stocuri, costuri etc. Utilizatorul care analizează informația poate „tăia” cubul în funcție de directii diferite, primește rezumat (de exemplu, ani de zile) sau, dimpotrivă, date detaliate (pentru săptămâni) și efectuează alte operațiuni care sunt necesare analizei sale.

Stocarea datelor OLAP ... În primul rând, trebuie spus că, întrucât analistul operează întotdeauna cu unele date rezumative (și nu detaliate), bazele de date OLAP stochează aproape întotdeauna împreună cu date detaliate așa-numitele agregate, adică indicatori totali precalculați. Exemple de agregate sunt vânzările totale pentru anul sau stocul mediu din stoc. Stocarea agregatelor precalculate este principala modalitate de a îmbunătăți viteza interogărilor OLAP.


Cu toate acestea, construirea de agregate poate crește semnificativ dimensiunea bazei de date.

O altă problemă cu stocarea datelor OLAP este raritatea datelor multidimensionale. De exemplu, dacă nu au existat vânzări într-o anumită regiune în 2000, atunci nu va exista nicio valoare la intersecția dimensiunilor corespunzătoare ale cubului. Dacă serverul OLAP stochează o valoare lipsă în acest caz, atunci cu o rară de date semnificativă, numărul de celule goale (cu toate acestea necesită spațiu de stocare) poate depăși de multe ori numărul de celule umplute și, ca urmare, volumul total va crește inutil. . Soluții oferite în acest sens de către Microsoft sunt date mai jos.

Arome OLAP. Pentru a stoca date OLAP, se pot folosi următoarele:

SGBD multidimensionale speciale (servere OLAP). În acest caz, ei vorbesc despre MOLAP (OLAP multidimensional)... Atunci când rulează interogări complexe care analizează date în dimensiuni diferite, SGBD-urile multidimensionale oferă performanțe mai bune decât cele relaționale. În același timp, viteza de execuție a interogării nu depinde de dimensiunea care este folosită pentru a „slice” un cub multidimensional.

SGBD relațional tradițional - ROLAP (OLAP relațional)... Utilizarea structurilor speciale de date, cum ar fi schemele stele și fulgi de zăpadă, precum și stocarea agregatelor calculate, permit analiza multidimensională a datelor relaționale. SGBD-urile relaționale sunt din punct de vedere istoric mai frecvente și s-au făcut investiții semnificative în ele, așa că deocamdată ROLAP este mai comun.

Opțiune combinată - HOLAP (OLAP hibrid) combinând ambele tipuri de SGBD. Una dintre opțiunile pentru combinarea celor două tipuri de SGBD este stocarea agregatelor într-un SGBD multidimensional și a datelor detaliate (având cel mai mare volum) într-un SGBD relațional.

Microsoft oferă următoarele instrumente de analiză OLAP:

Microsoft SQL Server 7.0 include un server OLAP cu funcții complete - SQL Server OLAP Services. Serverul, desigur, este conceput pentru a servi cererile clientului, iar acest lucru necesită un fel de protocol de comunicare și limbaj de solicitare. De exemplu, pentru interacțiunea clientului cu un SGBD relațional pe partea de server - SQL Server - protocoalele ODBC sau OLE DB și limba interogări SQL... Pentru a accesa serverul OLAP, Microsoft a dezvoltat OLE DB pentru protocolul OLAP și limbajul de interogare MultiDimensional eXpression (MDX) pentru date multidimensionale. La fel cum stratul ADO (ActiveX Data Objects) a fost dezvoltat peste OLE DB pentru simplitate și comoditate, ADO MD (MultiDimensional ADO) a fost construit pe deasupra OLE DB pentru OLAP.

Instrumente de analiză a datelor în Microsoft Office 2000. Microsoft Excel 2000 conține un nou mecanism pentru tabele pivot - OLAP PivotTable, care înlocuiește mecanismul cu același nume din versiunile anterioare. Alături de capabilitățile anterioare de analiză a datelor relaționale, motorul PivotTable include acum capabilități de analiză a datelor OLAP, adică acționează ca un client OLAP. Microsoft SQL Server 7.0 poate fi folosit ca server, precum și orice produs care acceptă interfața OLE DB pentru OLAP. Mecanism de pivotare Foi de calcul Excel v în întregime Acceptă capabilitățile oferite de serviciile PivotTable (PTS) descrise mai sus. Astfel, datele OLAP analizate pot fi localizate atât în ​​cuburi locale, cât și pe serverul OLAP.

Microsoft Office 2000 conține, de asemenea, un set de componente ActiveX numite Componente Web Office 2000, care vă permit să organizați analiza datelor OLAP prin intermediul navigare pe internet... Acestea includ următoarele patru componente:

Foaie de calcul- unelte funcționalitate limitată Foaia de lucru Excel.

Masă rotativă- „gemeni” de tabele pivot Excel; poate lucra cu datele OLAP Services.

Diagramă- vă permite să construiți diagrame bazate atât pe date relaționale, cât și pe date OLAP.

Sursă de date- o componentă de serviciu pentru legarea altor componente la o sursă de date.

Când lucrați cu date OLAP, componentele web se referă la serviciile PivotTable.

5.5. TEHNOLOGIA DE ANALIZĂ MINEREA DATELOR

Apariția tehnologiei Data Mining este asociată cu nevoia de a extrage cunoștințe din datele eterogene acumulate de sistemele informaționale. A existat un concept care în rusă a început să fie numit „extracție”, „extracție” de cunoștințe. În străinătate, a fost stabilit termenul „Data Mining”.

Metodele de statistică matematică utilizate anterior s-au dovedit utile în principal pentru extragerea de date bazată pe verificare și pentru analiza exploratorie „grundă”, care formează baza procesării analitice online (OLAP).

Avantaj cheie Exploatarea datelor comparativ cu metodele anterioare – capacitatea de a genera automat ipoteze despre relația dintre parametri diferiți sau componente de date. Munca unui analist atunci când lucrează cu un pachet tradițional de prelucrare a datelor se reduce de fapt la verificarea sau rafinarea uneia sau două ipoteze generate de el. În cazurile în care nu există ipoteze inițiale, iar cantitatea de date este semnificativă, sistemele existenteîși pierd capacitatea de a lucra și se transformă în analiști mâncători de timp.

Încă unul caracteristică importantă Sistemele Data Mining au capacitatea de a procesa interogări multidimensionale și de a căuta dependențe multidimensionale. De asemenea, unică este capacitatea sisteme de date minerit detectează automat situatii exceptionale- adica elemente de date care „cad” din tiparele generale.

Există cinci tipuri standard de modele care vă permit să identificați metodele de Data Mining

asociere

ulterior

clasificare

gruparea

prognoza

Căutarea tiparelor se realizează prin metode care nu sunt limitate de cadrul ipotezelor a priori despre structura eșantionului și tipul de distribuție a valorilor indicatorilor analizați. Exemple de sarcini pentru o astfel de căutare când folosind Date Exploatarea minieră este prezentată în tabelul 1.

Tabelul 1 - Comparația declarațiilor problemei când se utilizează metodele OLAP și Data Mining

Pentru a rezolva probleme analitice legate de calcule complexe, previziune, modelare scenarii Tehnologia „What if...” se aplică analiza datelor multidimensionale – tehnologia OLAP. Conceptul OLAP a fost descris pentru prima dată în 1993 de Edgar Codd, un renumit cercetător de baze de date și autor al modelului de date relaționale, în cartea sa „OLAP for Analytic Users: What It Should Be”, unde a subliniat 12 legi ale procesării datelor analitice prin care Produsele pentru dezvoltatori OLAP sunt prezente acum:

1. Reprezentarea conceptuală a datelor multidimensionale.

2. Transparență (acces transparent la datele externe pentru utilizator, permițându-i acestuia, oriunde s-ar afla, să comunice cu serverul folosind un instrument analitic).

3. Disponibilitatea și detaliul datelor.

4. Performanță constantă la elaborarea rapoartelor (Dacă crește numărul de dimensiuni sau dimensiunea bazei de date, utilizatorul analist nu ar trebui să simtă o degradare a performanței).

5. Arhitectura client-server (OLAP este disponibil de pe desktop).

6. Multidimensionalitate generală.

7. Managementul dinamic al matricelor rare.

8. Suport multi-utilizator. Se întâmplă adesea ca mai mulți utilizatori analitici să lucreze împreună cu același model analitic sau să creeze modele diferite din aceleași date. Și instrumentul OLAP trebuie să ofere partajare (interogare și completare), integritate și capabilități de securitate.

9. Crossover-uri nelimitate.

10. Manipularea intuitivă a datelor.

11. Opțiuni flexibile de raportare.

12. Dimensiune și număr nelimitat de niveluri de agregare (instrumentul analitic trebuie să ofere cel puțin 15 măsurători în același timp și de preferință 20).

Dezavantajele rapoartelor convenționale pentru un manager sunt evidente: managerul nu are timp să selecteze cifrele de interes din raport, mai ales că pot fi prea multe. Complexitatea rapoartelor de înțeles, inconvenientul de a lucra cu acestea au dus la necesitatea creării unui nou concept de lucru cu date.

Atunci când un analist trebuie să obțină informații, el independent sau cu ajutorul unui programator face o interogare SQL corespunzătoare bazei de date, primește datele de interes sub forma unui raport. Rapoartele pot fi construite la comandă sau la atingerea unor evenimente sau ore. Acest lucru ridică multe probleme. În primul rând, cel mai adesea analistul nu are abilități de programare la nivel înalt și nu poate executa independent o interogare SQL în baza de date. În plus, analistul are nevoie de mai mult de un raport, dar multe dintre ele în timp real. Programatori, care pot efectua cu ușurință orice întrebări la baza de date, dacă îl vor ajuta, atunci nu tot timpul, deoarece au propria lor muncă. Interogările în bloc către serverul de baze de date complică munca acelor angajați ai companiei care lucrează constant cu bazele de date.

Conceptul de OLAP s-a născut tocmai pentru a rezolva astfel de probleme. OLAP (O n L ine A analitice P procesarea) este prelucrarea analitică operațională a unor cantități mari de date în timp real. Scopul sistemelor OLAP este de a facilita rezolvarea problemelor de analiză a unor cantități mari de date și de a procesa rapid interogări complexe către baza de date.

OLAP este:

    nu un produs software

    nu un limbaj de programare

    nu tehnologie

OLAP este o colecție de concepte, principii și cerințe care facilitează accesul analiștilor la date. Este un instrument pentru analiza dinamică multidimensională a unor cantități mari de date în timp real.

Sarcina analistului este să găsească tipare în seturi mari de date. Un analist nu va acorda atenție unui singur fapt, are nevoie de informații despre câteva zeci de evenimente similare. Faptele unice din baza de date sunt de interes, de exemplu, pentru un contabil sau un angajat al departamentului de vânzări care se ocupă de afacere. Un analist cu o singură înregistrare nu este suficient - de exemplu, poate avea nevoie de toate tranzacțiile unei anumite sucursale sau reprezentanțe pentru o lună sau un an. În același timp, analistul elimină detalii inutile, cum ar fi TIN-ul cumpărătorului, adresa și numărul de telefon exact al acestuia, indexul contractului și altele asemenea. În același timp, datele de care are nevoie un analist pentru muncă conțin în mod necesar valori numerice - acest lucru se datorează însăși esenței activității sale.

Un set de date multidimensional este adesea reprezentat ca un cub OLAP (vezi Figura 26). Axele unui cub OLAP conțin parametri, iar celulele conțin date agregate care depind de aceștia.

Orez. 26OLAP - cub

Cuburile OLAP sunt în esență meta-rapoarte. Avantajele cuburilor sunt evidente - trebuie să interogați o singură dată datele din baza de date - atunci când construiți cubul. Deoarece analiștii, de regulă, nu lucrează cu informații care sunt completate și modificate din mers, cubul generat este relevant pentru o perioadă destul de lungă. Datorită acestui fapt, nu sunt excluse doar întreruperile în funcționarea serverului de baze de date (nu există solicitări cu mii și milioane de linii de răspuns), dar și viteza de acces la date pentru analist însuși este crescută dramatic.

Dar există și un dezavantaj semnificativ: un cub OLAP poate ocupa zeci și chiar de sute de ori mai mult spațiu decât datele originale.

OLAP - cubul nu trebuie să fie deloc tridimensional. Poate fi atât bidimensional, cât și multidimensional – în funcție de problema care se rezolvă. Analiștii pot avea nevoie de mai mult de 20 de dimensiuni - produsele OLAP serioase sunt proiectate exact pentru acest număr. Aplicațiile desktop mai simple acceptă până la 6 dimensiuni.

Nu toate elementele cubului trebuie umplute: dacă nu există informații, valoarea din celula corespunzătoare pur și simplu nu va fi determinată de aceasta. De asemenea, este complet opțional ca aplicația OLAP să stocheze date într-o structură multidimensională - principalul lucru este că aceste date arată așa pentru utilizator.

Umplerea unui cub OLAP poate fi realizată atât cu date reale din sistemele operaționale, cât și previzionate pe baza datelor istorice. Dimensiunile hipercubului pot fi complexe, ierarhice, iar între ele pot fi stabilite relații. În procesul de analiză, utilizatorul poate schimba punctul de vedere asupra datelor (așa-numita operațiune de schimbare a vederii logice), vizualizand astfel datele în diferite secțiuni și rezolvând probleme specifice. Pe cuburi pot fi efectuate diferite operații, inclusiv prognoza și planificarea condiționată (analiza ce se întâmplă dacă).

Un cub tridimensional poate fi desenat și imaginat cu ușurință. Cu toate acestea, este aproape imposibil să reprezinte sau să descrii în mod adecvat un cub cu șase sau douăzeci de dimensiuni. Prin urmare, înainte de utilizare, tabelele bidimensionale obișnuite sunt extrase dintr-un cub multidimensional, adică parcă, „tăiați” dimensiunile cubului prin etichete. Prin tăierea cuburilor OLAP în dimensiuni, analistul obține, de fapt, „rapoartele bidimensionale obișnuite” care îl interesează (nu neapărat rapoarte în sensul obișnuit al termenului - vorbim de structuri de date cu aceleași funcții). Această operație se numește „tăierea” cubului. În acest fel, analistul ia o felie bidimensională a cubului și lucrează cu ea. Secțiunile necesare sunt rapoarte.

Interacționând cu sistemul OLAP, utilizatorul poate efectua vizualizarea flexibilă a informațiilor, obține secțiuni de date arbitrare și poate efectua operațiuni analitice de detaliere, convoluție, distribuție de la capăt la capăt, comparație în timp (vezi Fig. 27).

Orez. 27 pRecuperarea secțiunilor de date arbitrare cândfelierea unui cub OLAP.

Clasificarea produselor OLAP

Operațiile asupra datelor sunt efectuate de o mașină OLAP. Produsele OLAP sunt clasificate în funcție de metoda de stocare și de locația mașinii OLAP.

După modul de stocare a datelor, acestea sunt împărțite în trei categorii MOLAP, ROLAP și HOLAP:

    MOLAP - datele sursă și agregate sunt stocate în baza de date multidimensionala sau într-un cub local multidimensional.

    ROLAP - datele brute sunt stocate în baza de date relationala sau în tabele locale plate pe un server de fișiere. Datele agregate pot fi plasate în tabele de servicii din aceeași bază de date. Conversia datelor dintr-o bază de date relațională în cuburi multidimensionale are loc la solicitarea instrumentului OLAP.

    HOLAP - datele originale rămân în bază relațională, iar datele agregate sunt plasate în baza de date multidimensionala... Construirea unui cub OLAP se realizează la cererea unui instrument OLAP bazat pe date relaționale și multidimensionale.

În funcție de locația mașinii OLAP, se pot distinge două clase principale de produse OLAP: server OLAP și client OLAP.

server OLAP primește o interogare, calculează și stochează date agregate pe server, oferind aplicației client instalată pe computerul clientului doar rezultatele interogărilor către cuburi multidimensionale care sunt stocate pe server. Multe servere OLAP moderne acceptă toate cele trei metode de stocare: MOLAP, ROLAP și HOLAP.

Client OLAP construiește un cub multidimensional și calcule OLAP nu pe un server separat, ci pe computerul client al utilizatorului însuși. Clienții OLAP sunt, de asemenea, împărțiți în ROLAP și MOLAP.

Se știe că un server OLAP poate gestiona cantități mai mari de date decât un client OLAP cu aceeași putere de computer. Acest lucru se datorează faptului că serverul OLAP stochează hard disk-uri o bază de date multidimensională care conține cuburi precalculate. Programele client fac cereri către server, primind atât cubul, cât și fragmentele acestuia. Caracteristicile de viteză ale serverului OLAP sunt mai puțin sensibile la creșterea datelor.

Clientul OLAP la momentul operațiunii trebuie să aibă întregul cub în RAM. Prin urmare, cantitatea de date procesate de clientul OLAP este direct proporțională cu cantitatea de RAM de pe computerul utilizatorului. Clientul OLAP generează o interogare la baza de date, care descrie condițiile de filtrare și algoritmul pentru gruparea preliminară a datelor primare. Serverul găsește, grupează înregistrările și returnează o selecție compactă pentru calcule OLAP ulterioare. Mărimea acestui eșantion poate fi de zeci sau sute de ori mai mică decât volumul înregistrărilor primare, neagregate. În consecință, nevoia unui astfel de client OLAP în resursele computerului este redusă semnificativ.

OLAP Server prezintă Cerințe minime la puterea computerelor client. Cerințele clientului OLAP sunt mai mari, din moment ce efectuează calcule în RAM-ul său. Dacă capacitatea computerelor client este scăzută, atunci clientul OLAP va funcționa lent sau poate să nu funcționeze deloc. Cumpărarea unui server puternic poate fi mai ieftină decât actualizarea tuturor computerelor.

Costul unui server OLAP este destul de mare, iar implementarea și întreținerea unui server OLAP necesită personal înalt calificat. Costul unui client OLAP este cu un ordin de mărime mai mic decât costul unui server OLAP.

Odată cu introducerea OLAP, productivitatea și eficiența managementului întreprinderii crește semnificativ. Persoana principală în procesul de analiză a datelor este expert- un specialist în domeniu. Expertul prezintă ipoteze (ipoteze) și, pentru analiza lor, fie analizează anumite mostre în diferite moduri, fie construiește modele pentru a testa fiabilitatea ipotezelor.

Analytics permite unui utilizator final non-IT să lucreze cu cantități mari de date. Scopul sistemelor analitice de afaceri: suport decizional la toate nivelurile de management al întreprinderii.

Sisteme analitice nivel operațional asigura managementul intreprinderii intr-un "mod de operare", i.e. îndeplinirea unui anumit program de producţie. Sisteme analitice nivel strategic ajuta conducerea întreprinderii să elaboreze soluții în „modul de dezvoltare”. Sistemele de management strategic sunt SI analitice care susțin soluția sarcini cheie managementul strategic al companiei.

Multe articole despre OLAP pot fi citite pe site-ul: http://www.olap.ru/basic/oolap.asp

Poate că, pentru cineva, utilizarea tehnologiei OLAP (Procesare analitică on-line) la construirea rapoartelor va părea cumva exotică, prin urmare, utilizarea OLAP-CUB pentru acestea nu este deloc una dintre cele mai importante cerințe pentru automatizarea bugetului și contabilitate de gestiune.

De fapt, este foarte convenabil să utilizați un CUBE multidimensional atunci când lucrați cu raportarea managementului. La elaborarea formatelor bugetare se poate întâlni problema formelor multivariate (pentru mai multe detalii, vezi Cartea 8 „Tehnologie pentru stabilirea bugetului într-o companie” și în cartea „Setarea și automatizarea contabilității de gestiune”).

Acest lucru se datorează faptului că raportarea managementului din ce în ce mai detaliată este necesară pentru un management eficient al companiei. Adică, sistemul utilizează din ce în ce mai multe felii analitice diferite (în sisteme de informare analiștii sunt definiți printr-un set de cărți de referință).

Desigur, acest lucru duce la faptul că managerii doresc să primească raportări în toate secțiunile analitice de interes pentru ei. Asta înseamnă că rapoartele trebuie făcute cumva să „respire”. Cu alte cuvinte, putem spune că în acest caz vorbim despre sensul aceluiași raport ar trebui să ofere informații în diferite secțiuni analitice. Prin urmare, rapoartele statice nu se mai potrivesc multor lideri moderni. Au nevoie de dinamica pe care o poate oferi un CUBU multidimensional.

Astfel, tehnologia OLAP a devenit deja element necesarîn sistemele informaţionale moderne şi avansate. Prin urmare, atunci când alegeți un produs software, trebuie să acordați atenție dacă acesta utilizează tehnologia OLAP.

Și trebuie să fii capabil să distinge CUBU-urile reale de imitație. Una dintre astfel de simulări este tabelele pivot în MS Excel. Da, acest instrument este similar cu CUB, dar de fapt nu este, deoarece acestea sunt tabele statice, nu dinamice. În plus, capacitatea de a construi rapoarte folosind elemente din directoare ierarhice este mult mai prost implementată în acestea.

Pentru a confirma relevanța utilizării CUBE-ului la construcție raportarea managementului cel mai simplu exemplu este cu un buget de vânzări. În acest exemplu, următoarele segmente analitice sunt relevante pentru companie: produse, sucursale și canale de distribuție. Dacă aceste trei analize sunt importante pentru companie, atunci bugetul de vânzări (sau raportul) poate fi afișat în mai multe versiuni.

Trebuie remarcat faptul că, dacă creați linii bugetare bazate pe trei segmente analitice (ca în acest exemplu), acest lucru vă permite să creați destul de complexe modele bugetareși pregătiți rapoarte detaliate folosind CUBE.

De exemplu, un buget de vânzări poate fi pregătit folosind doar un singur analitic (referință). Este prezentat un exemplu de buget de vânzări construit pe baza unui „Produse” analitic poza 1.

Orez. 1. Un exemplu de buget de vânzări construit pe baza unui „Produse” analitic în OLAP-CUBE

Același buget de vânzări poate fi întocmit folosind două analitice (cărți de referință). Un exemplu de buget de vânzări construit pe baza a două dimensiuni „Produse” și „Sucursale” este prezentat pe Figura 2.

Orez. 2. Un exemplu de buget de vânzări construit pe baza a doi analiști „Produse” și „Sucursale” în OLAP-CUBE a pachetului software „INTEGRAL”

.

Dacă este nevoie de a construi rapoarte mai detaliate, atunci puteți întocmi același buget de vânzări folosind trei analize (cărți de referință). Un exemplu de buget de vânzări construit pe baza celor trei dimensiuni „Produse”, „Sucursale” și „Canale de distribuție” este prezentat pe Figura 3.

Orez. 3. Un exemplu de buget de vânzări construit pe baza a trei analiști „Produse”, „Sucursale” și „Canale de vânzări” în OLAP-CUBE al pachetului software INTEGRAL

Trebuie amintit că CUBU-ul folosit pentru a genera rapoarte vă permite să afișați datele într-o secvență diferită. Pe Figura 3 Bugetul de vânzări este mai întâi „extins” pe produse, apoi pe sucursale, iar apoi pe canale de distribuție.

Aceleași date pot fi prezentate într-o secvență diferită. Pe Figura 4 acelaşi buget de vânzări este „desfăşurat” mai întâi pe produs, apoi pe canal de distribuţie, iar apoi pe ramură.

Orez. 4. Un exemplu de buget de vânzări construit pe baza a trei analiști „Produse”, „Canale de vânzări” și „Sucursale” în OLAP-CUBE a pachetului software „INTEGRAL”

Pe Figura 5 Același buget de vânzări este „extins” mai întâi pe ramură, apoi pe produs și apoi pe canal de distribuție.

Orez. 5. Un exemplu de buget de vânzări construit pe baza a trei analiști „Sucursale”, „Produse” și „Canale de vânzări” în OLAP-CUBE a complexului software „INTEGRAL”

De fapt, asta nu este tot opțiuni posibile ieșirea bugetului de vânzări.

În plus, trebuie să acordați atenție faptului că KUB vă permite să lucrați cu structura ierarhica carti de referinta. În exemplele prezentate directoare ierarhice sunt „Produse” și „Canale de distribuție”.

Din punctul de vedere al utilizatorului, el este în acest exemplu primește mai multe rapoarte de management (vezi. Orez. 1-5), dar din punct de vedere al setărilor în produs software Este un raport. Doar folosind CUBE, acesta poate fi vizualizat în mai multe moduri.

Desigur, în practică, un număr foarte mare de opțiuni pentru afișarea diferitelor rapoarte de management este posibil, dacă articolele acestora se bazează pe unul sau mai mulți analiști. Și setul de analiști în sine depinde de nevoia utilizatorului de detalii. Cu toate acestea, nu trebuie uitat că, pe de o parte, cu cât sunt mai mulți analiști, cu atât puteți construi rapoarte mai detaliate. Dar, pe de altă parte, înseamnă că modelul de bugetare financiară va fi mai complex. În orice caz, dacă există un CUB, compania va putea vizualiza rapoartele solicitate în diferite versiuni, în conformitate cu secțiunile analitice de interes.

Este necesar să menționăm mai multe caracteristici ale OLAP-CUBE.

În OLAP-CUBE ierarhic multidimensional există mai multe dimensiuni: tipul rândului, data, rândurile, referința 1, referința 2 și referința 3 (vezi. Orez. 6). Desigur, raportul afișează atâtea butoane cu directoare câte sunt în linia bugetară care conține numărul maxim de directoare. Dacă nu există cataloage în nicio linie a bugetului, atunci nu va exista un singur buton cu cataloage în raport.

Inițial, OLAP-CUBE este construit pe toate dimensiunile. În mod implicit, în timpul construcției inițiale a raportului, dimensiunile sunt situate exact în acele zone, așa cum se arată în Figura 6... Adică, o dimensiune precum „Data” este situată în zona dimensiunilor verticale (dimensiuni în zona coloanelor), dimensiunile „Rânduri”, „Referință 1”, „Referință 2” și „Referință 3” - în zona dimensiunilor orizontale (măsurători în rândurile zonei), iar dimensiunea „Tip rând” este în dimensiunile „neextensibile” (dimensiuni în zona paginii). Dacă dimensiunea se află în ultima zonă, atunci datele din raport nu vor fi „dezvăluite” pentru această dimensiune.

Fiecare dintre aceste dimensiuni poate fi plasată în oricare dintre cele trei zone. După transferul măsurătorilor, raportul se reconstruiește instantaneu conform noii configurații de măsurare. De exemplu, puteți schimba data și șirurile de caractere cu referințe. Sau puteți muta una dintre cărțile de referință în zona verticală de măsurare (vezi. Orez. 7). Cu alte cuvinte, un raport în OLAP-CUBE poate fi „întors” și poate selecta opțiunea de ieșire a raportului care este cea mai convenabilă pentru utilizator.

Orez. 7. Un exemplu de reconstrucție a raportului după modificarea configurației de măsurare a pachetului software INTEGRAL

Configurația măsurătorilor poate fi modificată fie în formularul principal CUBE, fie în editorul hărții de modificare (vezi. Orez. opt). În acest editor, puteți, de asemenea, să trageți măsurătorile dintr-o zonă în alta cu mouse-ul. În plus, puteți schimba măsurătorile în aceeași zonă.

În plus, unii parametri de măsurare pot fi configurați în aceeași formă. Pentru fiecare dimensiune, puteți personaliza locația totalurilor, ordinea de sortare a membrilor și numele membrilor (vezi. Orez. opt). De asemenea, puteți specifica ce nume de articole sunt afișate în raport: prescurtat (Nume) sau complet (Nume complet).

Orez. 8. Editor al hărții de măsurare a pachetului software „INTEGRAL”.

Puteți edita parametrii de măsurare direct în fiecare dintre aceștia (vezi. Orez. nouă). Pentru a face acest lucru, faceți clic pe pictograma situată pe butonul de lângă numele măsurătorii.

Orez. 9. Un exemplu de editare a unei cărți de referință 1 Produse și servicii în

Cu acest editor, puteți selecta elementele care vor fi afișate în raport. În mod implicit, toate elementele sunt afișate în raport, dar, dacă este necesar, unele elemente sau foldere pot fi sărite. De exemplu, dacă trebuie să afișați un singur grup de produse într-un raport, debifați toate celelalte în editorul de dimensiuni. După aceea, raportul va conține un singur grup de produse (vezi. Orez. zece).

De asemenea, puteți sorta articole în acest editor. În plus, articolele pot fi rearanjate în diferite moduri. După o astfel de regrupare, raportul este reconstruit instantaneu.

Orez. 10. Un exemplu de ieșire în raportul unui singur grup de produse (dosar) în pachetul software INTEGRAL

În editorul de dimensiuni, puteți să vă creați rapid propriile grupuri, să trageți și să plasați elemente din directoare de acolo etc. În mod implicit, numai grupul Alte este creat automat, dar puteți crea și alte grupuri. Astfel, folosind editorul de dimensiuni, puteți personaliza ce elemente de catalog și în ce ordine trebuie afișate în raport.


Trebuie remarcat faptul că toate astfel de rearanjamente nu sunt înregistrate. Adică după închiderea raportului sau după recalcularea acestuia, toate directoarele vor fi afișate în raport în conformitate cu metodologia configurată.

De fapt, toate astfel de modificări ar putea fi făcute inițial la configurarea șirurilor.

De exemplu, folosind constrângeri, puteți specifica și ce elemente sau grupuri de referințe ar trebui să fie afișate în raport și care nu.

Notă: subiectul acestui articol este discutat mai detaliat la ateliere „Managementul întreprinderii bugetare”și „Formularea și automatizarea contabilității de gestiune” condus de autorul acestui articol - Alexander Karpov.

Dacă utilizatorul aproape în mod regulat trebuie să afișeze doar anumite elemente sau foldere directoare în raport, atunci este mai bine să facă astfel de setări în avans atunci când creează linii de raport. Dacă, totuși, sunt importante pentru utilizator diverse combinatii elemente ale directoarelor din rapoarte, atunci nu trebuie să setați nicio restricție atunci când configurați o metodă. Toate astfel de restricții pot fi configurate rapid folosind editorul de măsurători.

Top articole similare