Come configurare smartphone e PC. Portale informativo
  • casa
  • Interessante
  • I 10 migliori sistemi di reporting analitico olap. OLAP-CUBE (reporting dinamico di gestione)

I 10 migliori sistemi di reporting analitico olap. OLAP-CUBE (reporting dinamico di gestione)

La proposta tesinaè lo studio della tecnologia OLAP, il concetto della sua implementazione e struttura.

V mondo moderno reti di computer e sistemi informatici consentono di analizzare ed elaborare grandi quantità di dati.

Una grande quantità di informazioni complica notevolmente la ricerca di soluzioni, ma consente di ottenere calcoli e analisi molto più accurati. Per risolvere questo problema, esiste un'intera classe di sistemi informativi che eseguono analisi. Tali sistemi sono chiamati sistemi di supporto alle decisioni (DSS) (DSS, Decision Support System).

Per eseguire l'analisi, il DSS dovrebbe accumulare informazioni, disponendo dei mezzi per l'input e l'archiviazione. In totale, ci sono tre compiti principali risolti nel DSS:

· inserimento dati;

· archivio dati;

· analisi dei dati.

L'immissione dei dati nel DSS viene effettuata automaticamente da sensori che caratterizzano lo stato dell'ambiente o del processo, oppure da un operatore umano.

Se i dati vengono inseriti automaticamente dai sensori, i dati vengono accumulati dal segnale di prontezza che appare quando vengono visualizzate le informazioni o dal polling ciclico. Se l'input è di un essere umano, allora dovrebbero fornire agli utenti mezzo conveniente inserire i dati, verificandone la correttezza dell'input, nonché eseguire i calcoli necessari.

Quando si inseriscono dati contemporaneamente da più operatori, è necessario risolvere i problemi di modifica e accesso parallelo degli stessi dati.

DSS fornisce agli analisti dati sotto forma di report, tabelle, grafici per lo studio e l'analisi, motivo per cui tali sistemi forniscono funzioni di supporto alle decisioni.

Nei sottosistemi di data entry denominati OLTP (On-linetransactionprocessing), viene implementata l'elaborazione dei dati operativi. Per implementarli, usa sistemi convenzionali Gestione DB (DBMS).

Il sottosistema di analisi può essere costruito sulla base di:

· Sottosistemi di analisi dell'information retrieval basati su DBMS relazionali e query statiche utilizzando il linguaggio SQL;

· Sottosistemi di analisi operativa. Per implementare tali sottosistemi, viene utilizzata la tecnologia di elaborazione dei dati analitici online OLAP, che utilizza il concetto di presentazione dei dati multidimensionali;

· Sottosistemi di analisi intellettuale. Questo sottosistema implementa metodi e algoritmi di DataMining.

Dal punto di vista dell'utente, i sistemi OLAP forniscono un mezzo di visualizzazione flessibile delle informazioni nelle varie sezioni, l'ottenimento automatico di dati aggregati, l'esecuzione di operazioni analitiche di convoluzione, dettaglio, confronto nel tempo. Grazie a tutto questo, i sistemi OLAP sono una soluzione con grandi vantaggi nel campo della preparazione dei dati per tutti i tipi di rendicontazione aziendale, che comportano la presentazione dei dati in diverse sezioni e diversi livelli gerarchie, come rapporti sulle vendite, varie forme di budget e altro. I sistemi OLAP hanno grandi vantaggi di tale presentazione in altre forme di analisi dei dati, inclusa la previsione.

1.2 Definizione OLAP -sistemi

La tecnologia per l'analisi complessa dei dati multivariati si chiama OLAP. OLAP è un componente chiave di un'organizzazione HD.

La funzionalità OLAP può essere implementata in vari modi, sia i più semplici, come l'analisi dei dati nelle applicazioni per ufficio, sia i sistemi analitici distribuiti più complessi basati su prodotti server.

OLAP (On-LineAnalyticalProcessing) è una tecnologia per l'elaborazione di dati analitici on-line che utilizza strumenti e metodi per la raccolta, l'archiviazione e l'analisi di dati multidimensionali e per supportare i processi decisionali.

Lo scopo principale dei sistemi OLAP è supportare attività analitiche, richieste arbitrarie degli utenti analisti. Lo scopo dell'analisi OLAP è testare le ipotesi emergenti.

Dopo aver capito cos'è OLAP e quali sono le sue proprietà, passiamo alla domanda più importante: a chi sono destinati i prodotti software di questa classe?

Come già notato, l'infrastruttura informativa dell'azienda è gerarchica e comprende il livello di raccolta delle informazioni primarie (livello transazionale), i livelli di storage e data mart, il livello OLAP e le applicazioni analitiche client. Pertanto, i sistemi OLAP occupano un posto definito nell'infrastruttura informativa di un'azienda.

Sovente sorge la domanda: in cosa differisce, dal punto di vista di un utente-analista, un sistema OLAP da un data warehouse? Possiamo dire che la cosa principale, dal punto di vista dell'utente, è differenza OLAP consiste nella strutturazione dell'informazione secondo la sua essenza soggettiva (ovvero, soggetto e non tecnica). Lavorando con un'applicazione OLAP, un analista utilizza termini, categorie e indicatori finanziari ed economici familiari (tipi di materiali e prodotti finiti, regioni di vendita, volume delle vendite, prezzo di costo, profitto, ecc.) e per formare qualsiasi, anche piuttosto query complessa, non deve studiare linguaggio SQL... E allo stesso tempo, la risposta alla richiesta arriverà entro pochi secondi. Inoltre, lavorando con un sistema OLAP, un economista può utilizzare strumenti familiari come fogli di calcolo o strumenti di reporting speciali.

Se il data warehouse è principalmente oggetto di attenzione del servizio IT, allora OLAP è uno strumento per analisti “soggetti”. Allo stesso tempo, gli analisti potrebbero anche non indovinare l'esistenza del repository. Pertanto, senza esagerazione, OLAP può essere definito uno strumento software dell'arsenale di un economista, perché è un economista che si occupa di una varietà di compiti analitici: analisi di marketing, analisi delle vendite, analisi degli indicatori di budget, analisi dei rendiconti finanziari e molti altri.

Informazioni su LAP è uno strumento universale. Ma allo stesso tempo, è proprio la sua versatilità che lo rende poco adatto a specifici compiti finanziari ed economici che richiedono l'uso di metodi e principi organizzativi speciali. Pertanto, le applicazioni OLAP non possono fungere da alternativa completa alle applicazioni analitiche specializzate, ad esempio i sistemi di budgeting oi sistemi di consolidamento dei report finanziari. Non c'è contraddizione qui: un prodotto software che implementa i principi generali dell'analisi economica difficilmente può pretendere di risolvere assolutamente tutti i problemi particolari. Ma, d'altra parte, è la combinazione di OLAP e sistemi specializzati che offre all'economista i maggiori vantaggi, poiché in questo caso funzioni, metodi e algoritmi speciali sono combinati con successo con la versatilità dell'elaborazione dei dati analitici.

Questo è il motivo per cui gli strumenti OLAP vengono spesso utilizzati dalle applicazioni di analisi dei client per l'archiviazione di dati multidimensionali. Qui l'utente applica i suoi consueti strumenti per implementare alcune tecniche di gestione, ma allo stesso tempo i dati per l'elaborazione e l'analisi sono archiviati nel server OLAP. Un esempio illustrativo è Hyperion Planning, un sistema di budgeting, pianificazione e previsione. Il suo elemento obbligatorio è un database multidimensionale, che viene utilizzato per memorizzare le informazioni che cambiano più dinamicamente (mentre i metadati e altre informazioni statiche sono archiviate in base relazionale dati).

Pertanto, un sistema OLAP ben costruito svolge un ruolo molto evidente nella vita di un economista, perché con il suo aiuto è possibile accedere alle informazioni più recenti ed eseguire rapidamente procedure analitiche generali. E le complesse funzioni finanziarie e gli aspetti organizzativi necessari saranno forniti da sistemi specializzati, ancora una volta, basati su dati OLAP. Come dimostra l'esperienza di aziende leader (sia internazionali che russe), le tecnologie OLAP sono economicamente redditizie e gli investimenti in tali soluzioni si ripagano piuttosto rapidamente.

Concetto di gestione delle prestazioni aziendali: introduzione agli strumenti di query e reporting

Come già evidenziato, gli strumenti per la generazione di interrogazioni e la costruzione di report (Query e Reporting prese) forniscono funzioni per costruire interrogazioni a sistemi informativi e analitici, integrando dati provenienti da più fonti, visualizzando dati con possibilità di dettaglio e di sintesi, costruendo e stampando integralmente rapporti veri e propri, compresa la qualità della presentazione. Alcuni dei prodotti software di questa classe possono essere utilizzati dagli utenti finali con un supporto IT minimo, mentre altri richiedono un po' di programmazione e sono configurati dai tecnici.

Rappresentanti tipici di questa classe di sistemi sono i prodotti software di Hyperion Corporation, riuniti nella famiglia Hyperion Performance Suite.

Hyperion Performance Suite è una raccolta di strumenti per la creazione di query, l'analisi, la creazione di report e la distribuzione in tutta l'organizzazione. Questi prodotti software sono entrati a far parte della linea di sistemi di BI Hyperion dopo che Hyperion ha acquisito Brio Software nel 2003, un'azienda ben nota nel mercato della business intelligence per le sue soluzioni efficienti e facili da usare. In precedenza, per diversi anni, Hyperion e Brio hanno lavorato a stretto contatto come partner tecnologici, quindi la combinazione dei loro sviluppi ha creato una linea unica in cui le soluzioni Hyperion (sistema Hyperion Essbase OLAP e applicazioni analitiche - Hyperion Planning, Hyperion Financial Management e altri) si è rivelato organicamente integrato dai moderni strumenti di query e reporting di Brio. Di conseguenza, Hyperion è diventata proprietaria della linea di prodotti software di Business Intelligence più potente e completa sul mercato. Oggi tutte queste soluzioni, apprezzate da molte aziende straniere, sono diventate disponibili per le imprese russe.

Hyperion Performance Suite include due prodotto software- Hyperion Intelligence e Hyperion SQR.

Hyperion Intelligence è un sistema moderno e facile da usare per la generazione di query complesse per varie fonti dati, inclusi ERP, CRM, sistemi bancari e altri sistemi transazionali, oltre a presentare questi dati in una forma facile da analizzare. Sfruttando i dati archiviati nei sistemi informativi esistenti, Hyperion Intelligence consente a sviluppatori, analisti e consumatori di trasformare i dati grezzi in informazione preziosa per prendere decisioni. Le capacità analitiche del sistema consentono agli specialisti dell'organizzazione di valutare rapidamente opportunità e tendenze di business e aumentare la validità delle decisioni di gestione e l'interfaccia utente intuitiva basata su tecnologie Internet rende le informazioni disponibili a qualsiasi utente autorizzato.

Il sistema Hyperion SQR è soluzione efficace gestire grandi flussi di report - da relativamente semplici messaggi a report complessi e critici per l'organizzazione. Hyperion SQR consente agli sviluppatori di generare report di qualità di presentazione di qualsiasi complessità e quindi di fornire questi report agli utenti finali in tutta l'organizzazione. Elaborando query complesse e generando report significativi da esse, Hyperion SQR trasforma i set di dati in informazioni aziendali per migliorare l'efficienza dell'intera organizzazione. Il sistema è focalizzato sull'utilizzo di report regolamentati, sulla generazione di report secondo un determinato programma e sulla fornitura di informazioni tempestive a dipendenti, clienti, fornitori e partner commerciali. È molto facile lavorare con i report: utilizzando browser Web familiari, gli utenti possono visualizzare i report, stamparli o inviarli tramite e-mail a diversi formati... Il sistema consente inoltre la classificazione dei messaggi, il controllo della versione e l'archiviazione e il linguaggio di programmazione di terza generazione integrato consente di utilizzare Hyperion SQR come strumento per creare strumenti di estrazione, trasformazione e caricamento dei dati.

La linea di soluzioni BI di Hyperion, integrata dagli strumenti di query e reporting ereditati da Brio, interessa sia i professionisti IT che gli utenti finali.

Dal punto di vista dell'utente finale, è... strumento utile, consentendo di risolvere il problema già menzionato, che i manager e gli specialisti in materia affrontano così spesso: il problema di "una visione delle informazioni di gestione". Ricordiamo che questo problema risiede nel fatto che molto spesso le informazioni gestionali necessarie per l'analisi e il processo decisionale sono archiviate in diverse fonti: sistemi contabili, sistemi ERP, database, ecc. Ciò rende estremamente difficile ottenere le informazioni necessarie e la loro presentazione .in modo user-friendly: gli specialisti sono costretti a dedicare tempo alle procedure di raccolta ed elaborazione dei dati di routine, e con il rischio di distorsioni. Le informazioni gestionali ottenute in questo modo spesso non soddisfano i requisiti di affidabilità e pertinenza, il che ne riduce il valore. A questo proposito, le soluzioni Hyperion BI possono semplificare e velocizzare notevolmente la raccolta delle informazioni, unificarle e presentarle in una forma comoda e visiva. Tali informazioni sono una base affidabile per prendere decisioni gestionali, mentre le procedure di routine sono ridotte al minimo e il tempo degli specialisti è liberato per risolvere i problemi analitici.

Dal punto di vista dei servizi IT, le soluzioni Hyperion BI si distinguono per la loro scalabilità, facilità di supporto e linguaggi integrati che estendono le funzionalità del software.

Le frecce blu sono i modi in cui le informazioni entrano nel sistema, quelle verdi - come le informazioni vengono utilizzate in futuro.

  1. Le informazioni sugli ordini vengono inserite nel sistema 1c - versione dbf.
  2. Caricamento dati "scambio automatico". In realtà lo è passo in più... I dati possono essere ottenuti direttamente dal database dbf. Ma i programmatori 1c hanno deciso che il meccanismo di scaricamento dei dati standard (per 1c) avrebbe fatto meno danni.
  3. Una volta al giorno, le modifiche per il giorno passato vengono caricate in un database MsSql appositamente preparato - archiviazione. Non tutte le informazioni vengono scaricate, ma solo ciò che è necessario per i cubi.

    In linea di principio, non è necessario creare un "repository". I dati per un cubo possono essere ottenuti direttamente dal database 1c (MsSQL o dbf). Ma nel mio caso, i dati dei periodi passati vengono periodicamente cancellati da 1c e i libri di riferimento vengono cancellati. Inoltre, i dati vengono leggermente "puliti" prima di caricarli nella memoria.

  4. Il cubo viene ricalcolato: i dati vengono inseriti nel cubo.
Le informazioni dall'archivio vengono utilizzate non solo dai cubi, ma anche da applicazioni esterne, ad esempio questi dati sono necessari per il calcolo delle buste paga, per la contabilità dei pagamenti e delle consegne, per pianificare il lavoro del manager. Allo stesso tempo, i dati di questi programmi esterni cadono anche a cubetti.

I dipendenti dell'ufficio lavorano con i cubi: gestione, manager, marketing, contabilità. Le informazioni vengono inviate anche a fornitori e rappresentanti di vendita in diverse città della regione.

Ogni utente può ottenere informazioni in diversi modi:

  1. Crea tu stesso un report su una pagina web o in excel

    All'inizio veniva utilizzato solo excel, ma c'erano molti problemi con il fatto che i file Excel erano "sparsi", era necessario ottenere un "punto di ingresso" per selezionare le informazioni.
    Pertanto, è stato creato un sito locale in cui vengono pubblicate le pagine con la tabella pivot. Un dipendente che vuole ottenere un paio di numeri "qui e ora" arriva su questo sito e crea un rapporto nella forma di cui ha bisogno. Se una persona ha bisogno di utilizzare questo rapporto in futuro, può scrivere una richiesta per pubblicare il suo rapporto in SSRS o salvarlo lui stesso in excel.

  2. Visualizza report standard pubblicato in SQL Server Reporting Services (SSRS)
  3. Ottieni un cubo locale e "ruota" i dati fuori dall'ufficio usando excel
  4. Iscriviti alla newsletter e ricevi rapporti standard da SSRS via e-mail
  5. Anche il reparto marketing utilizza il programma CubeSlice. In esso, puoi creare cubi locali da solo ed è molto più conveniente che in Excel

Cubi locali

A volte un utente ha bisogno di ricevere periodicamente report contenenti grandi quantità di dati. Ad esempio, il reparto marketing ha inviato rapporti ai fornitori sotto forma di file Excel contenenti diverse dozzine di pagine.
Olap non è "affinato" per ricevere tali informazioni - i rapporti sono stati generati per molto tempo.

Di norma, anche il fornitore è scomodo per lavorare con report di grandi dimensioni. Pertanto, la maggioranza, dopo aver provato a lavorare con i cubi locali, ha accettato di ricevere rapporti in questa forma. L'elenco dei report generati dal reparto marketing è stato notevolmente ridotto. I restanti report pesanti sono stati implementati in SSRS, sono stati creati abbonamenti (i report vengono generati automaticamente e inviati ai fornitori in base a una pianificazione)

Parametri di sistema di base

Configurazione del server:

processore: 2xAMD Opteron 280
memoria: 4Gb
array di dischi:
sistema operativo: RAID 1 (mirror) 2xSCSI 15k
dati: RAID 0 + 1 4xSCSI 10k

D'accordo, una macchina del genere difficilmente può essere definita un server "potente"

Volume di dati:

memoria 10GB, dati dal 2002
aggregazione 30%
La dimensione della base multidimensionale è 350M
numero di membri di "grandi dimensioni": beni 25 mila, indirizzi - 20 mila.
numero di documenti al giorno - 400. numero medio di righe in un documento - 30

Cosa ha ricevuto l'azienda alla fine:

professionisti

  • Per la gestione dell'impresa
    Consente di guardare la situazione "dall'alto", per identificare i modelli generali di sviluppo del business.
    Aiuta a tracciare le dinamiche dei cambiamenti nei principali indicatori dell'organizzazione nel suo insieme e a valutare rapidamente gli indicatori di prestazione dei subordinati.
  • Per il manager
    La capacità di ricevere autonomamente e in breve tempo le informazioni necessarie per prendere una decisione.
    Facilità di funzionamento. Tutte le azioni sono intuitive
  • Per i fornitori
    Possibilità di lavoro interattivo con informazioni
  • Dal punto di vista di uno specialista IT
    Ridurre il lavoro di routine. L'utente riceve la maggior parte dei report da solo.

Svantaggi:

  • Costo di implementazione. Necessario equipaggiamento opzionale e software.
  • Mancanza di professionisti preparati. Spese per la formazione dei dipendenti del dipartimento IT.

4. Classificazione dei prodotti OLAP.

5. Principi di funzionamento dei client OLAP.

7. Ambiti di applicazione delle tecnologie OLAP.

8. Un esempio di utilizzo delle tecnologie OLAP per l'analisi nel campo delle vendite.

1. Il posto dell'OLAP nella struttura informativa dell'impresa.

Il termine OLAP è indissolubilmente legato al termine Data Warehouse.

I dati nel magazzino provengono da sistemi operativi (sistemi OLTP), progettati per automatizzare i processi aziendali. Inoltre, lo stoccaggio può essere rifornito da fonti esterne come i rapporti statistici.

Il compito del repository è quello di fornire la "materia prima" per l'analisi in un unico luogo e in una struttura semplice e comprensibile.

C'è un motivo in più che giustifica la comparsa di un repository separato: le query analitiche complesse alle informazioni operative rallentano lavoro attuale aziende, bloccando in modo permanente le tabelle e sequestrando le risorse del server.

Uno spazio di archiviazione non è necessariamente un gigantesco accumulo di dati: la cosa principale è che è conveniente per l'analisi.

Centralizzazione e strutturazione conveniente non sono tutto ciò di cui un analista ha bisogno. Ha ancora bisogno di uno strumento per visualizzare e visualizzare le informazioni. I report tradizionali, anche costruiti sulla base di un unico repository, mancano di una cosa: la flessibilità. Non possono essere ruotati, espansi o compressi per ottenere la visualizzazione desiderata dei dati. Vorrei che avesse uno strumento del genere che consentisse di espandere e comprimere i dati in modo semplice e conveniente! OLAP agisce come tale strumento.

Sebbene OLAP non sia un attributo necessario di un data warehouse, viene sempre più utilizzato per analizzare le informazioni accumulate in questo magazzino.

Il posto di OLAP nella struttura informativa dell'impresa (Fig. 1).

Immagine 1... LuogoOLAP nella struttura informativa dell'impresa

I dati operativi vengono raccolti da varie fonti, puliti, integrati e archiviati in un archivio relazionale. Inoltre, sono già disponibili per l'analisi utilizzando vari strumenti di reportistica. Quindi i dati (in tutto o in parte) vengono preparati per l'analisi OLAP. Possono essere caricati in uno speciale database OLAP o lasciati in un archivio relazionale. Il suo elemento più importante sono i metadati, ovvero le informazioni sulla struttura, il posizionamento e la trasformazione dei dati. Grazie a loro, è garantita l'interazione efficiente di vari componenti di archiviazione.

In sintesi, OLAP può essere definito come una raccolta di strumenti di analisi dei dati multidimensionali accumulati nel magazzino.

2. Operativo elaborazione analitica dati.

Il concetto OLAP si basa sul principio della presentazione multidimensionale dei dati. Nel 1993 E. F. Codd ha esaminato gli svantaggi di modello relazionale, in primo luogo, evidenziando l'impossibilità "di combinare, visualizzare e analizzare i dati dal punto di vista di più dimensioni, cioè nel modo più comprensibile per gli analisti aziendali", e definiti requisiti generali per Sistemi OLAP, estendendo le funzionalità dei DBMS relazionali e includendo l'analisi multidimensionale come una delle sue caratteristiche.

Secondo Codd, una visione concettuale multidimensionale è una prospettiva multipla costituita da diverse dimensioni indipendenti lungo le quali possono essere analizzati insiemi specifici di dati.

L'analisi simultanea su più dimensioni è definita come analisi multivariata. Ciascuna dimensione include direzioni di consolidamento dei dati, costituite da una serie di livelli successivi di aggregazione, dove ad ogni livello superiore corrisponde un maggiore grado di aggregazione dei dati per la dimensione corrispondente.

Pertanto, la dimensione dell'Appaltatore può essere determinata dalla direzione di consolidamento, che consiste nei livelli di generalizzazione "impresa - dipartimento - dipartimento - dipendente". La dimensione Tempo può anche includere due direzioni di consolidamento: anno - trimestre - mese - giorno e settimana - giorno, poiché il conteggio del tempo per mese e per settimana non è compatibile. In questo caso, diventa possibile selezionare arbitrariamente il livello di dettaglio delle informazioni desiderato per ciascuna delle misurazioni.

L'operazione di drill down corrisponde al passaggio dagli stadi di consolidamento superiori a quelli inferiori; al contrario, un'operazione di arrotolamento significa passare da livelli inferiori a livelli superiori (Fig. 2).


Figura 2.Misure e direzioni di consolidamento dei dati

3. Requisiti per gli strumenti per l'elaborazione analitica in linea.

L'approccio multidimensionale è emerso quasi contemporaneamente e in parallelo con l'approccio relazionale. Tuttavia, solo dalla metà degli anni novanta, o meglio da
1993, interesse per MSUBD cominciò ad acquisire un carattere generale. È stato in quest'anno che un nuovo articolo del programma uno dei fondatori dell'approccio relazionale E. Codda, in cui ha formulato 12 requisiti di base per i mezzi di attuazione OLAP(Tabella 1).

Tabella 1.

Rappresentazione multidimensionale dei dati

Gli strumenti devono supportare una visione concettuale multidimensionale dei dati.

Trasparenza

L'utente non deve essere consapevole di quali mezzi specifici vengono utilizzati per memorizzare ed elaborare i dati, come sono organizzati i dati e da dove provengono.

Disponibilità

Sta ai media scegliere e comunicare con i migliori per plasmare la risposta a richiesta data fonte di dati. I mezzi dovrebbero fornire una propria visualizzazione automatica diagramma logico in diverse fonti di dati eterogenee.

Prestazioni costanti

Le prestazioni non dovrebbero praticamente dipendere dal numero di Dimensioni nella richiesta.

Supporto per architettura client-server

Gli strumenti devono funzionare in un'architettura client-server.

Uguaglianza di tutte le misurazioni

Nessuna delle misure dovrebbe essere di base, dovrebbero essere tutte uguali (simmetriche).

Elaborazione dinamica matrici sparse

I valori non definiti dovrebbero essere archiviati e gestiti nel modo più efficiente.

Supporto per la modalità multiutente di lavorare con i dati

Gli strumenti devono fornire la capacità di lavorare per più di un utente.

Supporta operazioni basate su varie dimensioni

Tutte le operazioni multidimensionali (es. Aggregazione) devono essere applicate in modo uniforme e coerente a qualsiasi numero di qualsiasi dimensione.

Facilità di manipolazione dei dati

Gli strumenti dovrebbero avere l'interfaccia utente più comoda, naturale e confortevole.

Strumenti di presentazione avanzati

I fondi devono sostenere diversi modi visualizzazione (presentazione) dei dati.

Numero illimitato di dimensioni e livelli di aggregazione dei dati

Non ci dovrebbero essere limiti al numero di dimensioni supportate.

Regole per la valutazione dei prodotti software della classe OLAP

L'insieme di questi requisiti, che è servito come definizione de facto dell'OLAP, dovrebbe essere considerato consultivo e i prodotti specifici dovrebbero essere giudicati nella misura in cui sono vicini a soddisfare perfettamente tutti i requisiti.

Successivamente, la definizione di Codd è stata rivista nel cosiddetto test FASMI, che richiede un'applicazione OLAP per fornire la capacità di analizzare rapidamente le informazioni multidimensionali condivise.

Ricordare le 12 regole di Codd è troppo gravoso per la maggior parte delle persone. Si è scoperto che puoi riassumere la definizione OLAP con solo cinque parole chiave: Analisi rapida delle informazioni multidimensionali condivise - o, in breve - FASMI (tradotto dall'inglese:F asti UN analisi di S arrapato m ultradimensionale io informazioni).

Questa definizione è stata formulata per la prima volta all'inizio del 1995 e da allora non ha avuto bisogno di revisione.

VELOCE ( Veloce ) - significa che il sistema dovrebbe essere in grado di fornire la maggior parte delle risposte agli utenti entro circa cinque secondi. Inoltre, il più semplici query vengono elaborati entro un secondo e pochissimi - più di 20 secondi. La ricerca ha dimostrato che gli utenti finali percepiscono che il processo non ha successo se non vengono ricevuti risultati dopo 30 secondi.

A prima vista, può sembrare sorprendente che quando si riceve un rapporto in un minuto, cosa che non molto tempo fa richiedeva giorni, l'utente si annoia molto rapidamente durante l'attesa e il progetto risulta essere molto meno riuscito rispetto al caso di un risposta immediata, anche a costo di analisi meno dettagliate.

ANALISI (Analisi)significa che il sistema può gestire qualsiasi analisi logica e statistica specifica per di questa applicazione e garantisce che venga salvato in un modulo accessibile all'utente finale.

Non importa se questa analisi viene eseguita nel banco di lavoro del fornitore o in un prodotto software esterno correlato come foglio di calcolo, è solo che tutte le funzionalità di analisi richieste devono essere fornite in modo intuitivo agli utenti finali. Gli strumenti di analisi potrebbero includere procedure specifiche come l'analisi delle serie temporali, l'allocazione dei costi, i trasferimenti di valuta estera, la ricerca di obiettivi, le modifiche alla struttura multidimensionale, la modellazione non procedurale, il rilevamento delle eccezioni, l'estrazione dei dati e altre operazioni dipendenti dall'applicazione. Tali capacità variano ampiamente tra i prodotti, a seconda dell'orientamento del target.

CONDIVISA significa che il sistema soddisfa tutti i requisiti di protezione della privacy (possibilmente fino al livello della cella) e, se è richiesto l'accesso in scrittura multipla, garantisce che le modifiche siano bloccate al livello appropriato. Non tutte le applicazioni sono necessarie rispondere dati. Tuttavia, il numero di tali applicazioni è in crescita e il sistema deve essere in grado di gestire più modifiche in modo tempestivo e sicuro.

MULTIDIMENSIONALE - questo è un requisito fondamentale. Se dovessi definire OLAP in una parola, lo sceglieresti. Il sistema dovrebbe fornire una visione concettuale multidimensionale dei dati, incluso il supporto completo per gerarchie e gerarchie multiple, poiché questo è sicuramente il modo più logico per analizzare un'azienda e un'organizzazione. Non esiste un numero minimo di dimensioni da elaborare perché dipende anche dall'applicazione e la maggior parte dei prodotti OLAP ha dimensioni sufficienti per i mercati di destinazione.

INFORMAZIONE - tutto qui. Le informazioni necessarie dovrebbe essere ricevuto dove è necessario. Tuttavia, molto dipende dall'applicazione. La potenza di vari prodotti viene misurata in termini di quantità di input che possono elaborare, ma non di quanti gigabyte possono memorizzare. La potenza dei prodotti è molto diversa: i prodotti OLAP più grandi su cui possono operare almeno, mille volte più dati del più piccolo. Ci sono molti fattori da considerare a questo proposito, tra cui la duplicazione dei dati, la RAM richiesta, l'utilizzo spazio sul disco, indicatori di performance, integrazione con archivi di informazioni, ecc.

Il test FASMI è una definizione ragionevole e comprensibile degli obiettivi che l'OLAP si concentra sul raggiungimento.

4. ClassificazioneOLAP-prodotti.

Quindi, l'essenza di OLAP consiste nel fatto che le informazioni iniziali per l'analisi sono presentate sotto forma di un cubo multidimensionale e viene fornita la capacità di manipolarle arbitrariamente e ottenere le sezioni di informazioni necessarie - i rapporti. In questo caso, l'utente finale vede il cubo come una tabella dinamica multidimensionale che riepiloga automaticamente i dati (fatti) in diverse sezioni (dimensioni), e consente di controllare in modo interattivo i calcoli e il modulo del report. L'esecuzione di queste operazioni è assicurata OLAP -macchina (o macchina calcoli OLAP).

Ad oggi, nel mondo sono stati sviluppati molti prodotti che implementano OLAP -tecnologie. Per facilitare la navigazione tra di essi, vengono utilizzate le classificazioni OLAP -prodotti: a titolo di archiviazione dei dati per l'analisi e per posizione OLAP -automobili. Diamo un'occhiata più da vicino a ciascuna categoria prodotti OLAP.

Classificazione per metodo di conservazione

I cubi multidimensionali sono costruiti sulla base di dati di origine e aggregati. Sia i dati di origine che quelli aggregati per i cubi possono essere archiviati sia in formato relazionale che basi multidimensionali dati. Pertanto, attualmente esistono tre metodi di memorizzazione dei dati: MOLAP (OLAP multidimensionale), ROLAP (OLAP relazionale) e HOLAP (OLAP ibrido ). Rispettivamente, OLAP -I prodotti si suddividono in tre categorie simili a titolo di conservazione dei dati:

1. Nel caso di MOLAP , i dati di origine e aggregati vengono archiviati in un database multidimensionale o in un cubo locale multidimensionale.

2. In ROLAP -products, i dati di origine vengono archiviati in database relazionali o in tabelle locali flat su un file server. I dati aggregati possono essere inseriti nelle tabelle di servizio nello stesso database. La conversione dei dati da un database relazionale a cubi multidimensionali avviene su richiesta strumenti OLAP.

3. In caso di utilizzo HOLAP architettura, i dati originali rimangono nel database relazionale, e gli aggregati sono collocati in quello multidimensionale. Edificio OLAP -cube viene eseguito su richiesta OLAP -Mezzi basati su dati relazionali e multidimensionali.

Classificazione della posizione OLAP-automobili.

Su questa base OLAP -i prodotti sono suddivisi in Server OLAP e client OLAP:

Server OLAP -i mezzi di calcolo e memorizzazione dei dati aggregati sono eseguiti da un processo separato - il server. Applicazione client recupera solo i risultati delle query sui cubi multidimensionali archiviati sul server. Alcuni OLAP - i server supportano l'archiviazione dei dati solo nei database relazionali, alcuni - solo in quelli multidimensionali. Molti moderni OLAP - i server supportano tutti e tre i modi di memorizzare i dati:MOLAP, ROLAP e HOLAP.

MOLAP.

MOLAP è Elaborazione analitica on-line multidimensionale, ovvero OLAP multidimensionale.Ciò significa che il server utilizza un database multidimensionale (MDB) per archiviare i dati. Il senso dell'utilizzo di MDB è ovvio. Può archiviare in modo efficiente dati di natura multidimensionale, fornendo un mezzo per servire rapidamente le query del database. I dati vengono trasferiti da un'origine dati a un database multidimensionale, quindi il database viene aggregato. Il pre-calcolo è ciò che rende le query OLAP più veloci perché i dati di riepilogo sono già stati calcolati. Il tempo di richiesta diventa funzione esclusivamente del tempo necessario per accedere a un dato dato ed eseguire un calcolo. Questo metodo supporta il concetto che il lavoro viene svolto una volta e i risultati vengono quindi utilizzati più e più volte. I database multidimensionali sono una tecnologia relativamente nuova. L'utilizzo di MDB presenta gli stessi svantaggi della maggior parte delle nuove tecnologie. Vale a dire, non sono stabili come i database relazionali (RDB) e non sono ottimizzati nella stessa misura. Altro debolezza MDB risiede nell'impossibilità di utilizzare la maggior parte dei database multidimensionali nel processo di aggregazione dei dati, quindi ci vuole tempo per nuova informazione reso disponibile per l'analisi.

ROLAP.

ROLAP è Elaborazione Analitica Relazionale On-Line, ovvero OLAP relazionale.Il termine ROLAP significa che il server OLAP è basato su un database relazionale. I dati originali vengono inseriti in un database relazionale, solitamente in uno schema a stella oa fiocco di neve, che aiuta a ridurre i tempi di recupero. Il server fornisce un modello di dati multidimensionale utilizzando query SQL ottimizzate.

Ci sono una serie di ragioni per scegliere un database relazionale su un database multidimensionale. RDB è una tecnologia consolidata con molte opportunità di ottimizzazione. Usare in condizioni reali ha portato a un prodotto più elaborato. Inoltre, gli RDB supportano volumi di dati maggiori rispetto agli MDB. Sono progettati solo per tali volumi. L'argomento principale contro gli RDB è la complessità delle query richieste per recuperare informazioni da un database di grandi dimensioni utilizzando SQL. Un programmatore SQL inesperto potrebbe facilmente caricare preziose risorse di sistema cercando di eseguire una query simile, che è molto più facile da eseguire in MDB.

Dati aggregati/preaggregati.

L'implementazione rapida delle query è fondamentale per OLAP. Questo è uno di principi di base OLAP: la capacità di manipolare in modo intuitivo i dati richiede estrazione rapida informazione. In generale, più calcoli sono necessari per ottenere un'informazione, più lenta è la risposta. Pertanto, al fine di risparmiare un po' di tempo per l'implementazione delle query, le informazioni a cui solitamente si accede più spesso, ma che allo stesso tempo richiedono un calcolo, vengono sottoposte ad aggregazione preliminare. Cioè, vengono contati e quindi archiviati nel database come nuovi dati. Un esempio di tipo di dati che può essere calcolato in anticipo sono i dati di riepilogo, ad esempio i dati di vendita per mese, trimestre o anno, per i quali i dati effettivi inseriti sono dati giornalieri.

Diversi fornitori hanno diversi metodi di selezione per i parametri che richiedono la preaggregazione e un numero di valori precalcolati. L'approccio di aggregazione influisce sia sul database che sul tempo di esecuzione della query. Se calcolato più valori, aumenta la probabilità che l'utente chieda un valore già calcolato, e quindi il tempo di risposta sarà più breve, poiché non c'è bisogno di chiedere il valore iniziale per il calcolo. Tuttavia, se calcoliamo tutti i valori possibili, questo non è la migliore soluzione- in questo caso, la dimensione del database aumenta notevolmente, il che lo renderà ingestibile e il tempo di aggregazione sarà troppo lungo. Inoltre, quando viene aggiunto il database valori numerici, o se cambiano, queste informazioni dovrebbero riflettersi nei valori calcolati in precedenza a seconda dei nuovi dati. Pertanto, anche l'aggiornamento del database può richiedere molto tempo se un largo numero valori precalcolati. Poiché il database è in genere offline durante l'aggregazione, è consigliabile che il tempo di aggregazione non sia troppo lungo.

OLAP -il cliente è organizzato diversamente. Costruire un cubo multidimensionale e OLAP -i calcoli vengono eseguiti nella memoria del computer client.OLAP -i clienti si dividono anche in ROLAP e MOLAP.E alcuni possono supportare entrambi i tipi di accesso ai dati.

Ognuno di questi approcci ha i suoi pro e contro. Contrariamente alla credenza popolare sui vantaggi degli strumenti server rispetto a quelli client, in un certo numero di casi l'uso di OLAP - il client per gli utenti può essere più efficiente e redditizio rispetto all'utilizzo server OLAP.

Lo sviluppo di applicazioni analitiche utilizzando gli strumenti client OLAP è un processo rapido e non richiede una formazione specifica per l'appaltatore. Un utente che conosce l'implementazione fisica del database può sviluppare da solo un'applicazione analitica, senza il coinvolgimento di uno specialista IT.

Quando si utilizza un server OLAP, è necessario studiare 2 sistemi diversi, a volte di fornitori diversi, per creare cubi sul server e per sviluppare un'applicazione client.

Il client OLAP fornisce un'interfaccia visiva unificata per descrivere i cubi e personalizzare le loro interfacce utente.

Quindi, in quali casi l'utilizzo di un client OLAP per gli utenti può essere più efficiente e redditizio rispetto all'utilizzo di un server OLAP?

· Fattibilità economica dell'applicazione OLAP -server si verifica quando la quantità di dati è molto grande e insopportabile per OLAP - il cliente, altrimenti l'uso di quest'ultimo è più giustificato. In questo caso OLAP -Il cliente combina le caratteristiche di alte prestazioni con il basso costo.

· I potenti PC per analisti sono un'altra buona ragione OLAP -clienti. Quando si applica OLAP -server, queste capacità non vengono utilizzate.

Tra i vantaggi dei client OLAP ci sono i seguenti:

· Costi di implementazione e manutenzione OLAP - il cliente è significativamente inferiore al costo di server OLAP.

· Usando OLAP - per un client con una macchina incorporata, la trasmissione dei dati in rete viene eseguita una volta. Facendo OLAP -le operazioni di nuovi flussi di dati non vengono generate.

5. Principi di lavoro OLAP-clienti.

Diamo un'occhiata al processo di creazione di un'applicazione OLAP utilizzando lo strumento client (Figura 1).

Figura 1.Crea un'applicazione OLAP utilizzando lo strumento client ROLAP

Il principio di funzionamento dei client ROLAP è una descrizione preliminare del livello semantico dietro il quale si nasconde la struttura fisica dei dati iniziali. In questo caso, le origini dati possono essere: tabelle locali, RDBMS. L'elenco delle origini dati supportate è specifico del prodotto. Successivamente, l'utente può manipolare in modo indipendente oggetti che comprende in termini di argomento per creare cubi e interfacce analitiche.

Il client del server OLAP funziona in modo diverso. Nel server OLAP, durante la creazione dei cubi, l'utente manipola le descrizioni fisiche del database. Questo crea descrizioni personalizzate nel cubo stesso. Il client OLAP Server è configurato solo per cubo.

Quando si crea un livello semantico, le origini dati, le tabelle Sales e Deal, sono descritte in modo chiaro utente finale termini e diventano "Prodotti" e "Transazioni". Il campo "ID" della tabella "Prodotti" viene rinominato in "Codice" e "Nome" in "Prodotto", ecc.

Quindi viene creato l'oggetto business Vendite. Un oggetto business è un tavolo piatto da cui viene formato un cubo multidimensionale. Quando viene creato un oggetto commerciale, le tabelle "Prodotti" e "Offerte" vengono combinate dal campo "Codice" del prodotto. Poiché non è necessario che tutti i campi della tabella siano visualizzati nel report, l'oggetto business utilizza solo i campi "Articolo", "Data" e "Importo".

Nel nostro esempio, in base all'oggetto commerciale Vendite, abbiamo creato un report sulle vendite di merci per mese.

Quando si lavora con un report interattivo, l'utente può impostare le condizioni di filtraggio e raggruppamento con gli stessi semplici movimenti del mouse. A questo punto, il client ROLAP accede ai dati nella cache. D'altra parte, il client del server OLAP genera una nuova query sul database multidimensionale. Ad esempio, applicando un filtro per prodotti nel report delle vendite, è possibile ottenere un report sulle vendite dei prodotti di nostro interesse.

Tutte le impostazioni dell'applicazione OLAP possono essere archiviate in un repository di metadati dedicato, in un'applicazione o in un repository del sistema di database multidimensionale.L'implementazione dipende dal prodotto software specifico.

Tutto ciò che è incluso in queste applicazioni è un aspetto standard dell'interfaccia, delle funzioni e della struttura predefinite e Decisioni rapide per situazioni più o meno standard. Ad esempio, i pacchetti finanziari sono popolari. Le applicazioni finanziarie predefinite consentiranno ai professionisti di utilizzare strumenti finanziari familiari senza dover progettare una struttura di database o moduli e report comuni.

Internet è nuova forma cliente. Inoltre, porta il marchio delle nuove tecnologie; un mucchio di soluzioni internet differiscono significativamente nelle loro capacità in generale e nella qualità delle soluzioni OLAP in particolare. Ci sono molti vantaggi nella generazione di report OLAP su Internet. La più significativa è l'assenza della necessità di specialisti Software per accedere alle informazioni. Ciò consente all'azienda di risparmiare un sacco di tempo e denaro.

6. Scelta dell'architettura dell'applicazione OLAP.

Quando si implementa un sistema informativo e analitico, è importante non commettere errori nella scelta di un'architettura applicativa OLAP. La traduzione letterale del termine Processo Analitico On-Line - "elaborazione analitica on-line" - è spesso presa alla lettera nel senso che i dati che entrano nel sistema vengono prontamente analizzati. Questa è un'illusione: l'efficienza dell'analisi non ha nulla a che fare con tempo reale aggiornamento dei dati nel sistema. Questa caratteristica si riferisce al tempo di risposta del sistema OLAP alle richieste degli utenti. Allo stesso tempo, i dati analizzati sono spesso un'istantanea di informazioni "di ieri", se, ad esempio, i dati negli archivi vengono aggiornati una volta al giorno.

In questo contesto, la traduzione di OLAP come "elaborazione analitica interattiva" è più accurata. È la capacità di analizzare i dati in modalità interattiva che distingue i sistemi OLAP dai sistemi per la redazione di report regolamentati.

Un'altra caratteristica dell'elaborazione interattiva nella formulazione del fondatore di OLAP E. Codd è la capacità di "combinare, visualizzare e analizzare i dati dal punto di vista di più dimensioni, cioè nel modo più comprensibile per gli analisti aziendali". Per Codd stesso, il termine OLAP denota un modo esclusivamente specifico di rappresentare i dati a livello concettuale - multidimensionale. A livello fisico, i dati possono essere archiviati in database relazionali, ma in realtà gli strumenti OLAP tendono a funzionare con database multidimensionali, in cui i dati sono organizzati in un ipercubo (Figura 1).

Figura 1. OLAP- cubo (ipercubo, metacubo)

Inoltre, la rilevanza di questi dati è determinata dal momento in cui l'ipercubo viene riempito con nuovi dati.

Ovviamente, il tempo di formazione di un database multidimensionale dipende in modo significativo dal volume di dati in esso caricato, quindi è ragionevole limitare questo volume. Ma come non restringere le possibilità di analisi e non privare l'utente dell'accesso a tutte le informazioni di interesse? Esistono due percorsi alternativi: Analizza quindi interroga e Interroga quindi analizza.

I seguaci del primo percorso suggeriscono di caricare informazioni generalizzate in un database multidimensionale, ad esempio totali mensili, trimestrali, annuali per i reparti. E se è necessario approfondire i dati, viene richiesto all'utente di generare un report sul database relazionale contenente la selezione richiesta, ad esempio per giorno per un determinato reparto o per mesi e dipendenti di un reparto selezionato.

I sostenitori della seconda via, al contrario, offrono all'utente, prima di tutto, di decidere i dati che sta per analizzare e di caricarli in un microcubo, un piccolo database multidimensionale. Entrambi gli approcci differiscono concettualmente e hanno i loro vantaggi e svantaggi.

I vantaggi del secondo approccio includono la "freschezza" delle informazioni che l'utente riceve sotto forma di un rapporto multidimensionale - un "microcubo". Il microcubo viene formato sulla base delle informazioni appena richieste dall'attuale database relazionale. Il lavoro con il microcubo viene eseguito in modalità interattiva: l'ottenimento di porzioni di informazioni e i relativi dettagli all'interno del microcubo vengono eseguiti istantaneamente. Altri punto positivoè che la progettazione della struttura e del riempimento del microcubo viene eseguita dall'utente "al volo", senza la partecipazione dell'amministratore del database. Tuttavia, l'approccio soffre anche di gravi inconvenienti. L'utente non vede il quadro generale e deve essere determinato in anticipo con la direzione della sua ricerca. In caso contrario, il microcubo richiesto potrebbe essere troppo piccolo e non contenere tutti i dati di interesse, e l'utente dovrà richiedere un nuovo microcubo, poi uno nuovo, poi ancora e ancora. L'approccio Query quindi analizzare implementa lo strumento BusinessObjects dell'azienda con lo stesso nome e utensili Piattaforme Azienda ContornoIntersoft Laboratorio.

Con l'approccio Analizza quindi interroga, la quantità di dati caricati in un database multidimensionale può essere piuttosto grande, il riempimento dovrebbe essere eseguito secondo le regole e può richiedere molto tempo. Tuttavia, tutti questi svantaggi si ripagano in seguito, quando l'utente ha accesso a quasi tutti i dati necessari in qualsiasi combinazione. Il riferimento ai dati di origine in un database relazionale viene effettuato solo come ultima risorsa, quando sono necessarie informazioni dettagliate, ad esempio su una fattura specifica.

Il lavoro di un singolo database multidimensionale non è praticamente influenzato dal numero di utenti che vi accedono. Leggono solo i dati disponibili lì, in contrasto con l'approccio Query poi analizza, in cui il numero di microcubi nel caso estremo può crescere alla stessa velocità del numero di utenti.

Questo approccio aumenta il carico sui servizi IT, che, oltre a quelli relazionali, sono costretti anche a servire database multidimensionali.Questi servizi sono responsabili dell'aggiornamento automatico tempestivo dei dati nei database multidimensionali.

I rappresentanti più importanti dell'approccio "Analizza e poi interroga" sono gli strumenti PowerPlay e Impromptu di Cognos.

La scelta sia dell'approccio che dello strumento che lo implementa dipende principalmente dall'obiettivo perseguito: bisogna sempre trovare un equilibrio tra il risparmio di budget e il miglioramento della qualità del servizio per gli utenti finali. Va tenuto presente che, strategicamente, la realizzazione di sistemi informativi e analitici persegue l'obiettivo di conseguire un vantaggio competitivo, e non di evitare i costi dell'automazione. Ad esempio, un sistema informativo e analitico aziendale può fornire le necessarie, tempestive e informazione affidabile su una società, la cui pubblicazione per i potenziali investitori garantirà la trasparenza e la prevedibilità di questa società, che diventerà inevitabilmente una condizione per la sua attrattività di investimento.

7. Ambiti di applicazione delle tecnologie OLAP.

OLAP è applicabile ovunque sia presente un'attività di analisi dei dati multivariata. In generale, se si dispone di una tabella con dati, in cui è presente almeno una colonna descrittiva (dimensione) e una colonna con numeri (misure o fatti), uno strumento OLAP sarà solitamente uno strumento efficace per l'analisi e la generazione di report.

Consideriamo alcuni ambiti di applicazione delle tecnologie OLAP, presi dalla vita reale.

1. Vendite.

Sulla base dell'analisi della struttura di vendita, vengono risolte le questioni necessarie per prendere decisioni gestionali: modifica della gamma di merci, prezzi, chiusura e apertura di negozi, filiali, risoluzione e sottoscrizione di contratti con i rivenditori, conduzione o risoluzione campagne pubblicitarie eccetera.

2. Acquisti.

Il compito è l'opposto dell'analisi delle vendite. Molte aziende acquistano componenti e materiali dai fornitori. I commercianti acquistano beni per la rivendita. Ci sono molti compiti possibili nell'analisi degli appalti, dalla pianificazione I soldi sulla base dell'esperienza passata, prima controllo sui manager scelta dei fornitori.

3. Prezzi.

L'analisi degli acquisti è strettamente correlata all'analisi dei prezzi di mercato. Lo scopo di questa analisi è ottimizzare i costi, per selezionare le offerte più vantaggiose.

4. Marketing.

Per analisi di marketing intendiamo solo l'area di analisi degli acquirenti o dei clienti-consumatori di servizi. Compito di questa analisi è il corretto posizionamento del prodotto, l'identificazione di gruppi di acquirenti per una pubblicità mirata e l'ottimizzazione dell'assortimento. Attività OLAP in in questo caso- dare all'utente uno strumento per ricevere rapidamente, alla velocità del pensiero, risposte a domande che sorgono intuitivamente durante l'analisi dei dati.

5. Magazzino.

L'analisi della struttura dei saldi di magazzino nel contesto dei tipi di merce, i magazzini, l'analisi della durata di conservazione delle merci, l'analisi della spedizione per destinatario e molti altri tipi di analisi importanti per l'azienda sono possibili se l'organizzazione dispone della contabilità di magazzino.

6. Flusso di cassa.

Questa è un'intera area di analisi, con molte scuole e metodologie. La tecnologia OLAP può fungere da strumento per l'implementazione o il miglioramento di queste tecniche, ma in nessun modo può sostituirle. Analizza il turnover in contanti di non contante e contante in termini di transazioni commerciali, controparti, valute e tempo al fine di ottimizzare i flussi, fornire liquidità, ecc. La composizione delle misurazioni dipende fortemente dalle specificità dell'azienda, del settore e della metodologia.

7. Bilancio.

Uno dei campi di applicazione più fertili per le tecnologie OLAP. Non per niente nessun moderno sistema di budgeting è considerato completo senza la presenza di strumenti OLAP per l'analisi del budget nella sua composizione. La maggior parte dei report di budget può essere facilmente creata sulla base di sistemi OLAP. Allo stesso tempo, i rapporti rispondono a un molto vasta gamma domande: analisi della struttura delle spese e delle entrate, confronto delle spese per alcune voci nei diversi reparti, analisi della dinamica e dell'andamento delle spese per alcune voci, analisi del costo e del profitto.

8. Conti.

Il classico bilancio, composto da un numero di conto e contenente saldi in entrata, fatturato e saldi in uscita, può essere perfettamente analizzato nel sistema OLAP. Inoltre, il sistema OLAP è in grado di calcolare in modo automatico e molto rapido i saldi consolidati di un'organizzazione multiramo, i saldi mensili, trimestrali e annuali, i saldi aggregati per gerarchia dei conti, i saldi analitici in base alle caratteristiche analitiche.

9. Rendicontazione finanziaria.

Un sistema di reporting tecnologicamente avanzato non è altro che un insieme di indicatori nominativi con valori alla data, che devono essere raggruppati e riassunti in vari aspetti per ottenere report specifici. In questo caso, la visualizzazione e la stampa dei report è il modo più semplice ed economico da implementare nei sistemi OLAP. In ogni caso, il sistema di reporting interno dell'azienda non è così conservativo e può essere ricostruito per risparmiare denaro su lavori di ingegneria per creare report e acquisire capacità di analisi operativa multivariata.

10. Traffico del sito web.

Il file di registro del server Internet è di natura multidimensionale, il che significa che è adatto per l'analisi OLAP. I fatti sono: il numero di visite, il numero di accessi, il tempo trascorso sulla pagina e altre informazioni disponibili nel registro.

11. Volumi di produzione.

Questo è un altro esempio analisi statistica... Pertanto, è possibile analizzare i volumi di patate coltivate, acciaio fuso, merci prodotte.

12. Consumo di materiali di consumo.

Immagina un impianto composto da dozzine di laboratori, che consuma liquidi di raffreddamento, lavaggio, oli, stracci, carta vetrata - centinaia di articoli Forniture... Per una pianificazione accurata e l'ottimizzazione dei costi è necessaria un'analisi approfondita del consumo effettivo dei materiali di consumo.

13. Uso dei locali.

Un altro tipo di analisi statistica. Esempi: analisi del carico di lavoro di aule, edifici e locali in locazione, utilizzo di sale conferenze, ecc.

14. Turnover dei dipendenti nell'impresa.

Analisi del turnover del personale in azienda nell'ambito di filiali, dipartimenti, professioni, titolo di studio, genere, età, tempo.

15. Traffico passeggeri.

Analisi del numero di biglietti venduti e degli importi nel contesto di stagioni, direzioni, tipi di auto (classi), tipi di treni (aeromobili).

L'ambito di applicazione non è limitato a questo elenco. OLAP - tecnologie. Consideriamo ad esempio la tecnologia OLAP -analisi nel campo delle vendite.

8. Esempio di utilizzo OLAP -tecnologie per l'analisi nel campo delle vendite.

Progettare una rappresentazione multidimensionale dei dati per OLAP -l'analisi inizia con la formazione di una mappa di misura. Ad esempio, quando si analizzano le vendite, può essere opportuno individuare singole parti del mercato (in via di sviluppo, stabili, consumatori grandi e piccoli, probabilità di nuovi consumatori, ecc.) e valutare i volumi di vendita per prodotti, territori, clienti, segmenti di mercato, canali di distribuzione, ecc. la dimensione degli ordini. Queste direzioni formano la griglia della visione multidimensionale delle vendite - la struttura delle sue dimensioni.

Poiché l'attività di qualsiasi impresa si svolge nel tempo, la prima domanda che si pone nell'analisi è la questione delle dinamiche di sviluppo del business. Organizzazione corretta asse temporale fornirà una risposta qualitativa a questa domanda. Di solito l'asse temporale è diviso in anni, trimestri e mesi. È possibile una frammentazione ancora maggiore in settimane e giorni. La struttura della dimensione temporale è formata tenendo conto della frequenza di ricezione dei dati; può anche essere condizionata dalla frequenza della richiesta di informazioni.

La dimensione "gruppo di prodotti" è progettata per riflettere il più fedelmente possibile la struttura dei prodotti venduti. Allo stesso tempo, è importante osservare un certo equilibrio al fine, da un lato, di evitare dettagli eccessivi (il numero di gruppi dovrebbe essere visibile), e dall'altro, di non perdere un segmento significativo del mercato .

La dimensione “Clienti” riflette la struttura delle vendite per localizzazione geografica. Ogni dimensione può avere le proprie gerarchie, ad esempio in questa dimensione può essere una struttura: Paesi - Regioni - Città - Clienti.

Per analizzare le prestazioni dei reparti, dovresti creare la tua dimensione. Ad esempio, puoi distinguere due livelli della gerarchia: i reparti e le loro suddivisioni, che dovrebbero riflettersi nella dimensione "Reparti".

Infatti, le dimensioni "Tempo", "Prodotti", "Clienti" definiscono in modo abbastanza completo lo spazio dell'area tematica.

Inoltre, è utile suddividere questo spazio in aree condizionali, prendendo come base le caratteristiche calcolate, ad esempio gli intervalli del volume delle transazioni in termini di valore. Quindi l'intera attività può essere suddivisa in una serie di intervalli di valori in cui viene svolta. In questo esempio, puoi limitarti ai seguenti indicatori: l'importo delle vendite di beni, il numero di beni venduti, l'importo delle entrate, il numero di transazioni, il numero di clienti, il volume degli acquisti dai produttori.

OLAP - il cubo per l'analisi apparirà come (Fig. 2):


Figura 2.OLAP- un cubo per analizzare il volume delle vendite

È proprio un array così tridimensionale in termini OLAP che viene chiamato cubo. Infatti, dal punto di vista della matematica rigorosa, un tale array non sarà sempre un cubo: un cubo reale dovrebbe avere lo stesso numero di elementi in tutte le dimensioni, mentre i cubi OLAP non hanno tale limitazione. Un cubo OLAP non deve essere affatto 3D. Può essere sia bidimensionale che multidimensionale, a seconda del problema da risolvere. I prodotti OLAP seri sono progettati per circa 20 dimensioni, mentre le applicazioni desktop più semplici supportano circa 6 dimensioni.

Lontano da tutti gli elementi del cubo dovrebbero essere riempiti: se non ci sono informazioni sulle vendite del Prodotto 2 al Cliente 3 nel terzo trimestre, il valore nella cella corrispondente semplicemente non sarà determinato.

Tuttavia, il cubo stesso non è adatto per l'analisi. Se è ancora possibile rappresentare o rappresentare adeguatamente un cubo tridimensionale, allora con sei o diciannove dimensionali la situazione è molto peggiore. Pertanto, prima dell'uso, le normali tabelle bidimensionali vengono estratte dal cubo multidimensionale. Questa operazione si chiama "slicing" del cubo. L'analista, per così dire, prende e "taglia" le dimensioni del cubo secondo le etichette di interesse. In questo modo, l'analista prende una fetta bidimensionale del cubo (report) e lavora con essa. La struttura del report è mostrata nella Figura 3.

Figura 3.Struttura del report analitico

Tagliamo il nostro cubo OLAP e otteniamo il report delle vendite per il terzo trimestre, sarà simile a questo (Fig. 4).

Figura 4.Rapporto sulle vendite del terzo trimestre

Puoi tagliare il cubo lungo un asse diverso e ottenere un rapporto sulle vendite del gruppo di prodotti 2 durante l'anno (Fig. 5).

Figura 5.Rapporto trimestrale sulle vendite di prodotti 2

Allo stesso modo, puoi analizzare il rapporto con il cliente 4, tagliando il cubo in etichetta Clienti(fig.6)

Figura 6.Report sulla consegna della merce al cliente 4

Puoi approfondire il rapporto per mese o parlare della consegna della merce a una specifica filiale del cliente.

Incredibile - vicino ...

Nel corso del mio lavoro, ho spesso avuto bisogno di fare relazioni complesse, ho cercato costantemente di trovare qualcosa in comune in esse per comporle in modo più semplice e universale, ho persino scritto e pubblicato un articolo su questo argomento "Albero di Osipov". Tuttavia, il mio articolo è stato criticato e ha affermato che tutti i problemi che ho sollevato sono stati risolti da tempo in MOLAP.RU v.2.4 (www.molap.rgtu.ru) e ho consigliato di guardare le tabelle riassuntive in EXCEL.
Si è rivelato così semplice che, mettendoci sopra le mie mani ingegnose, ho avuto un'idea molto circuito semplice per lo scarico dei dati da 1C7 o qualsiasi altro database (di seguito denominato 1C qualsiasi database) e analisi in OLAP.
Penso che molti degli schemi di caricamento OLAP siano troppo complicati, scelgo la semplicità.

Specifiche :

1. Per il funzionamento è richiesto solo EXCEL 2000.
2. L'utente stesso può progettare report senza programmazione.
3. Scarico da 1C7 a formato semplice file di testo.
4. Per registrazioni contabili già disponibili elaborazione universale per lo scarico, funzionante in qualsiasi configurazione. L'elaborazione del campione è disponibile per il caricamento di altri dati.
5. È possibile progettare in anticipo moduli di report e quindi applicarli a dati diversi senza riprogettarli.
6. Bella buona performance... Nella prima lunga fase, i dati vengono prima importati in EXCEL da un file di testo e viene creato un cubo OLAP, quindi, abbastanza rapidamente, è possibile creare qualsiasi report sulla base di questo cubo. Ad esempio, i dati sulle vendite di prodotti da parte di un negozio per 3 mesi con un assortimento di 6000 prodotti vengono caricati in EXCEL in 8 minuti su Cel600-128M, la valutazione per prodotti e gruppi (report OLAP) viene ricalcolata in 1 minuto.
7. I dati vengono scaricati completamente da 1C7 per il periodo specificato (tutti i movimenti, in tutti i magazzini, aziende, conti). Durante l'importazione in EXCEL, è possibile utilizzare filtri che caricano solo i dati necessari per l'analisi (ad esempio, da tutti i movimenti, solo vendite).
8. Attualmente sono stati sviluppati metodi per analizzare movimenti o residui, ma non movimenti e residui insieme, sebbene ciò sia possibile in linea di principio.

Cos'è OLAP : (www.molap.rgtu.ru)

Supponi di avere rete commerciale... Lascia che i dati sulle operazioni commerciali vengano caricati in un file di testo o in una tabella del modulo:

Data - data dell'operazione
Mese - mese di funzionamento
Settimana - settimana dell'intervento
Tipo: acquisto, vendita, restituzione, cancellazione
Controparte: un'organizzazione esterna coinvolta in un'operazione
Autore - la persona che ha emesso la fattura

In 1C, ad esempio, una riga di questa tabella corrisponderà ad una riga della fattura, alcuni campi (Controparte, Data) sono presi dall'intestazione della fattura.

I dati per l'analisi vengono solitamente caricati nel sistema OLAP per un certo periodo di tempo, dal quale, in linea di principio, è possibile selezionare un altro periodo applicando filtri di carico.

Questa tabella è la fonte per l'analisi OLAP.

Rapporto

misure

Dati

Filtro

Quanti prodotti vengono venduti e per quale importo al giorno?

Data, oggetto

Quantità, importo

Tipo = "vendita"

Quali controparti hanno consegnato quale prodotto per quale importo al mese?

Mese, Controparte, Articolo

Somma

Visualizza = "acquista"

Per quale importo gli operatori delle fatture hanno scritto quale tipo di fattura per l'intero periodo del report?

Somma

L'utente stesso determina quale dei campi della tabella sarà Dimensioni, quali Dati e quali Filtri applicare. Il sistema stesso crea un report in una visuale forma tabellare... Le dimensioni possono essere posizionate nelle intestazioni di riga o colonna della tabella del report.
Come puoi vedere, da una semplice tabella, puoi ottenere molti dati sotto forma di vari rapporti.


Come usare a casa :

Decomprimere i dati dal kit di distribuzione nella directory c: \ fixin (per un sistema commerciale, è possibile in c: \ report). Leggi il file readme.txt e segui tutte le istruzioni in esso contenute.

Innanzitutto, devi scrivere l'elaborazione che scarica i dati da 1C in un file di testo (tabella). È necessario determinare la composizione dei campi che verranno scaricati.
Ad esempio, un'elaborazione universale già pronta che funziona in qualsiasi configurazione e scarica le transazioni per un periodo per l'analisi OLAP, scarica i seguenti campi per l'analisi:

Data | Giorno della settimana | Settimana | Anno | Trimestre | Mese | Documento | Società | Debito | Dt
| DtGroupNomenclature | DtSectionNomenclature | Credito | Importo | ValSum | Quantità
Moneta
CTDifferentObjects

Dove sotto i prefissi Дт (Кт) sono il subconto Debito (Credito), Gruppo è il gruppo di questo subconto (se presente), Sezione è il gruppo del gruppo, Classe è il gruppo della sezione.

Per un sistema di trading, i campi possono essere i seguenti:

Direzione | Tipo di movimento | Vendite | Prodotto | Quantità | Prezzo | Importo | Data | Azienda
| Magazzino | Valuta | Documento | Giorno della settimana | Settimana | Anno | Trimestre | Mese | Autore
| Categoria di prodotto | Categoria di movimento | Categoria di appaltatore | Gruppo di prodotti
| ValSum | Prezzo di costo | Controparte

Per analizzare i dati, utilizzare le tabelle "Analisi dei movimenti.xls" ("Analisi della contabilità.xls"). Non disabilitare le macro durante l'apertura, altrimenti non sarai in grado di aggiornare i report (vengono lanciati dalle macro in linguaggio VBA). Questi file sono presi dai file C:\fixin\motions.txt (C:\fixin\buh.txt), altrimenti sono uguali. Pertanto, potrebbe essere necessario copiare i dati in uno di questi file.
Per caricare i tuoi dati su EXCEL, seleziona o scrivi il tuo filtro e fai clic sul pulsante "Genera" nel foglio "Condizioni".
I fogli di rapporto iniziano con il prefisso "Rapporto". Vai al foglio del rapporto, fai clic su "Aggiorna" e i dati del rapporto cambieranno in base agli ultimi dati caricati.
Se non sei soddisfatto dei report standard, c'è un foglio Rep. Template. Copialo in nuova foglia e personalizzare l'aspetto del report lavorando con la tabella pivot su questo foglio (sul lavoro con le tabelle pivot - in qualsiasi libro su EXCEL 2000). Consiglio di impostare report su un piccolo set di dati e poi eseguirli su un grande set di dati. non è possibile disabilitare il ridisegno della tabella ogni volta che il layout del report cambia.

Note tecniche :

Quando si caricano i dati da 1C, l'utente sceglie la cartella in cui caricare il file. L'ho fatto perché è probabile che nel prossimo futuro verranno caricati diversi file (avanzi e movimenti). Quindi, facendo clic sul pulsante "Invia" in Explorer -> "Per analisi OLAP in EXCEL 2000", i dati vengono copiati dalla cartella selezionata alla cartella C:\fixin. (affinché questo comando appaia nell'elenco del comando "Invia" ed è necessario copiare il file "Per analisi OLAP in EXCEL 2000.bat" nella directory C:\Windows\SendTo) Quindi scaricare subito i dati dando i nomi ai file motions.txt o buh.txt.

Formato file di testo:
La prima riga del file di testo sono le intestazioni delle colonne separate da "|", il resto delle righe contiene i valori di queste colonne, separati da "|".

Per importare file di testo in Excel, Microsoft Query ( componente EXCEL) per il suo funzionamento, il file shema.ini deve essere presente nella directory di importazione (C:\fixin) contenente le seguenti informazioni:


ColNameHeader = True
Formato = Delimitato (|)
MaxScanRows = 3
Set di caratteri = ANSI
ColNameHeader = True
Formato = Delimitato (|)
MaxScanRows = 3
Set di caratteri = ANSI

Spiegazione: motions.txt e buh.txt è il nome della sezione, corrisponde al nome del file importato, descrive come importare un file di testo in Excel. Il resto dei parametri significa che la prima riga contiene i nomi delle colonne, il separatore di colonna è "|", il set di caratteri è Windows ANSI (per DOS - OEM).
La tipologia dei campi viene determinata automaticamente in base ai dati contenuti nella colonna (data, numero, riga).
L'elenco dei campi non deve essere descritto da nessuna parte: EXCEL e OLAP determineranno essi stessi quali campi sono contenuti nel file dalle intestazioni nella prima riga.

Attenzione, controlla le impostazioni regionali "Pannello di controllo" -> "Impostazioni internazionali". Nella mia elaborazione, i numeri vengono scaricati con un separatore di virgola e le date sono nel formato "GG.MM.AAAA".

Quando si preme il pulsante "Genera", i dati vengono caricati nella tabella pivot del foglio "Base", e da questo tabella pivot e prendere i dati di tutti i report sui fogli "Report".

Capisco che gli amanti di MS SQL Server e basi potenti i dati cominceranno a borbottare che tutto è troppo semplificato per me, che la mia elaborazione sarà piegata su un campione di un anno, ma prima di tutto voglio dare i vantaggi dell'analisi OLAP per le organizzazioni di medie dimensioni. Posizionerei questo prodotto come strumento di analisi di un anno per i grossisti, analisi trimestrale per la vendita al dettaglio e analisi operativa per qualsiasi organizzazione.

Ho dovuto armeggiare con VBA in modo che i dati fossero presi da un file con qualsiasi elenco di campi e fosse possibile preparare in anticipo i moduli di rapporto.

Descrizione del lavoro in EXCEL (per gli utenti):

Istruzioni per l'utilizzo dei report:
1. Inviare i dati scaricati per l'analisi (verificare con l'amministratore). Per fare ciò, fare clic con il tasto destro del mouse sulla cartella in cui sono stati scaricati i dati da 1C e selezionare il comando "Invia", quindi "Analisi OLAP in EXCEL 2000".
2. Aprire il file "Analisi del movimento.xls"
3. Seleziona il valore del filtro, i filtri necessari possono essere aggiunti nella scheda "Valori".
4. Premere il pulsante "Genera" e i dati caricati verranno caricati in EXCEL.
5. Dopo aver caricato i dati in EXCEL, è possibile visualizzare vari report. Per fare ciò, fai clic sul pulsante "Aggiorna" nel rapporto selezionato. I fogli con i rapporti iniziano con Rep.
Attenzione! Dopo aver modificato il valore del filtro, è necessario fare nuovamente clic sul pulsante "Genera" in modo che i dati in EXCEL vengano ricaricati dal file di caricamento in conformità con i filtri.

Elaborazione demo:

Elaborazione motionsbuh2011.ert è l'ultima versione di caricamento delle transazioni da Contabilità 7.7 per l'analisi in Excel. Ha una casella di controllo "Allega a file", che consente di caricare i dati in parti per punti, allegandoli allo stesso file, piuttosto che caricarli nuovamente nello stesso file:

L'elaborazione di motionswork.ert carica i dati di vendita per l'analisi in Excel.

Rapporti di esempio:

Scacchiera per messaggi:

Carico di lavoro dell'operatore per tipo di fatture:

P.S. :

È chiaro che con uno schema simile è possibile organizzare il download dei dati da 1C8.
Nel 2011, un utente mi ha contattato che aveva bisogno di finalizzare questa elaborazione in 1C7 in modo che potesse caricare grandi quantità di dati, ho trovato un outsourcer e ho fatto questo lavoro. Quindi lo sviluppo è abbastanza rilevante.

L'elaborazione di motionsbuh2011.ert è stata migliorata per far fronte allo scarico di una grande quantità di dati.

Principali articoli correlati