Kako postaviti pametne telefone i računala. Informativni portal
  • Dom
  • Windows 8
  • Uvod u osnove OLAP-a. Usporedba karakteristika statičke i dinamičke analize

Uvod u osnove OLAP-a. Usporedba karakteristika statičke i dinamičke analize

Do danas su mnoge organizacije akumulirale značajne količine podataka na temelju kojih je moguće rješavati različite analitičke i upravljačke zadatke. Problemi pohranjivanja i obrade analitičkih informacija postaju sve relevantniji i privlače pozornost stručnjaka i tvrtki koje rade u području informacijske tehnologije, što je dovelo do formiranja punopravnog tržišta tehnologija poslovne analize.

U idealnom slučaju, rad analitičara i menadžera na različitim razinama trebao bi biti organiziran tako da mogu imati pristup svim informacijama koje ih zanimaju i koristiti prikladne i jednostavna sredstva predstavljanje i rad s tim informacijama. Da bi se postigli ovi ciljevi Informacijska tehnologija, objedinjeni pod općim nazivom skladišta podataka i poslovne analize.

Prema definiciji Gartnera, poslovna inteligencija (BI, Business Intelligence) je kategorija aplikacija i tehnologija za prikupljanje, pohranjivanje, analiziranje i objavljivanje podataka koja korporativnim korisnicima omogućuje da najbolja rješenja. U ruskoj terminologiji sličnih sustava koji se nazivaju i sustavi za podršku odlučivanju (DSS).

Prikupljanje i pohranjivanje informacija, kao i rješavanje problema upita za pretraživanje informacija, učinkovito se provode pomoću sustava za upravljanje bazama podataka (DBMS). Implementacija podsustava OLTP (Online Transaction Processing). obrada transakcije podaci. Izravno OLTP sustavi nisu prikladni za potpunu analizu informacija zbog nedosljednosti zahtjeva za OLTP sustave i DSS.

Za pružanje informacija potrebnih za donošenje odluka obično je potrebno prikupiti podatke od nekoliko transakcijske baze podataka drugačija struktura i sadržaj. Glavni problem u ovom slučaju je nekonzistentnost i nedosljednost ovih izvornih baza, nedostatak jedinstvenog logičkog pogleda na korporativne podatke.

Stoga se za kombiniranje OLTP i DSS u jednom sustavu za implementaciju podsustava za pohranu koristi koncept skladišta podataka (HD). Koncept skladišta podataka temelji se na ideji odvajanja podataka koji se koriste za operativnu obradu i za rješavanje problema analize, što omogućuje optimizaciju skladišnih struktura. Skladište podataka omogućuje vam da integrirate prethodno različite detaljne podatke sadržane u povijesnim arhivama akumuliranim u tradicionalnim OLTP sustavima koji dolaze iz vanjski izvori, u jednostruka baza podataka, provodeći njihovu preliminarnu koordinaciju i, eventualno, agregaciju.

Podsustav analize može se izgraditi na temelju:

  1. podsustavi analize pronalaženja informacija temeljeni na relacijskim DBMS i statičkim upitima u SQL jeziku;
  2. podsustavi operativne analize. Za implementaciju takvih podsustava koristi se tehnologija online analitičke obrade. OLAP podaci, koji koristi koncept višedimenzionalnog prikaza podataka;
  3. rudarski podsustavi koji implementiraju Data Mining metode i algoritme.
Koncept skladišta podataka

HD tehnologija dizajnirana je za pohranu i analizu velikih količina podataka kako bi se daljnje otkrivanje sadrže skrivene uzorke i, zajedno s Podatkovna tehnologija Rudarstvo je uključeno u koncept "prediktivne analitike". Data Mining pak proučava proces pronalaženja novog, valjanog i potencijalno korisnog znanja u bazama podataka.

Skladište podataka je skup podataka specifičan za domenu, integriran, rijetko mijenjan, kronološki održavan skup podataka organiziran u svrhu podrške odlučivanju. Predmetna orijentacija znači da skladišta podataka integriraju informacije koje odražavaju različita gledišta na predmetno područje. Integracija pretpostavlja da su podaci pohranjeni u skladištu podataka dovedeni u jedan format. Povijesna podrška znači da svi podaci u skladištu podataka odgovaraju uzastopnim vremenskim intervalima.

Osim sposobnosti rada s jednim izvorom informacija, menadžeri i analitičari moraju imati zgodno sredstvo vizualizacija podataka, agregacija, pretraživanje trendova, predviđanje. Unatoč raznolikosti analitičke aktivnosti može se identificirati tipične tehnologije analiza podataka, od kojih svaki odgovara određenom skupu alata. Zajedno sa skladištem podataka, ovi alati pružaju cjelovito rješenje automatizirati analitičke aktivnosti i stvoriti korporativni informacijski i analitički sustav.

Fizička i virtualna spremišta podataka

Kada se podaci učitavaju iz OLTP sustava u skladište podataka, podaci se dupliciraju. Međutim, tijekom ovog preuzimanja podaci se filtriraju jer nisu svi relevantni za postupke analize. Skladište podataka pohranjuje generalizirane informacije koje nisu dostupne u OLTP sustavu.

Pomoću virtualnog skladišta podataka redundancija informacija može se svesti na nulu. U takvom sustavu podaci iz OLTP sustava se ne kopiraju u jednu pohranu. Oni se ekstrahiraju, transformiraju i integriraju izravno prilikom izvršavanja analitičkih upita u stvarnom vremenu. Zapravo, takvi se zahtjevi izravno prenose u OLTP sustav.

Prednosti virtualnog HD-a:

  • minimiziranje količine pohranjenih podataka;
  • rad s trenutnim, ažurnim podacima.

Nedostaci virtualne pohrane:

  • duže vrijeme obrade upita u usporedbi s fizičkom pohranom;
  • potreba za stalnom dostupnošću svih OLTP izvora;
  • smanjene performanse OLTP sustava;
  • OLTP sustavi nisu usmjereni na dugotrajnu pohranu podataka, po potrebi se podaci učitavaju u arhive, tako da ne postoji uvijek fizička mogućnost dobivanja kompletan set podataka u HD.

Koncept skladišta podataka

"Skladište podataka" je specifična domena, vremenski ograničena i nepromjenjiva zbirka podataka za podršku donošenju upravljačkih odluka.

Podaci u pohrani dolaze iz operativni sustavi(OLTP-sustavi), koji su dizajnirani za automatizaciju poslovnih procesa. Osim toga, repozitorij se može nadopunjavati iz vanjskih izvora, kao što su statistička izvješća, razni imenici itd. Skladište podataka, osim detaljnih informacija, sadrži agregate, tj. sažimanje informacija, kao što su iznosi prodaje, količine, ukupni troškovi itd.

Skladište poreznih podataka treba promatrati kao informacijsko središte koje automatizira obračun odgođenih poreza, prihvaća i pohranjuje informacije iz vanjskih izvora te pretvara podatke u format jednostavan za korištenje. Takav repozitorij je platforma za pohranu točnih i ažuriranih poreznih podataka koji se mogu dohvatiti i prenijeti na vanjske aplikacije za potrebe analize, revizije, planiranja i predviđanja.

Skladište podataka je repozitorij izvori informacija i pruža konsolidaciju podataka poduzeća za potrebe izvješćivanja i analize. Podaci i informacije, operativni i neoperativni, unose se u skladište, obično pomoću ETL alata, iz izvora, podataka čim postanu dostupni ili redovito. Transformacija podataka omogućuje obradu zahtjeva i njihovu pravovremenu analizu, što pojednostavljuje i ubrzava proces ispunjavanja zahtjeva za informacijama izvorno primljenih iz drugih izvora.
Prednosti repozitorija uključuju mogućnost pretvaranja podataka u kvalitetno porezno izvješćivanje i informacije o poreznoj usklađenosti za korisnike svih razina. Sve zainteresirane strane - kupci, partneri, zaposlenici, menadžeri i voditelji - mogu dobiti interaktivni sadržaj bilo kada i bilo gdje.
Samo postojanje jedinstvenog izvora informacija za pripremu poreza i ispunjavanje poreznih obveza velik je korak naprijed za mnoga porezna tijela.

Zašto je potrebno graditi skladišta podataka - uostalom, ona sadrže očito suvišne informacije koje se već nalaze u bazama podataka ili datotekama operacijskih sustava? Nemoguće je ili vrlo teško izravno analizirati podatke iz operativnih sustava. To je zbog različitih razloga, uključujući fragmentaciju podataka i njihovo pohranjivanje u različite DBMS formate. Ali čak i ako su svi podaci u poduzeću pohranjeni na središnjem poslužitelju baze podataka, analitičar gotovo sigurno neće razumjeti njihove složene, ponekad zbunjujuće strukture.

Dakle, zadaća repozitorija je da na jednom mjestu iu jednostavnoj, razumljivoj strukturi pruži "sirovi materijal" za analizu.

Postoji još jedan razlog koji opravdava pojavu zasebnog repozitorija - složeni analitički upiti za operativne informacije uspori trenutni rad tvrtke, dugotrajno blokiranje tablica i zauzimanje resursa poslužitelja.

Pod pohranom se ne može podrazumijevati golema akumulacija podataka - glavna stvar je da bude prikladna za analizu.

Koncept skladišta podataka

Autor koncepta skladišta podataka ( Skladište podataka) je B. Inmon, koji je skladišta podataka definirao kao: „domenski orijentirane, integrirane, nepromjenjive, povijesne skupove podataka organizirane za potrebe podrške upravljanju”, dizajnirane da djeluju kao „jedinstveni i jedini izvor istine”, pružajući menadžerima i analitičarima pouzdane informacije potrebne za operativnu analizu i donošenje odluka. Shema skladišta podataka može se predstaviti na sljedeći način:

Fizička implementacija ove sheme može biti vrlo raznolika. Razmotrimo prvu opciju - virtualno skladište podataka, ovo je sustav koji omogućuje pristup konvencionalnom sustavu registracije koji oponaša rad sa skladištem podataka. Virtualna pohrana može se organizirati na dva načina. Možete stvoriti niz "pogleda" (view) u bazi podataka ili koristiti posebna sredstva pristup bazi podataka (na primjer, proizvodi desktop OLAP klase).

Budući da je izgradnja skladišta podataka složen proces koji može potrajati godinama, neke organizacije umjesto toga grade podatkovne marte koje sadrže informacije za određene odjele. Na primjer, prodavaonica marketinških podataka može sadržavati samo informacije o kupcima, proizvodima i prodaji i ne uključuje planove opskrbe. Višestruke vitrine podataka za odjele mogu koegzistirati s glavnim skladištem podataka, dajući djelomičan prikaz sadržaja skladišta. Podatkovne trgovine puno se brže izgrađuju od pohrane, ali kasnije može doći do značajnih problema s integracijom ako je početno planiranje napravljeno bez razmatranja cjelovitog poslovnog modela. Ovo je drugi način.


Izgradnja punopravnog skladišta podataka poduzeća obično se izvodi u troslojnoj arhitekturi. Na prvoj razini nalaze se različiti izvori podataka - interni sustavi snimanja, sustavi pomoći, vanjski izvori (podaci novinske agencije, makroekonomski pokazatelji). Druga razina sadrži središnji repozitorij, u koji teku informacije iz svih izvora s prve razine, te, eventualno, operativno skladište podataka koje ne sadrži povijesne podatke i obavlja dvije glavne funkcije.

Koncept skladišta podataka temelji se na dvije temeljne ideje:

1) integracija prethodno odvojenih detaljnih podataka u jedinstveno skladište podataka, njihova koordinacija i, eventualno, agregacija:

povijesni arhivi;

podaci iz tradicionalnog ODS-a;

podatke iz vanjskih izvora.

2) odvajanje skupova podataka koji se koriste za operativnu obradu i skupova podataka koji se koriste za rješavanje problema analize.

Svrha koncepta skladišta podataka je saznati zahtjeve za podatke koji se nalaze u ciljnoj bazi podataka skladišta podataka (Tablica 1), odrediti generalni principi i faze njegove izgradnje, glavni izvori podataka, daju preporuke za rješavanje potencijalnih problema koji nastaju prilikom njihovog istovara, čišćenja, koordiniranja, transporta i učitavanja u ciljnu bazu.

Tablica 1. Osnovni zahtjevi za podatke u Skladištu podataka.

Predmetna orijentacija Prikupljaju se svi podaci o određenom subjektu (poslovnom objektu) (obično iz skupa razni izvori), pročišćavaju se, usklađuju, dopunjuju, objedinjuju i prikazuju u jedinstvenom obliku pogodnom za korištenje u analizi poslovanja.
Integracija Svi podaci o različitim poslovnim objektima međusobno su usklađeni i pohranjeni u jedinstvenu pohranu za cijelu tvrtku.
nepromjenljivost Početni (povijesni) podaci, nakon što su dogovoreni, verificirani i uneseni u korporativnu pohranu, ostaju nepromijenjeni i koriste se isključivo u načinu čitanja.
Podrška za vremensku traku Podaci su kronološki strukturirani i odražavaju povijest, za dovoljno vremena za obavljanje zadataka poslovne analize i predviđanja.

Predmet koncepta skladišta podataka su sami podaci. Nakon što se tradicionalni sustav obrade podataka (DPS) implementira i počne funkcionirati, on postaje isti neovisni objekt stvarnog svijeta kao bilo koji proizvodni proces. A podatak, koji je jedan od finalnih proizvoda takve proizvodnje, ima potpuno ista svojstva i karakteristike kao i svaki industrijski proizvod: rok trajanja, mjesto skladištenja (skladištenja), kompatibilnost s podacima iz drugih industrija (SOD), tržišnu vrijednost, mogućnost transporta. , cjelovitost, mogućnost održavanja itd.

S tog se gledišta razmatraju podaci u skladištima podataka. To jest, cilj ovdje nisu načini opisivanja i prikazivanja objekata predmetno područje, već sam podatak, kao samostalan objekt predmetnog područja nastao kao rezultat funkcioniranja prethodno stvorenih informacijskih sustava.

Za ispravno razumijevanje Ovaj koncept zahtijeva pojašnjenje sljedećih temeljnih točaka:

· Koncept skladištenja podataka nije koncept analize podataka, već je to koncept pripreme podataka za analizu.

· Koncept skladišta podataka ne određuje unaprijed arhitekturu ciljanog analitičkog sustava. Govori o tome koji bi procesi trebali biti pokrenuti na sustavu, ali ne i gdje bi se točno trebali izvoditi ti procesi.

· Koncept skladišta podataka ne uključuje samo jedan logički prikaz podataka organizacije, već implementaciju jednog integriranog izvora podataka.

Osim jedinstveni imenik metapodataka, sredstava za učitavanje, agregiranje i usklađivanje podataka, koncept skladišta podataka podrazumijeva: integraciju, nepromjenjivost, kronološku podršku i dosljednost podataka. I ako prva dva svojstva (integracija i nepromjenjivost) utječu na načine analize podataka, onda posljednja dva (kronološka podrška i dosljednost) značajno sužavaju popis analitičkih zadataka koje treba riješiti.

Bez potpore kronologije (dostupnosti povijesnih podataka) nemoguće je govoriti o rješavanju problema prognoziranja i analize trendova. Ali najkritičnija i najbolnija su pitanja koja se odnose na usklađivanje podataka.

Glavni zahtjev analitičara nije toliko učinkovitost koliko pouzdanost odgovora. Ali vjerodostojnost je u konačnici određena dosljednošću. Dok se ne poradi na međusobnom usuglašavanju vrijednosti podataka iz različitih izvora, teško je govoriti o njihovoj pouzdanosti.

Često se menadžer susreće sa situacijom u kojoj različiti sustavi mogu i obično daju različit odgovor na isto pitanje. Razlog tome može biti nesinkronizam trenutaka modifikacije podataka, razlike u interpretaciji istih događaja, pojmova i podataka, promjene u semantici podataka tijekom razvoja predmetnog područja, elementarne pogreške tijekom unosa i obrade, djelomični gubitak pojedinih fragmenata arhiva i sl. Očito je da nije realno unaprijed uzeti u obzir i odrediti algoritme za rješavanje svih mogućih kolizija. Štoviše, to je nemoguće učiniti u način rada, dinamički, izravno u procesu generiranja odgovora na zahtjev.


Slične informacije.


Prema Forrester Researchu, većina velike tvrtke lica sljedeći problem: nakupljaju se veliki iznos informacije koje se nikad ne koriste. U gotovo svakoj organizaciji zapravo postoji mnogo transakcijskih sustava usmjerenih na online obradu podataka (svaki za određenu klasu zadataka) i kontinuirano dopunjavanje brojnih baza podataka. Osim toga, poduzeća često posjeduju ogromne količine informacija pohranjenih u tzv. naslijeđeni sustavi. Svi ti podaci distribuiraju se po mrežama osobnih računala, pohranjuju se na glavnim računalima, radnim stanicama i poslužiteljima. Dakle, informacija ima, ali su raspršene, nedosljedne, nestrukturirane, često suvišne i ne uvijek pouzdane. Stoga se u većini organizacija ti podaci još uvijek ne mogu koristiti za donošenje ključnih poslovnih odluka. Koncept skladišta podataka (Data Warehouse) usmjeren je na rješavanje ove kontradikcije.

Bill Inmon, autor koncepta, u svom klasičnom članku "Što su pohrane podataka" (D2K  Incorporated,   1996.), definira pohrane podataka kao "domenski specifične, integrirane, nepromjenjive, povijesne skupove podataka organizirane u svrhu podrške upravljanju." On promatra pohranu kao "jedini i jedini izvor istine", "središte svemira" sustava za podršku odlučivanju (DSS). “Iz skladišta podataka”, piše on, “informacije teku u različite odjele, filtrirane prema unaprijed postavljene postavke DSS. Ove odvojene baze podataka za donošenje odluka nazivaju se martovima podataka.”

Koncept skladišta podataka temelji se na ideji kombiniranja korporativnih podataka razasutih po online sustavima za obradu podataka, povijesnim arhivima i drugim vanjskim izvorima. Ovi izvori mogu sadržavati podatke koji se ne koriste izravno u ODS-u, ali su vitalni za DSS: zakonodavni okvir(uključujući porezne prognoze), planove razvoja industrije, statističke podatke, elektroničke imenike. Kao što pokazuje praksa, odluka donesena samo na temelju internih podataka najčešće se pokaže pogrešnom.

Svrha koncepta skladišta podataka je razjasniti razlike u karakteristikama podataka u operativnim i analitičkim sustavima, odrediti zahtjeve za podatke koji se nalaze u skladištu, odrediti opća načela i faze njegove izgradnje, glavne izvore podataka, kako bi se dale preporuke za rješavanje potencijalnih problema koji nastaju tijekom njihovog istovara, čišćenja, usklađivanja, transporta i učitavanja u ciljnu bazu podataka za pohranu.

Usporedba karakteristika podataka u informacijskim sustavima usmjerenim na operativnu i analitičku obradu podataka

Karakteristično

Operativni

Analitički

Učestalost ažuriranja

Visoka frekvencija, u malim obrocima

Niska frekvencija, velike porcije

Izvori podataka

Uglavnom unutarnje

Uglavnom vanjski

Količine pohranjenih podataka

Stotine megabajta, gigabajta

gigabajta i terabajta

Starost podataka

Tekuće (u razdoblju od nekoliko mjeseci do jedne godine)

Sadašnje i povijesno (za razdoblje od nekoliko godina, desetljeća)

Svrha

Fiksacija, online pretraživanje i transformacija podataka

Pohrana detaljnih i agregiranih povijesnih podataka, analitička obrada, predviđanje i modeliranje

Osnovni zahtjevi za podatke u skladištu podataka

Predmetna orijentacija

Svi podaci o određenom subjektu (poslovnom objektu) prikupljaju se (obično iz više različitih izvora), čiste, koordiniraju, dopunjuju, agregiraju i prezentiraju u jedinstvenom obliku pogodnom za korištenje u poslovnim analizama.

Integracija

Svi podaci o različitim poslovnim objektima međusobno su dogovoreni i pohranjeni u jedinstvenu pohranu za cijelu tvrtku

nepromjenljivost

Početni (povijesni) podaci, nakon što su usuglašeni, verificirani i uključeni u generalku korporativno skladištenje, ostaju nepromijenjeni i koriste se isključivo u načinu čitanja

Podrška za vremensku traku

Podaci su kronološki strukturirani i odražavaju povijest za dovoljno vremena za obavljanje zadataka poslovne analize i predviđanja.

Predmet koncepta skladišta podataka nije analiza podataka, već sami podaci, odnosno koncept njihove pripreme za daljnju analizu. Istodobno, koncept skladišta podataka ne definira samo jedan logički prikaz korporativnih podataka, već implementaciju jednog integriranog izvora podataka.

Modeli analize podataka

Unatoč činjenici da je u konceptu skladišta podataka koji je formulirao B. Inmon naglasak na samim podacima i identificiranju njihovih najvažnijih zajednička svojstva, karakteristikama i odnosima, jasno je da se ti podaci trebaju koristiti u procesu donošenja poslovnih odluka na svim razinama, do korporativne i međukorporacijske. Do danas su se povijesno oblikovala dva glavna modela analize podataka na kojima se temelji postojeći analitički DSS:

1. Statička analiza (DSS). Sam koncept DSS (Decision Support Systems) zapravo se prevodi kao DSS. Donedavno je to bio jedini analitički koncept. Rezultat rada ovakvih sustava bila su strogo regulirana izvješća na više stranica, za čije su se formiranje izvršavali dugi upiti koji su obrađivali goleme količine podataka. Takvi zahtjevi mogli su se izvršavati nekoliko sati, ponekad i desetke sati, pa čak i dana.

2. Operativna analiza podataka (OLAP). Autor koncepta OLAP (On-Line Analytical Processing) je dr. E. Codd, koji je 1993. godine formulirao 12 osnovnih zahtjeva za alate. OLAP implementacije. Temeljna razlika Ovaj model iz tradicionalnog statičkog DSS-a konceptualni je prikaz podataka u obliku višedimenzionalne kocke. U isto vrijeme, E. Codd je pokazao potencijalne nedostatke relacijskog pristupa u sustavima orijentiranim na analizu podataka. Svrha stvaranja ovog koncepta bila je temeljna mogućnost pružanja krajnjem korisniku sredstava za generiranje, obradu i izvršavanje ad hoc analitičkih zahtjeva uz minimalno vrijeme odziva sustava. Potreba za ovim novim konceptom bila je unaprijed određena činjenicom da je analitičar često nakon primitka standardnog izvješća pomoću DSS-a imao novo pitanje ili spoznaju da je samo pitanje pogrešno formulirano. Kao rezultat toga, morao je dugo vremena pričekajte sljedeći rezultat kako biste se potom, eventualno, vratili na sljedeću iteraciju ovog procesa.

Usporedba karakteristika statičke i dinamičke analize

Karakteristično

Statička analiza

Dinamička analiza

Vrste pitanja

Kako? Kako? Kada?

Zašto? Što ako?..

Vrijeme odziva

Nije regulirano

Tipične operacije

Propisani izvještaj, dijagram

Niz interaktivnih izvješća, grafikona, ekranske forme. Dinamička promjena razina agregacije i odsječaka podataka.

Razina analitičkih zahtjeva

Vrsta zaslona

U osnovi unaprijed određeno, regulirano

Korisnik definiran

Razina agregacije podataka

Detaljno i sažeto

Uglavnom totalno

Starost podataka

Povijesne i aktualne

Povijesni, trenutni i prognozni

Vrste zahtjeva

Uglavnom predvidljivo

Nepredvidivo, od slučaja do slučaja

Svrha

Planirana analitička obrada

Višenamjenska analiza, modeliranje i predviđanje

Danas je smjer OLAP možda najperspektivniji za rješavanje problema analitičkog upravljanja. Pomoću posebno kreirane usluge OLAP Report, 12 zahtjeva koje je izvorno formulirao dr. Codd djelomično je revidirano i značajno dopunjeno osnovnim i pristupačnost, kao što je odabir i obrada podataka koji nedostaju, itd. Ali jezgra OLAP koncepta još uvijek je višedimenzionalni prikaz podataka na konceptualnoj razini.

Trgovine podacima

Prema klasičnoj definiciji, Data Mart je podskup skladišta podataka koji odražava specifičnosti odjela (poslovnog objekta) i pruža povećana produktivnost. Dakle, izlog je poveznica na kojoj specifičan analitički sustav riješiti njihov niz problema. Ipak, moguća je situacija kada neko područje djelatnosti poduzeća praktički nije u korelaciji s drugima, a moguće je samostalno izgraditi odgovarajući stalak podataka, bez vezivanja za korporativni repozitorij. Zatim će se izlog puniti podacima izravno iz sustava za obradu online transakcija. Takvi podatkovni martovi nazivaju se neovisnim, za razliku od klasičnih skladišta podataka koji ovise i iz njega se dopunjavaju.

U nekim slučajevima, čini se prikladnim razviti data mart umjesto potpuno oblikovanog skladišta. Trgovine podacima manje su zahtjevne, jeftinije i lakše ih je izgraditi, a temelje se na jeftinijim poslužiteljima, a ne na višeprocesorskim sustavima. S ovim pristupom, nema potrebe za korištenjem cjeline informacijski sistem korporacije i podržavaju složene procedure za sinkrono ažuriranje podatkovne trgovine prilikom ažuriranja skladišta. U isto vrijeme, potrebno je razumjeti da se ovim pristupom vitrine podataka mogu umnožiti u cijele komplekse neovisnih informacijske baze podataka, a naravno bit će postavljen i zadatak upravljanja pojedinačnim strategijama pretraživanja, održavanja i oporavka. S druge strane, mnogo je isplativije izgraditi jedinstveno korporativno skladište temeljeno na mnogim neovisnim prodajnim mjestima nego oslanjati se na podatke razbacane po sustavima za obradu transakcija.

Dakle, što ima smisla koristiti: jedan repozitorij, samostalne marte podataka, repozitorij s ovisnim martovima ili druge opcije? Ne postoji univerzalni odgovor na pitanje o potrebi korištenja jedne ili druge opcije. U svakom slučaju najbolja opcija određeno poslovnim zahtjevima, intenzitetom potražnje, mrežnom arhitekturom, potrebnim odzivom i drugim uvjetima.

Tehnologija implementacije skladišta podataka

Kada gradite skladište podataka, prirodno je slijediti pristup razvoja u fazama. Iako nijedan opis procesa izgradnje skladišta podataka kao niza faza ne može pokriti sve aspekte Povratne informacije s potencijalnim korisnicima, menadžerima i analitičarima, međutim, postoje neki osnovni koraci koji se primjenjuju na proces izgradnje poslovne arhitekture:

1. Definicija potrebe krajnji korisnici i izgradnja modela poslovnih pitanja na koja treba odgovoriti.

2. Identifikacija podataka iz korporativnih i vanjskih izvora koji će pokretati skladište podataka ili prodavaonicu podataka.

3. Analiza izvora podataka i modeliranje funkcija i procesa koje ti izvori pokrivaju. Učenje pravila po kojima tvrtka posluje jedan je od bitni uvjeti građenje skladišta ili data martova, budući da se na temelju njega postavlja razina detalja elemenata u skladištu podataka.

4. Utvrđivanje postupaka za transformaciju, čišćenje i logičku integraciju izvornih podataka prije njihovog smještaja u skladište podataka ili data mart, kao i reguliranje provedbe ovih postupaka koji ažuriraju skladište podataka.

5. Izrada metapodataka koji opisuju izvore i metode transformacije podataka i logiku skladišta podataka. Repozitorij metapodataka trebao bi uključivati ​​definicije podataka, poslovna pravila i detaljnu logiku za modeliranje razvoja analitičkih sustava.

6. Formiranje fizičkih tablica skladišta podataka i njihovo popunjavanje. Ovaj proces može zahtijevati nekoliko ponavljanja, uzimajući u obzir mogući redizajn struktura podataka prilikom analize sheme podataka za pohranu.

7. Izgradnja repozitorija podatkovnih martova, koji će uključivati ​​podskupove podataka iz skladišta i unaprijed agregirane podatke. Dio s metapodacima opisat će kako se neobrađeni skladišni podaci transformiraju, agregiraju i pohranjuju u predmemoriju u podatkovnim marcama.

8. Instaliranje OLAP alata, aplikacijskih sustava, web poslužitelja i svega potrebni alati i poslužiteljski programi potreban za pristup podacima, analizu i izvješćivanje.

9. Instalacija klijentskog softvera (debeli klijent) ili preglednika koji podržavaju na radne stanice krajnjeg korisnika standardni formati podataka i Java apleta, kao i potrebna proširenja plug-in ("tanki" klijent) za korisnički pristup podacima.

Nakon završetka procesa kreiranja skladišta podataka može se činiti da je sve već gotovo. Naime, formiranje skladišta podataka je proces koji uključuje i potrebne faze kontinuiranog nadzora i održavanja skladišta podataka. Ispravan nadzor ne znači samo održavanje točnosti podataka, već i osiguranje njihove tajnosti, osobito ako se pristup pohrani podataka vrši putem weba. “Budući da skladište podataka sadrži jedno od najvećih sredstava poduzeća,” kaže R. Tenler, predsjednik Information Advantagea, “podaci moraju biti sigurni. Ali da bi shvatila potencijalnu vrijednost skladišta podataka, organizacija će ga morati ponuditi potencijalnim kupcima.”

Održavanje skladišta podataka u dobrom stanju dulje vrijeme još je jedan kritičan zadatak. Ovaj faktor postaje posebno važan kada broj korisnika koji pristupaju sustavu počne rasti. Istodobno, ako je u procesu projektiranja skladišta podataka informacijske usluge Budući da obično postoji temeljito usklađivanje podataka, s vremenom pažnja ljudi obično slabi, a skladište podataka može se pretvoriti u deponij. Da se to ne bi dogodilo, potrebno je imenovati službenike za kvalitetu podataka koji će konstantno provjeravati informacije koje dolaze iz sustava za obradu transakcija s podacima u skladištu ili izlogu.

Zaključno, može se primijetiti da je proces dizajniranja skladišta podataka koji se koristi za pružanje potrebnih informacija u procesu donošenja odluka u poduzeću i na međukorporacijskoj razini ključan za život poduzeća. U fazi njegove implementacije treba obratiti pozornost ne samo na rješenje tehnički problemi ali i na probleme povezane s ljudski faktor. Ne treba zaboraviti ni na potrebu stalne procjene primjerenosti uloženih napora. Osim pravilnog lanca upravljanja projektom, potrebno je u svakoj fazi uzeti u obzir i potrebe korisnika i prisutnost političkih aspekata koji mogu usporiti projekt. Uz kompetentan pristup rješavanju ovog problema, skladište podataka bi uskoro moglo postati dio komercijalni sustav poduzeće pružajući dijelu korisnika trećih strana uz naknadu mogućnost korištenja podataka iz nekog podskupa repozitorija. Ovaj pristup omogućit će ne samo nadoknadu rada na formiranju skladišta podataka, već i pružiti novi kanal primitak prihoda.

Evolucija skladišta podataka

Od 1970-ih, organizacije su više zainteresirane za ulaganje svog novca u nove računalni sustavi nego u automatizaciji poslovnih procesa koje koriste. To im je omogućilo da povećaju svoju konkurentnost uvođenjem sustava koji bi korisnicima mogli pružiti učinkovitiji i jeftiniji skup usluga. Od tada su organizacije prikupile ogromnu količinu informacija koje su pohranjene u njihovim operativnim bazama podataka. Ali sada, s proliferacijom sustava za podršku odlučivanju, organizacije se usredotočuju na to kako koristiti akumulirane operativne podatke, s ciljem postizanja dodatne konkurentnosti kroz to.

Bivši sustavi online obrada nije bila dizajnirana da podrži takve poslovne zahtjeve na bilo koji način, tako da konverzija konvencionalni sustavi OLTP u sustavima za podršku odlučivanju pokazao se iznimno izazovan zadatak. Tipično, tipična organizacija ima mnogo raznih sustava operativna obrada s preklapajućim i ponekad proturječnim definicijama, kao što je različiti tipovi izabrani da predstavljaju iste podatke. Glavna zadaća organizacije je transformirati akumulirane arhive podataka u izvor novih znanja, i to na način da se korisniku omogući jedinstveni integrirani i konsolidirani prikaz podataka organizacije. Koncept skladišta podataka zamišljen je kao tehnologija koja može zadovoljiti zahtjeve sustava za podršku odlučivanju i temelji se na informacijama koje dolaze iz nekoliko različitih izvora operativnih podataka.

Najrašireniji pristup stvaranju skladišta podataka predložio je Bill Inmon. On ovako definira HD:

Pohrana podataka. Specifično za domenu, integrirano, vezano u to vrijeme i nepromjenjivi skup podataka osmišljen za podršku donošenju odluka.

U gornjoj definiciji, ove karakteristike podataka se tretiraju na sljedeći način.

predmetna orijentacija. Skladište podataka organizirano je oko ključnih subjekata (ili subjekata) organizacije (kao što su kupci, proizvodi i prodaja), a ne oko područja primjene (fakturiranje kupcima, kontrola zaliha i prodaja proizvoda). Ovo svojstvo odražava potrebu za pohranjivanjem podataka namijenjenih podršci donošenja odluka, a ne uobičajenih operativnih i primijenjenih podataka.

Integracija. Značenje ove karakteristike je da operativno-primijenjeni podaci obično dolaze iz različitih izvora, koji često imaju nedosljedne prikaze istih podataka, npr. drugačiji format. Kako bi se korisniku omogućio jedinstven generalizirani pregled podataka, potrebno je izraditi integrirani izvor koji osigurava konzistentnost pohranjenih informacija.



Veza s vremenom. Podaci u skladištu su točni i valjani samo ako su vezani uz neki trenutak ili vremensko razdoblje. Potreba za povezivanjem skladišta podataka s vremenom proizlazi iz dugotrajnosti razdoblja za koje su informacije pohranjene u njemu akumulirane, iz eksplicitne ili implicitne povezanosti vremenskih oznaka sa svim pohranjenim podacima, kao i iz činjenice da su pohranjene informacije zapravo skup snimaka stanja podataka .

Nepromjenljivost. To znači da se podaci ne ažuriraju online, već samo redovito ažuriraju informacijama iz sustava za online obradu. Istovremeno, novi podaci nikada ne zamjenjuju, već samo nadopunjuju prethodne. Stoga se baza podataka za pohranu stalno ažurira novim podacima, dosljedno integriranim s već prikupljenim informacijama.

Krajnji cilj skladišta podataka je integracija podataka poduzeća u jedinstveno spremište kojem korisnici mogu pristupiti za upite, izvješća i analizu podataka. Ukratko, možemo reći da je tehnologija skladištenja podataka tehnologija za upravljanje podacima i njihovu analizu.

Najpopularniji povezani članci