Come configurare smartphone e PC. Portale informativo

Big data e il suo significato. Perché i Big Data vengono costantemente confusi con il marketing e l'IT

Solo i pigri non parlano di Big data, ma difficilmente capiranno cosa siano e come funzionino. Cominciamo con il più semplice: la terminologia. Parlando in russo, i big data sono una varietà di strumenti, approcci e metodi per l'elaborazione di dati sia strutturati che non strutturati al fine di utilizzarli per compiti e scopi specifici.

I dati non strutturati sono informazioni che non hanno una struttura predefinita o non sono organizzate in un ordine specifico.

Il termine "big data" è stato coniato dall'editore della rivista Nature Clifford Lynch nel 2008 in un numero speciale dedicato alla crescita esplosiva dei volumi di informazioni mondiali. Sebbene, ovviamente, i big data stessi esistessero prima. Secondo gli esperti, la maggior parte dei flussi di dati superiori a 100 GB al giorno appartiene alla categoria Big data.

Leggi anche:

Oggi, questo semplice termine nasconde solo due parole: archiviazione ed elaborazione dei dati.

Big data - in parole semplici

Nel mondo moderno, i Big data sono un fenomeno socio-economico, che è associato al fatto che sono apparse nuove opportunità tecnologiche per analizzare un'enorme quantità di dati.

Leggi anche:

Per facilità di comprensione, immagina un supermercato in cui tutte le merci non sono nel tuo solito ordine. Pane accanto alla frutta, concentrato di pomodoro accanto alla pizza surgelata, accendino davanti a un porta assorbenti contenente avocado, tofu o funghi shiitake, tra gli altri. I big data mettono ogni cosa al suo posto e ti aiutano a trovare il latte di noci, a scoprire il costo e la data di scadenza, e anche chi, oltre a te, lo compra e perché è migliore del latte di mucca.

Kenneth Kukier: I big data sono i dati migliori

Tecnologia dei big data

Enormi quantità di dati vengono elaborate in modo che una persona possa ottenere risultati specifici e necessari per il loro ulteriore uso efficace.

Leggi anche:

In effetti, i Big data sono un problem solving e un'alternativa ai tradizionali sistemi di gestione dei dati.

Tecniche e metodi di analisi applicabili ai Big data secondo McKinsey:

  • crowdsourcing;

    Miscelazione e integrazione dei dati;

    Apprendimento automatico;

    Reti neurali artificiali;

    Riconoscimento del modello;

    Analisi predittiva;

    Modellazione di simulazione;

    Analisi spaziale;

    Analisi statistica;

  • Visualizzazione dei dati analitici.

La scalabilità orizzontale che consente l'elaborazione dei dati è un principio fondamentale dell'elaborazione dei big data. I dati vengono distribuiti ai nodi di calcolo e l'elaborazione avviene senza degrado delle prestazioni. McKinsey ha incluso anche i sistemi di gestione relazionale e la Business Intelligence nel contesto dell'applicabilità.

Tecnologie:

  • NoSQL;
  • Riduci mappa;
  • Hadoop;
  • Soluzioni hardware.

Leggi anche:

Per i big data, ci sono le tradizionali caratteristiche distintive sviluppate dal Gruppo Meta già nel 2001, che sono chiamate “ tre V»:

  1. Volume- la dimensione del volume fisico.
  2. Velocità- la velocità di crescita e la necessità di un'elaborazione rapida dei dati per ottenere risultati.
  3. Varietà- la capacità di elaborare contemporaneamente vari tipi di dati.

Big data: applicazioni e opportunità

Con gli strumenti tradizionali è impossibile elaborare volumi di informazioni digitali eterogenee e in rapido arrivo. L'analisi dei dati stessi consente di vedere schemi certi e impercettibili che una persona non può vedere. Questo ci consente di ottimizzare tutte le aree della nostra vita, dal governo alla produzione e alle telecomunicazioni.

Ad esempio, alcune aziende alcuni anni fa proteggevano i propri clienti dalle frodi e prendersi cura del denaro del cliente significava prendersi cura del proprio denaro.

Susan Etleiger: E i Big Data?

Soluzioni basate sui big data: Sberbank, Beeline e altre aziende

Beeline ha un'enorme quantità di dati sugli abbonati, che usano non solo per lavorare con loro, ma anche per creare prodotti analitici, come consulenza esterna o analisi IPTV. Beeline ha segmentato il database e protetto i clienti da frodi e virus, utilizzando HDFS e Apache Spark per l'archiviazione e Rapidminer e Python per l'elaborazione dei dati.

Leggi anche:

Oppure ricorda Sberbank con il loro vecchio caso chiamato AS SAFI. È un sistema che analizza le fotografie per identificare i clienti bancari e prevenire le frodi. Il sistema è stato introdotto nel 2014, al centro del sistema c'è un confronto di fotografie dal database, che arrivano da webcam su rack grazie alla visione artificiale. La base del sistema è una piattaforma biometrica. Grazie a questo, i casi di frode sono diminuiti di 10 volte.

Big data nel mondo

Entro il 2020, secondo le previsioni, l'umanità genererà 40-44 zettabyte di informazioni. E entro il 2025 crescerà di 10 volte, secondo il rapporto The Data Age 2025, preparato dagli analisti di IDC. Il rapporto rileva che la maggior parte dei dati sarà generata dalle imprese stesse, non dai consumatori.

Gli analisti della ricerca ritengono che i dati diventeranno una risorsa vitale e la sicurezza diventerà una base fondamentale nella vita. Gli autori del lavoro sono anche fiduciosi che la tecnologia cambierà il panorama economico e che l'utente medio comunicherà con i dispositivi connessi circa 4800 volte al giorno.

Mercato dei big data in Russia

In genere, i big data provengono da tre fonti:

  • Internet (social network, forum, blog, media e altri siti);
  • Archivi aziendali di documenti;
  • Letture da sensori, strumenti e altri dispositivi.

Big data nelle banche

Oltre al sistema sopra descritto, nella strategia di Sberbank per il 2014-2018. parla dell'importanza di analizzare enormi quantità di dati per un servizio clienti di qualità, gestione del rischio e ottimizzazione dei costi. Ora la banca utilizza i Big Data per la gestione del rischio, contrasto alle frodi, segmentazione e valutazione del merito creditizio dei clienti, gestione del personale, previsione code in filiale, calcolo bonus dipendenti e altre mansioni.

VTB24 utilizza i big data per segmentare e gestire l'abbandono dei clienti, generare rendiconti finanziari, analizzare le recensioni nei social network e nei forum. Per fare ciò, utilizza le soluzioni Teradata, SAS Visual Analytics e SAS Marketing Optimizer.

Grandi dati- non si tratta solo dei dati in sé, ma anche delle tecnologie per la loro elaborazione e utilizzo, metodi per trovare le informazioni necessarie in grandi array. Il problema dei big data rimane aperto e vitale per tutti i sistemi che accumulano un'ampia varietà di informazioni per decenni.

Questo termine è associato all'espressione "Volume, velocità, varietà"- i principi su cui si basa il lavoro con i big data. Questo direttamente quantità di informazioni, velocità di elaborazione e varietà di informazioni memorizzato in un array. Di recente, un altro è stato aggiunto ai tre principi di base: Valore che significa valore dell'informazione... Cioè, deve essere utile e necessario in termini teorici o pratici, il che giustificherebbe i costi della sua conservazione ed elaborazione.

I social media sono un esempio di una tipica fonte di big data: ogni profilo o pagina pubblica è una piccola goccia in un oceano di informazioni non strutturato. Inoltre, indipendentemente dalla quantità di informazioni memorizzate in un particolare profilo, l'interazione con ciascuno degli utenti dovrebbe essere il più veloce possibile.

I big data si accumulano costantemente in quasi ogni area della vita umana. Ciò include qualsiasi settore correlato all'interazione umana o all'informatica. Si tratta di social media, medicina e servizi bancari, nonché sistemi di dispositivi che ricevono numerosi risultati di calcoli giornalieri. Ad esempio, osservazioni astronomiche, informazioni meteorologiche e informazioni dai dispositivi di rilevamento della Terra.

Le informazioni provenienti da tutti i tipi di sistemi di tracciamento in tempo reale arrivano anche ai server di una determinata azienda. Trasmissioni televisive e radiofoniche, basi di chiamata degli operatori mobili: l'interazione di ogni singola persona con loro è minima, ma nel complesso tutte queste informazioni diventano big data.

Le tecnologie dei big data sono diventate parte integrante della ricerca, dello sviluppo e del commercio. Inoltre, stanno cominciando a invadere la sfera della pubblica amministrazione - e ovunque è necessario introdurre sistemi sempre più efficienti per l'archiviazione e la manipolazione delle informazioni.

Il termine "big data" è apparso per la prima volta sulla stampa nel 2008, quando l'editore di Nature Clifford Lynch ha pubblicato un articolo sullo sviluppo del futuro della scienza utilizzando tecnologie per lavorare con grandi quantità di dati. Fino al 2009, questo termine era considerato solo dal punto di vista dell'analisi scientifica, ma dopo la pubblicazione di molti altri articoli, la stampa ha iniziato a utilizzare ampiamente il concetto di Big Data - e continua a usarlo attualmente.

Nel 2010 iniziano ad apparire i primi tentativi per risolvere il crescente problema dei big data. Sono stati rilasciati prodotti software, la cui azione era mirata a ridurre al minimo i rischi durante l'utilizzo di enormi array di informazioni.

Nel 2011, grandi aziende come Microsoft, Oracle, EMC e IBM si sono interessate ai big data: sono state le prime a utilizzare i Big data nelle loro strategie di sviluppo e con successo.

Le università hanno iniziato a condurre lo studio dei big data come materia separata già nel 2013 - ora i problemi in questo settore sono affrontati non solo nella scienza dei dati, ma anche nell'ingegneria, insieme a materie computazionali.

I principali metodi di analisi ed elaborazione dei dati includono quanto segue:

  1. Metodi di classe o analisi approfondite (Data Mining).

Questi metodi sono abbastanza numerosi, ma sono accomunati da una cosa: gli strumenti matematici utilizzati insieme alle conquiste nel campo dell'informatica.

  1. Crowdsourcing.

Questa tecnica consente di ottenere dati contemporaneamente da più fonti e il numero di queste ultime è praticamente illimitato.

  1. A/B test.

Dall'intera quantità di dati, viene selezionato un insieme di elementi di controllo, che viene alternativamente confrontato con altre popolazioni simili, in cui uno degli elementi è stato modificato. L'esecuzione di tali test aiuta a determinare quali fluttuazioni dei parametri hanno il maggiore impatto sulla popolazione di controllo. Grazie ai volumi di Big Data, è possibile eseguire un numero enorme di iterazioni, ognuna delle quali si avvicina al risultato più affidabile.

  1. Analisi predittiva.

Gli esperti in questo campo cercano di prevedere e pianificare in anticipo come si comporterà l'oggetto controllato per prendere la decisione più vantaggiosa in questa situazione.

  1. Apprendimento automatico (intelligenza artificiale).

Si basa sull'analisi empirica delle informazioni e sulla successiva costruzione di algoritmi per sistemi di autoapprendimento.

  1. Analisi di rete.

Il metodo più comune per la ricerca sui social network - dopo aver ottenuto dati statistici, vengono analizzati i nodi creati nella griglia, ovvero le interazioni tra i singoli utenti e le loro comunità.

Nel 2017, quando i big data hanno cessato di essere qualcosa di nuovo e sconosciuto, la loro importanza non solo non è diminuita, ma è aumentata ancora di più. Ora gli esperti scommettono che l'analisi di grandi quantità di dati sarà disponibile non solo per le organizzazioni giganti, ma anche per le piccole e medie imprese. Questo approccio è pianificato per essere implementato utilizzando i seguenti componenti:

  • Archiviazione cloud.

L'archiviazione e l'elaborazione dei dati stanno diventando più veloci ed economici: rispetto ai costi di mantenimento del proprio data center e alla possibile espansione del personale, l'affitto di un cloud sembra essere un'alternativa molto più economica.

  • Utilizzo di dati oscuri.

I cosiddetti "dati oscuri": tutte le informazioni non digitali sull'azienda, che non svolgono un ruolo chiave nel suo utilizzo diretto, ma possono fungere da motivo per il passaggio a un nuovo formato per l'archiviazione delle informazioni.

  • Intelligenza Artificiale e Deep Learning.

La tecnologia di apprendimento dell'intelligenza artificiale, che imita la struttura e il lavoro del cervello umano, è la più adatta per elaborare una grande quantità di informazioni in continua evoluzione. In questo caso, la macchina farà esattamente la stessa cosa che avrebbe dovuto fare un essere umano, ma allo stesso tempo la probabilità di errore è notevolmente ridotta.

  • Blockchain.

Questa tecnologia consente di velocizzare e semplificare numerose transazioni Internet, anche internazionali. Un altro vantaggio della Blockchain è che riduce i costi di transazione.

  • Self service e riduzione del prezzo.

Nel 2017 è prevista l'introduzione di "piattaforme self-service": si tratta di siti gratuiti in cui i rappresentanti delle piccole e medie imprese potranno valutare in modo indipendente i dati che archiviano e organizzarli.

Tutte le strategie di marketing in un modo o nell'altro si basano sulla manipolazione delle informazioni e sull'analisi dei dati esistenti. Ecco perché l'uso dei big data può prevedere e consentire di adeguare l'ulteriore sviluppo dell'azienda.

Ad esempio, un'asta RTB basata su big data ti consente di utilizzare la pubblicità in modo più efficiente: un determinato prodotto verrà mostrato solo a un gruppo di utenti interessati all'acquisto.

Qual è il vantaggio di utilizzare le tecnologie dei big data nel marketing e nel business?

  1. Con il loro aiuto, puoi creare nuovi progetti molto più velocemente, che potrebbero diventare richiesti dagli acquirenti.
  2. Aiutano a correlare le esigenze del cliente con il servizio esistente o previsto e quindi a correggerle.
  3. I metodi dei big data ci consentono di valutare il grado di soddisfazione attuale di tutti gli utenti e di ciascuno individualmente.
  4. La fidelizzazione del cliente è aumentata attraverso le tecniche di elaborazione dei big data.
  5. Attirare il tuo pubblico di destinazione su Internet diventa più facile grazie alla possibilità di controllare enormi quantità di dati.

Ad esempio, uno dei servizi più popolari per prevedere la probabile popolarità di un prodotto è Google.trends. È ampiamente utilizzato da esperti di marketing e analisti, consentendo loro di ottenere statistiche sull'uso di un determinato prodotto in passato e previsioni per la stagione successiva. Ciò consente ai leader aziendali di allocare in modo più efficace il budget pubblicitario, per determinare in quale area è meglio investire denaro.

Esempi di utilizzo di Big Data

L'introduzione attiva delle tecnologie Big Data nel mercato e nella vita moderna è iniziata subito dopo che aziende di fama mondiale hanno iniziato a utilizzarle, con clienti in quasi ogni parte del mondo.

Questi sono giganti sociali come Facebook e Google, IBM., Oltre a strutture finanziarie come Master Card, VISA e Bank of America.

Ad esempio, IBM sta applicando tecniche di big data alle sue transazioni monetarie. Con il loro aiuto, sono state rilevate il 15% in più di transazioni fraudolente, il che ha permesso di aumentare la quantità di fondi protetti del 60%. Anche i problemi con i falsi positivi del sistema sono stati risolti: il loro numero è stato ridotto di oltre la metà.

VISA ha utilizzato i Big Data in modo simile, tracciando i tentativi fraudolenti di eseguire questa o quell'operazione. Grazie a questo, ogni anno risparmiano più di 2 miliardi di dollari dalle perdite.

Il ministero del lavoro tedesco è riuscito a tagliare i costi di 10 miliardi di euro integrando i big data nelle indennità di disoccupazione. Allo stesso tempo, è stato rivelato che un quinto dei cittadini riceve questi benefici in modo irragionevole.

Neanche i Big Data hanno risparmiato l'industria dei giochi. Quindi, gli sviluppatori di World of Tanks hanno condotto uno studio sulle informazioni su tutti i giocatori e hanno confrontato gli indicatori disponibili della loro attività. Ciò ha aiutato a prevedere la possibile abbandono futuro dei giocatori: sulla base delle ipotesi fatte, i rappresentanti dell'organizzazione sono stati in grado di interagire in modo più efficace con gli utenti.

Tra le organizzazioni degne di nota che utilizzano i big data figurano anche HSBC, Nasdaq, Coca-Cola, Starbucks e AT&T.

Il problema più grande con i big data è il costo della loro elaborazione. Ciò può includere sia attrezzature costose che il costo dei salari per professionisti qualificati in grado di fornire grandi quantità di informazioni. Ovviamente, l'apparecchiatura dovrà essere regolarmente aggiornata in modo che non perda prestazioni minime all'aumentare della quantità di dati.

Il secondo problema è ancora una volta legato alla grande quantità di informazioni che devono essere elaborate. Se, ad esempio, uno studio non fornisce 2-3, ma un gran numero di risultati, è molto difficile rimanere obiettivi e selezionare dal flusso di dati generale solo quelli che avranno un impatto reale sullo stato di un fenomeno.

Problema di privacy dei Big Data. Con la maggior parte dei fornitori di servizi ai clienti che passano all'uso online dei dati, è molto facile diventare il prossimo obiettivo dei criminali informatici. Anche la semplice memorizzazione di informazioni personali senza eseguire alcuna transazione online può essere carica di conseguenze indesiderabili per i clienti di cloud storage.

Problema di perdita di informazioni. Le precauzioni richiedono di non essere limitate a un semplice backup dei dati una tantum, ma di eseguire almeno 2-3 copie di backup dell'archiviazione. Tuttavia, con l'aumento del volume, aumentano le difficoltà con la ridondanza e gli specialisti IT stanno cercando di trovare la soluzione ottimale a questo problema.

Mercato della tecnologia dei big data in Russia e nel mondo

A partire dal 2014, il 40% del volume del mercato dei big data è costituito da servizi. Le entrate derivanti dall'utilizzo dei Big Data nelle apparecchiature informatiche sono leggermente inferiori (38%) a questo indicatore. Il restante 22% proviene dal software.

I prodotti più utili nel segmento globale per risolvere problemi di Big Data, secondo le statistiche, sono le piattaforme analitiche In-memory e NoSQL. Il 15 e il 12% del mercato, rispettivamente, è occupato dal software analitico Log-file e dalle piattaforme Columnar. Ma Hadoop / MapReduce non è molto efficiente nell'affrontare i problemi dei big data in pratica.

Risultati dell'implementazione di tecnologie per i big data:

  • aumento della qualità del servizio al cliente;
  • ottimizzazione dell'integrazione nella catena di fornitura;
  • ottimizzazione della pianificazione organizzativa;
  • accelerazione dell'interazione con i clienti;
  • migliorare l'efficienza nell'elaborazione delle richieste dei clienti;
  • riduzione dei costi del servizio;
  • ottimizzazione dell'elaborazione degli ordini dei clienti.

I migliori libri sui Big Data



Adatto per lo studio iniziale delle tecnologie di elaborazione dei big data - ti introduce facilmente e chiaramente al corso. Mette in chiaro come l'abbondanza di informazioni abbia influenzato la vita quotidiana e tutte le sue sfere: scienza, affari, medicina, ecc. Contiene numerose illustrazioni, quindi è percepita senza troppi sforzi.

Introduzione al data mining, Pang-Ning Tan, Michael Steinbach e Vipin Kumar

Utile anche per i neofiti è un libro sui Big Data, che spiega come lavorare con i big data sulla base del principio "dal semplice al complesso". Copre molti punti importanti nella fase iniziale: preparazione per l'elaborazione, visualizzazione, OLAP, nonché alcuni metodi di analisi e classificazione dei dati.

Una guida pratica all'utilizzo e al lavoro con i big data utilizzando il linguaggio di programmazione Python. Adatto sia a studenti di ingegneria che a professionisti che vogliono approfondire le proprie conoscenze.

Hadoop for Dummies, Dirk Derus, Paul S. Zykopoulos, Roman B. Melnik

Hadoop è un progetto progettato specificamente per funzionare con programmi distribuiti che eseguono azioni su migliaia di nodi contemporaneamente. La familiarità con esso ti aiuterà a comprendere più in dettaglio l'applicazione pratica dei big data.

"Grandi dati"- un argomento che viene discusso attivamente dalle aziende tecnologiche. Alcuni di loro sono riusciti a rimanere delusi dai big data, altri - al contrario, sfruttarli al meglio per il business ... Una nuova revisione analitica del mercato dei Big Data nazionale e globale, preparata dalla Borsa di Mosca in collaborazione con gli analisti di IPOboard , mostra quali tendenze sono più rilevanti ora sul mercato ... Ci auguriamo che le informazioni siano interessanti e utili.

COSA SONO I BIG DATA?

Caratteristiche principali
I Big Data, oggi, sono uno dei driver chiave dello sviluppo delle tecnologie dell'informazione. Questa direzione, relativamente nuova per gli affari russi, si è diffusa nei paesi occidentali. Ciò è dovuto al fatto che nell'era della tecnologia dell'informazione, soprattutto dopo il boom dei social network, ha iniziato ad accumularsi una quantità significativa di informazioni per ciascun utente di Internet, che alla fine ha dato lo sviluppo della direzione dei Big Data.

Il termine "Big Data" causa molte polemiche, molti credono che significhi solo la quantità di informazioni accumulate, ma non dimenticare il lato tecnico, quest'area include tecnologie di archiviazione, elaborazione e servizi.

Si precisa che quest'area comprende il trattamento di una grande quantità di informazioni, difficilmente processabili con i metodi tradizionali*.

Di seguito una tabella comparativa tra database tradizionali e Big Data.

La sfera dei Big Data è caratterizzata dalle seguenti caratteristiche:
Volume - il volume del database accumulato è una grande quantità di informazioni che è laboriosa da elaborare e archiviare in modi tradizionali, richiedono un nuovo approccio e strumenti migliorati.
Velocità - velocità, questo segno indica sia la crescente velocità di accumulo dei dati (il 90% delle informazioni è stato raccolto negli ultimi 2 anni), sia la velocità di elaborazione dei dati, recentemente le tecnologie di elaborazione dei dati in tempo reale sono diventate più richieste.
Varietà - diversità, cioè la possibilità di elaborazione simultanea di informazioni multiformato strutturate e non strutturate. La principale differenza tra le informazioni strutturate è che possono essere classificate. Un esempio di tali informazioni sono le informazioni sulle transazioni del cliente.
Le informazioni non strutturate includono video, file audio, testo libero, informazioni provenienti dai social network. Oggi l'80% delle informazioni è compreso nel gruppo non strutturato. Queste informazioni necessitano di un'analisi complessa per renderle utili per ulteriori elaborazioni.
veridicità - affidabilità dei dati, gli utenti hanno iniziato ad attribuire un'importanza crescente all'affidabilità dei dati disponibili. Ad esempio, le aziende Internet hanno il problema di separare le azioni eseguite da un robot e una persona sul sito Web dell'azienda, il che alla fine porta alla difficoltà dell'analisi dei dati.
Valore - il valore delle informazioni accumulate. I Big Data dovrebbero essere utili all'azienda e apportarvi un valore. Ad esempio, aiuto nel miglioramento dei processi aziendali, nel reporting o nell'ottimizzazione dei costi.

Se le 5 condizioni precedenti sono soddisfatte, i volumi di dati accumulati possono essere classificati come grandi.

Aree di applicazione dei Big Data

La sfera dell'utilizzo delle tecnologie Big Data è vasta. Quindi, con l'aiuto dei Big Data, puoi scoprire le preferenze dei clienti, l'efficacia delle campagne di marketing o condurre un'analisi dei rischi. Di seguito i risultati di un'indagine dell'IBM Institute sull'utilizzo dei Big Data nelle aziende.

Come puoi vedere dal diagramma, la maggior parte delle aziende utilizza i Big Data nel campo del servizio clienti, la seconda area più popolare è l'efficienza operativa, nel campo della gestione del rischio i Big Data sono meno comuni al momento.

Va anche notato che i Big Data sono una delle aree della tecnologia dell'informazione in più rapida crescita, secondo le statistiche, la quantità totale di dati ricevuti e archiviati raddoppia ogni 1,2 anni.
Tra il 2012 e il 2014 la quantità di dati trasferiti mensilmente dalle reti mobili è cresciuta dell'81%. Secondo le stime Cisco, nel 2014 il volume di traffico mobile era di 2,5 exabyte (unità di misura per la quantità di informazioni pari a 10^18 standard byte) al mese, e già nel 2019 sarà pari a 24,3 exabyte.
Pertanto, i Big Data sono già un'area consolidata della tecnologia, nonostante la sua età relativamente giovane, che si è diffusa in molte aree di business e svolge un ruolo importante nello sviluppo delle aziende.

Tecnologie per i Big Data
Le tecnologie utilizzate per raccogliere ed elaborare i Big Data possono essere suddivise in 3 gruppi:
  • Software;
  • Attrezzatura;
  • Servizi di servizio.

Gli approcci più comuni per l'elaborazione dei dati (software) includono:
SQL - un linguaggio di query strutturato che consente di lavorare con i database. Con l'aiuto di SQL, è possibile creare e modificare i dati e il sistema di gestione del database corrispondente si occupa della gestione del set di dati.
NoSQL - il termine sta per Not Only SQL (non solo SQL). Comprende una serie di approcci volti all'implementazione di un database che differiscono dai modelli utilizzati nei DBMS relazionali tradizionali. Sono convenienti da usare quando la struttura dei dati è in continua evoluzione. Ad esempio, per raccogliere e archiviare informazioni sui social network.
Riduci mappa - modello di distribuzione computazionale. Utilizzato per il calcolo parallelo su set di dati molto grandi (petabyte * o più). Nell'interfaccia di programmazione, non vengono trasferiti dati al programma per l'elaborazione, ma il programma viene trasferito ai dati. Pertanto, la richiesta è un programma separato. Il principio di funzionamento consiste nell'elaborazione sequenziale dei dati mediante due metodi Map e Reduce. La mappa recupera i dati preliminari, Riduci li aggrega.
Hadoop - viene utilizzato per implementare meccanismi di ricerca e contestuali di siti ad alto carico - Facebook, eBay, Amazon, ecc. Una caratteristica distintiva è che il sistema è protetto dai guasti di uno qualsiasi dei nodi del cluster, poiché ogni blocco ha almeno una copia di i dati sull'altro nodo.
SAP HANA È una piattaforma NewSQL ad alte prestazioni per l'archiviazione e l'elaborazione dei dati. Fornisce un'elevata velocità di elaborazione delle richieste. Un'altra caratteristica distintiva è che SAP HANA semplifica il panorama del sistema riducendo i costi di supporto dei sistemi analitici.

La dotazione tecnologica comprende:

  • server;
  • attrezzatura infrastrutturale.
I server includono archivi di dati.
Le apparecchiature dell'infrastruttura includono acceleratori di piattaforme, gruppi di continuità, kit di console per server, ecc.

Servizi di servizio.
I servizi includono servizi per costruire l'architettura del sistema di database, organizzare e ottimizzare l'infrastruttura e garantire la sicurezza dell'archiviazione dei dati.

Software, hardware e servizi insieme formano complesse piattaforme per l'archiviazione e l'analisi dei dati. Aziende come Microsoft, HP, EMC offrono servizi per lo sviluppo, l'implementazione e la gestione di soluzioni Big Data.

Applicazione nelle industrie
I Big Data si sono diffusi in molti settori. Sono utilizzati in sanità, telecomunicazioni, commercio, logistica, società finanziarie e governo.
Di seguito sono riportati alcuni esempi di applicazioni Big Data in alcuni dei settori.

Vedere al dettaglio
Nei database dei negozi al dettaglio, è possibile accumulare molte informazioni sui clienti, sul sistema di gestione dell'inventario e sulla fornitura di prodotti commerciabili. Queste informazioni possono essere utili in tutte le aree dei negozi.

Quindi, con l'aiuto delle informazioni accumulate, puoi gestire la fornitura di merci, il loro stoccaggio e vendita. Sulla base delle informazioni accumulate, è possibile prevedere la domanda e l'offerta di beni. Inoltre, il sistema di elaborazione e analisi dei dati può risolvere altri problemi del rivenditore, ad esempio per ottimizzare i costi o preparare report.

Servizi finanziari
I Big Data consentono di analizzare il merito creditizio di un mutuatario, ed è utile anche per il credit scoring* e underwriting**. L'introduzione delle tecnologie Big Data ridurrà i tempi per l'esame delle domande di prestito. Con l'aiuto dei Big Data, puoi analizzare le transazioni di un cliente specifico e offrire servizi bancari adatti a lui.

Telecom
Nel settore delle telecomunicazioni, i Big Data sono ampiamente utilizzati dagli operatori mobili.
Gli operatori mobili, insieme agli istituti finanziari, dispongono di una delle banche dati più voluminose, che consente loro di effettuare l'analisi più approfondita delle informazioni accumulate.
L'obiettivo principale dell'analisi dei dati è fidelizzare i clienti esistenti e attirarne di nuovi. Per fare ciò, le aziende segmentano i clienti, analizzano il loro traffico e determinano l'affiliazione sociale dell'abbonato.

Oltre a utilizzare i Big Data per scopi di marketing, vengono utilizzate tecnologie per prevenire transazioni finanziarie fraudolente.

Industria mineraria e petrolifera
I Big Data vengono utilizzati sia nell'estrazione che nell'elaborazione e nel marketing. Sulla base delle informazioni ricevute, le imprese possono trarre conclusioni sull'efficacia dello sviluppo sul campo, tenere traccia del programma delle revisioni e delle condizioni delle attrezzature, prevedere la domanda di prodotti e prezzi.

Secondo un sondaggio di Tech Pro Research, i Big Data sono più diffusi nel settore delle telecomunicazioni, nonché nelle imprese ingegneristiche, IT, finanziarie e governative. Secondo i risultati di questo sondaggio, i Big Data sono meno popolari nell'istruzione e nella sanità. I risultati del sondaggio sono presentati di seguito:

Esempi di utilizzo dei Big Data nelle aziende
Oggi i Big Data vengono attivamente implementati in società estere. Aziende come Nasdaq, Facebook, Google, IBM, VISA, Master Card, Bank of America, HSBC, AT&T, Coca Cola, Starbucks e Netflix stanno già utilizzando i Big Data.

I campi di applicazione delle informazioni trattate sono molteplici e variano a seconda del settore e delle mansioni da svolgere.
Verranno presentati ulteriori esempi di applicazione pratica delle tecnologie Big Data.

HSBC utilizza le tecnologie Big Data per combattere le transazioni fraudolente con carte di plastica. Con l'aiuto dei Big Data, l'azienda ha aumentato l'efficienza del servizio di sicurezza 3 volte e il rilevamento di incidenti fraudolenti - 10 volte. L'effetto economico dell'introduzione di queste tecnologie ha superato i 10 milioni di dollari.

Anti frode * VISA consente di calcolare automaticamente le transazioni fraudolente, il sistema attualmente aiuta a prevenire pagamenti fraudolenti per un importo di 2 miliardi di dollari all'anno.

Supercomputer Watson Company IBM analizza il flusso di dati sulle transazioni monetarie in tempo reale. Secondo IBM, Watson ha aumentato del 15% il numero di transazioni fraudolente rilevate, ridotto del 50% i falsi positivi e aumentato del 60% la quantità di fondi protetti da tali transazioni.

Procter & Gamble con l'aiuto dei Big Data, progettano nuovi prodotti e compongono campagne di marketing globali. P&G ha istituito uffici dedicati alle Business Spheres dove le informazioni possono essere visualizzate in tempo reale.
Pertanto, la direzione dell'azienda è stata in grado di testare istantaneamente ipotesi e condurre esperimenti. P&G crede che i Big Data aiutino a prevedere le prestazioni dell'azienda.

Rivenditore di forniture per ufficio OfficeMax utilizzando le tecnologie Big Data, analizzano il comportamento dei clienti. L'analisi dei Big Data ci ha permesso di aumentare le entrate B2B del 13% e di ridurre i costi di 400.000 USD all'anno.

A parere bruco , i suoi distributori perdono da $ 9 a $ 18 miliardi all'anno di profitti solo perché non implementano le tecnologie Big Data. I Big Data consentirebbero ai clienti di gestire in modo più efficiente la propria flotta di auto analizzando le informazioni provenienti dai sensori installati sulle auto.

Già oggi è possibile analizzare lo stato dei componenti chiave, il loro grado di usura, gestire i costi di carburante e di manutenzione.

Gruppo Luxottica è un produttore di occhiali sportivi come Ray-Ban, Persol e Oakley. L'azienda utilizza le tecnologie Big Data per analizzare il comportamento dei potenziali clienti e il marketing SMS "intelligente". Di conseguenza, il gruppo Big Data Luxottica ha assegnato più di 100 milioni di clienti di maggior valore e ha aumentato l'efficacia della campagna di marketing del 10%.

Con l'aiuto di Yandex Data Factory, sviluppatori di giochi Mondo dei carri armati analizzare il comportamento dei giocatori. Le tecnologie Big Data hanno permesso di analizzare il comportamento di 100mila giocatori di World of Tanks utilizzando più di 100 parametri (informazioni su acquisti, giochi, esperienza, ecc.). Come risultato dell'analisi, è stata ottenuta una previsione del tasso di abbandono degli utenti. Queste informazioni aiutano a ridurre l'abbandono degli utenti e a lavorare con i partecipanti al gioco in modo mirato. Il modello sviluppato si è rivelato più efficiente del 20-30% rispetto agli strumenti standard per l'analisi dell'industria dei giochi.

Ministero del Lavoro tedesco utilizza i Big Data nelle sue attività relative all'analisi delle domande in entrata per l'emissione di sussidi di disoccupazione. Quindi, dopo aver analizzato le informazioni, è apparso chiaro che il 20% dei benefici è stato pagato immeritatamente. Con l'aiuto dei Big Data, il Ministero del Lavoro ha tagliato i costi di 10 miliardi di euro.

Ospedale pediatrico Toronto ha realizzato il progetto Progetto Artemis. È un sistema informativo che raccoglie e analizza i dati sui neonati in tempo reale. Il sistema monitora ogni secondo 1260 indicatori dello stato di ogni bambino. Il progetto Artemis consente di prevedere lo stato instabile di un bambino e avviare la prevenzione delle malattie nei bambini.

PANORAMICA DEL MERCATO GLOBALE DEI BIG DATA

Stato attuale del mercato mondiale
Nel 2014 i Big Data, secondo Data Collective, sono diventati una delle aree prioritarie di investimento nel settore del venture capital. Secondo il portale di informazione Computerra, ciò è dovuto al fatto che gli sviluppi in questo settore hanno iniziato a portare risultati significativi per i loro utenti. Nell'ultimo anno, il numero di aziende con progetti implementati nel campo della gestione dei big data è aumentato del 125%, il volume di mercato è cresciuto del 45% rispetto al 2013.

La maggior parte delle entrate del mercato dei Big Data, secondo Wikibon, nel 2014 era costituita da servizi, la loro quota era pari al 40% delle entrate totali (si veda lo schema sotto):

Se consideriamo i Big Data per il 2014 per sottotipi, il mercato sarà simile a questo:

Secondo Wikibon, le applicazioni e le analisi rappresentano il 36% delle entrate dei Big Data nel 2014 provengono da applicazioni e analisi di Big Data, il 17% dalle apparecchiature informatiche e il 15% dalle tecnologie di archiviazione dei dati. Meno di tutti i ricavi sono stati generati dalle tecnologie NoSQL, dalle apparecchiature infrastrutturali e dalla fornitura di una rete di aziende (reti aziendali).

Le più popolari sono le tecnologie Big Data come le piattaforme in-memory di SAP, HANA, Oracle, ecc. I risultati dell'indagine T-Systems hanno mostrato che sono state scelte dal 30% delle aziende intervistate. Le seconde più popolari erano le piattaforme NoSQL (18% degli utenti), le aziende utilizzavano anche piattaforme analitiche di Splunk e Dell, scelte dal 15% delle aziende. I meno utili per risolvere i problemi dei Big Data, secondo i risultati del sondaggio, erano i prodotti Hadoop/MapReduce.

Secondo un sondaggio di Accenture, oltre il 50% delle aziende che utilizzano tecnologie Big Data spende dal 21% al 30% in Big Data.
Secondo la seguente analisi di Accenture, il 76% delle aziende ritiene che queste spese aumenteranno nel 2015 e il 24% delle aziende non modificherà il proprio budget per le tecnologie Big Data. Ciò suggerisce che in queste aziende i Big Data sono già diventati una direzione consolidata dell'IT, che è diventata parte integrante dello sviluppo dell'azienda.

I risultati dell'indagine dell'Economist Intelligence Unit confermano l'effetto positivo dell'implementazione dei Big Data. Il 46% delle aziende afferma di aver migliorato il servizio clienti di oltre il 10% utilizzando le tecnologie Big Data, il 33% delle aziende ha ottimizzato l'inventario e migliorato la produttività delle immobilizzazioni, il 32% delle aziende ha migliorato i processi di pianificazione.

Big data nel mondo
Oggi le tecnologie Big Data sono più spesso implementate nelle aziende statunitensi, ma anche ora altri paesi del mondo hanno iniziato a mostrare interesse. Nel 2014, secondo IDC, i paesi di Europa, Medio Oriente, Asia (escluso il Giappone) e Africa hanno rappresentato il 45% del mercato di software, servizi e apparecchiature nel campo dei Big Data.

Inoltre, secondo un sondaggio CIO, le aziende della regione Asia-Pacifico stanno rapidamente adottando nuove soluzioni nel campo dell'analisi dei Big Data, dell'archiviazione sicura e delle tecnologie cloud. L'America Latina è al secondo posto per ammontare di investimenti nello sviluppo delle tecnologie Big Data, davanti ai paesi dell'Europa e degli Stati Uniti.
Successivamente, verrà presentata una descrizione e previsioni dello sviluppo del mercato dei Big Data in diversi paesi.

Cina
Il volume delle informazioni in Cina è di 909 exabyte, pari al 10% della quantità totale di informazioni nel mondo, entro il 2020 la quantità di informazioni raggiungerà gli 8060 exabyte e aumenterà anche la quota di informazioni nelle statistiche globali, in 5 anni sarà del 18%. La crescita potenziale dei Big Data cinesi ha una delle dinamiche in più rapida crescita.

Brasile
Alla fine del 2014, il Brasile ha accumulato 212 exabyte di informazioni, ovvero il 3% del volume globale. Entro il 2020, il volume delle informazioni aumenterà fino a 1.600 exabyte, ovvero il 4% delle informazioni mondiali.

India
Secondo EMC, il volume di dati accumulati in India alla fine del 2014 è di 326 exabyte, ovvero il 5% del volume totale di informazioni. Entro il 2020, il volume delle informazioni aumenterà fino a 2.800 exabyte, ovvero il 6% delle informazioni in tutto il mondo.

Giappone
La quantità di dati accumulati in Giappone alla fine del 2014 è di 495 exabyte, ovvero l'8% della quantità totale di informazioni. Entro il 2020, il volume di informazioni aumenterà fino a 2.200 exabyte, ma la quota di mercato del Giappone diminuirà al 5% del volume totale di informazioni di tutto il mondo.
Pertanto, le dimensioni del mercato giapponese diminuiranno di oltre il 30%.

Germania
Secondo EMC, il volume di dati accumulati in Germania alla fine del 2014 è di 230 exabyte, ovvero il 4% del volume totale di informazioni nel mondo. Entro il 2020, il volume delle informazioni aumenterà fino a 1.100 exabyte, ovvero il 2%.
Nel mercato tedesco, una grande quota di fatturato, secondo le previsioni del Gruppo Experton, sarà generata dal segmento dei servizi, la cui quota nel 2015 sarà pari al 54%, e nel 2019 aumenterà al 59% la quota di software e hardware, al contrario, diminuirà.

Complessivamente il mercato passerà da 1,345 miliardi di euro nel 2015 a 3,198 miliardi di euro nel 2019, con un tasso di crescita medio del 24%.
Pertanto, sulla base dell'analisi di CIO ed EMC, si può concludere che i paesi in via di sviluppo del mondo nei prossimi anni diventeranno mercati per lo sviluppo attivo delle tecnologie Big Data.

Principali tendenze di mercato
Secondo IDG Enterprise, nel 2015 la spesa delle aziende sui Big Data sarà in media di 7,4 milioni di dollari per azienda, le grandi aziende intendono spendere circa 13,8 milioni di dollari, le piccole e medie imprese 1,6 milioni di dollari. ...
La maggior parte sarà investita in aree quali l'analisi e la visualizzazione dei dati e la raccolta dei dati.
In linea con le tendenze attuali e la domanda del mercato, gli investimenti del 2015 saranno utilizzati per migliorare la qualità dei dati, migliorare la pianificazione e le previsioni e aumentare la velocità di elaborazione dei dati.
Le aziende del settore finanziario, secondo Insights Analysis di Bain Company, effettueranno investimenti significativi, quindi nel 2015 si prevede di spendere 6,4 miliardi di dollari in tecnologie Big Data, il tasso di crescita medio degli investimenti sarà del 22% fino al 2020. Le società Internet prevedono di spendere 2,8 miliardi di dollari, con un tasso di crescita medio del 26% per la spesa per i Big Data.
Nel condurre un'indagine dell'indagine dell'Economist Intelligence Unit, sono state individuate le direzioni prioritarie per lo sviluppo dei Big Data nel 2014 e nei prossimi 3 anni, la distribuzione delle risposte è la seguente:

Secondo le previsioni di IDC, le tendenze del mercato sono le seguenti:

  • Nei prossimi 5 anni, il costo delle soluzioni cloud nel campo delle tecnologie Big Data crescerà 3 volte più velocemente del costo delle soluzioni on-premise. Saranno richieste piattaforme di storage ibride.
  • La crescita delle applicazioni che utilizzano analisi complesse e predittive, compreso l'apprendimento automatico, accelererà nel 2015, il mercato di tali applicazioni crescerà del 65% più velocemente rispetto alle applicazioni che non utilizzano l'analisi predittiva.
  • L'analisi dei media triplicherà nel 2015 e diventerà un fattore chiave di crescita per il mercato della tecnologia Big Data.
  • La tendenza accelererà per implementare soluzioni per analizzare il flusso continuo di informazioni applicabile all'Internet of Things.
  • Entro il 2018, il 50% degli utenti interagirà con i servizi di cognitive computing.
Driver di mercato e limitatori
Gli esperti di IDC hanno identificato 3 driver del mercato dei Big Data nel 2015:

Secondo un sondaggio di Accenture, i problemi di sicurezza dei dati sono ora il principale ostacolo all'implementazione delle tecnologie Big Data, con oltre il 51% degli intervistati che ha confermato di essere preoccupato per garantire la protezione e la riservatezza dei dati. Il 47% delle aziende ha segnalato l'impossibilità di implementare Big Data a causa di un budget limitato, il 41% delle aziende ha indicato come un problema la mancanza di personale qualificato.

Wikibon prevede che la dimensione del mercato dei Big Data crescerà fino a $ 38,4 miliardi nel 2015 e aumenterà del 36% rispetto all'anno precedente. Nei prossimi anni si assisterà a un calo dei tassi di crescita fino al 10% nel 2017. Sulla base di queste previsioni, la dimensione del mercato nel 2020 sarà pari a 68,7 miliardi di dollari.

La distribuzione del mercato globale dei Big Data per categoria di attività sarà simile alla seguente:

Come puoi vedere dal diagramma, la maggior parte del mercato sarà occupata da tecnologie nel campo del miglioramento del servizio clienti. Il point marketing sarà al secondo posto in termini di priorità tra le aziende fino al 2019, nel 2020, secondo le previsioni di Heavy Reading, lascerà il posto a soluzioni per migliorare l'efficienza operativa.
Anche il segmento “miglioramento del servizio clienti” avrà il tasso di crescita più elevato, con un incremento del 49% annuo.
La previsione di mercato per i sottotipi di Big Data sarà simile a questa:

La quota di mercato predominante, come si vede dal grafico, è occupata dai servizi professionali, il tasso di crescita più alto sarà nelle applicazioni con analytics, la loro quota passerà dall'attuale 12% al 18% nel 2020, e il volume di questo segmento sarà pari a 12,3 miliardi di dollari, la quota delle apparecchiature informatiche, invece, scenderà dal 20% al 14% e ammonterà a circa 9,3 miliardi di dollari nel 2020, il mercato delle tecnologie cloud aumenterà gradualmente e nel 2020 raggiungerà i 6,3 miliardi di dollari USA, la quota di mercato delle soluzioni per l'archiviazione dei dati, invece, scenderà dal 15% del 2014 al 13% del 2020 e in termini monetari sarà pari a 8,9 miliardi di dollari.
Secondo le previsioni di Insights Analysis di Bain & Company, la distribuzione del mercato Big Data per settore nel 2020 sarà simile a questa:

  • L'industria finanziaria spenderà 6,4 miliardi di dollari in Big Data con un tasso di crescita medio del 22% all'anno;
  • Le società Internet spenderanno $ 2,8 miliardi e un tasso di crescita medio dei costi del 26% nei prossimi 5 anni;
  • I costi del settore pubblico saranno commisurati ai costi delle società Internet, ma il tasso di crescita sarà inferiore - 22%;
  • Il settore delle telecomunicazioni crescerà a un tasso medio di crescita del 40% per raggiungere 1,2 miliardi di dollari nel 2020;

Le utility investiranno una quantità relativamente piccola di 800 milioni di dollari USA in queste tecnologie, ma il tasso di crescita sarà uno dei più alti al 54% annuo.
Pertanto, una grande fetta del mercato dei Big Data nel 2020 sarà occupata da aziende del settore finanziario e il settore in più rapida crescita sarà l'energia.
Secondo le previsioni degli analisti, il volume totale del mercato aumenterà nei prossimi anni. La crescita del mercato sarà assicurata dall'introduzione delle tecnologie Big Data nei paesi in via di sviluppo del mondo, come si può vedere dal grafico sottostante.

La dimensione del mercato prevista dipenderà da come i paesi in via di sviluppo percepiscono le tecnologie Big Data, dal fatto che siano così popolari come nei paesi sviluppati. Nel 2014, i paesi in via di sviluppo del mondo hanno rappresentato il 40% delle informazioni accumulate. EMC prevede che l'attuale struttura del mercato, dominata dai paesi sviluppati, cambierà nel 2017. Secondo gli analisti EMC, nel 2020 la quota dei paesi in via di sviluppo supererà il 60%.
Secondo Cisco ed EMC, i paesi in via di sviluppo del mondo saranno piuttosto attivi nel lavorare con i Big Data, in gran parte grazie alla disponibilità di tecnologie e all'accumulo di una quantità di informazioni sufficiente al livello dei Big Data. La mappa del mondo nella pagina successiva mostrerà la previsione per l'aumento del volume e il tasso di crescita dei Big Data per regione.

ANALISI DEL MERCATO RUSSO

Stato attuale del mercato russo

Secondo uno studio di CNews Analytics e Oracle, il livello di maturità del mercato russo dei Big Data è aumentato nell'ultimo anno. Gli intervistati di 108 grandi imprese in un'ampia gamma di settori hanno mostrato un grado più elevato di consapevolezza di queste tecnologie, nonché una comprensione consolidata del potenziale di tali soluzioni per la loro attività.
A partire dal 2014, secondo IDC, in Russia sono stati accumulati 155 exabyte di informazioni, ovvero solo l'1,8% dei dati mondiali. Il volume delle informazioni entro il 2020 raggiungerà i 980 exabyte e impiegherà il 2,2%. Pertanto, il tasso di crescita medio del volume di informazioni sarà del 36% all'anno.
IDC stima il mercato russo a $ 340 milioni, di cui $ 100 milioni sono soluzioni SAP, circa $ 240 milioni sono soluzioni simili di Oracle, IBM, SAS, Microsoft, ecc.
Il tasso di crescita del mercato russo dei Big Data non è inferiore al 50% annuo.
Si prevede che le dinamiche positive continueranno in questo settore del mercato IT russo, anche in un contesto di generale stagnazione dell'economia. Ciò è dovuto al fatto che le aziende richiedono ancora soluzioni che migliorino l'efficienza operativa, ottimizzino i costi, migliorino l'accuratezza delle previsioni e minimizzino i possibili rischi aziendali.
I principali fornitori di servizi Big Data nel mercato russo sono:
  • Oracolo
  • Microsoft
  • Cloudera
  • Hortonworks
  • Teradata.
Panoramica del mercato per settore ed esperienza nell'uso dei Big Data nelle aziende
Secondo CNews, in Russia solo il 10% delle aziende ha iniziato a utilizzare le tecnologie Big Data, quando la quota di tali aziende nel mondo è di circa il 30%. La disponibilità per i progetti Big Data sta crescendo in molti settori dell'economia russa, secondo il rapporto di CNews Analytics e Oracle. Più di un terzo delle aziende intervistate (37%) ha iniziato a lavorare con le tecnologie Big Data, di cui il 20% sta già utilizzando tali soluzioni e il 17% sta iniziando a sperimentarle. Un secondo terzo degli intervistati sta attualmente valutando questa possibilità.

In Russia, le tecnologie Big Data sono più popolari nel settore bancario e delle telecomunicazioni, ma sono richieste anche nel settore minerario, energetico, al dettaglio, nelle società di logistica e nel settore pubblico.
Di seguito prenderemo in considerazione esempi di applicazione dei Big Data nelle realtà russe.

Telecom
Gli operatori di telecomunicazioni dispongono di una delle banche dati più voluminose, che consente loro di effettuare l'analisi più approfondita delle informazioni accumulate.
Una delle aree di applicazione della tecnologia Big Data è la gestione della fedeltà degli abbonati.
L'obiettivo principale dell'analisi dei dati è fidelizzare i clienti esistenti e attirarne di nuovi. Per fare ciò, le aziende segmentano i clienti, analizzano il loro traffico e determinano l'affiliazione sociale dell'abbonato. Oltre a utilizzare le informazioni per scopi di marketing, le tecnologie di telecomunicazione vengono utilizzate per prevenire transazioni finanziarie fraudolente.
VimpelCom è uno degli esempi eclatanti di questo settore. L'azienda utilizza i Big Data per migliorare la qualità del servizio a livello di ciascun abbonato, preparare report, analizzare i dati per lo sviluppo della rete, combattere lo spam e personalizzare i servizi.

Banche
Una percentuale significativa degli utenti di Big Data sono specialisti del settore finanziario. Uno degli esperimenti di successo è stato condotto presso la Banca degli Urali per la ricostruzione e lo sviluppo, dove la base di informazioni è stata utilizzata per analizzare i clienti, la banca ha iniziato a offrire offerte di prestito specializzate, depositi e altri servizi. Durante l'anno di utilizzo di queste tecnologie, il portafoglio di prestiti al dettaglio della società è cresciuto del 55%.
Alfa-Bank analizza le informazioni dai social network, elabora le domande di prestito e analizza il comportamento degli utenti del sito Web dell'azienda.
Sberbank ha anche iniziato a elaborare un'enorme quantità di dati per segmentare i clienti, prevenire attività fraudolente, effettuare vendite incrociate e gestire il rischio. In futuro, si prevede di migliorare il servizio e analizzare le azioni dei clienti in tempo reale.
La Banca di sviluppo regionale panrussa analizza il comportamento dei titolari di carte di plastica. Ciò consente di identificare transazioni atipiche per un particolare cliente, aumentando così la probabilità di rilevare il furto di fondi dalle carte di plastica.

Vedere al dettaglio
In Russia, le tecnologie Big Data sono state implementate da società di trading sia online che offline. Oggi, secondo CNews Analytics, i Big Data sono utilizzati dal 20% dei rivenditori. Il 75% dei rivenditori ritiene che i Big Data siano essenziali per sviluppare una strategia di marketing competitiva. Secondo le statistiche Hadoop, dopo l'implementazione della tecnologia Big Data, i profitti nelle organizzazioni commerciali crescono del 7-10%.
Gli specialisti di M.Video parlano del miglioramento della pianificazione logistica dopo l'implementazione di SAP HANA e, a seguito della sua implementazione, la preparazione dei report annuali è stata ridotta da 10 giorni a 3, la velocità di download dei dati giornalieri è diminuita da 3 ore a 30 minuti.
Wikimart utilizza queste tecnologie per generare raccomandazioni per i visitatori del sito web.
Uno dei primi negozi offline a introdurre l'analisi dei Big Data in Russia è stato Lenta. Con l'aiuto dei Big Data, la vendita al dettaglio ha iniziato a studiare le informazioni sui clienti dalle ricevute delle casse. Il rivenditore raccoglie informazioni per generare modelli comportamentali, che gli consentono di prendere decisioni più informate a livello operativo e aziendale.

Industria petrolifera e del gas
In questo settore, il campo di applicazione dei Big Data è piuttosto ampio. Le tecnologie Big Data possono essere applicate nell'estrazione di minerali dal sottosuolo. Con il loro aiuto, puoi analizzare il processo di produzione stesso e i modi più efficaci per estrarlo, monitorare il processo di perforazione, analizzare la qualità delle materie prime, nonché la lavorazione e la commercializzazione del prodotto finale. In Russia, Transneft e Rosneft hanno già iniziato a utilizzare queste tecnologie.

organi statali
Paesi come Germania, Australia, Spagna, Giappone, Brasile e Pakistan utilizzano le tecnologie Big Data per affrontare le questioni nazionali. Queste tecnologie aiutano gli enti governativi a fornire più efficacemente servizi alla popolazione, fornendo un supporto sociale mirato.
In Russia, queste tecnologie hanno iniziato a essere padroneggiate da organismi statali come il Fondo pensione, il Servizio fiscale federale e il Fondo di assicurazione sanitaria obbligatorio. Il potenziale per l'implementazione di progetti che utilizzano i Big Data è ampio, queste tecnologie potrebbero aiutare a migliorare la qualità dei servizi e, di conseguenza, il tenore di vita della popolazione.

Logistica e trasporti
I Big Data possono essere utilizzati anche dalle aziende di trasporto. Con l'ausilio delle tecnologie Big Data è possibile tracciare il parcheggio, tenere conto dei costi del carburante e monitorare le richieste dei clienti.
Le ferrovie russe hanno implementato le tecnologie Big Data insieme a SAP. Queste tecnologie hanno contribuito a ridurre il periodo di rendicontazione di 43,5 volte (da 14,5 ore a 20 minuti) ea migliorare di 40 volte l'accuratezza dell'allocazione dei costi. Inoltre, i Big Data sono stati introdotti nei processi di pianificazione e regolazione tariffaria. In totale, le aziende utilizzano più di 300 sistemi basati su soluzioni SAP, sono coinvolti 4 data center e il numero di utenti è di 220.000.

Principali driver e vincoli di mercato
I driver per lo sviluppo delle tecnologie Big Data nel mercato russo sono:
  • Maggiore interesse da parte degli utenti alle possibilità dei Big Data come mezzo per aumentare la competitività dell'azienda;
  • Sviluppo di metodi per l'elaborazione di file multimediali a livello globale;
  • Trasferimento di server che elaborano informazioni personali nel territorio della Russia, in conformità con la legge adottata sulla conservazione e il trattamento dei dati personali;
  • Attuazione del piano settoriale per la sostituzione delle importazioni di software. Questo piano include il sostegno statale per i produttori di software nazionali, nonché la fornitura di preferenze per i prodotti IT nazionali quando si effettuano acquisti a spese pubbliche.
  • Nella nuova situazione economica, quando il tasso del dollaro sarà quasi raddoppiato, si assisterà a una tendenza verso un uso sempre maggiore dei servizi dei fornitori di cloud russi rispetto a quelli stranieri.
  • Creazione di tecnoparchi che contribuiscono allo sviluppo del mercato delle tecnologie dell'informazione, compreso il mercato dei Big Data;
  • Programma statale per l'implementazione di sistemi grid, che si basano su tecnologie Big Data.

I principali ostacoli allo sviluppo dei Big Data nel mercato russo sono:

  • Garantire la sicurezza e la riservatezza dei dati;
  • Mancanza di personale qualificato;
  • Mancanza di risorse informative accumulate al livello dei Big Data nella maggior parte delle aziende russe;
  • Difficoltà nell'introduzione di nuove tecnologie nei sistemi informativi consolidati delle aziende;
  • L'alto costo delle tecnologie Big Data, che porta a un numero limitato di imprese in grado di implementare queste tecnologie;
  • Incertezza politica ed economica che ha portato al deflusso di capitali e al congelamento dei progetti di investimento in Russia;
  • L'aumento dei prezzi dei prodotti importati e l'impennata dell'inflazione, secondo IDC, rallentano lo sviluppo dell'intero mercato IT.
Previsioni del mercato russo
Ad oggi, il mercato russo dei Big Data non è così popolare come nei paesi sviluppati. La maggior parte delle aziende russe mostra interesse, ma non osano sfruttare le loro opportunità.
Esempi di grandi aziende che hanno già beneficiato delle tecnologie Big Data stanno aumentando la consapevolezza del potere di queste tecnologie.
Gli analisti sono anche abbastanza ottimisti sul mercato russo. IDC ritiene che la quota di mercato russo aumenterà nei prossimi 5 anni, in contrasto con il mercato in Germania e Giappone.
Entro il 2020, il volume dei Big Data in Russia passerà dall'attuale 1,8% al 2,2% del volume di dati globale. La quantità di informazioni aumenterà, secondo EMC, dagli attuali 155 exabyte a 980 exabyte nel 2020.
Al momento, la Russia continua ad accumulare quantità di informazioni fino al livello dei Big Data.
Secondo un sondaggio di CNews Analytics, il 44% delle aziende intervistate lavora con dati non superiori a 100 terabyte* e solo il 13% lavora con volumi superiori a 500 terabyte.

Tuttavia, il mercato russo, seguendo le tendenze globali, crescerà. A partire dal 2014, IDC stima la dimensione del mercato a $ 340 milioni.
Il tasso di crescita del mercato negli anni precedenti era del 50% all'anno, se rimane allo stesso livello, nel 2018 il volume del mercato raggiungerà 1,7 miliardi di dollari. La quota del mercato russo nel mercato mondiale sarà di circa il 3%, essendo passata dall'attuale 1,2%.

Le industrie più suscettibili all'utilizzo dei Big Data in Russia sono:

  • Retail e banche, per loro, prima di tutto, è importante l'analisi della base clienti, la valutazione dell'effetto delle campagne di marketing;
  • Telecom - segmentazione della base clienti e monetizzazione del traffico;
  • Settore pubblico - contabilità, analisi delle domande della popolazione, ecc.;
  • Compagnie petrolifere - monitoraggio del lavoro e pianificazione della produzione e delle vendite;
  • Compagnie energetiche: creazione di sistemi di alimentazione intelligenti, monitoraggio operativo e previsioni.
Nei paesi sviluppati, i Big Data si sono diffusi nelle sfere della sanità, delle assicurazioni, della metallurgia, delle società Internet e delle imprese industriali, molto probabilmente nel prossimo futuro anche le aziende russe di queste aree valuteranno l'effetto dell'implementazione dei Big Data e adatteranno queste tecnologie nelle loro industrie.
In Russia, così come nel mondo, nel prossimo futuro ci sarà una tendenza verso la visualizzazione dei dati, l'analisi dei file multimediali e lo sviluppo dell'Internet of Things.
Nonostante la generale stagnazione dell'economia, gli analisti prevedono un'ulteriore crescita del mercato Big Data nei prossimi anni, principalmente per il fatto che l'utilizzo delle tecnologie Big Data offre ai propri utenti un vantaggio competitivo in termini di aumento dell'efficienza operativa del business , attrarre nuovi clienti, ridurre al minimo i rischi e implementare tecnologie di previsione dei dati.
Pertanto, possiamo concludere che il segmento dei Big Data in Russia è in fase di formazione, ma la domanda di queste tecnologie aumenta ogni anno.

Risultati chiave dell'analisi di mercato

Mercato mondiale
A fine 2014 il mercato dei Big Data è caratterizzato dai seguenti parametri:
  • la dimensione del mercato è stata di 28,5 miliardi di dollari, con un incremento del 45% rispetto all'anno precedente;
  • la maggior parte dei ricavi del mercato Big Data era costituita da servizi, la loro quota era pari al 40% sui ricavi totali;
  • Il 36% dei ricavi proveniva da applicazioni e analisi dei Big Data, il 17% da apparecchiature informatiche e il 15% da tecnologie di archiviazione dei dati;
  • Le piattaforme più popolari per la risoluzione dei problemi relativi ai Big Data sono le piattaforme in-memory di aziende come SAP, HANA e Oracle.
  • il numero di aziende con progetti realizzati nell'ambito della gestione dei Big Data è aumentato del 125%;
Le previsioni di mercato per i prossimi anni sono le seguenti:
  • nel 2015 il volume di mercato raggiungerà i 38,4 miliardi di dollari, nel 2020 i 68,7 miliardi di dollari;
  • il tasso di crescita medio sarà del 16% annuo;
  • la spesa media dell'azienda sulle tecnologie Big Data ammonterà a 13,8 milioni di dollari per le grandi aziende e 1,6 milioni di dollari per le piccole e medie imprese;
  • le tecnologie saranno prevalenti nelle aree del servizio clienti e del marketing puntuale;
  • nel 2017 la struttura del mercato globale cambierà verso una predominanza di aziende utilizzatrici provenienti da paesi in via di sviluppo.
mercato russo
Il mercato russo dei Big Data è in fase di formazione, i risultati del 2014 sono i seguenti:
  • la dimensione del mercato ha raggiunto i 340 milioni di dollari;
  • il tasso medio di crescita del mercato negli anni precedenti è stato del 50% annuo;
  • la quantità totale di informazioni accumulate era di 155 exabyte;
  • Il 10% delle aziende russe ha iniziato a utilizzare le tecnologie Big Data;
  • Le tecnologie Big Data erano più popolari nelle aziende bancarie, delle telecomunicazioni, di Internet e della vendita al dettaglio.
Le previsioni per il mercato russo per i prossimi anni sono le seguenti:
  • il volume del mercato russo nel 2015 raggiungerà i 500 milioni di dollari e nel 2018 - 1,7 miliardi di dollari;
  • la quota del mercato russo nel mondo sarà di circa il 3% nel 2018;
  • la quantità di dati accumulati nel 2020 sarà di 980 exabyte;
  • il volume dei dati crescerà fino al 2,2% del volume globale dei dati nel 2020;
  • le tecnologie più popolari saranno la visualizzazione dei dati, l'analisi dei file multimediali e l'Internet of Things.
Sulla base dei risultati dell'analisi, si può concludere che il mercato dei Big Data è ancora nelle prime fasi di sviluppo e nel prossimo futuro osserveremo la sua crescita e l'espansione delle capacità di queste tecnologie.

Grazie per aver dedicato del tempo a leggere questo voluminoso lavoro, iscriviti al nostro blog - promettiamo molte nuove pubblicazioni interessanti!

Moscow_Exchange 6 maggio 2015 alle 20:38

Revisione analitica del mercato dei Big Data

  • Blog della società di cambio di Mosca,
  • Grandi dati

"Grandi dati"- un argomento che viene discusso attivamente dalle aziende tecnologiche. Alcuni di loro sono riusciti a rimanere delusi dai big data, altri - al contrario, sfruttarli al meglio per il business ... Una nuova revisione analitica del mercato dei Big Data nazionale e globale, preparata dalla Borsa di Mosca in collaborazione con gli analisti di IPOboard , mostra quali tendenze sono più rilevanti ora sul mercato ... Ci auguriamo che le informazioni siano interessanti e utili.

COSA SONO I BIG DATA?

Caratteristiche principali
I Big Data, oggi, sono uno dei driver chiave dello sviluppo delle tecnologie dell'informazione. Questa direzione, relativamente nuova per gli affari russi, si è diffusa nei paesi occidentali. Ciò è dovuto al fatto che nell'era della tecnologia dell'informazione, soprattutto dopo il boom dei social network, ha iniziato ad accumularsi una quantità significativa di informazioni per ciascun utente di Internet, che alla fine ha dato lo sviluppo della direzione dei Big Data.

Il termine "Big Data" causa molte polemiche, molti credono che significhi solo la quantità di informazioni accumulate, ma non dimenticare il lato tecnico, quest'area include tecnologie di archiviazione, elaborazione e servizi.

Si precisa che quest'area comprende il trattamento di una grande quantità di informazioni, difficilmente processabili con i metodi tradizionali*.

Di seguito una tabella comparativa tra database tradizionali e Big Data.

La sfera dei Big Data è caratterizzata dalle seguenti caratteristiche:
Volume - il volume del database accumulato è una grande quantità di informazioni che è laboriosa da elaborare e archiviare in modi tradizionali, richiedono un nuovo approccio e strumenti migliorati.
Velocità - velocità, questo segno indica sia la crescente velocità di accumulo dei dati (il 90% delle informazioni è stato raccolto negli ultimi 2 anni), sia la velocità di elaborazione dei dati, recentemente le tecnologie di elaborazione dei dati in tempo reale sono diventate più richieste.
Varietà - diversità, cioè la possibilità di elaborazione simultanea di informazioni multiformato strutturate e non strutturate. La principale differenza tra le informazioni strutturate è che possono essere classificate. Un esempio di tali informazioni sono le informazioni sulle transazioni del cliente.
Le informazioni non strutturate includono video, file audio, testo libero, informazioni provenienti dai social network. Oggi l'80% delle informazioni è compreso nel gruppo non strutturato. Queste informazioni necessitano di un'analisi complessa per renderle utili per ulteriori elaborazioni.
veridicità - affidabilità dei dati, gli utenti hanno iniziato ad attribuire un'importanza crescente all'affidabilità dei dati disponibili. Ad esempio, le aziende Internet hanno il problema di separare le azioni eseguite da un robot e una persona sul sito Web dell'azienda, il che alla fine porta alla difficoltà dell'analisi dei dati.
Valore - il valore delle informazioni accumulate. I Big Data dovrebbero essere utili all'azienda e apportarvi un valore. Ad esempio, aiuto nel miglioramento dei processi aziendali, nel reporting o nell'ottimizzazione dei costi.

Se le 5 condizioni precedenti sono soddisfatte, i volumi di dati accumulati possono essere classificati come grandi.

Aree di applicazione dei Big Data

La sfera dell'utilizzo delle tecnologie Big Data è vasta. Quindi, con l'aiuto dei Big Data, puoi scoprire le preferenze dei clienti, l'efficacia delle campagne di marketing o condurre un'analisi dei rischi. Di seguito i risultati di un'indagine dell'IBM Institute sull'utilizzo dei Big Data nelle aziende.

Come puoi vedere dal diagramma, la maggior parte delle aziende utilizza i Big Data nel campo del servizio clienti, la seconda area più popolare è l'efficienza operativa, nel campo della gestione del rischio i Big Data sono meno comuni al momento.

Va anche notato che i Big Data sono una delle aree della tecnologia dell'informazione in più rapida crescita, secondo le statistiche, la quantità totale di dati ricevuti e archiviati raddoppia ogni 1,2 anni.
Tra il 2012 e il 2014 la quantità di dati trasferiti mensilmente dalle reti mobili è cresciuta dell'81%. Secondo le stime Cisco, nel 2014 il volume di traffico mobile era di 2,5 exabyte (unità di misura per la quantità di informazioni pari a 10^18 standard byte) al mese, e già nel 2019 sarà pari a 24,3 exabyte.
Pertanto, i Big Data sono già un'area consolidata della tecnologia, nonostante la sua età relativamente giovane, che si è diffusa in molte aree di business e svolge un ruolo importante nello sviluppo delle aziende.

Tecnologie per i Big Data
Le tecnologie utilizzate per raccogliere ed elaborare i Big Data possono essere suddivise in 3 gruppi:
  • Software;
  • Attrezzatura;
  • Servizi di servizio.

Gli approcci più comuni per l'elaborazione dei dati (software) includono:
SQL - un linguaggio di query strutturato che consente di lavorare con i database. Con l'aiuto di SQL, è possibile creare e modificare i dati e il sistema di gestione del database corrispondente si occupa della gestione del set di dati.
NoSQL - il termine sta per Not Only SQL (non solo SQL). Comprende una serie di approcci volti all'implementazione di un database che differiscono dai modelli utilizzati nei DBMS relazionali tradizionali. Sono convenienti da usare quando la struttura dei dati è in continua evoluzione. Ad esempio, per raccogliere e archiviare informazioni sui social network.
Riduci mappa - modello di distribuzione computazionale. Utilizzato per il calcolo parallelo su set di dati molto grandi (petabyte * o più). Nell'interfaccia di programmazione, non vengono trasferiti dati al programma per l'elaborazione, ma il programma viene trasferito ai dati. Pertanto, la richiesta è un programma separato. Il principio di funzionamento consiste nell'elaborazione sequenziale dei dati mediante due metodi Map e Reduce. La mappa recupera i dati preliminari, Riduci li aggrega.
Hadoop - viene utilizzato per implementare meccanismi di ricerca e contestuali di siti ad alto carico - Facebook, eBay, Amazon, ecc. Una caratteristica distintiva è che il sistema è protetto dai guasti di uno qualsiasi dei nodi del cluster, poiché ogni blocco ha almeno una copia di i dati sull'altro nodo.
SAP HANA È una piattaforma NewSQL ad alte prestazioni per l'archiviazione e l'elaborazione dei dati. Fornisce un'elevata velocità di elaborazione delle richieste. Un'altra caratteristica distintiva è che SAP HANA semplifica il panorama del sistema riducendo i costi di supporto dei sistemi analitici.

La dotazione tecnologica comprende:

  • server;
  • attrezzatura infrastrutturale.
I server includono archivi di dati.
Le apparecchiature dell'infrastruttura includono acceleratori di piattaforme, gruppi di continuità, kit di console per server, ecc.

Servizi di servizio.
I servizi includono servizi per costruire l'architettura del sistema di database, organizzare e ottimizzare l'infrastruttura e garantire la sicurezza dell'archiviazione dei dati.

Software, hardware e servizi insieme formano complesse piattaforme per l'archiviazione e l'analisi dei dati. Aziende come Microsoft, HP, EMC offrono servizi per lo sviluppo, l'implementazione e la gestione di soluzioni Big Data.

Applicazione nelle industrie
I Big Data si sono diffusi in molti settori. Sono utilizzati in sanità, telecomunicazioni, commercio, logistica, società finanziarie e governo.
Di seguito sono riportati alcuni esempi di applicazioni Big Data in alcuni dei settori.

Vedere al dettaglio
Nei database dei negozi al dettaglio, è possibile accumulare molte informazioni sui clienti, sul sistema di gestione dell'inventario e sulla fornitura di prodotti commerciabili. Queste informazioni possono essere utili in tutte le aree dei negozi.

Quindi, con l'aiuto delle informazioni accumulate, puoi gestire la fornitura di merci, il loro stoccaggio e vendita. Sulla base delle informazioni accumulate, è possibile prevedere la domanda e l'offerta di beni. Inoltre, il sistema di elaborazione e analisi dei dati può risolvere altri problemi del rivenditore, ad esempio per ottimizzare i costi o preparare report.

Servizi finanziari
I Big Data consentono di analizzare il merito creditizio di un mutuatario, ed è utile anche per il credit scoring* e underwriting**. L'introduzione delle tecnologie Big Data ridurrà i tempi per l'esame delle domande di prestito. Con l'aiuto dei Big Data, puoi analizzare le transazioni di un cliente specifico e offrire servizi bancari adatti a lui.

Telecom
Nel settore delle telecomunicazioni, i Big Data sono ampiamente utilizzati dagli operatori mobili.
Gli operatori mobili, insieme agli istituti finanziari, dispongono di una delle banche dati più voluminose, che consente loro di effettuare l'analisi più approfondita delle informazioni accumulate.
L'obiettivo principale dell'analisi dei dati è fidelizzare i clienti esistenti e attirarne di nuovi. Per fare ciò, le aziende segmentano i clienti, analizzano il loro traffico e determinano l'affiliazione sociale dell'abbonato.

Oltre a utilizzare i Big Data per scopi di marketing, vengono utilizzate tecnologie per prevenire transazioni finanziarie fraudolente.

Industria mineraria e petrolifera
I Big Data vengono utilizzati sia nell'estrazione che nell'elaborazione e nel marketing. Sulla base delle informazioni ricevute, le imprese possono trarre conclusioni sull'efficacia dello sviluppo sul campo, tenere traccia del programma delle revisioni e delle condizioni delle attrezzature, prevedere la domanda di prodotti e prezzi.

Secondo un sondaggio di Tech Pro Research, i Big Data sono più diffusi nel settore delle telecomunicazioni, nonché nelle imprese ingegneristiche, IT, finanziarie e governative. Secondo i risultati di questo sondaggio, i Big Data sono meno popolari nell'istruzione e nella sanità. I risultati del sondaggio sono presentati di seguito:

Esempi di utilizzo dei Big Data nelle aziende
Oggi i Big Data vengono attivamente implementati in società estere. Aziende come Nasdaq, Facebook, Google, IBM, VISA, Master Card, Bank of America, HSBC, AT&T, Coca Cola, Starbucks e Netflix stanno già utilizzando i Big Data.

I campi di applicazione delle informazioni trattate sono molteplici e variano a seconda del settore e delle mansioni da svolgere.
Verranno presentati ulteriori esempi di applicazione pratica delle tecnologie Big Data.

HSBC utilizza le tecnologie Big Data per combattere le transazioni fraudolente con carte di plastica. Con l'aiuto dei Big Data, l'azienda ha aumentato l'efficienza del servizio di sicurezza 3 volte e il rilevamento di incidenti fraudolenti - 10 volte. L'effetto economico dell'introduzione di queste tecnologie ha superato i 10 milioni di dollari.

Anti frode * VISA consente di calcolare automaticamente le transazioni fraudolente, il sistema attualmente aiuta a prevenire pagamenti fraudolenti per un importo di 2 miliardi di dollari all'anno.

Supercomputer Watson Company IBM analizza il flusso di dati sulle transazioni monetarie in tempo reale. Secondo IBM, Watson ha aumentato del 15% il numero di transazioni fraudolente rilevate, ridotto del 50% i falsi positivi e aumentato del 60% la quantità di fondi protetti da tali transazioni.

Procter & Gamble con l'aiuto dei Big Data, progettano nuovi prodotti e compongono campagne di marketing globali. P&G ha istituito uffici dedicati alle Business Spheres dove le informazioni possono essere visualizzate in tempo reale.
Pertanto, la direzione dell'azienda è stata in grado di testare istantaneamente ipotesi e condurre esperimenti. P&G crede che i Big Data aiutino a prevedere le prestazioni dell'azienda.

Rivenditore di forniture per ufficio OfficeMax utilizzando le tecnologie Big Data, analizzano il comportamento dei clienti. L'analisi dei Big Data ci ha permesso di aumentare le entrate B2B del 13% e di ridurre i costi di 400.000 USD all'anno.

A parere bruco , i suoi distributori perdono da $ 9 a $ 18 miliardi all'anno di profitti solo perché non implementano le tecnologie Big Data. I Big Data consentirebbero ai clienti di gestire in modo più efficiente la propria flotta di auto analizzando le informazioni provenienti dai sensori installati sulle auto.

Già oggi è possibile analizzare lo stato dei componenti chiave, il loro grado di usura, gestire i costi di carburante e di manutenzione.

Gruppo Luxottica è un produttore di occhiali sportivi come Ray-Ban, Persol e Oakley. L'azienda utilizza le tecnologie Big Data per analizzare il comportamento dei potenziali clienti e il marketing SMS "intelligente". Di conseguenza, il gruppo Big Data Luxottica ha assegnato più di 100 milioni di clienti di maggior valore e ha aumentato l'efficacia della campagna di marketing del 10%.

Con l'aiuto di Yandex Data Factory, sviluppatori di giochi Mondo dei carri armati analizzare il comportamento dei giocatori. Le tecnologie Big Data hanno permesso di analizzare il comportamento di 100mila giocatori di World of Tanks utilizzando più di 100 parametri (informazioni su acquisti, giochi, esperienza, ecc.). Come risultato dell'analisi, è stata ottenuta una previsione del tasso di abbandono degli utenti. Queste informazioni aiutano a ridurre l'abbandono degli utenti e a lavorare con i partecipanti al gioco in modo mirato. Il modello sviluppato si è rivelato più efficiente del 20-30% rispetto agli strumenti standard per l'analisi dell'industria dei giochi.

Ministero del Lavoro tedesco utilizza i Big Data nelle sue attività relative all'analisi delle domande in entrata per l'emissione di sussidi di disoccupazione. Quindi, dopo aver analizzato le informazioni, è apparso chiaro che il 20% dei benefici è stato pagato immeritatamente. Con l'aiuto dei Big Data, il Ministero del Lavoro ha tagliato i costi di 10 miliardi di euro.

Ospedale pediatrico Toronto ha realizzato il progetto Progetto Artemis. È un sistema informativo che raccoglie e analizza i dati sui neonati in tempo reale. Il sistema monitora ogni secondo 1260 indicatori dello stato di ogni bambino. Il progetto Artemis consente di prevedere lo stato instabile di un bambino e avviare la prevenzione delle malattie nei bambini.

PANORAMICA DEL MERCATO GLOBALE DEI BIG DATA

Stato attuale del mercato mondiale
Nel 2014 i Big Data, secondo Data Collective, sono diventati una delle aree prioritarie di investimento nel settore del venture capital. Secondo il portale di informazione Computerra, ciò è dovuto al fatto che gli sviluppi in questo settore hanno iniziato a portare risultati significativi per i loro utenti. Nell'ultimo anno, il numero di aziende con progetti implementati nel campo della gestione dei big data è aumentato del 125%, il volume di mercato è cresciuto del 45% rispetto al 2013.

La maggior parte delle entrate del mercato dei Big Data, secondo Wikibon, nel 2014 era costituita da servizi, la loro quota era pari al 40% delle entrate totali (si veda lo schema sotto):

Se consideriamo i Big Data per il 2014 per sottotipi, il mercato sarà simile a questo:

Secondo Wikibon, le applicazioni e le analisi rappresentano il 36% delle entrate dei Big Data nel 2014 provengono da applicazioni e analisi di Big Data, il 17% dalle apparecchiature informatiche e il 15% dalle tecnologie di archiviazione dei dati. Meno di tutti i ricavi sono stati generati dalle tecnologie NoSQL, dalle apparecchiature infrastrutturali e dalla fornitura di una rete di aziende (reti aziendali).

Le più popolari sono le tecnologie Big Data come le piattaforme in-memory di SAP, HANA, Oracle, ecc. I risultati dell'indagine T-Systems hanno mostrato che sono state scelte dal 30% delle aziende intervistate. Le seconde più popolari erano le piattaforme NoSQL (18% degli utenti), le aziende utilizzavano anche piattaforme analitiche di Splunk e Dell, scelte dal 15% delle aziende. I meno utili per risolvere i problemi dei Big Data, secondo i risultati del sondaggio, erano i prodotti Hadoop/MapReduce.

Secondo un sondaggio di Accenture, oltre il 50% delle aziende che utilizzano tecnologie Big Data spende dal 21% al 30% in Big Data.
Secondo la seguente analisi di Accenture, il 76% delle aziende ritiene che queste spese aumenteranno nel 2015 e il 24% delle aziende non modificherà il proprio budget per le tecnologie Big Data. Ciò suggerisce che in queste aziende i Big Data sono già diventati una direzione consolidata dell'IT, che è diventata parte integrante dello sviluppo dell'azienda.

I risultati dell'indagine dell'Economist Intelligence Unit confermano l'effetto positivo dell'implementazione dei Big Data. Il 46% delle aziende afferma di aver migliorato il servizio clienti di oltre il 10% utilizzando le tecnologie Big Data, il 33% delle aziende ha ottimizzato l'inventario e migliorato la produttività delle immobilizzazioni, il 32% delle aziende ha migliorato i processi di pianificazione.

Big data nel mondo
Oggi le tecnologie Big Data sono più spesso implementate nelle aziende statunitensi, ma anche ora altri paesi del mondo hanno iniziato a mostrare interesse. Nel 2014, secondo IDC, i paesi di Europa, Medio Oriente, Asia (escluso il Giappone) e Africa hanno rappresentato il 45% del mercato di software, servizi e apparecchiature nel campo dei Big Data.

Inoltre, secondo un sondaggio CIO, le aziende della regione Asia-Pacifico stanno rapidamente adottando nuove soluzioni nel campo dell'analisi dei Big Data, dell'archiviazione sicura e delle tecnologie cloud. L'America Latina è al secondo posto per ammontare di investimenti nello sviluppo delle tecnologie Big Data, davanti ai paesi dell'Europa e degli Stati Uniti.
Successivamente, verrà presentata una descrizione e previsioni dello sviluppo del mercato dei Big Data in diversi paesi.

Cina
Il volume delle informazioni in Cina è di 909 exabyte, pari al 10% della quantità totale di informazioni nel mondo, entro il 2020 la quantità di informazioni raggiungerà gli 8060 exabyte e aumenterà anche la quota di informazioni nelle statistiche globali, in 5 anni sarà del 18%. La crescita potenziale dei Big Data cinesi ha una delle dinamiche in più rapida crescita.

Brasile
Alla fine del 2014, il Brasile ha accumulato 212 exabyte di informazioni, ovvero il 3% del volume globale. Entro il 2020, il volume delle informazioni aumenterà fino a 1.600 exabyte, ovvero il 4% delle informazioni mondiali.

India
Secondo EMC, il volume di dati accumulati in India alla fine del 2014 è di 326 exabyte, ovvero il 5% del volume totale di informazioni. Entro il 2020, il volume delle informazioni aumenterà fino a 2.800 exabyte, ovvero il 6% delle informazioni in tutto il mondo.

Giappone
La quantità di dati accumulati in Giappone alla fine del 2014 è di 495 exabyte, ovvero l'8% della quantità totale di informazioni. Entro il 2020, il volume di informazioni aumenterà fino a 2.200 exabyte, ma la quota di mercato del Giappone diminuirà al 5% del volume totale di informazioni di tutto il mondo.
Pertanto, le dimensioni del mercato giapponese diminuiranno di oltre il 30%.

Germania
Secondo EMC, il volume di dati accumulati in Germania alla fine del 2014 è di 230 exabyte, ovvero il 4% del volume totale di informazioni nel mondo. Entro il 2020, il volume delle informazioni aumenterà fino a 1.100 exabyte, ovvero il 2%.
Nel mercato tedesco, una grande quota di fatturato, secondo le previsioni del Gruppo Experton, sarà generata dal segmento dei servizi, la cui quota nel 2015 sarà pari al 54%, e nel 2019 aumenterà al 59% la quota di software e hardware, al contrario, diminuirà.

Complessivamente il mercato passerà da 1,345 miliardi di euro nel 2015 a 3,198 miliardi di euro nel 2019, con un tasso di crescita medio del 24%.
Pertanto, sulla base dell'analisi di CIO ed EMC, si può concludere che i paesi in via di sviluppo del mondo nei prossimi anni diventeranno mercati per lo sviluppo attivo delle tecnologie Big Data.

Principali tendenze di mercato
Secondo IDG Enterprise, nel 2015 la spesa delle aziende sui Big Data sarà in media di 7,4 milioni di dollari per azienda, le grandi aziende intendono spendere circa 13,8 milioni di dollari, le piccole e medie imprese 1,6 milioni di dollari. ...
La maggior parte sarà investita in aree quali l'analisi e la visualizzazione dei dati e la raccolta dei dati.
In linea con le tendenze attuali e la domanda del mercato, gli investimenti del 2015 saranno utilizzati per migliorare la qualità dei dati, migliorare la pianificazione e le previsioni e aumentare la velocità di elaborazione dei dati.
Le aziende del settore finanziario, secondo Insights Analysis di Bain Company, effettueranno investimenti significativi, quindi nel 2015 si prevede di spendere 6,4 miliardi di dollari in tecnologie Big Data, il tasso di crescita medio degli investimenti sarà del 22% fino al 2020. Le società Internet prevedono di spendere 2,8 miliardi di dollari, con un tasso di crescita medio del 26% per la spesa per i Big Data.
Nel condurre un'indagine dell'indagine dell'Economist Intelligence Unit, sono state individuate le direzioni prioritarie per lo sviluppo dei Big Data nel 2014 e nei prossimi 3 anni, la distribuzione delle risposte è la seguente:

Secondo le previsioni di IDC, le tendenze del mercato sono le seguenti:

  • Nei prossimi 5 anni, il costo delle soluzioni cloud nel campo delle tecnologie Big Data crescerà 3 volte più velocemente del costo delle soluzioni on-premise. Saranno richieste piattaforme di storage ibride.
  • La crescita delle applicazioni che utilizzano analisi complesse e predittive, compreso l'apprendimento automatico, accelererà nel 2015, il mercato di tali applicazioni crescerà del 65% più velocemente rispetto alle applicazioni che non utilizzano l'analisi predittiva.
  • L'analisi dei media triplicherà nel 2015 e diventerà un fattore chiave di crescita per il mercato della tecnologia Big Data.
  • La tendenza accelererà per implementare soluzioni per analizzare il flusso continuo di informazioni applicabile all'Internet of Things.
  • Entro il 2018, il 50% degli utenti interagirà con i servizi di cognitive computing.
Driver di mercato e limitatori
Gli esperti di IDC hanno identificato 3 driver del mercato dei Big Data nel 2015:

Secondo un sondaggio di Accenture, i problemi di sicurezza dei dati sono ora il principale ostacolo all'implementazione delle tecnologie Big Data, con oltre il 51% degli intervistati che ha confermato di essere preoccupato per garantire la protezione e la riservatezza dei dati. Il 47% delle aziende ha segnalato l'impossibilità di implementare Big Data a causa di un budget limitato, il 41% delle aziende ha indicato come un problema la mancanza di personale qualificato.

Wikibon prevede che la dimensione del mercato dei Big Data crescerà fino a $ 38,4 miliardi nel 2015 e aumenterà del 36% rispetto all'anno precedente. Nei prossimi anni si assisterà a un calo dei tassi di crescita fino al 10% nel 2017. Sulla base di queste previsioni, la dimensione del mercato nel 2020 sarà pari a 68,7 miliardi di dollari.

La distribuzione del mercato globale dei Big Data per categoria di attività sarà simile alla seguente:

Come puoi vedere dal diagramma, la maggior parte del mercato sarà occupata da tecnologie nel campo del miglioramento del servizio clienti. Il point marketing sarà al secondo posto in termini di priorità tra le aziende fino al 2019, nel 2020, secondo le previsioni di Heavy Reading, lascerà il posto a soluzioni per migliorare l'efficienza operativa.
Anche il segmento “miglioramento del servizio clienti” avrà il tasso di crescita più elevato, con un incremento del 49% annuo.
La previsione di mercato per i sottotipi di Big Data sarà simile a questa:

La quota di mercato predominante, come si vede dal grafico, è occupata dai servizi professionali, il tasso di crescita più alto sarà nelle applicazioni con analytics, la loro quota passerà dall'attuale 12% al 18% nel 2020, e il volume di questo segmento sarà pari a 12,3 miliardi di dollari, la quota delle apparecchiature informatiche, invece, scenderà dal 20% al 14% e ammonterà a circa 9,3 miliardi di dollari nel 2020, il mercato delle tecnologie cloud aumenterà gradualmente e nel 2020 raggiungerà i 6,3 miliardi di dollari USA, la quota di mercato delle soluzioni per l'archiviazione dei dati, invece, scenderà dal 15% del 2014 al 13% del 2020 e in termini monetari sarà pari a 8,9 miliardi di dollari.
Secondo le previsioni di Insights Analysis di Bain & Company, la distribuzione del mercato Big Data per settore nel 2020 sarà simile a questa:

  • L'industria finanziaria spenderà 6,4 miliardi di dollari in Big Data con un tasso di crescita medio del 22% all'anno;
  • Le società Internet spenderanno $ 2,8 miliardi e un tasso di crescita medio dei costi del 26% nei prossimi 5 anni;
  • I costi del settore pubblico saranno commisurati ai costi delle società Internet, ma il tasso di crescita sarà inferiore - 22%;
  • Il settore delle telecomunicazioni crescerà a un tasso medio di crescita del 40% per raggiungere 1,2 miliardi di dollari nel 2020;

Le utility investiranno una quantità relativamente piccola di 800 milioni di dollari USA in queste tecnologie, ma il tasso di crescita sarà uno dei più alti al 54% annuo.
Pertanto, una grande fetta del mercato dei Big Data nel 2020 sarà occupata da aziende del settore finanziario e il settore in più rapida crescita sarà l'energia.
Secondo le previsioni degli analisti, il volume totale del mercato aumenterà nei prossimi anni. La crescita del mercato sarà assicurata dall'introduzione delle tecnologie Big Data nei paesi in via di sviluppo del mondo, come si può vedere dal grafico sottostante.

La dimensione del mercato prevista dipenderà da come i paesi in via di sviluppo percepiscono le tecnologie Big Data, dal fatto che siano così popolari come nei paesi sviluppati. Nel 2014, i paesi in via di sviluppo del mondo hanno rappresentato il 40% delle informazioni accumulate. EMC prevede che l'attuale struttura del mercato, dominata dai paesi sviluppati, cambierà nel 2017. Secondo gli analisti EMC, nel 2020 la quota dei paesi in via di sviluppo supererà il 60%.
Secondo Cisco ed EMC, i paesi in via di sviluppo del mondo saranno piuttosto attivi nel lavorare con i Big Data, in gran parte grazie alla disponibilità di tecnologie e all'accumulo di una quantità di informazioni sufficiente al livello dei Big Data. La mappa del mondo nella pagina successiva mostrerà la previsione per l'aumento del volume e il tasso di crescita dei Big Data per regione.

ANALISI DEL MERCATO RUSSO

Stato attuale del mercato russo

Secondo uno studio di CNews Analytics e Oracle, il livello di maturità del mercato russo dei Big Data è aumentato nell'ultimo anno. Gli intervistati di 108 grandi imprese in un'ampia gamma di settori hanno mostrato un grado più elevato di consapevolezza di queste tecnologie, nonché una comprensione consolidata del potenziale di tali soluzioni per la loro attività.
A partire dal 2014, secondo IDC, in Russia sono stati accumulati 155 exabyte di informazioni, ovvero solo l'1,8% dei dati mondiali. Il volume delle informazioni entro il 2020 raggiungerà i 980 exabyte e impiegherà il 2,2%. Pertanto, il tasso di crescita medio del volume di informazioni sarà del 36% all'anno.
IDC stima il mercato russo a $ 340 milioni, di cui $ 100 milioni sono soluzioni SAP, circa $ 240 milioni sono soluzioni simili di Oracle, IBM, SAS, Microsoft, ecc.
Il tasso di crescita del mercato russo dei Big Data non è inferiore al 50% annuo.
Si prevede che le dinamiche positive continueranno in questo settore del mercato IT russo, anche in un contesto di generale stagnazione dell'economia. Ciò è dovuto al fatto che le aziende richiedono ancora soluzioni che migliorino l'efficienza operativa, ottimizzino i costi, migliorino l'accuratezza delle previsioni e minimizzino i possibili rischi aziendali.
I principali fornitori di servizi Big Data nel mercato russo sono:
  • Oracolo
  • Microsoft
  • Cloudera
  • Hortonworks
  • Teradata.
Panoramica del mercato per settore ed esperienza nell'uso dei Big Data nelle aziende
Secondo CNews, in Russia solo il 10% delle aziende ha iniziato a utilizzare le tecnologie Big Data, quando la quota di tali aziende nel mondo è di circa il 30%. La disponibilità per i progetti Big Data sta crescendo in molti settori dell'economia russa, secondo il rapporto di CNews Analytics e Oracle. Più di un terzo delle aziende intervistate (37%) ha iniziato a lavorare con le tecnologie Big Data, di cui il 20% sta già utilizzando tali soluzioni e il 17% sta iniziando a sperimentarle. Un secondo terzo degli intervistati sta attualmente valutando questa possibilità.

In Russia, le tecnologie Big Data sono più popolari nel settore bancario e delle telecomunicazioni, ma sono richieste anche nel settore minerario, energetico, al dettaglio, nelle società di logistica e nel settore pubblico.
Di seguito prenderemo in considerazione esempi di applicazione dei Big Data nelle realtà russe.

Telecom
Gli operatori di telecomunicazioni dispongono di una delle banche dati più voluminose, che consente loro di effettuare l'analisi più approfondita delle informazioni accumulate.
Una delle aree di applicazione della tecnologia Big Data è la gestione della fedeltà degli abbonati.
L'obiettivo principale dell'analisi dei dati è fidelizzare i clienti esistenti e attirarne di nuovi. Per fare ciò, le aziende segmentano i clienti, analizzano il loro traffico e determinano l'affiliazione sociale dell'abbonato. Oltre a utilizzare le informazioni per scopi di marketing, le tecnologie di telecomunicazione vengono utilizzate per prevenire transazioni finanziarie fraudolente.
VimpelCom è uno degli esempi eclatanti di questo settore. L'azienda utilizza i Big Data per migliorare la qualità del servizio a livello di ciascun abbonato, preparare report, analizzare i dati per lo sviluppo della rete, combattere lo spam e personalizzare i servizi.

Banche
Una percentuale significativa degli utenti di Big Data sono specialisti del settore finanziario. Uno degli esperimenti di successo è stato condotto presso la Banca degli Urali per la ricostruzione e lo sviluppo, dove la base di informazioni è stata utilizzata per analizzare i clienti, la banca ha iniziato a offrire offerte di prestito specializzate, depositi e altri servizi. Durante l'anno di utilizzo di queste tecnologie, il portafoglio di prestiti al dettaglio della società è cresciuto del 55%.
Alfa-Bank analizza le informazioni dai social network, elabora le domande di prestito e analizza il comportamento degli utenti del sito Web dell'azienda.
Sberbank ha anche iniziato a elaborare un'enorme quantità di dati per segmentare i clienti, prevenire attività fraudolente, effettuare vendite incrociate e gestire il rischio. In futuro, si prevede di migliorare il servizio e analizzare le azioni dei clienti in tempo reale.
La Banca di sviluppo regionale panrussa analizza il comportamento dei titolari di carte di plastica. Ciò consente di identificare transazioni atipiche per un particolare cliente, aumentando così la probabilità di rilevare il furto di fondi dalle carte di plastica.

Vedere al dettaglio
In Russia, le tecnologie Big Data sono state implementate da società di trading sia online che offline. Oggi, secondo CNews Analytics, i Big Data sono utilizzati dal 20% dei rivenditori. Il 75% dei rivenditori ritiene che i Big Data siano essenziali per sviluppare una strategia di marketing competitiva. Secondo le statistiche Hadoop, dopo l'implementazione della tecnologia Big Data, i profitti nelle organizzazioni commerciali crescono del 7-10%.
Gli specialisti di M.Video parlano del miglioramento della pianificazione logistica dopo l'implementazione di SAP HANA e, a seguito della sua implementazione, la preparazione dei report annuali è stata ridotta da 10 giorni a 3, la velocità di download dei dati giornalieri è diminuita da 3 ore a 30 minuti.
Wikimart utilizza queste tecnologie per generare raccomandazioni per i visitatori del sito web.
Uno dei primi negozi offline a introdurre l'analisi dei Big Data in Russia è stato Lenta. Con l'aiuto dei Big Data, la vendita al dettaglio ha iniziato a studiare le informazioni sui clienti dalle ricevute delle casse. Il rivenditore raccoglie informazioni per generare modelli comportamentali, che gli consentono di prendere decisioni più informate a livello operativo e aziendale.

Industria petrolifera e del gas
In questo settore, il campo di applicazione dei Big Data è piuttosto ampio. Le tecnologie Big Data possono essere applicate nell'estrazione di minerali dal sottosuolo. Con il loro aiuto, puoi analizzare il processo di produzione stesso e i modi più efficaci per estrarlo, monitorare il processo di perforazione, analizzare la qualità delle materie prime, nonché la lavorazione e la commercializzazione del prodotto finale. In Russia, Transneft e Rosneft hanno già iniziato a utilizzare queste tecnologie.

organi statali
Paesi come Germania, Australia, Spagna, Giappone, Brasile e Pakistan utilizzano le tecnologie Big Data per affrontare le questioni nazionali. Queste tecnologie aiutano gli enti governativi a fornire più efficacemente servizi alla popolazione, fornendo un supporto sociale mirato.
In Russia, queste tecnologie hanno iniziato a essere padroneggiate da organismi statali come il Fondo pensione, il Servizio fiscale federale e il Fondo di assicurazione sanitaria obbligatorio. Il potenziale per l'implementazione di progetti che utilizzano i Big Data è ampio, queste tecnologie potrebbero aiutare a migliorare la qualità dei servizi e, di conseguenza, il tenore di vita della popolazione.

Logistica e trasporti
I Big Data possono essere utilizzati anche dalle aziende di trasporto. Con l'ausilio delle tecnologie Big Data è possibile tracciare il parcheggio, tenere conto dei costi del carburante e monitorare le richieste dei clienti.
Le ferrovie russe hanno implementato le tecnologie Big Data insieme a SAP. Queste tecnologie hanno contribuito a ridurre il periodo di rendicontazione di 43,5 volte (da 14,5 ore a 20 minuti) ea migliorare di 40 volte l'accuratezza dell'allocazione dei costi. Inoltre, i Big Data sono stati introdotti nei processi di pianificazione e regolazione tariffaria. In totale, le aziende utilizzano più di 300 sistemi basati su soluzioni SAP, sono coinvolti 4 data center e il numero di utenti è di 220.000.

Principali driver e vincoli di mercato
I driver per lo sviluppo delle tecnologie Big Data nel mercato russo sono:
  • Maggiore interesse da parte degli utenti alle possibilità dei Big Data come mezzo per aumentare la competitività dell'azienda;
  • Sviluppo di metodi per l'elaborazione di file multimediali a livello globale;
  • Trasferimento di server che elaborano informazioni personali nel territorio della Russia, in conformità con la legge adottata sulla conservazione e il trattamento dei dati personali;
  • Attuazione del piano settoriale per la sostituzione delle importazioni di software. Questo piano include il sostegno statale per i produttori di software nazionali, nonché la fornitura di preferenze per i prodotti IT nazionali quando si effettuano acquisti a spese pubbliche.
  • Nella nuova situazione economica, quando il tasso del dollaro sarà quasi raddoppiato, si assisterà a una tendenza verso un uso sempre maggiore dei servizi dei fornitori di cloud russi rispetto a quelli stranieri.
  • Creazione di tecnoparchi che contribuiscono allo sviluppo del mercato delle tecnologie dell'informazione, compreso il mercato dei Big Data;
  • Programma statale per l'implementazione di sistemi grid, che si basano su tecnologie Big Data.

I principali ostacoli allo sviluppo dei Big Data nel mercato russo sono:

  • Garantire la sicurezza e la riservatezza dei dati;
  • Mancanza di personale qualificato;
  • Mancanza di risorse informative accumulate al livello dei Big Data nella maggior parte delle aziende russe;
  • Difficoltà nell'introduzione di nuove tecnologie nei sistemi informativi consolidati delle aziende;
  • L'alto costo delle tecnologie Big Data, che porta a un numero limitato di imprese in grado di implementare queste tecnologie;
  • Incertezza politica ed economica che ha portato al deflusso di capitali e al congelamento dei progetti di investimento in Russia;
  • L'aumento dei prezzi dei prodotti importati e l'impennata dell'inflazione, secondo IDC, rallentano lo sviluppo dell'intero mercato IT.
Previsioni del mercato russo
Ad oggi, il mercato russo dei Big Data non è così popolare come nei paesi sviluppati. La maggior parte delle aziende russe mostra interesse, ma non osano sfruttare le loro opportunità.
Esempi di grandi aziende che hanno già beneficiato delle tecnologie Big Data stanno aumentando la consapevolezza del potere di queste tecnologie.
Gli analisti sono anche abbastanza ottimisti sul mercato russo. IDC ritiene che la quota di mercato russo aumenterà nei prossimi 5 anni, in contrasto con il mercato in Germania e Giappone.
Entro il 2020, il volume dei Big Data in Russia passerà dall'attuale 1,8% al 2,2% del volume di dati globale. La quantità di informazioni aumenterà, secondo EMC, dagli attuali 155 exabyte a 980 exabyte nel 2020.
Al momento, la Russia continua ad accumulare quantità di informazioni fino al livello dei Big Data.
Secondo un sondaggio di CNews Analytics, il 44% delle aziende intervistate lavora con dati non superiori a 100 terabyte* e solo il 13% lavora con volumi superiori a 500 terabyte.

Tuttavia, il mercato russo, seguendo le tendenze globali, crescerà. A partire dal 2014, IDC stima la dimensione del mercato a $ 340 milioni.
Il tasso di crescita del mercato negli anni precedenti era del 50% all'anno, se rimane allo stesso livello, nel 2018 il volume del mercato raggiungerà 1,7 miliardi di dollari. La quota del mercato russo nel mercato mondiale sarà di circa il 3%, essendo passata dall'attuale 1,2%.

Le industrie più suscettibili all'utilizzo dei Big Data in Russia sono:

  • Retail e banche, per loro, prima di tutto, è importante l'analisi della base clienti, la valutazione dell'effetto delle campagne di marketing;
  • Telecom - segmentazione della base clienti e monetizzazione del traffico;
  • Settore pubblico - contabilità, analisi delle domande della popolazione, ecc.;
  • Compagnie petrolifere - monitoraggio del lavoro e pianificazione della produzione e delle vendite;
  • Compagnie energetiche: creazione di sistemi di alimentazione intelligenti, monitoraggio operativo e previsioni.
Nei paesi sviluppati, i Big Data si sono diffusi nelle sfere della sanità, delle assicurazioni, della metallurgia, delle società Internet e delle imprese industriali, molto probabilmente nel prossimo futuro anche le aziende russe di queste aree valuteranno l'effetto dell'implementazione dei Big Data e adatteranno queste tecnologie nelle loro industrie.
In Russia, così come nel mondo, nel prossimo futuro ci sarà una tendenza verso la visualizzazione dei dati, l'analisi dei file multimediali e lo sviluppo dell'Internet of Things.
Nonostante la generale stagnazione dell'economia, gli analisti prevedono un'ulteriore crescita del mercato Big Data nei prossimi anni, principalmente per il fatto che l'utilizzo delle tecnologie Big Data offre ai propri utenti un vantaggio competitivo in termini di aumento dell'efficienza operativa del business , attrarre nuovi clienti, ridurre al minimo i rischi e implementare tecnologie di previsione dei dati.
Pertanto, possiamo concludere che il segmento dei Big Data in Russia è in fase di formazione, ma la domanda di queste tecnologie aumenta ogni anno.

Risultati chiave dell'analisi di mercato

Mercato mondiale
A fine 2014 il mercato dei Big Data è caratterizzato dai seguenti parametri:
  • la dimensione del mercato è stata di 28,5 miliardi di dollari, con un incremento del 45% rispetto all'anno precedente;
  • la maggior parte dei ricavi del mercato Big Data era costituita da servizi, la loro quota era pari al 40% sui ricavi totali;
  • Il 36% dei ricavi proveniva da applicazioni e analisi dei Big Data, il 17% da apparecchiature informatiche e il 15% da tecnologie di archiviazione dei dati;
  • Le piattaforme più popolari per la risoluzione dei problemi relativi ai Big Data sono le piattaforme in-memory di aziende come SAP, HANA e Oracle.
  • il numero di aziende con progetti realizzati nell'ambito della gestione dei Big Data è aumentato del 125%;
Le previsioni di mercato per i prossimi anni sono le seguenti:
  • nel 2015 il volume di mercato raggiungerà i 38,4 miliardi di dollari, nel 2020 i 68,7 miliardi di dollari;
  • il tasso di crescita medio sarà del 16% annuo;
  • la spesa media dell'azienda sulle tecnologie Big Data ammonterà a 13,8 milioni di dollari per le grandi aziende e 1,6 milioni di dollari per le piccole e medie imprese;
  • le tecnologie saranno prevalenti nelle aree del servizio clienti e del marketing puntuale;
  • nel 2017 la struttura del mercato globale cambierà verso una predominanza di aziende utilizzatrici provenienti da paesi in via di sviluppo.
mercato russo
Il mercato russo dei Big Data è in fase di formazione, i risultati del 2014 sono i seguenti:
  • la dimensione del mercato ha raggiunto i 340 milioni di dollari;
  • il tasso medio di crescita del mercato negli anni precedenti è stato del 50% annuo;
  • la quantità totale di informazioni accumulate era di 155 exabyte;
  • Il 10% delle aziende russe ha iniziato a utilizzare le tecnologie Big Data;
  • Le tecnologie Big Data erano più popolari nelle aziende bancarie, delle telecomunicazioni, di Internet e della vendita al dettaglio.
Le previsioni per il mercato russo per i prossimi anni sono le seguenti:
  • il volume del mercato russo nel 2015 raggiungerà i 500 milioni di dollari e nel 2018 - 1,7 miliardi di dollari;
  • la quota del mercato russo nel mondo sarà di circa il 3% nel 2018;
  • la quantità di dati accumulati nel 2020 sarà di 980 exabyte;
  • il volume dei dati crescerà fino al 2,2% del volume globale dei dati nel 2020;
  • le tecnologie più popolari saranno la visualizzazione dei dati, l'analisi dei file multimediali e l'Internet of Things.
Sulla base dei risultati dell'analisi, si può concludere che il mercato dei Big Data è ancora nelle prime fasi di sviluppo e nel prossimo futuro osserveremo la sua crescita e l'espansione delle capacità di queste tecnologie.

Grazie per aver dedicato del tempo a leggere questo voluminoso lavoro, iscriviti al nostro blog - promettiamo molte nuove pubblicazioni interessanti!

Colonna di docenti HSE su miti e casi di lavoro con i big data

Ai segnalibri

Konstantin Romanov e Alexander Pyatigorsky, che è anche il direttore della trasformazione digitale di Beeline, presso la HSE School of New Media, hanno scritto una rubrica per il sito sulle principali idee sbagliate sui big data - esempi dell'uso della tecnologia e degli strumenti. Gli autori suggeriscono che la pubblicazione aiuterà i dirigenti dell'azienda a comprendere questo concetto.

Miti e malintesi sui Big Data

I Big Data non sono marketing

Il termine Big Data è diventato molto di moda: è usato in milioni di situazioni e in centinaia di interpretazioni diverse, spesso irrilevanti per quello che è. Spesso c'è una sostituzione di concetti nella testa delle persone e i Big Data vengono confusi con un prodotto di marketing. Inoltre, in alcune aziende Big Data fa parte della divisione marketing. Il risultato dell'analisi dei big data può infatti essere una fonte per l'attività di marketing, ma niente di più. Vediamo come funziona.

Se abbiamo identificato un elenco di coloro che hanno acquistato beni nel nostro negozio per più di tremila rubli due mesi fa, e poi abbiamo inviato un'offerta a questi utenti, allora questo è il marketing tipico. Deduciamo un modello chiaro dai dati strutturali e lo usiamo per guidare le vendite.

Tuttavia, se combiniamo i dati CRM con le informazioni in streaming, ad esempio da Instagram, e le analizziamo, troveremo uno schema: una persona che ha ridotto la sua attività mercoledì sera e la cui ultima foto mostra dei gattini dovrebbe fare una certa offerta. Questi saranno già Big Data. Abbiamo trovato un trigger, l'abbiamo passato ai marketer e loro l'hanno usato per i propri scopi.

Ne consegue che la tecnologia di solito funziona con dati non strutturati e, se i dati sono strutturati, il sistema continua a cercare schemi nascosti in essi, cosa che il marketing non fa.

I Big Data non sono IT

Il secondo estremo di questa storia: i Big Data vengono spesso confusi con l'IT. Ciò è dovuto al fatto che nelle aziende russe, di norma, sono gli specialisti IT a guidare tutte le tecnologie, compresi i big data. Pertanto, se tutto accade in questo reparto, per l'azienda nel suo insieme sembra che si tratti di una sorta di attività IT.

In effetti, qui c'è una differenza fondamentale: i Big Data sono un'attività finalizzata all'ottenimento di un determinato prodotto, che non è affatto correlato all'IT, sebbene la tecnologia non possa esistere senza di essi.

I Big Data non sono sempre la raccolta e l'analisi delle informazioni

C'è un altro equivoco sui Big Data. Tutti sanno che questa tecnologia è associata a grandi quantità di dati, ma non è sempre chiaro che tipo di dati si intenda. Tutti possono raccogliere e utilizzare le informazioni, ora è possibile non solo nei film su, ma anche in qualsiasi azienda, anche molto piccola. L'unica domanda è cosa raccogliere e come usarlo a proprio vantaggio.

Ma dovrebbe essere chiaro che la tecnologia dei Big Data non sarà la raccolta e l'analisi di alcuna informazione. Ad esempio, se raccogli dati su una persona specifica sui social network, non saranno Big Data.

Cosa sono veramente i Big Data?

I Big Data sono costituiti da tre elementi:

  • dati;
  • analisi;
  • tecnologie.

I Big Data non sono solo uno di questi componenti, ma un insieme di tutti e tre gli elementi. Spesso le persone sostituiscono i concetti: qualcuno pensa che i Big Data siano solo dati, qualcuno - quella tecnologia. Ma in realtà, non importa quanti dati raccogli, non puoi farci nulla senza la giusta tecnologia e analisi. Se c'è una buona analisi, ma nessun dato, è ancora più negativo.

Se parliamo di dati, allora questi non sono solo testi, ma anche tutte le foto pubblicate su Instagram, e in generale tutto ciò che può essere analizzato e utilizzato per scopi e compiti diversi. In altre parole, i dati sono intesi come un'enorme quantità di dati interni ed esterni di varie strutture.

Hai anche bisogno di analisi, perché il compito dei Big Data è costruire alcuni modelli. Cioè, l'analisi è l'identificazione di dipendenze nascoste e la ricerca di nuove domande e risposte basate sull'analisi dell'intero volume di dati eterogenei. Inoltre, i Big Data sollevano questioni che non possiamo derivare direttamente da questi dati.

Se parliamo di immagini, il fatto che tu abbia pubblicato la tua foto con una maglietta blu non significa nulla. Ma se usi la fotografia per la modellazione dei Big Data, potrebbe risultare che in questo momento ti dovrebbe essere offerto un prestito, perché nel tuo gruppo sociale questo comportamento parla di un certo fenomeno nelle azioni. Pertanto, i dati “nudi” senza analytics, senza rivelare dipendenze nascoste e non ovvie dei Big Data non lo sono.

Quindi abbiamo i big data. La loro gamma è enorme. Abbiamo anche un analista. Ma come possiamo assicurarci che da questi dati grezzi si ottenga una soluzione concreta? Per fare questo abbiamo bisogno di tecnologie che permettano non solo di essere archiviati (e prima era impossibile), ma anche di analizzarli.

In poche parole, se disponi di molti dati, hai bisogno di tecnologie, ad esempio Hadoop, che consentono di conservare tutte le informazioni nella loro forma originale per analisi successive. Questo tipo di tecnologia è emerso nei colossi di Internet, poiché sono stati i primi ad affrontare il problema di archiviare una grande quantità di dati e analizzarli per la successiva monetizzazione.

Oltre agli strumenti per l'archiviazione dei dati ottimizzata e a basso costo, sono necessari strumenti analitici, nonché componenti aggiuntivi per la piattaforma utilizzata. Ad esempio, attorno ad Hadoop si è già formato un intero ecosistema di progetti e tecnologie correlati. Ecco qui alcuni di loro:

  • Pig è un linguaggio dichiarativo di analisi dei dati.
  • Hive: analisi dei dati utilizzando un linguaggio vicino a SQL.
  • Oozie è un flusso di lavoro in Hadoop.
  • Hbase è un database (non relazionale), analogo a Google Big Table.
  • Mahout è l'apprendimento automatico.
  • Sqoop - trasferimento dati da RSDB ad Hadoop e viceversa.
  • Flume - trasferimento dei log su HDFS.
  • Zookeeper, MRUnit, Avro, Giraph, Ambari, Cassandra, HCatalog, Fuse-DFS e così via.

Tutti questi strumenti sono disponibili per tutti gratuitamente, ma c'è anche una serie di componenti aggiuntivi a pagamento.

Inoltre, sono necessari degli specialisti: si tratta di uno sviluppatore e di un analista (il cosiddetto Data Scientist). Hai anche bisogno di un manager che sappia come applicare questa analisi per risolvere un problema specifico, perché di per sé è completamente priva di significato se non è incorporata nei processi aziendali.

Tutti e tre i dipendenti devono lavorare come una squadra. Un manager che assegna a uno specialista di Data Science il compito di trovare un determinato modello deve capire che non è sempre possibile trovare esattamente ciò di cui ha bisogno. In questo caso, il manager dovrebbe ascoltare attentamente ciò che ha scoperto il Data Scientist, poiché spesso le sue scoperte si rivelano più interessanti e utili per il business. Il tuo compito è applicare questo alla tua attività e farne un prodotto.

Nonostante il fatto che ora ci siano molti diversi tipi di macchine e tecnologie, la decisione finale spetta sempre alla persona. Per fare ciò, le informazioni devono essere visualizzate in qualche modo. Ci sono alcuni strumenti per questo.

L'esempio più illustrativo sono i rapporti geo-analitici. L'azienda Beeline lavora molto con i governi di diverse città e regioni. Molto spesso, queste organizzazioni ordinano rapporti del tipo "Congestione del traffico in una determinata località".

È chiaro che un tale rapporto dovrebbe arrivare alle strutture di governo in una forma semplice e comprensibile. Se forniamo loro una tabella enorme e completamente incomprensibile (cioè informazioni nella forma in cui le riceviamo), è improbabile che acquistino un rapporto del genere: sarà completamente inutile, non ne tireranno fuori la conoscenza volevano ottenere.

Pertanto, non importa quanto siano bravi i Data Scientist e non importa quali modelli trovino, non puoi lavorare con questi dati senza strumenti di visualizzazione di alta qualità.

Origine dei dati

L'array dei dati ricevuti è molto ampio, quindi può essere suddiviso in più gruppi.

Dati aziendali interni

Sebbene l'80% dei dati raccolti rientri in questo gruppo, questa fonte non viene sempre utilizzata. Spesso si tratta di dati di cui, a quanto pare, nessuno ha bisogno, ad esempio i registri. Ma se li guardi da un'angolazione diversa, a volte puoi trovare schemi inaspettati in loro.

Fonti shareware

Ciò include i dati dei social network, Internet e qualsiasi altra cosa a cui è possibile accedere gratuitamente. Perché shareware? Da un lato, questi dati sono disponibili per tutti, ma se sei una grande azienda, ottenere le dimensioni di una base di abbonati di decine di migliaia, centinaia o milioni di clienti non è più un compito facile. Pertanto, ci sono servizi a pagamento sul mercato per fornire questi dati.

Fonti a pagamento

Ciò include le aziende che vendono dati per denaro. Questi possono essere telecomunicazioni, DMP, società Internet, agenzie di credito e aggregatori. Le telecomunicazioni in Russia non vendono dati. In primo luogo, è economicamente non redditizio e, in secondo luogo, è vietato dalla legge. Pertanto, vendono i risultati della loro elaborazione, ad esempio rapporti geo-analitici.

Dati aperti

Lo Stato incontra le imprese a metà e rende possibile l'utilizzo dei dati che raccolgono. In misura maggiore, questo è sviluppato in Occidente, ma anche la Russia in questo senso è al passo con i tempi. Ad esempio, c'è il portale Open Data del governo di Mosca, che pubblica informazioni su varie infrastrutture urbane.

Per i residenti e gli ospiti di Mosca, i dati sono presentati in forma tabellare e cartografica e per gli sviluppatori - in speciali formati leggibili dalla macchina. Finora, il progetto funziona in modalità limitata, ma si sta sviluppando, il che significa che è anche un'origine dati che puoi utilizzare per le tue attività aziendali.

Ricerca

Come già notato, il compito dei Big Data è trovare uno schema. Spesso, la ricerca condotta in tutto il mondo può diventare un fulcro per trovare uno schema particolare: puoi ottenere un risultato specifico e provare ad applicare una logica simile per i tuoi scopi.

I Big Data sono un'area in cui non tutte le leggi della matematica funzionano. Ad esempio, "1" + "1" non è "2", ma molto di più, perché la combinazione di origini dati può migliorare notevolmente l'effetto.

Esempi di prodotti

Molti hanno familiarità con il selettore di musica di Spotify. È bello in quanto non chiede agli utenti qual è il loro stato d'animo oggi, ma lo calcola in base alle fonti a sua disposizione. Sa sempre di cosa hai bisogno ora: jazz o hard rock. Questa è la differenza fondamentale che gli fornisce una base di fan e lo differenzia da altri servizi.

Tali prodotti sono generalmente chiamati prodotti sensoriali - quelli che sentono il loro cliente.

La tecnologia Big Data è utilizzata anche nell'industria automobilistica. Ad esempio, Tesla fa questo: il loro ultimo modello ha un pilota automatico. L'azienda si sforza di creare un'auto che porti il ​​passeggero dove vuole. Questo è impossibile senza Big Data, perché se utilizziamo solo i dati che riceviamo direttamente, come fa una persona, allora l'auto non potrà migliorare.

Quando guidiamo un'auto noi stessi, usiamo i nostri neuroni per prendere decisioni basate su molti fattori che non ci accorgiamo nemmeno. Ad esempio, potremmo non renderci conto del motivo per cui abbiamo deciso di non accelerare immediatamente fino al semaforo verde, e poi si scopre che la decisione è stata corretta: un'auto ti è passata davanti a rotta di collo e hai evitato un incidente.

Puoi anche fornire un esempio dell'utilizzo dei Big Data nello sport. Nel 2002, il direttore generale della squadra di baseball degli Oakland Athletics, Billy Bean, decise di rompere il paradigma di come trovare gli atleti: selezionava e allenava i giocatori in base ai numeri.

Di solito i manager guardano al successo dei giocatori, ma in questo caso è stato diverso: per ottenere il risultato, il manager ha studiato di quali combinazioni di atleti aveva bisogno, prestando attenzione alle caratteristiche individuali. Inoltre, ha scelto atleti che di per sé non rappresentavano molto potenziale, ma la squadra nel suo insieme si è rivelata così vincente da vincere venti partite di fila.

Il regista Bennett Miller ha poi girato un film su questa storia - "L'uomo che ha cambiato tutto" con Brad Pitt.

La tecnologia dei Big Data è utile anche nel settore finanziario. Non una sola persona al mondo può determinare in modo indipendente e accurato se vale la pena dare un prestito a qualcuno. Per prendere una decisione, viene eseguito il punteggio, ovvero viene costruito un modello probabilistico, in base al quale è possibile capire se questa persona restituirà i soldi o meno. Quindi il punteggio viene applicato in tutte le fasi: puoi, ad esempio, calcolare che a un certo momento una persona smetterà di pagare.

I big data non solo possono fare soldi, ma anche salvarli. In particolare, questa tecnologia ha aiutato il Ministero del Lavoro tedesco a ridurre il costo delle indennità di disoccupazione di 10 miliardi di euro, poiché dopo aver analizzato le informazioni è apparso chiaro che il 20% delle indennità è stato pagato immeritatamente.

Inoltre, le tecnologie sono utilizzate in medicina (questo è particolarmente tipico per Israele). Con l'aiuto dei Big Data è possibile fornire un'analisi molto più accurata di quanto possa fare un medico con trent'anni di esperienza.

Qualsiasi medico, quando fa una diagnosi, si basa solo sulla propria esperienza. Quando una macchina lo fa, viene dalle esperienze di migliaia di tali medici e da tutte le storie di casi esistenti. Tiene conto di quale materiale è fatta la casa del paziente, in quale zona vive la vittima, che tipo di fumo c'è e così via. Cioè, tiene conto di molti fattori che i medici non tengono in considerazione.

Un esempio dell'utilizzo dei Big Data in ambito sanitario è il progetto Project Artemis, realizzato dal Toronto Children's Hospital. È un sistema informativo che raccoglie e analizza i dati sui neonati in tempo reale. La macchina consente di analizzare 1260 indicatori di salute di ogni bambino ogni secondo. Questo progetto ha lo scopo di prevedere lo stato instabile di un bambino e prevenire le malattie nei bambini.

Anche in Russia iniziano ad essere utilizzati i big data: ad esempio, Yandex ha una divisione big data. L'azienda, insieme ad AstraZeneca e alla Società russa di oncologia clinica RUSSCO, ha lanciato la piattaforma RAY per genetisti e biologi molecolari. Il progetto consente di migliorare i metodi per la diagnosi del cancro e l'identificazione della suscettibilità al cancro. La piattaforma inizierà a funzionare a dicembre 2016.

Principali articoli correlati