Come configurare smartphone e PC. Portale informativo
  • casa
  • Ferro
  • Come funzionano i sistemi di archiviazione dati. Finalità dei sistemi di archiviazione dati (DSS) e loro tipologie

Come funzionano i sistemi di archiviazione dati. Finalità dei sistemi di archiviazione dati (DSS) e loro tipologie

È una soluzione hardware e software per archiviare in modo sicuro i dati e fornire un accesso rapido e affidabile.

Implementazione hardware in sistemi di stoccaggio(Storage) è simile all'implementazione dell'architettura di un personal computer. Perché, allora, utilizzare generalmente sistemi di storage nell'architettura della rete locale di un'organizzazione, perché non può essere fornito, per implementare sistemi di storage basati su un normale PC?

Conservazione come nodo aggiuntivo di una rete locale basata su un personal computer o anche su un potente server esistono da molto tempo.

La più semplice fornitura di accesso ai dati tramite protocolli FTP(protocollo di trasferimento file) e PMI(protocollo di accesso remoto alle risorse di rete) che sono supportati in tutti i moderni sistemi operativi.

Perché allora sono apparsi? Conservazione?

È semplice, l'apparenza Conservazione associato al ritardo nello sviluppo e nella velocità dei dispositivi di memorizzazione permanente (dischi magnetici rigidi) dal processore centrale e dalla memoria ad accesso casuale. Il collo di bottiglia nell'architettura del PC è ancora considerato l'hard disk, nonostante il potente sviluppo SATA(interfaccia seriale) fino a un cambio di 600 MB/s ( SATA3), il dispositivo fisico dell'unità è una targa, i cui dati devono essere consultati tramite lettori, che è molto lento. Gli ultimi inconvenienti sono attualmente risolti dalle unità SSD(non memoria meccanica) costruita sulla base di chip di memoria. Oltre al prezzo elevato di SSD hanno, a mio parere, al momento attuale, una mancanza di affidabilità. Ingegneri Conservazione proposto di sostituire i dispositivi di archiviazione in un elemento separato e utilizzare la RAM di tali dispositivi per archiviare dati che cambiano frequentemente utilizzando algoritmi speciali, che richiedevano il componente software del prodotto. Infine sistemi di stoccaggio eseguire più velocemente dei dischi rigidi nei server e la rimozione del dispositivo di archiviazione (sottosistema del disco in un elemento separato) è interessata affidabilità e centralizzazione sistema nel suo insieme.

Affidabilità assicurato il fatto dell'implementazione in un dispositivo separato del sistema del disco, che, lavorando con il componente software, svolge una funzione: queste sono operazioni input Output e archiviazione dei dati.

Oltre al semplice principio: un dispositivo, una funzione che garantisce l'affidabilità. Tutti i nodi principali: alimentatori, controller i sistemi di archiviazione dei dati sono duplicati, il che, ovviamente, aumenta ulteriormente l'affidabilità del sistema, ma influisce sul prezzo del prodotto finale.

La rimozione del sistema disco in un'unità separata consente centralizzare i dispositivi di archiviazione... Di norma, senza un'archiviazione di rete separata, le cartelle principali, la posta e i database degli utenti vengono archiviati su nodi separati, di regola, su server della rete, il che è molto scomodo e non affidabile. Devi fare dei backup, duplicare i dati su un server di backup in rete, che, oltre al costo del supporto e dell'hardware, del software, occupa parte della larghezza di banda della rete.

Ecco come appare:

Con un sistema di archiviazione separato:

A seconda del metodo, della tecnologia di connessione Conservazione alla rete informatica. Conservazione suddiviso in: DAS, NAS, SAN

DAS (DirettoAllegatoConservazione)- un metodo di connessione non diverso dalla connessione standard di un disco rigido, array di dischi (RAID) a un server o PC. In genere, la connessione è SAS.

SAS- infatti, il protocollo progettato per sostituire SCSI utilizza un'interfaccia seriale a differenza di SCSI, ma i comandi sono gli stessi di SCSI. SAS dispone di una maggiore larghezza di banda grazie alle connessioni di collegamento su un'unica interfaccia.

NAS (ReteAllegatoConservazione)- il sistema a disco è connesso a una rete LAN comune, viene utilizzato il protocollo di trasporto TCP, i protocolli funzionano al di sopra del modello PMI,NFS(accesso remoto a file e stampanti).

SAN (ConservazioneLa zonaRete)È una rete dedicata che collega i dispositivi di archiviazione con i server. Funziona utilizzando il protocollo Canale in fibra ottica o iSCSI.

CON FibraCanale tutto è chiaro - ottica. Ma iSCSI- incapsulamento di pacchetti in protocollo IP, permette di creare reti di storage basate su infrastruttura Ethernet, velocità di trasmissione 1Gb e 10GB. Secondo gli sviluppatori, la velocità iSCSI dovrebbe essere sufficiente per quasi tutte le applicazioni aziendali. Per connettere il server a Conservazione in poi iSCSI adattatori necessari con supporto iSCSI... Quando si utilizza iSCSI, vengono stabilite almeno due rotte per ciascun dispositivo utilizzando VLAN, ogni dispositivo e LUN(definisce una partizione virtuale in un array, utilizzata per l'indirizzamento) viene assegnato un indirizzo ( MondoAmpioNome).

La differenza NAS a partire dal SAN in cosa c'è in rete SAN Le operazioni di I/O leggono e scrivono i dati in blocchi. Conservazione non ha idea della struttura dei file system.

I fornitori più famosi sul mercato dei dispositivi di storage sono: NetApp, IBM, HP, DELL, HITACHI, EMC.

Il nostro progetto richiede un sistema di stoccaggio con le seguenti caratteristiche:

  • Volume 1 TB per file, 1 TB per sistemi operativi di server e database, 300 - 500 GB, per server di backup + stock. Totale almeno 3 TB di spazio su disco
  • Supporto per i protocolli SMB e NFS, per la distribuzione di file condivisi agli utenti senza la partecipazione dei server
  • Se vogliamo caricare l'hypervisor da Conservazione, è necessario almeno il protocollo iSCSI
  • In teoria, è comunque necessario tenere in considerazione un parametro così importante come la velocità di input/output (IO) che il sistema di storage può fornire. È possibile stimare questo parametro misurando l'IO su un hardware funzionante, ad esempio utilizzando il programma IOMeter.

Va tenuto presente che il clustering da Microsoft funziona solo attraverso FibraCanale.

Ecco un elenco di aziende e hardware tra cui scegliere:

Asustor

Asustor AS 606T, AS 608T, 609 RD(oltre alla possibilità di installare fino a 8 dischi da 4Tb, viene dichiarato il supporto per VMware, Citrix e Hyper-V.

Componente hardware

CPU Intel Atom 2.13

RAM 1GB (3GB) DDR3

Hard 2.5, 3.5, SATA 3 o SSD

Lan Gigabit Ethernet - 2

Schermo LCD, HDMI

Rete

Rete protocolli

File system

Per dischi rigidi integrati: EXT4, Per dischi rigidi esterni: FAT32, NTFS, EXT3, EXT4, HFS +

Conservazione

Supporto per più volumi con dischi di riserva

Tipo di volume: disco singolo, JBOD, RAID 0, RAID 1, RAID 5, RAID 6, RAID 10

Supporto per la migrazione online dei livelli RAID

Numero massimo di bersagli: 256

LUN massimi: 256

Obiettivi di mascheramento

Mappatura LUN

Monta immagini ISO

Supporto MPIO e MCS

Ridondanza persistente (SCSI-3)

Gestione del disco

Cerca i blocchi danneggiati in base a una pianificazione

Scansione S.M.A.R.T programmata

Supportato OS

Windows XP, Vista, 7, 8, Server 2003, Server 2008, Server 2012

Mac OS X 10.6 in poi

UNIX, Linux e BSD

Backup

Supporto modalità Rsync (sincronizzazione remota)

Backup su cloud

Backup FTP

Backup su supporto esterno

Backup con un tocco

Amministrazione di sistema

Tipo di registro: syslog, registro di connessione, registro di accesso ai file

Registratore di attività dell'utente in tempo reale

Monitor di sistema in tempo reale

Cestino di rete

Quota disco degli utenti

Disco virtuale (monta immagini ISO, max. 16)

Supporto UPS

Controllo di accesso

Numero massimo di utenti: 4096

Numero massimo di gruppi: 512

Numero massimo di cartelle condivise: 512

Connessioni simultanee massime: 512

Supporto per Active Directory di Windows

Sicurezza

Firewall: impedisci l'accesso non autorizzato

Protezione contro le sovratensioni: previeni gli attacchi di rete

Notifiche di minaccia: e-mail, SMS

Connessioni protette: HTTPS, FTP su SSL / TLS, SSH, SFTP, Rsync su SSH

Sistema operativo ADM con possibilità di collegare moduli aggiuntivi tramite app central

Modelli AS 604RD, AS 609RD a differenza di AS 606T, AS 608T, non includono un display LCD, sono progettati per l'installazione in un rack e hanno un alimentatore ridondante, è dichiarato il supporto per le piattaforme di virtualizzazione

Netgear

Pronto Nas 2100, Pronto Nas 3100, Pronto Nas Pro 6

Componente hardware

CPU Intel SOC 1GHz

Hard 2.5, 3.5, SATA 2 o SSD

Lan Gigabit Ethernet - 2

Rete

Rete protocolli

CIFS/SMB, AFP, NFS, FTP, WebDAV, Rsync, SSH, SFTP, iSCSI, HTTP, HTTPS

File system

Per dischi rigidi integrati: BTRFS, Per dischi rigidi esterni: FAT32, NTFS, EXT3, EXT4, HFS +

Conservazione

Supporta l'espansione della capacità RAID online

Numero massimo di bersagli: 256

LUN massimi: 256

Obiettivi di mascheramento

Mappatura LUN

Gestione del disco

Capacità del disco, prestazioni, monitoraggio del carico

Scansione per trovare blocchi danneggiati sui dischi

Supporto HDD S.M.A.R.T.

Correzione dati in linea su dischi

Supporto per lo scrubbing del disco

Supporto per la deframmentazione

Messaggi (dal servizio SMTP via e-mail, SNMP, syslog, log locale)

Spegnimento automatico (HDD, ventole, UPS)

Ripristino delle prestazioni al ripristino dell'alimentazione

Sistema operativo supportato

Microsoft Windows Vista (32/64 bit), 7 (32/64 bit), 8 (32/64 bit), Microsoft Windows Server 2008 R2 / 2012, Apple OS X, Linux / Unix, Solaris, Apple iOS, Google Android)

Backup

Snapshot illimitati per una protezione continua.

Recupera gli snapshot in qualsiasi momento. Tramite interfaccia utente grafica (Admin Console), ReadyCLOUD o Windows Explorer

La possibilità di creare un'istantanea manualmente o tramite lo scheduler

Sincronizzazione dei file tramite R-sync

Replica remota della gestione del cloud (da ReadyNAS a ReadyNAS). Non richiede licenze per i dispositivi che eseguono il sistema operativo Radiator OS v6.

Ridondanza a caldo

Supporto ESATA

Supporta il backup su unità esterne su e (USB / eSATA)

Supporta il backup e il ripristino remoto di Apple Time Machine (tramite ReadyNAS Remote)

Supporto del servizio cloud ReadyNAS Vault (opzionale)

Supporto per la sincronizzazione di ReadyDROP (sincronizzazione di file Mac/Windows con ReadyNAS)

Supporto per il servizio DropBox per la sincronizzazione dei file (richiede un account sul servizio DropBox)

Amministrazione di sistema

ReadyCLOUD per il rilevamento e la gestione dei dispositivi

RAIDar - Agente di rilevamento dei dispositivi di rete (Windows/Mac)

Salvataggio e ripristino del file di configurazione

Il registro degli eventi

Supporto per la messaggistica del server Syslog

Supporto per messaggistica SMB

Interfaccia utente grafica in russo e inglese

Genio + mercato. App store integrato per migliorare la funzionalità del dispositivo

Supporto per caratteri Unicode

Gestore disco

Supporto per thin provisioning condivisioni e LUN

Allocazione immediata delle risorse

Controllo di accesso

Numero massimo di utenti: 8192

Numero massimo di gruppi: 8192

Numero massimo di cartelle fornite per l'accesso alla rete: 1024

Numero massimo di connessioni: 1024

Accesso a cartelle e file basati su ACL

Autorizzazioni estese per cartelle e sottocartelle basate su ACL per CIFS/SMB, AFP, FTP, autenticazione controller di dominio Microsoft Active Directory (AD)

Elenchi di accesso propri

Elenchi di accesso ReadyCLOUD basati su ACL

Sistema operativo

ReadyNAS OS 6 è basato su Linux 3.x

Pronto Nas 3100 distingue Pronto Nas 2100 Memoria ECC da 2 GB

Pronto Nas Pro 6- Memoria a 6 slot, processore Intel Atom D510, memoria DDR2 da 1 GB

Qnap

TS-869U-RP, TS-869 PRO

Componente hardware

CPU Intel Atom 2.13GHz

Hard 2.5, 3.5, SATA 3 o SSD

Lan Gigabit Ethernet - 2

Rete

IPv4, IPv6, supporta 802.3ad e altre sei modalità per il bilanciamento del carico e/o il failover di rete, Vlan

Rete protocolli

CIFS/SMB, AFP, NFS, FTP, WebDAV, Rsync, SSH, SFTP, iSCSI, HTTP, HTTPS

File system

Per dischi rigidi integrati: EXT3, EXT4, Per dischi rigidi esterni: FAT32, NTFS, EXT3, EXT4, HFS +

Conservazione

Tipo di volume: RAID 0, RAID 1, RAID 5, RAID 6, RAID 10

Supporta l'espansione della capacità RAID online

Numero massimo di bersagli: 256

LUN massimi: 256

Obiettivi di mascheramento

Mappatura LUN

Iniziatore ISCSI (disco virtuale)

Maestro di concatenamento stack

Fino a 8 dischi virtuali

Gestione del disco

Aumenta la capacità di archiviazione di un array RAID senza perdita di dati

Scansione blocco errato

Funzione di ripristino RAID

Supporto bitmap

Supportato OS

Backup

Replica in tempo reale (RTRR)

Funziona sia come server RTRR che come client

Supporta backup programmati e in tempo reale

Possibilità di filtraggio, compressione e crittografia dei file

Pulsante per la copia dei dati da/a un dispositivo esterno

Supporto Apple Time Machine con gestione delle prenotazioni

Replica delle risorse a livello di blocco (Rsync)

Funziona sia come server che come client

Replica sicura tra i server QNAP

Backup su supporto esterno

Backup su sistemi di archiviazione cloud

NetBak Replicator per Windows

Supporto per Apple Time Machine

Amministrazione di sistema

Interfaccia web basata su AJAX

Connessione HTTP/HTTPS

Notifiche istantanee via e-mail e SMS

Gestione del sistema di raffreddamento

DynDNS e servizio dedicato MyCloudNAS

Supporta UPS SNMP (USB)

Supporto UPS di rete

Sorvegliante delle risorse

Bucket di rete per CIFS/SMB e AFP

Registri dettagliati di eventi e connessioni

Elenco degli utenti attivi

client Syslog

Aggiornamento del firmware

Salvataggio e ripristino delle impostazioni di sistema

Ripristino delle impostazioni di fabbrica

Controllo di accesso

Fino a 4096 account utente

Fino a 512 gruppi di utenti

Fino a 512 risorse di rete

Aggiungi utenti in gruppo

Importazione/esportazione utente

Impostazione dei parametri delle quote

Gestione dei diritti di accesso alle sottocartelle

Sistema operativo

TS - 869 Pro- modello senza alimentatore di backup, capacità di memoria 1GB

Sinologia

RS 2212, DS1813

Componente hardware

CPU Intel Core 2.13GHz

Hard 2.5, 3.5, SATA 2 o SSD

Lan Gigabit Ethernet - 2

Rete

IPv4, IPv6, supporta 802.3ad e altre sei modalità per il bilanciamento del carico e/o il failover di rete

Rete protocolli

CIFS/SMB, AFP, NFS, FTP, WebDAV, SSH

File system

Per dischi rigidi integrati: EXT3, EXT4, Per dischi rigidi esterni: NTFS, EXT3, EXT4

Conservazione

Tipo di volume: RAID 0, RAID 1, RAID 5, RAID 6, RAID 10

Numero massimo di bersagli: 512

LUN massimi: 256

Gestione del disco

Modifica del livello RAID senza spegnere il sistema

Sistema operativo supportato

Windows 2000 e versioni successive, Mac OS X 10.3 e versioni successive, Ubuntu 9.04 e versioni successive

Backup

Ridondanza di rete

Ridondanza locale

Sincronizzare le cartelle condivise

Prenotazione desktop

Amministrazione di sistema

Notifica degli eventi di sistema tramite SMS, e-mail

Quota utenti

Monitoraggio delle risorse

Controllo di accesso

Fino a 2048 account utente

Fino a 256 gruppi di utenti

Fino a 256 risorse di rete

Sistema operativo

DS1813- 2 GB di RAM, 4 Gigabit, supporto HASP 1C, supporto disco da 4 TB

Thecus

N8800PRO v2, N7700PRO v2, N8900

Componente hardware

CPU Intel Core 2 1,66 GHz

Lan Gigabit Ethernet - 2

Capacità LAN 10GB

Rete

IPv4, IPv6, supporta 802.3ad e altre sei modalità per il bilanciamento del carico e/o il failover di rete

Rete protocolli

CIFS/SMB, NFS, FTP

File system

Per dischi rigidi interni: EXT3, EXT4, Per dischi rigidi esterni: EXT3, EXT4, XFS

Conservazione

Tipo di volume: RAID 0, RAID 1, RAID 5, RAID 6, RAID 10, RAID 50, RAID 60

Supporta l'espansione della capacità RAID online

Obiettivi di mascheramento

Mappatura LUN

Gestione del disco

Monitoraggio dello stato del disco (S.M.A.R.T)

Scansione blocco errato

La possibilità di montare immagini ISO

Supportato OS

Microsoft Windows 2000, XP, Vista (32/64 bit), Windows 7 (32/64 bit), Server 2003/2008

Backup

Acronis True Image

Utilità di backup Thecus

Lettura da un disco ottico a Nas

Amministrazione di sistema

Interfaccia di amministrazione basata sul web del server

Controllo di accesso

Supporto ADS

Sistema operativo

N7700PRO v2- modello senza alimentazione di backup

N8900- nuovo modello con supporto per SATA 3 e SAS

Sulla base dei dati sopra, al momento sono necessari almeno 3 x Tb e durante l'aggiornamento del sistema operativo e dei programmi, questa cifra può essere moltiplicata per due, quindi è necessaria una memoria su disco con una capacità di almeno 6Tb, e con possibilità di crescita. Pertanto, con un segnalibro per il futuro e l'organizzazione di un array RAID 5, la cifra finale è la necessità di 12 Tb... Quando si supporta un sistema di unità disco rigido da 4 Tb, è necessario un sistema con almeno sei alloggiamenti per unità.

La selezione è stata notevolmente ridotta dai seguenti modelli: AS 609RD, NAS pronto 3200, TS-869U-RP, RS-1212RP +, N8900... Tutti i modelli includono alimentazione supplementare... E il supporto dichiarato dal produttore per il noto piattaforme di virtualizzazione... Il più interessante è stato il modello di NetGear - NAS pronto 3200, poiché solo questo modello, oltre a SMART, supportava almeno alcune tecnologie aggiuntive per lavorare con dischi eccetto SMART e memoria con ECC, ma il prezzo è volato per 100.000 rubli, inoltre c'erano dubbi sulla possibilità di lavorare con dischi 4Tb e SATA3 in esso. Prezzo per RS-1212RP +, ha anche volato sopra i 100 mila. AS 609RD- il player nel mercato dei sistemi di storage è molto nuovo, quindi non si sa come si comporterà Conservazione.

Di cui c'era solo due sistemi tra cui scegliere: TS-869U-RP, N8900.

TS-869U-RP- al momento costa circa 88.000 rubli.

N8900- il prezzo è di 95 400 rubli, ha molti vantaggi rispetto a TS-869U-RP- questo è il supporto per entrambe le unità SATA e SAS, la possibilità di installazione aggiuntiva dell'adattatore 10 Gb, processore dual-core più potente, supporto per unità SATA3 4Tb. Inoltre, esiste un backup del firmware per un microcircuito di backup, che offre un'affidabilità più favorevole rispetto ad altri sistemi.

  • Indietro

Shkera

Con la complicazione quotidiana dei sistemi informatici in rete e delle soluzioni aziendali globali, il mondo ha iniziato a richiedere tecnologie che dessero impulso al rilancio dei sistemi di archiviazione aziendali (sistemi di archiviazione). E così, un'unica tecnologia offre prestazioni senza precedenti, straordinaria scalabilità ed eccezionali vantaggi in termini di TCO al tesoro mondiale di miglioramenti dello storage. Le circostanze che si sono formate con l'avvento dello standard FC-AL (Fiber Channel - Arbitrated Loop) e della SAN (Storage Area Network) che si sviluppa sulla sua base promettono una rivoluzione nelle tecnologie informatiche orientate ai dati.

"Lo sviluppo più significativo nello storage che abbiamo" visto in 15 anni "

Data Communications International, 21 marzo 1998

Definizione formale di SAN come definita dalla Storage Network Industry Association (SNIA):

“Una rete il cui compito principale è trasferire dati tra sistemi informatici e dispositivi di archiviazione dati, nonché tra i sistemi di archiviazione stessi. La SAN è costituita dall'infrastruttura di comunicazione che fornisce connettività fisica ed è anche responsabile del livello di gestione che integra comunicazioni, storage e sistemi informatici per trasferire i dati in modo sicuro e affidabile. ”

Dizionario tecnico SNIA, copyright Storage Network Industry Association, 2000

Opzioni per organizzare l'accesso ai sistemi di archiviazione

Esistono tre opzioni principali per organizzare l'accesso ai sistemi di archiviazione:

  • SAS (Server Attached Storage), storage collegato al server;
  • NAS (Network Attached Storage), storage connesso alla rete;
  • SAN (Storage Area Network), rete di archiviazione.

Considerare le topologie dei corrispondenti sistemi di storage e le loro caratteristiche.

SAS

Un sistema di archiviazione connesso a un server. Il modo familiare e tradizionale di collegare un sistema di storage a un'interfaccia ad alta velocità in un server, solitamente un'interfaccia SCSI parallela.

Figura 1. Archiviazione collegata al server

L'utilizzo di un contenitore di archiviazione separato per la topologia SAS è facoltativo.

Il vantaggio principale di uno storage connesso a un server rispetto ad altre opzioni è un prezzo basso e prestazioni elevate alla velocità di uno storage per un server. Questa topologia è la più ottimale nel caso di utilizzo di un unico server attraverso il quale è organizzato l'accesso all'array di dati. Ma ha ancora una serie di problemi che hanno spinto i progettisti a cercare altre opzioni per organizzare l'accesso ai sistemi di archiviazione.

Le caratteristiche di SAS includono:

  • L'accesso ai dati dipende dal sistema operativo e dal file system (in generale);
  • La complessità dell'organizzazione di sistemi ad alta disponibilità;
  • A basso costo;
  • Alte prestazioni all'interno di un nodo;
  • Ridurre la velocità di risposta durante il caricamento del server che serve il negozio.

NAS

Un sistema di archiviazione connesso alla rete. Questa opzione per organizzare l'accesso è apparsa relativamente di recente. Il suo principale vantaggio è la comodità di integrare storage aggiuntivo nelle reti esistenti, ma di per sé non apporta miglioramenti radicali all'architettura di storage. In effetti, un NAS è un puro file server e oggi puoi trovare molte nuove implementazioni di archiviazione come NAS basate sulla tecnologia Thin Server.


Figura 2. Archiviazione collegata alla rete.

Caratteristiche del NAS:

  • File server dedicato;
  • L'accesso ai dati è indipendente dal sistema operativo e dalla piattaforma;
  • Convenienza di amministrazione;
  • Massima facilità di installazione;
  • Bassa scalabilità;
  • Conflitto con il traffico LAN/WAN.

L'archiviazione basata su NAS è ideale per server a basso costo con funzionalità minime.

SAN

Le reti di archiviazione dati hanno iniziato a svilupparsi intensamente e sono state introdotte solo nel 1999. La SAN si basa su una rete separata dalla LAN/WAN, che serve per organizzare l'accesso ai dati da server e postazioni di lavoro coinvolte nella loro elaborazione diretta. Questa rete è costruita sullo standard Fibre Channel, che offre ai sistemi di storage i vantaggi delle tecnologie LAN/WAN e la capacità di organizzare piattaforme standard per sistemi con elevata disponibilità e domanda elevata. Quasi l'unico inconveniente della SAN oggi è il costo relativamente elevato dei componenti, ma il costo totale di proprietà per i sistemi aziendali realizzati utilizzando la tecnologia SAN è piuttosto basso.


Figura 3. Rete dell'area di archiviazione.

I principali vantaggi di una SAN includono quasi tutte le sue caratteristiche:

  • Indipendenza della topologia SAN da sistemi di storage e server;
  • Comoda gestione centralizzata;
  • Nessun conflitto con il traffico LAN/WAN;
  • Comodo backup dei dati senza caricare la rete locale e i server;
  • Alte prestazioni;
  • Elevata scalabilità;
  • Elevata flessibilità;
  • Elevata disponibilità e tolleranza ai guasti.

Va inoltre notato che questa tecnologia è ancora piuttosto giovane e nel prossimo futuro dovrebbe subire molti miglioramenti nel campo della standardizzazione della gestione e del modo in cui interagiscono le sottoreti SAN. Ma si può sperare che questo minacci solo i pionieri con ulteriori prospettive di leadership.

FC come base per la costruzione di un SAN

Come una LAN, una SAN può essere costruita utilizzando una varietà di topologie e supporti. Quando si costruisce una SAN, è possibile utilizzare sia un'interfaccia SCSI parallela che Fibre Channel o, ad esempio, SCI (Scalable Coherent Interface), ma Fibre Channel deve la sua popolarità sempre crescente alla SAN. Esperti con una significativa esperienza nello sviluppo di interfacce di canale e di rete hanno preso parte alla progettazione di questa interfaccia e sono riusciti a combinare tutte le importanti caratteristiche positive di entrambe le tecnologie per ottenere qualcosa di veramente rivoluzionario. Che cosa esattamente?

Principali caratteristiche chiave del condotto:

  • Bassa latenza
  • Alte velocità
  • Alta affidabilità
  • Topologia punto-punto
  • Piccole distanze tra i nodi
  • Dipendenza dalla piattaforma
e interfacce di rete:
  • Topologie multipunto
  • Lunga distanza
  • Elevata scalabilità
  • Bassa velocità
  • Grandi ritardi
fusa in Fibre Channel:
  • Alte velocità
  • Indipendenza dal protocollo (0-3 livelli)
  • Lunga distanza
  • Bassa latenza
  • Alta affidabilità
  • Elevata scalabilità
  • Topologie multipunto

Tradizionalmente, le interfacce di archiviazione (ciò che si trova tra l'host e i dispositivi di archiviazione) sono state una barriera alla crescita delle prestazioni e dell'archiviazione. Allo stesso tempo, le attività applicate richiedono un aumento significativo della capacità hardware, che a sua volta porta alla necessità di aumentare la larghezza di banda delle interfacce per la comunicazione con i sistemi di archiviazione. Sono i problemi legati alla creazione di un accesso ai dati flessibile e ad alta velocità che Fibre Channel aiuta a risolvere.

Lo standard Fibre Channel è stato finalmente definito negli ultimi anni (dal 1997 al 1999), durante i quali è stato svolto un lavoro enorme per armonizzare l'interazione dei produttori di vari componenti e si è fatto tutto il necessario per trasformare Fibre Channel da una tecnologia puramente concettuale in real, che ha ricevuto supporto sotto forma di installazioni in laboratori e centri di calcolo. Nel 1997 sono stati progettati i primi campioni commerciali di componenti fondamentali per la creazione di SAN basate su FC come adattatori, hub, switch e bridge. Pertanto, dal 1998, FC è stato utilizzato commercialmente nel settore aziendale, nella produzione e in progetti su larga scala per l'implementazione di sistemi critici per i guasti.

Fibre Channel è uno standard industriale aperto per la comunicazione seriale ad alta velocità. Collega server e sistemi di storage a una distanza fino a 10 km (utilizzando apparecchiature standard) a una velocità di 100 MB/s (al Cebit 2000 sono stati presentati campioni di prodotti che utilizzano il nuovo standard Fibre Channel a velocità di 200 MB/s s per un anello, e in condizioni di laboratorio, vengono già sfruttate le implementazioni del nuovo standard con velocità di 400 MB / s, che è 800 MB / s quando si utilizza un doppio anello.) (Al momento della pubblicazione dell'articolo, diversi produttori hanno già iniziato a distribuire schede di rete e switch basati su FC 200 MB/s.) Fibre Channel supporta contemporaneamente una varietà di protocolli standard (inclusi TCP/IP e SCSI-3) su un singolo supporto fisico, che potenzialmente semplifica la rete l'infrastruttura offrendo allo stesso tempo opportunità per ridurre i costi di installazione e manutenzione. L'utilizzo di sottoreti separate per LAN/WAN e SAN presenta numerosi vantaggi ed è l'impostazione predefinita consigliata.

Uno dei vantaggi più importanti del Fibre Channel, insieme ai parametri di velocità (che, tra l'altro, non sono sempre i principali per gli utenti SAN e possono essere implementati con altre tecnologie) è la capacità di lavorare su lunghe distanze e la flessibilità della topologia, che è arrivato al nuovo standard dalle tecnologie di rete. Pertanto, il concetto di costruzione di una topologia SAN si basa sugli stessi principi delle reti tradizionali, solitamente basate su hub e switch, che aiutano a prevenire cali di velocità con un aumento del numero di nodi e creano la possibilità di una comoda organizzazione dei sistemi senza un singolo punto di errore.

Per una migliore comprensione dei vantaggi e delle caratteristiche di questa interfaccia, presentiamo le caratteristiche comparative di FC e Parallel SCSI sotto forma di tabella.

Tabella 1. Confronto tra Fibre Channel e tecnologie SCSI parallele

Lo standard Fibre Channel presuppone l'uso di una varietà di topologie, come hub punto-punto, ad anello o FC-AL (Loop o Hub FC-AL), switch backbone (Fabric/Switch).

Una topologia punto-punto viene utilizzata per connettere un singolo sistema di storage a un server.

Loop o Hub FC-AL - per collegare più dispositivi di archiviazione a più host. Quando si organizza un doppio anello, la velocità e la tolleranza ai guasti del sistema aumentano.

Gli switch vengono utilizzati per fornire le massime prestazioni e resilienza per sistemi complessi, di grandi dimensioni e ramificati.

Grazie alla flessibilità della rete, la SAN ha una caratteristica estremamente importante: la comoda capacità di creare sistemi a tolleranza d'errore.

Offrendo alternative di storage e capacità di aggregazione multi-store per la ridondanza hardware, le SAN aiutano a proteggere i sistemi hardware e software da guasti hardware. A scopo dimostrativo, forniremo un esempio di creazione di un sistema a due modalità senza punti di errore.


Figura 4. Nessun singolo punto di errore.

La costruzione di tre o più sistemi di nodi viene effettuata semplicemente aggiungendo ulteriori server alla rete FC e collegandoli ad entrambi gli hub/switch).

Con FC, la creazione di sistemi tolleranti ai disastri diventa trasparente. I canali di rete sia per l'archiviazione che per le reti locali possono essere posati sulla base della fibra ottica (fino a 10 km o più utilizzando amplificatori di segnale) come supporto fisico per FC, utilizzando apparecchiature standard, il che consente di ridurre significativamente il costo di tali sistemi.

Con la possibilità di accedere a tutti i componenti SAN da qualsiasi luogo, otteniamo una rete dati estremamente flessibile. Va notato che la SAN fornisce trasparenza (la capacità di vedere) tutti i componenti, fino ai dischi nei sistemi di archiviazione. Questa caratteristica ha spinto i produttori di componenti a sfruttare la loro notevole esperienza nella creazione di sistemi di gestione per LAN/WAN al fine di incorporare ampie capacità di monitoraggio e gestione in tutti i componenti SAN. Queste funzionalità includono il monitoraggio e la gestione di singoli nodi, storage dei componenti, contenitori, dispositivi di rete e sottostrutture di rete.

Il sistema di gestione e monitoraggio della SAN utilizza standard aperti come:

  • Set di comandi SCSI
  • Servizi di custodia SCSI (SES)
  • SCSI Self Monitoring Analysis and Reporting Technology (S.M.A.R.T.)
  • SAF-TE (involucri a tolleranza d'errore con accesso SCSI)
  • Protocollo di gestione della rete semplice (SNMP)
  • Gestione aziendale basata sul Web (WBEM)

I sistemi realizzati utilizzando le tecnologie SAN non solo forniscono all'amministratore la capacità di monitorare lo sviluppo e lo stato delle risorse di storage, ma aprono anche opportunità per il monitoraggio e il controllo del traffico. Con queste risorse, il software di gestione della SAN implementa gli schemi di pianificazione dello storage e bilanciamento del carico dei componenti più efficienti.

Le SAN si integrano bene con le infrastrutture informative esistenti. La loro implementazione non richiede modifiche alle reti LAN e WAN esistenti, ma espande solo le capacità dei sistemi esistenti, sollevandoli dalle attività incentrate sul trasferimento di grandi quantità di dati. Inoltre, quando si integra e si amministra una SAN, è molto importante che gli elementi chiave della rete siano sostituibili a caldo e installabili, con funzionalità di configurazione dinamica. Quindi l'amministratore può aggiungere uno o un altro componente o sostituirlo senza spegnere il sistema. E l'intero processo di integrazione può essere visualizzato visivamente in un sistema di gestione SAN grafico.

Considerati i vantaggi di cui sopra, è possibile identificare alcuni punti chiave che incidono direttamente su uno dei principali vantaggi della Storage Area Network: il costo totale di proprietà (Total Cost Ownership).

L'incredibile scalabilità consente a un'azienda che utilizza una SAN di investire in server e storage in base alle esigenze. E mantieni anche i tuoi investimenti in apparecchiature già installate quando cambi generazioni tecnologiche. Ogni nuovo server avrà accesso ad alta velocità allo storage e ogni gigabyte aggiuntivo di storage sarà disponibile per tutti i server della sottorete su comando dell'amministratore.

Eccellenti capacità per la creazione di sistemi resilienti possono portare vantaggi commerciali diretti dalla riduzione al minimo dei tempi di fermo e dal salvataggio del sistema in caso di calamità naturali o altri disastri.

La controllabilità dei componenti e la trasparenza del sistema consentono di eseguire l'amministrazione centralizzata di tutte le risorse di archiviazione e questo, a sua volta, riduce significativamente i costi del loro supporto, il cui costo, di norma, è superiore a 50% del costo dell'attrezzatura.

Impatto della SAN sulle applicazioni

Affinché i nostri lettori possano capire quanto siano praticamente utili le tecnologie discusse in questo articolo, daremo diversi esempi di problemi applicati che sarebbero risolti in modo inefficace senza l'uso di reti di archiviazione, richiederebbero investimenti finanziari colossali o non sarebbero risolti a tutto con metodi standard.

Backup e ripristino dei dati

Utilizzando l'interfaccia SCSI tradizionale, l'utente, durante la creazione di sistemi di backup e ripristino dei dati, deve affrontare una serie di problemi complessi che possono essere risolti molto facilmente utilizzando le tecnologie SAN e FC.

Pertanto, l'uso delle reti di archiviazione porta la soluzione del problema del backup e del ripristino a un nuovo livello e offre l'opportunità di eseguire backup molte volte più velocemente di prima, senza caricare la rete locale e i server con il backup dei dati.

Clustering di server

Una delle attività tipiche per le quali viene effettivamente utilizzata la SAN è il clustering di server. Poiché uno dei punti chiave nell'organizzazione di sistemi cluster ad alta velocità che lavorano con i dati è l'accesso allo storage, con l'avvento della SAN, la costruzione di cluster multinodo a livello hardware si risolve semplicemente aggiungendo un server connesso a la SAN (questo può essere fatto senza nemmeno spegnere il sistema, poiché gli switch FC supportano l'hot-plug). Quando si utilizza un'interfaccia SCSI parallela, la cui connettività e scalabilità è molto peggiore di quella di FC, i cluster orientati ai dati sarebbero difficili da realizzare con più di due nodi. Gli switch SCSI paralleli sono complessi e costosi e sono standard per gli FC. Per creare un cluster che non avrà un singolo punto di errore, è sufficiente integrare nel sistema una SAN con mirroring (tecnologia DUAL Path).

All'interno del clustering, una delle tecnologie RAIS (Redundant Array of Inexpensive Servers) sembra particolarmente interessante per la creazione di potenti sistemi di e-commerce scalabili e altri tipi di attività con maggiori requisiti di alimentazione. Secondo Alistair A. Croll, co-fondatore di Networkshop Inc, l'utilizzo di RAIS è abbastanza efficace: "Ad esempio, per $ 12.000-15.000, è possibile acquistare circa sei server Linux/Apache economici a uno o due processori (Pentium III). . La potenza, la scalabilità e la resilienza di un tale sistema saranno significativamente superiori, ad esempio, a un singolo server a quattro vie basato su processori Xeon e il costo è lo stesso".

Streaming video simultaneo, condivisione dei dati

Immagina un'attività in cui devi modificare video in diverse (diciamo> 5) stazioni o semplicemente lavorare su dati enormi. Il trasferimento di un file da 100 GB su una rete locale richiederà alcuni minuti e il lavoro complessivo su di esso sarà molto difficile. Con SAN, ogni workstation e server della rete può accedere al file con l'equivalente di un disco locale ad alta velocità. Se hai bisogno di un'altra stazione/server per elaborare i dati, puoi aggiungerla alla SAN senza spegnere la rete, semplicemente collegando la stazione allo switch SAN e concedendole l'accesso allo store. Se non sei più soddisfatto delle prestazioni del sottosistema di dati, puoi semplicemente aggiungere un altro spazio di archiviazione e utilizzare la tecnologia di distribuzione dei dati (ad esempio, RAID 0) per ottenere il doppio delle prestazioni.

Principali componenti SAN

mercoledì

Fibre Channel utilizza rame e fibra per collegare i componenti. Entrambi i tipi di cavi possono essere utilizzati contemporaneamente durante la creazione di una SAN. La conversione dell'interfaccia viene eseguita utilizzando GBIC (Gigabit Interface Converter) e MIA (Media Interface Adapter). Entrambi i tipi di cavo oggi forniscono la stessa velocità di trasferimento dati. Il cavo in rame viene utilizzato per brevi distanze (fino a 30 metri), ottico - sia per brevi che per distanze fino a 10 km e oltre. Utilizza cavi ottici multimodali e monomodali. Il cavo multimodale viene utilizzato per brevi distanze (fino a 2 km). Il diametro interno della fibra del cavo multimodale è di 62,5 o 50 micron. Per una velocità di trasferimento di 100 MB/s (200 MB/s full duplex) quando si utilizza la fibra multimodale, la lunghezza del cavo non deve superare i 200 metri. Il cavo monomodale viene utilizzato per le lunghe distanze. La lunghezza di tale cavo è limitata dalla potenza del laser utilizzato nel trasmettitore di segnale. Il cavo monomodale ha un diametro interno di 7 o 9 micron e consente il passaggio di un singolo raggio.

Connettori, adattatori

Per collegare i cavi in ​​rame, vengono utilizzati connettori DB-9 o HSSD. HSSD è considerato più affidabile, ma DB-9 viene utilizzato altrettanto spesso perché è più semplice ed economico. Il connettore standard (più comune) per i cavi ottici è il connettore SC, che fornisce una connessione chiara e di alta qualità. Per la connessione normale vengono utilizzati connettori SC multimodali e per le connessioni remote monomodali. I microconnettori vengono utilizzati negli adattatori multiporta.

Gli adattatori più comuni per FC per il bus PCI a 64 bit. Inoltre, vengono sviluppati molti adattatori FC per il bus S-BUS, adattatori per MCA, EISA, GIO, HIO, PMC, Compact PCI sono prodotti per uso specializzato. Le più popolari sono a porta singola, ci sono schede a due e quattro porte. Sugli adattatori PCI, di norma, vengono utilizzati connettori DB-9, HSSD, SC. Inoltre, ci sono spesso adattatori basati su GBIC forniti con o senza moduli GBIC. Gli adattatori Fibre Channel si differenziano per le classi che supportano e per una varietà di funzionalità. Per comprendere le differenze, presentiamo una tabella comparativa degli adattatori prodotti da QLogic.

Tabella della famiglia di adattatori bus host Fibre Channel
SANblade64 bitPubblico FCAL Ciclo PvtPorta FLClasse 3Porta FClasse 2Punto a puntoIP/SCSIDuplex completoNastro FCSpecifiche hot plug PCI 1.0Riconfigurazione dinamica di SolarisVIВ2 Gb
Serie 2100PCI 33 e 66 MHzXXX
Serie 2200PCI 33 e 66 MHzXXXXXXXXX
PCI 33MHzXXXXXXXXXX
25 MHZ SbusXXXXXXXXX X
Serie 230066 MHZ PCI / 133 MHZ PCI-XXXXXXXXXX XX

concentratori

Gli HUB (hub) Fibre Channel vengono utilizzati per connettere i nodi a un anello FC (FC Loop) e hanno una struttura simile agli hub Token Ring. Poiché un'interruzione dell'anello può causare l'interruzione del funzionamento della rete, i moderni hub FC utilizzano le porte del circuito di bypass della porta PBC, che aprono / chiudono automaticamente l'anello (collegano / scollegano i sistemi collegati all'hub). In genere, gli HUB FC supportano fino a 10 connessioni e possono impilare fino a 127 porte per anello. Tutti i dispositivi collegati all'HUB ricevono una larghezza di banda comune che possono condividere tra loro.

Interruttori

Gli switch Fibre Channel (switch) hanno le stesse funzioni degli switch LAN familiari al lettore. Forniscono connettività a piena velocità e non bloccante tra i nodi. Qualsiasi nodo connesso allo switch FC riceve la larghezza di banda completa (scalabile). All'aumentare del numero di porte su una rete commutata, aumenta anche la larghezza di banda. Gli switch possono essere utilizzati insieme agli hub (che vengono utilizzati per i siti che non richiedono larghezza di banda dedicata per ogni nodo) per ottenere il miglior rapporto prezzo/prestazioni. Grazie al cascading, gli switch possono essere potenzialmente utilizzati per creare reti FC con numero di indirizzi da 2 a 24 (oltre 16 milioni).

ponti

I bridge FC (bridge o multiplexer) vengono utilizzati per collegare dispositivi SCSI paralleli a una rete basata su FC. Forniscono la traduzione di pacchetti SCSI tra dispositivi Fibre Channel e Parallel SCSI, esempi dei quali sono Solid State Disk (SSD) o librerie a nastro. Va notato che di recente, quasi tutti i dispositivi che possono essere utilizzati all'interno della SAN, i produttori stanno iniziando a produrre con un'interfaccia FC integrata per la loro connessione diretta alle reti di archiviazione.

Server e storage

Nonostante il fatto che server e storage siano lontani dai componenti SAN meno importanti, non ci soffermeremo sulla loro descrizione, poiché siamo sicuri che tutti i nostri lettori li conoscano.

Alla fine, vorrei aggiungere che questo articolo è solo il primo passo verso le reti di archiviazione. Per comprendere appieno l'argomento, il lettore dovrebbe prestare molta attenzione alle caratteristiche di implementazione dei componenti da parte dei produttori di SAN e del software di gestione, poiché senza di essi la Storage Area Network è solo un insieme di elementi per la commutazione dei sistemi di archiviazione che non ti porteranno tutti i vantaggi dell'implementazione di una rete di archiviazione.

Conclusione

Oggi, la Storage Area Network è una tecnologia abbastanza nuova che potrebbe presto diventare mainstream tra i clienti aziendali. In Europa e negli Stati Uniti, le aziende con una flotta abbastanza ampia di sistemi di storage installati stanno già iniziando a migrare verso reti di area di archiviazione con il miglior costo totale di proprietà (TCO).

Gli analisti prevedono che nel 2005 un numero significativo di server di fascia media e alta verrà fornito con Fibre Channel preinstallato (questa tendenza è visibile oggi) e solo per le unità disco interne nei server verrà utilizzata l'interfaccia SCSI parallela. Già oggi, quando si costruiscono sistemi di storage e si acquistano server di livello medio e superiore, si dovrebbe prestare attenzione a questa promettente tecnologia, soprattutto perché oggi consente di implementare una serie di attività molto più economiche rispetto all'utilizzo di soluzioni specializzate. Inoltre, quando investi nella tecnologia SAN oggi, non perderai il tuo investimento domani, poiché le funzionalità di Fibre Channel creano una grande opportunità per sfruttare il tuo investimento in futuro.

P.S.

La versione precedente di questo articolo è stata scritta nel giugno 2000, ma a causa della mancanza di interesse popolare per la tecnologia di rete dell'area di archiviazione, la pubblicazione è stata rinviata per il futuro. Questo futuro è arrivato oggi e spero che questo articolo induca il lettore a rendersi conto della necessità di passare alla tecnologia di rete dell'area di archiviazione come tecnologia avanzata per la creazione di sistemi di archiviazione e l'organizzazione dell'accesso ai dati.

Stiamo iniziando una nuova sezione chiamata "Programma educativo". Qui verranno descritte cose apparentemente ben note, ma, come spesso si scopre, non a tutti, e non così bene. Speriamo che questa sezione possa essere utile.

Quindi, problema numero 1 - "Sistemi di archiviazione dati".

Sistemi di archiviazione dati.

In inglese, sono chiamati in una parola: archiviazione, che è molto conveniente. Ma questa parola è tradotta in russo piuttosto goffamente - "conservazione". Spesso nel gergo di "IT-Schnikov" usano la parola "storaj" nella trascrizione russa, o la parola "khranilka", ma questa è una cattiva educazione. Pertanto, utilizzeremo il termine "sistemi di archiviazione", sistemi di archiviazione abbreviati o semplicemente "sistemi di archiviazione".

I dispositivi di memorizzazione dei dati comprendono qualsiasi dispositivo per la registrazione dei dati: il cd. "Unità flash", dischi compatti (CD, DVD, ZIP), unità a nastro (Nastro), dischi rigidi (Hard disk, sono anche chiamati nei vecchi "dischi rigidi", poiché i loro primi modelli assomigliavano a una clip con cartucce di lo stesso nome fucile del 19° secolo) e così via. I dischi rigidi vengono utilizzati non solo all'interno dei computer, ma anche come dispositivi USB esterni per la registrazione di informazioni e persino, ad esempio, uno dei primi modelli di iPod è un piccolo disco rigido con un diametro di 1,8 pollici, con un'uscita per le cuffie e uno schermo integrato ...

Recentemente, il cosiddetto. I sistemi di archiviazione "Solid State" SSD (Solid State Disk, o Solid State Drive), che sono simili in linea di principio a una "unità flash" per una fotocamera o uno smartphone, hanno solo un controller e una quantità maggiore di dati memorizzati. A differenza di un disco rigido, un SSD non ha parti meccanicamente mobili. Sebbene i prezzi di tali sistemi di storage siano piuttosto elevati, stanno diminuendo rapidamente.

Tutti questi sono dispositivi di consumo, e tra i sistemi industriali, si dovrebbero evidenziare, prima di tutto, i sistemi di archiviazione hardware: gli array di dischi rigidi, i cosiddetti. Controller RAID per loro, sistemi di archiviazione su nastro per l'archiviazione dei dati a lungo termine. Inoltre, una classe a parte: controller per sistemi di storage, per la gestione del backup dei dati, creazione di "snapshot" (Snapshot) nel sistema di storage per il loro successivo ripristino, replica dei dati, ecc.). I sistemi di storage includono anche dispositivi di rete (HBA, switch Fibre Channel, cavi FC/SAS, ecc.). Infine, sono state sviluppate soluzioni su larga scala per l'archiviazione, l'archiviazione, il recupero dei dati e il ripristino di emergenza dei dati.

Da dove provengono i dati da archiviare? Da noi, persone care, utenti, programmi applicativi, e-mail, nonché da varie apparecchiature: file server e server di database. Inoltre, il fornitore di grandi quantità di dati - il cosiddetto. Dispositivi M2M (comunicazione Machine-to-Machine) - tutti i tipi di sensori, sensori, telecamere, ecc.

In base alla frequenza di utilizzo dei dati archiviati, i sistemi di archiviazione possono essere suddivisi in sistemi di archiviazione a breve termine (archiviazione online), archiviazione a media durata (archiviazione near-line) e sistemi di archiviazione a lungo termine (archiviazione offline).

Il primo può essere attribuito all'hard disk (o SSD) di un qualsiasi personal computer. Il secondo e il terzo sono sistemi di archiviazione esterni DAS (Direct Attached Storage), che possono essere un array di dischi esterni al computer (Disk Array). A loro volta, possono anche essere suddivisi in Just a Bunch Of Disks (JBOD) e controller di storage array di dischi intelligenti (iDAS).

I sistemi di storage esterno sono di tre tipi: DAS (Direct Attached Storage), SAN (Storage Area Network) e NAS (Network Attached Storage). Sfortunatamente, anche molti specialisti IT esperti non possono spiegare la differenza tra SAN e NAS, affermando che una volta esisteva questa differenza e ora presumibilmente non esiste più. In effetti, c'è una differenza, e significativa (vedi Fig. 1).

Figura 1. La differenza tra SAN e NAS.

In una SAN, i server stessi sono effettivamente connessi al sistema di storage tramite la SAN. Nel caso di NAS, i server di rete sono collegati tramite una rete locale (LAN) a un file system condiviso in RAID.

Protocolli di connessione di archiviazione di base

Protocollo SCSI(Small Computer System Interface), pronunciato skazi, è un protocollo sviluppato a metà degli anni '80 per collegare dispositivi esterni a mini-computer. La sua versione SCSI-3 è la base per tutti i protocolli di comunicazione di archiviazione e utilizza un set di comandi SCSI comune. I suoi principali vantaggi sono: indipendenza dal server utilizzato, possibilità di funzionamento in parallelo di più dispositivi, elevata velocità di trasferimento dati. Svantaggi: numero limitato di dispositivi collegati, il raggio di connessione è molto limitato.

Protocollo FC(Fiber Channel), un protocollo interno tra un server e storage condiviso, controller, dischi. È un protocollo di comunicazione seriale ampiamente utilizzato che opera a 4 o 8 Gigabit al secondo (Gbps). Come suggerisce il nome, funziona attraverso la fibra, ma può anche funzionare sul rame. Fibre Channel è il protocollo principale per i sistemi di storage SAN FC.

Protocollo ISCSI(Internet Small Computer System Interface), protocollo standard per il trasferimento di blocchi di dati sul noto protocollo TCP/IP es. SCSI su IP. iSCSI può essere visto come una soluzione di archiviazione ad alta velocità ea basso costo per sistemi di archiviazione collegati in remoto su Internet. iSCSI incapsula i comandi SCSI in pacchetti TCP/IP per la trasmissione su una rete IP.

Protocollo SAS(SCSI allegato seriale). SAS utilizza la trasmissione dati seriale ed è compatibile con i dischi rigidi SATA. Attualmente, SAS può trasferire dati a 3 Gbps o 6 Gbps e supporta la modalità full duplex, ad es. può trasferire dati in entrambe le direzioni alla stessa velocità.

Tipi di sistemi di stoccaggio.

Si possono distinguere tre principali tipologie di sistemi di stoccaggio:

  • DAS (Direct Attached Storage)
  • NAS (archiviazione collegata alla rete)
  • SAN (rete di archiviazione)

I sistemi di archiviazione con connessione diretta di dischi DAS sono stati sviluppati alla fine degli anni '70, a causa dell'aumento esplosivo dei dati degli utenti, che semplicemente non si adattavano fisicamente alla memoria interna a lungo termine dei computer, ma i computer di grandi dimensioni, il così- chiamati mainframe). La velocità di trasferimento dati in DAS non era molto elevata, da 20 a 80 Mbit/s, ma era abbastanza per le esigenze dell'epoca.

Figura 2. DAS

Lo storage di rete NAS è apparso nei primi anni '90. Il motivo era il rapido sviluppo delle reti ei requisiti critici per la condivisione di grandi quantità di dati all'interno della rete aziendale o dell'operatore. Il NAS utilizzava uno speciale file system di rete CIFS (Windows) o NFS (Linux), in modo che server diversi di utenti diversi potessero leggere lo stesso file dal NAS contemporaneamente. La velocità di trasferimento dati era già superiore: 1 - 10 Gbps.

Figura 3. NAS

A metà degli anni '90 sono apparse le reti per la connessione di dispositivi di archiviazione SAN FC. Il loro sviluppo è stato richiesto dalla necessità di organizzare i dati sparsi nella rete. Un singolo dispositivo di storage su una SAN può essere suddiviso in diversi piccoli nodi chiamati Logical Unit Number (LUN), ognuno dei quali appartiene a un singolo server. La velocità di trasferimento dati è aumentata a 2-8 Gbps. Tali sistemi di archiviazione potrebbero fornire tecnologie per proteggere i dati dalla perdita (istantanee, backup).

Figura 4. FC SAN

Un altro tipo di SAN è l'IP SAN (IP Storage Area Network), sviluppato nei primi anni 2000. Le SAN FC erano costose, difficili da gestire e le reti IP erano al loro apice, motivo per cui è nato questo standard. I sistemi di storage erano collegati ai server tramite un controller iSCSI tramite switch IP e fornivano una velocità di trasferimento dati di 1-10 Gb/s.

figura 5. IP SAN.

La tabella seguente mostra alcune caratteristiche comparative di tutti i sistemi di stoccaggio considerati:

Un tipo NAS SAN
Parametro FC SAN IP SAN DAS
Tipo di trasferimento SCSI, FC, SAS FC IP IP
Tipo di dati Blocco dati File Blocco dati Blocco dati
Applicazione tipica Qualsiasi File server Banca dati Monitoraggio video
Vantaggio Eccellente compatibilità Facile da installare, a basso costo Buona scalabilità Buona scalabilità
Screpolatura Difficoltà nel controllo.

Uso inefficiente delle risorse. Scarsa scalabilità

Scarse prestazioni.

Limitazioni nell'applicabilità

Alto prezzo.

Complessità della configurazione del ridimensionamento

Bassa produttività

In breve, le SAN sono progettate per trasferire enormi blocchi di dati ai sistemi di archiviazione, mentre i NAS forniscono l'accesso ai dati a livello di file. La combinazione SAN + NAS fornisce un'elevata integrazione dei dati, alte prestazioni e condivisione di file. Tali sistemi sono chiamati archiviazione unificata - "sistemi di archiviazione unificata".

Sistemi di archiviazione unificati: un'architettura di archiviazione di rete che supporta sia NAS basati su file che SAN basati su blocchi. Tali sistemi sono stati sviluppati all'inizio degli anni 2000 per risolvere i problemi amministrativi e l'elevato costo totale di proprietà di sistemi separati in un'unica impresa. Questo sistema di archiviazione supporta quasi tutti i protocolli: FC, iSCSI, FCoE, NFS, CIFS.

Dischi fissi

Tutti i dischi rigidi possono essere suddivisi in due tipi principali: HDD (Hard Disk Drive, che di fatto viene tradotto come "disco rigido") e SSD (Solid State Drive, - il cosiddetto "Solid State Drive"). Cioè, entrambe le unità sono dischi rigidi. Che cos'è, allora, un "soft disk"? Sì, in passato c'erano, venivano chiamati "floppy disk" (così venivano chiamati a causa del caratteristico suono "popping" nell'unità durante il funzionamento). Le unità per loro possono ancora essere viste nei blocchi di sistema dei vecchi computer, che sono stati conservati in alcune istituzioni governative. Tuttavia, con tutto il desiderio, tali dischi magnetici difficilmente possono essere attribuiti a SISTEMI di archiviazione. Questi erano alcuni analoghi delle attuali "unità flash", anche se di capacità molto ridotta.

La differenza tra HDD e SSD è che l'HDD ha diversi dischi magnetici coassiali all'interno e meccanismi complessi che muovono le testine di lettura-scrittura magnetiche, e l'SSD non ha parti meccaniche in movimento ed è, infatti, un microcircuito stampato in plastica . Pertanto, a rigor di termini, non è corretto chiamare "dischi rigidi" solo gli HDD.

I dischi rigidi possono essere classificati in base ai seguenti parametri:

  • Progettazione: HDD, SSD;
  • Diametro dell'HDD in pollici: 3,5, 2,5, 1,8 pollici;
  • Interfaccia: ATA/IDE, SATA/NL SAS, SCSI, SAS, FC
  • Classe di utilizzo: individuale (classe desktop), aziendale (classe enterprise).
Parametro SATA SAS NL-SAS SSD
Velocità di rotazione (RPM) 7200 15000/10000 7200 N / A
Capacità tipica (TB) 1T / 2T / 3T 0,3 T / 0,6 T / 0,9 T 2T / 3T / 4T 0.1T/0.2T/0.4T
MTBF (ora) 1 200 000 1 600 000 1 200 000 2 000 000
Note (modifica) Evoluzione dei dischi rigidi serial ATA.

SATA 2.0 supporta velocità di trasferimento di 300 MB/s, SATA3.0 supporta fino a 600 MB/s.

Il tasso di guasto annuale medio (AFR) per le unità SATA è di circa il 2%.

I dischi rigidi SATA con interfaccia SAS sono adatti per il tiering. Il tasso di guasto annualizzato (AFR) per le unità NL-SAS è di circa il 2%. Unità a stato solido costituite da chip di memoria elettronici, inclusi un dispositivo di controllo e un chip (FLASH / DRAM). Le specifiche dell'interfaccia, la funzione e il metodo di utilizzo sono gli stessi dell'HDD, le dimensioni e la forma sono le stesse.

Caratteristiche dei dischi rigidi.

  • Capacità

Nei moderni dischi rigidi, la capacità viene misurata in gigabyte o terabyte. Per HDD, questo valore è un multiplo della capacità di un disco magnetico all'interno della scatola, moltiplicato per il numero di quelli magnetici, di cui di solito ce ne sono diversi.

  • Velocità di rotazione (solo per HDD)

La velocità di rotazione dei dischi magnetici all'interno dell'unità, misurata in RPM (Rotation Per Minute), è solitamente di 5400 RPM o 7200 RPM. Gli HDD con interfacce SCSI/SAS hanno una velocità di rotazione di 10.000-15.000 RPM.

  • Tempo medio di accesso = Tempo medio di ricerca + Tempo medio di attesa, ad es. tempo per recuperare le informazioni dal disco.
  • Velocità di trasmissione

Questa è la velocità di lettura e scrittura dei dati su un disco rigido, misurata in megabyte al secondo (MB/S).

  • IOPS (input/output al secondo)

Operazioni di input/output al secondo, uno dei principali indicatori per misurare le prestazioni del disco. Per le applicazioni con operazioni di lettura e scrittura frequenti come l'elaborazione delle transazioni online (OLTP), IOPS è la metrica più importante perché le prestazioni dell'applicazione aziendale dipendono da questo. Un altro indicatore importante è il throughput dei dati, che può essere approssimativamente tradotto come "larghezza di banda di trasmissione dati", che mostra la quantità di dati che possono essere trasferiti per unità di tempo.

RAID

Non importa quanto siano affidabili i dischi rigidi, a volte i dati in essi contenuti vengono persi, per vari motivi. Pertanto, la tecnologia è stata proposta RAID (Redundant Array of Independent Disks) - una serie di dischi indipendenti con archiviazione dati ridondante. Ridondanza significa che tutti i byte di dati scritti su un disco vengono duplicati su un altro disco e possono essere utilizzati in caso di guasto del primo disco. Inoltre, questa tecnologia aiuta ad aumentare le IOPS.

I concetti base del RAID sono lo stripping (il cosiddetto "stripping" o separazione) e il mirroring (il cosiddetto "mirroring" o duplicazione) dei dati. Le loro combinazioni definiscono diversi tipi di array RAID del disco rigido.

Esistono i seguenti livelli di array RAID:

Le combinazioni di questi tipi danno origine a molti altri nuovi tipi di RAID:

La figura seguente spiega come viene eseguito RAID 0 (striping):

Riso. 6. RAID 0.

Ed ecco come viene eseguito RAID 1 (duplicazione):

Riso. 7. RADIO 1.

Ed è così che funziona RAID 3. XOR è una funzione logica OR esclusiva. Calcola il valore di parità per i blocchi di dati A, B, C, D ..., che viene scritto su un disco separato.

Riso. 8. RADIO 3.

I diagrammi sopra illustrano bene come funziona il RAID e non hanno bisogno di commenti. Non mostreremo i diagrammi del resto dei livelli RAID, chi lo desidera può trovarli su Internet.

Le principali caratteristiche dei tipi di RAID sono riportate nella tabella.

Software di archiviazione

Il software di archiviazione può essere classificato come segue:

  1. Gestione e amministrazione: gestione e impostazione dei parametri dell'infrastruttura: ventilazione, raffreddamento, modalità di funzionamento del disco, ecc., controllo dell'ora, ecc.
  2. Protezione dati: Istantanea, copia del contenuto LUN, mirror diviso, replica remota, CDP (protezione continua dei dati), ecc.
  3. Maggiore affidabilità: vari software per la copia multipla e il backup dei percorsi di trasmissione dei dati all'interno del data center e tra di essi.
  4. Miglioramento dell'efficienza: Thin Provisioning, storage a livelli automatico, deduplicazione, gestione QoS, prefetch della cache, partizionamento, migrazione automatica dei dati, riduzione della velocità di rotazione del disco (sping down del disco)

La tecnologia è molto interessante" approvvigionamento sottile". Come spesso accade nell'IT, i termini sono spesso difficili da tradurre adeguatamente in russo, ad esempio, è difficile tradurre con precisione la parola "provisioning" ("provisioning", "support", "provisioning" - nessuno di questi termini trasmette completamente il significato). E quando è “sottile”...

Un prestito bancario può essere utilizzato per illustrare il thin provisioning. Quando una banca emette diecimila carte di credito con un limite di 500mila, non ha bisogno di avere 5 miliardi sul conto per servire questo volume di prestiti. Gli utenti di carte di credito di solito non spendono l'intero prestito in una volta e ne utilizzano solo una piccola parte. Tuttavia, ogni utente individualmente può utilizzare l'intero o quasi l'importo del prestito, se l'importo totale dei fondi della banca non è esaurito.

Riso. 9. Provisioning sottile.

Pertanto, l'uso del thin provisioning consente di risolvere il problema dell'allocazione inefficiente dello spazio nella SAN, risparmiare spazio, facilitare le procedure amministrative per l'allocazione dello spazio alle applicazioni sullo storage e utilizzare il cosiddetto oversubscribe, ovvero allocare più spazio alle applicazioni rispetto a quello che abbiamo fisicamente, contando che le applicazioni non occuperanno tutto lo spazio contemporaneamente. Poiché la necessità si presenta in seguito, è possibile aumentare la capacità di archiviazione fisica.

L'archiviazione a livelli presuppone che dati diversi siano archiviati in dispositivi di archiviazione che rispondono alla frequenza con cui si accede ai dati. Ad esempio, i dati utilizzati di frequente possono essere inseriti in "archiviazione online" su unità SSD con alta velocità di accesso e prestazioni elevate. Tuttavia, il prezzo di tali dischi è ancora elevato, quindi è consigliabile utilizzarli solo per l'archiviazione online (per ora).

Anche le unità FC/SAS sono veloci ea prezzi ragionevoli. Pertanto, tali dischi sono adatti per l'"archiviazione near-line", in cui vengono archiviati i dati, il cui accesso non avviene così spesso, ma allo stesso tempo e non così raramente.

Infine, le unità SATA / NL-SAS hanno una velocità di accesso relativamente lenta, ma sono di grande capacità e relativamente economiche. Pertanto, l'archiviazione offline viene solitamente eseguita su di essi, per dati di uso raro.

Non appena il sistema di controllo rileva che l'accesso ai dati nell'archiviazione offline è diventato più frequente, li trasferisce sull'archiviazione near-line e, con un'ulteriore attivazione del loro utilizzo, sull'archiviazione online su dischi SSD.

Deduplicazione (eliminazione della duplicazione) dei dati(deduplicazione, DEDUP). Come suggerisce il nome, la deduplicazione elimina la duplicazione dei dati nello spazio su disco comunemente utilizzato per i backup dei dati. Sebbene il sistema non sia in grado di determinare quali informazioni siano ridondanti, può rilevare la presenza di dati duplicati. Ciò consente di ridurre significativamente i requisiti di capacità del sistema di backup.

Ridurre la velocità di rotazione del disco (Disk spin-down) - quello che di solito viene chiamato "ibernazione" (sleep) del disco. Se i dati su un disco non vengono utilizzati per molto tempo, allora Spin-down del disco lo mette in modalità di ibernazione per ridurre il consumo energetico facendo girare inutilmente il disco a velocità normale. Ciò aumenta anche la durata del disco e aumenta l'affidabilità del sistema nel suo insieme. Quando arriva una nuova richiesta di dati su questo disco, questo "si sveglia" e la sua velocità di rotazione torna normale. Il prezzo da pagare per il risparmio energetico e la maggiore affidabilità è una certa latenza quando si accede per la prima volta ai dati su disco, ma ne vale la pena.

Istantanea del disco (Istantanea). Uno snapshot è una copia completamente utilizzabile di uno specifico set di dati su disco nel momento in cui è stata eseguita la copia (motivo per cui viene chiamato "snapshot"). Tale copia viene utilizzata per ripristinare parzialmente lo stato del sistema al momento della copia. Allo stesso tempo, la continuità del sistema non è affatto compromessa e le prestazioni non si deteriorano.

Replica remota: Funziona utilizzando la tecnologia Mirroring. Può conservare più copie dei dati su due o più siti per prevenire la perdita di dati in caso di disastri naturali. Esistono due tipi di replica: sincrona e asincrona, la differenza tra loro è spiegata nella figura.

Riso. 10. Replica remota dei dati (Replica remota).

Protezione continua dei dati (CDP) Conosciuto anche come backup continuo o backup in tempo reale, crea automaticamente un backup ogni volta che i dati cambiano. Allo stesso tempo, diventa possibile ripristinare i dati in caso di eventuali disastri in qualsiasi momento, e allo stesso tempo è disponibile una copia aggiornata dei dati e non di quelli che erano pochi minuti o ore fa.

Software di gestione: questo include una varietà di software per la gestione e l'amministrazione di vari dispositivi: semplici programmi di configurazione (procedure guidate di configurazione), programmi di monitoraggio centralizzato: mappatura della topologia, monitoraggio in tempo reale, meccanismi di segnalazione dei crash. Include anche programmi di garanzia aziendale: statistiche sulle prestazioni multidimensionali, rapporti e query sulle prestazioni e altro ancora.

Ripristino di emergenza (DR)... Questo è un componente abbastanza importante dei sistemi di stoccaggio industriale seri, sebbene sia piuttosto costoso. Ma questi costi devono essere sostenuti per non perdere da un giorno all'altro "ciò che è stato acquisito con il superlavoro". I suddetti sistemi di protezione dei dati (Snapshot, Remote Replication, CDP) sono validi finché non si verificano disastri naturali nell'insediamento in cui si trova il sistema di archiviazione: tsunami, inondazioni, terremoti o (pah-pah-pah) - guerra nucleare. E qualsiasi guerra può anche rovinare notevolmente la vita delle persone che sono impegnate in cose utili, ad esempio, archiviare dati e non correre con una mitragliatrice per tagliare i territori di altre persone o punire alcuni "infedeli". La replica remota presuppone che il sistema di archiviazione replicato si trovi nella stessa città o almeno nelle vicinanze. Ciò, ad esempio, non aiuta in caso di tsunami.

La tecnologia di Disaster Recovery presuppone che il centro di backup utilizzato per il ripristino dei dati in caso di calamità naturali si trovi ad una distanza considerevole dal centro dati principale, e interagisca con esso tramite una rete di trasmissione dati sovrapposta a una rete di trasporto, il più delle volte ottica. Con una tale disposizione dei data center principali e di backup, ad esempio, sarà semplicemente impossibile utilizzare la tecnologia CDP.

La tecnologia DR utilizza tre concetti fondamentali:

  • BW (finestra di backup)- "finestra di backup", il tempo necessario al sistema di backup per copiare il volume di dati ricevuti dal sistema funzionante.
  • RPO (obiettivo del punto di ripristino)- "Punto di ripristino valido", il periodo di tempo massimo e la corrispondente quantità di dati che è accettabile perdere per l'utente dello storage.
  • RTO (obiettivo del tempo di recupero)- "tempo di indisponibilità accettabile", il tempo massimo durante il quale il sistema di storage può essere non disponibile, senza un impatto critico sul core business.

Riso. 11. Tre concetti fondamentali della tecnologia DR.

* * *

Questo saggio non ha la pretesa di essere completo e spiega solo i principi di base dello stoccaggio, anche se non completamente. Diverse fonti su Internet contengono molti documenti che descrivono in modo più dettagliato tutti i punti qui esposti (e non esposti).

Continuando il tema dell'archiviazione sui sistemi di archiviazione degli oggetti -.

La dipendenza dei processi aziendali dell'impresa dalla sfera IT è in costante crescita. Oggi non solo le grandi aziende, ma anche rappresentanti di medie e spesso piccole imprese sono attente al tema della continuità dei servizi informatici.

Uno degli elementi centrali per garantire la tolleranza agli errori è un sistema di archiviazione dei dati (DSS), un dispositivo su cui tutte le informazioni sono archiviate centralmente. Il sistema di archiviazione è caratterizzato da elevata scalabilità, tolleranza ai guasti, capacità di eseguire tutte le operazioni di servizio senza interrompere il funzionamento del dispositivo (compresa la sostituzione dei componenti). Ma il costo anche di un modello base si misura in decine di migliaia di dollari. Ad esempio, Fujitsu ETERNUS DX100 con 12 dischi Nearline SAS 1 Tb SFF (RAID10 6 TB) vale l'ordine 21.000 USD, che è molto costoso per una piccola azienda.

Nel nostro articolo, proponiamo di considerare opzioni per organizzare l'archiviazione del budget, che non perde in prestazioni e affidabilità rispetto ai sistemi classici. Per implementarlo, proponiamo di utilizzare CEPH.

Cos'è CEPH e come funziona?

CEPH- storage basato su software libero, è una combinazione di spazi su disco di più server (il numero di server in pratica si misura in decine e centinaia). CEPH consente di creare storage altamente scalabile con prestazioni elevate e ridondanza delle risorse. CEPH può essere utilizzato sia come storage di oggetti (per archiviare file) che come dispositivo a blocchi (per fornire dischi rigidi virtuali).

La tolleranza agli errori di archiviazione è assicurata replicando ogni blocco di dati su più server. Il numero di copie memorizzate contemporaneamente di ciascun blocco è chiamato fattore di replica, per impostazione predefinita il suo valore è 2. Lo schema dell'operazione di archiviazione è mostrato in Figura 1, come vediamo le informazioni sono suddivise in blocchi, ognuno dei quali è distribuito su due diversi nodi.

Figura 1 - Distribuzione dei blocchi di dati


Se i server non utilizzano array di dischi a tolleranza d'errore, si consiglia di utilizzare un fattore di replica più elevato per un'archiviazione affidabile dei dati. In caso di guasto di uno dei server, CEPH corregge l'indisponibilità dei blocchi dati (Figura 2) che si trovano su di esso, attende un certo tempo (il parametro è configurato, di default 300 secondi), dopo di che inizia a ricreare i blocchi di informazioni mancanti in un altro luogo (Figura 3).

Figura 2 - Guasto di un nodo


Figura 3 - Ripristino della ridondanza


Allo stesso modo, se un nuovo server viene aggiunto al cluster, lo storage viene ribilanciato per riempire uniformemente i dischi su tutti i nodi. Il meccanismo che controlla la distribuzione dei blocchi di informazioni nel cluster CEPH è chiamato CRUSH.

Per ottenere elevate prestazioni di spazio su disco nei cluster CEPH, si consiglia di utilizzare la funzionalità di tiering della cache. Il suo significato è creare un pool separato ad alte prestazioni e utilizzarlo per la memorizzazione nella cache, mentre le informazioni principali verranno collocate su dischi più economici (Figura 4).

Figura 4 - Vista logica dei lotti di dischi


La memorizzazione nella cache a livelli funzionerà come segue: le richieste di scrittura del client verranno scritte nel pool più veloce e quindi spostate nel livello di archiviazione. Allo stesso modo, per le richieste di lettura, le informazioni al momento dell'accesso verranno portate al livello di memorizzazione nella cache ed elaborate. I dati continuano a rimanere a livello di cache finché non diventano inattivi o non diventano irrilevanti (Figura 5). Vale la pena notare che la memorizzazione nella cache può essere configurata per la sola lettura, nel qual caso le richieste di scrittura verranno scritte direttamente nel pool di archiviazione.

Figura 5 - Il principio di funzionamento del cash-thyrring


Consideriamo scenari reali di utilizzo di CEPH in un'organizzazione per creare un data warehouse. Le piccole e medie imprese sono considerate un potenziale cliente, dove questa tecnologia sarà più richiesta. Abbiamo calcolato 3 scenari per l'utilizzo della soluzione descritta:

  1. Un'impresa manifatturiera o commerciale con un requisito per la disponibilità di un sistema ERP interno e archiviazione di file 99,98% all'anno, 24 ore su 24, 7 giorni su 7.
  2. Un'organizzazione che ha bisogno di distribuire un cloud privato locale per le proprie esigenze aziendali.
  3. Una soluzione molto economica per l'organizzazione dell'archiviazione dei dati a blocchi a tolleranza di errore, completamente indipendente dall'hardware con disponibilità del 99,98% all'anno e scalabilità economica.

Caso d'uso 1: data warehouse basato su CEPH

Diamo un'occhiata a un esempio reale di CEPH applicato in un'organizzazione. Ad esempio, abbiamo bisogno di 6 TB di storage ad alte prestazioni a tolleranza di errore, ma i costi anche per un modello di storage di base con dischi sono dell'ordine di $21 000 .

Mettere insieme un repository basato su CEPH. Proponiamo di utilizzare la soluzione come server Gemello Supermicro(Figura 6). Il prodotto rappresenta 4 piattaforme server in un unico case da 2 unità, tutti i nodi principali del dispositivo sono duplicati, il che garantisce il suo funzionamento continuo. Per realizzare il nostro compito basterà utilizzare 3 nodi, il 4° sarà di riserva per il futuro.




Figura 6 - Supermicro Twin


Completiamo ciascuno dei nodi come segue: 32 GB di RAM, un processore a 4 core da 2,5 GHz, 4 dischi SATA da 2 TB ciascuno per lo storage pool sono combinati in 2 array RAID1, anche 2 dischi SSD per il caching pool sono combinati in RAID1. Il costo dell'intero progetto è mostrato nella tabella 1.

Tabella 1. Componenti per l'archiviazione basati su CEPH

Componenti Prezzo, USD Qtà Costo, USD
4 999,28 1 4 999,28
139,28 6 835,68
Processore Ivy Bridge-EP 4-core 2,5GHz (LGA2011, 10MB, 80W, 22nm) Vassoio 366,00 3 1 098,00
416,00 12 4 992,00
641,00 6 3 846,00
TOTALE 15 770,96

Conclusione: Come risultato della creazione dello storage, otteniamo un array di dischi da 6 Tb con costi dell'ordine di $16 000 , che cosa 25% in meno rispetto all'acquisto di un sistema di storage minimo, mentre alle capacità attuali è possibile eseguire macchine virtuali che funzionano con storage, risparmiando così sull'acquisto di server aggiuntivi. In realtà, questa è una soluzione completa.

I server da cui è costruito lo storage possono essere utilizzati non solo come storage per i dischi rigidi, ma anche come storage per macchine virtuali o server applicativi.

Caso d'uso 2: crea un cloud privato

La sfida è distribuire l'infrastruttura per creare un cloud privato a un costo minimo.

Costruire anche una piccola nuvola composta, ad esempio, da 3 vettori in circa $36 000 : $ 21.000 - il costo dello storage + $ 5000 per ogni server con il 50% di contenuto.

L'utilizzo di CEPH come storage consente di combinare risorse di elaborazione e disco sullo stesso hardware. Ciò significa che non è necessario acquistare separatamente i sistemi di archiviazione: i dischi installati direttamente nei server verranno utilizzati per ospitare le macchine virtuali.

Riferimento rapido:
La classica struttura cloud è un cluster di macchine virtuali, il cui funzionamento è assicurato da 2 componenti hardware principali:

  1. Parte informatica (calcolo) - server pieni di RAM e processori, le cui risorse sono utilizzate dalle macchine virtuali per l'elaborazione
  2. Sistema di archiviazione (archiviazione) - un dispositivo pieno di dischi rigidi, che memorizza tutti i dati.

Prendiamo gli stessi server Supermicro come apparecchiature, ma installiamo processori più potenti - 8 core con una frequenza di 2,6 GHz e 96 GB di RAM in ciascun nodo, poiché il sistema verrà utilizzato non solo per l'archiviazione delle informazioni, ma anche per il funzionamento delle macchine virtuali. Prendiamo un set di dischi simile al primo scenario.

Tabella 2. Hardware per cloud privato CEPH

Componenti Prezzo, USD Qtà Costo, USD
Supermicro Twin 2027PR-HTR: 4 sistemi hot plug (nodi) in un fattore di forma 2U. Doppia presa R (LGA 2011), RDIMM ECC fino a 512 GB, IPMI 2.0 integrato con KVM e LAN dedicata. 6 alloggiamenti per HDD SATA hot-swap da 2,5". Alimentatori ridondanti da 2000 W 4 999,28 1 4 999,28
Modulo di memoria Samsung DDR3 16GB Registrato ECC 1866Mhz 1.5V, Dual rank 139,28 18 2 507,04
Processore Intel Xeon E5-2650V2 Ivy Bridge-EP 8-core 2,6 GHz (LGA2011, 20 MB, 95 W, 32 nm) Vassoio 1 416,18 3 4 248,54
Disco Rigido SATA 2TB 2,5" Capacità Enterprise SATA 6Gb/s 7200rpm 128Mb 512E 416 12 4 992,00
Unità a stato solido SSD 2.5"" 400GB DC S3710 Series. 641 6 3 846,00
TOTALE 20 592,86

Il cloud raccolto avrà le seguenti risorse, tenendo conto della conservazione della stabilità in caso di guasto del 1° nodo:

  • RAM: 120 GB
  • Spazio su disco 6000 GB
  • Core del processore fisico: 16 pz.

Il cluster assemblato sarà in grado di supportare circa 10 macchine virtuali medie con le seguenti caratteristiche: 12 GB di RAM / 4 core del processore / 400 GB di spazio su disco.

Vale anche la pena considerare che tutti e 3 i server sono pieni solo al 50% e, se necessario, possono essere riforniti, raddoppiando così il pool di risorse per il cloud.

Conclusione: Come puoi vedere, abbiamo ottenuto sia un vero e proprio cluster di failover di macchine virtuali sia un'archiviazione ridondante dei dati - il guasto di uno qualsiasi dei server non è critico - il sistema continuerà a funzionare senza fermarsi, mentre il costo della soluzione è circa 1,5 volte inferiore piuttosto che acquistare sistemi di storage e server separati.

Caso d'uso 3: costruire un data warehouse super economico

Se il budget è completamente limitato e non ci sono soldi per l'acquisto dell'attrezzatura sopra descritta, puoi acquistare server usati, ma non dovresti risparmiare sui dischi: si consiglia vivamente di acquistarne di nuovi.

Proponiamo di considerare la seguente struttura: acquistata 4 nodi server, ogni server ha 1 unità SSD per la memorizzazione nella cache e 3 unità SATA... I server Supermicro con 48 GB di RAM e processori serie 5600 possono ora essere acquistati per circa $800 .

I dischi non verranno assemblati in array a tolleranza d'errore su ciascun server, ma verranno presentati come un dispositivo separato. A questo proposito, per migliorare l'affidabilità dello storage, utilizzeremo il fattore di replica 3. Cioè, ogni blocco avrà 3 copie. Con questa architettura, il mirroring del disco della cache SSD non è richiesto, poiché le informazioni vengono duplicate automaticamente su altri nodi.

Tabella 3. Accessori per la conservazione

Conclusione: Se necessario, questa soluzione può utilizzare dischi di dimensioni maggiori, oppure sostituirli con SAS, se è necessario ottenere le massime prestazioni per il funzionamento del DBMS. In questo esempio, il risultato è 8 TB di storage con un costo molto basso e una disponibilità molto elevata. Il prezzo di un terabyte si è rivelato 3,8 volte più economico rispetto a quando si utilizza lo stoccaggio industriale per $ 21.000.

Tabella riassuntiva, conclusioni

Configurazione Archiviazione Fujitsu ETERNUS DX100 + 12 Nearline SAS 1Tb SFF (RAID10) Archiviazione Fujitsu ETERNUS DX100 + 12 Nearline SAS 1Tb SFF (RAID10) + Supermicro Twin Il nostro scenario 1: archiviazione basata su CEPH Il nostro scenario 2: costruire un cloud privato Il nostro scenario 3: costruire storage ultra-economico
Volume utile, GB 6 000 6 000 6 000 6000 8 000
Prezzo, USD 21000 36000 15 770 20 592 7 324
Costo di 1 GB, USD 3,5 6 2,63 3,43 0,92
Numero di IOP * (lettura 70% / scrittura 30%, dimensione blocco 4K) 760 760 700 700 675
Appuntamento Conservazione Archiviazione + Informatica Archiviazione + Informatica Archiviazione + Informatica Archiviazione + Informatica

* Il calcolo del numero di IOP è stato eseguito per gli array creati di dischi NL SAS su sistemi di archiviazione e dischi SATA su archiviazione CEPH, la memorizzazione nella cache è stata disabilitata per la purezza dei valori ottenuti. Con la memorizzazione nella cache, gli IOP saranno significativamente più alti finché la cache non sarà piena.

Di conseguenza, possiamo dire che sulla base del cluster CEPH possono essere costruiti data warehouse affidabili ed economici. I calcoli hanno dimostrato che l'utilizzo dei nodi cluster solo per lo storage non è molto efficiente - la soluzione è più economica rispetto all'acquisto di sistemi di storage, ma non di molto - nel nostro esempio, il costo dello storage su CEPH era di circa il 25% inferiore rispetto a Fujitsu DX100. I risparmi reali si avvertono come risultato della combinazione della parte informatica e dello storage sullo stesso hardware: in questo caso, il costo della soluzione sarà 1,8 volte inferiore rispetto a quando si costruisce una struttura classica utilizzando storage dedicato e macchine host separate.

EFSOL implementa questa soluzione in base alle esigenze individuali. Possiamo utilizzare l'attrezzatura che hai, il che ridurrà ulteriormente i costi di capitale dell'implementazione del sistema. Contattaci e condurremo un'indagine sulla tua attrezzatura per il suo utilizzo nella creazione di sistemi di stoccaggio.

Come sapete, negli ultimi anni c'è stato un intenso aumento del volume di informazioni e dati accumulati. La ricerca di IDC Digital Universe ha dimostrato che è probabile che il contenuto digitale mondiale cresca da 4,4 zettebyte a 44 zettebyte entro il 2020. Secondo gli esperti, il volume delle informazioni digitali raddoppia ogni due anni. Pertanto, oggi il problema non solo dell'elaborazione delle informazioni, ma anche della loro conservazione è estremamente urgente.

Per affrontare questo problema, esiste attualmente uno sviluppo molto attivo di una direzione come lo sviluppo di sistemi di archiviazione (reti / sistemi di archiviazione). Proviamo a capire cosa intende esattamente il moderno settore IT con il concetto di "sistema di archiviazione dei dati".

Lo storage è una soluzione integrata software e hardware finalizzata all'organizzazione dell'archiviazione affidabile e di alta qualità di varie risorse informative, oltre a fornire un accesso ininterrotto a tali risorse.

La creazione di un tale complesso dovrebbe aiutare a risolvere una serie di problemi che devono affrontare le imprese moderne nel corso della costruzione di un sistema informativo integrale.

I componenti principali del sistema di archiviazione:

Dispositivi di archiviazione (libreria a nastro, array di dischi interni o esterni);

Sistema di monitoraggio e controllo;

Sottosistema di backup/archiviazione dei dati;

Software per la gestione dell'archiviazione;

Infrastruttura per l'accesso a tutti i dispositivi di archiviazione.

Compiti principali

Consideriamo i compiti più tipici:

Decentramento delle informazioni. Alcune organizzazioni hanno una struttura di filiali sviluppata. Ogni unità separata di tale organizzazione dovrebbe avere libero accesso a tutte le informazioni di cui ha bisogno per funzionare. I moderni sistemi di storage interagiscono con utenti che si trovano a grande distanza dal centro in cui viene eseguita l'elaborazione dei dati, quindi sono in grado di risolvere questo problema.

Mancata previsione delle risorse finali richieste. Quando si pianifica un progetto, può essere estremamente difficile determinare esattamente con quale quantità di informazioni si dovrà lavorare durante il funzionamento del sistema. Inoltre, la massa dei dati accumulati è in costante aumento. La maggior parte dei moderni sistemi di storage supporta la scalabilità (la capacità di aumentare le proprie prestazioni dopo aver aggiunto risorse), quindi la capacità del sistema può essere aumentata in proporzione all'aumento dei carichi (upgrade).

Sicurezza di tutte le informazioni memorizzate. Può essere piuttosto difficile controllare e limitare l'accesso alle risorse informative di un'azienda. Azioni non qualificate del personale di servizio e degli utenti, tentativi deliberati di sabotaggio: tutto ciò può causare danni significativi ai dati memorizzati. I moderni sistemi di storage utilizzano vari schemi di tolleranza agli errori per resistere sia al sabotaggio deliberato che alle azioni inopportune di dipendenti non qualificati, preservando così l'operatività del sistema.

La complessità della gestione dei flussi informativi distribuiti - qualsiasi azione volta a modificare i dati delle informazioni distribuite in una delle filiali crea inevitabilmente una serie di problemi - dalla complessità della sincronizzazione di diversi database e versioni dei file degli sviluppatori alla duplicazione non necessaria delle informazioni. I prodotti software di gestione forniti con lo storage possono aiutarti a ottimizzare la complessità e l'efficienza delle informazioni memorizzate.

Costi elevati. I costi di archiviazione dei dati rappresentano circa il 23% di tutta la spesa IT, secondo uno studio condotto da IDC Perspectives. Questi costi includono il costo delle parti software e hardware del complesso, i pagamenti al personale di servizio, ecc. L'utilizzo di sistemi di archiviazione consente di risparmiare sull'amministrazione del sistema e fornisce anche una riduzione dei costi del personale.


Le principali tipologie di sistemi di stoccaggio

Tutti i sistemi di archiviazione dati sono divisi in 2 tipi: sistemi di archiviazione su nastro e su disco. Ciascuna delle due specie sopra menzionate è suddivisa, a sua volta, in più sottospecie.

Sistemi di archiviazione su disco

Tali sistemi di archiviazione dei dati vengono utilizzati per creare copie intermedie di backup, nonché per il lavoro operativo con vari dati.

I sistemi di archiviazione su disco sono suddivisi nelle seguenti sottospecie:

Dispositivi di backup (varie librerie di dischi);

Dispositivi per dati di lavoro (apparecchiature ad alte prestazioni);

Dispositivi utilizzati per l'archiviazione a lungo termine degli archivi.


Archiviazione su nastro

Utilizzato per creare archivi e backup.

I sistemi di archiviazione su nastro sono suddivisi nelle seguenti sottospecie:

Librerie a nastro (due o più unità, molti slot per nastri);

Caricatori automatici (1 unità, più slot per nastro);

Azionamenti separati.

Principali interfacce di connessione

Sopra abbiamo esaminato i principali tipi di sistemi, e ora diamo uno sguardo più da vicino alla struttura dei sistemi di archiviazione stessi. I moderni sistemi di archiviazione sono classificati in base al tipo di interfaccia host che utilizzano. Considera di seguito le 2 interfacce di connessione esterne più comuni: SCSI e FibreChannel. L'interfaccia SCSI assomiglia all'IDE ampiamente utilizzato ed è un'interfaccia parallela che può ospitare sedici dispositivi su un bus (per l'IDE, come sapete, due dispositivi per canale). La velocità massima del protocollo SCSI oggi è di 320 megabyte al secondo (è attualmente in fase di sviluppo una versione che fornirà velocità di 640 megabyte al secondo). Gli svantaggi di SCSI sono i seguenti: scomodo, non avendo immunità al rumore, cavi troppo spessi, la cui lunghezza massima non supera i venticinque metri. Anche il protocollo SCSI stesso impone alcune restrizioni: di norma, si tratta di 1 iniziatore sul bus più dispositivi slave (unità nastro, dischi, ecc.).

FibreChannel è meno utilizzato di SCSI perché l'hardware utilizzato per questa interfaccia è più costoso. Inoltre, FibreChannel viene utilizzato per implementare reti di storage SAN di grandi dimensioni, quindi viene utilizzato solo nelle grandi aziende. Le distanze possono essere praticamente qualsiasi: dai trecento metri standard per le apparecchiature standard ai duemila chilometri per gli interruttori potenti ("registi"). Il vantaggio principale dell'interfaccia FibreChannel è la capacità di combinare più dispositivi di archiviazione e host (server) in una rete SAN comune. Vantaggi meno importanti sono: distanze maggiori rispetto a SCSI, possibilità di aggregazione dei collegamenti e ridondanza dei percorsi di accesso, possibilità di apparecchiature "hot-plug" e maggiore immunità ai disturbi. Vengono utilizzati cavi ottici bipolari unipolari e multimodali (con connettori SC o LC), nonché SFP - trasmettitori ottici realizzati sulla base di emettitori laser o LED (questi componenti determinano la distanza massima tra i dispositivi utilizzati, nonché la velocità di trasmissione).

Opzioni della topologia di archiviazione

Tradizionalmente, i sistemi di archiviazione vengono utilizzati per connettere i server a DAS, un sistema di archiviazione dei dati. Oltre a DAS, ci sono anche NAS - dispositivi di archiviazione che si collegano alla rete, nonché SAN - componenti delle reti di archiviazione. I sistemi SAN e NAS sono stati creati come alternativa all'architettura DAS. Allo stesso tempo, ciascuna delle soluzioni di cui sopra è stata sviluppata in risposta alle esigenze in costante aumento dei moderni sistemi di archiviazione dei dati e si basava sull'uso delle tecnologie disponibili in quel momento.

Le prime architetture di archiviazione in rete sono state sviluppate negli anni '90 per affrontare alcune delle carenze più tangibili dei sistemi DAS. Le soluzioni di storage networking sono state progettate per affrontare gli obiettivi sopra indicati: ridurre i costi e la complessità della gestione dei dati, ridurre il traffico LAN e migliorare le prestazioni complessive e la disponibilità dei dati. Detto questo, le architetture SAN e NAS affrontano diversi aspetti di un problema comune. Di conseguenza, 2 architetture di rete iniziarono a esistere contemporaneamente. Ognuno di loro ha le sue funzionalità e vantaggi.

DAS


(D diretto UN allegato S toraggio)È una soluzione architetturale utilizzata nei casi in cui un dispositivo adibito all'archiviazione di dati digitali è connesso tramite protocollo SAS tramite un'interfaccia direttamente ad un server o ad una workstation.


I principali vantaggi dei sistemi DAS: basso costo rispetto ad altre soluzioni di storage, facilità di implementazione e amministrazione, scambio di dati ad alta velocità tra il server e il sistema di storage.

I vantaggi di cui sopra hanno permesso ai sistemi DAS di diventare estremamente popolari nel segmento delle piccole reti aziendali, dei provider di hosting e dei piccoli uffici. Ma allo stesso tempo, i sistemi DAS hanno anche i loro svantaggi, ad esempio, l'utilizzo non ottimale delle risorse, spiegato dal fatto che ogni sistema DAS richiede una connessione server dedicata, inoltre, ciascuno di questi sistemi consente di connettere non più di due server a un ripiano per dischi in una determinata configurazione.

vantaggi:

Costo accessibile. Il sistema di archiviazione è essenzialmente un cestello di dischi installato all'esterno del server, dotato di dischi rigidi.

Fornire uno scambio ad alta velocità tra il server e l'array di dischi.


Screpolatura:

Affidabilità insufficiente: in caso di incidente o problemi nella rete, il server cessa di essere disponibile per un numero di utenti.

Latenza elevata dovuta al fatto che tutte le richieste vengono elaborate da un server.

Scarsa gestibilità: la disponibilità di tutta la capacità su un singolo server riduce la flessibilità della distribuzione dei dati.

Scarso utilizzo delle risorse: la quantità di dati richiesta è difficile da prevedere: alcuni dispositivi DAS in un'organizzazione potrebbero riscontrare una capacità eccessiva, mentre altri potrebbero non avere una capacità sufficiente, poiché la riallocazione della capacità richiede solitamente troppo tempo o addirittura impossibile.

NAS


(n rete UN allegato S toraggio)È un sistema disco autonomo integrato che include un server NAS con un proprio sistema operativo specializzato e una serie di funzioni intuitive che forniscono un avvio rapido del sistema e l'accesso a qualsiasi file. Il sistema è collegato a una normale rete di computer, consentendo agli utenti di questa rete di risolvere il problema della mancanza di spazio libero su disco.

Il NAS è uno storage che si connette alla rete come un normale dispositivo di rete, fornendo l'accesso ai file ai dati digitali. Qualsiasi dispositivo NAS è una combinazione del sistema di archiviazione e del server a cui è connesso il sistema. Il dispositivo NAS più semplice è un server di rete che fornisce condivisioni di file.

I dispositivi NAS sono costituiti da un'unità principale che esegue l'elaborazione dei dati e collega anche una catena di dischi in una singola rete. Il NAS consente l'archiviazione su reti Ethernet. L'accesso condiviso ai file è organizzato in essi utilizzando il protocollo TCP / IP. Tali dispositivi consentono la condivisione di file anche tra client con sistemi che eseguono sistemi operativi diversi. A differenza dell'architettura DAS, i sistemi NAS non devono portare i server offline per aumentare la capacità complessiva; l'aggiunta di unità alla struttura NAS può essere eseguita semplicemente collegando il dispositivo alla rete.

La tecnologia NAS si sta sviluppando oggi come alternativa ai server universali che svolgono un gran numero di funzioni diverse (e-mail, server fax, applicazioni, stampa, ecc.). I dispositivi NAS, a differenza dei server universali, svolgono solo una funzione: un file server, cercando di farlo nel modo più rapido, semplice ed efficiente possibile.

La connessione del NAS a una LAN fornisce l'accesso alle informazioni digitali per un numero illimitato di client eterogenei (ovvero client con sistemi operativi diversi) o altri server. Quasi tutti i dispositivi NAS oggi vengono utilizzati su reti Ethernet basate su protocolli TCP/IP. L'accesso ai dispositivi NAS viene effettuato utilizzando protocolli di accesso speciali. I protocolli di accesso ai file più comuni sono DAFS, NFS, CIFS. All'interno di tali server sono installati sistemi operativi specializzati.

Un dispositivo NAS può sembrare una normale scatola con una porta Ethernet e un paio di dischi rigidi, oppure può essere un enorme sistema dotato di diversi server dedicati, un numero enorme di unità e porte Ethernet esterne. A volte i dispositivi NAS fanno parte di una rete SAN. In questo caso, non dispongono di proprie unità, ma forniscono solo l'accesso ai dati che si trovano sui dispositivi a blocchi. In questo caso, il NAS funge da potente server dedicato e la SAN da dispositivo di archiviazione. In questo caso, una singola topologia DAS è formata da componenti SAN e NAS.

Vantaggi

Basso costo, disponibilità di risorse per i singoli server, nonché per qualsiasi computer dell'organizzazione.

Versatilità (un server è in grado di servire client Unix, Novell, MS, Mac).

Facilità di implementazione e amministrazione.

Facilità di condivisione delle risorse.


Screpolatura

L'accesso alle informazioni tramite i protocolli del file system di rete è spesso più lento dell'accesso a un disco locale.

I server NAS più convenienti non riescono a fornire l'accesso flessibile e ad alta velocità fornito dai moderni sistemi SAN (a livello di blocco, non a livello di file).

SAN


(S torage UN vero n rete)- questa soluzione architetturale consente di connettere dispositivi di archiviazione esterni (librerie a nastro, array di dischi, unità ottiche, ecc.) ai server. Con questa connessione, i dispositivi esterni vengono riconosciuti dal sistema operativo come locali. L'utilizzo di una rete SAN consente di ridurre il costo totale della manutenzione di un sistema di archiviazione dei dati e consente alle organizzazioni moderne di organizzare l'archiviazione affidabile delle proprie informazioni.

L'opzione SAN più semplice è costituita da sistemi di storage, server e switch, uniti da canali di comunicazione ottici. Oltre ai sistemi di archiviazione su disco, alla SAN possono essere collegati librerie di dischi, unità a nastro (librerie a nastro), dispositivi utilizzati per memorizzare informazioni su dischi ottici, ecc.

Vantaggi

Affidabilità di accesso ai dati che si trovano su sistemi esterni.

L'indipendenza della topologia SAN dai server e dai sistemi di storage utilizzati.

Sicurezza e affidabilità dell'archiviazione centralizzata dei dati.

Convenienza dei dati centralizzati e della gestione degli scambi.

Possibilità di spostare il traffico I/O su una rete separata per scaricare la LAN.

Bassa latenza e alte prestazioni.

Flessibilità e scalabilità della struttura logica SAN.

La dimensione geografica illimitata effettiva della SAN.

La capacità di distribuire rapidamente le risorse tra i server.

La semplicità dello schema di backup, garantita dal fatto che tutti i dati si trovano in un unico posto.

Possibilità di creare soluzioni di clustering di failover basate su una SAN esistente senza costi aggiuntivi.

Disponibilità di servizi e funzionalità aggiuntivi, come replica remota, snapshot, ecc.

SAN ad alta sicurezza /


L'unico inconveniente di tali soluzioni è il loro costo elevato. In generale, il mercato nazionale dei sistemi di archiviazione dati è in ritardo rispetto al mercato dei paesi occidentali sviluppati, caratterizzato da un uso diffuso di sistemi di archiviazione. L'alto costo e la carenza di canali di comunicazione ad alta velocità sono i principali motivi che ostacolano lo sviluppo del mercato russo dello storage.

RAID

Parlando di sistemi di archiviazione dati, dovresti assolutamente considerare una delle principali tecnologie che sono alla base del funzionamento di tali sistemi e sono onnipresenti nel moderno settore IT. Intendiamo array RAID.

Un array RAID è costituito da diversi dischi controllati da un controller e interconnessi tramite canali di trasmissione dati ad alta velocità. Il sistema esterno percepisce tali dischi (dispositivi di archiviazione) come un tutt'uno. Il tipo di array utilizzato ha un impatto diretto sul grado di prestazioni e tolleranza ai guasti. Gli array RAID vengono utilizzati per aumentare l'affidabilità dell'archiviazione dei dati e per migliorare la velocità di lettura/scrittura.

Esistono diversi livelli RAID utilizzati durante la creazione di reti dell'area di archiviazione. I livelli più comunemente usati sono:

1. Questo è un array di dischi con prestazioni migliorate, senza tolleranza di errore, con striping.
Le informazioni sono suddivise in blocchi di dati separati. Viene registrato contemporaneamente su due o più dischi.

Professionisti:

La quantità di memoria viene sommata.

Aumento significativo delle prestazioni (il numero di dischi influisce direttamente sulla velocità di aumento delle prestazioni).


Svantaggi:

L'affidabilità di RAID 0 è inferiore all'affidabilità anche del disco più inaffidabile, perché se uno dei dischi si guasta, l'intero array diventa inutilizzabile.


2. - array con mirroring del disco. Questo array è costituito da una coppia di dischi che si copiano completamente l'un l'altro.

Professionisti:

Fornire una velocità di scrittura accettabile durante la parallelizzazione delle query, nonché un aumento della velocità di lettura.

Garantire un'elevata affidabilità: un array di dischi di questo tipo funziona finché almeno 1 disco funziona al suo interno. La probabilità di rompere 2 dischi contemporaneamente, pari al prodotto delle probabilità di rompere ciascuno di essi, è molto inferiore alla probabilità di rompere un disco. In caso di guasto di un singolo disco, in pratica, occorre intervenire immediatamente per ripristinare nuovamente la ridondanza. Per questo, si consiglia di utilizzare hot spare con RAID di qualsiasi livello (tranne zero).


Svantaggi:

L'unico inconveniente di RAID 1 è che l'utente ottiene un disco rigido al prezzo di due unità.



3.. Questo è un array RAID 0 costruito da array RAID 1.

4. RAID 2... Utilizzato per gli array che utilizzano il codice di Hamming.

Gli array di questo tipo si basano sull'uso del codice di Hamming. I dischi sono divisi in 2 gruppi: per i dati e anche per i codici utilizzati per la correzione degli errori. I dati sui dischi utilizzati per l'archiviazione delle informazioni sono distribuiti allo stesso modo del RAID 0, ovvero sono suddivisi in piccoli blocchi in base al numero di dischi. Le unità rimanenti memorizzano tutti i codici di correzione degli errori che aiutano a ripristinare le informazioni in caso di guasto di uno dei dischi rigidi. Il metodo Hamming utilizzato nella memoria ECC consente di correggere i singoli errori al volo, nonché di rilevare errori doppi.

RAID 3, RAID 4... Questi sono array di dischi con striping e un disco di parità dedicato. In RAID 3, i dati di n dischi vengono suddivisi in componenti più piccoli di un settore (in blocchi o byte) e quindi vengono distribuiti su n-1 dischi. I blocchi di parità sono memorizzati su un disco. In un array RAID 2, a questo scopo sono stati utilizzati n-1 dischi, tuttavia, la maggior parte delle informazioni sui dischi di controllo è stata utilizzata per correggere gli errori al volo, mentre la maggior parte degli utenti in caso di guasto del disco, il semplice recupero delle informazioni è sufficiente (per questo, ci sono abbastanza informazioni che si adattano a un disco rigido).

Un array RAID 4 è simile a RAID 3, tuttavia i dati non sono divisi in byte separati, ma in blocchi. Ciò ha permesso in parte di risolvere il problema della velocità di trasferimento dati insufficientemente elevata con un volume ridotto. La scrittura è troppo lenta a causa del fatto che la scrittura genera parità per il blocco, scrivendo su un singolo disco.
A differenza di RAID 2, RAID 3 si distingue per la sua incapacità di correggere gli errori al volo e anche per la minore ridondanza.

Professionisti:

Anche i fornitori di cloud stanno acquistando attivamente per le loro esigenze di archiviazione, ad esempio Facebook e Google stanno costruendo i propri server da componenti già pronti, ma questi server non vengono conteggiati nel rapporto IDC.

IDC prevede inoltre che i mercati emergenti supereranno presto i mercati sviluppati nel consumo di storage poiché registrano una crescita economica più rapida. Ad esempio, la regione dell'Europa centrale e orientale, dell'Africa e del Medio Oriente supererà il Giappone in termini di costi di stoccaggio nel 2014. Entro il 2015, la regione Asia-Pacifico, Giappone escluso, supererà l'Europa occidentale in termini di consumo di storage.

La vendita di sistemi di archiviazione dati effettuata dalla nostra azienda Navigator offre a tutti la possibilità di ottenere una base affidabile e duratura per l'archiviazione dei propri dati multimediali. Un'ampia selezione di array Raid, archivi di rete e altri sistemi consente di selezionare individualmente RAID dal secondo al quarto per ogni ordine; è impossibile eseguire operazioni di scrittura parallela, poiché viene utilizzato un disco di controllo separato per memorizzare le informazioni sulla parità digitale. RAID 5 non ha lo svantaggio sopra menzionato. I checksum e i blocchi di dati vengono scritti automaticamente su tutti i dischi; non esiste una configurazione asimmetrica del disco. Per checksum si intende il risultato dell'operazione XOR XOR permette di sostituire qualsiasi operando con il risultato e, utilizzando l'algoritmo XOR, di ottenere come risultato l'operando mancante. Per salvare il risultato XOR, è necessario un solo disco (la sua dimensione è identica alla dimensione di qualsiasi disco in raid).

Professionisti:

La popolarità di RAID5 è principalmente dovuta alla sua efficacia in termini di costi. La scrittura su un volume RAID5 richiede risorse aggiuntive, con conseguente degrado delle prestazioni poiché sono necessari calcoli e scritture aggiuntivi. Ma d'altra parte, durante la lettura (rispetto a un disco rigido separato), c'è un certo guadagno, che consiste nel fatto che i flussi di dati provenienti da più dischi possono essere elaborati in parallelo.


Svantaggi:

RAID 5 ha prestazioni molto inferiori, specialmente quando si eseguono scritture casuali (come Random Write), in cui le prestazioni sono ridotte del 10-25% delle prestazioni di RAID 10 o RAID 0. Questo perché questo processo richiede più operazioni su disco (ciascuna l'operazione di scrittura del server sul controller RAID viene sostituita da 3 operazioni: 1 operazione di lettura e 2 operazioni di scrittura). Gli svantaggi di RAID 5 compaiono quando un disco si guasta: in questo caso, l'intero volume entra in modalità critica, tutte le operazioni di lettura e scrittura sono accompagnate da ulteriori manipolazioni, il che porta a un forte calo delle prestazioni. In questo caso, il livello di affidabilità scende al livello di affidabilità del RAID 0 dotato del corrispondente numero di dischi, diventando n volte inferiore all'affidabilità di un singolo disco. Se, prima del ripristino dell'array, almeno un altro disco si guasta o si verifica un errore irreversibile su di esso, l'array verrà distrutto e i dati su di esso non potranno essere ripristinati utilizzando i metodi convenzionali. Si noti inoltre che il processo di ricostruzione della ridondanza dei dati RAID, noto come Ricostruzione RAID, dopo un guasto del disco causerà un intenso carico di lettura continuo da tutti i dischi che durerà per molte ore. Di conseguenza, uno dei dischi rimanenti potrebbe non funzionare. Inoltre, possono essere rilevati errori di lettura dei dati in array di dati freddi (quelli a cui non si accede durante il normale funzionamento dell'array - inattivi e archiviati) non rilevati in precedenza, il che comporta un aumento del rischio di errore durante il ripristino dei dati.



6. è un array RAID 50, che è costruito da array RAID5;

7. - array di dischi con striping, che utilizza 2 checksum, calcolati in 2 modi indipendenti.

RAID 6 è per molti versi simile a RAID 5, ma differisce da esso per un grado di affidabilità più elevato: alloca la capacità di due dischi per i checksum e due somme vengono calcolate utilizzando algoritmi diversi. È necessario un controller RAID di capacità maggiore. Aiuta a proteggere da più guasti garantendo il tempo di attività dopo che due unità si guastano contemporaneamente. La disposizione dell'array richiede un minimo di quattro unità. L'utilizzo di RAID-6 in genere comporta un degrado di circa il 10-15 percento nelle prestazioni del gruppo di dischi. Ciò è dovuto alla grande quantità di informazioni che il controller deve elaborare (diventa necessario calcolare il secondo checksum, nonché leggere e scrivere più blocchi del disco durante il processo di scrittura di ciascuno dei blocchi).

8. è un array RAID 0 creato da array RAID6.

9. RAID ibrido... Questo è un altro livello di array RAID che è diventato molto popolare ultimamente. Questi sono i soliti livelli RAID utilizzati in combinazione con software opzionale e SSD utilizzati come cache di lettura. Ciò porta ad un aumento delle prestazioni del sistema, poiché gli SSD, rispetto agli HDD, hanno caratteristiche di velocità molto migliori. Oggi ci sono diverse implementazioni, ad esempio Crucial Adrenaline, oltre a diversi controller Adaptec economici. Attualmente, l'uso di Hybrid RAID non è consigliato a causa della piccola risorsa dei dischi SSD.


Hybrid RAID legge dall'SSD più veloce e scrive sia su SSD che su dischi rigidi (per motivi di ridondanza).
Il RAID ibrido è ottimo per le applicazioni dati di basso livello (macchina virtuale, file server o gateway Internet).

Caratteristiche del moderno mercato dello storage

La società di analisi IDC nell'estate del 2013 ha pubblicato la sua prossima previsione per il mercato dello storage, calcolata da essa fino al 2017. I calcoli degli analisti mostrano che nei prossimi quattro anni le imprese globali acquisteranno sistemi di storage, la cui capacità totale sarà di cento e trentotto exabyte. La capacità di archiviazione totale realizzabile crescerà di circa il trenta percento all'anno.

Tuttavia, rispetto agli anni precedenti, quando si registrava una rapida crescita del consumo di archiviazione dei dati, il tasso di questa crescita rallenterà leggermente, poiché oggi la maggior parte delle aziende utilizza soluzioni cloud, privilegiando le tecnologie che ottimizzano l'archiviazione dei dati. Il risparmio di spazio di archiviazione si ottiene attraverso strumenti come la virtualizzazione, la compressione dei dati, la deduplicazione dei dati e altro.Tutti gli strumenti di cui sopra forniscono risparmi di spazio, consentendo alle aziende di evitare acquisti spontanei e ricorrere all'acquisto di nuovi sistemi di archiviazione solo quando sono realmente necessari.

Dei 138 exabyte che dovrebbero essere venduti nel 2017, 102 exabyte saranno storage esterno e 36 storage interno. Nel 2012 sono stati implementati venti exabyte di storage per sistemi esterni e otto per sistemi interni. I costi finanziari dei sistemi di stoccaggio industriale aumenteranno annualmente di circa il 4,1 per cento ed entro il 2017 ammonteranno a circa quarantadue miliardi e mezzo di dollari.

Abbiamo già notato che il mercato globale dello storage, che negli ultimi tempi ha conosciuto un vero e proprio boom, è progressivamente calato. Nel 2005, la crescita del consumo di stoccaggio a livello industriale è stata del sessantacinque percento e nel 2006 e 2007 del cinquantanove percento ciascuno. Negli anni successivi, la crescita del consumo di stoccaggio è diminuita ancora di più a causa dell'impatto negativo della crisi economica globale.

Gli analisti prevedono che un maggiore utilizzo del cloud storage porterà a un minor consumo di soluzioni di storage a livello aziendale. Anche i fornitori di cloud stanno acquistando attivamente per le loro esigenze di archiviazione, ad esempio Facebook e Google stanno costruendo i propri server da componenti già pronti, ma questi server non vengono conteggiati nel rapporto IDC.

IDC prevede inoltre che i mercati emergenti supereranno presto i mercati sviluppati nel consumo di storage poiché registrano una crescita economica più rapida. Ad esempio, la regione dell'Europa centrale e orientale, dell'Africa e del Medio Oriente supererà il Giappone in termini di costi di stoccaggio nel 2014. Entro il 2015, la regione Asia-Pacifico, Giappone escluso, supererà l'Europa occidentale in termini di consumo di storage.

Vendita rapida di sistemi di archiviazione dati

La vendita di sistemi di archiviazione dati effettuata dalla nostra azienda Navigator offre a tutti la possibilità di ottenere una base affidabile e duratura per l'archiviazione dei propri dati multimediali. Un'ampia selezione di array Raid, storage di rete e altri sistemi consente di selezionare individualmente per ogni cliente il sistema più adatto a lui.

L'ampia capacità tecnica, l'alfabetizzazione e l'esperienza del personale dell'azienda garantiscono una rapida e completa attuazione del compito. Allo stesso tempo, non ci limitiamo esclusivamente alla vendita di sistemi di archiviazione dati, poiché ne effettuiamo anche la configurazione, l'avviamento e la successiva assistenza e manutenzione.

Principali articoli correlati