Come configurare smartphone e PC. Portale informativo
  • casa
  • Windows 10
  • Dolby Digital Plus VS Dolby Digital: parliamo di tecnologia. Nozioni di base sull'audio Digitalizzazione e compressione di file audio

Dolby Digital Plus VS Dolby Digital: parliamo di tecnologia. Nozioni di base sull'audio Digitalizzazione e compressione di file audio

Dolby Digital - Informazioni generali

Il suono Dolby Digital è arrivato per la prima volta nei cinema nel 1992 con la première di Batman Returns, e da allora è apparso in quasi un migliaio di film in tutto il mondo ed è uno degli sviluppi più avanzati di .

Dolby ha rivoluzionato i sistemi di registrazione su nastro tra la fine degli anni '60 e l'inizio degli anni '70 con i suoi sistemi di riduzione del rumore Dolby A (per professionisti) e Dolby B (per utenti occasionali). Più tardi, negli anni '70, Dolby rivoluzionò l'audio cinematografico con il suo sistema analogico, Dolby Stereo.

Dolby Stereo ha portato nei film 4 canali audio, di cui tre nella parte anteriore (sinistro e destro per la musica e gli effetti e centrale per i dialoghi) e un quarto "surround" per creare un'atmosfera sonora complessiva. Successivamente, negli anni '80, grazie al sistema Dolby SR ("Spectral Recording"), la qualità della registrazione su nastro e del suono nei film è stata notevolmente migliorata.

Dolby ha anche rivoluzionato l'intrattenimento domestico tra la fine degli anni '80 e l'inizio degli anni '90 con l'introduzione del Dolby Surround e successivamente dei sistemi home theater Dolby Pro Logic. Gli apparecchi domestici utilizzano principalmente la tecnologia Dolby Stereo per la riproduzione di videocassette e dischi laser (di seguito laser disc significa LaserDisc, cioè dischi laser video "grandi"). Questi sistemi consentivano agli spettatori di utilizzare a casa la stessa configurazione a 4 canali che nei cinema.

Gli odierni sistemi Dolby Digital hanno portato le cose a un livello superiore, offrendo sei canali di suono surround digitale cristallino. I canali anteriori sinistro, centrale e destro consentono di determinare con precisione la posizione della sorgente sonora sullo schermo. I canali laterali posteriori sinistro e destro "divisi" separati ti trascinano nel film con i loro suoni ambientali e fluidi. E un ulteriore canale a bassa frequenza aggiunge intensità all'azione sullo schermo.

I principi di Dolby Digital derivano dagli sviluppi di Dolby nella riduzione del rumore analogico. La riduzione del rumore Dolby funziona attenuando il rumore quando non c'è segnale audio e quando c'è, consentendo al segnale audio desiderato più forte di soffocare il rumore più debole. Pertanto, questa tecnologia sfrutta un fenomeno psicoacustico noto come mascheramento uditivo. Anche se il segnale audio occupa solo una parte dello spettro, la riduzione del rumore Dolby riduce il livello di rumore in quelle parti dello spettro in cui non è presente il segnale desiderato, rendendo il rumore invisibile. Ciò avviene perché il segnale audio può mascherare solo il rumore con una frequenza vicina.

Quando si passa dalla registrazione analogica di un segnale alla registrazione su un supporto digitale come un compact disc, si scopre che la codifica digitale dei segnali audio utilizzata nei CD produce quantità di dati troppo grandi per essere archiviate o trasmesse elettronicamente in modo efficiente, soprattutto nei casi dove è necessario codificare più canali. Il risultato sono state nuove forme di codifica audio digitale - note collettivamente come "codifica percettiva" - progettate per consentire l'utilizzo di flussi di dati a basso bitrate con una minima perdita percettibile della qualità audio. Un esempio di tale algoritmo di codifica è la terza generazione di codificatori Dolby: AC-3.

Questo codificatore è stato progettato per sfruttare appieno la capacità umana di mascherare l'audio suddividendo lo spettro audio di ciascun canale in bande di frequenza strette di varie dimensioni ottimizzate per la selettività di frequenza dell'udito umano. Ciò consente di filtrare in modo molto preciso il rumore della digitalizzazione in modo che sia molto vicino in frequenza alle componenti di frequenza del segnale audio desiderato. Riducendo o addirittura eliminando completamente il rumore in assenza di segnale audio di mascheramento, la qualità del suono del segnale originale non viene influenzata soggettivamente. Sotto questo aspetto chiave, la codifica come AC-3 è una forma di riduzione del rumore altamente selettiva e di alta qualità.

L'esperienza unica di Dolby Laboratories nell'eliminazione del rumore audio è fondamentale per ridurre il traffico dati nella tecnologia AC-3: meno bit vengono utilizzati per descrivere il segnale audio, maggiore è il rumore associato alla codifica stessa.

Nell'industria cinematografica la colonna sonora Dolby Digital viene codificata otticamente direttamente sulla pellicola negli spazi tra i fori. Il posizionamento della traccia audio digitale sullo stesso supporto del film consente di coesistere con la traccia analogica senza la necessità di supporti di memorizzazione aggiuntivi come i CD. Ciò rende più semplice l'utilizzo dei film per la produzione e per i proprietari delle sale cinematografiche e consente inoltre la preparazione di una traccia Dolby Digital praticamente senza costi aggiuntivi. Poiché la parte perforata del nastro è realizzata per essere altamente resistente all'usura e ai danni, la traccia Dolby Digital non sarà soggetta a crepitii o sibili per tutta la vita del nastro.

Nell'elettronica di consumo, la tecnologia Dolby Digital può essere trovata nell'ultima generazione di dischi laser (dove era presente una traccia audio analogica convenzionale), è la traccia audio standard nei DVD e viene utilizzata come formato audio per la televisione ad alta definizione - HDTV, nonché nei sistemi televisivi via cavo e via satellite.

DOLBY DIGITAL: Domande e risposte

Probabilmente hai già sentito molto parlare di come Dolby Digital sia il prossimo e forse l'ultimo passo evolutivo nella direzione del realismo del suono. Allora, qual è questa nuova tecnologia? In cosa differisce dal Dolby Surround Pro Logic e quale nuovo hardware richiederà? Troverai le risposte a queste e ad altre domande in questo articolo.

Ma prima occorre chiarire la questione dei nomi. Negli ultimi anni, Dolby Laboratories ha utilizzato il termine Dolby Digital per riferirsi al loro nuovo sistema cinematografico digitale, mentre Dolby Surround AC-3 si riferisce ai sistemi home theater. In pratica, i due sistemi sono lievi variazioni (leggermente diverse nella velocità dei dati) della stessa tecnologia di base. E per non ingannare più gli utenti, hanno deciso che il formato Dolby per i sistemi multicanale domestici fosse chiamato anche con lo stesso nome dell'industria cinematografica: Dolby Digital.

Si ritiene che ciò aiuterà i consumatori a determinare più facilmente se un prodotto supporta questa tecnologia e aiuterà a differenziarlo dai formati Dolby Surround e Dolby Pro Logic, che si basano su tecnologie analogiche. Anche la nuova generazione di dischi laser e i nuovi formati utilizzati nei DVD e nella televisione ad alta definizione (HDTV) faranno riferimento al termine Dolby Digital, come avviene ora in relazione alle applicazioni cinematografiche professionali. Il nome generico Dolby Digital dovrebbe anche aiutare a fermare la crescente confusione degli utenti riguardo al termine "AC-3" (codice audio numero 3), che è la designazione tecnica della tecnologia Dolby progettata per applicazioni multicanale.

Ho sentito parlare di Dolby Surround Pro Logic, ma cos'è Dolby Digital (AC-3)? e cos'è il Dolby "5.1"?

Dolby Digital fornisce un totale di sei canali audio separati. Come il Dolby Surround Pro Logic, include i canali sinistro, centrale e destro nella parte anteriore della stanza. Dolby Surround Pro Logic fornisce un canale aggiuntivo con banda limitata (da 100 a 7000 Hz) per il suono surround, che viene generalmente amplificato attraverso due canali dell'amplificatore e quindi inviato a due altoparlanti. Mentre Dolby Digital fornisce canali surround sinistro e destro separati per una localizzazione più precisa dei suoni e un'atmosfera e una riproduzione dello sfondo più naturali e realistiche. Inoltre, tutti e cinque i canali principali trasmettono una gamma completa di frequenze (da 3 a 20.000 Hz), alla quale è possibile aggiungere woofer (subwoofer).

Il sesto canale - Canale degli effetti a bassa frequenza (canale per la bassa frequenza e gli effetti), a volte contiene informazioni aggiuntive a bassa frequenza per migliorare l'effetto di determinate scene, ad esempio esplosioni, disastri, ecc. A causa del fatto che questo canale è altamente limitato nella parte superiore della frequenza (da 3 a 120 Hz), a volte viene chiamato canale “.1”. Se viene aggiunto ai 5 canali Dolby Digital completi, si dice che tali sistemi abbiano canali “5.1”.

Tutti e sei i canali in Dolby Digital sono completamente digitali, il che significa che vengono trasmessi senza perdita di qualità lungo tutto il percorso dalla console del tecnico del suono al sistema domestico. Ma Dolby Digital li racchiude tutti in un unico canale, che occupa meno spazio di un canale su un CD. Questo è ciò che rende così semplice aggiungere colonne sonore Dolby Digital ai normali dischi laser, nonché a una varietà di altre sorgenti. Dolby Digital esiste da diversi anni per consentirti di guardare film Dolby Digital e ora, con l'avvento di Dolby Digital su Laser Disc, puoi goderti questa meravigliosa tecnologia a casa tua. E poiché è stato sviluppato da Dolby Laboratories, puoi star certo che il suono sarà sorprendente!

È vero che Dolby Digital richiede un sacco di nuovo hardware?

Se stai costruendo un nuovo sistema, puoi acquistare amplificatori e altoparlanti appositamente progettati per Dolby Pro Logic che funzioneranno con Dolby Digital. Avrai bisogno di un lettore laser di nuova generazione dotato di uscita Dolby Digital RF (emette un flusso di dati Dolby AC-3). Il nuovo dispositivo principale di cui avrai bisogno è un decoder Dolby Digital (per decodificare il flusso AC-3 per la successiva riproduzione). Se disponi già di un sistema Dolby Surround Pro Logic, probabilmente hai già un amplificatore a cinque canali, oltre al numero richiesto di altoparlanti. Si consiglia di aggiungere un subwoofer, forse anche diversi.

Dove masterizzi una traccia Dolby Digital su un laserdisc? Ciò causa la perdita di informazioni audio importanti dal laser disc? Dovrei ora sostituire la mia intera libreria di laserdisc?

Ci sono molte più somiglianze che differenze tra i dischi laser "normali" e "nuovi". I nuovi laserdisc, compresi quelli con Dolby Digital, sono completamente compatibili con il lettore esistente. Le due tracce digitali (PCM) rimangono invariate, quindi puoi continuare a goderti la qualità Dolby Surround Pro Logic dai dischi "nuovi". Sul disco viene registrata la traccia Dolby Digital invece della traccia analogica destra (FM). La traccia analogica sinistra può contenere una versione mono, un commento o qualsiasi altro materiale audio.

Gli ultimi lettori in grado di riprodurre solo audio da tracce analogiche (FM) sono stati rilasciati più di 10 anni fa. Da allora, quasi tutti i lettori possono utilizzare tracce digitali (PCM) di qualità superiore per la riproduzione stereo o Dolby Surround. Naturalmente, tutti i nuovi lettori laser con AC-3 riprodurranno tutti i laser disc che avete, sia le tracce audio digitali che quelle analogiche.

Dolby Digital rende Pro Logic superfluo?

Affatto. Dolby Surround Pro Logic sarà con noi per molto tempo. Dolby Surround Pro Logic riunisce quattro canali (sinistro, centrale, destro e surround con frequenza limitata) in due canali. Nei sistemi mono, questi due canali vengono sommati per la riproduzione. E, naturalmente, tutte le informazioni sono disponibili per la riproduzione negli impianti stereo. Ma quando questi due canali vengono immessi nel decoder Dolby Pro Logic, la matrice audio viene "aperta" e tutti i quattro canali originali sono disponibili (il canale "surround" viene riprodotto attraverso altoparlanti "surround" separati sinistro e destro) .

La parte più sorprendente del sistema Dolby Surround Pro Logic è che il segnale originale, "impilato" in stereo, può essere trasmesso insieme ad esso ovunque sia possibile trasmettere un segnale stereo: trasmissioni televisive stereo, via satellite (banda C, DSS o PrimeStar), trasmissioni via cavo, radio VHF (FM), dischi laser, videocassette e persino alcune console di gioco. Oggi è possibile ascoltare l'audio Dolby Surround in una varietà di normali programmi televisivi, in un elenco crescente di CD e, naturalmente, su VHS e LaserDisc, che contengono migliaia di film Dolby Stereo (il termine Dolby Stereo significa la stessa cosa del bene -noto Dolby Surround, ma utilizzato nell'industria cinematografica). Pertanto, finché avremo lo stereo, ci sarà il Dolby Surround Pro Logic, e quindi tutti i decoder Dolby Digital avranno un decoder Dolby Pro Logic integrato.

La tabella seguente confronta le proprietà di Dolby Digital e Dolby Surround Pro Logic.

ParametroDolbyDigitalDolby Surround Pro Logic
Canale "Volume".Stereo, frequenza completa (3–20.000 Hz)Spettro monofonico limitato (100–7000 Hz)
Canale a bassa frequenzaSì (3–120 Hz)NO
PadellaVarioDa sinistra a destra, da destra a sinistra, da davanti a dietro e viceversa.
Canali6 separati, tutti i canali possono essere attivi contemporaneamente e indipendentemente l'uno dall'altro.4 derivati, è possibile riprodurre un solo segnale dominante alla volta.
VarieImmagine sonora migliorata grazie all'"allineamento temporale", ovvero fa suonare gli altoparlanti come se fossero alla stessa distanza dall'ascoltatore.Una soluzione economica al problema di ottenere un suono surround di alta qualità.
Quando il volume complessivo delle colonne sonore di film dal ritmo frenetico viene abbassato (ad esempio, quando l'azione si svolge a tarda notte), la compressione viene regolata di conseguenza per preservare la qualità delle sezioni più silenziose.Suono surround da qualsiasi sorgente audio stereo non codificata.
I decodificatori possono essere configurati per instradare il suono a bassa frequenza in canali speciali per sistemi con subwoofer.Compatibile con tutti i formati stereo esistenti e futuri.
Un drammatico passo avanti nell'attirare l'ascoltatore nel mondo dei suoni reali. Possibilità creative senza precedenti per la produzione e il controllo audio.Rappresenta un significativo passo avanti rispetto al suono stereo convenzionale. È uno standard mondiale.

Al momento, esiste un numero enorme di sorgenti audio che supportano Dolby Pro Logic. E il Dolby Digital? Su cos'altro puoi registrare in Dolby Digital oltre ai dischi laser?

Una cosa grandiosa di Dolby Digital è la maggiore flessibilità di codifica. Dolby Digital tecnicamente consente un'enorme varietà di formati e alcuni di essi appariranno in un futuro molto prossimo:

Televisione ad alta definizione (HDTV). Quest'ultimo sistema è uno dei primi a scegliere Dolby Digital come sottosistema audio principale. La scelta è stata fatta dalla Grand Alliance, l'organizzazione che fissa tutti gli standard per i sistemi HDTV negli Stati Uniti.

TV satellitare - Trasmissione diretta via satellite (DBS) Già oggi utilizza attivamente i vantaggi del sistema Dolby Digital come l'alta qualità e la facilità di trasmissione. Ad esempio, DMX for Business utilizza Dolby Digital per fornire 120 canali musicali stereo, il tutto da un unico trasmettitore. PrimeStar prevede di aggiungere presto Dolby Digital al suo servizio televisivo satellitare.

Tv via cavo per ragioni di efficienza e per essere pronti agli standard dei futuri sistemi televisivi ad alta definizione introduce sistemi con Dolby Digital.

Il formato Digital Video Disc (DVD) include già Dolby Digital.

Altri formati, come Digital Video Cassette (DVC) e Digital Audio Broadcast (DAB), sono i primi sulla lista a introdurre la combinazione unica di audio di alta qualità, trasmissione efficiente dell'intero spettro del segnale e funzionalità multicanale di Dolby. Tecnologia digitale.

Cosa rende il Dolby Digital così flessibile o, per dirla senza mezzi termini, cosa lo rende così buono?

Le lettere "AC" in Dolby AC-3 stanno per codifica audio. La codifica audio digitale viene spesso definita "codifica percettiva". In poche parole, si tratta di una codifica che tenta di rilevare e quindi rimuovere le informazioni audio che comunque non possiamo sentire, ma conserva ciò che possiamo sentire. Il suo scopo è quello di inserire quante più informazioni utili possibili nello spettro disponibile. Consideriamo un'analogia:

Diciamo che devi trasportare 4.000 persone (informazioni utili) da un luogo all'altro in un'ora. L'autostrada può trasportare solo 1.000 auto all'ora. Se metti tutte le 4.000 persone in 1.000 auto, puoi eliminare le informazioni non necessarie (lasciamo 3.000 auto a casa). Si tratta di una trasmissione altamente efficiente ed è per questo che è stato progettato il sistema Dolby Digital.

Uno dei motivi per cui la qualità del suono di un CD è così elevata è che contiene un'enorme quantità di dati: i campioni a 16 bit vengono campionati 44.100 volte al secondo separatamente per ciascun canale. Ciò corrisponde a un flusso di 1411200 bit al secondo. Un compact disc è una struttura di archiviazione talmente grande che può contenere fino a 74 minuti di musica su un disco. Ma cosa fare se è necessario registrare 2 ore di segnale a 20 bit e, oltre a tutto il resto, dovrebbero esserci sei canali? Oggi, un flusso di dati così grande non è pratico né per l’archiviazione né per la trasmissione.

Il codificatore Dolby Digital è il primo codificatore progettato specificamente per l'audio multicanale. L'esperienza unica di Dolby Laboratories nell'eliminazione del rumore audio è fondamentale per ridurre il traffico di dati perché meno bit vengono utilizzati per descrivere un segnale audio, maggiore è il rumore.

La riduzione del rumore Dolby funziona riducendo il livello di rumore in assenza di un segnale audio, consentendo anche al segnale audio desiderato più forte di coprire o "mascherare" il rumore. Ma ciò consente di mascherare solo il rumore che è vicino in frequenza al segnale utile. Pertanto, Dolby Digital divide lo spettro audio per ciascun canale in strisce strette di diverse dimensioni, ottimizzate per la selettività di frequenza dell'udito umano. Ciò consente di filtrare molto accuratamente il rumore della digitalizzazione in modo che sia molto vicino in frequenza alla frequenza del segnale codificato. Il segnale audio attutisce efficacemente il rumore, rendendolo impercettibile all'orecchio. Laddove la mancanza di segnale non consente di mascherare il rumore della digitalizzazione, Dolby Digital fa ogni sforzo per ridurlo. Si può dire che il Dolby Digital sia un sistema di riduzione del rumore molto efficace e di conseguenza la qualità del suono è soggettivamente molto vicina all'originale.

Dolby Digital utilizza la tecnologia "bitpool condiviso" e un modello di mascheramento dell'udito umano per ottenere la massima efficienza di trasmissione. I bit sono distribuiti in modo non uniforme tra molte bande di frequenza strette e in ciascun caso specifico in modo diverso, a seconda dello spettro e della struttura dinamica del segnale codificato. Utilizzando un modello di mascheramento uditivo, il codificatore fornisce il numero ottimale di bit per il segnale audio in ciascuna banda. Inoltre, i bit vengono ridistribuiti tra i diversi canali secondo il modello secondo il quale un canale più saturo richiederà più dati per la trasmissione rispetto ad altri canali poco riempiti, e tiene conto anche del fatto che un segnale forte in un canale può mascherare i segnali emergenti rumore in altri canali. Di conseguenza, Dolby Digital può utilizzare proporzionalmente più dati per codificare l'audio, producendo un segnale di qualità superiore e consentendo a più canali audio di essere codificati in flussi di dati con bitrate inferiore rispetto a quanto richiesto anche da un singolo canale su un CD.

DATI TECNICI

Il codificatore Dolby Digital è in grado di elaborare un segnale di ingresso con un segnale digitale dinamico di almeno 20 bit con una gamma di frequenza compresa tra 20 e 20.000 Hz ±0,5 dB (-3 dB a 3 e 20.300 Hz). Il canale delle basse frequenze copre la gamma da 20 a 120 Hz ±0,5 dB (-3 dB a 3 e 121 Hz). Sono supportate frequenze di campionamento di 32, 44,1 e 48 kHz. La larghezza del flusso di dati in uscita può variare da un minimo di 32 kbps per un singolo canale mono a un massimo di 640 kbps, soddisfacendo una gamma completa di requisiti. Le velocità tipiche sono 384 kbps per i formati consumer Dolby Digital "5.1" e 192 kbps per l'audio a due canali.

DolbyDigital

Film con audio digitale e analogico

DolbyDigital (AC-3, ATSC A/52) (Dolby Digital) - un sistema di riproduzione del suono spaziale sviluppato da Dolby Laboratories, Inc. ("Dolby Labs"), guidato da Ray Dolby, un pioniere nel settore audio e video.

Formato standardizzato Comitato per i sistemi televisivi avanzati, gli fu assegnato il codice A/52, Dolby Digitale (DD)è un marchio.

I moderni sistemi Dolby Digital forniscono sei canali di suono surround digitale. I canali anteriori sinistro, centrale e destro consentono di determinare con precisione la posizione della sorgente sonora sullo schermo. I canali laterali posteriori sinistro e destro "divisi" separati migliorano il senso di presenza, creando volume. E un ulteriore canale a bassa frequenza aggiunge intensità all'azione sullo schermo.

Nell'industria cinematografica la colonna sonora Dolby Digital viene codificata otticamente direttamente sulla pellicola negli spazi tra i fori. Posizionare una colonna sonora digitale sullo stesso supporto del film consente di coesistere con la traccia analogica senza la necessità di supporti di memorizzazione aggiuntivi e garantisce inoltre l'assoluta sincronizzazione di immagine e suono. Nelle sale IMAX, l'audio viene registrato su un disco rigido separato e sincronizzato con il film utilizzando il time code SMPTE.

Il flusso digitale all'uscita dell'encoder è una sequenza di frame audio (Pack AC-3 Frame). Le informazioni in esso contenute possono essere suddivise condizionatamente in due parti: principale (Informazioni principali) e aggiuntive (Informazioni secondarie).

Il frame audio del codificatore include sei blocchi audio. Ciascun blocco audio contiene informazioni su 512 campioni per ciascuno dei segnali codificati (Audio 1, Audio 2, ..., Audio n). A causa della sovrapposizione temporale del 50%, nel blocco audio vengono inclusi 256 campioni del blocco precedente e 256 nuovi campioni per ciascun segnale. In sei blocchi audio di un fotogramma audio, il numero totale di campioni elaborati per ciascuno dei segnali di ingresso sarà pari a 512 × 6 = 3072. Si noti che se il numero di segnali audio codificati è 5 (formato 3/2), allora il numero totale di campioni, le cui informazioni sono contenute in un fotogramma audio, sarà (512 × 5) × 6 = 15360, tuttavia, tenendo conto della sovrapposizione temporale del 50%, ci saranno solo 15360 ÷ 2 = 7680 nuovi campioni .

Dopo aver campionato i campioni mediante segmentazione temporale, il segnale audio di ciascun canale viene convertito in un nuovo set di dati digitali utilizzando una trasformata coseno discreta modificata (MDCT). La segmentazione dei segnali audio in base al tempo con una sovrapposizione del 50% dei campioni e la loro conversione dal dominio del tempo a quello della frequenza vengono eseguite nel blocco di trasformazione tempo-frequenza (Frequency Domain Transform). Prima della trasformazione ortogonale, i campioni di segnali audio vengono pesati da una funzione finestra. Quest'ultimo è presentato nella norma A/52 in una tabella.

La conversione di un campione audio nel dominio del tempo può essere eseguita utilizzando una trasformata lunga (512 punti) o due brevi (256 punti). Nel primo caso si otterranno rispettivamente 256 e nel secondo 128 + 128 coefficienti MDCT. Con un breve campione, i coefficienti MDCT di entrambi i segmenti, contenenti 128 valori ciascuno, vengono combinati in un blocco comune alternandoli. Questo blocco generale conterrà anche 256 coefficienti MDCT.

La trasformata lunga è preferibile per i segnali che cambiano lentamente in ampiezza nel tempo. Ha una migliore risoluzione di frequenza. La trasformata breve fornisce una migliore risoluzione temporale e viene utilizzata per segnali le cui ampiezze cambiano rapidamente nel tempo, come la regione di attacco di un suono. Il flag Block Switch Flags(blksw flags) indica quale trasformazione (lunga o breve) viene applicata durante il calcolo dei coefficienti MDCT. Il parametro Block Switch Flags è incluso nel flusso di dati digitali in uscita come informazione aggiuntiva e viene utilizzato dal decodificatore quando esegue la trasformazione ortogonale inversa.

A velocità di dati digitali basse, il codificatore Dolby AC-3 prevede l'uso di una procedura speciale per combinare i segnali dei canali (Coupling), che consente di utilizzare meno bit durante la codifica.

Nel sistema Dolby AC-3, ciascun coefficiente MDCT è rappresentato in formato a virgola mobile da due valori: un esponente (o esponente) e una mantissa: Xd[k] = A[k] × 2 -B[k] , dove A[k] e B [k] - mantissa e ordine del coefficiente di conversione k-esimo, rispettivamente. L'ordine è pari al numero di zeri prima del primo della rappresentazione binaria del coefficiente MDCT. È essenzialmente il suo fattore di scala (o fattore di normalizzazione). Ad esempio, se il coefficiente MDCT Xd[k] = 0,158 e la sua rappresentazione binaria è scritta come 0,001010000110, allora l'ordine (fattore di scala) B[k] = 2 e la mantissa è 0,1010000110 in binario o A[k] = 0. 6308 nei sistemi decimali. Il segno del coefficiente MDCT viene preso in considerazione durante la codifica della mantissa. Prima della codifica, le mantisse vengono normalizzate (Normalize Mantissas). Gli esponenti e le mantisse dei coefficienti MDCT sono codificati separatamente nei blocchi Encode Exponent e Quantisse, Encode Mantissas.

Il blocco Bit Allocation tiene conto dell'effetto di mascheramento. La procedura di selezione dei bit si basa su un modello uditivo che consente di stimare il valore massimo ammissibile (di soglia) del livello di rumore, che è ancora mascherato dal segnale utile nella banda di codifica, e, in accordo con i dati di questi calcoli , per selezionare il numero di bit corrispondente durante la codifica della mantissa dei coefficienti MDCT. Tutti questi calcoli vengono eseguiti in un blocco solitamente chiamato modello psicoacustico. Ciascuna mantissa normalizzata viene quantizzata con un numero di stadi di quantizzazione corrispondente al numero di bit definiti nel modulo Bit Allocation.

L'ordine di codifica del coefficiente MDCT nel codificatore Dolby AC-3 è un numero compreso tra 0 e 24. Pertanto, la parola in codice dell'ordine deve avere almeno m = 5 bit (2 5 = 32). L'ordine massimo nell'encoder è limitato a 24.

È noto che se lo spettro di un segnale audio campione viene analizzato utilizzando un banco di filtri, ciascuno dei quali ha una banda di frequenza piuttosto stretta, la differenza nei livelli di energia del segnale tra filtri adiacenti raramente supera i 12 dB. Questa circostanza è stata presa in considerazione durante la codifica degli ordini. Quando si codificano gli ordini nell'encoder Dolby AC-3, viene utilizzato il metodo della modulazione differenziale del codice a impulsi, quando non è l'ordine stesso a essere codificato, ma la differenza tra i valori dell'ordine dei coefficienti MDCT adiacenti. Il valore per il segnale di ciascun canale nella primissima banda di analisi della frequenza più bassa è - si tratta sempre di una parola in codice a quattro bit, che corrisponde all'intervallo di numeri da 0 a 15. L'ordine nella banda di analisi della frequenza successiva più alta è determinato come la differenza tra i valori dell'ordine corrente e precedente dei corrispondenti coefficienti MDCT. Nel codificatore Dolby AC-3, la risoluzione della modulazione differenziale del codice a impulsi (discretezza degli ordini variabili) durante la codifica è limitata ai valori −2, −1, 0, +1, +2. La variazione massima negli ordini dei coefficienti MDCT adiacenti è ± 2, che corrisponde a ± 12 dB.

Il valore differenziale degli ordini dei coefficienti MDCT è combinato in gruppi. Per la procedura di raggruppamento vengono utilizzate tre possibili strategie, designate nella norma come D15, D25 e D45. Nella strategia D15 ciascuno paio, e nella strategia D45 ogni quattro i valori dell'ordine differenziale sono rappresentati da un singolo valore del numero M nel flusso di dati digitali.

I valori dell'ordine differenziale ottenuti direttamente dai coefficienti MDCT originali, in pratica, non sempre danno una differenza massima tra coefficienti adiacenti che non superi l'intervallo di ± 2, richiesto dalle corrispondenti tabelle dello standard Dolby AC-3 . Pertanto, prima della codifica è necessaria un'ulteriore elaborazione dell'array dell'ordine. Con il suo aiuto, alcuni valori dell'ordine vengono ridotti, ma allo stesso tempo i corrispondenti valori della mantissa vengono modificati in modo che davanti a loro appaiano degli zeri nella loro rappresentazione binaria. Dopo aver eseguito questa operazione, l'ordine differenziale massimo non supererà più il valore richiesto di ± 2.

La scelta della strategia (D15, D25 o D45) per la codifica degli ordini dei coefficienti MDCT è un compromesso tra una buona risoluzione in frequenza, risoluzione temporale e il numero di bit richiesti per codificare gli esponenti. Le strategie D15 e D25 possono essere utilizzate per codificare segnali che hanno uno spettro non uniforme, quando il valore dell'esponente cambia abbastanza rapidamente da una banda di analisi all'altra. Se lo spettro del segnale è sufficientemente fluido (piatto), vengono utilizzate le strategie di codifica D45.

Dopo aver scelto una strategia di codifica dell'ordine, l'encoder Dolby AC-3 raggruppa in gruppi le parole in codice corrispondenti ai valori dell'esponente differenziale. Per tutte le modalità operative dell'encoder, gli insiemi di numeri M per tre coefficienti MDCT adiacenti (k, k + 1, k + 2) M[k], M, M sono raggruppati e codificati come una parola a sette bit secondo la regola:

L'intervallo di modifiche nella mantissa dei coefficienti MDCT è compreso tra −1 e + 1. Il segno del coefficiente MDCT viene preso in considerazione durante la codifica della mantissa. Il processo di quantizzazione della mantissa dei coefficienti MDCT nello standard Dolby AC-3 ha le seguenti caratteristiche:

  • il numero di possibili stadi di quantizzazione corrisponde alla seguente serie di numeri: 0, 3, 5, 7, 11, 15, 32, 64, 128, 256, 512, 1024, 2048, 4096, 16384, 65536; viene utilizzata la quantizzazione uniforme delle mantisse;
  • quando il numero di stadi di quantizzazione è 3, 5, 7, 11 e 15, viene utilizzata la cosiddetta quantizzazione simmetrica, in tutti gli altri casi - asimmetrica;
  • quando il numero di stadi di quantizzazione è 3, 5 e 11, le parole in codice della mantissa vengono combinate in gruppi. Con tre stadi di quantizzazione, tre parole di codice corrispondenti a tre valori di mantissa vengono codificate con una parola di codice a cinque bit. Con cinque stadi di quantizzazione, tre parole in codice mantissa vengono raggruppate e codificate in una parola in codice a sette bit. Con 11 stadi di quantizzazione, due parole in codice mantissa sono raggruppate e codificate in una parola in codice a sette bit; negli altri casi non è prevista alcuna procedura di raggruppamento.

Con la quantizzazione simmetrica, al posto dei valori quantizzati delle mantisse, nel flusso digitale vengono inclusi i loro indici, specificati nella tabella corrispondente. Ad esempio, se il numero di stadi di quantizzazione è 3 e il valore della mantissa è compreso tra −1 e −1/3, allora al decodificatore verrà trasmesso un valore pari a −2/3 e l'indice mc = Ad esso corrisponderà 0. Se il valore della mantissa è compreso tra −1/3 e +1/3, allora al decodificatore viene passato il valore pari a zero e viene codificato l'indice mc = 1. Ed infine, se il valore della mantissa è compreso tra +1/3 e +1, quindi viene passato al decodificatore il valore, pari a +2/3, e viene codificato il corrispondente indice della tabella mc = 2. Allo stesso modo, nella forma di Nelle tabelle, gli intervalli dei valori della mantissa e i corrispondenti indici per il numero di passi di quantizzazione sono rispettivamente pari a 5, 7, 11 e 15. Questo metodo di quantizzazione consente di ridurre il numero di bit richiesti. Per tutti gli altri stadi di quantizzazione (32, 64, ..., 65536), non sono gli indici ad essere codificati, ma le mantisse dei coefficienti MDCT stessi.

La fase successiva è la codifica e il confezionamento degli indici tabulari dei valori della mantissa quantizzata in un flusso digitale. Con la quantizzazione simmetrica viene utilizzata un'ulteriore procedura di raggruppamento per ridurre il numero di bit richiesti per la codifica degli indici. Ad esempio, se il numero di stadi di quantizzazione è 7, l'indice della mantissa varia da 0 a 6. La codifica di questa serie di numeri richiede 3 bit. Con 11 passi di quantizzazione, l'indice della tabella della mantissa è compreso tra 0 e 10, mentre con 15 passi di quantizzazione è già compreso tra 0 e 14. In questo caso, il numero di bit necessari per codificare ciascuno di essi sono rispettivamente 4 o 5. Il raggruppamento degli indici delle tabelle consente di ridurre il numero di bit richiesti per la loro codifica a 3, 5 e 11 passi di quantizzazione. Con 3 e 5 stadi di quantizzazione, tre indici di mantissa di tabella e con 11 stadi di quantizzazione, due indici di mantissa di tabella sono codificati con una parola di codice secondo le seguenti regole:

Codice_gruppo = 9mc[a] + 3mc[b] + mc[c]; Codice_gruppo = 25mc[a] + 5mc[b] + mc[c]; Codice_gruppo = 11mc[a] + mc[b],

dove Group_code, Group_code e Group_code sono parole in codice di gruppi di indici di tabella di mantisse, rispettivamente, a 3, 5, 11 passi di quantizzazione; mc[a], mc[b], mc[c] - indici della tabella delle mantisse dei coefficienti MDCT con i numeri a, b e c. Quindi, con tre stadi di quantizzazione della mantissa (n = 3), la parola in codice di un gruppo composto da tre indici conterrà 5 bit, quindi in questo caso verranno spesi 5 ÷ 3 = 1,67 bit per codificare ciascuna mantissa. Con n = 5, la parola in codice del gruppo mantissa sarà rappresentata come un numero a sette bit e la codifica di ciascuna mantissa richiederà 7 ÷ 3 = 2,33 bit. E infine, con n = 11, la codifica di ciascuna mantissa richiederà 7 ÷ 2 = 3,5 bit, e con n = 15 - 4 bit, ecc.

Il codificatore determina la lunghezza della parola in codice di ciascuna mantissa o il corrispondente indice della tabella, dopodiché le mantisse vengono spacchettate utilizzando una procedura speciale.

Quando si lavora in modalità combinazione di segnali audio, l'encoder combina parti ad alta frequenza dei segnali originali in una determinata banda di frequenza in un segnale comune e genera inoltre le cosiddette coordinate di combinazione. Quest'ultimo verrà utilizzato dal decodificatore per ripristinare i rapporti energetici delle parti ad alta frequenza dello spettro di ciascun segnale originale sottoposto alla procedura di combinazione. Dopo la decodifica, le parti combinate in ciascuno dei segnali ricostruiti avranno la stessa composizione spettrale e differiranno solo nel livello.

L'encoder genera un segnale comune semplicemente sommando i coefficienti MDCT dei segnali combinati. In questo caso, i coefficienti MDCT da 37 a 252 sono raggruppati in 18 sottobande (le cosiddette bande di combinazione) con 12 coefficienti in ciascuna di tali sottobande. I limiti di frequenza inferiore e superiore delle bande combinate sono specificati dall'utente. Le coordinate di combinazione vengono calcolate per ciascuna combinazione di segnali di sottobanda. Rappresentano il rapporto tra i coefficienti MDCT massimi di ciascun segnale combinato e il segnale totale nella sottobanda di combinazione. Successivamente, le coordinate di unione vengono convertite in formato a virgola mobile e incluse nel flusso di dati di output come informazioni aggiuntive. Il segnale totale (combinato) è codificato allo stesso modo del segnale dei canali indipendenti.

Decodificatore del sistema Dolby AC-3

Il decodificatore Dolby AC-3 riceve ordini di coefficienti MDCT in forma codificata e confezionata. Per decomprimerli e decodificarli è necessario disporre di informazioni aggiuntive sul numero di esponenti trasmessi nel segnale di ciascun canale e sulla loro strategia di codifica (D15, D25, D45) utilizzata nell'encoder. Il processo di decodifica dell'ordine viene eseguito nel blocco Decode Exponent. Dopo aver decodificato gli ordini, viene eseguita la procedura di disimballaggio, dequantizzazione e denormalizzazione delle mantisse dei coefficienti MDCT (Dequantize, Denormalize Mantissas). Per realizzarlo vengono utilizzati i parametri del modello psicoacustico, i parametri che determinano la distribuzione dei bit nell'encoder, nonché il ripristino dei valori dell'ordine dei coefficienti MDCT. L'operazione di denormalizzazione delle mantisse viene eseguita spostando i bit della parola in codice della mantissa verso destra. In questo caso, il numero di turni è determinato dall'ordine del corrispondente coefficiente MDCT. Se il codificatore utilizza la procedura di combinazione dei segnali provenienti da più canali, ovviamente il decoder deve eseguire l'operazione inversa (De-Coupling), utilizzando i valori delle coordinate di combinazione trasmessi al decoder nel campo dati informazioni aggiuntive. Nel blocco MDCT ortogonale inverso (Inverse Transform), il segnale ricostruito nel decodificatore viene convertito inversamente nel dominio del tempo.

S.I. BSI Blocco audio 0 Blocco audio 1 Blocco audio 2 Blocco audio 3 Blocco audio 4 Blocco audio 5 Dati AUX CRC

Schema 1. Struttura dati del frame audio del sistema Dolby AC-3.

Blocca i flag di commutazione Flag di dithering Controllo della gamma dinamica Strategia di accoppiamento Coordinate di accoppiamento Strategia dell'esponente Esponente Parametri di allocazione dei bit Mantisse

Schema 2. Struttura dati dell'unità audio del sistema Dolby AC-3.

La struttura dei dati audio nello standard Dolby AC-3 è mostrata nella Figura 1. Il campo dati di intestazione di un frame audio contiene informazioni SI (Syncronizator Information) e informazioni sulla configurazione del flusso di dati BSI (Bit Stream Information).

Il campo dati SI include la parola di sincronizzazione (0000 1011 0111 0111 o OB77h), i bit di codifica del controllo del rumore (CRC), la frequenza di campionamento e la dimensione del frame audio. Un frame audio Dolby AC-3 include due parole CRC a 16 bit, la prima all'inizio di ciascun frame dopo la parola di sincronizzazione e la seconda alla fine. Il campo dati BSI contiene informazioni sulla configurazione del flusso di dati digitali, ad esempio, come il tipo di servizio, la modalità operativa dell'encoder (ovvero il numero di segnali codificati o il tipo di formato audio), il livello acustico assoluto del segnale di ciascun canale, informazioni sulla lingua, informazioni sull'ora e altro ancora.

La struttura dati di un blocco audio è mostrata nel Diagramma 2. Comprende i seguenti campi bit: Block Switch Flags - parametro di lunghezza della trasformazione ortogonale; Dither Flags: segno della presenza di rumore aggiuntivo; Controllo della gamma dinamica: dati di controllo per la gamma dinamica dei segnali trasmessi; Strategia di accoppiamento: informazioni sulla combinazione dei segnali (segnali di quali canali sono combinati e a partire da quale frequenza); Coordinate di accoppiamento: coordinate di accoppiamento per il segnale di ciascun canale; Strategia dell'esponente: strategia di codifica dell'ordine selezionata; Esponenti: parole in codice per gli ordini dei coefficienti MDCT; Parametri di allocazione dei bit - parametri del modello psicoacustico; Mantisse - parole in codice per le mantisse dei coefficienti MDCT.

Tecnologie digitali Dolby

Dolby Digital EX

EX è un prefisso utilizzato per designare i sistemi audio Dolby Digital con 6.1 canali: due anteriori, centrale, a bassa frequenza, surround posteriore e due surround laterali.

Dolby Digital Surround EX

Dolby Digital Surround-EX aggiunge un terzo canale di suono surround alla colonna sonora. L'idea appartiene agli ingegneri del suono dello studio Skywalker Sound. La tecnologia è stata sviluppata in collaborazione con Dolby Laboratories e Lucasfilm THX.

Dolby Digital in diretta

Dolby Digital Live (DDL) è una tecnologia per la codifica di segnali audio multicanale (5.1) nel formato AC3 in tempo reale, proposta da Dolby Technologies. Progettato per trasmettere audio multicanale da giochi e altre applicazioni al ricevitore tramite l'interfaccia S/PDIF (ottica o coassiale).

Il suo utilizzo consente di eliminare le restrizioni per cui solo le tracce multicanale già pronte (cioè memorizzate codificate nel formato AC3 o DTS) (di solito la colonna sonora dei film) potrebbero essere trasmesse tramite interfacce digitali) e nei giochi le capacità di uscita digitale erano limitate al solito suono stereo. (Per i giochi 5.1 completi in questi casi, è necessaria una connessione analogica a tre fili, se, ovviamente, è possibile.)

Lo svantaggio fondamentale e fatale della tecnologia DDL è una certa perdita di qualità del suono durante la compressione nel formato AC3 (paragonabile al passaggio da CD-Audio a mp3 con un bitrate elevato), che, tuttavia, è del tutto acritica per lo scopo principale applicazione.

Attualmente, questa tecnologia si trova principalmente nelle schede madri dotate di codec Realtek ALC882D, ALC888DD e ALC888H, nonché in alcuni codec C-Media. Tali schede possono essere trovate nelle descrizioni dei prodotti con la dicitura "AC3 Encode" o "Dolby Digital Live".

Questa tecnologia sta cominciando ad essere introdotta anche nei laptop, dove, data la mancanza di spazio per connettori analogici "extra", promette i maggiori vantaggi: un connettore ti consentirà di ottenere l'audio 5.1 completo in tutte le applicazioni, a condizione che tu colleghi il laptop ad un ricevitore o ad un set di altoparlanti attivi con decoder incorporato.

Delle singole schede audio che supportano questa tecnologia, vale la pena notare Terratec Aureon 7.1, e nelle popolari schede audio della famiglia Creative X-Fi non esiste il supporto DDL, ma (secondo informazioni non ufficiali) in futuro è possibile per introdurlo retroattivamente quando viene rilasciata una nuova versione dei driver.

Per il 2010, i seguenti modelli della famiglia Creative X-Fi supportano questa tecnologia: CREATIVE X-Fi Titanium 7.1, CREATIVE X-Fi Titanium Fatal1ty Pro 7.1, CREATIVE X-Fi Titanium Fatal1ty Champion 7.1

DolbyDigital Plus

MIPS Technologies e Dolby Laboratories hanno introdotto una nuova tecnologia audio per dispositivi che supportano la riproduzione audio e video ad alta definizione, come lettori HD DVD e Blu-ray. La tecnologia audio si chiama Dolby Digital Plus e può essere utilizzata nei core del microprocessore MIPS32.

Dolby Digital Plus migliorerà anche la qualità della registrazione di contenuti audio su supporti HD DVD e Blu-ray Disk, grazie al supporto di un numero di canali ancora maggiore rispetto a quanto possibile con Dolby Digital. Le aziende presenteranno agli sviluppatori di soluzioni SoC (System-on-Chip) varietà del codec integrato Dolby Digital Plus basato sul core MIPS.

Peculiarità:

  • Audio multicanale con canali indipendenti
  • Supporta fino a 7.1 canali* e la possibilità di avere più programmi audio in un unico flusso
  • Uscita flusso Dolby Digital per compatibilità con dispositivi meno recenti
  • Portata massima fino a 6 Mbps
  • Bitrate da 3 Mbps su HD DVD e fino a 1,7 Mbps su Blu-ray Disc
  • HDMI supportato
  • Uno stream può contenere materiale in diverse lingue
  • Nuove opzioni di codifica per i professionisti dell'audio
  • Mantiene l'alta qualità a velocità di trasmissione dati più efficienti (200 Kbps per 5.1 canali)

"Dolby Digital Plus supporta più di 8 canali audio. Gli standard HD DVD e Blu-ray Disc attualmente limitano questo numero a 8.

Dolby TrueHD

Dolby TrueHD è uno dei primi due formati audio non compressi (compressi senza perdita di dati) disponibili solo per lettori HD ottici. Sebbene il codec Dolby TrueHD sia opzionale, il formato è ampiamente supportato da lettori e dischi Blu-ray (molto più di DD+, che spesso manca nei dischi Blu-ray). Dolby TrueHD utilizza l'algoritmo di compressione Meridian Lossless Packing (MLP). Il flusso digitale Dolby TrueHD può ospitare fino a 14 canali audio individuali, ma in pratica funziona con 6 (5.1) o 8 (7.1) canali. Dolby TrueHD supporta una profondità di bit fino a 24 bit e una frequenza di campionamento fino a 192 kHz (per un flusso non compresso massimo di 63 Mbps), ma per Blu-ray attualmente sono disponibili un massimo di 8 canali a 24 bit e 96 kHz ( o in alternativa 6 canali a 24 bit e 192 kHz) per un flusso compresso massimo di 18 Mbps. Una ricerca tra i film Dolby TrueHD disponibili su dischi Blu-ray ha rivelato che attualmente ne è disponibile solo la metà: 6 canali con frequenza di campionamento di 96 kHz e profondità di 24 bit (equivalenti a 13,5 Mbps non compressi e 9 Mbps compressi). dischi con concerti del gruppo Dave Matthews e Tim Reynolds, che hanno ricevuto ottimi punteggi per la qualità sul sito Cinema Squid).

Le specifiche della traccia Dolby TrueHD per i film Blu-ray sono le seguenti:

  • Codec audio: Dolby TrueHD.
  • I canali (schema audio) sono quasi sempre 5.1, 6.1 e 7.1 sono molto rari.
  • I dati sulla chiarezza audio spesso non sono disponibili, ma i valori tipici sono 16 bit a 48 kHz o 24 bit a 48 kHz; per alcuni dischi live questi valori sono 24 bit a 96 kHz.
  • Il valore del flusso solitamente non è disponibile, ma solitamente è 4608 kbps (4,5 Mbps, che corrisponde a sei canali a 48 kHz e 16 bit). Il massimo che abbiamo visto sui dischi Blu-ray dei concerti commerciali è stato di 9,0 Mbps, che equivale a sei canali a 96 kHz e 24 bit. Il valore massimo per Blu-ray è 18 Mbps.

Tecnologie Dolby su supporti ottici

DVD HD disco Blu-ray DVD-Video DVD audio Laserdisc
Codec Supporto hardware Numero di canali (max.) Massimo. Portata Supporto hardware Numero di canali (max.) Massimo. Portata Supporto hardware Numero di canali (max.) Massimo. Portata Supporto hardware Numero di canali (max.) Massimo. Portata Supporto hardware Numero di canali (max.) Massimo. Portata
DolbyDigital Necessariamente 5.1 504 kbps Necessariamente 5.1 640 kbps Necessariamente 5.1 448 kbps Inoltre nella parte video per la compatibilità con i lettori DVD convenzionali 5.1 448 kbps Inoltre 5.1 384 kbit/s
DolbyDigital Plus 7.1 3 Mbit/s Inoltre 7.1 1,7 Mbit/s Non usato
Dolby TrueHD 8 18 Mbit/s 8 18 Mbit/s
  • Il suono Dolby Digital è apparso per la prima volta nei cinema nel 1992 con Batman Returns.
  • L'impulso per lo sviluppo di Dolby Digital Surround-EX è stata la necessità di un'immagine sonora di un'astronave che sorvolava l'auditorium nel film “Star Wars. Episodio I: La minaccia fantasma."

Guarda anche

  • Dolby Atmos
  • Immsound
  • Audio digitale

Letteratura

  1. Standard di compressione audio digitale (AC-3)/Doc.A/52, 20-12-1995
  2. I. A. Aldoshina, E. I. Vologodin, A. P. Efimov e altri. Elettroacustica e trasmissione del suono: un libro di testo per le università / A cura di Yu A Kovalgin. - M.: Hotline-Telecom, Radio e Comunicazioni, 2007. - 872 p.: ill.

Collegamenti

DolbyDigital

Film con audio digitale e analogico

DolbyDigital (AC-3, ATSC A/52) (Dolby Digital) - un sistema di riproduzione del suono spaziale sviluppato da Dolby Laboratories, Inc. ("Dolby Labs"), guidato da Ray Dolby, un pioniere nel settore audio e video.

Formato standardizzato Comitato per i sistemi televisivi avanzati, gli fu assegnato il codice A/52, Dolby Digitale (DD)è un marchio.

I moderni sistemi Dolby Digital forniscono sei canali di suono surround digitale. I canali anteriori sinistro, centrale e destro consentono di determinare con precisione la posizione della sorgente sonora sullo schermo. I canali laterali posteriori sinistro e destro "divisi" separati migliorano il senso di presenza, creando volume. E un ulteriore canale a bassa frequenza aggiunge intensità all'azione sullo schermo.

Nell'industria cinematografica la colonna sonora Dolby Digital viene codificata otticamente direttamente sulla pellicola negli spazi tra i fori. Posizionare una colonna sonora digitale sullo stesso supporto del film consente di coesistere con la traccia analogica senza la necessità di supporti di memorizzazione aggiuntivi e garantisce inoltre l'assoluta sincronizzazione di immagine e suono. Nelle sale IMAX, l'audio viene registrato su un disco rigido separato e sincronizzato con il film utilizzando il time code SMPTE.

Il flusso digitale all'uscita dell'encoder è una sequenza di frame audio (Pack AC-3 Frame). Le informazioni in esso contenute possono essere suddivise condizionatamente in due parti: principale (Informazioni principali) e aggiuntive (Informazioni secondarie).

Il frame audio del codificatore include sei blocchi audio. Ciascun blocco audio contiene informazioni su 512 campioni per ciascuno dei segnali codificati (Audio 1, Audio 2, ..., Audio n). A causa della sovrapposizione temporale del 50%, nel blocco audio vengono inclusi 256 campioni del blocco precedente e 256 nuovi campioni per ciascun segnale. In sei blocchi audio di un fotogramma audio, il numero totale di campioni elaborati per ciascuno dei segnali di ingresso sarà pari a 512 × 6 = 3072. Si noti che se il numero di segnali audio codificati è 5 (formato 3/2), allora il numero totale di campioni, le cui informazioni sono contenute in un fotogramma audio, sarà (512 × 5) × 6 = 15360, tuttavia, tenendo conto della sovrapposizione temporale del 50%, ci saranno solo 15360 ÷ 2 = 7680 nuovi campioni .

Dopo aver campionato i campioni mediante segmentazione temporale, il segnale audio di ciascun canale viene convertito in un nuovo set di dati digitali utilizzando una trasformata coseno discreta modificata (MDCT). La segmentazione dei segnali audio in base al tempo con una sovrapposizione del 50% dei campioni e la loro conversione dal dominio del tempo a quello della frequenza vengono eseguite nel blocco di trasformazione tempo-frequenza (Frequency Domain Transform). Prima della trasformazione ortogonale, i campioni di segnali audio vengono pesati da una funzione finestra. Quest'ultimo è presentato nella norma A/52 in una tabella.

La conversione di un campione audio nel dominio del tempo può essere eseguita utilizzando una trasformata lunga (512 punti) o due brevi (256 punti). Nel primo caso si otterranno rispettivamente 256 e nel secondo 128 + 128 coefficienti MDCT. Con un breve campione, i coefficienti MDCT di entrambi i segmenti, contenenti 128 valori ciascuno, vengono combinati in un blocco comune alternandoli. Questo blocco generale conterrà anche 256 coefficienti MDCT.

La trasformata lunga è preferibile per i segnali che cambiano lentamente in ampiezza nel tempo. Ha una migliore risoluzione di frequenza. La trasformata breve fornisce una migliore risoluzione temporale e viene utilizzata per segnali le cui ampiezze cambiano rapidamente nel tempo, come la regione di attacco di un suono. Il flag Block Switch Flags(blksw flags) indica quale trasformazione (lunga o breve) viene applicata durante il calcolo dei coefficienti MDCT. Il parametro Block Switch Flags è incluso nel flusso di dati digitali in uscita come informazione aggiuntiva e viene utilizzato dal decodificatore quando esegue la trasformazione ortogonale inversa.

A velocità di dati digitali basse, il codificatore Dolby AC-3 prevede l'uso di una procedura speciale per combinare i segnali dei canali (Coupling), che consente di utilizzare meno bit durante la codifica.

Nel sistema Dolby AC-3, ciascun coefficiente MDCT è rappresentato in formato a virgola mobile da due valori: un esponente (o esponente) e una mantissa: Xd[k] = A[k] × 2 -B[k] , dove A[k] e B [k] - mantissa e ordine del coefficiente di conversione k-esimo, rispettivamente. L'ordine è pari al numero di zeri prima del primo della rappresentazione binaria del coefficiente MDCT. È essenzialmente il suo fattore di scala (o fattore di normalizzazione). Ad esempio, se il coefficiente MDCT Xd[k] = 0,158 e la sua rappresentazione binaria è scritta come 0,001010000110, allora l'ordine (fattore di scala) B[k] = 2 e la mantissa è 0,1010000110 in binario o A[k] = 0. 6308 nei sistemi decimali. Il segno del coefficiente MDCT viene preso in considerazione durante la codifica della mantissa. Prima della codifica, le mantisse vengono normalizzate (Normalize Mantissas). Gli esponenti e le mantisse dei coefficienti MDCT sono codificati separatamente nei blocchi Encode Exponent e Quantisse, Encode Mantissas.

Il blocco Bit Allocation tiene conto dell'effetto di mascheramento. La procedura di selezione dei bit si basa su un modello uditivo che consente di stimare il valore massimo ammissibile (di soglia) del livello di rumore, che è ancora mascherato dal segnale utile nella banda di codifica, e, in accordo con i dati di questi calcoli , per selezionare il numero di bit corrispondente durante la codifica della mantissa dei coefficienti MDCT. Tutti questi calcoli vengono eseguiti in un blocco solitamente chiamato modello psicoacustico. Ciascuna mantissa normalizzata viene quantizzata con un numero di stadi di quantizzazione corrispondente al numero di bit definiti nel modulo Bit Allocation.

L'ordine di codifica del coefficiente MDCT nel codificatore Dolby AC-3 è un numero compreso tra 0 e 24. Pertanto, la parola in codice dell'ordine deve avere almeno m = 5 bit (2 5 = 32). L'ordine massimo nell'encoder è limitato a 24.

È noto che se lo spettro di un segnale audio campione viene analizzato utilizzando un banco di filtri, ciascuno dei quali ha una banda di frequenza piuttosto stretta, la differenza nei livelli di energia del segnale tra filtri adiacenti raramente supera i 12 dB. Questa circostanza è stata presa in considerazione durante la codifica degli ordini. Quando si codificano gli ordini nell'encoder Dolby AC-3, viene utilizzato il metodo della modulazione differenziale del codice a impulsi, quando non è l'ordine stesso a essere codificato, ma la differenza tra i valori dell'ordine dei coefficienti MDCT adiacenti. Il valore per il segnale di ciascun canale nella primissima banda di analisi della frequenza più bassa è - si tratta sempre di una parola in codice a quattro bit, che corrisponde all'intervallo di numeri da 0 a 15. L'ordine nella banda di analisi della frequenza successiva più alta è determinato come la differenza tra i valori dell'ordine corrente e precedente dei corrispondenti coefficienti MDCT. Nel codificatore Dolby AC-3, la risoluzione della modulazione differenziale del codice a impulsi (discretezza degli ordini variabili) durante la codifica è limitata ai valori −2, −1, 0, +1, +2. La variazione massima negli ordini dei coefficienti MDCT adiacenti è ± 2, che corrisponde a ± 12 dB.

Il valore differenziale degli ordini dei coefficienti MDCT è combinato in gruppi. Per la procedura di raggruppamento vengono utilizzate tre possibili strategie, designate nella norma come D15, D25 e D45. Nella strategia D15 ciascuno paio, e nella strategia D45 ogni quattro i valori dell'ordine differenziale sono rappresentati da un singolo valore del numero M nel flusso di dati digitali.

I valori dell'ordine differenziale ottenuti direttamente dai coefficienti MDCT originali, in pratica, non sempre danno una differenza massima tra coefficienti adiacenti che non superi l'intervallo di ± 2, richiesto dalle corrispondenti tabelle dello standard Dolby AC-3 . Pertanto, prima della codifica è necessaria un'ulteriore elaborazione dell'array dell'ordine. Con il suo aiuto, alcuni valori dell'ordine vengono ridotti, ma allo stesso tempo i corrispondenti valori della mantissa vengono modificati in modo che davanti a loro appaiano degli zeri nella loro rappresentazione binaria. Dopo aver eseguito questa operazione, l'ordine differenziale massimo non supererà più il valore richiesto di ± 2.

La scelta della strategia (D15, D25 o D45) per la codifica degli ordini dei coefficienti MDCT è un compromesso tra una buona risoluzione in frequenza, risoluzione temporale e il numero di bit richiesti per codificare gli esponenti. Le strategie D15 e D25 possono essere utilizzate per codificare segnali che hanno uno spettro non uniforme, quando il valore dell'esponente cambia abbastanza rapidamente da una banda di analisi all'altra. Se lo spettro del segnale è sufficientemente fluido (piatto), vengono utilizzate le strategie di codifica D45.

Dopo aver scelto una strategia di codifica dell'ordine, l'encoder Dolby AC-3 raggruppa in gruppi le parole in codice corrispondenti ai valori dell'esponente differenziale. Per tutte le modalità operative dell'encoder, gli insiemi di numeri M per tre coefficienti MDCT adiacenti (k, k + 1, k + 2) M[k], M, M sono raggruppati e codificati come una parola a sette bit secondo la regola:

L'intervallo di modifiche nella mantissa dei coefficienti MDCT è compreso tra −1 e + 1. Il segno del coefficiente MDCT viene preso in considerazione durante la codifica della mantissa. Il processo di quantizzazione della mantissa dei coefficienti MDCT nello standard Dolby AC-3 ha le seguenti caratteristiche:

  • il numero di possibili stadi di quantizzazione corrisponde alla seguente serie di numeri: 0, 3, 5, 7, 11, 15, 32, 64, 128, 256, 512, 1024, 2048, 4096, 16384, 65536; viene utilizzata la quantizzazione uniforme delle mantisse;
  • quando il numero di stadi di quantizzazione è 3, 5, 7, 11 e 15, viene utilizzata la cosiddetta quantizzazione simmetrica, in tutti gli altri casi - asimmetrica;
  • quando il numero di stadi di quantizzazione è 3, 5 e 11, le parole in codice della mantissa vengono combinate in gruppi. Con tre stadi di quantizzazione, tre parole di codice corrispondenti a tre valori di mantissa vengono codificate con una parola di codice a cinque bit. Con cinque stadi di quantizzazione, tre parole in codice mantissa vengono raggruppate e codificate in una parola in codice a sette bit. Con 11 stadi di quantizzazione, due parole in codice mantissa sono raggruppate e codificate in una parola in codice a sette bit; negli altri casi non è prevista alcuna procedura di raggruppamento.

Con la quantizzazione simmetrica, al posto dei valori quantizzati delle mantisse, nel flusso digitale vengono inclusi i loro indici, specificati nella tabella corrispondente. Ad esempio, se il numero di stadi di quantizzazione è 3 e il valore della mantissa è compreso tra −1 e −1/3, allora al decodificatore verrà trasmesso un valore pari a −2/3 e l'indice mc = Ad esso corrisponderà 0. Se il valore della mantissa è compreso tra −1/3 e +1/3, allora al decodificatore viene passato il valore pari a zero e viene codificato l'indice mc = 1. Ed infine, se il valore della mantissa è compreso tra +1/3 e +1, quindi viene passato al decodificatore il valore, pari a +2/3, e viene codificato il corrispondente indice della tabella mc = 2. Allo stesso modo, nella forma di Nelle tabelle, gli intervalli dei valori della mantissa e i corrispondenti indici per il numero di passi di quantizzazione sono rispettivamente pari a 5, 7, 11 e 15. Questo metodo di quantizzazione consente di ridurre il numero di bit richiesti. Per tutti gli altri stadi di quantizzazione (32, 64, ..., 65536), non sono gli indici ad essere codificati, ma le mantisse dei coefficienti MDCT stessi.

La fase successiva è la codifica e il confezionamento degli indici tabulari dei valori della mantissa quantizzata in un flusso digitale. Con la quantizzazione simmetrica viene utilizzata un'ulteriore procedura di raggruppamento per ridurre il numero di bit richiesti per la codifica degli indici. Ad esempio, se il numero di stadi di quantizzazione è 7, l'indice della mantissa varia da 0 a 6. La codifica di questa serie di numeri richiede 3 bit. Con 11 passi di quantizzazione, l'indice della tabella della mantissa è compreso tra 0 e 10, mentre con 15 passi di quantizzazione è già compreso tra 0 e 14. In questo caso, il numero di bit necessari per codificare ciascuno di essi sono rispettivamente 4 o 5. Il raggruppamento degli indici delle tabelle consente di ridurre il numero di bit richiesti per la loro codifica a 3, 5 e 11 passi di quantizzazione. Con 3 e 5 stadi di quantizzazione, tre indici di mantissa di tabella e con 11 stadi di quantizzazione, due indici di mantissa di tabella sono codificati con una parola di codice secondo le seguenti regole:

Codice_gruppo = 9mc[a] + 3mc[b] + mc[c]; Codice_gruppo = 25mc[a] + 5mc[b] + mc[c]; Codice_gruppo = 11mc[a] + mc[b],

dove Group_code, Group_code e Group_code sono parole in codice di gruppi di indici di tabella di mantisse, rispettivamente, a 3, 5, 11 passi di quantizzazione; mc[a], mc[b], mc[c] - indici della tabella delle mantisse dei coefficienti MDCT con i numeri a, b e c. Quindi, con tre stadi di quantizzazione della mantissa (n = 3), la parola in codice di un gruppo composto da tre indici conterrà 5 bit, quindi in questo caso verranno spesi 5 ÷ 3 = 1,67 bit per codificare ciascuna mantissa. Con n = 5, la parola in codice del gruppo mantissa sarà rappresentata come un numero a sette bit e la codifica di ciascuna mantissa richiederà 7 ÷ 3 = 2,33 bit. E infine, con n = 11, la codifica di ciascuna mantissa richiederà 7 ÷ 2 = 3,5 bit, e con n = 15 - 4 bit, ecc.

Il codificatore determina la lunghezza della parola in codice di ciascuna mantissa o il corrispondente indice della tabella, dopodiché le mantisse vengono spacchettate utilizzando una procedura speciale.

Quando si lavora in modalità combinazione di segnali audio, l'encoder combina parti ad alta frequenza dei segnali originali in una determinata banda di frequenza in un segnale comune e genera inoltre le cosiddette coordinate di combinazione. Quest'ultimo verrà utilizzato dal decodificatore per ripristinare i rapporti energetici delle parti ad alta frequenza dello spettro di ciascun segnale originale sottoposto alla procedura di combinazione. Dopo la decodifica, le parti combinate in ciascuno dei segnali ricostruiti avranno la stessa composizione spettrale e differiranno solo nel livello.

L'encoder genera un segnale comune semplicemente sommando i coefficienti MDCT dei segnali combinati. In questo caso, i coefficienti MDCT da 37 a 252 sono raggruppati in 18 sottobande (le cosiddette bande di combinazione) con 12 coefficienti in ciascuna di tali sottobande. I limiti di frequenza inferiore e superiore delle bande combinate sono specificati dall'utente. Le coordinate di combinazione vengono calcolate per ciascuna combinazione di segnali di sottobanda. Rappresentano il rapporto tra i coefficienti MDCT massimi di ciascun segnale combinato e il segnale totale nella sottobanda di combinazione. Successivamente, le coordinate di unione vengono convertite in formato a virgola mobile e incluse nel flusso di dati di output come informazioni aggiuntive. Il segnale totale (combinato) è codificato allo stesso modo del segnale dei canali indipendenti.

Decodificatore del sistema Dolby AC-3

Il decodificatore Dolby AC-3 riceve ordini di coefficienti MDCT in forma codificata e confezionata. Per decomprimerli e decodificarli è necessario disporre di informazioni aggiuntive sul numero di esponenti trasmessi nel segnale di ciascun canale e sulla loro strategia di codifica (D15, D25, D45) utilizzata nell'encoder. Il processo di decodifica dell'ordine viene eseguito nel blocco Decode Exponent. Dopo aver decodificato gli ordini, viene eseguita la procedura di disimballaggio, dequantizzazione e denormalizzazione delle mantisse dei coefficienti MDCT (Dequantize, Denormalize Mantissas). Per realizzarlo vengono utilizzati i parametri del modello psicoacustico, i parametri che determinano la distribuzione dei bit nell'encoder, nonché il ripristino dei valori dell'ordine dei coefficienti MDCT. L'operazione di denormalizzazione delle mantisse viene eseguita spostando i bit della parola in codice della mantissa verso destra. In questo caso, il numero di turni è determinato dall'ordine del corrispondente coefficiente MDCT. Se il codificatore utilizza la procedura di combinazione dei segnali provenienti da più canali, ovviamente il decoder deve eseguire l'operazione inversa (De-Coupling), utilizzando i valori delle coordinate di combinazione trasmessi al decoder nel campo dati informazioni aggiuntive. Nel blocco MDCT ortogonale inverso (Inverse Transform), il segnale ricostruito nel decodificatore viene convertito inversamente nel dominio del tempo.

S.I. BSI Blocco audio 0 Blocco audio 1 Blocco audio 2 Blocco audio 3 Blocco audio 4 Blocco audio 5 Dati AUX CRC

Schema 1. Struttura dati del frame audio del sistema Dolby AC-3.

Blocca i flag di commutazione Flag di dithering Controllo della gamma dinamica Strategia di accoppiamento Coordinate di accoppiamento Strategia dell'esponente Esponente Parametri di allocazione dei bit Mantisse

Schema 2. Struttura dati dell'unità audio del sistema Dolby AC-3.

La struttura dei dati audio nello standard Dolby AC-3 è mostrata nella Figura 1. Il campo dati di intestazione di un frame audio contiene informazioni SI (Syncronizator Information) e informazioni sulla configurazione del flusso di dati BSI (Bit Stream Information).

Il campo dati SI include la parola di sincronizzazione (0000 1011 0111 0111 o OB77h), i bit di codifica del controllo del rumore (CRC), la frequenza di campionamento e la dimensione del frame audio. Un frame audio Dolby AC-3 include due parole CRC a 16 bit, la prima all'inizio di ciascun frame dopo la parola di sincronizzazione e la seconda alla fine. Il campo dati BSI contiene informazioni sulla configurazione del flusso di dati digitali, ad esempio, come il tipo di servizio, la modalità operativa dell'encoder (ovvero il numero di segnali codificati o il tipo di formato audio), il livello acustico assoluto del segnale di ciascun canale, informazioni sulla lingua, informazioni sull'ora e altro ancora.

La struttura dati di un blocco audio è mostrata nel Diagramma 2. Comprende i seguenti campi bit: Block Switch Flags - parametro di lunghezza della trasformazione ortogonale; Dither Flags: segno della presenza di rumore aggiuntivo; Controllo della gamma dinamica: dati di controllo per la gamma dinamica dei segnali trasmessi; Strategia di accoppiamento: informazioni sulla combinazione dei segnali (segnali di quali canali sono combinati e a partire da quale frequenza); Coordinate di accoppiamento: coordinate di accoppiamento per il segnale di ciascun canale; Strategia dell'esponente: strategia di codifica dell'ordine selezionata; Esponenti: parole in codice per gli ordini dei coefficienti MDCT; Parametri di allocazione dei bit - parametri del modello psicoacustico; Mantisse - parole in codice per le mantisse dei coefficienti MDCT.

Tecnologie digitali Dolby

Dolby Digital EX

EX è un prefisso utilizzato per designare i sistemi audio Dolby Digital con 6.1 canali: due anteriori, centrale, a bassa frequenza, surround posteriore e due surround laterali.

Dolby Digital Surround EX

Dolby Digital Surround-EX aggiunge un terzo canale di suono surround alla colonna sonora. L'idea appartiene agli ingegneri del suono dello studio Skywalker Sound. La tecnologia è stata sviluppata in collaborazione con Dolby Laboratories e Lucasfilm THX.

Dolby Digital in diretta

Dolby Digital Live (DDL) è una tecnologia per la codifica di segnali audio multicanale (5.1) nel formato AC3 in tempo reale, proposta da Dolby Technologies. Progettato per trasmettere audio multicanale da giochi e altre applicazioni al ricevitore tramite l'interfaccia S/PDIF (ottica o coassiale).

Il suo utilizzo consente di eliminare le restrizioni per cui solo le tracce multicanale già pronte (cioè memorizzate codificate nel formato AC3 o DTS) (di solito la colonna sonora dei film) potrebbero essere trasmesse tramite interfacce digitali) e nei giochi le capacità di uscita digitale erano limitate al solito suono stereo. (Per i giochi 5.1 completi in questi casi, è necessaria una connessione analogica a tre fili, se, ovviamente, è possibile.)

Lo svantaggio fondamentale e fatale della tecnologia DDL è una certa perdita di qualità del suono durante la compressione nel formato AC3 (paragonabile al passaggio da CD-Audio a mp3 con un bitrate elevato), che, tuttavia, è del tutto acritica per lo scopo principale applicazione.

Attualmente, questa tecnologia si trova principalmente nelle schede madri dotate di codec Realtek ALC882D, ALC888DD e ALC888H, nonché in alcuni codec C-Media. Tali schede possono essere trovate nelle descrizioni dei prodotti con la dicitura "AC3 Encode" o "Dolby Digital Live".

Questa tecnologia sta cominciando ad essere introdotta anche nei laptop, dove, data la mancanza di spazio per connettori analogici "extra", promette i maggiori vantaggi: un connettore ti consentirà di ottenere l'audio 5.1 completo in tutte le applicazioni, a condizione che tu colleghi il laptop ad un ricevitore o ad un set di altoparlanti attivi con decoder incorporato.

Delle singole schede audio che supportano questa tecnologia, vale la pena notare Terratec Aureon 7.1, e nelle popolari schede audio della famiglia Creative X-Fi non esiste il supporto DDL, ma (secondo informazioni non ufficiali) in futuro è possibile per introdurlo retroattivamente quando viene rilasciata una nuova versione dei driver.

Per il 2010, i seguenti modelli della famiglia Creative X-Fi supportano questa tecnologia: CREATIVE X-Fi Titanium 7.1, CREATIVE X-Fi Titanium Fatal1ty Pro 7.1, CREATIVE X-Fi Titanium Fatal1ty Champion 7.1

DolbyDigital Plus

MIPS Technologies e Dolby Laboratories hanno introdotto una nuova tecnologia audio per dispositivi che supportano la riproduzione audio e video ad alta definizione, come lettori HD DVD e Blu-ray. La tecnologia audio si chiama Dolby Digital Plus e può essere utilizzata nei core del microprocessore MIPS32.

Dolby Digital Plus migliorerà anche la qualità della registrazione di contenuti audio su supporti HD DVD e Blu-ray Disk, grazie al supporto di un numero di canali ancora maggiore rispetto a quanto possibile con Dolby Digital. Le aziende presenteranno agli sviluppatori di soluzioni SoC (System-on-Chip) varietà del codec integrato Dolby Digital Plus basato sul core MIPS.

Peculiarità:

  • Audio multicanale con canali indipendenti
  • Supporta fino a 7.1 canali* e la possibilità di avere più programmi audio in un unico flusso
  • Uscita flusso Dolby Digital per compatibilità con dispositivi meno recenti
  • Portata massima fino a 6 Mbps
  • Bitrate da 3 Mbps su HD DVD e fino a 1,7 Mbps su Blu-ray Disc
  • HDMI supportato
  • Uno stream può contenere materiale in diverse lingue
  • Nuove opzioni di codifica per i professionisti dell'audio
  • Mantiene l'alta qualità a velocità di trasmissione dati più efficienti (200 Kbps per 5.1 canali)

"Dolby Digital Plus supporta più di 8 canali audio. Gli standard HD DVD e Blu-ray Disc attualmente limitano questo numero a 8.

Dolby TrueHD

Dolby TrueHD è uno dei primi due formati audio non compressi (compressi senza perdita di dati) disponibili solo per lettori HD ottici. Sebbene il codec Dolby TrueHD sia opzionale, il formato è ampiamente supportato da lettori e dischi Blu-ray (molto più di DD+, che spesso manca nei dischi Blu-ray). Dolby TrueHD utilizza l'algoritmo di compressione Meridian Lossless Packing (MLP). Il flusso digitale Dolby TrueHD può ospitare fino a 14 canali audio individuali, ma in pratica funziona con 6 (5.1) o 8 (7.1) canali. Dolby TrueHD supporta una profondità di bit fino a 24 bit e una frequenza di campionamento fino a 192 kHz (per un flusso non compresso massimo di 63 Mbps), ma per Blu-ray attualmente sono disponibili un massimo di 8 canali a 24 bit e 96 kHz ( o in alternativa 6 canali a 24 bit e 192 kHz) per un flusso compresso massimo di 18 Mbps. Una ricerca tra i film Dolby TrueHD disponibili su dischi Blu-ray ha rivelato che attualmente ne è disponibile solo la metà: 6 canali con frequenza di campionamento di 96 kHz e profondità di 24 bit (equivalenti a 13,5 Mbps non compressi e 9 Mbps compressi). dischi con concerti del gruppo Dave Matthews e Tim Reynolds, che hanno ricevuto ottimi punteggi per la qualità sul sito Cinema Squid).

Le specifiche della traccia Dolby TrueHD per i film Blu-ray sono le seguenti:

  • Codec audio: Dolby TrueHD.
  • I canali (schema audio) sono quasi sempre 5.1, 6.1 e 7.1 sono molto rari.
  • I dati sulla chiarezza audio spesso non sono disponibili, ma i valori tipici sono 16 bit a 48 kHz o 24 bit a 48 kHz; per alcuni dischi live questi valori sono 24 bit a 96 kHz.
  • Il valore del flusso solitamente non è disponibile, ma solitamente è 4608 kbps (4,5 Mbps, che corrisponde a sei canali a 48 kHz e 16 bit). Il massimo che abbiamo visto sui dischi Blu-ray dei concerti commerciali è stato di 9,0 Mbps, che equivale a sei canali a 96 kHz e 24 bit. Il valore massimo per Blu-ray è 18 Mbps.

Tecnologie Dolby su supporti ottici

DVD HD disco Blu-ray DVD-Video DVD audio Laserdisc
Codec Supporto hardware Numero di canali (max.) Massimo. Portata Supporto hardware Numero di canali (max.) Massimo. Portata Supporto hardware Numero di canali (max.) Massimo. Portata Supporto hardware Numero di canali (max.) Massimo. Portata Supporto hardware Numero di canali (max.) Massimo. Portata
DolbyDigital Necessariamente 5.1 504 kbps Necessariamente 5.1 640 kbps Necessariamente 5.1 448 kbps Inoltre nella parte video per la compatibilità con i lettori DVD convenzionali 5.1 448 kbps Inoltre 5.1 384 kbit/s
DolbyDigital Plus 7.1 3 Mbit/s Inoltre 7.1 1,7 Mbit/s Non usato
Dolby TrueHD 8 18 Mbit/s 8 18 Mbit/s
  • Il suono Dolby Digital è apparso per la prima volta nei cinema nel 1992 con Batman Returns.
  • L'impulso per lo sviluppo di Dolby Digital Surround-EX è stata la necessità di un'immagine sonora di un'astronave che sorvolava l'auditorium nel film “Star Wars. Episodio I: La minaccia fantasma."

Guarda anche

  • Dolby Atmos
  • Immsound
  • Audio digitale

Letteratura

  1. Standard di compressione audio digitale (AC-3)/Doc.A/52, 20-12-1995
  2. I. A. Aldoshina, E. I. Vologodin, A. P. Efimov e altri. Elettroacustica e trasmissione del suono: un libro di testo per le università / A cura di Yu A Kovalgin. - M.: Hotline-Telecom, Radio e Comunicazioni, 2007. - 872 p.: ill.

Collegamenti


Per coloro che desiderano un suono cristallino, consigliamo di scaricare Dolby Digital Plus per Windows 10. Si tratta di un codec software leggero e intuitivo responsabile della riproduzione audio su qualsiasi dispositivo dotato di altoparlanti.

Peculiarità

Tieni presente che le versioni precedenti di Windows 10 non supportano il codec Dolby Digital. Pertanto, prima di scaricare Dolby Digital, ti consigliamo di aggiornare il tuo sistema alla versione più recente. Altrimenti, questo programma semplicemente non verrà installato, il che significa che non proverai tutte le sue delizie:
  • Conversione del suono alla massima qualità possibile;
  • Regolazione fine dell'uscita audio;
  • Interfaccia chiara in russo;
Dolby Digital Plus è solo uno dei codec audio per Windows 10. Ce ne sono altri, ad esempio. Tuttavia, Dolby Digital è un codec premium e, se il tuo dispositivo lo supporta, ti consigliamo di installarlo.

Il codec è distribuito gratuitamente, è in russo e funziona su tutte le versioni di Windows 10 - 32 e 64 bit. Il codec è compatibile con la maggior parte dei dispositivi moderni, non solo computer, ma anche tablet.

La riproduzione dell'audio su un computer è un processo piuttosto complesso e in più fasi. Il suono attraversa diverse fasi prima di raggiungere l'orecchio umano. Schematicamente si possono distinguere quattro fasi principali: file sorgente, scheda audio, cavi e il sistema di altoparlanti stesso. Inoltre, la posizione dei sistemi acustici nello spazio ha un’influenza significativa sulla qualità del suono.

L'importanza di ciascuna fase è determinata dalla qualità del collegamento finale: il sistema di altoparlanti su cui verrà riprodotto il file audio. Ad esempio, se per riprodurre il suono si utilizzano altoparlanti in plastica di piccole e medie dimensioni, allora non si può prestare attenzione alle restanti fasi, ma se si utilizza un buon sistema acustico, allora per ottenere una soluzione equilibrata non si possono ignorare tutti gli altri collegamenti, poiché ognuno di essi ha un impatto diretto sulla qualità del suono.

Prima di passare ad un esame dettagliato di ciascun anello della catena di riproduzione del suono, consideriamo i concetti di base associati al suono e il modo in cui una persona percepisce il suono.

Suono e sue caratteristiche

il suono come fenomeno fisico è un processo ondulatorio, cioè il processo di propagazione delle vibrazioni dell'aria. La sorgente del suono è qualsiasi corpo oscillante che mette in movimento oscillatorio le particelle adiacenti di un mezzo elastico (aria), che, a loro volta, fanno oscillare le particelle vicine, ecc. Pertanto, si verifica il processo di propagazione delle vibrazioni delle particelle di un mezzo elastico, chiamato onda sonora.

Una delle caratteristiche principali del suono è la sua frequenza, ovvero il numero di vibrazioni sonore al secondo. La frequenza è misurata in Hertz (Hz). Ad esempio, una frequenza del suono di 1000 Hz significa che si verificano 1000 vibrazioni del mezzo elastico al secondo.

La particolarità dell'orecchio umano è che percepisce meglio le vibrazioni sonore nella gamma di frequenze da 1 a 5 kHz. Una persona percepisce inoltre le frequenze più basse con il corpo, determinando il volume in base alla pressione esercitata. Si ritiene che una persona sia in grado di percepire il suono con una frequenza di 16 Hz.

Il limite superiore della gamma udibile è abbastanza individuale, ma i dati statistici medi sono i seguenti: dopo trent'anni, la gamma superiore di udibilità diminuisce a 18 kHz e dopo quaranta raramente qualcuno sente frequenze superiori a 16-17 kHz.

Un'altra caratteristica delle onde sonore è la forza del suono. L'intensità del suono determina il flusso di energia sonora che passa ogni secondo attraverso un centimetro quadrato di un piano convenzionale situato perpendicolare alla direzione di propagazione dell'onda. L'intensità del suono descrive le proprietà energetiche dell'onda stessa e si misura in watt per metro quadrato (W/m2).

Oltre all’intensità del suono, spesso viene utilizzata un’altra caratteristica: la pressione sonora. La pressione sonora è la massima variazione di pressione nell'aria durante la propagazione delle onde sonore rispetto alla pressione che esiste in assenza di onde. L'unità di misura della pressione sonora è un pascal (Pa).

Una persona è in grado di percepire solo quelle onde sonore in cui la forza del suono non va oltre un certo intervallo, chiamato gamma dinamica dell'udito. Il limite inferiore di questo intervallo è chiamato soglia uditiva, ovvero se l'intensità del suono di un'onda sonora è inferiore a questa soglia, non viene percepita dall'orecchio umano. Si assume come soglia di udibilità una forza sonora pari a 10-12 W/m 2 , ovvero 2x10-5 Pa.

Il limite superiore della gamma dinamica dell’udito è chiamato soglia del dolore. Se l'intensità del suono è superiore a questo livello, la persona avverte dolore alle orecchie. La soglia del dolore corrisponde ad un'intensità sonora pari a 10 W/m2.

In pratica, le variazioni dell'intensità del suono sono solitamente espresse in bel e decibel. Se io 1 E io 2 valori iniziali e finali dell'intensità sonora, quindi la variazione del livello sonoro viene calcolata utilizzando la formula:

.

La differenza minima nel livello sonoro che l'orecchio umano può percepire è esattamente di un decibel. Questo è uno dei motivi principali per introdurre un tale sistema di misurazione del livello sonoro. E l'intera gamma dinamica dell'udito è di 130 dB:

.

Sebbene i decibel servano per misurare la variazione di una grandezza fisica, possono essere utilizzati anche per misurare il valore assoluto dell'intensità sonora, prendendo come valore iniziale dell'intensità sonora il valore della soglia di udibilità, cioè 10-12 W /m2. In questo caso, il valore dell'intensità del suono in decibel mostra di quanti decibel questo valore dell'intensità del suono supera la soglia uditiva.

Pertanto, quando dicono che il livello sonoro negli altoparlanti è di 100 decibel, significano che gli altoparlanti funzionano ad un livello che supera di 100 dB la soglia uditiva.

La pressione sonora e l'intensità sonora sono in una relazione quadratica. Significa che:

.

In acustica, la forza di un suono è solitamente associata al suo volume, ma il volume e la forza del suono non sono la stessa cosa. Il volume è la sensazione uditiva soggettiva delle onde sonore, che dipende non solo dalla forza del suono, ma anche dalla sua frequenza.

A frequenza costante, il volume di un suono aumenta all’aumentare dell’intensità del suono. Tuttavia, la nostra percezione del volume dipende in gran parte dalla frequenza del suono. Si sente molto meglio alle frequenze medie, mentre alle frequenze basse e alte la sensibilità dell'udito è attenuata. Il livello di volume sonoro zero corrisponde ad un'intensità sonora di 10-12 W/m2 ad una frequenza di 1 kHz.

Sulla base di studi sull'udito umano, sono stati costruiti grafici noti come curve di uguale volume. Rappresentano linee (si trovano a intervalli di 10 dB ad una frequenza di 1000 Hz) che corrispondono allo stesso volume percepito a frequenze diverse (Fig. 1).

Digitalizzazione e compressione di file audio

L'impressione che si crea ascoltando un qualsiasi sistema di altoparlanti dipende quasi interamente dalla qualità del materiale sorgente. Naturalmente questa affermazione è vera solo per i sistemi multimediali della classe media e superiore. Quindi, sugli altoparlanti in plastica economici è difficile sentire la differenza tra mp3 192 Kbps e mp3 256 Kbps.

Ricordiamo come viene digitalizzato un segnale sonoro, ovvero il segnale analogico viene convertito in una forma di rappresentazione digitale. Il suono digitale è rappresentato come valori di ampiezza discreti. La digitalizzazione (conversione di un segnale analogico in forma digitale) include il campionamento del segnale in base al tempo e la quantizzazione in base all'ampiezza (Fig. 2). La discretizzazione è l'acquisizione di valori di ampiezza dopo un certo passo temporale. Ad esempio, per un CD audio, la frequenza di campionamento è 44,1 kHz, il che significa che ogni secondo vengono prelevati 44.100 campioni di ampiezza del segnale.

La quantizzazione dell'ampiezza è la sostituzione dei valori di ampiezza del segnale reale con valori approssimativi con una certa precisione. La precisione della quantizzazione del segnale è determinata dalla profondità di bit del codec utilizzato. Per i CD audio, la profondità di bit è di 16 bit, che consente di impostare 216=65.536 diversi livelli di ampiezza.

È chiaro che maggiore è la frequenza di campionamento del segnale e maggiore è la profondità di bit del codec, più il segnale analogico originale corrisponderà alla sua rappresentazione digitale.

In matematica è dimostrato (teorema di Kotelnikov Nyquist) che per una corrispondenza biunivoca tra un segnale analogico e la sua rappresentazione digitalizzata, la frequenza di campionamento deve essere il doppio della frequenza massima del segnale analogico. Pertanto, per ottenere informazioni complete sul segnale analogico originale nell'intervallo di frequenza da 0 a 22.050 Hz (nell'intervallo di frequenza udibile), è necessario campionare il segnale ad una frequenza di almeno 44,1 kHz.

I valori campione ottenuti durante il campionamento e la quantizzazione del segnale vengono scritti in un file PCM (Pulse Code Modulation) come insieme di valori di ampiezza sequenziali. È chiaro che maggiore è la frequenza di campionamento e maggiore è la profondità di bit del codec, maggiore sarà la dimensione del file risultante dopo la digitalizzazione del segnale. Pertanto, con una frequenza di campionamento di 44,1 kHz e un codec a 16 bit in modalità stereo, un'ora di file audio ha una dimensione di circa 635 MB. Tieni presente che il tipo di file standard per la memorizzazione di informazioni audio digitalizzate non compresse è attualmente il formato WAV.

Rappresentare un segnale come file PCM è troppo dispendioso e richiede molto spazio su disco. Pertanto, per risparmiare spazio, il segnale audio viene compresso. La compressione può essere di due tipi: con perdita e senza perdita.

La compressione dei dati senza perdita è un metodo di codifica delle informazioni audio che consente il recupero dei dati al 100%. Questo metodo di compressione dei dati viene utilizzato nei casi in cui è necessario preservare il cento per cento della qualità del suono originale dei dati audio. Ad esempio, dopo aver mixato il suono in uno studio di registrazione, i dati devono essere archiviati nella loro qualità originale per un possibile utilizzo successivo. Gli algoritmi di compressione senza perdita esistenti oggi (ad esempio, l'algoritmo implementato nei codec Monkeys Audio, Flac, WavPack, TTA, OptimFrog e altri) possono ridurre la quantità di dati occupati del 20-50% garantendo al tempo stesso il recupero del 100% dei dati originali ottenuti dopo la compressione.

La compressione dei dati con perdita viene utilizzata per ottenere una dimensione minima del file risultante. Ciò si ottiene rimuovendo le parti difficili da sentire dall'originale e tagliando la gamma di frequenza.

Dopo tale conversione, il segnale decodificato, quando riprodotto, suona simile all'originale, ma non esiste una corrispondenza completa tra l'originale e la sua copia convertita.

I metodi di compressione con perdita possono ridurre la dimensione dell'originale di 7-14 volte. È chiaro che maggiore è il rapporto di compressione, minore è la corrispondenza che si ottiene tra il file audio originale e quello risultante.

Esistono molti metodi di compressione con perdita. I più famosi sono MPEG-1 Layer 3 (il nome ufficiale del noto mp3), MPEG-2/4 AAC (MPEG-2 e MPEG-4 Advanced Audio Coding), Ogg Vorbis (OGG), Windows Media Audio (WMA), MusePask (MPC), ecc.

Decodifica audio

La decodifica audio è il processo di conversione del file compresso originale in un formato comprensibile dalle schede audio. La decodifica è necessaria solo per i formati compressi, poiché il flusso non compresso è già comprensibile per le schede audio. La differenza quando si ascolta l'uno o l'altro lettore è evidente solo quando si ascolta un file compresso con un codec con perdita, poiché ogni lettore ha il proprio algoritmo di decodifica.

Dopo la decodifica, il segnale va a una scheda audio, che include un convertitore analogico-digitale (ADC), un convertitore digitale-analogico (DAC) e un sintetizzatore midi. Per ascoltare la musica, il DAC è molto importante: maggiore è la qualità, maggiore è la qualità del suono risultante. Pertanto, se l'acustica è abbastanza buona, è meglio sostituire la scheda audio integrata con una di alta qualità, ad esempio Terratec Aureon Space/Sky, Audiotrack ProDigy 7.1 o anche Creative Live 24 bit 7.1. Ovviamente puoi utilizzare schede audio più costose, ma sull'acustica multimediale sarà difficile sentire la differenza tra loro e lo stesso ProDigy 7.1.

Cavi

Esistono due tipi di cavi: acustici e di interconnessione. I cavi degli altoparlanti vengono utilizzati per collegare gli altoparlanti a un amplificatore, mentre i cavi di interconnessione vengono utilizzati per collegare vari dispositivi, come una scheda audio e un amplificatore. Lo scopo principale del cavo di interconnessione è trasmettere il segnale all'amplificatore senza perdite. Poiché attraverso il cavo di interconnessione scorrono correnti deboli, la schermatura di questo cavo è della massima importanza. Se il cavo ha una scarsa schermatura, sarà suscettibile a vari tipi di interferenze.

Il cavo dell'altoparlante trasmette il segnale già amplificato agli altoparlanti. In questo cavo circolano forti correnti, quindi non è importante solo la schermatura del cavo, ma anche la sua sezione trasversale. Quando in un cavo sottile scorrono grandi correnti, si verifica una perdita di correnti deboli e una perdita di parte delle alte frequenze. Inoltre, spesso si verifica il cosiddetto effetto pelle, l'effetto dello spostamento delle correnti sulla superficie del cavo, a cui sono più sensibili le correnti ad alta frequenza. L'effetto pelle può essere ridotto utilizzando un cavo con nuclei sottili e la perdita di correnti deboli utilizzando un cavo con un numero elevato di nuclei.

Per i sistemi di altoparlanti di fascia media è sufficiente utilizzare un cavo di interconnessione con una buona schermatura e un cavo per altoparlanti OFC (rame privo di ossigeno) con una sezione di circa 1,0 mm2 per altoparlanti con una potenza di 20 W (per altoparlante). e una sezione di 1,5 mm2 per altoparlanti con potenza fino a 50 W (per altoparlante).

Sistemi acustici

Il sistema Bushy (AS) è un dispositivo progettato per convertire i segnali elettrici in vibrazioni acustiche. Nella stragrande maggioranza degli altoparlanti, la conversione dei segnali elettrici in vibrazioni sonore avviene tramite testine elettrodinamiche, il cui principio di funzionamento si basa sul fenomeno dell'induzione elettromagnetica.

La parte principale della testa elettrodinamica è un diffusore che crea onde sonore. Il diffusore della testa elettrodinamica ha due superfici: anteriore e posteriore. Pertanto, durante il movimento oscillatorio del diffusore, si generano due onde sonore, una delle quali proviene dalla sua superficie anteriore e la seconda dalla sua superficie posteriore. Queste onde sono in antifase tra loro e si annullano parzialmente a vicenda nello spazio aperto. Per eliminare questo effetto smorzante, l'onda emessa dalla superficie posteriore del diffusore viene smorzata posizionando la testa elettrodinamica in uno spazio chiuso (nell'alloggiamento dell'altoparlante).

Parlando del diffusore, notiamo che per frequenze diverse vengono utilizzati tipi diversi di diffusori. Pertanto, i diffusori in Kevlar vengono utilizzati per le frequenze medie e basse e i diffusori in seta per le alte frequenze.

Oltre al diffusore, la testa elettrodinamica ha anche una sospensione, il cui compito principale è riportare il diffusore allo stato originale durante il suo movimento oscillatorio. La sospensione dovrebbe essere sufficientemente rigida da riportare rapidamente il diffusore al suo stato originale, ma allo stesso tempo sufficientemente morbida da non ostacolare il movimento del diffusore.

Importante è anche la dimensione della colonna in cui è posizionata la testa elettrodinamica. Fondamentalmente, più sono, meglio è. Nel piccolo corpo dell'altoparlante si crea un'eccessiva elasticità dell'aria nel volume interno, che esercita una pressione sul diffusore dal lato posteriore, provocando una diminuzione della flessibilità della sua sospensione. Ciò ha un effetto particolarmente negativo sugli altoparlanti a bassa frequenza.

Tipi di sistemi di altoparlanti

In termini di progettazione acustica, i sistemi acustici possono essere suddivisi nelle seguenti tipologie:

  • alloggiamento aperto o design acusticamente scarico (la parete posteriore dell'alloggiamento dell'altoparlante è parzialmente o completamente assente);
  • un alloggiamento con labirinto per lo smorzamento delle onde generate dalla parete posteriore del diffusore;
  • alloggiamento chiuso o design con carico acustico;
  • corpo con bass reflex. Un bass reflex è un tubo di una certa lunghezza e sezione trasversale montato nell'alloggiamento. Il bass reflex consente di ottenere una riproduzione normale delle basse frequenze grazie al fatto che vengono amplificate molte volte nel tubo bass reflex. Inoltre, il bass reflex riduce la pressione in eccesso nella colonna;
  • alloggiamento con radiatore passivo.

Principali caratteristiche dei sistemi acustici

Le principali caratteristiche dei sistemi acustici sono tradizionalmente le seguenti:

Volume dell'altoparlante;

Potenza dell'altoparlante;

sensibilità;

Risposta in ampiezza-frequenza;

Distorsione armonica;

Distorsioni non lineari;

Rapporto segnale-rumore;

Separazione di frequenza.

Volume dell'altoparlante misurato esattamente allo stesso modo del volume del suono. L'unica differenza è che la misurazione non si basa sull'intensità del suono, ma sulla tensione sulla testa elettrodinamica, cioè:

,

dove U 1 è una tensione di riferimento e U 2 è il massimo consentito.

Esistono diversi tipi di tensioni di riferimento, quindi per evitare confusione vengono utilizzate unità di misura diverse. Pertanto, se l'unità di misura è dB (dBu), come tensione di riferimento viene utilizzata 0,775 V. Per le unità di misura dBV (dBV), come tensione di riferimento viene preso 1 V. Le unità dB e dBV sono correlate a tra loro da una relazione ovvia:

.

Esiste anche un'unità di misura chiamata dBm, che utilizza anch'essa una tensione di riferimento di 0,775 V.

Il volume del sistema di altoparlanti è direttamente correlato al volume del suono prodotto. Pertanto, se il passaporto dell'oratore indica che il suo valore di volume è di 60 dB, in una stanza con un sistema del genere acceso al massimo, dovrai parlare ad alta voce.

Perché il potenza degli altoparlanti può essere misurato in diversi modi e di conseguenza esistono diverse unità per misurare la potenza.

La potenza, misurata in RMS (Root Mean Squared Root Mean Squared), viene misurata applicando un segnale alla frequenza di 1 kHz a una distanza di 1 m dall'altoparlante ottenendo una distorsione armonica specificata (tipicamente il 10%). Quindi, se si dice che la potenza del sistema di altoparlanti è di 50 W RMS, significa che quando gli viene fornito un segnale di 50 W, l'altoparlante può funzionare a lungo senza danni meccanici alla testa elettrodinamica (rottura del diffusore, danni alla sospensione, danni alla bobina, ecc.). Tuttavia, con una distorsione così forte (10%) è quasi impossibile sentire qualcosa a causa del forte respiro sibilante.

Un'altra opzione di misurazione della potenza è il Peak Music Power Output (PMPO). Questa potenza determina il carico di picco a breve termine che l'acustica può sopportare senza danni meccanici. Si noti che questo potere non ha alcun significato pratico.

Sensibilità dell'altoparlante caratterizza la pressione sonora creata da un altoparlante ad una distanza di 1 m quando viene fornito un segnale con una potenza di 1 W e una frequenza di 1 kHz. La sensibilità viene misurata in decibel rispetto alla soglia uditiva (2S10-5 Pa). Ad esempio, una sensibilità di 85 dB/W/m significa che l'altoparlante è in grado di produrre una pressione sonora di 85 dB ad una distanza di 1 m dall'altoparlante quando viene fornito un segnale da 1 W.

Convenzionalmente, si considera che una sensibilità di 84-88 dB/W/m sia bassa, una sensibilità di 89-92 dB/W/m sia media e una sensibilità di 93-102 dB/W/m sia alta.

La sensibilità è una caratteristica piuttosto indicativa di un altoparlante, poiché ne determina direttamente il volume. Ad esempio, quando si confrontano due altoparlanti con una potenza di 60 W RMS, si dovrebbe dare la preferenza a quello con la sensibilità maggiore, poiché il volume del suono creato da tale altoparlante sarà maggiore, a parità di tutte le altre condizioni.

Risposta in ampiezza-frequenza (AFC)

La caratteristica ampiezza-frequenza è un grafico della variazione dell'ampiezza del segnale di uscita rispetto alla sua frequenza sull'intera gamma di frequenze riprodotte. La risposta in frequenza viene misurata fornendo un segnale sinusoidale di ampiezza costante e variabile in frequenza. Nel grafico l'ampiezza di un segnale sinusoidale corrispondente alla frequenza di 1 kHz viene considerata pari a 0 dB.

Idealmente, la risposta in frequenza è una linea retta su tutta la gamma di frequenze (da 20 Hz a 20 kHz). In questo caso, il segnale viene riprodotto senza distorsioni. Tuttavia, in realtà tale risposta in frequenza ideale non esiste.

A volte, al posto del termine risposta in frequenza, viene utilizzato il concetto FR (Risposta in Frequenza). In questo caso, invece del grafico della risposta in frequenza, vengono fornite solo le frequenze riproducibili al limite e le irregolarità. Ad esempio, se viene indicato 120 Hz-18 kHz (± 3 dB), ciò significa che questo altoparlante nella gamma di frequenze da 120 Hz a 18 kHz ha un suono e una distorsione affidabili (cambiamento nell'ampiezza del segnale rispetto all'ampiezza a una frequenza di 1000 Hz) non supera i 3 dB.

Distorsione non lineare misurato applicando un segnale sinusoidale con una frequenza di 1000 Hz. Utilizzando un filtro speciale, le armoniche "extra" vengono identificate nel segnale sonoro e viene determinata la loro potenza. Il risultato finale è espresso come distorsione armonica totale (THD), ovvero il peso delle armoniche aggiuntive nello spettro del segnale sinusoidale originale da 1 kHz dopo che è passato attraverso il percorso di distorsione. Questo coefficiente si calcola come radice quadrata del rapporto tra la somma delle potenze di tutte le armoniche, tranne quella fondamentale, e la potenza del segnale utile. L'acustica della classe Hi-Fi deve avere un THD non superiore all'1,5% ad una frequenza di 1000 Hz.

dove S livello del segnale utile, N livello del rumore.

L'indicatore SNR per un ottimo sistema di altoparlanti è superiore a 90 dB, per un sistema di classe media è di circa 75-85 dB e per un sistema di bassa qualità è inferiore a 60 dB.

Diafonia Questo indicatore determina la quantità di frequenze medie e basse trasmesse al tweeter. La diafonia viene calcolata come il rapporto tra il segnale trasmesso e il segnale attenuato utilizzando un filtro di frequenza. Ad esempio, un valore di 60 dB indica che il filtro di frequenza del segnale originale, quando applicato al tweeter, riduce le frequenze basse e medie di 60 dB.

Suono Dolby Surround (DSS)

La tecnologia Dolby Surround Sound è una tecnologia di codifica audio basata su filtri progettata per l'uso domestico (home theater). Utilizzando un decoder Dolby Surround, questa tecnologia consente di selezionare tre canali audio da un segnale codificato a due canali (segnale stereo): sinistro, destro e posteriore con una gamma di frequenza da 100 Hz a 7 kHz. In assenza di un decoder, il suono viene riprodotto come un normale suono stereo a due canali.

Questa tecnologia è stata introdotta dai Dolby Laboratories nel 1982.

Dolby Surround Pro Logic (DPL)

La tecnologia Dolby Surround Pro Logic rappresenta il passo successivo nello sviluppo dell'audio multicanale per i sistemi home theater. Questo standard è stato proposto dai Dolby Laboratories nel 1987. La tecnologia Dolby Surround Pro Logic consente di estrarre quattro canali di suono surround (sinistro, destro, centrale e posteriore) da una traccia stereo a due canali. La gamma di frequenza va da 100 Hz a 7 kHz.

DolbyDigital

Dolby Digital, introdotto nel 1992, è uno standard di decodifica audio multicanale che rappresenta l'audio come sei canali separati: cinque canali surround (sinistro, destro, centrale e due anteriori) e un canale a bassa frequenza (subwoofer). La presentazione audio era inizialmente digitale e la gamma di frequenza è stata ampliata da 20 Hz a 20 kHz (attualmente la gamma di frequenza va da 3 Hz a 20 kHz per cinque canali e da 3 Hz a 120 kHz per il canale subwoofer). Questo standard è uno dei più diffusi oggi.

Dolby Digital AC3

Lo standard Dolby Digital AC3 è uno schema di compressione audio sviluppato appositamente per lo standard Dolby Digital. Questo schema di compressione utilizza un modello psicoacustico, che ha un'efficienza molto elevata (il rapporto di compressione può essere superiore a 12:1 e un bitrate da 64 a 640 Kbps) e un'ottima qualità del suono.

Dolby Surround AC3

Dolby Surround AC3 versione semplificata dello standard Dolby Digital, progettata per i sistemi home theater. Questo standard si differenzia dallo standard Dolby Digital per la velocità di flusso dati ridotta.

DTS (sistema teatrale digitale)

Come Dolby Digital, DTS è uno standard audio a sei canali (5.1), ma con una qualità molto più elevata. Il rapporto di compressione qui è 4:1 e la velocità dati (bitrate) è 882 Kbps (algoritmo apt-X100). Grazie ai tassi di compressione più bassi e ad un algoritmo più avanzato, la qualità dell'audio codificato in DTS è molto superiore a quella del Dolby Digital, ma quest'ultimo standard è più comune a causa dell'uso diffuso dei DVD. L'alta qualità del DTS ha portato al suo utilizzo anche per la creazione di dischi musicali, anche se in una forma leggermente modificata (con rapporti di compressione inferiori e un algoritmo di codifica modificato). La produzione di DVD DTS utilizza una frequenza di campionamento di 48 kHz, rendendola lo standard di codifica audio DVD di massima qualità oggi disponibile.

Dolby Pro Logic II

Lo standard Dolby Pro Logic II, che è un ulteriore sviluppo degli standard Dolby Stereo Pro Logic, consente al decoder di scomporre il suono stereo convenzionale in sei canali (5.1).

Dolby Pro Logic IIx

Dolby Pro Logic IIx è il passo successivo nello sviluppo di Dolby Pro Logic II. In questo caso è implicita la possibilità di scomporre il suono stereo in sette (6.1) o otto (7.1) canali. Lo standard Dolby Pro Logic IIx è finora l'unico standard che offre la possibilità di espandere correttamente e completamente qualsiasi suono stereo o 5.1 nei formati 6.1 e 7.1. Sono possibili tre modalità di decodifica:

Duplicazione film del canale centrale o dei canali posteriori;

Gioco (Play) il segnale viene inviato solo in aggiunta a “nuovi canali”;

Musica (Musica).

Nessuna modalità utilizza le informazioni provenienti dai canali anteriori (solo dal centro e da quello posteriore).

Dolby Digital EX

Questo standard è una variante dello standard Dolby Pro Logic IIx destinato agli home theater.

Dolby Digital Surround EX

Lo standard Dolby Digital Surround EX è una versione 6.1 ampliata e relativamente nuova dello standard Dolby Digital Surround. Questo standard dispone di un altro canale posteriore che duplica il canale centrale esistente se l'audio sorgente è registrato in formato 5.1. Se il file sorgente viene presentato in formato 6.1, il canale aggiuntivo diventa un altro canale audio surround a tutti gli effetti.

DTS-ES

Lo standard DTS-ES è un analogo a tutti gli effetti dello standard Dolby Digital EX, ma di DTS. Questo standard consente inoltre di codificare l'audio nei formati 6.1 e 7.1 e di scomporre l'audio 5.1 codificato in DTS in sette (6.1) o otto (7.1) canali, rispettivamente.

I migliori articoli sull'argomento