Kako postaviti pametne telefone i računala. Informativni portal
  • Dom
  • Sigurnost
  • Dinamički raspon digitalnih audio staza. Što je dinamički raspon (DR) i kako utječe na kvalitetu zvuka

Dinamički raspon digitalnih audio staza. Što je dinamički raspon (DR) i kako utječe na kvalitetu zvuka

VOLOGDIN E.I.

DINAMIČKI DOSEG

DIGITALNI AUDIO PUT

Bilješke s predavanja

St. Petersburg

Dinamički raspon zvukova i glazbe ............................................ ........................................................

Dinamički raspon fonograma ........................................................ ................................................................

Dinamički raspon digitalnog audio puta.................................................. ....................................

Proširivanje dinamičkog raspona pomoću Dithering tehnologije .....

Proširenje dinamičkog raspona uz tehnologiju oblikovanja buke

.......................................................................................................................................................

Bibliografija ................................................. ................................................ .. ...........

1. Dinamički raspon zvukova i glazbe

Osoba čuje zvuk u iznimno širokom rasponu zvučnih pritisaka. Ovaj raspon se proteže od apsolutnog praga sluha do praga boli od 140 dB SPL u odnosu na nultu razinu, što se uzima kao tlak od 0,00002 Pa (slika 1.). Zona rizika na ovoj slici označava područje zvučnih pritisaka, koji, kada

Apsolutni prag sluha

Frekvencija tonskih zvukova, kHz

Riža. 1. Područja sluha sluha

produljeno izlaganje može dovesti do potpunog gubitka sluha. Prag boli za tonske zvukove ovisi o frekvenciji; za zvukove s proizvoljnim spektrom, kao prag boli uzima se razina pritiska od 120 dB SPL. Graf apsolutnog praga sluha prilično je točno opisan empirijskom jednakošću

U tišini se osjetljivost sluha osobe povećava, au atmosferi glasnih zvukova smanjuje, sluh se prilagođava okolnom zvučnom okruženju, stoga dinamički raspon sluha ne tako velika - oko 70..80 dB. Odozgo je ograničen pritiskom od 100 dB SPL, a odozdo bukom s razinom od -30 ... 35 dB SPL. Ovaj dinamički raspon može se pomicati gore i dolje za do 20 dB. Za ugodnu percepciju glazbe preporuča se da zvučni tlak ne prelazi 104 dB SPL kod kuće i 112 dB SPL u posebno opremljenim prostorijama.

Dinamički raspon glazbe definira se kao omjer u decibelima najglasnijeg zvuka (fortissimo) i najtišeg zvuka (pianissimo). Dinamički raspon simfonijske glazbe iznosi 65 ... 75 dB, a na koncertima rock glazbe se povećava

do 105 dB, dok vrhovi zvučnog tlaka mogu doseći 122 ... 130 dB SPL.

Dinamički raspon vokalnih izvođača ne prelazi 35 ... 45 dB (tablica 1).

Dinamički raspon glazbe značajno ovisi o izboru maksimuma

zvučni tlak P max , budući da je odozdo ograničen apsolutnim pragom

čujnost. Ova ovisnost je najizraženija na rubovima audio raspona.

Na sl. 2

dati su primjeri promjene dinamičkog raspona tonskih zvukova. NA

120dB prag boli

Pmax

80dB

DR 40 dB

50dB

80dB

50dB

Apsolutni prag

čujnost

Frekvencija tonskih zvukova, kHz

Riža. 2. Dinamički raspon glazbe i pragovi sluha

ovisno o izboru P max

i tonske frekvencije

dinamičan

rasponu

80 dB smanjen na rubovima

raspon zvuka do 40

Zato

uobičajeno je mjeriti dinamički raspon zvukova na frekvenciji od 1 kHz, gdje može

dosegnuti 117 dB.

soba maskira zvuk i time smanjuje njegov dinamički raspon

glazba odozdo. sl.3. prikazano kao kada se zvučni tlak smanji sa 120 na 80 dB

SPL dinamički raspon glazbe zbog buke u prostoriji smanjen je s 90 na 50 dB.

120dB SPL

DR 90 dB

Utjecaj

potpuno

zanemariti

samo kad

90dB

90dB

minimalna razina glazbenih zvukova.

70 dB

Razina buke u studijima za snimanje

90dB

premašuje

apartmani

50dB

razgovor

povećava razinu

buka do 60dB SPL.

Zato se tiha glazba često utopi

Buka u stanu

prostorije

audicije

nehotice

nastaje

povećati

volumen.

Šum kvantizacije je bijeli

buka, primjetna na uho kada je

Buka u studiju

intenzitet do 4 dB SPL, čak i kada

opća buka audio opreme u prostoriji

dosegne

Riža. 3. Dinamički raspon glazbe

treba odvagnuti s činjenicom da

FS skala digitalnog mjerača razine

odgovaraju razini između 105 i 112 dB SPL. Stoga, za

kućanskih prostorija

dinamički raspon glazbe ne smije prelaziti 101 - 108 dB.

Dinamički raspon mikrofona definira se na isti način kao što se obično radi u električnim putovima. Gornja granica ograničena je dopuštenom vrijednošću nelinearnih izobličenja, a donja granica - razinom unutarnje buke. Moderni studijski mikrofoni dopuštaju maksimalni zvučni tlak od 125 ... 145 dB SPL, dok nelinearna distorzija ne prelazi 0,5% ... 3%. Razina buke mikrofona je 15 ... 20 dBA, dinamički raspon je od 90 do 112 dBA, a omjer signal-šum je 70 do 80 dBA. Ovi mikrofoni pokrivaju cijeli raspon ljudskog sluha od 120dB SPL do 20dB SPL razine studijske buke. U modernim studijima snimanje se vrši pomoću 22 ili 24-bitnih ADC-a, ponekad se koristi kvantizacija s pomičnim zarezom, tako da nema problema s dinamičkim rasponom. Takva oprema je izuzetno skupa.

2. Dinamički raspon fonograma

Glazbeni i govorni signali slijed su brzo rastućih i sporije opadajućih zvučnih impulsa (slika 4.). Ovaj signal je karakteriziran rms i vršne razine, razlika između ovih razina naziva se krest faktor. Kvadratni val (kvadratni val) ima jedinični vršni faktor od 0 dB, a sinusoidni vrh faktor 3 dB. Fonogrami glazbenih i govornih signala imaju krest faktor do 20 dB ili više. Vrijeme određivanja Faktor vrha je povezan s vremenom integracije kada se izračunava RMS vrijednost signala i obično iznosi 50 ms.

Dinamički raspon i krest faktor glazbenog fonograma određuju se statističkom obradom trenutnih vrijednosti signala. Najdetaljnije statističke karakteristike izračunate su u Audition 3 audio editoru (slika 4).

sl.4. Fragmenti fonograma glazbenih ulomaka različitog trajanja

Od njih, glavne su sljedeće: vršna amplituda (Lpic), maksimalna RMS snaga (L max), minimalna RMS snaga (L min) i Prosječna RMS snaga (L avr) (razine maksimuma,

minimalna i srednja RMS (efektivna) jačina signala).

Dinamički raspon fonograma prema ovoj tablici definiran je kao

DR mL slika L min ,

krest faktor se izračunava po formuli

PF mL picL avr

Dinamički raspon se također može odrediti histogramom distribucije razina fonograma, prikazanom na sl.5. Takve je operacije prikladno izvesti brzo prije i nakon dinamičke obrade fonograma.

sl.4. Statističke karakteristike fonograma Beethovenove glazbe "Elise"

sl.5. Histogram distribucije Beethovenove glazbe "Elise"

ovisno o zadatku studija. Ako je, na primjer, važan dinamički raspon trenutnih vrijednosti razina fonograma, tada bi vrijeme integracije trebalo biti 1-5 ms. Ako se dinamički raspon glazbe mjeri uzimajući u obzir slušnu percepciju, tada je vrijeme integracije odabrano na 60 ms, što je vremenska konstanta sluha.

omogućuje određivanje dinamičkog raspona i faktora vrha s danom vjerojatnošću u odabranom vremenu integracije. Uređivač zvuka Adobe Audition 3 koristi normalizaciju histograma, u kojoj maksimalna vjerojatnost događaja uvijek odgovara vrijednosti 100. Takav histogram opisuje distribuciju vjerojatnosti razina signala fonograma u odnosu na maksimalnu vrijednost. Kada se izgradi automatski se odabire ljestvica duž X osi, pa je teško usporediti histograme različitih fonograma.

Praktična upotreba. Kome i zašto trebaju statistički podaci i histogram zvučnog zapisa. Prije svega, ovi podaci pružaju neprocjenjivu pomoć u dinamičkoj obradi fonograma, budući da vam omogućuju da razumno odaberete karakteristike kompresora i ekspandera. Statistički rezultati obrade fonograma s glazbom različitih žanrova omogućuju određivanje potrebnog dinamičkog raspona elektroakustičkog puta, formiranje zahtjeva za vršnu i prosječnu snagu glava akustičkog sustava. Oni igraju bitnu ulogu u razvoju algoritama kompresije audio signala.

Emotivna glazba sa širokim dinamičkim rasponom i visokim vrhom

faktor se može slušati samo na visokokvalitetnoj skupoj opremi uz dobru

akustični

agregati.

slušalicama i u automobilima zbog dinamičke buke

15 raspon se smanjuje i ona

samo odvratno.

Stoga takvi zapisi nisu u velikoj potražnji i,

neizbježno, svake godine dinamički raspon i vrhunac-

sl.7. Soundtrack pjesme "I'll Be There For You"

Riža. 6. Crest faktor za CD-e

fonograme proizvođači namjerno smanjuju (slika 6). Na modernim CD-ovima

diskova u većini slučajeva, dinamički raspon ne prelazi 20 dB, a vrh faktor je

nešto više od 3 dB, što je sasvim dovoljno za plesnu glazbu. Na sl.7. dano

slika modernog soundtracka s CD-a.

3. Dinamički raspon digitalnog audio puta

Konvencionalni digitalni put

uključuje ADC i DAC.

Prvi provodi

kvantizacija analognih signala, te njihovo pretvaranje u digitalni tok. Drugi

vrši inverznu pretvorbu digitalnog toka u analogni signal.

Kvantizacija

zaokruživanje

uzorci sekvenci

na cjelobrojni binarni

vrijednosti. Uz modulaciju impulsnog koda (PCM), ovo

operacija

provedeno

linearni

kvantizer, koji se u tehničkoj literaturi naziva Mid-

nit. Na

njemu opremu

ima oblik

"stepenice" s istim stepenicama

nužno,

neparan broj razina kvantizacije. zaokruživanje

digitalni podaci u ovom kvantizatoru proizvedeni

najbliži

binarnu vrijednost (slika 8).

Ovaj algoritam

naziva zaokruživanje.

algoritam

slobodan dan

kvantizator

je simetričan u odnosu na vremensku os i kvantizaciju

Riža. 8. Zupčanik

provodi se s pragom jednakim

0,5 koraka kvantizacije

funkcije kvantizatora

Sve dok je ulazni signal manji od ovog praga, izlazni

Srednji profil i srednji uspon

signal kvantizatora je nula, što znači da

kvantizacija se provodi sa središnjim cutoffom.

ulazni signal malo iznad praga kvantizacije, izlazni signal ima oblik

slijed impulsa s ovisno o radnom ciklusu

od razine

daljnje povećanje razine SL formira izlazni signal stepenastog oblika.

Zaokruživanje digitalnih podataka u kvantizatoru Mid-Riser izvodi se na najbližu manju vrijednost (slika 8), pa se ovaj algoritam obično naziva skraćenjem. Mid-Riser kvantizator razlikuje se po tome što nema prag kvantizacije, tako da prenosi audio signale na vrlo niskim razinama, čak i ispod razine

buka. Međutim, u nedostatku ZS, svaki beznačajan šum na izlazu stvara slijed slučajnih impulsa s amplitudom od 1 kvanta, što znači da takav kvantizator pojačava šum.

ADC dinamički raspon sa kvantizatorom srednjeg sloja određuje se kroz logaritam omjera maksimalne i minimalne vrijednosti sinusoidnog signala na ulazu kvantizatora

DR A 20 logA max,

Amin

Q 2 (q 1), A

Q je korak kvantizacije, q je broj znamenki. Zato

DRA

Q 2 (q 1)

) 6,02q (1)

Q/2

Kod q = 8 ovaj dinamički raspon iznosi 48 dB, a kod q = 16 raste na 96 dB. Vrijednost DR A definira donju granicu dinamičkog raspona za razinu ulaznih signala kvantizera tipa Mid-Tread.

DAC dinamički raspon mjereno u skladu s preporukama EIAJ u smislu omjera maksimalne RMS vrijednosti signala

sinusoidalni oblik A max na svom izlazu na efektivnu vrijednost šuma kvantizacije, mjereno u pojasu od 0 do Nyquistove frekvencije F N

Amax

Q 2 (q 1)

Amax

q 1,76; q

Za q = 16

DR R = 98 dB, što

decibel

dinamički raspon

kvantizer definiran formulom (1). Dinamički raspon DAC-a mjeren na ovaj način identificira se s njegovom SNR vrijednošću.

Ako je gornji frekvencijski raspon ograničen vrijednošću F max F N , tada formula za izračun za SNR i DR R postaje

SNR R DR R 6,02q 1,76 10log

2Fmax

gdje je f s - frekvencija uzorkovanja, F max - maksimalna frekvencija audio raspona. Na

f s = 44,1 kHz i F max = 20 kHz i SNR R =DR R = 98,5 dB. Kao što vidite, omjer signala i šuma je samo 2 dB veći od dinamičkog raspona. Treba napomenuti da vrijednost SNR ovisi o frekvencijama fs i Fmax, dok DR ne ovisi o tim parametrima.

Međutim, većina tehničkih publikacija izjednačava dinamički raspon s omjerom signal-šum. To potvrđuju i AES 17 i

IEC 61606.

Standard IEC 61606 preporučuje mjerenje SNR i DR kada se na ulaz ADC-a primjenjuje sinusni signal frekvencije 997 Hz i razine minus 60 dB FS uz obveznu upotrebu TPDF Dithering tehnologije. U ovom slučaju, izračunati omjer za SNR zbog unesene dodatne buke je predložen u obrascu

SNR T DR T 6,02q 3,01 10log

2Fmax

U prethodnim uvjetima, DR = SNR = 93,7 dB, a ne 96 dB, kako se često nalazi u tehničkoj literaturi. Posljedično, izračunati dinamički raspon također se smanjuje. Umjesto SNR-a, često se koristi njegova recipročna vrijednost, koja određuje integralnu razinu šuma kvantizacije

L nTSNR T.

U skladu sa standardom IEC 61606, mjerenje dinamičkog raspona DR R vrši se prema shemi prikazanoj na slici 9. U ovoj shemi, test

sl..9. DAC mjerni krug dinamičkog raspona

digitalni signal s frekvencijom od 1 kHz i razinom od minus 60 dB, formiran pomoću TPDF Dithering tehnologije, dovodi se na DAC ulaz. Analogni signal iz DAC-a ulazi u niskopropusni filtar s graničnom frekvencijom od 20 kHz, što ograničava spektar šuma kvantizacije. Zatim se filtriranje izvodi pomoću filtera za ponderiranje tipa A, koji uzima u obzir osobitosti slušne percepcije šuma kvantizacije, što povećava dinamički raspon za 2-3 dB. Ispitni signal i šum se pojačavaju za 60 dB i unose u mjerač razine THD+N. U ovom mjeraču, tonski signal se potiskuje notch filterom, a razina buke se mjeri u decibelima RMS voltmetrom. Ova izmjerena razina buke identificirana je, s suprotnim predznakom, s dinamičkim rasponom DAC-a.

Prilikom kvantiziranja signala minimalne razine dolazi do ogromnih izobličenja koja dosežu 100% (slika 10.). U tom smislu, u praksi se treba voditi pravi dinamički raspon ADC. Prilikom određivanja ovog raspona potrebno je uzeti u obzir: faktor vrha glazbenih signala, koji doseže 12 ... spriječiti slučajno preopterećenje.

Kao rezultat, pravi dinamički raspon

snimanje 16-bitni ADC PCM

ne prelazi 48…54 dB. Ovaj

ni dovoljno blizu za dobro

studio

zvučne snimke.

automatska kontrola razine

odvija se prilikom snimanja CD-a,

raspon se može proširiti do 74

16 bita, 1000 Hz, 93 dB

uočljiv

pogoršanje

kvaliteta zvuka signala niske razine.

sl.10. Slijed uzoraka je iskrivljen

Prostor za glavu na vrhu

sinusoidni valni oblici

štiti od mogućnosti preopterećenja,

premašiti

očekivana vrijednost. Prilikom snimanja plesne glazbe dovoljan je prostor za glavu od 6 dB.

Prilikom snimanja simfonijske glazbe, ponekad morate imati marginu do 20 ... 30 dB. Granica dinamičkog raspona na dnu sprječava mogućnost da tihi prolazi budu ispod razine buke i, štoviše, ispod praga čujnosti.

U digitalnim stazama gornja granica dinamičkog raspona ograničeno na razinu signala od 0 dB FS . Bez korištenja tehnologije Dithering donje granice dinamičkog raspona ograničeno razinom

LA1/DRA.

S q = 8 bita, jednako je minus 48 dB, a s q = 16 bita minus 96 dB. Neizbježna buka na putu povećava ovu razinu.

Integrirana razina buke minus 93,7 dB je puno ili malo. Važno je koliko ta razina prelazi prag čujnosti. Dithering buke

sl.11. Pragovi čujnosti za šum kvantizacije ovisno o broju bitova

kvantizacija postaje bijeli šum, prag sluha je 4 dB SPL. To znači da će blizu 3 kHz, šum kvantizacije na q = 16 bita premašiti prag sluha za 22,3 dB (slika 11). Kao što možete vidjeti iz ove slike, potrebna je 20-bitna kvantizacija kako bi šum kvantizacije bio nečujan.

4. Proširivanje dinamičkog raspona pomoću Dithering tehnologije

Za proširenje dinamičkog raspona PCM put s tipom kvantizatora MeadTread bez povećanja broja znamenki i učestalosti uzorkovanja, mnogo

analognih signala, mala količina analognog šuma dodaje se ES-u. Češće se ova tehnologija koristi za rekvantizacija digitalnih AP-ova kada se proizvodi

napravljeno s 24 bita, a zatim rekvantizirano, obično na 16 bita, kao što je uobičajeno u CD standardu. Istodobno, kvaliteta takvog CD-a u smislu šuma odgovara 20-bitnoj snimci.

U procesu rekvantizacije češće se koristi operacija skraćivanja, u kojoj se najmanje značajni bitovi kodnih riječi jednostavno odbacuju. U ovom slučaju, izlazni signal

Dinamička obrada zvuka na računalu

(c) Jurij Petelin
http://www.petelin.ru/

U prethodnom članku govorio sam o softverskim alatima za uklanjanje šuma i izobličenja zvuka, uključujući navođenje onih operacija "čišćenja zvuka" koje je potrebno obaviti prilikom snimanja pjesme, počevši od ispravljanja grešaka u instalaciji mikrofona i završavajući s masteringom, učinjenim tako da skupina pjesama, snimljenih na disk, s estetskog stajališta bila je jedinstvena cjelina. Ova je tema toliko ozbiljna da joj je vrijedno posvetiti sljedećih nekoliko članaka.

Počet ću, kao i prošli put, s glavnom tezom: zvuk koji je amater snimio u kućnom kompjuterskom studiju, iako se, naravno, po kvaliteti ne može usporediti s rezultatima profesionalnih studija, ali im može biti blizak.

Pišem, a krajičkom uha slušam što tu mrmlja televizor. Evo jednog filma koji se u najavi preporučuje kao "super projekt". Car Petar umire, boreći se za prijestolje. Strasti bjesne... Drugim kanalima istražitelj Turetsky traži ukradene rijetke tomove, znalci su uzdrmali davne dane i opet provode istragu, jer, ispostavilo se, "netko tu i tamo ponekad ne želi pošteno živjeti „...Tako različite priče, ali imaju nešto zajedničko. Ovo je uobičajeno - zvuk. Loš zvuk. Užasan zvuk koji su snimili profesionalci u profesionalnim studijima. Pogotovo u "superprojektu": kada se na trenutak stišaju jecaji umirućeg cara i povici njegovih bliskih, pozadinski zvuci jasno dopiru, čak se može čuti kako rade mehanizmi kasetofona kamera.

proizlaze sljedeći zaključci:

1. Jasno je da se kod nas filmovi odavno ne sinkroniziraju u tonskom studiju. Vjerojatno za to nema novca. Način na koji je zvuk snimljen na setu je način na koji ulazi u montiranu vrpcu.

2. Neki profesionalci ne koriste smanjenje buke računala. Nije baš jasno zašto. Ne znate za njih? Nemate vremena za čitanje posebne literature? No, za početak bi bile dovoljne i osnovne informacije koje se nalaze na pet stranica mog prethodnog članka.

3. Neki od ljudi koji snimaju zvuk za TV filmove ne znaju koristiti dinamiku.

Sada ćemo razgovarati o dinamičkoj obradi. Ova tema je složena, ali ako se usredotočite, sigurno ćete sve razumjeti, a zvuk u vašim projektima postat će profesionalan. Pa ne profesionalni, nego amaterski, ali takvi da će ih svi poslušati. Za one koji sumnjaju, predlažem ocjenu rada čitatelja snimljenog na disku koji prati novu knjigu "Sonar. Tajne majstorstva". Usput, ništa vas ne sprječava da se okušate. Vaša bi se kompozicija mogla naći u glazbenoj kolekciji na sljedećem takvom disku.



Dakle, dinamička obrada. Formalno se sastoji u promjeni dinamičkog raspona audio signala. Ali upotrijebiti ga za dobrobit kvalitete zvuka ove fraze očito nije dovoljno. Stoga, krenimo od početka.

Razina zvuka i dinamički raspon

Izvor zvučnih vibracija zrači energiju u okolni prostor. Količina zvučne energije koja u sekundi prolazi kroz površinu od 1 m2, koja se nalazi okomito na smjer širenja zvučnih vibracija, naziva se intenzitetom (snagom) zvuka.

Kada vodimo normalan razgovor, protok energije je otprilike 10 mikrovati. Snaga najglasnijih zvukova violine može biti 60 mikrovata, a snaga zvukova orgulja od 140 do 3200 mikrovati.

Osoba čuje zvuk u iznimno širokom rasponu zvučnih pritisaka (intenziteta). Jedna od referentnih vrijednosti ovog raspona je standardni prag sluha - efektivna vrijednost zvučnog tlaka stvorenog harmonijskom zvučnom vibracijom frekvencije od 1000 Hz, jedva čujnom za osobu prosječne osjetljivosti sluha.

Prag čujnosti odgovara jačini zvuka Iv0 = 10-12 W/m2 ili zvučnom tlaku psv0 = 2×10-5 Pa.

Gornja granica određena je vrijednostima Iv. Maks. = 1 W/m2 ili psv. Maks. = 20 Pa. Kada se percipira zvuk takvog intenziteta, osoba doživljava bol.

U području zvučnih tlakova koji znatno prelaze standardni prag sluha, veličina osjeta nije proporcionalna amplitudi zvučnog tlaka psv, već logaritmu omjera psv / psv0. Stoga se zvučni tlak i intenzitet zvuka često mjere u logaritamskim jedinicama decibela (dB) u odnosu na standardni prag sluha.

Raspon promjene zvučnog tlaka od apsolutnog praga sluha do praga boli je za različite frekvencije od 90 dB do 130 dB.

Ako ljudsko uho simultano percipira dva ili više zvukova različite glasnoće, tada glasniji zvuk prigušuje (apsorbira) slabe zvukove. Postoji takozvano maskiranje zvukova, a uho percipira samo jedan, glasniji, zvuk. Neposredno nakon izlaganja glasnom zvuku, osjetljivost sluha na slabe zvukove je smanjena. Ta se sposobnost naziva adaptacija sluha.

Dakle, prag čujnosti uvelike ovisi o uvjetima slušanja: u tišini ili na pozadini buke (ili drugog uznemirujućeg zvuka). U potonjem slučaju, prag sluha je povećan. To znači da smetnje maskiraju korisni signal.

Ljudski slušni aparat ima određenu inerciju: osjećaj pojave zvuka, kao i njegov prekid, ne pojavljuje se odmah.

Audio signal je nasumičan proces. Njegove akustičke ili električne karakteristike se kontinuirano mijenjaju tijekom vremena. Pokušaj pratiti slučajne promjene u implementaciji ovog kaosa je vježba koja nema previše smisla. Njegovo veličanstvo slučaj je moguće obuzdati, dati mu obilježja determinizma, koristeći prosječne parametre, kao što je razina audio signala.

Razina audio signala karakterizira signal u određenom trenutku i izražava se u decibelima, ispravljenim i prosječnim tijekom određenog prethodnog vremenskog razdoblja, naponom audio signala.

Pod dinamičkim rasponom audio signala podrazumijeva se omjer maksimalnog zvučnog tlaka prema minimalnom ili omjer odgovarajućih napona. U ovoj definiciji nema informacija o tome koji se pritisak i napon smatraju maksimalnim i minimalnim. Vjerojatno se zato tako određen dinamički raspon signala naziva teorijskim. Uz to, dinamički raspon audio signala može se također eksperimentalno odrediti kao razlika između maksimalne i minimalne razine za dovoljno dugo razdoblje. Ova vrijednost uvelike ovisi o odabranom vremenu mjerenja i vrsti mjerača razine.

Dinamički rasponi glazbenih i govornih akustičkih signala različitih vrsta, mjereni instrumentima, u prosjeku su:

80 dB za simfonijski orkestar

45 dB za zbor

35 dB za pop glazbu i vokalne soliste

25 dB za govor zvučnika

Prilikom snimanja potrebno je podesiti razine. To se objašnjava činjenicom da izvorni (neobrađeni) signali često imaju veliki dinamički raspon (na primjer, do 80 dB za simfonijsku glazbu), a kod kuće se audio programi čuju u rasponu od oko 40 dB.

Postoji nedostatak ručnog podešavanja razina. Vrijeme reakcije tonskog majstora je oko 2 s, čak i ako mu je partitura skladbe unaprijed poznata. To dovodi do pogreške u održavanju maksimalnih razina glazbenih programa do 4 dB u oba smjera.

Pojačala, akustični sustavi, pa čak i ljudske uši moraju biti zaštićeni od preopterećenja uzrokovanih naglim skokovima amplitude audio signala – kako bi se ograničila amplituda signala.

Dinamički raspon signala mora biti usklađen s dinamičkim rasponima uređaja za snimanje, pojačanje i odašiljanje.

Za povećanje dometa FM radio postaja, dinamički raspon audio signala mora biti komprimiran. Za smanjenje razine buke u pauzama, poželjno je povećati dinamički raspon.

Na kraju, moda, koja diktira svoje uvjete u svim sferama ljudskog djelovanja, pa tako i u snimanju zvuka, zahtijeva bogat, gust zvuk moderne glazbe, što se postiže oštrim sužavanjem njezina dinamičkog raspona.

Zvučni val (ovojnica glasnoće) fragmenta opere S. Rahmanjinova "Aleko",

i suvremene plesne glazbe.

U klasičnoj glazbi važne su nijanse, plesna glazba treba biti “snažna”.

To diktira potrebu korištenja uređaja za automatsku obradu razina signala.

Dinamički uređaji

Uređaji za automatsku obradu razina signala mogu se klasificirati prema nizu kriterija od kojih su najvažniji inercija odziva i izvršena funkcija.

Prema kriteriju inercije odziva, razlikuju se neinercijski (trenutačno djelovanje) i inercijski (s promjenjivim koeficijentom prijenosa) automatski regulatori razine:

Kada razina signala prijeđe nazivnu vrijednost na ulazu neinercijalnog autoregulatora, izlaz je trapezoidni umjesto sinusnog signala. Iako su slobodni automatski regulatori jednostavni, njihova upotreba dovodi do jakih izobličenja.

Inercijalna je takva automatska kontrola razine, u kojoj se koeficijent prijenosa automatski mijenja ovisno o razini signala na ulazu. Ovi automatski niveleri izobličuju valni oblik samo na kratko vrijeme. Odabirom optimalnog vremena odziva takva se izobličenja mogu učiniti jedva zamjetljivima uhu.

Ovisno o izvršenim funkcijama, inercijski automatski regulatori razine dijele se na:

Kvazi vršni limiteri

Stabilizatori razine

Kompresori dinamičkog raspona

Proširivači dinamičkog raspona

Compander squelch

Noise gate (vrata)

Uređaji sa složenom pretvorbom dinamičkog raspona

Glavna karakteristika uređaja za obradu dinamike je amplitudna karakteristika - ovisnost razine izlaznog signala o razini signala na ulazu.

Limiter (limiter) razine je autoregulator, u kojem se koeficijent prijenosa mijenja tako da kada ulazni signal prijeđe nazivnu razinu, razine signala na njegovom izlazu ostaju praktički konstantne, blizu nazivne vrijednosti. S ulaznim signalima koji ne prelaze nazivnu vrijednost, limiter razine radi kao normalno linearno pojačalo. Limiter bi trebao odmah reagirati na promjene razine.


Amplitudni odziv graničnika

Automatski stabilizator razine dizajniran je za stabilizaciju razine signala. To može biti potrebno za izjednačavanje glasnoće zvuka pojedinih fragmenata fonograma. Princip rada autostabilizatora sličan je principu rada limitera. Razlika je u tome što je nazivni izlazni napon automatskog stabilizatora približno 5 dB manji od nazivne izlazne razine limitera.

Kompresor je uređaj čije se pojačanje povećava kako se razina ulaznog signala smanjuje. Djelovanje kompresora dovodi do povećanja prosječne snage i, posljedično, glasnoće zvuka obrađenog signala, kao i do kompresije njegovog dinamičkog raspona.


Amplitudna karakteristika kompresora

Ekspander ima amplitudnu karakteristiku inverznu kompresoru. Koristi se kada je potrebno vratiti dinamički raspon koji je konvertirao kompresor.


Amplitudna karakteristika ekspandera

Kompander je sustav koji se sastoji od kompresora i ekspandera povezanih u seriju. Koristi se za smanjenje razine šuma u stazama snimanja ili prijenosa audio signala.

Threshold squelch (gate) je auto-regulator, u kojem se pojačanje mijenja tako da kada su razine ulaznog signala manje od praga, amplituda izlaznog signala je blizu nule. Za ulazne signale iznad praga, squelch radi kao konvencionalno linearno pojačalo.

Automatski regulatori za složenu pretvorbu dinamičkog raspona, imaju više upravljačkih kanala. Na primjer, kombinacija graničnika, automatskog stabilizatora, ekspandera i supresora buke praga omogućuje vam stabilizaciju glasnoće zvuka različitih fragmenata skladbe, održavanje maksimalne razine signala i suzbijanje buke u pauzama.

Struktura uređaja za obradu dinamike

Inercijski regulator razine ima glavni kanal i upravljački kanal. Ako se signal dovodi u upravljački kanal s ulaza glavnog kanala, imamo posla s izravnim podešavanjem, a ako iz izlaza - s obrnutim.

Glavni kanal u izravnom upravljačkom krugu uključuje audio pojačala, liniju odgode i podesivi element. Potonji, pod utjecajem upravljačkog napona, može promijeniti svoj koeficijent prijenosa. Glavni kanal u krugu s obrnutom regulacijom sadrži sve navedene elemente osim linije odgode.

Temeljno važni elementi upravljačkog kanala su detektor i integrirajući (izglađujući) krug. Sve dok napon na ulazu kruga ne prelazi prag (referencu), upravljački kanal ne generira upravljački signal, a koeficijent prijenosa reguliranog elementa se ne mijenja. Kada je prag prekoračen, detektor stvara impulsni napon proporcionalan razlici između vrijednosti trenutnog signala i referentnog napona. Integracijski krug prosječuje diferenčni napon i generira upravljački napon proporcionalan razini signala na ulazu kontrolnog kanala.

Linija kašnjenja prisutna u glavnom kanalu izravnog upravljačkog kruga omogućuje kontrolnom kanalu da radi s nekim odvodom. On će detektirati porast razine signala prije nego što signal dođe do podesivog elementa. Stoga postoji temeljna mogućnost uklanjanja neželjenih prijelaznih pojava. Razlike u razinama mogu se gotovo savršeno nositi. Međutim, fazni odziv analogne linije odgode nije linearan. Razlika u faznim pomacima za različite spektralne komponente signala dovodi do izobličenja oblika širokopojasnog signala pri prolasku kroz liniju kašnjenja. Digitalne linije kašnjenja nemaju ovaj nedostatak, ali da bi ih koristili, signal se prvo mora digitalizirati. U uređajima za virtualnu obradu signal se obrađuje digitalno, a nema problema s algoritamskom implementacijom funkcionalnih elemenata.

Sva prava na ovom dokumentu pripadaju autoru. Reprodukcija ovog teksta ili njegovog dijela dopuštena je samo uz pismeno dopuštenje autora.

Bitovi, herci... Što se krije iza ovih pojmova? Prilikom razvoja standarda audio kompakt diska, uzete su vrijednosti 44 kHz, 16 malo. Zašto baš toliko? Koji je razlog izbora, a i zašto se pokušava povećati te vrijednosti na, recimo, 96 kHz i 24 ili čak 32 bita...

Pozabavimo se najprije rezolucijom uzorkovanja – odnosno dubinom bita. Dogodilo se da morate birati između brojeva 16, 24 i 32. Srednje vrijednosti bi, naravno, bile prikladnije u smislu zvuka, ali previše neugodno za korištenje u digitalnoj tehnologiji.

Za što je odgovoran ovaj parametar? Ukratko - za dinamički raspon. Raspon istovremeno reproduciranih glasnoća je od najveće amplitude (0 dB) do najmanje amplitude koju razlučivost dopušta, na primjer, približno -93 dB za 16-bitni zvuk. Začudo, to je jako povezano s razinom šuma fonograma. U principu, za, na primjer, 16-bitni audio, sasvim je moguće odašiljati signale snage od -120 dB, međutim, te će signale biti teško primijeniti u praksi zbog tako temeljnog koncepta kao što je šum uzorkovanja. Činjenica je da pri uzimanju digitalnih vrijednosti cijelo vrijeme griješimo, zaokružujući stvarnu analognu vrijednost na najbližu moguću digitalnu vrijednost. Najmanja moguća pogreška je nula, a najveća pogreška je polovica zadnje znamenke (bit, u nastavku pojam LSB će biti skraćen na MB). Ova greška nam daje takozvani šum uzorkovanja - slučajni odstupak između digitaliziranog signala i originala. Ovaj šum je trajan i ima maksimalnu amplitudu od 0,5 MB. Ovo se može smatrati slučajnim vrijednostima pomiješanim u digitalni signal. Ovo se ponekad naziva šumom zaokruživanja ili kvantizacije.

Zaustavimo se detaljnije o tome što se podrazumijeva pod snagom signala, mjerenom u bitovima. Najjači signal u digitalnoj obradi zvuka obično se uzima kao 0 dB, što odgovara svim bitovima postavljenim na 1. Ako se najznačajniji bit (u daljnjem tekstu SB) postavi na nulu, rezultirajuća digitalna vrijednost bit će upola manja, što odgovara gubitku razine od 6 dB. Niti jedan bit osim SB ne može postići razinu veću od -6 dB. Sukladno tome, najznačajniji bit je, takoreći, odgovoran za prisutnost razine signala od -6 do 0 dB, tako da je SB bit od 0 dB. Prethodni bit je odgovoran za razinu od -6 dB, a najniži bit, dakle, za razinu (broj_bit-1) * 6 dB. U slučaju 16-bitnog zvuka, MB odgovara razini od -90 dB. Kad kažemo 0,5MB, ne mislimo na -90/2, već pola koraka do sljedećeg bita - odnosno još 3 dB niže, -93 dB.

Vraćamo se na izbor rezolucije digitalizacije. Kao što je već spomenuto, digitalizacija unosi šum na razini od 0,5MB, što znači da je zapis digitaliziran u 16 bita neprestano pravi buku na -93 dB. Može prenositi signale još tiše, ali šum i dalje ostaje na -93 dB. Na temelju toga određuje se dinamički raspon digitalnog zvuka – gdje se omjer signal-šum pretvara u šum/signal (više je šuma nego korisnog signala), nalazi se donja granica tog raspona. Na ovaj način, glavni kriterij digitalizacije - koliko buke možemo li si priuštiti obnovljeni signal? Odgovor na ovo pitanje dijelom ovisi o tome koliko je buke bilo u izvornoj snimci. Važan zaključak je da ako digitaliziramo nešto na -80 dB buke - nema apsolutno nikakvog razloga da to digitaliziramo na više od 16 bita jer, s jedne strane, -93 dB buka dodaje vrlo malo ionako ogromnoj (usporedno) -80 šum.dB, a s druge strane - tiše od -80 dB u samom fonogramu, šum/signal već počinje i jednostavno nije potrebno digitalizirati i prenositi takav signal.

Teoretski, to je jedini kriterij za odabir rezolucije digitalizacije. Više mi ne doprinose apsolutno bez izobličenja ili netočnosti. Praksa, začudo, gotovo u potpunosti ponavlja teoriju. To je ono što je vodilo one ljude koji su odabrali 16-bitnu rezoluciju za audio CD-ove. Buka -93 dB je prilično dobro stanje, što gotovo točno odgovara uvjetima naše percepcije: razlika između praga boli (140 dB) i uobičajene pozadinske buke u gradu (30-50 dB) je samo stotinjak dB, a s obzirom na to da na razini glasnoće koja donosi bol, ne slušaju glazbu - što još više sužava raspon - ispada da je stvarna buka prostorije ili čak opreme puno jača od buke uzorkovanja . Ako možemo čuti razinu ispod -90 dB u digitalnoj snimci, čut ćemo i percipirati šum uzorkovanja, inače jednostavno nikada nećemo utvrditi je li ovaj zvuk digitaliziran ili uživo. Jednostavno nema druge razlike u smislu dinamičkog raspona. No, u principu, čovjek može smisleno čuti u rasponu od 120 dB, a bilo bi lijepo zadržati cijeli raspon, s kojim se čini da 16 bita ne može podnijeti.

Ali to je samo na prvi pogled: uz pomoć posebne tehnike tzv oblikovano dithering, možete promijeniti frekvencijski spektar šuma uzorkovanja, gotovo ih potpuno premjestiti u područje više od 7-15 kHz. Čini se da mijenjamo frekvencijsku razlučivost (odbijajući reproducirati tihe visoke frekvencije) za dodatni dinamički raspon u preostalom frekvencijskom rasponu. U kombinaciji s posebnostima našeg sluha - naša osjetljivost na izbačeno visokofrekventno područje je za desetke dB niža nego u glavnom području (2-4 kHz) - to omogućuje relativno bešuman prijenos korisnih signala, dodatni 10-20 dB tiši od -93 dB - dakle, dinamički raspon 16-bitnog zvuka za čovjeka iznosi oko 110 dB. I općenito - u isto vrijeme, osoba jednostavno ne može čuti zvukove 110 dB tiše od glasnog zvuka koji je upravo čuo. Uho se, kao i oko, prilagođava glasnoći okolne stvarnosti, pa je simultani domet našeg sluha relativno mali – oko 80 dB. Razgovarajmo o dithringu detaljnije nakon razmatranja aspekta frekvencije.

Za CD-ove, brzina uzorkovanja je 44100 Hz. Postoji mišljenje da to znači da se reproduciraju sve frekvencije do 22,05 kHz, ali to nije sasvim točno. Možemo samo nedvosmisleno reći da u digitaliziranom signalu nema frekvencija iznad 22,05 kHz. Stvarna slika reprodukcije digitaliziranog zvuka uvijek ovisi o specifična tehnika i uvijek nije tako savršen kao što bismo željeli i u skladu s teorijom. Sve ovisi o konkretnom DAC-u.

Idemo prvo shvatiti što bismo željeli dobiti. Osoba srednjih godina (prilično mlada) može osjetiti zvukove od 10 Hz do 20 kHz, smisleno je čuti - od 30 Hz do 16 kHz. Zvukovi iznad i ispod se percipiraju, ali ne predstavljaju akustični osjećaj. Zvukovi iznad 16 kHz osjećaju se kao neugodan neugodan čimbenik - pritisak na glavu, bol, posebno glasni zvukovi donose tako oštru nelagodu da želite napustiti prostoriju. Neugodne senzacije su toliko jake da se na tome temelji djelovanje sigurnosnih uređaja - nekoliko minuta vrlo glasnog visokofrekventnog zvuka izludit će svakoga, a u takvom okruženju postaje apsolutno nemoguće ukrasti bilo što. Zvukovi ispod 30 - 40 Hz s dovoljnom amplitudom percipiraju se kao vibracija koja dolazi iz predmeta (zvučnika). Dapače, čak bi se reklo – samo vibracija. Čovjek akustički gotovo i ne određuje prostorni položaj tako niskih zvukova, pa se već koriste drugi osjetilni organi – taktilni, takve zvukove osjećamo tijelom.

Za prijenos zvuka kakav jest, bilo bi lijepo zadržati cijeli percipirani raspon 10 Hz do 20 kHz. U teoriji, kod digitalnog snimanja nema apsolutno nikakvih problema s niskim frekvencijama. U praksi, svi DAC-ovi koji koriste delta tehnologiju imaju potencijalni izvor problema. Takvih uređaja sada ima 99% pa je problem ovaj ili onaj, iako iskreno loših uređaja gotovo da i nema (samo najjeftiniji sklopovi). Možemo pretpostaviti da je s niskim frekvencijama sve u redu – uostalom, ovo je samo potpuno rješiv problem s reprodukcijom s kojim se uspješno nose dobro osmišljeni DAC-ovi koji koštaju više od 1 dolara.
S visokim frekvencijama sve je malo gore, barem sigurno teže. Gotovo cijela bit poboljšanja i komplikacija u DAC-ovima i ADC-ima usmjerena je upravo na pouzdaniji prijenos visokih frekvencija. Pod "visokim" podrazumijevamo frekvencije usporedive s frekvencijom uzorkovanja - to jest, u slučaju 44,1 kHz, to je 7-10 kHz i više. Crtež objašnjenja:

Slika prikazuje frekvenciju od 14 kHz, digitaliziranu s brzinom uzorkovanja od 44,1 kHz. Točke označavaju trenutke uzimanja amplitude signala. Vidi se da postoje oko tri točke za jedan period sinusoida, a da bi se vratila izvorna frekvencija u obliku sinusoida, mora se pokazati malo mašte. Sam sinusni val nacrtao je program CoolEdit, a pokazao je maštu – obnovio je podatke. Sličan se proces događa u DAC-u, to radi filter za oporavak. A ako su relativno niske frekvencije gotovo gotove sinusoide, tada oblik i, sukladno tome, kvaliteta visokofrekventne restauracije u potpunosti leži na savjesti DAC sustava restauracije. CoolEdit ima vrlo dobar filter za oporavak, ali također ne uspijeva u ekstremnom slučaju - na primjer, frekvencija od 21 kHz:

Vidi se da je oblik vibracija (plave linije) daleko od ispravnog, a pojavila su se svojstva kojih prije nije bilo. To je glavni problem kod reprodukcije visokih frekvencija. Problem, međutim, nije tako loš kao što se čini. Svi moderni DAC-ovi koriste multirate tehnologiju, koja se sastoji u digitalnom vraćanju na nekoliko puta veću stopu uzorkovanja, a zatim pretvorbi u analogni signal na povećanoj frekvenciji. Tako se problem vraćanja visokih frekvencija prebacuje na ramena digitalnih filtara, koji mogu biti vrlo kvalitetni. Toliko kvalitetan da je u slučaju skupih uređaja problem potpuno uklonjeno - pruža neiskrivljenu reprodukciju frekvencija do 19-20 kHz. Resampling se također koristi u ne baš skupim uređajima, pa se u principu i ovaj problem može smatrati riješenim. Uređaji u području od 30 - 60 dolara (zvučne kartice) ili glazbeni centri do 600 dolara, obično slični u DAC-u ovim zvučnim karticama, savršeno reproduciraju frekvencije do 10 kHz, podnošljivo do 14 - 15, i nekako ostalo. Ovaj dosta dovoljno za većinu pravih glazbenih aplikacija, a ako nekome treba više kvalitete - naći će je u profesionalnim uređajima koji nisu toliko skuplji - jednostavno su pametno napravljeni.

Vratimo se na dithering, da vidimo kako možemo korisno povećati dinamički raspon preko 16 bita.

Ideja ditheringa je miješanje u signal buka. Koliko god čudno zvučalo, kako bismo smanjili šum i neugodne efekte kvantizacije, mi dodati tvoja buka. Razmotrimo primjer – upotrijebimo sposobnost CoolEdita za rad u 32 bita. 32 bita je 65 tisuća puta točnije od 16 bita, pa se u našem slučaju 32 bita može smatrati analognim originalom, a pretvaranje u 16 bita je digitalizacija. Slika prikazuje 32-bitni zvuk - glazbu snimljenu na tako tihoj razini da najglasniji trenuci dosežu samo -110 dB:

Ovo je daleko tiše od dinamičkog raspona 16-bitnog zvuka (1 MB 16-bitnog prikaza jednako je jednom na skali s desne strane), pa ako jednostavno zaokružimo podatke na 16-bitni, dobivamo potpunu digitalnu tišinu.

Dodajmo bijeli šum signalu s razinom od 1 MB - to je -90 dB (približno odgovara razini šuma kvantizacije):

Pretvorimo u 16 bita (moguće su samo cjelobrojne vrijednosti - 0, 1, -1, ...):


(Zanemarite plavu liniju, koja također uzima srednje vrijednosti - ovo je filtar CoolEdit koji simulira stvarnu amplitudu nakon filtra za restauraciju. Točke uzorkovanja amplitude nalaze se samo na vrijednostima 0 i 1)

Kao što vidite, neki podaci ostaju. Gdje je izvorni signal imao višu razinu, ima više vrijednosti od 1, gdje je niža nula. Da bismo čuli što smo dobili, pojačavamo signal za 14 bita (za 78 dB). Rezultat se može preuzeti i poslušati (dithwht.zip, 183 kb).

Taj zvuk čujemo uz ogroman šum od -90 dB (prije slušanja pojačanja), dok je koristan signal samo -110 dB. Već imamo -110 dB audio prijenos na 16 bita. U principu, ovo je standardni način proširenja dinamičkog raspona, koji se često pokaže gotovo sam od sebe - svugdje ima dovoljno buke. Međutim, to je samo po sebi prilično besmisleno - razina šuma uzorkovanja ostaje na istoj razini, a prijenos signala koji je slabiji od šuma nije baš jasan s gledišta logike ...

Kompliciraniji način - oblikovano dithering. Ideja je da, budući da još uvijek ne čujemo visoke frekvencije u vrlo tihim zvukovima, onda bismo glavnu snagu buke trebali usmjeriti na te frekvencije, dok čak možete koristiti i puno buke - ja ću koristiti razinu od 4MB (to su dva bita buke). Poboljšani rezultat nakon filtriranja visokih frekvencija (ne bismo ih čuli pri normalnoj glasnoći ovog zvuka) - ditshpfl.zip , 1023 kb (nažalost, zvuk se više ne arhivira). Ovo je već prilično dobar (za iznimno nisku glasnoću) prijenos zvuka, buka je po snazi ​​otprilike jednaka samom zvuku s razinom -110 dB! Važna napomena: mi podignuta stvarni šum uzorkovanja od 0,5MB (-93dB) do 4MB (-84dB), snižavanje ocjene zvučni šum uzorkovanja od -93dB do oko -110dB. Omjer signala i šuma pogoršala, ali buka je otišla u visokofrekventno područje i prestala se čuti, što je dalo značajno poboljšanje u stvarnom(ljudski perceptivni) omjer signala i šuma. U praksi, to je već razina šuma 20-bitnog audio uzorkovanja. Jedini uvjet ove tehnologije je prisutnost frekvencija za šum. Zvuk od 44,1 kHz omogućuje postavljanje šuma na frekvencijama od 10-20 kHz koje su nečujne pri tihoj glasnoći. Ali ako digitalizirate na 96 kHz, frekvencijska domena za šum (ljudima nečujna) bit će toliko velika da će pri korištenju oblikovanog ditheringa 16 bita stvarno pretvoriti se u svih 24.

[Napomena: PC zvučnik je jednobitni uređaj, ali s prilično velikom maksimalnom stopom uzorkovanja (uključeno/isključeno tog jednog bita). Koristeći proces koji je u suštini sličan ditheringu, koji se naziva prilično pulsno-širinska modulacija, na njemu se reproducirao prilično kvalitetan digitalni zvuk - iz jednog bita je izvučeno 5-8 bita niske frekvencije i visoka stopa uzorkovanja, te nemogućnost opremu za reprodukciju tako visokih frekvencija, kao i našu nesposobnost da ih čujemo. Međutim, čuo se blagi visokofrekventni zvižduk - čujni dio ove buke.]

Dakle, oblikovano dithering omogućuje značajno smanjenje ionako niskog šuma uzorkovanja 16-bitnog zvuka, čime se tiho širi korisni (bešumni) dinamički raspon svi područje ljudskog sluha. Budući da se sada oblikovano dithering uvijek koristi pri prevođenju iz radnog formata od 32 bita u konačni 16-bitni za CD, naših 16 bita potpuno je dovoljno za potpuni prijenos zvučne slike.

Jedina stvar je da ova tehnologija radi samo u posljednjoj fazi - priprema materijala za reprodukciju. Prilikom obrade visokokvalitetnog zvuka, jednostavno potrebno ostanite na 32 bita kako biste izbjegli dithering nakon svake operacije, bolji rezultati kodiranja natrag na 16 bita. Ali ako je razina buke fonograma veća od -60 dB, možete, bez imalo grižnje savjesti, izvršiti svu obradu u 16 bita. Srednje zamućenje će osigurati da nema izobličenja zaokruživanja, a šum koji se njime dodaje stotine puta slabiji od postojećeg i stoga potpuno ravnodušan.

P:
Zašto se kaže da je 32-bitni zvuk bolji od 16-bitnog?
A1: Oni su u krivu.
A2: [Oni znače malo drugačije: prilikom obrade ili snimanja zvuka potreba koristiti veću rezoluciju. Oni to koriste stalno. Ali u zvuku kao iu gotovom proizvodu nije potrebna razlučivost veća od 16 bita.]
P: Ima li smisla povećati stopu uzorkovanja (npr. do 48 kHz ili do 96)?
A1: Nema. Uz barem koliko kompetentan pristup u dizajnu DAC 44 kHz prijenosa cjelinaželjeni frekvencijski raspon.
A2: [Oni znače malo drugačije: ima smisla, ali samo kada se obrađuje ili snima zvuk.]
P: Zašto još uvijek traje uvođenje visokih frekvencija i bitnosti?
A1: Za napredak je važno da se kreće. Gdje i zašto - nije toliko važno...
A2: Mnogi su procesi u ovom slučaju lakši. Ako će, na primjer, uređaj obraditi zvuk, bit će mu lakše to učiniti u 96 kHz / 32 bita. Gotovo svi DSP-ovi koriste 32 bita za obradu zvuka, a mogućnost zaboravljanja na konverzije je lakši razvoj i još uvijek lagano povećanje kvalitete. I općenito - zvuk za daljnju obradu Imašto znači pohranjivanje u višoj razlučivosti od 16 bita. Za hi-end uređaje koji reproduciraju samo zvuk, ovo je apsolutno ravnodušan.
P: Jesu li 32x ili 24x ili čak 18-bitni DAC-ovi bolji od 16-bitnih?
O: Općenito - Ne. Kvaliteta pretvorbe uopće ne ovisi o dubini bita. Kodek AC "97 (moderna zvučna kartica ispod 50 dolara) koristi 18-bitni kodek, a kartice od 500 dolara, čiji se zvuk ne može ni usporediti s ovom glupošću, koriste 16-bitne. Nema apsolutno nikakve razlike u reprodukciji 16-bitnog zvuka..
Također je vrijedno imati na umu da većina DAC-ova obično reproducira manje bitova nego što preuzimaju. Na primjer, stvarna razina buke tipičnog jeftinog kodeka je -90 dB, što je 15 bita, a čak i ako je sama 24 bita - nećete dobiti nikakav povrat na "dodatnih" 9 bita - rezultat njihovog rada , čak i da je dostupan, utopit će se u vlastitoj buci. Većina jeftinih uređaja je samo zanemariti dodatni bitovi - oni se jednostavno ne računaju u njihovom procesu sinteze zvuka, iako idu na digitalni ulaz DAC-a.
P: I za zapisnik?
O: Za snimanje je bolje imati ADC većeg kapaciteta. Opet, više stvaran dubina bita. Dubina bita DAC-a trebala bi odgovarati razini šuma izvornog fonograma ili jednostavno biti dovoljna za postizanje željene niske razine. buka.
Također je zgodno imati malo više dubine za korištenje većeg dinamičkog raspona za manje preciznu kontrolu razine snimanja. Ali zapamtite – uvijek morate pogoditi stvaran raspon kodeka. U stvarnosti, 32-bitni ADC, na primjer, je gotovo u potpunosti besmisleno, budući da će nižih deset bitova samo kontinuirano proizvoditi buku - tako niska buka (ispod -200 dB) samo ne može biti u analognom glazbenom izvoru.

Od zvuka povećane dubine bita ili frekvencije uzorkovanja, u usporedbi s CD-om, ne vrijedi zahtijevati bolju kvalitetu. 16bit/44kHz gurnut do granice s oblikovanim ditheringom je prilično sposoban potpuno prenijeti informacije koje nas zanimaju, ako se ne radi o procesu obrade zvuka. Nemojte gubiti prostor na dodatne podatke u svom gotovom materijalu, kao što ne očekujte poboljšanu kvalitetu zvuka od DVD-Audio-a sa 96 kHz/24 bita. Kompetentnim pristupom, pri stvaranju zvuka u standardnom CD formatu, imat ćemo kvalitetu jednostavno ne treba u daljnjem usavršavanju, a odgovornost za ispravan zvučni zapis konačnih podataka odavno su preuzeli razvijeni algoritmi i ljudi koji ih znaju ispravno koristiti. U posljednjih nekoliko godina nećete pronaći novi disk bez oblikovanog ditheringa i drugih tehnika za postizanje krajnjih granica kvalitete zvuka. Da, lijenima ili jednostavno mrzovoljnim ljudima bit će zgodnije dati gotov materijal u 32 bita i 96 kHz, ali u teoriji - vrijedi li nekoliko puta više audio podataka?...

Moje ime je Louis Philippe Dion, ja sam audio inženjer za Rainbow Six: Siege i u Ubisoftu sam sedam godina. Prije sam radio dizajn zvuka za Prince of Persia i Splinter Cell. Također sam radio kao voditelj proizvoda za Ubisoftov vlastiti zvučni mehanizam.

Prije nego što sam se pridružio industriji igara, radio sam kao tonski inženjer na setu nekoliko serija i filmova. U slobodno vrijeme, koliko se sjećam, bavio sam se glazbom, gajeći ljubav prema sintisajzerima, gitarama i općenito prema svemu što može proizvesti zvuk.

Imajući snažan interes za tehničke aspekte zvuka, s entuzijazmom sam krenuo u industriju igara. Osjećao sam da, u usporedbi s TV-om i filmovima, igre nude širi prostor za inovacije i tehnološka otkrića. Upravo sada, jedva smo zagrebali površinu potencijala interaktivnog zvuka, miksanja u stvarnom vremenu i novih algoritama pozicioniranja i vrlo sam znatiželjan vidjeti što nam budućnost nosi.

Dinamičko širenje zvuka u destruktivnim okruženjima

Tri osnovna aspekta fizike povezana su s širenjem zvuka: refleksija (kada se zvuk odbija od površina), apsorpcija (kada zvuk prolazi kroz površinu, ali gubi neke frekvencije) i difrakcija (kada se zvuk savija oko predmeta). Vaše uho svakodnevno primjećuje ove pojave. U stvarnom životu postoje mnogi drugi čimbenici koji upravljaju namjeravanim položajem izvora zvuka, ali ja ću se posebno usredotočiti na fiziku širenja zvuka i kako ga simuliramo.

Glavna inovacija u opsadi bila je obilna uporaba difrakcije - za to koristimo izraz "opstrukcija". Strateškim postavljanjem "distribucijskih čvorova" na kartu mogli bismo izračunati najjednostavniji put zvuka od izvora do slušatelja. Lakoća puta ovisi o nekoliko čimbenika, odnosno o duljini puta, ukupnom iznosu zaokruženih kutova i kaznama za stupanj uništenja na određenim čvorovima.

Na primjer, ako zid nije oštećen, algoritam ne uzima u obzir čvor unutar njega (beskonačna kazna). Ali ako u njemu postoji rupa, čvor će biti dostupan za odabir putanje širenja. Zatim virtuelno pomičemo izvor zvuka u skladu sa smjerom takvih staza, što u konačnici djeluje kao analog difrakcije.

Također koristimo nekoliko strategija za simulaciju apsorpcije, nazivajući je "okluzijom". Ovisno o izvoru, reproduciramo ili unaprijed pripremljenu prigušenu verziju zvuka (kao što su koraci na gornjem katu) ili reproduciramo zvuk izravno s izvora s filtriranjem u stvarnom vremenu. Druga opcija povećava opterećenje procesora pa je uglavnom rezervirana za zvukove oružja. U stvarnom životu možete čuti apsorbiranu i odbijenu verziju zvuka u isto vrijeme, a mi ih također kombiniramo, dajući više informacija o stvarnoj lokaciji izvora.

Konačno, za refleksiju (u našoj "reverb" terminologiji), koristimo impulsni reverb. Ovo je poseban reverb koji "skenira" akustična svojstva prave sobe, a zatim u njoj reproducira zvukove iz naše igre. Po mom mišljenju, ova je metoda svjetlosnim godinama ispred tradicionalnih parametarskih reverba - barem u svrhu simulacije. Jedina negativna je ta što ga zbog opterećenja procesora ne možemo koristiti u velikom broju slučajeva. Da bismo zaobišli ovo ograničenje, "prikačimo" reverb na oružje i reproduciramo ga prema tom oružju, što igraču daje točnije informacije o lokaciji neprijatelja.

čemu sve to služi?

Uništiva okruženja bila su velika poteškoća tijekom razvoja sustava distribucije zvuka. Jedno je voditi zvuk najkraćim putem, a sasvim drugo kada se razina mijenja tijekom igre – nešto što nikada prije nismo radili. Nije bilo lako zadržati kvalitetu zvuka na visokoj razini, a pritom imati na umu performanse. Nekoliko smo čvorova smjestili u razorivu okolinu, a oni su ostali zatvoreni dok se objekt ne ošteti. Eksperimentirali smo iznova i iznova s ​​različitim brojem mogućih putova širenja dok nismo pronašli sretan medij između točnosti i brzine.

Zanimljivo je da modifikatori širenja zvuka ne rade samo u jednom smjeru: čvorovi se mogu otvarati i zatvarati. Barikadiranjem i jačanjem zidova, igrači mijenjaju i putanju zvuka. Takve barijere ne moraju u potpunosti prekriti čvor - ovisno o svojstvima materijala (drvo, staklo, beton itd.), zvuk i dalje može proći, ali uz određenu kaznu. Na primjer, drvene i metalne barikade imaju različite postavke za isključivanje zvuka.

S razinom destruktivnosti kao u Opsadi, bila bi katastrofa kada bismo se samo oslanjali na okluziju bez upotrebe opstrukcije. Okluzija bi u ovom slučaju bila previše moćan "wallhack". Igrajući obranu, mogli biste samo uništiti što više zidova i osluškivati ​​kamo točno idu napadači - ne bi imali šanse. Pokušavamo zadržati zvuk što točnije, ali simulacija 'prave fizike' također dodaje dodatni sloj nagađanja u igri o lokaciji neprijatelja, što izjednačava obje strane. Naravno, u nekim situacijama ovaj trenutak može biti jako uznemirujući, ali takav je stvarni život.

Karta Hereforda

Čuti igračeve radnje

Tišina i neaktivnost ključni su principi igre, a čak i s triminutnim mjeračem vremena, igrači radije slušaju svoje protivnike. Zapravo, kada smo krenuli s razvojem, mislili smo da će okruženje igre zvučati prilično nezanimljivo. Tiho čekati u spavaćoj sobi prigradske kuće - ovo nije bitka u jeku bitke i ne bitka u svemiru, zar ne?

U to vrijeme u igru ​​nisu bili dodani svi zvukovi, a sustav za njihovu distribuciju bio je tek u ranoj fazi razvoja. No kako su se svi dijelovi slagalice počeli polako slagati, shvatili smo da možemo postići nešto ozbiljnije od “lažne napetosti”. Prijetnja koju čujete je stvarna i ide prema vama. Odbacivanjem teškog ambijenta uspjeli smo i povećati napetost atmosfere i stvoriti prostor za igrače da dobiju točnije informacije o neprijatelju.

Dijagram širenja zvuka na karti Hereforda

Posebnu pozornost posvetili smo zvukovima pokreta, koji vam omogućuju jednostavno slušanje kako biste razumjeli lokaciju neprijatelja - iz zvučnih poruka sasvim je moguće odrediti težinu, oklop i brzinu operatera. Barikade, gadgeti i drugi uređaji također su opremljeni specifičnim zvukovima.

Zvukovi koje stvara lik igrača pojačani su iz dva važna razloga: prvo, igrač razumije da stvara veliku buku i da ga to može odati; drugo, jasno daje do znanja da morate usporiti ako želite slušati. To je osnova dizajna zvuka u Siegeu: sporijim kretanjem i osluškivanjem okoline možete prikupiti više informacija i bolje svirati.

Čvorovi distribucije krupni plan

Rezultati

Kada smo počeli raditi na projektu, željeli smo stvoriti uznemirujuću atmosferu. U nekom trenutku smo za to dodali glazbu i efekte, ali, kao što je već spomenuto, najbolja ideja je bila koristiti same playere kao izvore zvuka. Stoga smo uklonili sve "lažne" zvukove, usredotočujući se na ono što je stvarno važno.

Danas, nakon dugo vremena, sve se to čini očitim, ali vidim da rijetke igre napuštaju klasičnu umjetnu napetost atmosfere. Oslobađanje od efekata, po mom mišljenju, Siegeu je dalo osebujan zvuk koji ne samo da je ugodan za uho, nego i na mnogo načina utječe na gameplay.

Izvor zvučnih vibracija zrači energiju u okolni prostor. Količina zvučne energije koja u sekundi prolazi kroz površinu od 1 m2, koja se nalazi okomito na smjer širenja zvučnih vibracija, naziva se intenzitetom (snagom) zvuka.

Kada vodimo normalan razgovor, protok energije je otprilike 10 mikrovati. Snaga najglasnijih zvukova violine može biti 60 mikrovata, a snaga zvukova orgulja od 140 do 3200 mikrovati.

Osoba čuje zvuk u iznimno širokom rasponu zvučnih pritisaka (intenziteta). Jedna od referentnih vrijednosti ovog raspona je standardni prag sluha - efektivna vrijednost zvučnog tlaka stvorenog harmonijskom zvučnom vibracijom frekvencije od 1000 Hz, jedva čujnom za osobu prosječne osjetljivosti sluha.

Prag čujnosti odgovara jačini zvuka Iv0 = 10-12 W/m2 ili zvučnom tlaku psv0 = 2×10-5 Pa.

Gornja granica određena je vrijednostima Iv. Maks. = 1 W/m2 ili psv. Maks. = 20 Pa. Kada se percipira zvuk takvog intenziteta, osoba doživljava bol.

U području zvučnih tlakova koji znatno prelaze standardni prag sluha, veličina osjeta nije proporcionalna amplitudi zvučnog tlaka psv, već logaritmu omjera psv / psv0. Stoga se zvučni tlak i intenzitet zvuka često mjere u logaritamskim jedinicama decibela (dB) u odnosu na standardni prag sluha.

Raspon promjene zvučnog tlaka od apsolutnog praga sluha do praga boli je za različite frekvencije od 90 dB do 130 dB.

Ako ljudsko uho simultano percipira dva ili više zvukova različite glasnoće, tada glasniji zvuk prigušuje (apsorbira) slabe zvukove. Postoji takozvano maskiranje zvukova, a uho percipira samo jedan, glasniji, zvuk. Neposredno nakon izlaganja glasnom zvuku, osjetljivost sluha na slabe zvukove je smanjena. Ta se sposobnost naziva adaptacija sluha.

Dakle, prag čujnosti uvelike ovisi o uvjetima slušanja: u tišini ili na pozadini buke (ili drugog uznemirujućeg zvuka). U potonjem slučaju, prag sluha je povećan. To znači da smetnje maskiraju korisni signal.

Ljudski slušni aparat ima određenu inerciju: osjećaj pojave zvuka, kao i njegov prekid, ne pojavljuje se odmah.

Audio signal je nasumičan proces. Njegove akustičke ili električne karakteristike se kontinuirano mijenjaju tijekom vremena. Pokušaj pratiti slučajne promjene u implementaciji ovog kaosa je vježba koja nema previše smisla. Njegovo veličanstvo slučaj je moguće obuzdati, dati mu obilježja determinizma, koristeći prosječne parametre, kao što je razina audio signala.

Razina audio signala karakterizira signal u određenom trenutku i izražava se u decibelima, ispravljenim i prosječnim tijekom određenog prethodnog vremenskog razdoblja, naponom audio signala.

Pod dinamičkim rasponom audio signala podrazumijeva se omjer maksimalnog zvučnog tlaka prema minimalnom ili omjer odgovarajućih napona. U ovoj definiciji nema informacija o tome koji se pritisak i napon smatraju maksimalnim i minimalnim. Vjerojatno se zato tako određen dinamički raspon signala naziva teorijskim. Uz to, dinamički raspon audio signala može se također eksperimentalno odrediti kao razlika između maksimalne i minimalne razine za dovoljno dugo razdoblje. Ova vrijednost uvelike ovisi o odabranom vremenu mjerenja i vrsti mjerača razine.

Dinamički rasponi glazbenih i govornih akustičkih signala različitih vrsta, mjereni instrumentima, u prosjeku su:

80 dB za simfonijski orkestar

45 dB za zbor

35 dB za pop glazbu i vokalne soliste

25 dB za govor zvučnika

Prilikom snimanja potrebno je podesiti razine. To se objašnjava činjenicom da izvorni (neobrađeni) signali često imaju veliki dinamički raspon (na primjer, do 80 dB za simfonijsku glazbu), a kod kuće se audio programi čuju u rasponu od oko 40 dB.

Postoji nedostatak ručnog podešavanja razina. Vrijeme reakcije tonskog majstora je oko 2 s, čak i ako mu je partitura skladbe unaprijed poznata. To dovodi do pogreške u održavanju maksimalnih razina glazbenih programa do 4 dB u oba smjera.

Pojačala, akustični sustavi, pa čak i ljudske uši moraju biti zaštićeni od preopterećenja uzrokovanih naglim skokovima amplitude audio signala – kako bi se ograničila amplituda signala.

Dinamički raspon signala mora biti usklađen s dinamičkim rasponima uređaja za snimanje, pojačanje i odašiljanje.

Za povećanje dometa FM radio postaja, dinamički raspon audio signala mora biti komprimiran. Za smanjenje razine buke u pauzama, poželjno je povećati dinamički raspon.

Na kraju, moda, koja diktira svoje uvjete u svim sferama ljudskog djelovanja, pa tako i u snimanju zvuka, zahtijeva bogat, gust zvuk moderne glazbe, što se postiže oštrim sužavanjem njezina dinamičkog raspona.

Zvučni val (ovojnica glasnoće) fragmenta opere S. Rahmanjinova "Aleko",

i suvremene plesne glazbe.

U klasičnoj glazbi važne su nijanse, plesna glazba treba biti “snažna”.

To diktira potrebu korištenja uređaja za automatsku obradu razina signala.

Vrhunski povezani članci