Kako podesiti pametne telefone i računare. Informativni portal
  • Dom
  • Sigurnost
  • Dinamički raspon digitalnih audio staza. Što je dinamički raspon (DR) i njegov utjecaj na kvalitet zvuka

Dinamički raspon digitalnih audio staza. Što je dinamički raspon (DR) i njegov utjecaj na kvalitet zvuka

E. I. VOLOGDIN

DYNAMIC RANGE

DIGITALNI AUDIO PESME

Bilješke sa predavanja

Sankt Peterburg

Dinamički raspon zvukova i muzike .................................................. ........................................

Dinamički raspon fonograma ................................................... ....................................

Dinamički opseg digitalne audio putanje ........................................ .. ............

Dinamičko proširenje raspona korištenjem Dithering tehnologije .....

Proširenje dinamičkog raspona uz tehnologiju oblikovanja buke

.......................................................................................................................................................

Bibliografija.................................................. ................................................. . ............

1. Dinamički raspon zvukova i muzike

Osoba čuje zvuk u izuzetno širokom rasponu zvučnih pritisaka. Ovaj raspon se proteže od apsolutnog praga sluha do praga bola od 140 dB SPL u odnosu na nulti nivo, koji se uzima kao pritisak od 0,00002 Pa (slika 1). Zona rizika na ovoj slici označava područje zvučnih pritisaka, koji na

Apsolutni prag čujnosti

Frekvencija tonskih zvukova, kHz

Rice. 1. Područja sluha

produženo izlaganje može uzrokovati trajni gubitak sluha. Prag bola za tonske zvukove zavisi od frekvencije; za zvukove proizvoljnog spektra, nivo pritiska od 120 dB SPL se uzima kao prag bola. Grafikon apsolutnog praga sluha je prilično precizno opisan empirijskom jednakošću

U tišini se osjetljivost sluha osobe povećava, au atmosferi glasnih zvukova smanjuje, sluh se prilagođava okolnom zvučnom okruženju, stoga dinamički opseg sluha nije tako velika - oko 70..80 dB. Odozgo je ograničen pritiskom od 100 dB SPL, a odozdo bukom sa nivoom od -30…35 dB SPL. Ovaj dinamički raspon se može pomjeriti gore i dolje za do 20 dB. Za udobno slušanje muzike, preporučuje se da zvučni pritisak ne prelazi 104 dB SPL kod kuće i 112 dB SPL u posebno opremljenim prostorijama.

Dinamički raspon muzike određuje se omjerom u decibelima najglasnijeg zvuka (fortissimo) i najtišeg zvuka (pianissimo). Dinamički raspon simfonijske muzike iznosi 65 ... 75 dB, a na koncertima rok muzike se povećava

do 105 dB, dok vrhovi zvučnog pritiska mogu doseći 122 ... 130 dB SPL.

Dinamički raspon vokalnih izvođača ne prelazi 35 ... 45 dB (tabela 1).

Dinamički opseg muzike značajno zavisi od izbora maksimuma

zvučni pritisak P max, jer je odozdo ograničen apsolutnim pragom

čujnost. Ova zavisnost je najizraženija na rubovima audio opsega.

Na sl. 2

dati su primjeri promjene dinamičkog raspona tonskih zvukova. V

120dB Prag boli

P max

80dB

DR 40 dB

50dB

80dB

50dB

Apsolutni prag

čujnost

Frekvencija tonskih zvukova, kHz

Rice. 2. Dinamički raspon muzike i praga sluha

ovisno o izboru P max

i tonske frekvencije

dinamičan

domet

80 dB se smanjuje na rubovima

opseg zvuka do 40

Zbog toga

uobičajeno je mjeriti dinamički raspon zvukova na frekvenciji od 1 kHz, na kojoj može

dostižu 117 dB.

soba maskira zvuk i time smanjuje njegov dinamički raspon

muzika odozdo. Slika 3. prikazano kao kada se zvučni pritisak smanji sa 120 na 80 dB

SPL dinamički opseg muzike zbog buke u prostoriji smanjen je sa 90 na 50 dB.

120 dB SPL

DR 90 dB

Uticaj

u potpunosti

zanemarivanje

samo kada

90dB

90dB

minimalni nivo muzičkih zvukova.

70dB

U studijima za snimanje, nivo buke nije

90dB

premašuje

apartmani

50dB

razgovarati

povećava nivo

buka do 60dB SPL.

Zbog toga se tiha muzika često utapa

Buka u stanu

prostorije

slušanje

nehotice

nastaje

povećati

volumen.

Šum kvantizacije je bijeli

buka, koja se čuje kada je

Buka u studiju

intenzitet od samo 4 dB SPL, čak i kada

opšta buka audio opreme u prostoriji

dosega

Rice. 3. Dinamički raspon muzike u

mora se uporediti sa činjenicom da je potpun

FS skala digitalnog mjerača nivoa

odgovaraju nivou između 105 i 112 dB SPL. Stoga za

kućne prostorije

dinamički opseg muzike ne bi trebalo da prelazi 101 - 108 dB.

Dinamički raspon mikrofona definisan na isti način kao što se obično radi u električnim putevima. Gornja granica je ograničena dozvoljenom vrijednošću nelinearne distorzije, a donja - nivoom unutrašnjeg šuma. Moderni studijski mikrofoni omogućavaju maksimalni zvučni pritisak od 125...145 dB SPL, dok harmonijska distorzija ne prelazi 0,5%...3%. Sopstveni nivo šuma mikrofona je 15 ... 20 dBA, dinamički opseg je od 90 do 112 dBA, a odnos signal-šum je 70 do 80 dBA. Ovi mikrofoni sa prostorom za glavu pokrivaju čitav opseg ljudskog sluha od 120 dB SPL do nivoa studijske buke od 20 dB SPL. U modernim studijima snimanje se vrši pomoću 22 ili 24-bitnih ADC-a, ponekad se koristi kvantizacija s pomičnim zarezom, tako da nema problema sa dinamičkim opsegom. Takva oprema je izuzetno skupa.

2. Dinamički raspon fonograma

Muzički i govorni signali su niz brzo rastućih i sporije opadajućih zvučnih impulsa (slika 4.). Takav signal karakteriše rms i vršni nivoi, razlika između ovih nivoa naziva se krest faktor. Kvadratni talas (kvadratni talas) ima jedinični vrh faktora od 0 dB, a vrh faktora sinusoida je 3 dB. Fonogrami muzičkih i govornih signala imaju krest faktor do 20 dB ili više. Vrijeme određivanja Krest faktor je povezan sa vremenom integracije pri izračunavanju efektivne vrijednosti signala i obično je jednak 50 ms.

Dinamički raspon i krest faktor muzičke numere određuju se statističkom obradom trenutnih vrijednosti signala. Najdetaljnije statističke karakteristike izračunate su u uređivaču zvuka Audition 3 (slika 4).

Slika 4. Fragmenti fonograma muzičkih odlomaka različitih dužina

Od njih, glavne su sljedeće: vršna amplituda (L pic), maksimalna RMS snaga (L max), minimalna RMS snaga (L min) i Prosječna RMS snaga (L avr) (nivoi maksimuma,

minimalna i srednja srednja kvadratna (efektivna) snaga signala).

Dinamički opseg fonograma prema ovoj tabeli je određen kao

DR mL picL min,

faktor vrha se izračunava po formuli

PF mL picL avr

Dinamički opseg se može odrediti i histogramom distribucije nivoa fonograma, prikazanom na slici 5. Takve operacije je pogodno izvesti brzo prije i nakon dinamičke obrade fonograma.

Slika 4. Statističke karakteristike fonograma Beethovenove muzike "Eliza"

Slika 5. Histogram distribucije Beethovenove muzike "Elise"

zavisno od istraživačkog zadatka. Ako je, na primjer, važan dinamički raspon trenutnih vrijednosti nivoa fonograma, tada bi vrijeme integracije trebalo biti 1-5 ms. Ako se dinamički raspon muzike mjeri uzimajući u obzir slušnu percepciju, tada se bira vrijeme integracije jednako 60 ms, što je vremenska konstanta sluha.

omogućava vam da odredite dinamički opseg i faktor vrha sa datom vjerovatnoćom u odabranom vremenu integracije. Uređivač zvuka Adobe Audition 3 koristi normalizaciju histograma, u kojoj maksimalna vjerovatnoća događaja uvijek odgovara vrijednosti od 100. Takav histogram opisuje distribuciju vjerovatnoća nivoa signala fonograma u odnosu na maksimalnu vrijednost. Prilikom iscrtavanja, skala se automatski bira duž X ose, tako da je teško uporediti histograme različitih fonograma.

Praktična upotreba. Kome su potrebne statističke informacije i histogram fonograma i zašto. Ovi podaci, prije svega, pružaju neprocjenjivu pomoć u dinamičkoj obradi fonograma, jer vam omogućavaju da razumno odaberete karakteristike kompresora i ekspandera. Statistički rezultati obrade fonograma sa muzikom različitih žanrova omogućavaju da se odredi potreban dinamički opseg elektroakustičkog puta, da se formulišu zahtevi za vršnu i prosečnu snagu glava akustičkog sistema. Oni igraju ključnu ulogu u razvoju algoritama kompresije za audio signale.

Emotivna muzika sa širokim dinamičkim rasponom i visokim vrhom

faktor se može slušati samo na visokokvalitetnoj skupoj opremi uz dobru

acoustic

agregati.

slušalicama iu automobilima zbog dinamičke buke

15 opseg se smanjuje i ona

samo odvratno.

Zbog toga ovakvi zapisi nisu baš traženi i,

neizbježno, svake godine dinamički raspon i vrhunac

Slika 7. Prateća pjesma pjesme "Biću tu za tebe"

Rice. 6. CD krest faktor

proizvođači namjerno smanjuju fonograme (slika 6.). Na modernim CD-ovima

diskova u većini slučajeva, dinamički opseg ne prelazi 20 dB, a vrh faktora

nešto više od 3 dB, što je sasvim dovoljno za plesnu muziku. Slika 7. dato

slika modernog soundtracka sa kompakt diska.

3. Dinamički raspon digitalnog audio puta

Konvencionalni digitalni put

uključuje ADC i DAC.

Prvi sprovodi

kvantiziranje analognih signala i njihovo pretvaranje u digitalni tok. Sekunda

pretvara digitalni tok nazad u analogni signal.

Kvantizacija

zaokruživanje

sekvenca uzoraka

na binarni cijeli broj

vrijednosti. Sa pulsno kodnom modulacijom (PCM) kao što je

operacija

sprovedeno

linearno

kvantizer, koji se u tehničkoj literaturi naziva sredinom

Tread. Imati

njegovu opremu

ima oblik

"Stepenice" sa istim stepenicama

nužno,

neparan broj nivoa kvantizacije. Zaokruživanje

digitalni podaci u ovom kvantizeru se proizvode

najbliži

binarnu vrijednost (sl. 8).

Ovaj algoritam

uobičajeno je to zvati zaokruživanje.

algoritam

slobodan dan

kvantizer

simetrično oko vremenske ose i kvantizacija

Rice. 8. Prijenos

provodi se s pragom jednakim

0,5 korak kvantizacije

funkcije kvantizatora

Sve dok je ulazni signal manji od ovog praga, izlazni

Srednji gazište i srednji uspon

signal kvantizatora je nula, što znači da

Kvantizacija se izvodi sa središnjim graničnikom.

ulazni signal je malo iznad praga kvantizacije, izlazni signal ima oblik

pulsni niz sa radnim ciklusom u zavisnosti

sa nivoa

Daljnjim povećanjem nivoa ES-a formira se stepenasti izlazni signal.

Zaokruživanje digitalnih podataka u kvantizatoru Mid-Riser vrši se na najbližu nižu vrijednost (slika 8), pa se ovaj algoritam naziva skraćivanjem. Mid-Riser kvantizator se razlikuje po tome što nema prag kvantizacije, tako da prenosi audio signale na vrlo niskim nivoima, čak i ispod nivoa

buka. Međutim, u odsustvu ES-a, svaki beznačajan šum na izlazu generiše niz slučajnih impulsa sa amplitudom od 1 kvanta, što znači da takav kvantizator pojačava šum.

ADC dinamički opseg sa kvantizatorom srednjeg sloja određuje se kroz logaritam omjera maksimalne i minimalne vrijednosti sinusoidnog signala na ulazu kvantizatora

DR A 20 logA max,

A min

Q 2 (q 1), A

Q je korak kvantizacije, q je broj bitova. Zbog toga

DRA

Q 2 (q 1)

) 6.02q (1)

Q / 2

Kod q = 8 ovaj dinamički opseg je 48 dB, a kod q = 16 se povećava na 96 dB. Vrijednost DR A određuje donju granicu dinamičkog raspona u smislu nivoa ulaznih signala kvantizatora srednjeg sloja.

DAC dinamički opseg mjereno prema preporukama standarda EIAJ kroz omjer maksimalne efektivne vrijednosti signala

sinusoidalni oblik A max na svom izlazu na efektivnu vrijednost šuma kvantizacije, mjereno u opsegu od 0 do Nyquistove frekvencije F N

A max

Q 2 (q 1)

A max

q 1,76;

Za q = 16

DR R = 98 dB, što

decibel

dinamički raspon

kvantizer definisan formulom (1). Dinamički raspon DAC-a mjeren na ovaj način identificira se sa vrijednošću njegovog SNR-a.

Ako je gornji frekvencijski raspon ograničen vrijednošću F max F N, tada formula za proračun za SNR i DR R ima oblik

SNR R DR R 6,02q 1,76 10 log

2 F max

gdje je f s frekvencija uzorkovanja, F max je maksimalna frekvencija audio opsega. At

f s = 44,1 kHz i F max = 20 kHz i SNR R = DR R = 98,5 dB. Kao što vidite, omjer signal-šum je samo 2 decibela veći od dinamičkog raspona. Treba napomenuti da vrijednost SNR ovisi o frekvencijama fs i Fmax, dok DR ne ovisi o ovim parametrima.

Međutim, većina tehničkih publikacija izjednačava dinamički raspon sa omjerom signal-šum. To potvrđuju i AES 17 i

IEC 61606.

Standard IEC 61606 preporučuje merenje SNR i DR kada se na ulaz ADC primeni sinusoidni signal frekvencije od 997 Hz i nivoom od minus 60 dB FS uz obaveznu upotrebu TPDF Dithering tehnologije. U ovom slučaju, izračunati odnos za SNR zbog unesenog dodatnog šuma je predložen u obrascu

SNR T DR T 6.02q 3.01 10 log

2 F max

Pod istim uslovima DR = SNR = 93,7 dB, a ne 96 dB, kako se često nalazi u tehničkoj literaturi. Posljedično, izračunati dinamički raspon je također smanjen. Umjesto SNR, često se koristi njegova recipročna vrijednost, koja određuje integralni nivo šuma kvantizacije.

L nTSNR T.

U skladu sa IEC 61606, mjerenje dinamičkog opsega DR R se izvodi prema dijagramu na slici 9. U ovom krugu, test

Sl..9. DAC mjerni krug dinamičkog raspona

digitalni signal sa frekvencijom od 1 kHz, i nivoom od minus 60 dB, formiran pomoću TPDF Dithering tehnologije, dovodi se na DAC ulaz. Analogni signal iz DAC-a se dovodi na ulaz niskopropusnog filtera sa graničnom frekvencijom od 20 kHz, što ograničava spektar šuma kvantizacije. Zatim se filtriranje izvodi pomoću ponderirajućeg filtera tipa A, koji uzima u obzir osobitosti slušne percepcije šuma kvantizacije, što povećava dinamički raspon za 2-3 dB. Test signal i šum se pojačavaju za 60 dB i upućuju na THD + N mjerač nivoa. Ovaj mjerač potiskuje tonski signal pomoću notch filtera i mjeri nivo buke u decibelima pomoću rms voltmetra. Ovaj izmjereni nivo buke identificiran je, sa suprotnim predznakom, sa dinamičkim rasponom DAC-a.

Prilikom kvantizacije signala minimalnog nivoa dolazi do ogromnih izobličenja, dostižući 100% (slika 10). U tom smislu, u praksi se mora voditi pravi dinamički opseg ADC. Prilikom određivanja ovog opsega potrebno je uzeti u obzir: vrh faktora muzičkih signala, koji dostiže 12...20 dB, potrebu da se nivo donje granice dinamičkog opsega podigne iznad nivoa šuma kvantizacije najmanje za 20 dB i imaju dodatnu marginu u gornjem dijelu dinamičkog opsega od oko 10 ... 12 dB za sprječavanje slučajnog preopterećenja.

Kao rezultat, pravi dinamički raspon je

16-bit ADC PCM snimanje

ne prelazi 48 ... 54 dB. Od ovoga

čak ni dovoljno blizu za dobro

studio

zvučni zapisi.

automatsko podešavanje nivoa koji

javlja se prilikom snimanja CD-a,

raspon se može proširiti na 74

16 bita, 1000 Hz, 93 dB

primetno

pogoršanje

kvalitet zvuka niskog nivoa signala.

Slika 10. Redoslijed uzoraka je iskrivljen

Headroom top

sinusoidni talasni oblici

štiti od mogućnosti preopterećenja,

premašiti

očekivana vrijednost. Prilikom snimanja plesne muzike, dovoljno je 6 dB prostora za slušanje.

Kada snimate simfonijsku muziku, ponekad morate imati marginu do 20 ... 30 dB. Prostor za glavu na dnu sprečava da tihi prolazi budu ispod nivoa buke i, štaviše, ispod praga čujnosti.

U digitalnim stazama gornja granica dinamičkog opsega ograničen nivoom signala od 0 dB FS ... Bez upotrebe tehnologije Dithering donja granica dinamičkog raspona ograničen nivoom

LA 1 / DRA.

Kod q = 8 bita, to je minus 48 dB, a kod q = 16 bita, minus 96 dB. Neizbežna buka na putu podiže ovaj nivo.

Integralni nivo buke od minus 93,7 dB je mnogo ili malo. Važno je koliko ovaj nivo prelazi prag čujnosti. Tehnologija dithering buke

Slika 11. Pragovi čujnosti šuma kvantizacije u zavisnosti od broja cifara

kvantizacija postaje bijeli šum, čiji je prag 4 dB SPL. To znači da će blizu 3 kHz, šum kvantizacije na q = 16 bita premašiti prag čujnosti za 22,3 dB (slika 11). Kao što možete vidjeti iz ove slike, da bi šum kvantizacije bio nečujan, potrebno je koristiti 20-bitnu kvantizaciju.

4. Proširenje dinamičkog raspona korištenjem Dithering tehnologije

Za proširenje dinamičkog raspona PCM putanja sa tipom kvantizatora MeadTread bez povećanja broja bitova i brzine uzorkovanja, mnogo

analognih signala, mali analogni šum se dodaje ES-u. Češće se ova tehnologija koristi kada rekvantizacija digitalnih signalnih stanica kada se proizvodi

vrši se sa 24 bita, a zatim se vrši rekvantizacija, obično do 16 bita, kao što je slučaj u CD standardu. Istovremeno, kvalitet šuma takvog CD-a odgovara 20-bitnom snimku.

U procesu rekvantizacije, često se koristi operacija skraćivanja, u kojoj se najmanje značajni bitovi kodnih riječi jednostavno odbacuju. U ovom slučaju, u izlaznom signalu

Dinamička obrada zvuka na PC-u

(c) Jurij Petelin
http://www.petelin.ru/

U prethodnom članku govorio sam o softverskim alatima za eliminaciju buke i izobličenja zvuka, uključujući navođenje onih operacija "čišćenja zvuka" koje je potrebno obaviti prilikom snimanja pjesme, počevši od ispravljanja grešaka u instalaciji mikrofona pa do masteringa, kako bi grupa pesama, snimljenih na disku, sa estetske tačke gledišta, predstavljala je jedinstvenu celinu. Ova tema je toliko ozbiljna da bi je trebalo posvetiti nekoliko nadolazećih članaka.

Počeću, kao i prošli put, sa glavnom tezom: zvuk koji je amater snimio u kućnom kompjuterskom studiju, iako se, naravno, po kvaliteti ne može porediti sa rezultatima rada profesionalnih studija, ali može biti blizu njih.

Pišem, i krajičkom uha slušam šta tu mrmlja TV. Evo filma koji je u najavi predstavljen kao "super projekat". Car Petar umire, boreći se za presto. Strasti haraju... Drugim kanalima istražitelj Turecki traži ukradene retke tomove, stručnjaci su se otresli antike i ponovo sprovode istragu, jer, ispostaviće se, još uvek „neko tu i tamo u našoj zemlji ponekad uradi ne želim da živim pošteno"... Tako različite priče, ali imaju nešto zajedničko. To je uobičajeno - zvuk. Loš zvuk. Užasan zvuk snimljen od strane profesionalaca u profesionalnim studijima. Pogotovo u "superprojektu": kada se na trenutak stišaju jecaji umirućeg cara i jauci njegovih bliskih, jasno se provlače pozadinski zvuci, čak se može čuti kako rade kasetofoni kamera.

Sljedeći zaključci se nameću sami od sebe:

1. Jasno je da kod nas filmovi odavno nisu presnimljeni u tonskom studiju. Vjerovatno nema novca za ovo. Način na koji je zvuk snimljen na setu, ovako ulazi u montiranu traku.

2. Neki profesionalci ne koriste kompjuterske alate za uklanjanje buke. Nije jasno zašto. Ne znate za njih? Nemate vremena za čitanje posebne literature? Ali čak i elementarne informacije koje se nalaze na pet stranica mog prethodnog članka bile bi dovoljne za početak.

3. Neki od onih koji snimaju zvuk za TV filmove ne znaju da koriste uređaje za obradu dinamike.

Sada ćemo govoriti o obradi dinamike. Ova tema je složena, ali ako se koncentrišete, sigurno ćete sve razumjeti, a zvuk u vašim projektima će postati profesionalan. Pa ne profesionalni, nego amaterski, ali takvi da će ih svi slušati. Za one koji sumnjaju, predlažem da ocijenite rad naših čitalaca, snimljen na disku, koji prati novu knjigu "Sonar. Tajne izrade". Usput, ništa vas ne sprečava da se okušate. Vaša kompozicija bi se mogla pojaviti u muzičkoj kolekciji na sljedećem takvom disku.



Dakle, dinamička obrada. Formalno se sastoji u promjeni dinamičkog raspona audio signala. Ali da bismo ga koristili u korist kvaliteta zvuka, ova fraza očito nije dovoljna. Pa počnimo od početka.

Nivo zvuka i dinamički raspon

Izvor zvučnih vibracija zrači energiju u okolni prostor. Količina zvučne energije koja u sekundi prođe kroz površinu od 1 m2 koja se nalazi okomito na smjer širenja zvučnih vibracija naziva se intenzitet (jačina) zvuka.

Kada smo u normalnom razgovoru, protok snage je otprilike 10 μW. Najglasniji zvuci violine mogu biti 60 μW, a zvuci orgulja mogu se kretati od 140 do 3200 μW.

Osoba čuje zvuk u izuzetno širokom rasponu zvučnih pritisaka (intenziteta). Jedna od referentnih vrijednosti za ovaj raspon je standardni prag sluha - efektivna vrijednost zvučnog pritiska stvorenog harmonijskom zvučnom vibracijom frekvencije 1000 Hz, koju jedva čuje osoba sa prosječnom osjetljivošću sluha.

Prag čujnosti odgovara intenzitetu zvuka Isv0 = 10-12 W / m2 ili zvučnom pritisku ps0 = 2CH10-5 Pa.

Gornja granica je određena vrijednostima Isv. Max. = 1 W / m2 ili pev. Max. = 20 Pa. Kada se percipira zvuk takvog intenziteta, osoba doživljava bol.

U području zvučnih pritisaka koji su znatno viši od standardnog praga sluha, veličina osjeta nije proporcionalna amplitudi zvučnog pritiska psc, već logaritmu omjera ps/ps0. Stoga se zvučni pritisak i intenzitet zvuka često izražavaju u logaritamskim jedinicama decibela (dB) u odnosu na standardni prag sluha.

Opseg promjene zvučnog pritiska od apsolutnog praga sluha do praga bola je za različite frekvencije od 90 dB do 130 dB.

Ako uho osobe istovremeno percipira dva ili više zvukova različite jačine, tada glasniji zvuk prigušuje (apsorbira) slabe zvukove. Dolazi do takozvanog maskiranja zvukova, a uho percipira samo jedan, jači zvuk. Neposredno nakon izlaganja uha glasnom zvuku, osjetljivost sluha na slabe zvukove je smanjena. Ova sposobnost se naziva adaptacija sluha.

Dakle, prag sluha u velikoj meri zavisi od okruženja za slušanje: u tišini ili u pozadini buke (ili drugog uznemirujućeg zvuka). U potonjem slučaju, prag sluha je povećan. Ovo ukazuje da smetnje maskiraju korisni signal.

Ljudski slušni aparat ima određenu inerciju: osjećaj pojave zvuka, kao i njegovog prestanka, ne javlja se odmah.

Audio signal je nasumičan proces. Njegove akustičke ili električne karakteristike se kontinuirano mijenjaju tokom vremena. Pokušaj praćenja nasumičnih promjena u realizaciji ovog haosa je vježba koja nema mnogo smisla. Njegovo Veličanstvo slučaj je moguće obuzdati, dati mu karakteristike determinizma, koristeći prosječne parametre, kao što je nivo audio signala.

Nivo audio signala karakteriše signal u određenom trenutku i predstavlja napon audio signala, izražen u decibelima, ispravljen i usrednjen u određenom prethodnom vremenskom periodu.

Pod dinamičkim opsegom audio signala podrazumijeva se omjer maksimalnog i minimalnog zvučnog pritiska ili odnos odgovarajućih napona. U takvoj definiciji nema informacija o tome koji se tlak i napon smatraju maksimalnim i minimalnim. Vjerojatno se zbog toga dinamički raspon signala koji je određen na ovaj način naziva teorijskim. Uz to, dinamički opseg audio signala može se eksperimentalno odrediti kao razlika između maksimalnog i minimalnog nivoa za dovoljno dug period. Ova vrijednost u suštini ovisi o odabranom vremenu mjerenja i vrsti mjerača nivoa.

Dinamički opsezi muzičkih i govornih akustičkih signala različitih tipova, mjereni instrumentima, u prosjeku su:

80 dB za simfonijski orkestar

45 dB za hor

35 dB za pop muziku i vokalne soliste

25 dB za govor zvučnika

Prilikom snimanja potrebno je podesiti nivoe. To se objašnjava činjenicom da originalni (neobrađeni) signali često imaju veliki dinamički raspon (na primjer, do 80 dB za simfonijsku muziku), a kod kuće se audio programi slušaju u rasponu od oko 40 dB.

Postoji nedostatak ručnog podešavanja nivoa. Vrijeme odziva tonskog inženjera je oko 2 sekunde, čak i ako mu je partitura kompozicije poznata unaprijed. To dovodi do greške u održavanju maksimalnih nivoa muzičkih programa do 4 dB u oba smjera.

Pojačala, akustični sistemi i ljudska uši moraju biti zaštićeni od preopterećenja uzrokovanih iznenadnim naglim promjenama amplitude audio signala – da bi se signal ograničio u amplitudi.

Dinamički opseg signala mora biti usklađen sa dinamičkim rasponima uređaja za snimanje, pojačanje, prijenos.

Da biste povećali domet FM radio stanica, dinamički opseg audio signala mora biti komprimiran. Da bi se smanjio nivo buke u pauzama, poželjno je povećati dinamički raspon.

Uostalom, moda, koja diktira svoje uvjete u svim sferama ljudske djelatnosti, uključujući i snimanje zvuka, zahtijeva bogat, gust zvuk moderne muzike, što se postiže oštrim sužavanjem njenog dinamičkog raspona.

Zvučni val (volumenski omotač) fragmenta opere S. Rahmanjinova "Aleko",

i savremena plesna muzika.

U klasičnoj muzici nijanse su važne; plesna muzika treba da bude "potentna".

To diktira potrebu za korištenjem uređaja za automatsku obradu nivoa signala.

Uređaji za obradu dinamike

Uređaji za automatsku obradu nivoa signala mogu se klasifikovati prema nizu kriterijuma, među kojima su najvažniji: inercija odziva i izvršena funkcija.

Prema kriteriju inercije odziva, razlikuju se neinercijski (trenutni) i inercijski (sa promjenjivim koeficijentom prijenosa) automatski regulatori nivoa:

Kada nivo signala na ulazu autoregulatora bez inercije pređe nominalnu vrijednost, na izlazu se umjesto sinusoidnog signala dobiva trapezni signal. Iako su autopodešivači bez inercije jednostavni, njihova upotreba dovodi do ozbiljnog izobličenja.

Inercijalna je automatska kontrola nivoa u kojoj se pojačanje automatski mijenja ovisno o nivou signala na ulazu. Ove kontrole automatskog nivoa samo izobličuju valni oblik na kratko vrijeme. Odabirom optimalnog vremena odziva, takva izobličenja se mogu učiniti jedva primjetnim uhu.

Ovisno o izvršenim funkcijama, inercijski automatski regulatori nivoa dijele se na:

Kvazi-maksimalni limitatori nivoa

Automatski stabilizatori nivoa

Kompresori dinamičkog opsega

Proširivači dinamičkog raspona

Compander Squelchs

Squelchs pragovi (kapije)

Uređaji sa složenom konverzijom dinamičkog opsega

Glavna karakteristika uređaja za dinamičku obradu je amplituda - zavisnost nivoa izlaznog signala od nivoa ulaznog signala.

Limiter nivoa (limiter) je autoregulator, u kojem se pojačanje mijenja tako da kada ulazni signal pređe nominalni nivo, nivoi signala na njegovom izlazu ostaju praktično konstantni, blizu nominalne vrijednosti. Sa ulaznim signalima koji ne prelaze nominalnu vrijednost, limiter nivoa radi kao konvencionalno linijsko pojačalo. Limiter bi trebao odmah reagirati na promjene nivoa.


Amplitudna karakteristika limitera

Automatski stabilizator nivoa je dizajniran da stabilizuje nivoe signala. Ovo je ponekad potrebno za izjednačavanje jačine zvuka pojedinih fragmenata fonograma. Princip rada auto-stabilizatora sličan je onom limitera. Razlika je u tome što je nominalni izlazni napon automatskog stabilizatora približno 5 dB manji od nominalnog izlaznog nivoa limitera.

Kompresor je uređaj čije se pojačanje povećava kako se nivo ulaza smanjuje. Djelovanje kompresora dovodi do povećanja prosječne snage i, posljedično, jačine zvuka obrađenog signala, kao i do kompresije njegovog dinamičkog opsega.


Amplitudna karakteristika kompresora

Ekspander ima suprotnu amplitudnu karakteristiku od kompresora. Koristi se kada je potrebno vratiti dinamički raspon koji je konvertovao kompresor.


Amplitudna karakteristika ekspandera

Kompander je sistem koji se sastoji od serijski spojenog kompresora i ekspandera. Koristi se za smanjenje šuma u putevima snimanja ili prijenosa audio signala.

Squelch praga (gejt) je auto-regulator u kojem se pojačanje mijenja tako da kada su nivoi ulaznog signala manji od praga, amplituda izlaznog signala je blizu nule. Za ulazne signale koji prelaze prag, squelch djeluje kao konvencionalno linearno pojačalo.

Automatski podešavači za složenu konverziju dinamičkog opsega imaju više kontrolnih kanala. Na primjer, kombinacija limitera, auto-stabilizatora, ekspandera i graničnog squelch-a omogućava vam da stabilizirate jačinu zvuka različitih fragmenata kompozicije, izdržite maksimalne razine signala i potisnete šum u pauzama.

Struktura uređaja za dinamičku obradu

Inercijalni regulator nivoa ima glavni kanal i kontrolni kanal. Ako se signal dovodi u upravljački kanal sa ulaza glavnog kanala, imamo posla sa direktnom regulacijom, a ako sa izlaza - sa reverznom.

Glavni kanal u direktnom upravljačkom krugu uključuje audio pojačala, liniju kašnjenja i podesivi element. Potonji, pod utjecajem upravljačkog napona, može promijeniti svoj koeficijent prijenosa. Glavni kanal u reverzno reguliranom kolu sadrži sve gore navedene elemente, s izuzetkom linije kašnjenja.

Suštinski važni elementi kontrolnog kanala su detektor i integrirajuće (izglađujuće) kolo. Sve dok napon na ulazu kola ne pređe prag (referencu), upravljački kanal ne generiše upravljački signal, a koeficijent prijenosa kontroliranog elementa se ne mijenja. Kada je prag prekoračen, detektor generiše impulsni napon proporcionalan razlici između vrednosti trenutnog signala i referentnog napona. Integraciono kolo usrednjuje diferencijalni napon i generiše kontrolni napon proporcionalan nivou signala na ulazu kontrolnog kanala.

Linija kašnjenja, dostupna u glavnom kanalu direktnog kontrolnog kola, omogućava kontrolnom kanalu da radi sa određenim predviđanjem. On će detektirati porast nivoa signala prije nego što signal stigne do podesivog elementa. Stoga postoji fundamentalna mogućnost eliminacije neželjenih prolaznih pojava. Pad nivoa se može nositi gotovo savršeno. Međutim, fazni odziv analogne linije kašnjenja nije linearan. Razlika u faznim pomacima za različite spektralne komponente signala dovodi do izobličenja oblika širokopojasnog signala pri prolasku kroz liniju kašnjenja. Digitalne linije kašnjenja nemaju ovaj nedostatak, ali da bi ih koristili, signal se prvo mora digitalizirati. U uređajima za virtuelnu obradu signal se obrađuje u digitalnom obliku i nema problema sa algoritamskom implementacijom funkcionalnih elemenata.

Sva prava u ovom dokumentu su zadržana od strane autora. Reprodukcija ovog teksta ili njegovog dijela dozvoljena je samo uz pismenu dozvolu autora.

Bitovi, herci... Šta se krije iza ovih pojmova? Prilikom razvoja standarda za audio CD-ove, vrijednosti 44 kHz, 16 bit. Zašto baš toliko? Koji je razlog za izbor, a i zašto se pokušavaju povećati ove vrijednosti na recimo 96 kHz i 24 ili čak 32 bita...

Hajde da to prvo shvatimo sa rezolucijom uzorkovanja - to jest, sa bitnošću. Desilo se da morate birati između brojeva 16, 24 i 32. Srednje vrijednosti bi, naravno, bile zgodnije u smislu zvuka, ali previse neprijatan za digitalnu upotrebu.

Za šta je odgovoran ovaj parametar? Ukratko - za dinamički opseg. Opseg istovremeno reprodukovane glasnoće je od maksimalne amplitude (0 dB) do najniže koju rezolucija može prenijeti, na primjer, oko -93 dB za 16-bitni zvuk. Čudno, ovo je u velikoj meri povezano sa nivoom buke sa zvučnog zapisa. U principu, za, na primjer, 16-bitni audio, sasvim je moguće prenositi signale sa snagom od -120 dB, međutim, ove signale će biti teško primijeniti u praksi zbog tako fundamentalnog koncepta kao što je šum uzorkovanja... Činjenica je da prilikom uzimanja digitalnih vrijednosti uvijek griješimo, zaokružujući stvarnu analognu vrijednost na najbližu moguću digitalnu vrijednost. Najmanja moguća greška je nula, ali najviše grešimo za polovinu posljednjeg bita (bit, tada će termin najmanji bitni bit skraćen na MB). Ova greška nam daje takozvani šum uzorkovanja - slučajnu nesklad između digitaliziranog signala i originala. Ovaj šum je konstantan i ima maksimalnu amplitudu od 0,5 MB. Ovo se može smatrati slučajnim vrijednostima pomiješanim u digitalni signal. Ovo se ponekad naziva šumom zaokruživanja ili kvantizacije.

Zaustavimo se detaljnije o tome šta se podrazumijeva pod snagom signala, mjerenom u bitovima. Najjači signal u digitalnoj audio obradi uzima se kao 0 dB, što odgovara svim bitovima postavljenim na 1. Ako je najznačajniji bit (u daljem tekstu SB) nula, rezultirajuća digitalna vrijednost će biti upola manja, što odgovara 6 dB gubitak u nivou. Niti jedan drugi bit osim SB ne može postići nivo veći od -6 dB. Shodno tome, najznačajniji bit je, takoreći, odgovoran za prisustvo nivoa signala od -6 do 0 dB, dakle, SB je bit od 0 dB. Prethodni bit je odgovoran za nivo od -6 dB, ali najmanje značajan, dakle za nivo (broj_bitova-1) * 6 dB. U slučaju 16-bitnog zvuka, MB odgovara nivou od -90 dB. Kada kažemo 0,5MB, ne mislimo na -90/2, već pola koraka do sljedećeg bita - odnosno još 3 dB niže, -93 dB.

Vraćamo se na izbor rezolucije digitalizacije. Kao što je već pomenuto, digitalizacija unosi šum na nivou od 0,5MB, što znači da je zapis digitalizovan u 16 bita pravi mnogo buke na -93 dB. Može prenositi signale i tiši, ali buka i dalje ostaje na -93 dB. Na osnovu toga se određuje dinamički raspon digitalnog zvuka – gdje se omjer signal-šum pretvara u šum/signal (buke ima više nego korisnog signala), granica ovog raspona je na dnu. dakle, main kriterijum digitalizacije - koliko buke možemo li priuštiti oporavljeni signal? Odgovor na ovo pitanje dijelom ovisi o tome koliko je buke bilo u originalnoj stazi. Važan zaključak je da ako digitalizujemo nešto sa nivoom buke od -80 dB - nema apsolutno nikakvog razloga da ga digitalizujemo na više od 16 bita, jer, s jedne strane, buka od -93 dB vrlo malo dodaje na ionako ogroman (relativno) ogroman šum od -80 dB, a sa druge strane - tiši od -80 dB u samom fonogramu, šum/signal već počinje i jednostavno nema potrebe za digitalizacijom i prijenosom takvog signala.

U teoriji, ovo je jedini kriterij za odabir rezolucije digitalizacije. Više mi ne pravi apsolutno bez izobličenja ili netačnosti. Praksa, što je čudno, gotovo u potpunosti ponavlja teoriju. To je ono što je vodilo one ljude koji su odabrali 16-bitnu rezoluciju za audio CD-ove. Buka -93 dB je prilično dobro stanje, koje gotovo potpuno odgovara uslovima naše percepcije: razlika između praga bola (140 dB) i uobičajene pozadinske buke u gradu (30-50 dB) je samo stotinjak. dB, a ako se uzme u obzir da se na bolnom nivou glasnoće ne sluša muzika – što dodatno sužava opseg – ispada da je stvarna buka prostorije ili čak opreme mnogo jača od buke uzorkovanja. Ako čujemo nivo ispod -90 dB u digitalnom snimku, čućemo i percipirati zvukove uzorkovanja, inače jednostavno nikada nećemo utvrditi da li se radi o digitalnom zvuku ili uživo. Jednostavno nema druge razlike u smislu dinamičkog raspona. Ali u principu, osoba može smisleno čuti u opsegu od 120 dB i bilo bi lijepo sačuvati cijeli taj raspon, s kojim se 16 bita, čini se, ne može nositi.

Ali to je samo na prvi pogled: pomoću posebne tehnike tzv oblikovano dithering, moguće je promijeniti frekvencijski spektar šuma uzorkovanja, gotovo u potpunosti ih dovesti u područje više od 7-15 kHz. Mi mijenjamo frekvencijsku rezoluciju (odbijamo da reprodukujemo tihe visoke frekvencije) za dodatni dinamički raspon u preostalom frekventnom segmentu. U kombinaciji sa specifičnostima našeg sluha - naša osetljivost na izbačeni visokofrekventni region je za desetine dB niža nego u glavnom području (2-4 kHz) - to omogućava relativno tih prenos korisnih signala putem dodatnih 10-20 dB tiše od -93 dB - dakle, dinamički opseg 16-bitnog zvuka za ljude iznosi oko 110 dB. I općenito - u isto vrijeme, osoba jednostavno ne može čuti zvukove koji su 110 dB tiši od glasnog zvuka koji je upravo čuo. Uho se, kao i oko, prilagođava glasnoći okolne stvarnosti, pa je simultani domet našeg sluha prilično mali - oko 80 dB. Razgovarajmo više o dithring-u nakon razmatranja aspekta frekvencije.

Za CD-ove, brzina uzorkovanja je 44100 Hz. Vjeruje se da to znači da se reproduciraju sve frekvencije do 22,05 kHz, ali to nije sasvim točno. Možemo samo reći da u digitalizovanom signalu nema frekvencija viših od 22,05 kHz. Prava slika reprodukcije digitalizovanog zvuka uvek zavisi od toga specifična tehnologija i uvek ne tako savršeno kao što bismo želeli, i kao u skladu sa teorijom. Sve zavisi od konkretnog DAC-a.

Hajde da prvo shvatimo šta želimo da dobijemo. Osoba srednjih godina (prilično mlada) može osjetiti zvukove od 10 Hz do 20 kHz, čuti smisleno - od 30 Hz do 16 kHz. Zvukovi sve viši i niži se percipiraju, ali ne predstavljaju akustične senzacije. Zvukovi iznad 16 kHz se osjećaju kao neugodan neugodan faktor - pritisak na glavu, bol, posebno glasni zvuci donose tako oštru nelagodu da želite napustiti prostoriju. Neugodne senzacije su toliko jake da se djelovanje sigurnosnih uređaja zasniva na tome - nekoliko minuta vrlo glasnog visokofrekventnog zvuka izludit će svakoga, a u takvom okruženju postaje apsolutno nemoguće ukrasti bilo šta. Zvukovi ispod 30 - 40 Hz sa dovoljnom amplitudom percipiraju se kao vibracija koja emituje iz predmeta (zvučnika). Ispravnije bi bilo reći - samo vibracija. Čovjek akustički gotovo i ne određuje prostorni položaj tako niskih zvukova, stoga se već koriste druga čula - taktilna, takve zvukove osjećamo tijelom.

Za prijenos zvuka kakav jeste, bilo bi lijepo sačuvati cijeli percipirani raspon 10 Hz do 20 kHz. U teoriji, kod digitalnog snimanja nema apsolutno nikakvih problema sa niskim frekvencijama. U praksi, svi DAC-ovi bazirani na delta imaju potencijalni izvor problema. Takvih uređaja sada ima 99%, tako da se problem nekako rješava, iako iskreno loših uređaja gotovo da i nema (samo najjeftinije sheme). Možemo pretpostaviti da je s niskim frekvencijama sve u redu - uostalom, ovo je samo potpuno rješiv problem reprodukcije, s kojim se uspješno nose dobro dizajnirani DAC-ovi s cijenom većom od 1 dolara.
Sa visokim frekvencijama stvari su malo gore, barem sigurno. teže... Gotovo cijela suština poboljšanja i komplikacija DAC-ova i ADC-a usmjerena je upravo na pouzdaniji prijenos visokih frekvencija. "Visoka" znači frekvencije uporedive sa frekvencijom uzorkovanja - to jest, u slučaju 44,1 kHz, to je 7-10 kHz i više. Slika sa objašnjenjem:

Na slici je prikazana frekvencija od 14 kHz, digitalizovana sa brzinom uzorkovanja od 44,1 kHz. Tačke označavaju trenutke kada je snimljena amplituda signala. Vidi se da postoje oko tri tačke po periodu sinusoide, a da biste vratili prvobitnu frekvenciju u obliku sinusoide, potrebno je pokazati malo mašte. Sam sinusni val nacrtao je program CoolEdit i pokazao je svoju maštu – povratio je podatke. Sličan proces se odvija u DAC-u, to radi filter za oporavak. A ako su relativno niske frekvencije gotovo gotove sinusoide, tada oblik i, shodno tome, kvaliteta visokofrekventnog oporavka u potpunosti leži na savjesti sustava restauracije DAC-a. CoolEdit ima vrlo dobar filter za oporavak, ali također ne uspijeva u ekstremnom slučaju - na primjer, frekvencija od 21 kHz:

Vidi se da je oblik oscilacija (plave linije) daleko od ispravnog, a pojavila su se svojstva kojih ranije nije bilo. Ovo je glavni problem kod reprodukcije visokih frekvencija. Problem, međutim, nije tako ozbiljan kao što se čini. Svi moderni DAC-ovi koriste tehnologiju resamplinga (multirate), koja se sastoji u digitalnoj restauraciji na nekoliko puta veću frekvenciju uzorkovanja, a zatim se pretvara u analogni signal na povećanoj frekvenciji. Tako se problem vraćanja visokih frekvencija prebacuje na pleća digitalnih filtera, koji mogu biti vrlo kvalitetni. Toliko kvalitetan da je u slučaju skupih uređaja problem u potpunosti uklonjeno - omogućena je neiskrivljena reprodukcija frekvencija do 19-20 kHz. Resampling se također koristi u ne baš skupim uređajima, tako da se, u principu, ovaj problem može smatrati riješenim. Uređaji u području od 30 - 60 dolara (zvučne kartice) ili stereo uređaji do 600 dolara, obično slični u DAC-u ovim zvučnim karticama, savršeno reproduciraju frekvencije do 10 kHz, podnošljivo - do 14 - 15, i nekako ostalo . Od ovoga prilično dovoljno za većinu pravih muzičkih aplikacija, a ako nekome treba više kvaliteta, naći će ga u profesionalnim uređajima koji nisu mnogo skuplji - jednostavno se prave pametno.

Nazad na dithering - da vidimo kako možete korisno povećati dinamički raspon preko 16 bita.

Ideja ditheringa je mešanje signala buka... Koliko god čudno zvučalo – kako bismo smanjili šum i neugodne efekte kvantizacije, mi dodati tvoja buka. Pogledajmo primjer - iskoristimo sposobnost CoolEdita da radi u 32 bita. 32 bita je 65 hiljada puta preciznije od 16 bita, stoga se u našem slučaju 32-bitni zvuk može smatrati analognim originalom, a njegov prijevod u 16 bita je digitaliziran. Slika prikazuje 32-bitni zvuk - muziku snimljenu na tako tihoj razini da najglasniji trenuci dosežu samo -110 dB:

Ovo je s marginom mnogo tiše od dinamičkog raspona 16-bitnog zvuka (1MB 16-bitnog prikaza jednako je jednom na skali s desne strane), tako da ako samo zaokružite podatke na 16 bita, dobićemo potpunu digitalnu tišinu .

Dodajmo bijeli šum signalu sa nivoom od 1MB - to je -90 dB (približno odgovara nivou šuma kvantizacije):

Pretvorite u 16 bita (moguće su samo cjelobrojne vrijednosti - 0, 1, -1, ...):


(Ne obraćajte pažnju na plavu liniju, koja takođe uzima srednje vrijednosti - ovo je CoolEdit filter koji simulira stvarnu amplitudu nakon filtera za rekonstrukciju. Tačke uzimanja amplituda nalaze se samo na vrijednostima 0 i 1)

Kao što vidite, neki podaci su ostali. Gdje je izvorni signal imao viši nivo, ima više vrijednosti 1, gdje manje - nula. Da bismo čuli šta smo dobili, pojačaćemo signal za 14 bita (78 dB). Rezultat se može preuzeti i poslušati (dithwht.zip, 183 kb).

Ovaj zvuk čujemo sa ogromnim -90dB smetnje (prije slušanja pojačanja), dok je željeni signal samo -110dB. Već imamo prenos zvuka sa nivoom od -110 dB u 16 bita. U principu, ovo je standardni način proširenja dinamičkog raspona, što se često događa gotovo samo od sebe - svuda ima dovoljno buke. Međutim, to je samo po sebi prilično besmisleno - nivo šuma uzorkovanja ostaje na istom nivou, a prenošenje signala slabijeg od šuma nije baš jasno sa stanovišta logike...

Komplikovaniji način je oblikovano dithering... Ideja je da, pošto još uvijek ne čujemo visoke frekvencije u vrlo tihim zvucima, onda bi se glavna snaga buke trebala usmjeriti na te frekvencije, a možete čak koristiti i puno buke - ja ću koristiti nivo od 4MB (ovo su dva bita buke). Poboljšan rezultat nakon filtriranja visokih frekvencija (ne bismo ih čuli pri normalnoj jačini ovog zvuka) - ditshpfl.zip, 1023 kb (nažalost, zvuk je prestao da se arhivira). Ovo je već prilično dobar (za izuzetno nisku jačinu) prenos zvuka, buka je približno jednaka po snazi ​​samom zvuku sa nivoom -110 dB! Važna napomena: Mi povećali su se stvarni šum uzorkovanja od 0,5MB (-93 dB) do 4MB (-84 dB), spuštanje zvučni šum uzorkovanja od -93 dB do oko -110 dB. Odnos signala i šuma pogoršao, ali buka je otišla u visokofrekventno područje i prestala se čuti, što je dalo značajno poboljšanje u stvarnosti(ljudski percipiran) odnos signal-šum. U praksi, ovo je već nivo šuma uzorkovanja 20-bitnog zvuka. Jedini uslov za ovu tehnologiju je prisustvo frekvencija za šum. Zvuk od 44,1 kHz omogućava postavljanje šuma na frekvencijama od 10-20 kHz nečujnih pri niskoj glasnoći. Ali ako digitalizirate na 96 kHz, frekvencijski domen za šum (nečujan za ljude) bit će toliki da kada koristite oblikovano dithering 16 bita stvarno pretvoriti u svih 24.

[Napomena: PC Speaker je 1-bitni uređaj, ali sa prilično velikom maksimalnom stopom uzorkovanja (uključen/isključen ovaj pojedinačni bit). Koristeći proces koji je u suštini sličan ditheringu, koji se prije naziva pulsno-širinskom modulacijom, na njemu je reproduciran prilično kvalitetan digitalni zvuk - 5-8 niskofrekventnih bitova je izvučeno iz jednog bita i visoka stopa uzorkovanja, te nemogućnost oprema za reprodukciju delovala je kao filter za visokofrekventnu buku, tako visoke frekvencije, kao i naša nesposobnost da ih čujemo. Međutim, začuo se blagi zvižduk visokog tona - čujni dio ove buke.]

Stoga, oblikovano dithering može značajno smanjiti ionako nizak šum uzorkovanja 16-bitnog zvuka, čime se tiho širi korisni (bešumni) dinamički raspon cjelina oblasti ljudskog sluha. Budući da se danas, prilikom konvertovanja iz radnog 32-bitnog formata u konačni 16-bitni format, za CD-ove koristi oblikovni dithering - naših 16 bitova je potpuno dovoljno za potpuni prenos zvučne slike.

Jedina stvar je da ova tehnologija radi samo u posljednjoj fazi - priprema materijala za reprodukciju. Prilikom obrade visokokvalitetnog zvuka, jednostavno neophodno ostanite u 32 bita, kako ne bi došlo do ditheringa nakon svake operacije, bolje kodiranje rezultata natrag na 16 bita. Ali ako je nivo buke fonograma veći od -60 dB, možete izvršiti svu obradu u 16 bita bez imalo grižnje savjesti. Srednji dithering će osigurati da nema izobličenja zaokruživanja i dodatnog šuma stotine puta slabiji od onog koji je već dostupan i stoga potpuno ravnodušan.

P:
Zašto kažu da je 32-bitni zvuk bolji od 16-bitnog?
A1: Oni nisu u pravu.
A2: [Oni znače malo drugačije: prilikom obrade ili snimanja zvuka neophodno koristite veću rezoluciju. Ovo se koristi uvijek... Ali u zvuku kao iu gotovom proizvodu, više od 16-bitne rezolucije nije potrebno.]
P: Ima li smisla povećati brzinu uzorkovanja (na primjer, do 48 kHz ili do 96)?
A1: Nema. Uz bilo koji kompetentan pristup u dizajnu DAC-a, 44 kHz prenosi cjelina potreban frekvencijski opseg.
A2: [Oni znače malo drugačije: ima smisla, ali samo kada se obrađuje ili snima zvuk.]
P: Zašto se nastavlja uvođenje visokih frekvencija i bitnih brzina?
A1: Za napredak je važno da se kreće. Gdje i zašto više nije toliko bitno...
A2: U ovom slučaju, mnogi procesi su lakši. Ako će, na primjer, uređaj obraditi zvuk, bit će mu lakše to učiniti na 96 kHz / 32 bita. Gotovo svi DSP-ovi koriste 32 bita za obradu zvuka, a mogućnost zaboravljanja na konverziju je lakši razvoj i još uvijek blago povećanje kvalitete. I općenito - zvuk za dalju obradu Ima ima smisla pohranjivati ​​u višoj rezoluciji od 16 bita. Za hi-end uređaje koji samo reproduciraju zvuk, ovo apsolutno indiferentan.
P: 32x ili 24x ili čak 18-bitni DAC-ovi bolji od 16-bitnih?
O: Uglavnom - br... Kvalitet konverzije uopće ne ovisi o bitnosti. Kodek AC "97 (moderna zvučna kartica do 50 dolara) koristi 18-bitni kodek, dok kartice od 500 dolara, čiji se zvuk ne može ni porediti sa ovom glupošću, koriste 16-bitni kodek. Nema apsolutno nikakve razlike za 16-bitnu audio reprodukciju..
Također treba imati na umu da većina DAC-ova obično zapravo reproducira manje bitova nego što ih uzima. Na primjer, stvarni nivo buke tipičnog jeftinog kodeka je -90 dB, što je 15 bita, a čak i ako je sam 24-bitni, nećete dobiti nikakav povrat od "dodatnih" 9 bita - rezultat njihovih rad, čak i da je bio dostupan, utonuće u njihovu sopstvenu buku. Većina jeftinih uređaja ignore dodatni bitovi - oni se jednostavno ne računaju u njihovom procesu sinteze zvuka, iako idu na digitalni ulaz DAC-a.
P: I za zapisnik?
O: Za snimanje je bolje imati veći ADC. Opet, veće pravi dubina bita. Dubina bita DAC-a bi trebala odgovarati nivou šuma originalnog fonograma, ili jednostavno biti dovoljna za postizanje željenog niskog nivoa buka.
Takođe je zgodno imati veću dubinu bita kako bi se koristio povećani dinamički opseg za manje precizno podešavanje nivoa snimanja. Ali zapamtite - uvijek morate upasti pravi opseg kodeka. U stvarnosti, 32-bitni ADC, na primjer, je gotovo u potpunosti besmisleno, pošto će nižih deset bitova samo kontinuirano proizvoditi buku - tako niska buka (ispod -200 dB) samo ne može biti u analognom muzičkom izvoru.

Od zvuka povećane dubine bita ili frekvencije uzorkovanja ne vrijedi zahtijevati bolji kvalitet u odnosu na CD. 16 bita / 44 kHz, gurnut do granice sa oblikovanim ditheringom, prilično je sposoban u potpunosti da prenesemo informacije koje nas zanimaju, ako se ne radi o procesu obrade zvuka. Ne gubite prostor na dodatne podatke u svom gotovom materijalu i ne očekujte bolji kvalitet zvuka od DVD-Audio-a na 96 kHz / 24 bita. Uz pravi pristup, pri stvaranju zvuka u standardnom CD formatu, imaćemo kvalitet koji jednostavno ne treba u daljem usavršavanju, a odgovornost za korektan zvučni zapis konačnih podataka odavno su preuzeli razvijeni algoritmi i ljudi koji ih znaju pravilno koristiti. U posljednjih nekoliko godina, nećete naći novi disk bez oblikovanog ditheringa i drugih trikova koji bi kvalitet zvuka doveli do krajnjih granica. Da, biće zgodnije za one koji su lijeni ili samo zakrivljeni da daju gotov materijal u 32 bita i 96 kHz, ali u teoriji, vrijedi li nekoliko puta veće audio podatke? ...

Moje ime je Louis Philippe Dion, ja sam inženjer zvuka za Rainbow Six: Siege i u Ubisoftu sam sedam godina. Ranije sam radio dizajn zvuka za Prince of Persia i Splinter Cell. Takođe sam radio kao menadžer proizvoda za Ubisoftov sopstveni zvučni mehanizam.

Prije nego što sam se pridružio industriji igara, radio sam kao tonski inženjer na nekoliko TV serija i filmova. U slobodno vrijeme, koliko se sjećam, bavio sam se muzikom, gajeći ljubav prema sintisajzerima, gitarama i općenito prema svemu što može proizvesti zvuk.

Sa velikim interesovanjem za tehničke aspekte zvuka, s entuzijazmom sam se preselio u industriju igara. Osjećao sam da igre nude više prostora za inovacije i tehnološka otkrića nego televizija i filmovi. Jedva smo se dotakli potencijala interaktivnog zvuka, informacija u realnom vremenu i novih algoritama za pozicioniranje upravo sada, i veoma sam znatiželjan šta nosi budućnost.

Dinamičko širenje zvuka u destruktivnim okruženjima

Tri osnovna aspekta fizike povezana su sa širenjem zvuka: refleksija (kada se zvuk odbija od površina), apsorpcija (kada zvuk prolazi kroz površinu, ali gubi neke frekvencije) i difrakcija (kada se zvuk savija oko objekata). Vaš sluh svakodnevno bilježi ove pojave. U stvarnom životu, mnogi drugi faktori su odgovorni za procijenjenu poziciju izvora zvuka, ali ja ću se fokusirati na fiziku širenja zvuka i kako ga simuliramo.

Glavna inovacija u Siegeu bila je obilna upotreba difrakcije - za to koristimo termin opstrukcija. Strateškim postavljanjem "distributivnih čvorova" na kartu mogli bismo izračunati najjednostavniji put zvuka od izvora do slušatelja. Jednostavnost putanje zavisi od nekoliko faktora, odnosno od dužine putanje, ukupne vrednosti savitljivih uglova i kazne za stepen uništenja na određenim čvorovima.

Na primjer, ako zid nije oštećen, čvor unutar njega se ne računa algoritmom (beskonačna kazna). Ali ako u njemu postoji rupa, čvor će biti dostupan za odabir putanje širenja. Zatim virtuelno pomjeramo izvor zvuka u skladu sa smjerom takvih putanja, što u konačnici djeluje kao analog difrakcije.

Također koristimo nekoliko strategija za simulaciju apsorpcije, nazivajući to "okluzijom". Ovisno o izvoru, mi ili puštamo unaprijed pripremljenu prigušenu verziju zvuka (na primjer, stepenice na gornjem spratu) ili reprodukujemo zvuk direktno sa izvora sa frekvencijama filtriranja u realnom vremenu. Druga opcija povećava opterećenje procesora, pa je pretežno rezervisana za zvukove oružja. U stvarnom životu, apsorbirana i odbačena verzija zvuka mogu se čuti istovremeno, a mi ih također kombiniramo, dajući više informacija o stvarnoj lokaciji izvora.

Konačno, za refleksiju (u našoj terminologiji "reverb") koristimo impulsni reverb. Ovo je poseban reverb koji "skenira" akustična svojstva prave sobe, a zatim u njoj pušta zvukove iz naše igre. Po mom mišljenju, ova metoda je svjetlosnim godinama ispred tradicionalnih parametarskih reverba - barem u svrhu simulacije. Jedina mana je što zbog opterećenja procesora ne možemo ga koristiti u velikom broju slučajeva. Da bismo zaobišli ovo ograničenje, "vezujemo" reverb za oružje i reproduciramo ga u smjeru tog oružja, što igraču pruža preciznije informacije o neprijateljskoj lokaciji.

čemu sve to?

Destruktivno okruženje bilo je veliki izazov tokom razvoja sistema za širenje zvuka. Jedno je voziti zvuk najkraćim putem, a sasvim drugo kada se nivo menja tokom igre - to je nešto što nikada ranije nismo radili. Nije bilo lako održati kvalitet zvuka na visokom nivou, imajući na umu performanse. Smjestili smo nekoliko čvorova u destruktivno okruženje i oni su ostali zatvoreni dok se objekt ne ošteti. Eksperimentirali smo s različitim brojem mogućih puteva širenja iznova i iznova dok nismo pronašli sredinu između tačnosti i brzine.

Zanimljivo je da modifikatori širenja zvuka ne rade samo u jednom smjeru: čvorovi se mogu otvarati i zatvarati. Barikadiranjem i jačanjem zidova, igrači mijenjaju i put širenja zvuka. Takve prepreke ne moraju u potpunosti prekriti čvor - ovisno o svojstvima materijala (drvo, staklo, beton, itd.), zvuk i dalje može proći, ali uz određenu kaznu. Na primjer, drvene i metalne barikade imaju različite postavke isključivanja zvuka.

Sa nivoom destruktivnosti kao što je Siege, bila bi katastrofa da smo se oslonili na okluziju bez prepreka. U ovom slučaju, okluzija bi bila previše moćan wallhack. Igrajući kao odbrana, moglo bi se jednostavno uništiti što više zidova i osluškivati ​​tačno kuda napadači idu - ne bi ni imali šanse. Trudimo se da zvuk bude što precizniji, ali simulacija "prave fizike" također dodaje dodatni sloj nagađanja u igri o mjestu gdje se neprijatelj nalazi, što izjednačava obje strane. Naravno, u nekim situacijama ovaj trenutak može biti veoma uznemirujući, ali ovo je i stvarni život.

Hereford karta

Čujnost radnji igrača

Tišina i neaktivnost su ključni principi igre, a čak i sa triminutnim mjeračem vremena, igrači radije slušaju svoje protivnike. Zapravo, čak i kada smo započeli razvoj, mislili smo da će okruženje igre zvučati prilično nezanimljivo. Tiho čekanje u spavaćoj sobi kuće u predgrađu nije bitka u jeku bitke ili svemirska bitka, zar ne?

U to vrijeme u igru ​​nisu dodani svi zvukovi, a sistem distribucije je bio tek u ranoj fazi razvoja. Ali kada su svi delovi slagalice počeli polako da se spajaju, shvatili smo da možemo postići nešto ozbiljnije od "lažne napetosti". Prijetnja koju čujete je stvarna i ide prema vama. Udaljavanjem od teškog ambijenta uspjeli smo i povećati anksioznost atmosfere i stvoriti prostor za pružanje preciznijih informacija igračima o neprijatelju.

Dijagram širenja zvuka na karti Hereforda

Posebnu pažnju posvetili smo zvukovima kretanja, omogućavajući vam da jednostavno slušate kako biste razumjeli lokaciju neprijatelja - sasvim je moguće odrediti težinu, oklop i brzinu operatera iz zvučnih upita. Barikade, gadgeti i drugi uređaji također su opremljeni specifičnim zvukovima.

Zvukovi koje lik u igrici proizvodi pojačavaju se iz dva važna razloga: prvo, igrač shvata da pravi veliku buku i da ga to može odati; drugo, jasno daje do znanja da morate usporiti ako želite da slušate. Ovo je temelj dizajna zvuka u Siegeu: sporijim kretanjem i osluškivanjem okoline možete prikupiti više informacija i bolje raditi.

Krupni plan distributivnih čvorova

Ishodi

Kada smo počeli da radimo na projektu, imali smo za cilj da stvorimo uznemirujuću atmosferu. U nekom trenutku smo dodali muziku i efekte za ovo, ali kao što je već spomenuto, najbolja ideja je bila koristiti same plejere kao izvore zvuka. Tako smo uklonili sve "lažne" zvukove, fokusirajući se na ono što je zaista važno.

Danas, nakon dugo vremena, sve ovo izgleda očigledno, ali vidim da rijetke igre napuštaju klasičnu umjetnu napetost atmosfere. Oslobađanje od efekata, po mom mišljenju, dalo je Siegeu prepoznatljiv zvuk koji ne samo da je prijatan za uho, već uveliko utiče i na igru.

Izvor zvučnih vibracija zrači energiju u okolni prostor. Količina zvučne energije koja u sekundi prođe kroz površinu od 1 m2 koja se nalazi okomito na smjer širenja zvučnih vibracija naziva se intenzitet (jačina) zvuka.

Kada smo u normalnom razgovoru, protok snage je otprilike 10 μW. Najglasniji zvuci violine mogu biti 60 μW, a zvuci orgulja mogu se kretati od 140 do 3200 μW.

Osoba čuje zvuk u izuzetno širokom rasponu zvučnih pritisaka (intenziteta). Jedna od referentnih vrijednosti za ovaj raspon je standardni prag sluha - efektivna vrijednost zvučnog pritiska stvorenog harmonijskom zvučnom vibracijom frekvencije 1000 Hz, koju jedva čuje osoba sa prosječnom osjetljivošću sluha.

Prag čujnosti odgovara intenzitetu zvuka Isv0 = 10-12 W / m2 ili zvučnom pritisku ps0 = 2CH10-5 Pa.

Gornja granica je određena vrijednostima Isv. Max. = 1 W / m2 ili pev. Max. = 20 Pa. Kada se percipira zvuk takvog intenziteta, osoba doživljava bol.

U području zvučnih pritisaka koji su znatno viši od standardnog praga sluha, veličina osjeta nije proporcionalna amplitudi zvučnog pritiska psc, već logaritmu omjera ps/ps0. Stoga se zvučni pritisak i intenzitet zvuka često izražavaju u logaritamskim jedinicama decibela (dB) u odnosu na standardni prag sluha.

Opseg promjene zvučnog pritiska od apsolutnog praga sluha do praga bola je za različite frekvencije od 90 dB do 130 dB.

Ako uho osobe istovremeno percipira dva ili više zvukova različite jačine, tada glasniji zvuk prigušuje (apsorbira) slabe zvukove. Dolazi do takozvanog maskiranja zvukova, a uho percipira samo jedan, jači zvuk. Neposredno nakon izlaganja uha glasnom zvuku, osjetljivost sluha na slabe zvukove je smanjena. Ova sposobnost se naziva adaptacija sluha.

Dakle, prag sluha u velikoj meri zavisi od okruženja za slušanje: u tišini ili u pozadini buke (ili drugog uznemirujućeg zvuka). U potonjem slučaju, prag sluha je povećan. Ovo ukazuje da smetnje maskiraju korisni signal.

Ljudski slušni aparat ima određenu inerciju: osjećaj pojave zvuka, kao i njegovog prestanka, ne javlja se odmah.

Audio signal je nasumičan proces. Njegove akustičke ili električne karakteristike se kontinuirano mijenjaju tokom vremena. Pokušaj praćenja nasumičnih promjena u realizaciji ovog haosa je vježba koja nema mnogo smisla. Njegovo Veličanstvo slučaj je moguće obuzdati, dati mu karakteristike determinizma, koristeći prosječne parametre, kao što je nivo audio signala.

Nivo audio signala karakteriše signal u određenom trenutku i predstavlja napon audio signala, izražen u decibelima, ispravljen i usrednjen u određenom prethodnom vremenskom periodu.

Pod dinamičkim opsegom audio signala podrazumijeva se omjer maksimalnog i minimalnog zvučnog pritiska ili odnos odgovarajućih napona. U takvoj definiciji nema informacija o tome koji se tlak i napon smatraju maksimalnim i minimalnim. Vjerojatno se zbog toga dinamički raspon signala koji je određen na ovaj način naziva teorijskim. Uz to, dinamički opseg audio signala može se eksperimentalno odrediti kao razlika između maksimalnog i minimalnog nivoa za dovoljno dug period. Ova vrijednost u suštini ovisi o odabranom vremenu mjerenja i vrsti mjerača nivoa.

Dinamički opsezi muzičkih i govornih akustičkih signala različitih tipova, mjereni instrumentima, u prosjeku su:

80 dB za simfonijski orkestar

45 dB za hor

35 dB za pop muziku i vokalne soliste

25 dB za govor zvučnika

Prilikom snimanja potrebno je podesiti nivoe. To se objašnjava činjenicom da originalni (neobrađeni) signali često imaju veliki dinamički raspon (na primjer, do 80 dB za simfonijsku muziku), a kod kuće se audio programi slušaju u rasponu od oko 40 dB.

Postoji nedostatak ručnog podešavanja nivoa. Vrijeme odziva tonskog inženjera je oko 2 sekunde, čak i ako mu je partitura kompozicije poznata unaprijed. To dovodi do greške u održavanju maksimalnih nivoa muzičkih programa do 4 dB u oba smjera.

Pojačala, akustični sistemi i ljudska uši moraju biti zaštićeni od preopterećenja uzrokovanih iznenadnim naglim promjenama amplitude audio signala – da bi se signal ograničio u amplitudi.

Dinamički opseg signala mora biti usklađen sa dinamičkim rasponima uređaja za snimanje, pojačanje, prijenos.

Da biste povećali domet FM radio stanica, dinamički opseg audio signala mora biti komprimiran. Da bi se smanjio nivo buke u pauzama, poželjno je povećati dinamički raspon.

Uostalom, moda, koja diktira svoje uvjete u svim sferama ljudske djelatnosti, uključujući i snimanje zvuka, zahtijeva bogat, gust zvuk moderne muzike, što se postiže oštrim sužavanjem njenog dinamičkog raspona.

Zvučni val (volumenski omotač) fragmenta opere S. Rahmanjinova "Aleko",

i savremena plesna muzika.

U klasičnoj muzici nijanse su važne; plesna muzika treba da bude "potentna".

To diktira potrebu za korištenjem uređaja za automatsku obradu nivoa signala.

Top srodni članci