Si të konfiguroni telefonat inteligjentë dhe PC. Portali informativ
  • në shtëpi
  • Siguria
  • Gama dinamike e shtigjeve audio dixhitale. Çfarë është diapazoni dinamik (DR) dhe si ndikon në cilësinë e zërit

Gama dinamike e shtigjeve audio dixhitale. Çfarë është diapazoni dinamik (DR) dhe si ndikon në cilësinë e zërit

VOLOGDIN E.I.

GAME DINAMIKE

SHTEGJA DIGJITALE AUDIO

Shënime leksioni

Shën Petersburg

Gama dinamike e tingujve dhe muzikës .............................................. ......................................................

Gama dinamike e fonogrameve .............................................. .................................................

Gama dinamike e shtegut të audios dixhitale.......................................... .................................

Zgjerimi i diapazonit dinamik duke përdorur teknologjinë Dithering .....

Zgjerimi dinamik i diapazonit me teknologjinë e formësimit të zhurmës

.......................................................................................................................................................

Bibliografia...................................................... ................................................ .. ...........

1. Gama dinamike e tingujve dhe muzikës

Një person dëgjon tinguj në një gamë jashtëzakonisht të gjerë të presioneve të zërit. Ky diapazon shtrihet nga pragu absolut i dëgjimit në një prag dhimbjeje prej 140 dB SPL në raport me nivelin zero, i cili merret si presion prej 0,00002 Pa (Fig. 1.). Zona e rrezikut në këtë figurë tregon zonën e presioneve të zërit, e cila, kur

Pragu absolut i dëgjimit

Frekuenca e tingujve tonalë, kHz

Oriz. 1. Fushat e dëgjimit të dëgjimit

ekspozimi i zgjatur mund të çojë në humbje të plotë të dëgjimit. Pragu i dhimbjes për tingujt tonale varet nga frekuenca; për tingujt me një spektër arbitrar, niveli i presionit prej 120 dB SPL merret si pragu i dhimbjes. Grafiku i pragut absolut të dëgjimit përshkruhet mjaft saktë nga barazia empirike

Në heshtje, ndjeshmëria e dëgjimit të një personi rritet, dhe në një atmosferë tingujsh të lartë zvogëlohet, dëgjimi përshtatet me mjedisin e zërit përreth, prandaj diapazoni dinamik i dëgjimit jo aq i madh - rreth 70..80 dB. Kufizohet nga lart nga një presion prej 100 dB SPL, dhe nga poshtë nga zhurma me një nivel prej -30 ... 35 dB SPL. Ky interval dinamik mund të zhvendoset lart e poshtë deri në 20 dB. Për perceptim komod të muzikës, rekomandohet që presioni i zërit të mos kalojë 104 dB SPL në shtëpi dhe 112 dB SPL në dhoma të pajisura posaçërisht.

Gama dinamike e muzikës përkufizohet si raporti në decibel i tingullit më të lartë (fortissimo) dhe tingullit më të qetë (pianissimo). Gama dinamike e muzikës simfonikeështë 65 ... 75 dB, dhe në koncertet e muzikës rock rritet

deri në 105 dB, ndërsa majat e presionit të zërit mund të arrijnë 122 ... 130 dB SPL.

Gama dinamike e interpretuesve vokale nuk kalon 35 ... 45 dB (Tabela 1).

Gama dinamike e muzikës varet ndjeshëm nga zgjedhja e maksimumit

Presioni i zërit P max, pasi është i kufizuar nga poshtë nga një prag absolut

dëgjueshmëria. Kjo varësi është më e theksuar në skajet e diapazonit audio.

Në fig. 2

jepen shembuj të ndryshimit të diapazonit dinamik të tingujve tonalë. NË

Pragu i dhimbjes 120dB

Pmax

80dB

DR 40 dB

50dB

80dB

50dB

Pragu Absolut

dëgjueshmëria

Frekuenca e tingujve tonalë, kHz

Oriz. 2. Gama dinamike e muzikës dhe pragjet e dëgjimit

në varësi të zgjedhjes së P max

dhe frekuencave tonale

dinamike

varg

80 dB reduktuar në skajet

diapazoni i zërit deri në 40

Kjo është arsyeja pse

është zakon të matet diapazoni dinamik i tingujve në një frekuencë prej 1 kHz, ku mundet

arrijnë 117 dB.

dhoma maskon tingullin dhe në këtë mënyrë zvogëlon diapazonin e tij dinamik

muzikë nga poshtë. Fig.3. tregohet si kur presioni i zërit reduktohet nga 120 në 80 dB

Gama dinamike e muzikës SPL për shkak të zhurmës së dhomës reduktohet nga 90 në 50 dB.

120dB SPL

DR 90 dB

Ndikimi

plotësisht

neglizhencë

vetem kur

90dB

90dB

niveli minimal i tingujve muzikorë.

70dB

Nivelet e zhurmës në studiot e regjistrimit

90dB

tejkalon

apartamente

50dB

bisedoni

rrit nivelin

zhurmë deri në 60dB SPL.

Kjo është arsyeja pse muzika e qetë shpesh mbytet

Zhurma në apartament

lokalet

audicionet

në mënyrë të pavullnetshme

lind

rrit

vëllimi.

Zhurma e kuantizimit është e bardhë

zhurmë, e dukshme nga veshi kur ajo

Zhurma në studio

intensiteti i ulët deri në 4 dB SPL, edhe kur

zhurma e përgjithshme e pajisjeve audio në dhomë

arrin

Oriz. 3. Gama dinamike e muzikës

duhet të peshohet kundrejt faktit se

Shkalla FS e një matësi dixhital të nivelit

korrespondojnë me një nivel midis 105 dhe 112 dB SPL. Prandaj, për

ambientet shtëpiake

diapazoni dinamik i muzikës nuk duhet të kalojë 101 - 108 dB.

Gama dinamike e mikrofonitështë përcaktuar në të njëjtën mënyrë siç bëhet zakonisht në shtigjet elektrike. Kufiri i sipërm është i kufizuar nga vlera e lejueshme e shtrembërimeve jolineare, dhe kufiri i poshtëm - nga niveli i zhurmës së brendshme. Mikrofonat moderne të studios lejojnë një presion maksimal të zërit prej 125 ... 145 dB SPL, ndërsa shtrembërimi jolinear nuk kalon 0,5% ... 3%. Niveli i zhurmës së mikrofonave është 15 ... 20 dBA, diapazoni dinamik është nga 90 në 112 dBA dhe raporti sinjal-zhurmë është 70-80 dBA. Këta mikrofona mbulojnë të gjithë gamën e dëgjimit të njeriut nga 120dB SPL deri në 20dB SPL nivelet e zhurmës në studio. Në studiot moderne, regjistrimi bëhet duke përdorur ADC 22 ose 24 bit, ndonjëherë përdoret kuantizimi me pikë lundruese, kështu që nuk ka probleme me diapazonin dinamik. Një pajisje e tillë është jashtëzakonisht e shtrenjtë.

2. Gama dinamike e fonogrameve

Sinjalet muzikore dhe të të folurit janë një sekuencë e pulseve zanore në rritje të shpejtë dhe më ngadalë të kalbjes (Fig. 4.). Ky sinjal karakterizohet rms dhe nivelet e pikut, diferenca ndërmjet këtyre niveleve quhet faktor kreshtë. Një valë katrore (valë katrore) ka një faktor kreshtë njësi prej 0 dB, një faktor kreshtë sinusoid prej 3 dB. Fonogramet e sinjaleve muzikore dhe të të folurit kanë një faktor kreshtë deri në 20 dB ose më shumë. Koha e përcaktimit Faktori i kreshtës lidhet me kohën e integrimit kur llogaritet vlera RMS e sinjalit dhe zakonisht është 50 ms.

Gama dinamike dhe faktori kreshtë i një fonogrami muzikor përcaktohen nga përpunimi statistikor i vlerave të menjëhershme të sinjaleve. Karakteristikat statistikore më të detajuara janë llogaritur në redaktorin audio Audition 3 (Fig. 4).

Fig.4. Fragmente fonogramesh fragmentesh muzikore me kohëzgjatje të ndryshme

Prej tyre, kryesoret janë këto: Amplituda e pikut (Lpic), Fuqia maksimale RMS (L max), Fuqia minimale RMS (L min) dhe Fuqia mesatare RMS (L avr) (nivelet e maksimumit,

fuqia e sinjalit minimal dhe mesatar RMS (efektive).

Gama dinamike e një fonogrami sipas kësaj tabele përcaktohet si

DR ml pic L min ,

faktori i kreshtës llogaritet me formulë

PF mL picL avr

Gama dinamike mund të përcaktohet edhe nga histogrami i shpërndarjes së niveleve të fonogramit, i paraqitur në Fig.5. Është i përshtatshëm për të kryer operacione të tilla shpejt para dhe pas përpunimit dinamik të një fonogrami.

Fig.4. Karakteristikat statistikore të fonogramit të muzikës së Bethoven "Elise"

Fig.5. Histogrami i shpërndarjes së muzikës së Bethoven "Elise"

në varësi të detyrës së studimit. Nëse, për shembull, diapazoni dinamik i vlerave të menjëhershme të niveleve të fonogramit është i rëndësishëm, atëherë koha e integrimit duhet të jetë 1-5 ms. Nëse diapazoni dinamik i muzikës matet duke marrë parasysh perceptimin dëgjimor, atëherë koha e integrimit zgjidhet të jetë 60 ms, kjo është konstanta kohore e dëgjimit.

ju lejon të përcaktoni diapazonin dinamik dhe faktorin e kreshtës me një probabilitet të caktuar në një kohë të zgjedhur integrimi. Redaktori i zërit Adobe Audition 3 përdor normalizimin e histogramit, në të cilin probabiliteti maksimal i ngjarjeve korrespondon gjithmonë me vlerën 100. Një histogram i tillë përshkruan shpërndarjen e probabilitetit të niveleve të sinjalit fonogram në lidhje me vlerën maksimale. Kur ndërtohet, shkalla përgjatë boshtit X zgjidhet automatikisht, kështu që është e vështirë të krahasohen histogramet e fonogrameve të ndryshëm.

Përdorimi praktik. Kush ka nevojë për informacion statistikor dhe një histogram të një kolone zanore dhe pse. Para së gjithash, këto të dhëna ofrojnë ndihmë të paçmuar në përpunimin dinamik të një fonogrami, pasi ato ju lejojnë të zgjidhni në mënyrë të arsyeshme karakteristikat e kompresorit dhe zgjeruesit. Rezultatet statistikore të përpunimit të fonogrameve me muzikë të zhanreve të ndryshme bëjnë të mundur përcaktimin e diapazonit të kërkuar dinamik të rrugës elektroakustike, formimin e kërkesave për fuqinë maksimale dhe mesatare të kokave të sistemit akustik. Ato luajnë një rol thelbësor në zhvillimin e algoritmeve të kompresimit të sinjalit audio.

Muzikë emocionale me një gamë të gjerë dinamike dhe kulm të lartë

faktori mund të dëgjohet vetëm në pajisje të shtrenjta me cilësi të lartë me të mirë

akustike

agregate.

kufje dhe në makina për shkak të zhurmës dinamike

15 diapazoni po zvogëlohet dhe ajo

thjesht e neveritshme.

Prandaj, regjistrime të tilla nuk janë në kërkesë të gjerë dhe,

në mënyrë të pashmangshme, çdo vit diapazoni dinamik dhe kulmi-

Fig.7. Kolona zanore e këngës "I'll Be There For You"

Oriz. 6. Faktori kreshtë për CD

fonogramet reduktohen qëllimisht nga prodhuesit (Fig. 6). Në CD moderne

disqet në shumicën e rasteve, diapazoni dinamik nuk kalon 20 dB, dhe faktori kreshtë është

pak më shumë se 3 dB, që është mjaft e mjaftueshme për muzikë kërcimi. Në Fig.7. dhënë

foto e një kolone zanore moderne nga një CD.

3. Gama dinamike e shtegut audio dixhitale

Rruga dixhitale konvencionale

përfshin ADC dhe DAC.

E para realizon

kuantizimi i sinjaleve analoge dhe shndërrimi i tyre në një rrymë dixhitale. Së dyti

kryen shndërrimin e anasjelltë të një rryme dixhitale në një sinjal analog.

Kuantizimi

rrumbullakimi

sekuencat e mostrës

në binar të plotë

vlerat. Me modulimin e kodit të pulsit (PCM), kjo

operacion

kryera

lineare

kuantizues, i quajtur në literaturën teknike Mid-

filli. Në

atij pajisje

ka formën

"shkallë" me të njëjtat hapa

detyrimisht,

një numër tek i niveleve të kuantizimit. rrumbullakimi

të dhëna dixhitale në këtë kuantizues të prodhuara

më i afërt

vlera binare (fig. 8).

Ky algoritëm

quajtur rrumbullakim.

algoritmi

ditë pushimi

kuantizues

është simetrik në lidhje me boshtin e kohës dhe kuantizimin

Oriz. 8. Ingranazhet

kryhet me një prag të barabartë me

0.5 hapa kuantizimi

funksionet e kuantizuesit

Për sa kohë që sinjali hyrës është më i vogël se ky prag, dalja

Mid-Tread dhe Mid-Riser

sinjali kuantizues është zero, që do të thotë se

kuantizimi kryhet me një ndërprerje qendrore.

sinjali hyrës pak mbi pragun e kuantizimit, sinjali i daljes ka formën

një sekuencë pulsesh me një cikël funksioni në varësi

nga niveli

një rritje e mëtejshme në nivelin e SL formon një sinjal dalës të një forme të shkallëzuar.

Rrumbullakimi i të dhënave dixhitale në kuantizuesin Mid-Riser kryhet në vlerën më të vogël më të afërt (Fig. 8), kështu që ky algoritëm zakonisht quhet shkurtues. Kuantizuesi Mid-Riser ndryshon në atë që nuk ka një prag kuantizimi, kështu që transmeton sinjale audio në nivele shumë të ulëta, madje edhe nën nivelin

zhurma. Sidoqoftë, në mungesë të ZS, çdo zhurmë e parëndësishme gjeneron në dalje një sekuencë impulsesh të rastësishme me një amplitudë prej 1 kuantike, që do të thotë se një kuantizues i tillë përforcon zhurmën.

Gama dinamike ADC me kuantizuesin e shkallës së mesme përcaktohet përmes logaritmit të raportit të vlerave maksimale dhe minimale të sinjalit sinusoidal në hyrje të kuantizuesit

DR A maksimumi 20 logA,

Amin

Q 2 (q 1), A

Q është hapi i kuantizimit, q është numri i shifrave. Kjo është arsyeja pse

DRA

Q 2 (q 1)

) 6,02q (1)

P/2

Në q = 8 ky interval dinamik është 48 dB, dhe në q = 16 rritet në 96 dB. Vlera e DR A përcakton kufirin e poshtëm të diapazonit dinamik për nivelin e sinjaleve hyrëse të kuantizuesit të tipit Mid-Tread.

Gama dinamike DAC matur në përputhje me rekomandimet e EIAJ për sa i përket raportit të vlerës maksimale RMS të sinjalit

forma sinusoidale A max në daljen e saj ndaj vlerës rms të zhurmës së kuantizimit, e matur në brezin nga 0 në frekuencën Nyquist F N

Amax

Q 2 (q 1)

Amax

q 1,76;q

Për q = 16

DR R = 98 dB, e cila

decibel

diapazoni dinamik

kuantizues i përcaktuar me formulën (1). Gama dinamike e DAC e matur në këtë mënyrë identifikohet me vlerën e saj SNR.

Nëse diapazoni i sipërm i frekuencës është i kufizuar nga vlera F max F N , atëherë formula e llogaritjes për SNR dhe DR R bëhet

SNR R DR R 6.02q 1.76 10log

2 Fmax

ku f s - frekuenca e kampionimit, F max - frekuenca maksimale e diapazonit audio. Në

f s = 44,1 kHz dhe F max = 20 kHz dhe SNR R =DR R = 98,5 dB. Siç mund ta shihni, raporti sinjal-zhurmë është vetëm 2 dB më shumë se diapazoni dinamik. Duhet të theksohet se vlera e SNR varet nga frekuencat f s dhe F max, ndërsa DR nuk varet nga këto parametra.

Megjithatë, shumica e botimeve teknike barazojnë diapazonin dinamik me raportin sinjal-zhurmë. Kjo konfirmohet nga të dy AES 17 dhe

IEC 61606.

Standardi IEC 61606 rekomandon matjen e SNR dhe DR kur një sinjal sinusoidal me një frekuencë 997 Hz dhe një nivel minus 60 dB FS aplikohet në hyrjen ADC, me përdorimin e detyrueshëm të teknologjisë TPDF Dithering. Në këtë rast, raporti i llogaritur për SNR për shkak të zhurmës shtesë të futur propozohet në formën

SNR T DR T 6.02q 3.01 10log

2 Fmax

Në kushtet e mëparshme, DR = SNR = 93.7 dB, jo 96 dB, siç gjendet shpesh në literaturën teknike. Rrjedhimisht, diapazoni dinamik i llogaritur gjithashtu zvogëlohet. Në vend të SNR, shpesh përdoret reciproku i tij, i cili përcakton nivelin integral të zhurmës së kuantizimit

L nTSNR T.

Në përputhje me standardin IEC 61606, matja e diapazonit dinamik DR R bëhet në përputhje me skemën e paraqitur në Fig. 9. Në këtë skemë, testi

Fig..9. Qarku i matjes së diapazonit dinamik DAC

një sinjal dixhital me një frekuencë prej 1 kHz dhe një nivel minus 60 dB, i formuar duke përdorur teknologjinë TPDF Dithering, futet në hyrjen DAC. Sinjali analog nga DAC futet në një filtër me kalim të ulët me një frekuencë ndërprerëse prej 20 kHz, e cila kufizon spektrin e zhurmës së kuantizimit. Më pas, filtrimi kryhet duke përdorur një filtër peshimi të tipit A, i cili merr parasysh veçoritë e perceptimit dëgjimor të zhurmës së kuantizimit, i cili rrit diapazonin dinamik me 2-3 dB. Sinjali i provës dhe zhurma përforcohen me 60 dB dhe futen në një matës të nivelit THD+N. Në këtë matës, sinjali i tonit shtypet nga një filtër notch dhe niveli i zhurmës matet në decibel me një voltmetër RMS. Ky nivel i matur i zhurmës identifikohet, me shenjën e kundërt, me diapazonin dinamik të DAC.

Kur kuantizohen sinjalet e nivelit minimal, ndodhin shtrembërime të mëdha, duke arritur në 100% (Fig. 10). Në këtë drejtim, në praktikë, duhet të udhëhiqet nga diapazoni real dinamik ADC. Gjatë përcaktimit të këtij diapazoni, është e nevojshme të merren parasysh: faktori kreshtë i sinjaleve muzikore, duke arritur në 12 ... parandalon mbingarkimin aksidental.

Si rezultat, diapazoni real dinamik

regjistrimi ADC PCM 16-bitësh

nuk i kalon 48…54 dB. Kjo

as aq afër për mirë

studio

regjistrime zanore.

kontroll automatik i nivelit

ndodh kur digjen CD,

diapazoni mund të zgjerohet deri në 74

16 bit, 1000 Hz, 93 dB

bie në sy

përkeqësimi

cilësia e zërit të sinjaleve të nivelit të ulët.

Fig.10. Sekuenca e mostrave është shtrembëruar

Dhoma e kokës sipër

forma valore sinusoidale

mbron nga mundësia e mbingarkesës,

tejkalojnë

vlera e pritur. Kur regjistroni muzikë kërcimi, mjafton një hapësirë ​​prej 6 dB.

Kur regjistroni muzikë simfonike, ndonjëherë duhet të keni një diferencë deri në 20 ... 30 dB. Diferenca e diapazonit dinamik në fund parandalon mundësinë që kalimet e qeta të jenë nën nivelin e zhurmës dhe, për më tepër, nën pragun e dëgjueshmërisë.

Në shtigjet dixhitale kufiri i sipërm i diapazonit dinamik i kufizuar në nivelin e sinjalit 0 dB FS . Pa përdorimin e teknologjisë Shkelja e kufirit të poshtëm të diapazonit dinamik kufizuar nga niveli

LA1/DRA.

Me q = 8 bit, është e barabartë me minus 48 dB, dhe me q = 16 bit, është minus 96 dB. Zhurma e pashmangshme e rrugës e rrit këtë nivel.

Niveli i integruar i zhurmës minus 93,7 dB është shumë ose pak. Është e rëndësishme se sa e kalon ky nivel pragun e dëgjueshmërisë. Zhurma e zhurmës

Fig.11. Pragjet e dëgjueshmërisë për zhurmën e kuantizimit në varësi të numrit të biteve

kuantizimi bëhet zhurmë e bardhë, pragu i dëgjimit është 4 dB SPL. Kjo do të thotë që afër 3 kHz, zhurma e kuantizimit në q = 16 bit do të tejkalojë pragun e dëgjimit me 22,3 dB (Fig. 11). Siç mund ta shihni nga kjo figurë, kërkohet kuantizimi 20-bit në mënyrë që zhurma e kuantizimit të jetë e padëgjueshme.

4. Zgjerimi i diapazonit dinamik duke përdorur teknologjinë Dithering

Për të zgjeruar gamën dinamike Rruga PCM me lloj kuantizuesi MeadTread pa rritur numrin e shifrave dhe frekuencën e kampionimit, shumë

sinjale analoge, një sasi e vogël zhurme analoge i shtohet ES. Më shpesh kjo teknologji përdoret për rikuantizimi i AP-ve dixhitale kur prodhohet

bëhet me 24 bit, dhe pastaj rikuantizohet, zakonisht në 16 bit, siç është zakon në standardin CD. Në të njëjtën kohë, cilësia e një CD të tillë për sa i përket zhurmës korrespondon me një regjistrim 20-bit.

Në procesin e rikuantizimit, më shpesh përdoret operacioni i shkurtimit, në të cilin pjesët më pak të rëndësishme të fjalëve të kodit thjesht hidhen poshtë. Në këtë rast, sinjali i daljes

Përpunimi dinamik i audios në PC

(c) Yuri Petelin
http://www.petelin.ru/

Në një artikull të mëparshëm, fola për mjetet softuerike për heqjen e zhurmës dhe shtrembërimit të zërit, duke përfshirë renditjen e operacioneve të "pastrimit të zërit" që duhet të bëhen me regjistrimin e një kënge, duke filluar me korrigjimin e gabimeve në instalimin e mikrofonit dhe duke përfunduar me mastering , interpretuar në mënyrë që një grup këngësh, të regjistruara në një disk, nga pikëpamja estetike, ishte një tërësi e vetme. Kjo temë është aq serioze sa ia vlen t'i kushtojmë disa artikuj të ardhshëm.

Do të filloj, si herën e kaluar, me tezën kryesore: tingulli i regjistruar nga një amator në një studio kompjuteri në shtëpi, megjithëse, natyrisht, nuk mund të krahasohet në cilësi me rezultatet e studiove profesionale, por mund të jetë afër tyre.

Shkruaj dhe me cep të veshit dëgjoj se çfarë mërmëriti televizori atje. Ja një film i rekomanduar në njoftim si “super projekt”. Car Pjetri po vdes, duke luftuar për fronin. Pasionet janë ndezur... Nëpër kanale të tjera, hetuesi Turetsky kërkon toma të rralla të vjedhura, njohësit kanë tronditur kohët e vjetra dhe po kryejnë përsëri hetimin e tyre, sepse, siç rezulton, "dikush këtu dhe atje ndonjëherë nuk dëshiron të jetojë me ndershmëri. “... Histori kaq të ndryshme por kanë diçka të përbashkët. Kjo është e zakonshme - tingulli. Tingull i keq. Tingull i tmerrshëm i regjistruar nga profesionistë në studio profesionale. Sidomos në "superprojektin": kur rënkimet e carit që po vdes dhe klithmat e të afërmve të tij qetësohen për një moment, tingujt e sfondit dalin qartë, madje mund të dëgjoni se si funksionojnë mekanizmat e kasetës së kamerave.

Konkluzionet e mëposhtme dalin:

1. Është e qartë se në vendin tonë filmat nuk dublohen prej kohësh në studio zanore. Ndoshta nuk ka para për të. Mënyra se si tingulli regjistrohet në grup është mënyra se si ai futet në kasetën e redaktuar.

2. Disa profesionistë nuk përdorin reduktimin e zhurmës së kompjuterit. Nuk është shumë e qartë pse. Nuk dini për to? Nuk ka kohë për të lexuar literaturë të veçantë? Por edhe informacioni elementar që gjendet në pesë faqet e artikullit tim të mëparshëm do të mjaftonte për fillim.

3. Disa nga njerëzit që regjistrojnë tinguj për filma televizivë nuk dinë të përdorin dinamikën.

Tani do të flasim për përpunimin dinamik. Kjo temë është komplekse, por nëse fokusoheni, patjetër do të kuptoni gjithçka dhe tingulli në projektet tuaja do të bëhet profesional. Epo, jo profesionale, por amatore, por të tilla që të gjithë do t'i dëgjojnë. Për ata që dyshojnë, propozoj të vlerësojnë punën e lexuesve të regjistruar në diskun që shoqëron librin e ri "Sonar. Sekretet e Mjeshtërisë". Nga rruga, asgjë nuk ju pengon të provoni dorën tuaj. Përbërja juaj mund të jetë në koleksionin muzikor në diskun tjetër të tillë.



Pra, përpunim dinamik. Formalisht, konsiston në ndryshimin e diapazonit dinamik të sinjaleve audio. Por, për ta përdorur atë për të mirën e cilësisë së zërit të kësaj fraze, nuk mjafton qartë. Prandaj, le të fillojmë nga fillimi.

Niveli i audios dhe diapazoni dinamik

Burimi i dridhjeve të zërit rrezaton energji në hapësirën përreth. Sasia e energjisë së zërit që kalon në sekondë në një sipërfaqe prej 1 m2, e vendosur pingul me drejtimin e përhapjes së dridhjeve të zërit, quhet intensiteti (forca) e zërit.

Kur kemi një bisedë normale, rrjedha e fuqisë së energjisë është afërsisht 10 mikrovat. Fuqia e tingujve më të lartë të violinës mund të jetë 60 mikrovat, dhe fuqia e tingujve të organeve është nga 140 në 3200 mikrovat.

Një person dëgjon tinguj në një gamë jashtëzakonisht të gjerë të presioneve (intensiteteve) të zërit. Një nga vlerat e referencës së këtij diapazoni është pragu standard i dëgjimit - vlera efektive e presionit të zërit të krijuar nga një dridhje harmonike e zërit të një frekuence prej 1000 Hz, mezi e dëgjueshme për një person me ndjeshmëri mesatare të dëgjimit.

Pragu i dëgjimit korrespondon me intensitetin e zërit Iv0 = 10-12 W/m2 ose presionin e zërit psv0 = 2×10-5 Pa.

Kufiri i sipërm përcaktohet nga vlerat e Iv. Maks. = 1 W/m2 ose psv. Maks. = 20 Pa. Kur perceptohet një tingull i një intensiteti të tillë, një person përjeton dhimbje.

Në zonën e presioneve të zërit që tejkalojnë ndjeshëm pragun standard të dëgjimit, madhësia e ndjesisë nuk është proporcionale me amplituda e presionit të zërit psv, por me logaritmin e raportit psv / psv0. Prandaj, presioni i zërit dhe intensiteti i zërit maten shpesh në njësi logaritmike decibel (dB) në raport me pragun standard të dëgjimit.

Gama e ndryshimit të presionit të zërit nga pragu absolut i dëgjimit në pragun e dhimbjes është për frekuenca të ndryshme nga 90 dB në 130 dB.

Nëse veshi i njeriut percepton njëkohësisht dy ose më shumë tinguj me zë të lartë të ndryshëm, atëherë një tingull më i fortë mbyt (thith) tinguj të dobët. Ekziston një i ashtuquajtur maskim i tingujve, dhe veshi percepton vetëm një tingull, më të fortë. Menjëherë pas ekspozimit ndaj një tingulli të lartë, ndjeshmëria e dëgjimit ndaj tingujve të dobët zvogëlohet. Kjo aftësi quhet përshtatje e dëgjimit.

Kështu, pragu i dëgjueshmërisë varet kryesisht nga kushtet e dëgjimit: në heshtje ose në sfondin e zhurmës (ose tingujve të tjerë shqetësues). Në rastin e fundit, pragu i dëgjimit rritet. Kjo tregon që ndërhyrja maskon sinjalin e dobishëm.

Aparati i dëgjimit të njeriut ka një inerci të caktuar: ndjesia e shfaqjes së një zëri, si dhe ndërprerja e tij, nuk shfaqen menjëherë.

Sinjali audio është një proces i rastësishëm. Karakteristikat e tij akustike ose elektrike ndryshojnë vazhdimisht me kalimin e kohës. Përpjekja për të mbajtur gjurmët e ndryshimeve të rastësishme në zbatimin e këtij kaosi është një ushtrim që nuk ka shumë kuptim. Është e mundur të frenohet rasti madhështisë së tij, t'i jepet tiparet e determinizmit, duke përdorur parametra mesatarë, siç është niveli i sinjalit audio.

Niveli i sinjalit audio karakterizon sinjalin në një moment të caktuar dhe shprehet në decibel, korrigjohet dhe mesatarizohet gjatë një periudhe të caktuar kohore të mëparshme, tensioni i sinjalit audio.

Gama dinamike e një sinjali audio kuptohet si raporti i presionit maksimal të zërit me minimumin ose raporti i tensioneve përkatëse. Në këtë përkufizim, nuk ka informacion se çfarë presioni dhe stresi konsiderohen maksimale dhe minimale. Kjo është ndoshta arsyeja pse diapazoni dinamik i sinjalit të përcaktuar në këtë mënyrë quhet teorik. Së bashku me këtë, diapazoni dinamik i një sinjali audio mund të përcaktohet gjithashtu eksperimentalisht si diferenca midis niveleve maksimale dhe minimale për një periudhë mjaft të gjatë. Kjo vlerë varet shumë nga koha e zgjedhur e matjes dhe lloji i njehsorit të nivelit.

Gama dinamike e sinjaleve akustike muzikore dhe të të folurit të llojeve të ndryshme, të matura duke përdorur instrumente, mesatare:

80 dB për orkestër simfonike

45 dB për kor

35 dB për muzikën pop dhe solistë vokalë

25 dB për fjalimin e folësit

Gjatë regjistrimit, nivelet duhet të rregullohen. Kjo shpjegohet me faktin se sinjalet origjinale (të papërpunuara) shpesh kanë një gamë të madhe dinamike (për shembull, deri në 80 dB për muzikën simfonike), dhe në shtëpi, programet audio dëgjohen në intervalin prej rreth 40 dB.

Ka një disavantazh për rregullimin manual të niveleve. Koha e reagimit të inxhinierit të zërit është rreth 2 s, edhe nëse rezultati i përbërjes i dihet paraprakisht. Kjo çon në një gabim në ruajtjen e niveleve maksimale të programeve muzikore deri në 4 dB në të dy drejtimet.

Përforcuesit, sistemet akustike dhe madje edhe veshët e njeriut duhet të mbrohen nga mbingarkesat e shkaktuara nga kërcimet e papritura në amplituda e sinjalit audio - për të kufizuar sinjalin në amplitudë.

Gama dinamike e sinjalit duhet të koordinohet me diapazonin dinamik të pajisjeve të regjistrimit, amplifikimit dhe transmetimit.

Për të rritur gamën e stacioneve të radios FM, diapazoni dinamik i sinjalit audio duhet të kompresohet. Për të zvogëluar nivelin e zhurmës në pauza, është e dëshirueshme të rritet diapazoni dinamik.

Në fund të fundit, moda, e cila dikton kushtet e saj në të gjitha sferat e veprimtarisë njerëzore, përfshirë regjistrimin e zërit, kërkon një tingull të pasur, të dendur të muzikës moderne, i cili arrihet nga një ngushtim i mprehtë i diapazonit të saj dinamik.

Vala zanore (zarfi i zërit) i një fragmenti të operës "Aleko" të S. Rachmaninov,

dhe muzikë bashkëkohore kërcimi.

Në muzikën klasike nuancat janë të rëndësishme, muzika e kërcimit duhet të jetë “e fuqishme”.

Kjo dikton nevojën e përdorimit të pajisjeve për përpunimin automatik të niveleve të sinjalit.

Pajisjet dinamike

Pajisjet për përpunimin automatik të niveleve të sinjalit mund të klasifikohen sipas një sërë kriteresh, ndër të cilat më të rëndësishmet janë inercia e reagimit dhe funksioni i kryer.

Sipas kriterit të inercisë së përgjigjes, ekzistojnë kontrollues të nivelit automatik jo-inercial (veprim i menjëhershëm) dhe inercial (me një koeficient të ndryshueshëm transmetimi):

Kur niveli i sinjalit tejkalon vlerën nominale në hyrjen e autorregullatorit pa inerci, dalja është trapezoidale në vend të një sinjali sinusoidal. Megjithëse rregullatorët automatikë me funksionim të lirë janë të thjeshtë, përdorimi i tyre çon në shtrembërime të forta.

Inerciali është një kontroll i tillë automatik i nivelit, në të cilin koeficienti i transmetimit ndryshon automatikisht në varësi të nivelit të sinjalit në hyrje. Këta autonivelues shtrembërojnë formën e valës vetëm për një kohë të vogël. Duke zgjedhur kohën optimale të përgjigjes, shtrembërime të tilla mund të bëhen vështirë të perceptueshme nga veshi.

Në varësi të funksioneve të kryera, kontrollorët e nivelit automatik inercial ndahen në:

Kuazi Kufizues të Pikut

Stabilizuesit e nivelit

Kompresorë me rreze dinamike

Zgjerues dinamik të gamës

Kompander squelch

Portat e zhurmës (portat)

Pajisjet me konvertim kompleks të diapazonit dinamik

Karakteristika kryesore e pajisjes së përpunimit të dinamikës është karakteristika e amplitudës - varësia e nivelit të sinjalit të daljes nga niveli i sinjalit në hyrje.

Kufizuesi i nivelit (kufizuesi) është një autorregullator, në të cilin koeficienti i transmetimit ndryshon në mënyrë që kur sinjali hyrës tejkalon nivelin nominal, nivelet e sinjalit në daljen e tij mbeten praktikisht konstante, afër vlerës nominale. Me sinjale hyrëse që nuk e kalojnë vlerën nominale, kufizuesi i nivelit funksionon si një përforcues normal linear. Kufizuesi duhet t'i përgjigjet menjëherë ndryshimeve të nivelit.


Përgjigja e amplitudës kufizuese

Stabilizuesi i nivelit automatik është krijuar për të stabilizuar nivelet e sinjalit. Kjo mund të jetë e nevojshme për të barazuar volumin e tingullit të fragmenteve individuale të fonogramit. Parimi i funksionimit të autostabilizuesit është i ngjashëm me parimin e funksionimit të kufizuesit. Dallimi është se voltazhi i vlerësuar i daljes i stabilizatorit automatik është afërsisht 5 dB më pak se niveli i vlerësuar i daljes së kufizuesit.

Një kompresor është një pajisje fitimi i të cilit rritet me uljen e nivelit të sinjalit të hyrjes. Veprimi i kompresorit çon në një rritje të fuqisë mesatare dhe, rrjedhimisht, në vëllimin e zërit të sinjalit të përpunuar, si dhe në ngjeshjen e diapazonit të tij dinamik.


Karakteristika e amplitudës së kompresorit

Zgjeruesi ka një karakteristikë amplitudë të kundërt me kompresorin. Përdoret kur është e nevojshme të rivendoset diapazoni dinamik i konvertuar nga kompresori.


Karakteristikë e amplitudës së zgjeruesit

Një kompander është një sistem i përbërë nga një kompresor dhe një zgjerues të lidhur në seri. Përdoret për të reduktuar nivelin e zhurmës në rrugët e regjistrimit ose transmetimit të sinjaleve audio.

Threshold squelch (porta) është një auto-rregullator, në të cilin fitimi ndryshohet në mënyrë që kur nivelet e sinjalit të hyrjes janë më të vogla se pragu, amplituda e sinjalit të daljes është afër zeros. Për sinjalet hyrëse mbi pragun, squelch funksionon si një përforcues linear konvencional.

Auto-rregullatorët për konvertimin kompleks të diapazonit dinamik, kanë kanale të shumta kontrolli. Për shembull, një kombinim i një kufizuesi, një stabilizuesi automatik, një zgjerues dhe një shtypës i zhurmës së pragut ju lejon të stabilizoni volumin e zërit të fragmenteve të ndryshme të një përbërjeje, të ruani nivelet maksimale të sinjalit dhe të shtypni zhurmën në pauza.

Struktura e pajisjeve të përpunimit të dinamikës

Kontrolluesi i nivelit inercial ka një kanal kryesor dhe një kanal kontrolli. Nëse sinjali futet në kanalin e kontrollit nga hyrja e kanalit kryesor, kemi të bëjmë me rregullim të drejtpërdrejtë, dhe nëse nga dalja - me të kundërt.

Kanali kryesor në një qark të kontrollit të drejtpërdrejtë përfshin përforcues audio, një linjë vonese dhe një element të rregullueshëm. Ky i fundit, nën ndikimin e një tensioni kontrolli, është në gjendje të ndryshojë koeficientin e tij të transmetimit. Kanali kryesor në qark me rregullim të kundërt përmban të gjithë elementët e listuar me përjashtim të linjës së vonesës.

Elementët thelbësorë të rëndësishëm të kanalit të kontrollit janë detektori dhe qarku integrues (zbutës). Për sa kohë që voltazhi në hyrje të qarkut nuk e kalon pragun (referencën), kanali i kontrollit nuk gjeneron një sinjal kontrolli dhe koeficienti i transmetimit të elementit të rregulluar nuk ndryshon. Kur tejkalohet pragu, detektori gjeneron një tension pulsues proporcional me diferencën midis vlerës së sinjalit aktual dhe tensionit të referencës. Qarku integrues mesatarizon tensionin e diferencës dhe gjeneron një tension kontrolli proporcional me nivelin e sinjalit në hyrjen e kanalit të kontrollit.

Linja e vonesës e pranishme në kanalin kryesor të qarkut të kontrollit të drejtpërdrejtë lejon që kanali i kontrollit të punojë me disa plumba. Një rritje e nivelit të sinjalit do të zbulohet nga ai përpara se sinjali të arrijë elementin e rregullueshëm. Prandaj, ekziston një mundësi thelbësore për të eliminuar kalimet e padëshiruara. Dallimet në nivele mund të trajtohen pothuajse në mënyrë të përsosur. Megjithatë, përgjigja fazore e një linje vonese analoge nuk është lineare. Dallimi në zhvendosjet fazore për komponentë të ndryshëm spektralë të sinjalit çon në shtrembërim të formës së sinjalit të brezit të gjerë kur kalon përmes linjës së vonesës. Linjat e vonesës dixhitale nuk e kanë këtë pengesë, por për t'i përdorur ato duhet fillimisht të digjitalizohet sinjali. Në pajisjet e përpunimit virtual, sinjali përpunohet në mënyrë dixhitale dhe nuk ka probleme me zbatimin algoritmik të elementeve funksionale.

Të gjitha të drejtat në këtë dokument i përkasin autorit. Riprodhimi i këtij teksti ose i një pjese të tij lejohet vetëm me lejen me shkrim të autorit.

Bit, herc... Çfarë fshihet pas këtyre koncepteve? Gjatë zhvillimit të standardit të diskut kompakt audio, u morën vlera 44 kHz, 16 pak. Pse pikërisht kaq shumë? Cila është arsyeja e zgjedhjes, si dhe pse po bëhen përpjekje për të rritur këto vlera, të themi, në 96 kHz dhe 24 apo edhe 32 bit...

Le të merremi së pari me zgjidhjen e kampionimit - domethënë me thellësinë e bitit. Thjesht ndodh që ju duhet të zgjidhni midis numrave 16, 24 dhe 32. Vlerat e ndërmjetme, natyrisht, do të ishin më të përshtatshme për sa i përket zërit, por shume e pakëndshme për përdorim në teknologjinë dixhitale.

Për çfarë është përgjegjës ky parametër? Me pak fjalë - për diapazonin dinamik. Gama e vëllimeve të riprodhuara njëkohësisht është nga amplituda maksimale (0 dB) deri në amplituda më e vogël që lejon rezolucioni, për shembull, afërsisht -93 dB për audio 16-bit. Mjaft e çuditshme, kjo lidhet fort me nivelin e zhurmës së fonogramit. Në parim, për shembull, audio 16-bit, është mjaft e mundur të transmetohen sinjale me një fuqi prej -120 dB, megjithatë, këto sinjale do të jenë të vështira për t'u zbatuar në praktikë për shkak të një koncepti të tillë themelor si zhurma e kampionimit. Fakti është se kur marrim vlera dixhitale, gabojmë gjatë gjithë kohës, duke rrumbullakosur vlerën reale analoge në vlerën dixhitale më të afërt të mundshme. Gabimi më i vogël i mundshëm është zero, por gabimi maksimal është gjysma e shifrës së fundit (bit, më tej termi LSB do të shkurtohet në MB). Ky gabim na jep të ashtuquajturën zhurmë kampionimi - një mospërputhje e rastësishme midis sinjalit të dixhitalizuar dhe origjinalit. Kjo zhurmë është e përhershme dhe ka një amplitudë maksimale prej 0,5 MB. Kjo mund të konsiderohet si vlera të rastësishme të përziera në një sinjal dixhital. Kjo nganjëherë quhet zhurmë rrumbullakimi ose kuantizimi.

Le të ndalemi më në detaje se çfarë nënkuptohet me fuqinë e sinjalit, e matur në bit. Sinjali më i fortë në përpunimin dixhital të tingullit zakonisht merret si 0 dB, që korrespondon me të gjitha bitet e vendosura në 1. Nëse biti më domethënës (në tekstin e mëtejmë si SB) vendoset në zero, vlera dixhitale që rezulton do të jetë gjysma e më shumë. që korrespondon me një humbje të nivelit prej 6 dB. Asnjë bit përveç SB nuk mund të arrijë një nivel më të lartë se -6 dB. Prandaj, biti më domethënës është, si të thuash, përgjegjës për praninë e një niveli sinjali nga -6 në 0 dB, kështu që SB është një bit 0 dB. Biti i mëparshëm është përgjegjës për nivelin -6 dB, dhe biti më i ulët, pra, për nivelin (numri_bit-1) * 6 dB. Në rastin e audios 16 bit, MB korrespondon me një nivel prej -90 dB. Kur themi 0,5 MB, nuk nënkuptojmë -90/2, por gjysmë hapi në bitin tjetër - pra, 3 dB të tjera më të ulëta, -93 dB.

I kthehemi zgjedhjes së rezolucionit të dixhitalizimit. Siç është përmendur tashmë, dixhitalizimi prezanton zhurmë në nivelin 0.5 MB, që do të thotë se një rekord dixhitalizohet në 16 bit duke bërë vazhdimisht zhurmë në -93 dB. Mund të transmetojë sinjale edhe më të qetë, por zhurma mbetet ende në -93 dB. Mbi këtë bazë, përcaktohet diapazoni dinamik i tingullit dixhital - ku raporti sinjal-zhurmë shndërrohet në zhurmë / sinjal (ka më shumë zhurmë sesa sinjali i dobishëm), ndodhet kufiri i poshtëm i këtij diapazoni. Në këtë mënyrë, kryesore kriteri i dixhitalizimit - sa zhurmë a mund të përballojmë një sinjal të rivendosur? Përgjigja për këtë pyetje varet pjesërisht nga sa zhurmë kishte në regjistrimin origjinal. Një hap i rëndësishëm është se nëse jemi duke dixhitalizuar diçka me zhurmë -80 dB - nuk ka absolutisht asnjë arsye për ta dixhitalizuar atë me më shumë se 16 bit pasi, nga njëra anë, zhurma -93 dB i shton shumë pak zhurmës tashmë të madhe (krahasisht) Zhurma -80 dB, dhe nga ana tjetër - më e qetë se -80 dB në vetë fonogram, zhurma / sinjali tashmë fillon, dhe thjesht nuk është e nevojshme të digjitalizohet dhe transmetohet një sinjal i tillë.

Teorikisht, ky është kriteri i vetëm për zgjedhjen e rezolucionit të dixhitalizimit. Më shumë ne mos kontribuoni absolutisht asnjë shtrembërim apo pasaktësi. Praktika, mjaft e çuditshme, pothuajse plotësisht përsërit teorinë. Kjo është ajo që udhëhoqi ata njerëz që zgjodhën rezolucionin 16-bit për CD audio. Zhurma -93 dB është një gjendje mjaft e mirë, e cila pothuajse saktësisht korrespondon me kushtet e perceptimit tonë: ndryshimi midis pragut të dhimbjes (140 dB) dhe zhurmës së zakonshme të sfondit në qytet (30-50 dB) është vetëm rreth njëqind. dB, dhe duke pasur parasysh se në një nivel volumi të dhimbshëm, ata nuk dëgjojnë muzikë - gjë që e ngushton diapazonin edhe më shumë - rezulton se zhurma e vërtetë e dhomës apo edhe e pajisjes është shumë më e fortë se zhurma e marrjes së mostrave. Nëse mund të dëgjojmë një nivel nën -90 dB në një regjistrim dixhital, do të dëgjojmë dhe perceptojmë zhurmën e kampionimit, përndryshe thjesht nuk do të përcaktojmë kurrë nëse kjo audio është e dixhitalizuar apo e drejtpërdrejtë. Thjesht nuk ka asnjë ndryshim tjetër për sa i përket diapazonit dinamik. Por në parim, një person mund të dëgjojë kuptimisht në rangun 120 dB dhe do të ishte mirë të ruhej i gjithë diapazoni, të cilin 16 bit duket se nuk mund ta përballojnë.

Por kjo është vetëm në shikim të parë: me ndihmën e një teknike të veçantë të quajtur dithering në formë, mund të ndryshoni spektrin e frekuencës së zhurmës së marrjes së mostrave, pothuajse plotësisht t'i zhvendosni ato në rajonin prej më shumë se 7-15 kHz. Duket se po ndryshojmë rezolucionin e frekuencës (duke refuzuar të riprodhojmë frekuenca të larta të qeta) për një gamë dinamike shtesë në diapazonin e mbetur të frekuencës. Në kombinim me veçoritë e dëgjimit tonë - ndjeshmëria jonë ndaj rajonit me frekuencë të lartë është dhjetëra dB më e ulët se në rajonin kryesor (2-4 kHz) - kjo bën të mundur transmetimin relativisht pa zhurmë të sinjaleve të dobishme, një shtesë shtesë. 10-20 dB më e qetë se -93 dB - kështu, diapazoni dinamik i audios 16-bit për një person është rreth 110 dB. Dhe në përgjithësi - në të njëjtën kohë, një person thjesht nuk mund të dëgjojë tinguj 110 dB më të qetë se tingulli i lartë që sapo është dëgjuar. Veshi, si syri, përshtatet me zërin e realitetit përreth, kështu që diapazoni i njëkohshëm i dëgjimit tonë është relativisht i vogël - rreth 80 dB. Le të flasim për dithing në më shumë detaje pasi të diskutojmë aspektet e frekuencës.

Për CD-të, shkalla e mostrës është 44100 Hz. Ekziston një mendim se kjo do të thotë që të gjitha frekuencat deri në 22.05 kHz riprodhohen, por kjo nuk është plotësisht e vërtetë. Mund të themi vetëm pa mëdyshje se nuk ka frekuenca mbi 22.05 kHz në sinjalin e dixhitalizuar. Pamja reale e riprodhimit të tingullit të dixhitalizuar varet gjithmonë nga teknikë specifike dhe nuk është gjithmonë aq i përsosur sa do të donim, dhe aq në përputhje me teorinë. E gjitha varet nga DAC specifike.

Le të kuptojmë së pari se çfarë do të donim të merrnim. Një person i moshës së mesme (mjaft i ri) mund të ndiejë tinguj nga 10 Hz në 20 kHz, është kuptimplotë të dëgjosh - nga 30 Hz në 16 kHz. Tingujt lart dhe poshtë perceptohen, por nuk përbëjnë një ndjesi akustike. Tingujt mbi 16 kHz ndihen si një faktor i pakëndshëm i bezdisshëm - presioni në kokë, dhimbja, veçanërisht tingujt me zë të lartë sjellin siklet aq të mprehtë saqë dëshironi të dilni nga dhoma. Ndjesitë e pakëndshme janë aq të forta saqë veprimi i pajisjeve të sigurisë bazohet në këtë - disa minuta tingull shumë i lartë me frekuencë të lartë do të çmendin këdo dhe bëhet absolutisht e pamundur të vidhni ndonjë gjë në një mjedis të tillë. Tingujt nën 30 - 40 Hz me amplitudë të mjaftueshme perceptohen si dridhje që vijnë nga objektet (altoparlantët). Përkundrazi, madje do të thuhej kështu - vetëm një dridhje. Një person akustikisht pothuajse nuk përcakton pozicionin hapësinor të tingujve kaq të ulët, prandaj organet e tjera shqisore tashmë janë duke u përdorur - prekëse, ne i ndiejmë tinguj të tillë me trupin tonë.

Për të transmetuar tingullin ashtu siç është, do të ishte mirë të ruani të gjithë gamën e perceptuar 10 Hz te 20 kHz. Në teori, nuk ka absolutisht asnjë problem me frekuenca të ulëta në regjistrimin dixhital. Në praktikë, të gjitha DAC-të që përdorin teknologjinë delta kanë një burim të mundshëm problemesh. Tani ka 99% të pajisjeve të tilla, kështu që problemi është në një mënyrë apo tjetër, megjithëse nuk ka pothuajse asnjë pajisje sinqerisht të keqe (vetëm qarqet më të lira). Mund të supozojmë se gjithçka është në rregull me frekuenca të ulëta - në fund të fundit, ky është vetëm një problem i riprodhimit plotësisht i zgjidhshëm, me të cilin DAC-të e dizajnuara mirë që kushtojnë më shumë se 1 dollarë e përballojnë me sukses.
Me frekuenca të larta, gjithçka është pak më keq, të paktën me siguri më i vështirë. Pothuajse i gjithë thelbi i përmirësimeve dhe ndërlikimeve të DAC dhe ADC synon pikërisht një transmetim më të besueshëm të frekuencave të larta. Me "të larta" nënkuptojmë frekuenca të krahasueshme me frekuencën e kampionimit - domethënë, në rastin e 44.1 kHz, kjo është 7-10 kHz dhe më e lartë. Vizatim shpjegues:

Figura tregon një frekuencë prej 14 kHz, të dixhitalizuar me një shpejtësi kampionimi prej 44.1 kHz. Pikat tregojnë momentet e marrjes së amplitudës së sinjalit. Mund të shihet se ka rreth tre pika për një periudhë të sinusoidit, dhe për të rivendosur frekuencën origjinale në formën e një sinusoidi, duhet të tregohet pak imagjinatë. Vetë vala e sinusit u tërhoq nga programi CoolEdit dhe tregoi imagjinatë - rivendosi të dhënat. Një proces i ngjashëm ndodh në DAC, kjo bëhet nga filtri i rikuperimit. Dhe nëse frekuencat relativisht të ulëta janë sinusoidë pothuajse të gatshëm, atëherë forma dhe, në përputhje me rrethanat, cilësia e restaurimit me frekuencë të lartë qëndron tërësisht në ndërgjegjen e sistemit të restaurimit DAC. CoolEdit ka një filtër shumë të mirë rikuperimi, por gjithashtu dështon në një rast ekstrem - për shembull, një frekuencë prej 21 kHz:

Mund të shihet se forma e dridhjeve (vijat blu) nuk është e saktë dhe janë shfaqur veti që nuk ishin aty më parë. Ky është problemi kryesor kur riprodhoni frekuenca të larta. Problemi, megjithatë, nuk është aq i keq sa mund të duket. Të gjithë DAC-të moderne përdorin teknologjinë me shumë norma, e cila konsiston në rikthimin dixhital në një normë kampionimi disa herë më të lartë dhe më pas konvertimin e tij në një sinjal analog me një frekuencë të rritur. Kështu, problemi i rikthimit të frekuencave të larta zhvendoset në supet e filtrave dixhitalë, të cilët mund të jenë të një cilësie shumë të lartë. Aq cilësi të lartë sa që në rastin e pajisjeve të shtrenjta, problemi plotësisht hequr - siguron riprodhim të pashtrembëruar të frekuencave deri në 19-20 kHz. Rimostrimi përdoret gjithashtu në pajisje jo shumë të shtrenjta, kështu që në parim ky problem mund të konsiderohet gjithashtu i zgjidhur. Pajisjet në rajonin prej 30 - 60 dollarë (kartat e zërit) ose qendrat muzikore deri në 600 dollarë, zakonisht të ngjashme në DAC me këto karta zanore, riprodhojnë në mënyrë të përsosur frekuencat deri në 10 kHz, tolerueshme deri në 14 - 15 dhe disi pjesën tjetër. Kjo mjaft mjafton për shumicën e aplikacioneve reale muzikore, dhe nëse dikush ka nevojë për më shumë cilësi - ai do ta gjejë atë në pajisje të nivelit profesional që nuk janë edhe aq më të shtrenjta - ato janë bërë thjesht me zgjuarsi.

Kthehu te dithering, le të shohim se si mund të rrisim në mënyrë të dobishme diapazonin dinamik përtej 16 bit.

Ideja e dithering është të përzihet në sinjal zhurma. Sado e çuditshme të tingëllojë, për të reduktuar zhurmën dhe efektet e pakëndshme të kuantizimit, ne shtoni zhurma juaj. Le të shqyrtojmë një shembull - le të përdorim aftësinë e CoolEdit për të punuar në 32 bit. 32 bit është 65 mijë herë më i saktë se 16 bit, kështu që në rastin tonë 32 bit mund të konsiderohen origjinale analoge dhe konvertimi i tij në 16 bit është digjitalizim. Imazhi tregon audio 32-bit - muzikë të regjistruar në një nivel kaq të qetë sa momentet më të zhurmshme arrijnë vetëm -110 dB:

Kjo është shumë më e qetë se diapazoni dinamik i audios 16-bit (1MB përfaqësim 16-bitësh është i barabartë me një në shkallën në të djathtë), kështu që nëse thjesht i rrumbullakojmë të dhënat në 16-bit, marrim heshtje të plotë dixhitale.

Le të shtojmë zhurmë të bardhë në sinjal me një nivel prej 1 MB - kjo është -90 dB (përafërsisht që korrespondon me nivelin e zhurmës së kuantizimit):

Le të konvertojmë në 16 bit (vetëm vlerat e numrave të plotë janë të mundshme - 0, 1, -1, ...):


(Injoroni vijën blu, e cila gjithashtu merr vlera të ndërmjetme - ky është filtri CoolEdit që simulon amplituda reale pas filtrit të restaurimit. Pikat e kampionimit të amplitudës janë të vendosura vetëm në vlerat 0 dhe 1)

Siç mund ta shihni, disa të dhëna mbeten. Aty ku sinjali origjinal kishte një nivel më të lartë, ka më shumë vlera 1, ku më i ulëti është zero. Për të dëgjuar atë që kemi marrë, ne e përforcojmë sinjalin me 14 bit (me 78 dB). Rezultati mund të shkarkohet dhe të dëgjohet (dithwht.zip, 183 kb).

Këtë tingull e dëgjojmë me një zhurmë të madhe prej -90 dB (përpara se të fitojmë dëgjim), ndërsa sinjali i dobishëm është vetëm -110 dB. Ne tashmë kemi transmetim audio -110 dB në 16 bit. Në parim, kjo është mënyra standarde për të zgjeruar gamën dinamike, e cila shpesh rezulton pothuajse vetvetiu - ka zhurmë të mjaftueshme kudo. Sidoqoftë, kjo në vetvete është mjaft e pakuptimtë - niveli i zhurmës së kampionimit mbetet në të njëjtin nivel, dhe transmetimi i një sinjali që është më i dobët se zhurma nuk është shumë i qartë nga pikëpamja logjike ...

Mënyrë më e ndërlikuar - dithering në formë. Ideja është që duke qenë se ne ende nuk dëgjojmë frekuenca të larta në tinguj shumë të qetë, atëherë duhet ta drejtojmë fuqinë kryesore të zhurmës në këto frekuenca, ndërsa ju mund të përdorni edhe shumë zhurmë - unë do të përdor një nivel 4MB ( kjo është dy pjesë zhurmë). Rezultat i përmirësuar pas filtrimit të frekuencave të larta (nuk do t'i dëgjonim me volumin normal të këtij tingulli) - ditshpfl.zip , 1023 kb (për fat të keq, tingulli nuk arkivohet më). Ky është tashmë një transmetim mjaft i mirë i zërit (për një vëllim jashtëzakonisht të ulët), zhurma është afërsisht e barabartë në fuqi me vetë tingullin me një nivel -110 dB! Shënim i rëndësishëm: ne i ngritur zhurma reale e kampionimit nga 0,5 MB (-93 dB) në 4 MB (-84 dB), duke ulur zhurma e dëgjueshme e kampionimit nga -93dB në rreth -110dB. Raporti sinjal ndaj zhurmës përkeqësuar, por zhurma shkoi në rajonin me frekuencë të lartë dhe pushoi së dëgjuari, gjë që dha përmirësim të dukshëm në realitet raporti sinjal-zhurmë (i perceptueshëm nga njeriu). Në praktikë, ky është tashmë niveli i zhurmës së kampionimit të audios 20-bit. Kushti i vetëm i kësaj teknologjie është prania e frekuencave për zhurmën. Audioja 44,1 kHz bën të mundur vendosjen e zhurmës në frekuencat 10-20 kHz që janë të padëgjueshme në vëllime të qeta. Por nëse dixhitalizoni në 96 kHz, domeni i frekuencës për zhurmën (i padëgjueshëm për njerëzit) do të jetë aq i madh sa që kur përdorni 16 bit në formë dithering vërtetë shndërrohet në të gjitha 24.

[Shënim: Altoparlanti i PC-së është një pajisje me një bit, por me një shpejtësi maksimale mjaft të lartë të kampionimit (ndezur/fikur i atij biti të vetëm). Duke përdorur një proces të ngjashëm në thelb me dithering, i quajtur më tepër modulim i gjerësisë së pulsit, në të u luajt tingull dixhital mjaft me cilësi të lartë - 5-8 bit me frekuencë të ulët u nxorrën nga një bit dhe një shkallë e lartë kampionimi, dhe pamundësia e pajisjet për të riprodhuar frekuenca të tilla të larta, si dhe pamundësia jonë për t'i dëgjuar ato. Një bilbil i lehtë me frekuencë të lartë, megjithatë - pjesa e dëgjueshme e kësaj zhurme - ishte e dëgjueshme.]

Kështu, dithering në formë ju lejon të reduktoni ndjeshëm zhurmën tashmë të ulët të mostrës së audios 16-bit, duke zgjeruar kështu në heshtje diapazonin dinamik të dobishëm (pa zhurmë) duke të gjitha zona e dëgjimit të njeriut. Meqenëse tani dithering në formë përdoret gjithmonë kur përkthehet nga një format pune prej 32 bitësh në një 16 bit përfundimtar për një CD, 16 bitët tanë janë plotësisht të mjaftueshëm për një transferim të plotë të një fotografie zanore.

E vetmja gjë është se kjo teknologji funksionon vetëm në fazën e fundit - përgatitjen e materialit për riprodhim. Kur përpunoni tinguj me cilësi të lartë, thjesht e nevojshme qëndroni në 32 bit për të shmangur shqetësimet pas çdo operacioni, kodimi më i mirë rezulton në 16 bit. Por nëse niveli i zhurmës së fonogramit është më shumë se -60 dB, ju mund të kryeni të gjithë përpunimin në 16 bit, pa skrupujt më të vegjël të ndërgjegjes. Ndarja e ndërmjetme do të sigurojë që të mos ketë shtrembërime të rrumbullakosjes dhe zhurma e shtuar prej saj do të ndodhë qindra herë më e dobët se ajo ekzistuese dhe për këtë arsye krejtësisht indiferente.

Pyetje:
Pse thuhet se tingulli 32-bit është më i mirë se 16-bit?
A1: Ata e kanë gabim.
A2: [Ata nënkuptojnë pak më ndryshe: kur përpunoni ose regjistroni tingullin e nevojshme përdorni rezolucion më të lartë. Ata e përdorin atë gjithmonë. Por në tingull si në produktin e përfunduar, nuk kërkohet një rezolucion prej më shumë se 16 bit.]
Pyetje: A ka kuptim të rritet shpejtësia e kampionimit (p.sh. deri në 48 kHz ose deri në 96)?
A1: nuk ka. Me të paktën sa qasje kompetente në hartimin e transmetimit DAC 44 kHz e gjitha diapazoni i dëshiruar i frekuencës.
A2: [Ata nënkuptojnë pak më ndryshe: ka kuptim, por vetëm kur përpunoni ose regjistroni tingullin.]
Pyetje: Pse po vazhdon ende futja e frekuencave të larta dhe bitness?
A1: Është e rëndësishme që progresi të lëvizë. Ku dhe pse - nuk është aq e rëndësishme ...
A2: Shumë procese në këtë rast janë më të lehta. Nëse, për shembull, pajisja do të përpunojë tingullin, do ta ketë më të lehtë për të ta bëjë këtë në 96 kHz / 32 bit. Pothuajse të gjithë DSP-të përdorin 32 bit për përpunimin e zërit, dhe aftësia për të harruar konvertimet është një zhvillim më i lehtë dhe ende një rritje e lehtë e cilësisë. Dhe në përgjithësi - tingulli për përpunim të mëtejshëm Ajo ka do të thotë të ruhet në një rezolucion më të lartë se 16 bit. Për pajisjet hi-end që luajnë vetëm zërin, kjo është absolutisht indiferent.
Pyetje: A janë DAC 32x apo 24x apo edhe 18 bit më të mirë se ato 16 bit?
A: Në përgjithësi - Nr. Cilësia e konvertimit nuk varet aspak nga thellësia e bitit. Kodeku AC "97 (një kartë moderne e zërit nën 50 dollarë) përdor një kodek 18-bit, dhe kartat 500 dollarë, tingulli i të cilave as nuk mund të krahasohet me këtë marrëzi, përdorin 16-bit. Nuk ka absolutisht asnjë ndryshim për të luajtur audio 16 bit..
Vlen gjithashtu të kihet parasysh se shumica e DAC-ve zakonisht luajnë më pak pjesë sesa marrin. Për shembull, niveli i vërtetë i zhurmës së një kodiku tipik të lirë është -90 dB, që është 15 bit, dhe edhe nëse është vetë 24 bit - nuk do të merrni asnjë kthim në 9 bit "shtesë" - rezultati i punës së tyre. , edhe nëse do të ishte në dispozicion, do të mbyten në zhurmën e tyre. Shumica e pajisjeve të lira janë vetëm injorojnë pjesë shtesë - ato thjesht nuk llogariten në procesin e tyre të sintezës së zërit, megjithëse shkojnë në hyrjen dixhitale të DAC.
Pyetje: Dhe për rekord?
A: Për regjistrim, është më mirë të keni një ADC me një kapacitet më të madh. Përsëri, më shumë reale thellësi bit. Thellësia bit e DAC duhet të korrespondojë me nivelin e zhurmës së fonogramit origjinal, ose thjesht të jetë e mjaftueshme për të arritur nivelin e ulët të dëshiruar. zhurma.
Është gjithashtu e dobishme të kesh pak më shumë thellësi për të përdorur diapazonin më të lartë dinamik për kontroll më pak të saktë të nivelit të regjistrimit. Por mbani mend - gjithmonë duhet të godisni reale diapazoni i kodikut. Në realitet, një ADC 32-bit, për shembull, është pothuajse plotësisht të pakuptimta, meqenëse dhjetë bitet e ulëta thjesht do të bëjnë zhurmë vazhdimisht - kështu që zhurmë e ulët (nën -200 dB) vetëm nuk mund të jetë në një burim muzikor analog.

Nuk ia vlen të kërkohet nga tingulli i thellësisë së bitit të rritur ose frekuenca e kampionimit, në krahasim me CD, cilësi më të mirë. 16 bit/44 kHz i shtyrë në kufi me gërvishtje në formë është mjaft i aftë plotësisht të përcjellim informacionin që na intereson, nëse nuk bëhet fjalë për procesin e përpunimit të zërit. Mos humbisni hapësirë ​​për të dhëna shtesë në materialin tuaj të përfunduar, ashtu si mos prisni cilësi superiore të zërit nga DVD-Audio me 96kHz/24bit. Me një qasje kompetente, gjatë krijimit të tingullit në një format standard CD, do të kemi një cilësi që thjesht nuk ka nevoje në përmirësim të mëtejshëm, dhe përgjegjësia për regjistrimin e saktë të zërit të të dhënave përfundimtare është marrë prej kohësh nga algoritmet e zhvilluara dhe njerëzit që dinë t'i përdorin ato në mënyrë korrekte. Në vitet e fundit, nuk do të gjeni një disk të ri pa gërvishtje në formë dhe teknika të tjera për të çuar cilësinë e zërit në kufi. Po, do të jetë më i përshtatshëm për njerëzit dembelë ose thjesht të ngathët të japin materiale të gatshme në 32 bit dhe 96 kHz, por në teori - a ia vlen disa herë më shumë të dhëna audio?...

Emri im është Louis Philippe Dion, unë jam projektuesi i zërit për Rainbow Six: Siege dhe kam qenë me Ubisoft për shtatë vjet. Më parë kam bërë dizajn të tingullit për Prince of Persia dhe Splinter Cell. Kam punuar gjithashtu si menaxher produkti për motorin e zërit të vetë Ubisoft.

Përpara se t'i bashkohesha industrisë së lojërave, kam punuar si inxhinier i zërit në xhirimet e disa serialeve dhe filmave. Në kohën e lirë, me sa mbaj mend, merresha me muzikë, duke kultivuar dashurinë për sintetizatorët, kitarat dhe në përgjithësi për gjithçka që mund të prodhojë tingull.

Duke pasur një interes të fortë në aspektet teknike të zërit, unë u zhvendosa në industrinë e lojrave me entuziazëm. Ndjeva se, krahasuar me TV dhe filmat, lojërat ofronin një hapësirë ​​më të gjerë për inovacione dhe përparime teknologjike. Për momentin, ne mezi e kemi gërvishtur sipërfaqen e potencialit të audios interaktive, përzierjes në kohë reale dhe algoritmeve të reja të pozicionimit, dhe jam shumë kurioz të shoh se çfarë na pret e ardhmja.

Përhapja dinamike e zërit në mjedise të shkatërrueshme

Tre aspekte themelore të fizikës janë të lidhura me përhapjen e zërit: reflektimi (kur zëri kërcen nga sipërfaqet), përthithja (kur zëri kalon nëpër një sipërfaqe, por humbet disa frekuenca) dhe difraksioni (kur zëri përkulet rreth objekteve). Veshi juaj i vëren këto fenomene çdo ditë. Në jetën reale, ka shumë faktorë të tjerë që rregullojnë pozicionin e synuar të një burimi tingulli, por unë do të fokusohem veçanërisht në fizikën e përhapjes së zërit dhe mënyrën se si ne e simulojmë atë.

Risia kryesore në Siege ishte përdorimi i bollshëm i difraksionit - ne përdorim termin "pengim" për këtë. Duke vendosur në mënyrë strategjike "nyjet e shpërndarjes" në hartë, ne mund të llogarisim rrugën më të thjeshtë për zërin nga burimi te dëgjuesi. Lehtësia e shtegut varet nga disa faktorë, përkatësisht, gjatësia e shtegut, sasia totale e qosheve të rrumbullakosura dhe dënimet për shkallën e shkatërrimit në nyje të caktuara.

Për shembull, nëse muri nuk është i dëmtuar, nyja brenda tij nuk merret parasysh nga algoritmi (penalitet pafund). Por nëse ka një vrimë në të, nyja do të jetë e disponueshme për të zgjedhur rrugën e përhapjes. Pastaj ne praktikisht e zhvendosim burimin e zërit në përputhje me drejtimin e shtigjeve të tilla, i cili në fund të fundit vepron si një analog i difraksionit.

Ne përdorim gjithashtu disa strategji për të simuluar përthithjen, duke e quajtur atë "okluzion". Në varësi të burimit, ne ose luajmë një version të parapërgatitur të heshtur të audios (siç janë hapat në katin e fundit) ose luajmë audion drejtpërdrejt nga burimi me filtrim në kohë reale. Opsioni i dytë rrit ngarkesën në procesor, kështu që rezervohet kryesisht për tingujt e armëve. Në jetën reale, ju mund të dëgjoni versionet e zhytura dhe të devijuara të tingullit në të njëjtën kohë, dhe ne gjithashtu i kombinojmë ato, duke dhënë më shumë informacion për vendndodhjen reale të burimit.

Së fundi, për reflektim (në terminologjinë tonë "reverb"), ne përdorim një reverb impuls. Ky është një kumbim i veçantë që "skanon" vetitë akustike të një dhome të vërtetë dhe më pas luan tingujt nga loja jonë në të. Sipas mendimit tim, kjo metodë është vite dritë përpara reverbs tradicionale parametrike - të paktën për qëllime simulimi. E vetmja negative është se për shkak të ngarkesës në procesor, ne nuk mund ta përdorim atë në një numër të madh rastesh. Për të kapërcyer këtë kufizim, ne "bashkëngjisim" reverbin në një armë dhe e luajmë atë përsëri drejt asaj arme, e cila i siguron lojtarit informacion më të saktë për vendndodhjen e armikut.

Për çfarë është e gjitha?

Mjediset e shkatërrueshme ishin një vështirësi e madhe gjatë zhvillimit të sistemit të shpërndarjes së zërit. Është një gjë të drejtosh tingullin në rrugën më të shkurtër dhe krejt tjetër kur niveli ndryshon gjatë lojës - diçka që nuk e kemi bërë kurrë më parë. Nuk ishte e lehtë të ruash cilësinë e zërit të lartë duke mbajtur parasysh performancën. Ne vendosëm disa nyje në një mjedis të shkatërrueshëm dhe ato qëndruan të mbyllura derisa objekti u dëmtua. Ne eksperimentuam vazhdimisht me një numër të ndryshëm shtigjesh të mundshme të përhapjes derisa gjetëm një mjet të lumtur midis saktësisë dhe shpejtësisë.

Është interesante se modifikuesit e përhapjes së zërit punojnë jo vetëm në një drejtim: nyjet mund të hapen dhe mbyllen. Duke barrikaduar dhe forcuar muret, lojtarët ndryshojnë edhe rrugën e zërit. Barriera të tilla nuk duhet të mbulojnë plotësisht nyjen - në varësi të vetive të materialit (druri, qelqi, betoni, etj.), Zëri mund të kalojë ende, por me një dënim të caktuar. Për shembull, barrikadat prej druri dhe metali kanë cilësime të ndryshme të heshtjes.

Me një nivel destruktiviteti si në Siege, do të ishte një katastrofë nëse thjesht do të mbështeteshim në mbylljen pa përdorimin e pengesave. Okluzioni në këtë rast do të ishte një "wallhack" shumë i fuqishëm. Duke luajtur mbrojtje, thjesht mund të shkatërroni sa më shumë mure të jetë e mundur dhe të dëgjoni saktësisht se ku po shkojnë sulmuesit - ata nuk do të kishin një shans. Ne po përpiqemi ta mbajmë tingullin sa më të saktë që të jetë e mundur, por simulimi i 'fizikës së vërtetë' shton gjithashtu një shtresë shtesë hamendjeje në lojë për vendndodhjen e armikut, gjë që barazon të dyja palët. Sigurisht, në disa situata ky moment mund të jetë shumë shqetësues, por e tillë është jeta reale.

Harta e Herefordit

Dëgjimi i veprimeve të lojtarit

Heshtja dhe pasiviteti janë parimet kryesore të lojës, dhe madje edhe me një kohëmatës prej tre minutash, lojtarët preferojnë të dëgjojnë kundërshtarët e tyre. Në fakt, kur filluam zhvillimin, menduam se mjedisi i lojës do të tingëllonte mjaft jo interesant. Të presësh në heshtje në dhomën e gjumit të një shtëpie periferike - kjo nuk është një betejë në thellësi të betejës dhe jo një betejë hapësinore, apo jo?

Në atë kohë, jo të gjithë tingujt ishin shtuar në lojë, dhe sistemi për shpërndarjen e tyre ishte vetëm në një fazë të hershme të zhvillimit. Por ndërsa të gjitha pjesët e enigmës filluan të bashkoheshin ngadalë, ne kuptuam se mund të arrinim diçka më serioze sesa "tensioni i rremë". Kërcënimi që po dëgjoni është real dhe po shkon drejt jush. Duke hequr qafe ambientin e rëndë, ne ishim në gjendje të rrisnim pezullimin e atmosferës dhe të krijonim hapësirë ​​që lojtarët të merrnin informacion më të saktë për armikun.

Diagrami i përhapjes së zërit në hartën e Herefordit

Ne i kushtuam vëmendje të veçantë tingujve të lëvizjes, të cilat ju lejojnë thjesht të dëgjoni për të kuptuar vendndodhjen e armikut - është mjaft e mundur të përcaktoni peshën, armaturën dhe shpejtësinë e operatorit nga kërkesat e zërit. Barrikadat, pajisjet dhe pajisjet e tjera janë gjithashtu të pajisura me tinguj specifikë.

Tingujt që lëshon personazhi i lojtarit përforcohen për dy arsye të rëndësishme: së pari, lojtari e kupton që po bën shumë zhurmë dhe se kjo mund ta largojë; së dyti, e bën të qartë se ju duhet të ngadalësoni nëse doni të dëgjoni. Kjo është baza e dizajnit të tingullit në Siege: duke lëvizur më ngadalë dhe duke dëgjuar rrethinën tuaj, mund të grumbulloni më shumë informacion dhe të luani më mirë.

Nyjet e shpërndarjes nga afër

Rezultatet

Kur filluam punën për projektin, synuam të krijonim një atmosferë shqetësuese. Në një moment, ne shtuam muzikë dhe efekte për këtë, por, siç u përmend tashmë, ideja më e mirë ishte të përdornim vetë lojtarët si burime tingulli. Kështu që ne hoqëm të gjithë tingujt "fake", duke u fokusuar në atë që ka vërtet rëndësi.

Sot, pas shumë kohësh, e gjithë kjo duket e qartë, por shoh që lojërat e rralla braktisin tensionin klasik artificial të atmosferës. Heqja e efekteve, për mendimin tim, i dha Siege një tingull të veçantë që jo vetëm që është i këndshëm për veshin, por gjithashtu ndikon në lojën në shumë mënyra.

Burimi i dridhjeve të zërit rrezaton energji në hapësirën përreth. Sasia e energjisë së zërit që kalon në sekondë në një sipërfaqe prej 1 m2, e vendosur pingul me drejtimin e përhapjes së dridhjeve të zërit, quhet intensiteti (forca) e zërit.

Kur kemi një bisedë normale, rrjedha e fuqisë së energjisë është afërsisht 10 mikrovat. Fuqia e tingujve më të lartë të violinës mund të jetë 60 mikrovat, dhe fuqia e tingujve të organeve është nga 140 në 3200 mikrovat.

Një person dëgjon tinguj në një gamë jashtëzakonisht të gjerë të presioneve (intensiteteve) të zërit. Një nga vlerat e referencës së këtij diapazoni është pragu standard i dëgjimit - vlera efektive e presionit të zërit të krijuar nga një dridhje harmonike e zërit të një frekuence prej 1000 Hz, mezi e dëgjueshme për një person me ndjeshmëri mesatare të dëgjimit.

Pragu i dëgjimit korrespondon me intensitetin e zërit Iv0 = 10-12 W/m2 ose presionin e zërit psv0 = 2×10-5 Pa.

Kufiri i sipërm përcaktohet nga vlerat e Iv. Maks. = 1 W/m2 ose psv. Maks. = 20 Pa. Kur perceptohet një tingull i një intensiteti të tillë, një person përjeton dhimbje.

Në zonën e presioneve të zërit që tejkalojnë ndjeshëm pragun standard të dëgjimit, madhësia e ndjesisë nuk është proporcionale me amplituda e presionit të zërit psv, por me logaritmin e raportit psv / psv0. Prandaj, presioni i zërit dhe intensiteti i zërit maten shpesh në njësi logaritmike decibel (dB) në raport me pragun standard të dëgjimit.

Gama e ndryshimit të presionit të zërit nga pragu absolut i dëgjimit në pragun e dhimbjes është për frekuenca të ndryshme nga 90 dB në 130 dB.

Nëse veshi i njeriut percepton njëkohësisht dy ose më shumë tinguj me zë të lartë të ndryshëm, atëherë një tingull më i fortë mbyt (thith) tinguj të dobët. Ekziston një i ashtuquajtur maskim i tingujve, dhe veshi percepton vetëm një tingull, më të fortë. Menjëherë pas ekspozimit ndaj një tingulli të lartë, ndjeshmëria e dëgjimit ndaj tingujve të dobët zvogëlohet. Kjo aftësi quhet përshtatje e dëgjimit.

Kështu, pragu i dëgjueshmërisë varet kryesisht nga kushtet e dëgjimit: në heshtje ose në sfondin e zhurmës (ose tingujve të tjerë shqetësues). Në rastin e fundit, pragu i dëgjimit rritet. Kjo tregon që ndërhyrja maskon sinjalin e dobishëm.

Aparati i dëgjimit të njeriut ka një inerci të caktuar: ndjesia e shfaqjes së një zëri, si dhe ndërprerja e tij, nuk shfaqen menjëherë.

Sinjali audio është një proces i rastësishëm. Karakteristikat e tij akustike ose elektrike ndryshojnë vazhdimisht me kalimin e kohës. Përpjekja për të mbajtur gjurmët e ndryshimeve të rastësishme në zbatimin e këtij kaosi është një ushtrim që nuk ka shumë kuptim. Është e mundur të frenohet rasti madhështisë së tij, t'i jepet tiparet e determinizmit, duke përdorur parametra mesatarë, siç është niveli i sinjalit audio.

Niveli i sinjalit audio karakterizon sinjalin në një moment të caktuar dhe shprehet në decibel, korrigjohet dhe mesatarizohet gjatë një periudhe të caktuar kohore të mëparshme, tensioni i sinjalit audio.

Gama dinamike e një sinjali audio kuptohet si raporti i presionit maksimal të zërit me minimumin ose raporti i tensioneve përkatëse. Në këtë përkufizim, nuk ka informacion se çfarë presioni dhe stresi konsiderohen maksimale dhe minimale. Kjo është ndoshta arsyeja pse diapazoni dinamik i sinjalit të përcaktuar në këtë mënyrë quhet teorik. Së bashku me këtë, diapazoni dinamik i një sinjali audio mund të përcaktohet gjithashtu eksperimentalisht si diferenca midis niveleve maksimale dhe minimale për një periudhë mjaft të gjatë. Kjo vlerë varet shumë nga koha e zgjedhur e matjes dhe lloji i njehsorit të nivelit.

Gama dinamike e sinjaleve akustike muzikore dhe të të folurit të llojeve të ndryshme, të matura duke përdorur instrumente, mesatare:

80 dB për orkestër simfonike

45 dB për kor

35 dB për muzikën pop dhe solistë vokalë

25 dB për fjalimin e folësit

Gjatë regjistrimit, nivelet duhet të rregullohen. Kjo shpjegohet me faktin se sinjalet origjinale (të papërpunuara) shpesh kanë një gamë të madhe dinamike (për shembull, deri në 80 dB për muzikën simfonike), dhe në shtëpi, programet audio dëgjohen në intervalin prej rreth 40 dB.

Ka një disavantazh për rregullimin manual të niveleve. Koha e reagimit të inxhinierit të zërit është rreth 2 s, edhe nëse rezultati i përbërjes i dihet paraprakisht. Kjo çon në një gabim në ruajtjen e niveleve maksimale të programeve muzikore deri në 4 dB në të dy drejtimet.

Përforcuesit, sistemet akustike dhe madje edhe veshët e njeriut duhet të mbrohen nga mbingarkesat e shkaktuara nga kërcimet e papritura në amplituda e sinjalit audio - për të kufizuar sinjalin në amplitudë.

Gama dinamike e sinjalit duhet të koordinohet me diapazonin dinamik të pajisjeve të regjistrimit, amplifikimit dhe transmetimit.

Për të rritur gamën e stacioneve të radios FM, diapazoni dinamik i sinjalit audio duhet të kompresohet. Për të zvogëluar nivelin e zhurmës në pauza, është e dëshirueshme të rritet diapazoni dinamik.

Në fund të fundit, moda, e cila dikton kushtet e saj në të gjitha sferat e veprimtarisë njerëzore, përfshirë regjistrimin e zërit, kërkon një tingull të pasur, të dendur të muzikës moderne, i cili arrihet nga një ngushtim i mprehtë i diapazonit të saj dinamik.

Vala zanore (zarfi i zërit) i një fragmenti të operës "Aleko" të S. Rachmaninov,

dhe muzikë bashkëkohore kërcimi.

Në muzikën klasike nuancat janë të rëndësishme, muzika e kërcimit duhet të jetë “e fuqishme”.

Kjo dikton nevojën e përdorimit të pajisjeve për përpunimin automatik të niveleve të sinjalit.

Artikujt kryesorë të lidhur