نحوه راه اندازی گوشی های هوشمند و رایانه های شخصی. پرتال اطلاعاتی
  • خانه
  • ویندوز 10
  • Dolby Digital Plus VS Dolby Digital: صحبت در مورد فناوری. مبانی صوتی دیجیتال سازی و فشرده سازی فایل های صوتی

Dolby Digital Plus VS Dolby Digital: صحبت در مورد فناوری. مبانی صوتی دیجیتال سازی و فشرده سازی فایل های صوتی

Dolby Digital - اطلاعات عمومی

صدای دالبی دیجیتال برای اولین بار در سال 1992 با نمایش فیلم بازگشت بتمن به سینماها راه یافت و از آن زمان تاکنون در نزدیک به هزار فیلم در سراسر جهان به نمایش درآمده است و یکی از پیشرفته ترین پیشرفت های تاریخ است.

دالبی در اواخر دهه 60 و اوایل دهه 70 با سیستم های کاهش نویز Dolby A (برای حرفه ای ها) و Dolby B (برای کاربران عادی) انقلابی در سیستم های ضبط نوار ایجاد کرد. بعدها، در دهه 70، دالبی با سیستم آنالوگ خود، دالبی استریو، صدای فیلم را متحول کرد.

Dolby Stereo 4 کانال صدا را به فیلم‌ها ارائه کرد که سه کانال در جلو (چپ و راست برای موسیقی و جلوه‌ها و مرکز برای دیالوگ) و چهارمی "Surround" برای ایجاد یک فضای صوتی کلی وجود دارد. بعدها، در دهه 80، به لطف سیستم Dolby SR ("ضبط طیفی")، کیفیت ضبط نوار و صدا در فیلم ها به طور قابل توجهی بهبود یافت.

دالبی همچنین در اواخر دهه 1980 و اوایل دهه 1990 با معرفی Dolby Surround و بعدها سیستم های سینمای خانگی Dolby Pro Logic انقلابی در سرگرمی های خانگی ایجاد کرد. دستگاه‌های خانگی عمدتاً از فناوری Dolby Stereo برای پخش از نوارهای ویدیویی و دیسک‌های لیزری استفاده می‌کنند (دیسک‌های لیزری از این پس به معنای LaserDisc، یعنی دیسک‌های لیزری ویدئویی "بزرگ") هستند. این سیستم ها به بینندگان این امکان را می دادند که از همان پیکربندی 4 کاناله در خانه مانند سالن های سینما استفاده کنند.

سیستم‌های Dolby Digital امروزی کارها را به سطح بالاتری رسانده‌اند و شش کانال صدای فراگیر دیجیتالی شفاف را ارائه می‌کنند. کانال های جلوی چپ، مرکز و راست به شما این امکان را می دهند که موقعیت منبع صدا را به طور دقیق روی صفحه تعیین کنید. کانال‌های پشتی چپ و راست مجزای «تقسیم‌شده» با صداهای محیطی و روان‌شان شما را به فیلم می‌کشاند. و یک کانال با فرکانس پایین اضافی به عملکرد روی صفحه نمایش می افزاید.

اصول Dolby Digital از پیشرفت های Dolby در کاهش نویز آنالوگ گرفته شده است. کاهش نویز Dolby با کاهش نویز زمانی که سیگنال صوتی وجود ندارد و زمانی که وجود دارد، کار می‌کند و به سیگنال صوتی مورد نظر قوی‌تر اجازه می‌دهد تا نویز ضعیف‌تر را خاموش کند. بنابراین، این فناوری از یک پدیده روانی-آکوستیک به نام پوشاندن شنوایی استفاده می کند. حتی اگر سیگنال صوتی فقط بخشی از طیف را اشغال کند، کاهش نویز Dolby سطح نویز را در قسمت هایی از طیف که سیگنال مورد نظر وجود ندارد کاهش می دهد و نویز را نامرئی می کند. این کار به این دلیل انجام می‌شود که سیگنال صوتی فقط می‌تواند نویزهایی را که فرکانس نزدیکی دارند پنهان کند.

هنگام انتقال از ضبط آنالوگ سیگنال به ضبط بر روی یک رسانه دیجیتال مانند یک لوح فشرده، مشخص می‌شود که رمزگذاری دیجیتال سیگنال‌های صوتی مورد استفاده در سی‌دی‌ها، مقادیر بسیار زیادی از داده‌ها را تولید می‌کند که به طور موثر ذخیره یا منتقل می‌شوند، به ویژه در مواردی. در جایی که لازم است چندین کانال را رمزگذاری کنید. نتیجه، اشکال جدیدی از کدگذاری صوتی دیجیتال است - که در مجموع به عنوان "کدگذاری ادراکی" شناخته می‌شوند - که به گونه‌ای طراحی شده‌اند که امکان استفاده از جریان‌های داده با نرخ بیت پایین را با حداقل کاهش محسوس کیفیت صدا فراهم کند. نمونه ای از چنین الگوریتم رمزگذاری نسل سوم رمزگذارهای Dolby - AC-3 است.

این رمزگذار برای استفاده کامل از توانایی انسان برای پوشاندن صدا با شکستن طیف صوتی هر کانال به باندهای فرکانسی باریک با اندازه‌های مختلف بهینه‌سازی شده برای انتخاب فرکانس شنوایی انسان طراحی شده است. این اجازه می دهد تا نویز دیجیتالی شدن به طور بسیار دقیق فیلتر شود به طوری که از نظر فرکانس بسیار نزدیک به اجزای فرکانس سیگنال صوتی مورد نظر است. با کاهش یا حتی حذف کامل نویز در جایی که سیگنال صوتی پوشاننده وجود ندارد، کیفیت صدای سیگنال اصلی به طور ذهنی تحت تأثیر قرار نمی گیرد. در این جنبه کلیدی، رمزگذاری مانند AC-3 نوعی کاهش نویز بسیار انتخابی و با کیفیت است.

تخصص منحصر به فرد آزمایشگاه دالبی در حذف نویز صوتی برای کاهش ترافیک داده در فناوری AC-3 بسیار مهم است: هر چه بیت های کمتری برای توصیف سیگنال صوتی استفاده شود، نویز بیشتری با خود رمزگذاری مرتبط می شود.

در صنعت فیلم، موسیقی متن Dolby Digital به صورت نوری مستقیماً روی نوار فیلم در فضاهای بین سوراخ‌های پانچ کدگذاری می‌شود. قرار دادن تراک صوتی دیجیتال بر روی همان رسانه فیلم به آن اجازه می دهد تا بدون نیاز به رسانه ذخیره سازی اضافی مانند سی دی با آهنگ آنالوگ همزیستی کند. این امر استفاده از فیلم ها را برای تولید و صاحبان تئاتر آسان تر می کند و همچنین امکان تهیه آهنگ دالبی دیجیتال را بدون هزینه اضافی فراهم می کند. از آنجایی که قسمت سوراخ شده نوار به گونه ای ساخته شده است که در برابر سایش و آسیب بسیار مقاوم باشد، تراک دالبی دیجیتال در طول عمر نوار دچار ترک خوردن یا خش خش نخواهد شد.

در لوازم الکترونیکی مصرفی، فناوری Dolby Digital را می توان در آخرین نسل دیسک های لیزری (جایی که یک آهنگ صوتی آنالوگ معمولی وجود داشت) یافت، این قطعه صوتی استاندارد در دی وی دی ها است و به عنوان فرمت صوتی برای تلویزیون با کیفیت بالا استفاده می شود - HDTV، و همچنین در سیستم های تلویزیون کابلی و ماهواره ای.

DOLBY DIGITAL: پرسش و پاسخ

احتمالاً قبلاً در مورد اینکه Dolby Digital گام بعدی و شاید آخرین مرحله تکاملی در جهت رئالیسم صدا است، زیاد شنیده اید. پس این فناوری جدید چیست؟ چه تفاوتی با Dolby Surround Pro Logic دارد و به چه سخت افزار جدیدی نیاز دارد؟ پاسخ این سوالات و سوالات دیگر را در این مقاله خواهید دید.

اما ابتدا باید موضوع را با اسامی روشن کنیم. در چند سال گذشته، آزمایشگاه دالبی از اصطلاح دالبی دیجیتال برای اشاره به سیستم فیلم دیجیتال جدید خود استفاده کرده است، در حالی که Dolby Surround AC-3 به سیستم های سینمای خانگی اشاره دارد. در عمل، این دو سیستم تغییرات جزئی (کمی از نظر سرعت داده متفاوت) از یک فناوری پایه هستند. و برای اینکه دیگر کاربران را گمراه نکنند، تصمیم گرفتند که فرمت Dolby برای سیستم های چند کاناله خانگی نیز با همان نام در صنعت فیلم - Dolby Digital نامیده شود.

اعتقاد بر این است که این امر به مصرف‌کنندگان کمک می‌کند تا راحت‌تر تشخیص دهند که آیا یک محصول از این فناوری پشتیبانی می‌کند یا خیر، و به تمایز آن از فرمت‌های Dolby Surround و Dolby Pro Logic که مبتنی بر فناوری‌های آنالوگ هستند کمک می‌کند. نسل جدید دیسک‌های لیزری و فرمت‌های جدید مورد استفاده در DVD و تلویزیون با وضوح بالا (HDTV) نیز به اصطلاح Dolby Digital اشاره دارد، همانطور که اکنون در رابطه با برنامه‌های حرفه‌ای فیلم انجام می‌شود. نام عمومی Dolby Digital همچنین باید به جلوگیری از سردرگمی فزاینده کاربر در مورد عبارت "AC-3" (شماره کد صوتی 3) کمک کند، که نام فنی برای فناوری Dolby است که برای برنامه‌های چند کاناله طراحی شده است.

من نام Dolby Surround Pro Logic را شنیده ام، اما Dolby Digital (AC-3) چیست؟ و Dolby "5.1" چیست؟

Dolby Digital در مجموع شش کانال مجزای صوتی را ارائه می دهد. مانند Dolby Surround Pro Logic، شامل کانال های چپ، مرکز و راست در جلوی اتاق است. Dolby Surround Pro Logic یک کانال باند محدود اضافی (100 تا 7000 هرتز) برای صدای فراگیر فراهم می کند که معمولاً از طریق دو کانال تقویت کننده تقویت می شود و سپس به دو بلندگو تغذیه می شود. در حالی که Dolby Digital کانال های فراگیر مجزای چپ و راست را برای مکان دقیق تر صداها و بازتولید محیط طبیعی و واقعی تر و پس زمینه فراهم می کند. و علاوه بر آن، هر پنج کانال اصلی طیف کاملی از فرکانس ها (از 3 تا 20000 هرتز) را منتقل می کنند، که می توانید ووفر (ساب ووفر) را به آنها اضافه کنید.

کانال ششم - کانال جلوه‌های فرکانس پایین (کانال برای فرکانس و جلوه‌های کم)، گاهی اوقات حاوی اطلاعات کم فرکانس اضافی برای افزایش تأثیر صحنه‌های خاص، به عنوان مثال، انفجار، بلایا و غیره است. با توجه به این واقعیت که این کانال در فرکانس بالا (از 3 تا 120 هرتز) بسیار محدود است، گاهی اوقات به آن کانال ".1" می گویند. اگر به 5 کانال کامل دالبی دیجیتال اضافه شود، گفته می شود که چنین سیستم هایی دارای کانال "5.1" هستند.

تمام شش کانال دالبی دیجیتال کاملا دیجیتال هستند، به این معنی که بدون افت کیفیت از کنسول مهندس صدا تا سیستم خانه شما منتقل می شوند. اما Dolby Digital همچنین همه آنها را در یک کانال قرار می دهد که فضای کمتری نسبت به یک کانال در یک CD اشغال می کند. این همان چیزی است که اضافه کردن موسیقی متن Dolby Digital به دیسک های لیزری معمولی و همچنین به منابع مختلف دیگر را بسیار آسان می کند. Dolby Digital چندین سال است که به شما امکان تماشای فیلم های Dolby Digital را می دهد و اکنون با ظهور Dolby Digital بر روی دیسک لیزری، می توانید از این فناوری فوق العاده در خانه خود لذت ببرید. و از آنجایی که توسط آزمایشگاه دالبی توسعه داده شده است، می توانید مطمئن باشید که صدا شگفت انگیز خواهد بود!

آیا درست است که Dolby Digital به سخت افزارهای جدید نیاز دارد؟

اگر در حال ساختن یک سیستم جدید هستید، می توانید تقویت کننده ها و بلندگوهایی را بخرید که به طور خاص برای Dolby Pro Logic طراحی شده اند که با Dolby Digital کار می کنند. شما به یک پخش کننده لیزری نسل جدید نیاز دارید که دارای خروجی Dolby Digital RF باشد (این دستگاه یک جریان داده Dolby AC-3 را خروجی می دهد). دستگاه اصلی جدیدی که به آن نیاز دارید، رمزگشای Dolby Digital است (برای رمزگشایی جریان AC-3 برای پخش بعدی). اگر قبلاً یک سیستم Dolby Surround Pro Logic دارید، احتمالاً از قبل یک آمپلی فایر پنج کانالی و همچنین تعداد مورد نیاز بلندگو دارید. توصیه می شود یک ساب ووفر اضافه کنید، شاید حتی چندین.

کجا آهنگ دالبی دیجیتال را روی دیسک لیزری می سوزانید؟ آیا این باعث می شود اطلاعات صوتی مهمی از دیسک لیزر از بین برود؟ آیا اکنون باید کل کتابخانه دیسک لیزری خود را جایگزین کنم؟

شباهت های بسیار بیشتر از تفاوت بین دیسک های لیزری "عادی" و "جدید" وجود دارد. دیسک های لیزری جدید، از جمله آنهایی که دارای Dolby Digital هستند، کاملاً با پخش کننده فعلی شما سازگار هستند. دو آهنگ دیجیتال (PCM) بدون تغییر باقی می‌مانند، بنابراین می‌توانید از کیفیت Dolby Surround Pro Logic از دیسک‌های «جدید» لذت ببرید. آهنگ Dolby Digital به جای آهنگ آنالوگ راست (FM) روی دیسک ضبط می شود. تراک آنالوگ سمت چپ می تواند شامل یک نسخه مونو، تفسیر یا هر ماده صوتی دیگری باشد.

آخرین پخش کننده هایی که فقط می توانستند صدا را از آهنگ های آنالوگ (FM) پخش کنند بیش از 10 سال پیش منتشر شدند. از آن زمان، تقریباً همه پخش کننده ها می توانند از آهنگ های دیجیتال (PCM) با کیفیت بالاتر برای پخش استریو یا Dolby Surround استفاده کنند. البته، تمام پخش‌کننده‌های لیزر جدید با AC-3، تمام دیسک‌های لیزری را که در اختیار دارید، چه آهنگ‌های صوتی دیجیتال و چه آنالوگ، پخش می‌کنند.

آیا Dolby Digital Pro Logic را غیر ضروری می کند؟

اصلا. Dolby Surround Pro Logic برای مدت طولانی با ما خواهد بود. Dolby Surround Pro Logic چهار کانال (چپ، مرکز، راست و فرکانس محدود) را به دو کانال تا می کند. در سیستم های مونو این دو کانال برای پخش با هم جمع می شوند. و البته تمام اطلاعات برای پخش در سیستم های استریو موجود است. اما هنگامی که این دو کانال به رمزگشای Dolby Pro Logic وارد می‌شوند، ماتریس صدا "باز می‌شود" و تمام چهار کانال اصلی در دسترس هستند (کانال "سوراند" از طریق بلندگوهای مجزای "سوراند" چپ و راست پخش می‌شود) .

شگفت‌انگیزترین بخش سیستم Dolby Surround Pro Logic این است که سیگنال اصلی، "انباشته" به صورت استریو، می‌تواند همراه با آن در هر جایی که سیگنال استریو قابل انتقال باشد ارسال شود: پخش تلویزیونی استریو، از طریق ماهواره (باند C، DSS یا PrimeStar)، پخش کابلی، رادیو VHF (FM)، دیسک های لیزری، نوارهای ویدئویی و حتی برخی از کنسول های بازی. امروزه می‌توانید صدای Dolby Surround را در انواع برنامه‌های تلویزیونی معمولی، در فهرست رو به رشد سی‌دی‌ها و البته روی VHS و دیسک‌های لیزری که حاوی هزاران فیلم Dolby Stereo هستند بشنوید (اصطلاح Dolby Stereo به معنای همان چاه است. Dolby Surround شناخته شده است، اما در صنعت فیلم استفاده می شود). بنابراین، تا زمانی که ما استریو داریم، Dolby Surround Pro Logic وجود خواهد داشت و بنابراین همه رسیورهای Dolby Digital دارای یک رمزگشای داخلی Dolby Pro Logic هستند.

جدول زیر ویژگی های Dolby Digital و Dolby Surround Pro Logic را با هم مقایسه می کند.

پارامتردالبی دیجیتالDolby Surround Pro Logic
کانال "حجم".استریو، فرکانس کامل (3 تا 20000 هرتز)تک صوتی، طیف محدود (100-7000 هرتز)
کانال فرکانس پایینبله (3-120 هرتز)خیر
ماهی تابهمتنوعاز چپ به راست، راست به چپ، جلو به عقب و بالعکس.
کانال ها6 مجزا، همه کانال ها می توانند به طور همزمان و مستقل از یکدیگر فعال شوند.4 مشتق، تنها یک سیگنال غالب را می توان در یک زمان بازتولید کرد.
متفرقهبهبود تصویر صدا به لطف "تراز زمانی"، به عنوان مثال. صدای بلندگوها را طوری ایجاد می کند که انگار با شنونده فاصله دارند.یک راه حل اقتصادی برای مشکل به دست آوردن صدای فراگیر با کیفیت بالا.
هنگامی که حجم کلی موسیقی متن فیلم سریع کاهش می یابد (به عنوان مثال، زمانی که اکشن در اواخر شب انجام می شود)، فشرده سازی مطابق با آن تنظیم می شود تا کیفیت بخش های ساکت تر حفظ شود.صدای فراگیر از هر منبع صوتی استریو رمزگذاری نشده.
رمزگشاها را می توان طوری پیکربندی کرد که صدای فرکانس پایین را به کانال های مخصوص سیستم های دارای ساب ووفر هدایت کند.سازگار با تمام فرمت های استریو موجود و آینده.
گامی چشمگیر به جلو در کشاندن شنونده به دنیای صداهای واقعی. امکانات خلاقانه بی سابقه برای تولید و کنترل صدا.نشان دهنده یک گام به جلو نسبت به صدای استریوی معمولی است. یک استاندارد جهانی است.

در حال حاضر، تعداد زیادی منبع صوتی وجود دارد که از Dolby Pro Logic پشتیبانی می کنند. دالبی دیجیتال چطور؟ به جز دیسک های لیزری روی چه چیز دیگری می توانید دالبی دیجیتال را ضبط کنید؟

یک چیز عالی در مورد Dolby Digital انعطاف پذیری بیشتر در کدگذاری است. Dolby Digital از نظر فنی به فرمت های بسیار متنوعی اجازه می دهد، و برخی از آنها در آینده بسیار نزدیک ظاهر خواهند شد:

تلویزیون با وضوح بالا (HDTV). این جدیدترین سیستم یکی از اولین سیستم هایی است که Dolby Digital را به عنوان زیرسیستم صوتی اصلی خود انتخاب کرده است. این انتخاب توسط Grand Alliance انجام شد، سازمانی که تمام استانداردها را برای سیستم های HDTV در ایالات متحده تعیین می کند.

تلویزیون ماهواره ای - پخش مستقیم ماهواره (DBS)در حال حاضر او به طور فعال از مزایای سیستم Dolby Digital مانند کیفیت بالا و سهولت انتقال استفاده می کند. به عنوان مثال، DMX for Business از Dolby Digital برای ارائه 120 کانال موسیقی استریو، همه از یک فرستنده استفاده می کند. PrimeStar قصد دارد به زودی Dolby Digital را به سرویس تلویزیون ماهواره ای خود اضافه کند.

تلویزیون کابلیدر حال معرفی سیستم هایی با Dolby Digital به دلایل کارایی و آماده سازی برای استانداردهای سیستم های تلویزیون با کیفیت بالا در آینده است.

فرمت دیسک ویدیوی دیجیتال (DVD) از قبل شامل Dolby Digital است.

فرمت‌های دیگر مانند کاست ویدئوی دیجیتال (DVC) و پخش صوتی دیجیتال (DAB) اولین‌ها در لیست هستند که ترکیبی منحصر به فرد از صدای با کیفیت بالا، انتقال کارآمد کل طیف سیگنال و قابلیت‌های چند کاناله Dolby را معرفی می‌کنند. تکنولوژی دیجیتالی.

چه چیزی Dolby Digital را تا این حد انعطاف‌پذیر می‌کند، یا به صراحت می‌گویم، چه چیزی آن را تا این حد خوب می‌کند؟

حروف "AC" در Dolby AC-3 مخفف کدگذاری صوتی است. کدگذاری صوتی دیجیتال اغلب به عنوان "کدگذاری ادراکی" شناخته می شود. به عبارت ساده، این رمزگذاری است که سعی می‌کند اطلاعات صوتی را که به هر حال نمی‌شنویم، شناسایی و سپس حذف کند، اما آنچه را که می‌شنویم حفظ می‌کند. هدف آن جا دادن هر چه بیشتر اطلاعات مفید در طیف موجود است. بیایید یک قیاس را در نظر بگیریم:

فرض کنید باید 4000 نفر (اطلاعات مفید) را در عرض یک ساعت از یک مکان به مکان دیگر منتقل کنید. این بزرگراه تنها می تواند 1000 خودرو را در ساعت جابه جا کند. اگر همه 4000 نفر را در 1000 ماشین قرار دهید، می توانید از شر اطلاعات غیر ضروری خلاص شوید (بیایید 3000 ماشین را در خانه بگذاریم). این یک تحویل بسیار کارآمد است و سیستم Dolby Digital برای همین طراحی شده است.

یکی از دلایل بالا بودن کیفیت صدای سی دی این است که حاوی حجم عظیمی از اطلاعات است: نمونه های 16 بیتی 44100 بار در ثانیه به طور جداگانه برای هر کانال نمونه برداری می شوند. این مربوط به جریان 1411200 بیت در ثانیه است. یک دیسک فشرده یک فضای ذخیره سازی بزرگ است که می تواند تا 74 دقیقه موسیقی را روی یک دیسک ذخیره کند. اما اگر نیاز به ضبط 2 ساعت سیگنال 20 بیتی دارید و علاوه بر هر چیز دیگری، باید 6 کانال وجود داشته باشد، چه باید کرد؟ امروزه، چنین جریان داده بزرگی برای ذخیره یا انتقال غیرعملی است.

انکودر دالبی دیجیتال اولین انکودری است که به طور خاص برای صدای چند کاناله طراحی شده است. تخصص منحصر به فرد آزمایشگاه دالبی در حذف نویز صوتی برای کاهش ترافیک داده بسیار مهم است زیرا هر چه بیت های کمتری برای توصیف سیگنال صوتی استفاده شود، نویز بیشتر است.

کاهش نویز دالبی با کاهش سطح نویز در غیاب سیگنال صوتی کار می‌کند، در حالی که به سیگنال صوتی مورد نظر قوی‌تر اجازه می‌دهد نویز را بپوشاند یا "ماسک" کند. اما این به شما امکان می دهد فقط نویزهایی را بپوشانید که از نظر فرکانس نزدیک به سیگنال مفید است. بنابراین، Dolby Digital طیف صوتی را برای هر کانال به نوارهای باریک با اندازه های مختلف تقسیم می کند که برای انتخاب فرکانس شنوایی انسان بهینه شده است. این اجازه می دهد تا نویز دیجیتالی سازی با دقت زیادی فیلتر شود به طوری که از نظر فرکانس بسیار نزدیک به فرکانس سیگنال رمزگذاری شده است. سیگنال صوتی به طور موثر نویز را خفه می کند و آن را برای گوش غیر قابل شنیدن می کند. در جایی که کمبود سیگنال اجازه نمی دهد نویز دیجیتالی شدن را پنهان کند، دالبی دیجیتال تمام تلاش خود را برای کاهش آن انجام می دهد. می توان گفت که Dolby Digital یک سیستم کاهش نویز بسیار موثر است و در نتیجه کیفیت صدا از نظر ذهنی بسیار نزدیک به اصلی است.

دالبی دیجیتال از فناوری "bitpool مشترک" و همچنین مدل پوشش شنوایی انسان برای دستیابی به بالاترین بازده داده های ارسالی استفاده می کند. بیت ها به طور نابرابر در بین بسیاری از باندهای فرکانسی باریک توزیع می شوند و در هر مورد خاص بسته به طیف و ساختار دینامیکی سیگنال رمزگذاری شده متفاوت است. با استفاده از مدل پوشش شنوایی، رمزگذار تعداد بیت های بهینه را برای سیگنال صوتی در هر باند فراهم می کند. علاوه بر این، بیت‌ها بین کانال‌های مختلف مطابق با مدلی توزیع می‌شوند که بر اساس آن کانالی که از فرکانس‌ها اشباع‌تر است به داده‌های بیشتری نسبت به سایر کانال‌های ضعیف پر شده نیاز دارد، و همچنین در نظر می‌گیرد که یک سیگنال قوی در یک کانال کانال می تواند نویز در حال ظهور در کانال های دیگر را پنهان کند. در نتیجه، Dolby Digital می‌تواند به نسبت داده‌های بیشتری برای رمزگذاری صدا استفاده کند، سیگنالی با کیفیت بالاتر تولید کند و به کانال‌های صوتی متعدد اجازه می‌دهد تا در جریان‌های داده با نرخ بیت پایین‌تر از حتی یک کانال منفرد روی سی‌دی کدگذاری شوند.

داده های تکنیکی

رمزگذار Dolby Digital قادر به پردازش یک سیگنال ورودی با حداقل یک سیگنال دیجیتال پویا 20 بیتی با محدوده فرکانس 20 تا 20000 هرتز ± 0.5 دسی بل (3-dB در 3 و 20300 هرتز) است. کانال فرکانس پایین محدوده 20 تا 120 هرتز ± 0.5 دسی بل (3- دسی بل در 3 و 121 هرتز) را پوشش می دهد. نرخ نمونه برداری 32، 44.1 و 48 کیلوهرتز پشتیبانی می شود. عرض جریان داده خروجی می تواند از حداقل 32 کیلوبیت بر ثانیه برای یک کانال تک تک تا حداکثر 640 کیلوبیت در ثانیه متغیر باشد که طیف کاملی از نیازها را برآورده می کند. نرخ معمولی 384 کیلوبیت در ثانیه برای فرمت‌های مصرفی Dolby Digital "5.1" و برای صدای دو کاناله 192 کیلوبیت در ثانیه است.

دالبی دیجیتال

فیلم با صدای دیجیتال و آنالوگ

دالبی دیجیتال (AC-3، ATSC A/52) (Dolby Digital) - یک سیستم بازتولید صدای فضایی که توسط Dolby Laboratories, Inc. ("آزمایشگاه های دالبی")، به رهبری ری دالبی، پیشگام در صنعت صوتی و تصویری.

قالب استاندارد شده کمیته سیستم های تلویزیون پیشرفته، به او کد A/52 اختصاص داده شد، دالبی دیجیتال (DD)یک علامت تجاری است.

سیستم های مدرن Dolby Digital شش کانال صدای فراگیر دیجیتال را ارائه می دهند. کانال های جلوی چپ، مرکز و راست به شما این امکان را می دهند که موقعیت منبع صدا را به طور دقیق روی صفحه تعیین کنید. مجزای "تقسیم" کانال های سمت چپ و راست عقب، حس حضور را افزایش می دهد و حجم را ایجاد می کند. و یک کانال با فرکانس پایین اضافی به عملکرد روی صفحه نمایش می افزاید.

در صنعت فیلم، موسیقی متن Dolby Digital به صورت نوری مستقیماً روی نوار فیلم در فضاهای بین سوراخ‌های پانچ کدگذاری می‌شود. قرار دادن یک موسیقی متن دیجیتال روی همان رسانه فیلم به آن امکان می دهد بدون نیاز به رسانه ذخیره سازی اضافی با آهنگ آنالوگ همزیستی داشته باشد و همچنین هماهنگی مطلق تصویر و صدا را تضمین می کند. در سینماهای IMAX، صدا بر روی یک هارد دیسک جداگانه ضبط می شود و با استفاده از کد زمانی SMPTE با فیلم هماهنگ می شود.

جریان دیجیتال در خروجی رمزگذار، دنباله ای از فریم های صوتی است (بسته AC-3 Frame). اطلاعات موجود در آن را می توان به طور مشروط به دو بخش اصلی (اطلاعات اصلی) و اضافی (اطلاعات جانبی) تقسیم کرد.

قاب صوتی انکودر شامل شش بلوک صوتی است. هر بلوک صوتی حاوی اطلاعاتی در مورد 512 نمونه برای هر یک از سیگنال های رمزگذاری شده (صدا 1، صوتی 2، ...، صوتی n) است. با توجه به همپوشانی زمانی 50 درصد، 256 نمونه از بلوک قبلی و 256 نمونه جدید برای هر سیگنال در بلوک صوتی گنجانده شده است. در شش بلوک صوتی یک فریم صوتی، تعداد کل نمونه های پردازش شده برای هر یک از سیگنال های ورودی برابر با 512 × 6 = 3072 خواهد بود. توجه داشته باشید که اگر تعداد سیگنال های صوتی رمزگذاری شده 5 باشد (فرمت 3/2)، پس تعداد کل نمونه هایی که اطلاعات مربوط به آنها در یک فریم صوتی موجود است (512 × 5) × 6 = 15360 خواهد بود، اما با در نظر گرفتن 50 درصد همپوشانی زمانی، تنها 15360 ÷ 2 = 7680 نمونه جدید وجود خواهد داشت. .

پس از نمونه برداری از نمونه ها با تقسیم بندی زمانی، سیگنال صوتی هر کانال با استفاده از تبدیل کسینوس گسسته اصلاح شده (MDCT) به مجموعه جدیدی از داده های دیجیتال تبدیل می شود. تقسیم بندی سیگنال های صوتی بر اساس زمان با همپوشانی 50 درصدی نمونه ها و تبدیل آنها از زمان به حوزه فرکانس در بلوک تبدیل زمان-فرکانس (تبدیل دامنه فرکانس) انجام می شود. قبل از تبدیل متعامد، نمونه هایی از سیگنال های صوتی توسط یک تابع پنجره وزن می شوند. دومی در استاندارد A/52 در جدول ارائه شده است.

تبدیل نمونه صوتی حوزه زمانی را می توان با استفاده از یک تبدیل طولانی (512 نقطه) یا دو تبدیل کوتاه (256 نقطه) انجام داد. در حالت اول 256 و در حالت دوم به ترتیب ضرایب MDCT 128 + 128 به دست می آید. با یک نمونه کوتاه، ضرایب MDCT هر دو بخش، حاوی 128 مقدار، با متناوب کردن آنها در یک بلوک مشترک ترکیب می شوند. این بلوک کلی همچنین شامل 256 ضریب MDCT خواهد بود.

تبدیل طولانی برای سیگنال هایی که به آرامی در طول زمان در دامنه تغییر می کنند ترجیح داده می شود. وضوح فرکانس بهتری دارد. تبدیل کوتاه وضوح زمانی بهتری را ارائه می دهد و برای سیگنال هایی استفاده می شود که دامنه آنها با زمان به سرعت تغییر می کند، مانند منطقه حمله صدا. پرچم Block Switch Flags (blksw flags) نشان می دهد که کدام تبدیل (بلند یا کوتاه) هنگام محاسبه ضرایب MDCT اعمال می شود. پارامتر Block Switch Flags در جریان داده های دیجیتال خروجی به عنوان اطلاعات اضافی گنجانده شده است و توسط رمزگشا هنگام انجام تبدیل متعامد معکوس استفاده می شود.

در نرخ داده‌های دیجیتال پایین، رمزگذار Dolby AC-3 استفاده از روش خاصی را برای ترکیب سیگنال‌های کانال (Coupling) فراهم می‌کند که امکان استفاده از بیت‌های کمتری را هنگام رمزگذاری آنها ممکن می‌سازد.

در سیستم Dolby AC-3، هر ضریب MDCT در قالب ممیز شناور با دو مقدار نشان داده می شود: یک توان (یا توان) و یک مانتیس: Xd[k] = A[k] × 2 -B[k]، که در آن A[k] و B [k] - به ترتیب مانتیس و ترتیب ضریب تبدیل kth. ترتیب برابر است با تعداد صفرهای قبل از اولین نمایش دودویی ضریب MDCT. اساساً عامل مقیاس آن (یا عامل عادی سازی) آن است. به عنوان مثال، اگر ضریب MDCT Xd[k] = 0.158 و نمایش باینری آن به صورت 0.001010000110 نوشته شود، آنگاه ترتیب (ضریب مقیاس) B[k] = 2 و مانتیس 0.10100000110 در باینری یا A[k] = 0 است. 6308 در سیستم های اعشاری. علامت ضریب MDCT هنگام رمزگذاری مانتیس در نظر گرفته می شود. قبل از رمزگذاری، مانتیس ها عادی می شوند (Normalize Mantissas). توان و مانتیس ضرایب MDCT به طور جداگانه در بلوک‌های Encode Exponent و Quantisse، Encode Mantissas کدگذاری می‌شوند.

بلوک Bit Allocation اثر پوشاندن را در نظر می گیرد. روش انتخاب بیت بر اساس یک مدل شنوایی است که به فرد امکان می دهد حداکثر مقدار مجاز (آستانه) سطح نویز را که هنوز توسط سیگنال مفید در باند رمزگذاری پوشانده می شود و مطابق با داده های این محاسبات، تخمین بزند. ، برای انتخاب تعداد بیت های مربوطه هنگام رمزگذاری مانتیس ضرایب MDCT. همه این محاسبات در بلوکی که معمولاً مدل روان آکوستیک نامیده می شود انجام می شود. هر آخوندک نرمال شده با تعدادی مرحله کوانتیزه شدن متناظر با تعداد بیت های تعریف شده در ماژول Bit Allocation کوانتیزه می شود.

ترتیب رمزگذاری ضریب MDCT در رمزگذار Dolby AC-3 عددی است که از 0 تا 24 متغیر است. بنابراین، کلمه رمز ترتیب باید حداقل m = 5 بیت (2 5 = 32) داشته باشد. حداکثر سفارش در رمزگذار به 24 محدود شده است.

مشخص است که اگر طیف سیگنال صوتی نمونه با استفاده از یک بانک از فیلترها که هر کدام دارای باند فرکانسی نسبتاً باریکی هستند تجزیه و تحلیل شود، تفاوت در سطوح انرژی سیگنال بین فیلترهای مجاور به ندرت از 12 دسی بل تجاوز می کند. این شرایط هنگام کدگذاری سفارش ها در نظر گرفته شد. هنگام رمزگذاری سفارشات در رمزگذار Dolby AC-3، از روش مدولاسیون کد پالس تفاضلی استفاده می شود، زمانی که خود ترتیب کدگذاری نمی شود، بلکه تفاوت بین مقادیر ترتیب ضرایب MDCT مجاور است. مرتبه اول. مقدار سیگنال هر کانال در اولین باند تحلیل فرکانس پایین است - این همیشه یک کلمه رمز چهار بیتی است که با محدوده اعداد از 0 تا 15 مطابقت دارد. ترتیب در باند تحلیل فرکانس بالاتر بعدی به صورت تعیین می شود. تفاوت بین مقادیر سفارش فعلی و قبلی ضرایب MDCT مربوطه. در رمزگذار Dolby AC-3، وضوح مدولاسیون کد پالس دیفرانسیل (گسستگی تغییر دستورات) در طول رمزگذاری به مقادیر -2، -1، 0، +1، +2 محدود می شود. حداکثر تغییر در ترتیب ضرایب MDCT مجاور 2± است که مربوط به ± dB 12 است.

مقدار دیفرانسیل دستورات ضرایب MDCT در گروه ها ترکیب می شود. برای روش گروه بندی، از سه استراتژی ممکن استفاده می شود که در استاندارد به عنوان D15، D25 و D45 تعیین شده است. در استراتژی D15 هر کدام جفتو در استراتژی D45 هر چهارمقادیر سفارش دیفرانسیل با یک مقدار واحد از عدد M در جریان داده دیجیتال نشان داده می شود.

مقادیر سفارش دیفرانسیل که مستقیماً از ضرایب MDCT اصلی به دست می‌آیند، در عمل، همیشه حداکثر اختلاف را بین ضرایب مجاور که از محدوده ± 2 تجاوز نمی‌کند، که طبق جداول مربوطه استاندارد Dolby AC-3 مورد نیاز است، ایجاد نمی‌کند. . بنابراین، پردازش اضافی آرایه سفارش قبل از رمزگذاری ضروری است. با کمک آن، برخی از مقادیر سفارش کاهش می یابد، اما در عین حال مقادیر مربوط به مانتیس تغییر می کنند به طوری که صفرها در جلوی آنها در نمایش باینری آنها ظاهر می شوند. پس از انجام این عمل، حداکثر ترتیب دیفرانسیل دیگر از مقدار لازم 2± تجاوز نخواهد کرد.

انتخاب استراتژی (D15، D25 یا D45) برای کدگذاری دستورات ضرایب MDCT، مصالحه ای بین وضوح فرکانس خوب، وضوح زمانی و تعداد بیت های مورد نیاز برای رمزگذاری نماها است. استراتژی‌های D15 و D25 را می‌توان برای رمزگذاری سیگنال‌هایی استفاده کرد که طیف غیریکنواختی دارند، زمانی که مقدار توان به سرعت از یک باند تحلیلی به باند دیگر تغییر می‌کند. اگر طیف سیگنال به اندازه کافی صاف (مسطح) باشد، از استراتژی های رمزگذاری D45 استفاده می شود.

پس از انتخاب یک استراتژی رمزگذاری سفارش، رمزگذار Dolby AC-3 کلمات رمز مربوط به مقادیر توان دیفرانسیل را به گروه ها گروه بندی می کند. برای همه حالت‌های عملکرد رمزگذار، مجموعه‌ای از اعداد M برای سه ضریب MDCT مجاور (k، k + 1، k + 2) M[k]، M، M طبق قانون به عنوان یک کلمه هفت بیتی گروه‌بندی و کدگذاری می‌شوند:

دامنه تغییرات در مانتیس ضرایب MDCT در محدوده 1- تا 1+ قرار دارد. علامت ضریب MDCT هنگام رمزگذاری آخوندک در نظر گرفته می شود. فرآیند کوانتیزه کردن آخوندک ضرایب MDCT در استاندارد Dolby AC-3 دارای ویژگی های زیر است:

  • تعداد مراحل کوانتیزاسیون ممکن با سری اعداد زیر مطابقت دارد: 0، 3، 5، 7، 11، 15، 32، 64، 128، 256، 512، 1024، 2048، 4096، 16384، 65536. کوانتیزاسیون یکنواخت مانتیس ها استفاده می شود.
  • هنگامی که تعداد مراحل کوانتیزاسیون 3، 5، 7، 11 و 15 باشد، به اصطلاح کوانتیزاسیون متقارن استفاده می شود، در سایر موارد - نامتقارن.
  • زمانی که تعداد مراحل کوانتیزه شدن 3، 5 و 11 باشد، رمز واژه های مانتیس در گروه ها ترکیب می شوند. با سه مرحله کوانتیزاسیون، سه کلمه رمز مربوط به سه مقدار mantissa با یک کلمه رمز پنج بیتی کدگذاری می شوند. با پنج مرحله کوانتیزه کردن، سه کلمه رمز مانتیس گروه بندی شده و در یک کلمه رمز هفت بیتی کدگذاری می شوند. با 11 مرحله کوانتیزاسیون، دو کلمه رمز مانتیس گروه بندی شده و در یک کلمه رمز هفت بیتی کدگذاری می شوند. در موارد دیگر هیچ روش گروه بندی وجود ندارد.

با کوانتیزاسیون متقارن، به جای مقادیر کوانتیزه شده آخوندک ها، شاخص های آنها که در جدول مربوطه مشخص شده است، در جریان دیجیتال قرار می گیرند. به عنوان مثال، اگر تعداد مراحل کوانتیزه کردن 3 باشد، و مقدار مانتیس در محدوده 1- تا 1/3- باشد، مقداری برابر با 2/3- به رمزگشا منتقل می شود و شاخص mc = 0 با آن مطابقت دارد.اگر مقدار mantissa در محدوده 1/3- تا 1/3+ قرار داشته باشد، مقدار برابر با صفر به رمزگشا منتقل می شود و شاخص mc = 1 رمزگذاری می شود. و در نهایت، اگر مقدار مانتیس در محدوده 1/3+ تا 1+ است، سپس مقدار برابر با 2/3+ به رمزگشا منتقل می‌شود و شاخص جدول مربوطه mc=2 کدگذاری می‌شود. به همین ترتیب، به شکل جداول، فواصل مقادیر آخوندک و شاخص های مربوط به تعداد مراحل کوانتیزه سازی به ترتیب برابر با 5، 7، 11 و 15 می باشد.این روش کوانتیزه کردن امکان کاهش تعداد بیت های مورد نیاز را فراهم می کند. برای تمام مراحل کوانتیزاسیون دیگر (32، 64، ...، 65536)، این شاخص‌ها نیستند که کدگذاری می‌شوند، بلکه آخوندک‌های خود ضرایب MDCT هستند.

مرحله بعدی رمزگذاری و بسته بندی شاخص های جدولی مقادیر کوانتیزه مانتیس در یک جریان دیجیتال است. با کوانتیزاسیون متقارن، یک روش گروه بندی اضافی برای کاهش تعداد بیت های مورد نیاز برای کدگذاری شاخص ها استفاده می شود. به عنوان مثال، اگر تعداد مراحل کوانتیزاسیون 7 باشد، شاخص mantissa از 0 تا 6 متغیر است. رمزگذاری این سری از اعداد به 3 بیت نیاز دارد. با 11 مرحله کوانتیزه کردن، شاخص جدول آخوندک در محدوده 0 تا 10 قرار دارد، و با 15 مرحله کوانتیزه کردن، در حال حاضر در محدوده 0 تا 14 قرار دارد. در این حالت، تعداد بیت های مورد نیاز برای رمزگذاری هر یک از آنهاست. آنها به ترتیب 4 یا 5 هستند.گروه بندی شاخص های جدول اجازه می دهد تا تعداد بیت های مورد نیاز برای رمزگذاری آنها را در 3، 5 و 11 مرحله کوانتیزاسیون کاهش دهد. با 3 و 5 مرحله کوانتیزاسیون، سه شاخص آخوندک جدولی و با 11 مرحله کوانتیزه کردن، دو شاخص آخوندک جدولی با یک کلمه رمز طبق قوانین زیر کدگذاری می شوند:

کد_گروه = 9mc[a] + 3mc[b] + mc[c]; کد_گروه = 25 mc[a] + 5 mc[b] + mc[c]; کد_گروه = 11 mc[a] + mc[b]،

که در آن Group_code، Group_code و Group_code کلمات کد گروه‌های شاخص جدولی مانتیس‌ها هستند، به ترتیب، در 3، 5، 11 مرحله کوانتیزاسیون. mc[a]، mc[b]، mc[c] - شاخص‌های جدول آخوندک‌های ضرایب MDCT با اعداد a، b و c. بنابراین، با سه مرحله کوانتیزه کردن آخوندک (n = 3)، کلمه رمز یک گروه متشکل از سه شاخص شامل 5 بیت خواهد بود، بنابراین در این حالت 5 ÷ 3 = 1.67 بیت برای رمزگذاری هر آخوندک صرف می شود. با n = 5، کلمه کد گروه mantissa به عنوان یک عدد هفت بیتی نمایش داده می شود و رمزگذاری هر مانتیس به 7 ÷ 3 = 2.33 بیت نیاز دارد. و در نهایت، با n = 11، رمزگذاری هر مانتیس به 7 ÷ 2 = 3.5 بیت و با n = 15 - 4 بیت و غیره نیاز دارد.

رمزگذار طول کلمه رمز هر آخوندک یا شاخص جدول مربوطه را تعیین می کند، پس از آن آخوندک ها با استفاده از روش خاصی از بسته بندی باز می شوند.

هنگام کار در حالت ترکیب سیگنال‌های صوتی، رمزگذار بخش‌های فرکانس بالا از سیگنال‌های اصلی را در یک باند فرکانس مشخص در یک سیگنال مشترک ترکیب می‌کند و علاوه بر این مختصات به اصطلاح ترکیبی را تولید می‌کند. دومی توسط رمزگشا برای بازیابی نسبت های انرژی بخش های فرکانس بالا از طیف هر سیگنال اصلی که تحت فرآیند ترکیب قرار می گیرند استفاده می شود. پس از رمزگشایی، قطعات ترکیب شده در هر یک از سیگنال های بازسازی شده ترکیب طیفی یکسانی خواهند داشت و تنها در سطح متفاوت هستند.

رمزگذار با افزودن ضرایب MDCT سیگنال های ترکیبی، یک سیگنال مشترک تولید می کند. در این مورد، ضرایب MDCT از 37 تا 252 به 18 زیر باند (به اصطلاح باندهای ترکیبی) با 12 ضریب در هر زیر باند گروه بندی می شوند. محدودیت فرکانس پایین و بالای باندهای ترکیبی توسط کاربر مشخص می شود. مختصات ترکیب برای هر سیگنال زیر باند ترکیب شده محاسبه می شود. آنها نسبت حداکثر ضرایب MDCT هر سیگنال ترکیبی و کل سیگنال در زیر باند ترکیبی را نشان می دهند. در مرحله بعد، مختصات اتحادیه به فرمت ممیز شناور تبدیل می شود و به عنوان اطلاعات اضافی در جریان داده خروجی قرار می گیرد. سیگنال کل (ترکیب) به همان روشی که سیگنال کانال های مستقل رمزگذاری می شود.

رسیور سیستم Dolby AC-3

رسیور Dolby AC-3 سفارشات ضرایب MDCT را به صورت کدگذاری شده و بسته بندی شده دریافت می کند. برای فشرده سازی و رمزگشایی آنها، لازم است اطلاعات بیشتری در مورد تعداد توان های ارسالی در سیگنال هر کانال و در مورد استراتژی رمزگذاری آنها (D15, D25, D45) مورد استفاده در رمزگذار داشته باشید. فرآیند رمزگشایی سفارش در بلوک Decode Exponent انجام می شود. پس از رمزگشایی سفارشات، مراحل بازکردن، کمی‌زدایی و غیرعادی کردن آخوندک‌ها از ضرایب MDCT (Dequantize, Denormalize Mantissas) انجام می‌شود. برای انجام آن، از پارامترهای مدل روان آکوستیک، پارامترهایی که توزیع بیت ها را در رمزگذار تعیین می کنند و همچنین بازیابی مقادیر سفارش ضرایب MDCT استفاده می شود. عملیات غیرعادی کردن آخوندک ها با جابجایی بیت های رمز آخوندک به سمت راست انجام می شود. در این مورد، تعداد شیفت ها با ترتیب ضریب MDCT مربوطه تعیین می شود. اگر رمزگذار از روش ترکیب سیگنال ها از تعدادی کانال استفاده می کند، بدیهی است که رمزگشا باید عملیات معکوس (De-Coupling) را با استفاده از مقادیر مختصات ترکیبی ارسال شده به رمزگشا در قسمت اطلاعات اضافی انجام دهد. در بلوک MDCT متعامد معکوس (تبدیل معکوس)، سیگنال بازسازی شده در رمزگشا به صورت معکوس به حوزه زمان تبدیل می شود.

S.I. BSI بلوک صوتی 0 بلوک صوتی 1 بلوک صوتی 2 بلوک صوتی 3 بلوک صوتی 4 بلوک صوتی 5 داده های AUX CRC

طرح 1. ساختار داده قاب صوتی سیستم Dolby AC-3.

پرچم های سوئیچ را مسدود کنید پرچم های دیتر کنترل برد دینامیکی استراتژی جفت مختصات جفت استراتژی توان توان پارامترهای تخصیص بیت مانتیس

طرح 2. ساختار داده واحد صوتی سیستم Dolby AC-3.

ساختار داده های صوتی در استاندارد Dolby AC-3 در شکل 1 نشان داده شده است. فیلد داده سرصفحه یک فریم صوتی حاوی اطلاعات SI (اطلاعات همگام ساز) و BSI (اطلاعات جریان بیت) اطلاعات پیکربندی جریان داده است.

فیلد داده SI شامل کلمه همگام سازی (0000 1011 0111 0111 یا OB77h)، بیت های کدگذاری کنترل نویز (CRC)، سرعت نمونه برداری و اندازه فریم صوتی است. یک قاب صوتی Dolby AC-3 شامل دو کلمه CRC 16 بیتی است، اولی در ابتدای هر فریم بعد از کلمه همگام سازی و دومی در پایان. فیلد داده BSI حاوی اطلاعاتی در مورد پیکربندی جریان داده دیجیتال است، به عنوان مثال، مانند نوع سرویس، حالت عملکرد رمزگذار (یعنی تعداد سیگنال های رمزگذاری شده یا نوع فرمت صوتی)، سطح صوتی مطلق. از سیگنال هر کانال، اطلاعات زبان، اطلاعات زمان و موارد دیگر.

ساختار داده یک بلوک صوتی در نمودار 2 نشان داده شده است. شامل فیلدهای بیت زیر است: پرچم های سوئیچ بلوک - پارامتر طول تبدیل متعامد. پرچم های Dither - نشانه ای از وجود نویز اضافی. کنترل محدوده دینامیکی - کنترل داده ها برای محدوده دینامیکی سیگنال های ارسالی. استراتژی جفت - اطلاعاتی در مورد ترکیب سیگنال ها (سیگنال هایی که کدام کانال ها ترکیب شده اند و از چه فرکانس شروع می شوند). مختصات جفت - مختصات جفت برای سیگنال هر کانال. استراتژی توان - استراتژی رمزگذاری سفارش انتخاب شده. نماها - کلمات کد برای ترتیب ضرایب MDCT. پارامترهای تخصیص بیت - پارامترهای مدل روان آکوستیک. Mantissas - کلمات کد برای آخوندک از ضرایب MDCT.

فناوری های دیجیتال دالبی

Dolby Digital EX

EX پیشوندی است که برای تعیین سیستم های صوتی Dolby Digital با 6.1 کانال استفاده می شود: دو کانال جلو، مرکز، فرکانس پایین، پشتی فراگیر و دو کانال فراگیر جانبی.

Dolby Digital Surround-EX

Dolby Digital Surround-EX کانال سوم صدای فراگیر را به موسیقی متن اضافه می کند. این ایده متعلق به مهندسان صدا استودیو Skywalker Sound است. این فناوری به طور مشترک با آزمایشگاه های Dolby و Lucasfilm THX توسعه یافته است.

Dolby Digital Live

Dolby Digital Live (DDL) یک فناوری برای رمزگذاری سیگنال های صوتی چند کاناله (5.1) به فرمت AC3 در زمان واقعی است که توسط Dolby Technologies پیشنهاد شده است. طراحی شده برای انتقال صدای چند کاناله از بازی ها و سایر برنامه ها به گیرنده از طریق رابط S/PDIF (اپتیکال یا کواکسیال).

استفاده از آن به شما این امکان را می دهد که از محدودیت هایی خلاص شوید که به دلیل آن تنها آهنگ های آماده (یعنی رمزگذاری شده در فرمت AC3 یا DTS) چند کاناله، معمولاً موسیقی متن فیلم ها، می توانند از طریق رابط های دیجیتال منتقل شوند و در بازی ها وجود دارد. قابلیت های خروجی دیجیتال به صدای معمولی استریو محدود می شد. (برای فول 5.1 در بازی ها در این گونه موارد، اتصال آنالوگ سه سیمه لازم است، البته در صورت امکان).

اشکال اساسی و مهلک فناوری DDL کاهش کیفیت صدا از فشرده سازی آن به فرمت AC3 است (مقایسه با انتقال از CD-Audio به mp3 با نرخ بیت بالا)، که با این حال، برای هدف اصلی آن کاملاً غیرقابل توجه است. کاربرد.

در حال حاضر، این فناوری عمدتاً در مادربردهای مجهز به کدک های Realtek ALC882D، ALC888DD و ALC888H و همچنین برخی از کدک های C-Media یافت می شود. چنین بردهایی را می توان با عبارت "AC3 Encode" یا "Dolby Digital Live" در توضیحات محصول یافت.

این فناوری در لپ‌تاپ‌ها نیز شروع به معرفی می‌کند، جایی که با توجه به کمبود فضا برای اتصالات آنالوگ "اضافی"، بیشترین مزیت‌ها را نوید می‌دهد - یک کانکتور به شما امکان می‌دهد تا صدای 5.1 کامل را در همه برنامه‌ها دریافت کنید، به شرطی که لپ‌تاپ را وصل کنید. به یک گیرنده یا مجموعه ای از بلندگوهای فعال با رمزگشای داخلی.

از بین کارت های صوتی جداگانه ای که از این فناوری پشتیبانی می کنند، باید به Terratec Aureon 7.1 اشاره کرد و در کارت های صوتی محبوب خانواده Creative X-Fi پشتیبانی از DDL وجود ندارد، اما (طبق اطلاعات غیر رسمی) در آینده امکان پذیر است. که با انتشار نسخه جدید درایورها به صورت عطف به ماسبق معرفی خواهد شد.

برای سال 2010، مدل‌های زیر از خانواده Creative X-Fi از این فناوری پشتیبانی می‌کنند: CREATIVE X-Fi Titanium 7.1، CREATIVE X-Fi Titanium Fatal1ty Pro 7.1، CREATIVE X-Fi Titanium Fatal1ty Champion 7.1

دالبی دیجیتال پلاس

MIPS Technologies و Dolby Laboratories فناوری صوتی جدیدی را برای دستگاه‌هایی معرفی کرده‌اند که از پخش ویدیو و صدا با کیفیت بالا پشتیبانی می‌کنند، مانند پخش‌کننده‌های HD DVD و Blu-ray. فناوری صوتی Dolby Digital Plus نام دارد و می تواند در هسته های ریزپردازنده MIPS32 استفاده شود.

همچنین Dolby Digital Plus به لطف پشتیبانی از تعداد کانال‌های حتی بیشتر از آنچه با Dolby Digital امکان‌پذیر بود، کیفیت ضبط محتوای صوتی در HD DVD و رسانه‌های دیسک بلو-ری را بهبود می‌بخشد. این شرکت ها به توسعه دهندگان راه حل های SoC (سیستم روی تراشه) انواع کدک یکپارچه Dolby Digital Plus مبتنی بر هسته MIPS را ارائه خواهند داد.

ویژگی ها:

  • صدای چند کاناله با کانال های مستقل
  • پشتیبانی از 7.1 کانال* و امکان داشتن چندین برنامه صوتی در یک جریان
  • خروجی پخش جریانی Dolby Digital برای سازگاری با دستگاه های قدیمی
  • حداکثر سرعت جریان تا 6 مگابیت در ثانیه
  • نرخ بیت از 3 مگابیت بر ثانیه در HD DVD و تا 1.7 مگابیت در ثانیه در دیسک بلوری
  • HDMI پشتیبانی می شود
  • یک جریان ممکن است حاوی مطالبی به زبان های مختلف باشد
  • گزینه های رمزگذاری جدید برای حرفه ای های صوتی
  • کیفیت بالا را با نرخ داده پخش کارآمدتر حفظ می کند (200 کیلوبیت بر ثانیه برای 5.1 کانال)

«دالبی دیجیتال پلاس از بیش از 8 کانال صوتی پشتیبانی می کند. استانداردهای HD DVD و دیسک های بلوری در حال حاضر این تعداد را به 8 محدود می کند.

Dolby TrueHD

Dolby TrueHD یکی از دو فرمت صوتی اولیه فشرده نشده (فشرده بدون اتلاف) است که فقط برای پخش کننده های HD نوری موجود است. اگرچه کدک Dolby TrueHD اختیاری است، فرمت به طور گسترده توسط پخش کننده ها و دیسک های Blu-ray پشتیبانی می شود (بسیار بیشتر از DD+، که اغلب در دیسک های Blu-ray وجود ندارد). Dolby TrueHD از الگوریتم فشرده سازی Meridian Lossless Packing (MLP) استفاده می کند. جریان دیجیتال Dolby TrueHD می تواند تا 14 کانال صوتی جداگانه را در خود جای دهد، اما در عمل با 6 (5.1) یا 8 (7.1) کانال کار می کند. Dolby TrueHD تا عمق 24 بیت و نرخ نمونه برداری تا 192 کیلوهرتز (برای حداکثر جریان غیر فشرده 63 مگابیت بر ثانیه) پشتیبانی می کند، اما برای Blu-ray در حال حاضر حداکثر 8 کانال در 24 بیت و 96 کیلوهرتز موجود است. یا 6 کانال در 24 بیت و 192 کیلوهرتز) برای حداکثر جریان فشرده 18 مگابیت بر ثانیه. جست‌وجوی فیلم‌های موجود Dolby TrueHD روی دیسک‌های بلوری نشان داد که در حال حاضر تنها نیمی از آنها در دسترس است: 6 کانال با نرخ نمونه‌برداری 96 کیلوهرتز و عمق 24 بیت (معادل 13.5 مگابیت در ثانیه فشرده نشده و 9 مگابیت در ثانیه فشرده). دیسک هایی با کنسرت های گروه دیو متیوز و تیم رینولدز که نمرات عالی از نظر کیفیت را در وب سایت Cinema Squid دریافت کردند).

مشخصات آهنگ Dolby TrueHD برای فیلم های Blu-ray به شرح زیر است:

  • کدک صوتی - Dolby TrueHD.
  • کانال ها (طرح صدا) تقریباً همیشه 5.1، 6.1 و 7.1 بسیار نادر هستند.
  • داده های وضوح صدا اغلب در دسترس نیستند، اما مقادیر معمولی عبارتند از: 16 بیت در 48 کیلوهرتز یا 24 بیت در 48 کیلوهرتز. برای برخی از دیسک های زنده این مقادیر 24 بیت در 96 کیلوهرتز هستند.
  • مقدار جریان معمولاً در دسترس نیست، اما معمولاً 4608 کیلوبیت در ثانیه (4.5 مگابیت در ثانیه، که مربوط به شش کانال در 48 کیلوهرتز و 16 بیت است) است. بالاترین میزانی که روی دیسک‌های Blu-ray کنسرت‌های تجاری دیده‌ایم، 9.0 مگابیت بر ثانیه بود که معادل 6 کانال در 96 کیلوهرتز و 24 بیت است. حداکثر مقدار برای Blu-ray 18 مگابیت در ثانیه است.

فناوری های دالبی در رسانه های نوری

HD DVD دیسک بلوری DVD-Video DVD-Audio دیسک لیزری
کدک پشتیبانی سخت افزاری تعداد کانال ها (حداکثر) حداکثر نرخ جریان پشتیبانی سخت افزاری تعداد کانال ها (حداکثر) حداکثر نرخ جریان پشتیبانی سخت افزاری تعداد کانال ها (حداکثر) حداکثر نرخ جریان پشتیبانی سخت افزاری تعداد کانال ها (حداکثر) حداکثر نرخ جریان پشتیبانی سخت افزاری تعداد کانال ها (حداکثر) حداکثر نرخ جریان
دالبی دیجیتال لزوما 5.1 504 کیلوبیت بر ثانیه لزوما 5.1 640 کیلوبیت بر ثانیه لزوما 5.1 448 کیلوبیت بر ثانیه علاوه بر این در بخش ویدیو برای سازگاری با پخش کننده های DVD معمولی 5.1 448 کیلوبیت بر ثانیه علاوه بر این 5.1 384 کیلوبیت بر ثانیه
دالبی دیجیتال پلاس 7.1 3 مگابیت بر ثانیه علاوه بر این 7.1 1.7 مگابیت بر ثانیه استفاده نشده
Dolby TrueHD 8 18 مگابیت بر ثانیه 8 18 مگابیت بر ثانیه
  • صدای دالبی دیجیتال اولین بار در سال 1992 با بازی Batman Returns در سینماها ظاهر شد.
  • انگیزه توسعه Dolby Digital Surround-EX نیاز به تصویر صوتی از یک سفینه فضایی در حال پرواز بر فراز سالن در فیلم "جنگ ستارگان" بود. اپیزود اول: تهدید شبح."

همچنین ببینید

  • Dolby Atmos
  • Immsound
  • صدای دیجیتال

ادبیات

  1. استاندارد فشرده‌سازی صوتی دیجیتال (AC-3)/Doc.A/52، 1995-12-20
  2. I. A. Aldoshina، E. I. Vologodin، A. P. Efimov و دیگران.الکتروآکوستیک و پخش صدا: کتاب درسی برای دانشگاه ها / ویرایش شده توسط Yu. A Kovalgin. - م.: خط تلفن، مخابرات، رادیو و ارتباطات، 1386. - 872 ص: ill.

پیوندها

دالبی دیجیتال

فیلم با صدای دیجیتال و آنالوگ

دالبی دیجیتال (AC-3، ATSC A/52) (Dolby Digital) - یک سیستم بازتولید صدای فضایی که توسط Dolby Laboratories, Inc. ("آزمایشگاه های دالبی")، به رهبری ری دالبی، پیشگام در صنعت صوتی و تصویری.

قالب استاندارد شده کمیته سیستم های تلویزیون پیشرفته، به او کد A/52 اختصاص داده شد، دالبی دیجیتال (DD)یک علامت تجاری است.

سیستم های مدرن Dolby Digital شش کانال صدای فراگیر دیجیتال را ارائه می دهند. کانال های جلوی چپ، مرکز و راست به شما این امکان را می دهند که موقعیت منبع صدا را به طور دقیق روی صفحه تعیین کنید. مجزای "تقسیم" کانال های سمت چپ و راست عقب، حس حضور را افزایش می دهد و حجم را ایجاد می کند. و یک کانال با فرکانس پایین اضافی به عملکرد روی صفحه نمایش می افزاید.

در صنعت فیلم، موسیقی متن Dolby Digital به صورت نوری مستقیماً روی نوار فیلم در فضاهای بین سوراخ‌های پانچ کدگذاری می‌شود. قرار دادن یک موسیقی متن دیجیتال روی همان رسانه فیلم به آن امکان می دهد بدون نیاز به رسانه ذخیره سازی اضافی با آهنگ آنالوگ همزیستی داشته باشد و همچنین هماهنگی مطلق تصویر و صدا را تضمین می کند. در سینماهای IMAX، صدا بر روی یک هارد دیسک جداگانه ضبط می شود و با استفاده از کد زمانی SMPTE با فیلم هماهنگ می شود.

جریان دیجیتال در خروجی رمزگذار، دنباله ای از فریم های صوتی است (بسته AC-3 Frame). اطلاعات موجود در آن را می توان به طور مشروط به دو بخش اصلی (اطلاعات اصلی) و اضافی (اطلاعات جانبی) تقسیم کرد.

قاب صوتی انکودر شامل شش بلوک صوتی است. هر بلوک صوتی حاوی اطلاعاتی در مورد 512 نمونه برای هر یک از سیگنال های رمزگذاری شده (صدا 1، صوتی 2، ...، صوتی n) است. با توجه به همپوشانی زمانی 50 درصد، 256 نمونه از بلوک قبلی و 256 نمونه جدید برای هر سیگنال در بلوک صوتی گنجانده شده است. در شش بلوک صوتی یک فریم صوتی، تعداد کل نمونه های پردازش شده برای هر یک از سیگنال های ورودی برابر با 512 × 6 = 3072 خواهد بود. توجه داشته باشید که اگر تعداد سیگنال های صوتی رمزگذاری شده 5 باشد (فرمت 3/2)، پس تعداد کل نمونه هایی که اطلاعات مربوط به آنها در یک فریم صوتی موجود است (512 × 5) × 6 = 15360 خواهد بود، اما با در نظر گرفتن 50 درصد همپوشانی زمانی، تنها 15360 ÷ 2 = 7680 نمونه جدید وجود خواهد داشت. .

پس از نمونه برداری از نمونه ها با تقسیم بندی زمانی، سیگنال صوتی هر کانال با استفاده از تبدیل کسینوس گسسته اصلاح شده (MDCT) به مجموعه جدیدی از داده های دیجیتال تبدیل می شود. تقسیم بندی سیگنال های صوتی بر اساس زمان با همپوشانی 50 درصدی نمونه ها و تبدیل آنها از زمان به حوزه فرکانس در بلوک تبدیل زمان-فرکانس (تبدیل دامنه فرکانس) انجام می شود. قبل از تبدیل متعامد، نمونه هایی از سیگنال های صوتی توسط یک تابع پنجره وزن می شوند. دومی در استاندارد A/52 در جدول ارائه شده است.

تبدیل نمونه صوتی حوزه زمانی را می توان با استفاده از یک تبدیل طولانی (512 نقطه) یا دو تبدیل کوتاه (256 نقطه) انجام داد. در حالت اول 256 و در حالت دوم به ترتیب ضرایب MDCT 128 + 128 به دست می آید. با یک نمونه کوتاه، ضرایب MDCT هر دو بخش، حاوی 128 مقدار، با متناوب کردن آنها در یک بلوک مشترک ترکیب می شوند. این بلوک کلی همچنین شامل 256 ضریب MDCT خواهد بود.

تبدیل طولانی برای سیگنال هایی که به آرامی در طول زمان در دامنه تغییر می کنند ترجیح داده می شود. وضوح فرکانس بهتری دارد. تبدیل کوتاه وضوح زمانی بهتری را ارائه می دهد و برای سیگنال هایی استفاده می شود که دامنه آنها با زمان به سرعت تغییر می کند، مانند منطقه حمله صدا. پرچم Block Switch Flags (blksw flags) نشان می دهد که کدام تبدیل (بلند یا کوتاه) هنگام محاسبه ضرایب MDCT اعمال می شود. پارامتر Block Switch Flags در جریان داده های دیجیتال خروجی به عنوان اطلاعات اضافی گنجانده شده است و توسط رمزگشا هنگام انجام تبدیل متعامد معکوس استفاده می شود.

در نرخ داده‌های دیجیتال پایین، رمزگذار Dolby AC-3 استفاده از روش خاصی را برای ترکیب سیگنال‌های کانال (Coupling) فراهم می‌کند که امکان استفاده از بیت‌های کمتری را هنگام رمزگذاری آنها ممکن می‌سازد.

در سیستم Dolby AC-3، هر ضریب MDCT در قالب ممیز شناور با دو مقدار نشان داده می شود: یک توان (یا توان) و یک مانتیس: Xd[k] = A[k] × 2 -B[k]، که در آن A[k] و B [k] - به ترتیب مانتیس و ترتیب ضریب تبدیل kth. ترتیب برابر است با تعداد صفرهای قبل از اولین نمایش دودویی ضریب MDCT. اساساً عامل مقیاس آن (یا عامل عادی سازی) آن است. به عنوان مثال، اگر ضریب MDCT Xd[k] = 0.158 و نمایش باینری آن به صورت 0.001010000110 نوشته شود، آنگاه ترتیب (ضریب مقیاس) B[k] = 2 و مانتیس 0.10100000110 در باینری یا A[k] = 0 است. 6308 در سیستم های اعشاری. علامت ضریب MDCT هنگام رمزگذاری مانتیس در نظر گرفته می شود. قبل از رمزگذاری، مانتیس ها عادی می شوند (Normalize Mantissas). توان و مانتیس ضرایب MDCT به طور جداگانه در بلوک‌های Encode Exponent و Quantisse، Encode Mantissas کدگذاری می‌شوند.

بلوک Bit Allocation اثر پوشاندن را در نظر می گیرد. روش انتخاب بیت بر اساس یک مدل شنوایی است که به فرد امکان می دهد حداکثر مقدار مجاز (آستانه) سطح نویز را که هنوز توسط سیگنال مفید در باند رمزگذاری پوشانده می شود و مطابق با داده های این محاسبات، تخمین بزند. ، برای انتخاب تعداد بیت های مربوطه هنگام رمزگذاری مانتیس ضرایب MDCT. همه این محاسبات در بلوکی که معمولاً مدل روان آکوستیک نامیده می شود انجام می شود. هر آخوندک نرمال شده با تعدادی مرحله کوانتیزه شدن متناظر با تعداد بیت های تعریف شده در ماژول Bit Allocation کوانتیزه می شود.

ترتیب رمزگذاری ضریب MDCT در رمزگذار Dolby AC-3 عددی است که از 0 تا 24 متغیر است. بنابراین، کلمه رمز ترتیب باید حداقل m = 5 بیت (2 5 = 32) داشته باشد. حداکثر سفارش در رمزگذار به 24 محدود شده است.

مشخص است که اگر طیف سیگنال صوتی نمونه با استفاده از یک بانک از فیلترها که هر کدام دارای باند فرکانسی نسبتاً باریکی هستند تجزیه و تحلیل شود، تفاوت در سطوح انرژی سیگنال بین فیلترهای مجاور به ندرت از 12 دسی بل تجاوز می کند. این شرایط هنگام کدگذاری سفارش ها در نظر گرفته شد. هنگام رمزگذاری سفارشات در رمزگذار Dolby AC-3، از روش مدولاسیون کد پالس تفاضلی استفاده می شود، زمانی که خود ترتیب کدگذاری نمی شود، بلکه تفاوت بین مقادیر ترتیب ضرایب MDCT مجاور است. مرتبه اول. مقدار سیگنال هر کانال در اولین باند تحلیل فرکانس پایین است - این همیشه یک کلمه رمز چهار بیتی است که با محدوده اعداد از 0 تا 15 مطابقت دارد. ترتیب در باند تحلیل فرکانس بالاتر بعدی به صورت تعیین می شود. تفاوت بین مقادیر سفارش فعلی و قبلی ضرایب MDCT مربوطه. در رمزگذار Dolby AC-3، وضوح مدولاسیون کد پالس دیفرانسیل (گسستگی تغییر دستورات) در طول رمزگذاری به مقادیر -2، -1، 0، +1، +2 محدود می شود. حداکثر تغییر در ترتیب ضرایب MDCT مجاور 2± است که مربوط به ± dB 12 است.

مقدار دیفرانسیل دستورات ضرایب MDCT در گروه ها ترکیب می شود. برای روش گروه بندی، از سه استراتژی ممکن استفاده می شود که در استاندارد به عنوان D15، D25 و D45 تعیین شده است. در استراتژی D15 هر کدام جفتو در استراتژی D45 هر چهارمقادیر سفارش دیفرانسیل با یک مقدار واحد از عدد M در جریان داده دیجیتال نشان داده می شود.

مقادیر سفارش دیفرانسیل که مستقیماً از ضرایب MDCT اصلی به دست می‌آیند، در عمل، همیشه حداکثر اختلاف را بین ضرایب مجاور که از محدوده ± 2 تجاوز نمی‌کند، که طبق جداول مربوطه استاندارد Dolby AC-3 مورد نیاز است، ایجاد نمی‌کند. . بنابراین، پردازش اضافی آرایه سفارش قبل از رمزگذاری ضروری است. با کمک آن، برخی از مقادیر سفارش کاهش می یابد، اما در عین حال مقادیر مربوط به مانتیس تغییر می کنند به طوری که صفرها در جلوی آنها در نمایش باینری آنها ظاهر می شوند. پس از انجام این عمل، حداکثر ترتیب دیفرانسیل دیگر از مقدار لازم 2± تجاوز نخواهد کرد.

انتخاب استراتژی (D15، D25 یا D45) برای کدگذاری دستورات ضرایب MDCT، مصالحه ای بین وضوح فرکانس خوب، وضوح زمانی و تعداد بیت های مورد نیاز برای رمزگذاری نماها است. استراتژی‌های D15 و D25 را می‌توان برای رمزگذاری سیگنال‌هایی استفاده کرد که طیف غیریکنواختی دارند، زمانی که مقدار توان به سرعت از یک باند تحلیلی به باند دیگر تغییر می‌کند. اگر طیف سیگنال به اندازه کافی صاف (مسطح) باشد، از استراتژی های رمزگذاری D45 استفاده می شود.

پس از انتخاب یک استراتژی رمزگذاری سفارش، رمزگذار Dolby AC-3 کلمات رمز مربوط به مقادیر توان دیفرانسیل را به گروه ها گروه بندی می کند. برای همه حالت‌های عملکرد رمزگذار، مجموعه‌ای از اعداد M برای سه ضریب MDCT مجاور (k، k + 1، k + 2) M[k]، M، M طبق قانون به عنوان یک کلمه هفت بیتی گروه‌بندی و کدگذاری می‌شوند:

دامنه تغییرات در مانتیس ضرایب MDCT در محدوده 1- تا 1+ قرار دارد. علامت ضریب MDCT هنگام رمزگذاری آخوندک در نظر گرفته می شود. فرآیند کوانتیزه کردن آخوندک ضرایب MDCT در استاندارد Dolby AC-3 دارای ویژگی های زیر است:

  • تعداد مراحل کوانتیزاسیون ممکن با سری اعداد زیر مطابقت دارد: 0، 3، 5، 7، 11، 15، 32، 64، 128، 256، 512، 1024، 2048، 4096، 16384، 65536. کوانتیزاسیون یکنواخت مانتیس ها استفاده می شود.
  • هنگامی که تعداد مراحل کوانتیزاسیون 3، 5، 7، 11 و 15 باشد، به اصطلاح کوانتیزاسیون متقارن استفاده می شود، در سایر موارد - نامتقارن.
  • زمانی که تعداد مراحل کوانتیزه شدن 3، 5 و 11 باشد، رمز واژه های مانتیس در گروه ها ترکیب می شوند. با سه مرحله کوانتیزاسیون، سه کلمه رمز مربوط به سه مقدار mantissa با یک کلمه رمز پنج بیتی کدگذاری می شوند. با پنج مرحله کوانتیزه کردن، سه کلمه رمز مانتیس گروه بندی شده و در یک کلمه رمز هفت بیتی کدگذاری می شوند. با 11 مرحله کوانتیزاسیون، دو کلمه رمز مانتیس گروه بندی شده و در یک کلمه رمز هفت بیتی کدگذاری می شوند. در موارد دیگر هیچ روش گروه بندی وجود ندارد.

با کوانتیزاسیون متقارن، به جای مقادیر کوانتیزه شده آخوندک ها، شاخص های آنها که در جدول مربوطه مشخص شده است، در جریان دیجیتال قرار می گیرند. به عنوان مثال، اگر تعداد مراحل کوانتیزه کردن 3 باشد، و مقدار مانتیس در محدوده 1- تا 1/3- باشد، مقداری برابر با 2/3- به رمزگشا منتقل می شود و شاخص mc = 0 با آن مطابقت دارد.اگر مقدار mantissa در محدوده 1/3- تا 1/3+ قرار داشته باشد، مقدار برابر با صفر به رمزگشا منتقل می شود و شاخص mc = 1 رمزگذاری می شود. و در نهایت، اگر مقدار مانتیس در محدوده 1/3+ تا 1+ است، سپس مقدار برابر با 2/3+ به رمزگشا منتقل می‌شود و شاخص جدول مربوطه mc=2 کدگذاری می‌شود. به همین ترتیب، به شکل جداول، فواصل مقادیر آخوندک و شاخص های مربوط به تعداد مراحل کوانتیزه سازی به ترتیب برابر با 5، 7، 11 و 15 می باشد.این روش کوانتیزه کردن امکان کاهش تعداد بیت های مورد نیاز را فراهم می کند. برای تمام مراحل کوانتیزاسیون دیگر (32، 64، ...، 65536)، این شاخص‌ها نیستند که کدگذاری می‌شوند، بلکه آخوندک‌های خود ضرایب MDCT هستند.

مرحله بعدی رمزگذاری و بسته بندی شاخص های جدولی مقادیر کوانتیزه مانتیس در یک جریان دیجیتال است. با کوانتیزاسیون متقارن، یک روش گروه بندی اضافی برای کاهش تعداد بیت های مورد نیاز برای کدگذاری شاخص ها استفاده می شود. به عنوان مثال، اگر تعداد مراحل کوانتیزاسیون 7 باشد، شاخص mantissa از 0 تا 6 متغیر است. رمزگذاری این سری از اعداد به 3 بیت نیاز دارد. با 11 مرحله کوانتیزه کردن، شاخص جدول آخوندک در محدوده 0 تا 10 قرار دارد، و با 15 مرحله کوانتیزه کردن، در حال حاضر در محدوده 0 تا 14 قرار دارد. در این حالت، تعداد بیت های مورد نیاز برای رمزگذاری هر یک از آنهاست. آنها به ترتیب 4 یا 5 هستند.گروه بندی شاخص های جدول اجازه می دهد تا تعداد بیت های مورد نیاز برای رمزگذاری آنها را در 3، 5 و 11 مرحله کوانتیزاسیون کاهش دهد. با 3 و 5 مرحله کوانتیزاسیون، سه شاخص آخوندک جدولی و با 11 مرحله کوانتیزه کردن، دو شاخص آخوندک جدولی با یک کلمه رمز طبق قوانین زیر کدگذاری می شوند:

کد_گروه = 9mc[a] + 3mc[b] + mc[c]; کد_گروه = 25 mc[a] + 5 mc[b] + mc[c]; کد_گروه = 11 mc[a] + mc[b]،

که در آن Group_code، Group_code و Group_code کلمات کد گروه‌های شاخص جدولی مانتیس‌ها هستند، به ترتیب، در 3، 5، 11 مرحله کوانتیزاسیون. mc[a]، mc[b]، mc[c] - شاخص‌های جدول آخوندک‌های ضرایب MDCT با اعداد a، b و c. بنابراین، با سه مرحله کوانتیزه کردن آخوندک (n = 3)، کلمه رمز یک گروه متشکل از سه شاخص شامل 5 بیت خواهد بود، بنابراین در این حالت 5 ÷ 3 = 1.67 بیت برای رمزگذاری هر آخوندک صرف می شود. با n = 5، کلمه کد گروه mantissa به عنوان یک عدد هفت بیتی نمایش داده می شود و رمزگذاری هر مانتیس به 7 ÷ 3 = 2.33 بیت نیاز دارد. و در نهایت، با n = 11، رمزگذاری هر مانتیس به 7 ÷ 2 = 3.5 بیت و با n = 15 - 4 بیت و غیره نیاز دارد.

رمزگذار طول کلمه رمز هر آخوندک یا شاخص جدول مربوطه را تعیین می کند، پس از آن آخوندک ها با استفاده از روش خاصی از بسته بندی باز می شوند.

هنگام کار در حالت ترکیب سیگنال‌های صوتی، رمزگذار بخش‌های فرکانس بالا از سیگنال‌های اصلی را در یک باند فرکانس مشخص در یک سیگنال مشترک ترکیب می‌کند و علاوه بر این مختصات به اصطلاح ترکیبی را تولید می‌کند. دومی توسط رمزگشا برای بازیابی نسبت های انرژی بخش های فرکانس بالا از طیف هر سیگنال اصلی که تحت فرآیند ترکیب قرار می گیرند استفاده می شود. پس از رمزگشایی، قطعات ترکیب شده در هر یک از سیگنال های بازسازی شده ترکیب طیفی یکسانی خواهند داشت و تنها در سطح متفاوت هستند.

رمزگذار با افزودن ضرایب MDCT سیگنال های ترکیبی، یک سیگنال مشترک تولید می کند. در این مورد، ضرایب MDCT از 37 تا 252 به 18 زیر باند (به اصطلاح باندهای ترکیبی) با 12 ضریب در هر زیر باند گروه بندی می شوند. محدودیت فرکانس پایین و بالای باندهای ترکیبی توسط کاربر مشخص می شود. مختصات ترکیب برای هر سیگنال زیر باند ترکیب شده محاسبه می شود. آنها نسبت حداکثر ضرایب MDCT هر سیگنال ترکیبی و کل سیگنال در زیر باند ترکیبی را نشان می دهند. در مرحله بعد، مختصات اتحادیه به فرمت ممیز شناور تبدیل می شود و به عنوان اطلاعات اضافی در جریان داده خروجی قرار می گیرد. سیگنال کل (ترکیب) به همان روشی که سیگنال کانال های مستقل رمزگذاری می شود.

رسیور سیستم Dolby AC-3

رسیور Dolby AC-3 سفارشات ضرایب MDCT را به صورت کدگذاری شده و بسته بندی شده دریافت می کند. برای فشرده سازی و رمزگشایی آنها، لازم است اطلاعات بیشتری در مورد تعداد توان های ارسالی در سیگنال هر کانال و در مورد استراتژی رمزگذاری آنها (D15, D25, D45) مورد استفاده در رمزگذار داشته باشید. فرآیند رمزگشایی سفارش در بلوک Decode Exponent انجام می شود. پس از رمزگشایی سفارشات، مراحل بازکردن، کمی‌زدایی و غیرعادی کردن آخوندک‌ها از ضرایب MDCT (Dequantize, Denormalize Mantissas) انجام می‌شود. برای انجام آن، از پارامترهای مدل روان آکوستیک، پارامترهایی که توزیع بیت ها را در رمزگذار تعیین می کنند و همچنین بازیابی مقادیر سفارش ضرایب MDCT استفاده می شود. عملیات غیرعادی کردن آخوندک ها با جابجایی بیت های رمز آخوندک به سمت راست انجام می شود. در این مورد، تعداد شیفت ها با ترتیب ضریب MDCT مربوطه تعیین می شود. اگر رمزگذار از روش ترکیب سیگنال ها از تعدادی کانال استفاده می کند، بدیهی است که رمزگشا باید عملیات معکوس (De-Coupling) را با استفاده از مقادیر مختصات ترکیبی ارسال شده به رمزگشا در قسمت اطلاعات اضافی انجام دهد. در بلوک MDCT متعامد معکوس (تبدیل معکوس)، سیگنال بازسازی شده در رمزگشا به صورت معکوس به حوزه زمان تبدیل می شود.

S.I. BSI بلوک صوتی 0 بلوک صوتی 1 بلوک صوتی 2 بلوک صوتی 3 بلوک صوتی 4 بلوک صوتی 5 داده های AUX CRC

طرح 1. ساختار داده قاب صوتی سیستم Dolby AC-3.

پرچم های سوئیچ را مسدود کنید پرچم های دیتر کنترل برد دینامیکی استراتژی جفت مختصات جفت استراتژی توان توان پارامترهای تخصیص بیت مانتیس

طرح 2. ساختار داده واحد صوتی سیستم Dolby AC-3.

ساختار داده های صوتی در استاندارد Dolby AC-3 در شکل 1 نشان داده شده است. فیلد داده سرصفحه یک فریم صوتی حاوی اطلاعات SI (اطلاعات همگام ساز) و BSI (اطلاعات جریان بیت) اطلاعات پیکربندی جریان داده است.

فیلد داده SI شامل کلمه همگام سازی (0000 1011 0111 0111 یا OB77h)، بیت های کدگذاری کنترل نویز (CRC)، سرعت نمونه برداری و اندازه فریم صوتی است. یک قاب صوتی Dolby AC-3 شامل دو کلمه CRC 16 بیتی است، اولی در ابتدای هر فریم بعد از کلمه همگام سازی و دومی در پایان. فیلد داده BSI حاوی اطلاعاتی در مورد پیکربندی جریان داده دیجیتال است، به عنوان مثال، مانند نوع سرویس، حالت عملکرد رمزگذار (یعنی تعداد سیگنال های رمزگذاری شده یا نوع فرمت صوتی)، سطح صوتی مطلق. از سیگنال هر کانال، اطلاعات زبان، اطلاعات زمان و موارد دیگر.

ساختار داده یک بلوک صوتی در نمودار 2 نشان داده شده است. شامل فیلدهای بیت زیر است: پرچم های سوئیچ بلوک - پارامتر طول تبدیل متعامد. پرچم های Dither - نشانه ای از وجود نویز اضافی. کنترل محدوده دینامیکی - کنترل داده ها برای محدوده دینامیکی سیگنال های ارسالی. استراتژی جفت - اطلاعاتی در مورد ترکیب سیگنال ها (سیگنال هایی که کدام کانال ها ترکیب شده اند و از چه فرکانس شروع می شوند). مختصات جفت - مختصات جفت برای سیگنال هر کانال. استراتژی توان - استراتژی رمزگذاری سفارش انتخاب شده. نماها - کلمات کد برای ترتیب ضرایب MDCT. پارامترهای تخصیص بیت - پارامترهای مدل روان آکوستیک. Mantissas - کلمات کد برای آخوندک از ضرایب MDCT.

فناوری های دیجیتال دالبی

Dolby Digital EX

EX پیشوندی است که برای تعیین سیستم های صوتی Dolby Digital با 6.1 کانال استفاده می شود: دو کانال جلو، مرکز، فرکانس پایین، پشتی فراگیر و دو کانال فراگیر جانبی.

Dolby Digital Surround-EX

Dolby Digital Surround-EX کانال سوم صدای فراگیر را به موسیقی متن اضافه می کند. این ایده متعلق به مهندسان صدا استودیو Skywalker Sound است. این فناوری به طور مشترک با آزمایشگاه های Dolby و Lucasfilm THX توسعه یافته است.

Dolby Digital Live

Dolby Digital Live (DDL) یک فناوری برای رمزگذاری سیگنال های صوتی چند کاناله (5.1) به فرمت AC3 در زمان واقعی است که توسط Dolby Technologies پیشنهاد شده است. طراحی شده برای انتقال صدای چند کاناله از بازی ها و سایر برنامه ها به گیرنده از طریق رابط S/PDIF (اپتیکال یا کواکسیال).

استفاده از آن به شما این امکان را می دهد که از محدودیت هایی خلاص شوید که به دلیل آن تنها آهنگ های آماده (یعنی رمزگذاری شده در فرمت AC3 یا DTS) چند کاناله، معمولاً موسیقی متن فیلم ها، می توانند از طریق رابط های دیجیتال منتقل شوند و در بازی ها وجود دارد. قابلیت های خروجی دیجیتال به صدای معمولی استریو محدود می شد. (برای فول 5.1 در بازی ها در این گونه موارد، اتصال آنالوگ سه سیمه لازم است، البته در صورت امکان).

اشکال اساسی و مهلک فناوری DDL کاهش کیفیت صدا از فشرده سازی آن به فرمت AC3 است (مقایسه با انتقال از CD-Audio به mp3 با نرخ بیت بالا)، که با این حال، برای هدف اصلی آن کاملاً غیرقابل توجه است. کاربرد.

در حال حاضر، این فناوری عمدتاً در مادربردهای مجهز به کدک های Realtek ALC882D، ALC888DD و ALC888H و همچنین برخی از کدک های C-Media یافت می شود. چنین بردهایی را می توان با عبارت "AC3 Encode" یا "Dolby Digital Live" در توضیحات محصول یافت.

این فناوری در لپ‌تاپ‌ها نیز شروع به معرفی می‌کند، جایی که با توجه به کمبود فضا برای اتصالات آنالوگ "اضافی"، بیشترین مزیت‌ها را نوید می‌دهد - یک کانکتور به شما امکان می‌دهد تا صدای 5.1 کامل را در همه برنامه‌ها دریافت کنید، به شرطی که لپ‌تاپ را وصل کنید. به یک گیرنده یا مجموعه ای از بلندگوهای فعال با رمزگشای داخلی.

از بین کارت های صوتی جداگانه ای که از این فناوری پشتیبانی می کنند، باید به Terratec Aureon 7.1 اشاره کرد و در کارت های صوتی محبوب خانواده Creative X-Fi پشتیبانی از DDL وجود ندارد، اما (طبق اطلاعات غیر رسمی) در آینده امکان پذیر است. که با انتشار نسخه جدید درایورها به صورت عطف به ماسبق معرفی خواهد شد.

برای سال 2010، مدل‌های زیر از خانواده Creative X-Fi از این فناوری پشتیبانی می‌کنند: CREATIVE X-Fi Titanium 7.1، CREATIVE X-Fi Titanium Fatal1ty Pro 7.1، CREATIVE X-Fi Titanium Fatal1ty Champion 7.1

دالبی دیجیتال پلاس

MIPS Technologies و Dolby Laboratories فناوری صوتی جدیدی را برای دستگاه‌هایی معرفی کرده‌اند که از پخش ویدیو و صدا با کیفیت بالا پشتیبانی می‌کنند، مانند پخش‌کننده‌های HD DVD و Blu-ray. فناوری صوتی Dolby Digital Plus نام دارد و می تواند در هسته های ریزپردازنده MIPS32 استفاده شود.

همچنین Dolby Digital Plus به لطف پشتیبانی از تعداد کانال‌های حتی بیشتر از آنچه با Dolby Digital امکان‌پذیر بود، کیفیت ضبط محتوای صوتی در HD DVD و رسانه‌های دیسک بلو-ری را بهبود می‌بخشد. این شرکت ها به توسعه دهندگان راه حل های SoC (سیستم روی تراشه) انواع کدک یکپارچه Dolby Digital Plus مبتنی بر هسته MIPS را ارائه خواهند داد.

ویژگی ها:

  • صدای چند کاناله با کانال های مستقل
  • پشتیبانی از 7.1 کانال* و امکان داشتن چندین برنامه صوتی در یک جریان
  • خروجی پخش جریانی Dolby Digital برای سازگاری با دستگاه های قدیمی
  • حداکثر سرعت جریان تا 6 مگابیت در ثانیه
  • نرخ بیت از 3 مگابیت بر ثانیه در HD DVD و تا 1.7 مگابیت در ثانیه در دیسک بلوری
  • HDMI پشتیبانی می شود
  • یک جریان ممکن است حاوی مطالبی به زبان های مختلف باشد
  • گزینه های رمزگذاری جدید برای حرفه ای های صوتی
  • کیفیت بالا را با نرخ داده پخش کارآمدتر حفظ می کند (200 کیلوبیت بر ثانیه برای 5.1 کانال)

«دالبی دیجیتال پلاس از بیش از 8 کانال صوتی پشتیبانی می کند. استانداردهای HD DVD و دیسک های بلوری در حال حاضر این تعداد را به 8 محدود می کند.

Dolby TrueHD

Dolby TrueHD یکی از دو فرمت صوتی اولیه فشرده نشده (فشرده بدون اتلاف) است که فقط برای پخش کننده های HD نوری موجود است. اگرچه کدک Dolby TrueHD اختیاری است، فرمت به طور گسترده توسط پخش کننده ها و دیسک های Blu-ray پشتیبانی می شود (بسیار بیشتر از DD+، که اغلب در دیسک های Blu-ray وجود ندارد). Dolby TrueHD از الگوریتم فشرده سازی Meridian Lossless Packing (MLP) استفاده می کند. جریان دیجیتال Dolby TrueHD می تواند تا 14 کانال صوتی جداگانه را در خود جای دهد، اما در عمل با 6 (5.1) یا 8 (7.1) کانال کار می کند. Dolby TrueHD تا عمق 24 بیت و نرخ نمونه برداری تا 192 کیلوهرتز (برای حداکثر جریان غیر فشرده 63 مگابیت بر ثانیه) پشتیبانی می کند، اما برای Blu-ray در حال حاضر حداکثر 8 کانال در 24 بیت و 96 کیلوهرتز موجود است. یا 6 کانال در 24 بیت و 192 کیلوهرتز) برای حداکثر جریان فشرده 18 مگابیت بر ثانیه. جست‌وجوی فیلم‌های موجود Dolby TrueHD روی دیسک‌های بلوری نشان داد که در حال حاضر تنها نیمی از آنها در دسترس است: 6 کانال با نرخ نمونه‌برداری 96 کیلوهرتز و عمق 24 بیت (معادل 13.5 مگابیت در ثانیه فشرده نشده و 9 مگابیت در ثانیه فشرده). دیسک هایی با کنسرت های گروه دیو متیوز و تیم رینولدز که نمرات عالی از نظر کیفیت را در وب سایت Cinema Squid دریافت کردند).

مشخصات آهنگ Dolby TrueHD برای فیلم های Blu-ray به شرح زیر است:

  • کدک صوتی - Dolby TrueHD.
  • کانال ها (طرح صدا) تقریباً همیشه 5.1، 6.1 و 7.1 بسیار نادر هستند.
  • داده های وضوح صدا اغلب در دسترس نیستند، اما مقادیر معمولی عبارتند از: 16 بیت در 48 کیلوهرتز یا 24 بیت در 48 کیلوهرتز. برای برخی از دیسک های زنده این مقادیر 24 بیت در 96 کیلوهرتز هستند.
  • مقدار جریان معمولاً در دسترس نیست، اما معمولاً 4608 کیلوبیت در ثانیه (4.5 مگابیت در ثانیه، که مربوط به شش کانال در 48 کیلوهرتز و 16 بیت است) است. بالاترین میزانی که روی دیسک‌های Blu-ray کنسرت‌های تجاری دیده‌ایم، 9.0 مگابیت بر ثانیه بود که معادل 6 کانال در 96 کیلوهرتز و 24 بیت است. حداکثر مقدار برای Blu-ray 18 مگابیت در ثانیه است.

فناوری های دالبی در رسانه های نوری

HD DVD دیسک بلوری DVD-Video DVD-Audio دیسک لیزری
کدک پشتیبانی سخت افزاری تعداد کانال ها (حداکثر) حداکثر نرخ جریان پشتیبانی سخت افزاری تعداد کانال ها (حداکثر) حداکثر نرخ جریان پشتیبانی سخت افزاری تعداد کانال ها (حداکثر) حداکثر نرخ جریان پشتیبانی سخت افزاری تعداد کانال ها (حداکثر) حداکثر نرخ جریان پشتیبانی سخت افزاری تعداد کانال ها (حداکثر) حداکثر نرخ جریان
دالبی دیجیتال لزوما 5.1 504 کیلوبیت بر ثانیه لزوما 5.1 640 کیلوبیت بر ثانیه لزوما 5.1 448 کیلوبیت بر ثانیه علاوه بر این در بخش ویدیو برای سازگاری با پخش کننده های DVD معمولی 5.1 448 کیلوبیت بر ثانیه علاوه بر این 5.1 384 کیلوبیت بر ثانیه
دالبی دیجیتال پلاس 7.1 3 مگابیت بر ثانیه علاوه بر این 7.1 1.7 مگابیت بر ثانیه استفاده نشده
Dolby TrueHD 8 18 مگابیت بر ثانیه 8 18 مگابیت بر ثانیه
  • صدای دالبی دیجیتال اولین بار در سال 1992 با بازی Batman Returns در سینماها ظاهر شد.
  • انگیزه توسعه Dolby Digital Surround-EX نیاز به تصویر صوتی از یک سفینه فضایی در حال پرواز بر فراز سالن در فیلم "جنگ ستارگان" بود. اپیزود اول: تهدید شبح."

همچنین ببینید

  • Dolby Atmos
  • Immsound
  • صدای دیجیتال

ادبیات

  1. استاندارد فشرده‌سازی صوتی دیجیتال (AC-3)/Doc.A/52، 1995-12-20
  2. I. A. Aldoshina، E. I. Vologodin، A. P. Efimov و دیگران.الکتروآکوستیک و پخش صدا: کتاب درسی برای دانشگاه ها / ویرایش شده توسط Yu. A Kovalgin. - م.: خط تلفن، مخابرات، رادیو و ارتباطات، 1386. - 872 ص: ill.

پیوندها


برای کسانی که خواهان صدای شفاف هستند، دانلود Dolby Digital Plus برای ویندوز 10 را توصیه می کنیم. این یک کدک نرم افزاری سبک وزن و بصری است که وظیفه پخش صدا را در هر دستگاهی با بلندگو بر عهده دارد.

ویژگی های خاص

لطفاً توجه داشته باشید که نسخه های قبلی ویندوز 10 از کدک Dolby Digital پشتیبانی نمی کنند. بنابراین، قبل از دانلود Dolby Digital، توصیه می کنیم سیستم خود را به آخرین نسخه به روز کنید. در غیر این صورت، این برنامه به سادگی نصب نمی شود، به این معنی که شما تمام لذت های آن را تجربه نخواهید کرد:
  • تبدیل صدا به بالاترین کیفیت ممکن؛
  • تنظیم دقیق خروجی صدا؛
  • رابط کاربری پاک به زبان روسی؛
Dolby Digital Plus تنها یکی از کدک های صوتی ویندوز 10 است. به عنوان مثال، موارد دیگری نیز وجود دارد. با این حال، Dolby Digital یک کدک ممتاز است و اگر دستگاه شما از آن پشتیبانی می کند، توصیه می کنیم آن را نصب کنید.

کدک به صورت رایگان توزیع می شود، به زبان روسی است و در تمام نسخه های ویندوز 10 - 32 و 64 بیت کار می کند. این کدک با اکثر دستگاه های مدرن، نه تنها رایانه ها، بلکه تبلت ها نیز سازگار است.

پخش صدا در رایانه یک فرآیند نسبتاً پیچیده و چند مرحله ای است. صدا قبل از اینکه به گوش انسان برسد مراحل مختلفی را طی می کند. از نظر شماتیک، چهار مرحله اصلی را می توان تشخیص داد: فایل منبع، کارت صدا، کابل ها و خود سیستم بلندگو. علاوه بر این، محل قرارگیری سیستم‌های صوتی در فضا تأثیر بسزایی بر کیفیت صدا دارد.

اهمیت هر مرحله با کیفیت لینک نهایی - سیستم بلندگو که فایل صوتی روی آن پخش می شود - تعیین می شود. به عنوان مثال، اگر از بلندگوهای پلاستیکی کوچک و متوسط ​​برای بازتولید صدا استفاده می شود، نمی توانید به مراحل باقی مانده توجه کنید، اما اگر از یک سیستم صوتی خوب استفاده شود، برای به دست آوردن یک راه حل متعادل، نمی توانید همه پیوندهای دیگر را نادیده بگیرید. زیرا هر یک از آنها تأثیر مستقیمی بر کیفیت صدا دارند.

قبل از اینکه به بررسی دقیق هر پیوند در زنجیره بازتولید صدا بپردازیم، بیایید به مفاهیم اساسی مرتبط با صدا و همچنین نحوه درک یک شخص از صدا نگاه کنیم.

صدا و ویژگی های آن

صدا به عنوان یک پدیده فیزیکی یک فرآیند موجی است، یعنی فرآیند انتشار ارتعاشات هوا. منبع صوت هر جسم نوسانی است که ذرات مجاور یک محیط کشسان (هوا) را به حرکت نوسانی وارد می کند که به نوبه خود باعث نوسان ذرات مجاور و غیره می شود. بنابراین، فرآیند انتشار ارتعاشات ذرات یک محیط الاستیک به وجود می آید که به آن موج صوتی می گویند.

یکی از مشخصه های اصلی صدا فرکانس آن یا تعداد ارتعاشات صوت در ثانیه است. فرکانس بر حسب هرتز (هرتز) اندازه گیری می شود. به عنوان مثال، فرکانس صدای 1000 هرتز به این معنی است که 1000 ارتعاش از محیط الاستیک در هر ثانیه رخ می دهد.

ویژگی گوش انسان این است که ارتعاشات صوتی را در محدوده فرکانس 1 تا 5 کیلوهرتز به بهترین شکل درک می کند. فرد علاوه بر این فرکانس های پایین تر را با بدن درک می کند و حجم را با فشار اعمال شده تعیین می کند. اعتقاد بر این است که فرد قادر به درک صدا با فرکانس 16 هرتز است.

حد بالای محدوده قابل شنیدن کاملاً فردی است، اما میانگین داده های آماری به شرح زیر است: پس از سی سال، محدوده بالایی شنیداری به 18 کیلوهرتز کاهش می یابد، و پس از چهل، به ندرت کسی فرکانس های بالاتر از 16-17 کیلوهرتز را می شنود.

یکی دیگر از ویژگی های امواج صوتی، قدرت صدا است. قدرت صوت جریان انرژی صوتی را تعیین می کند که در هر ثانیه از یک سانتی متر مربع از صفحه معمولی که عمود بر جهت انتشار موج قرار دارد عبور می کند. شدت صوت ویژگی های انرژی خود موج را توصیف می کند و بر حسب وات بر متر مربع (W/m2) اندازه گیری می شود.

علاوه بر شدت صدا، یک مشخصه دیگر اغلب استفاده می شود: فشار صدا. فشار صوت حداکثر تغییر فشار در هوا در حین انتشار امواج صوتی در مقایسه با فشاری است که در غیاب امواج وجود دارد. واحد اندازه گیری فشار صوت یک پاسکال (Pa) است.

یک فرد قادر است تنها آن امواج صوتی را درک کند که در آنها قدرت صدا از محدوده خاصی که محدوده دینامیکی شنوایی نامیده می شود فراتر نمی رود. حد پایینی این محدوده آستانه شنوایی نامیده می شود، یعنی اگر قدرت صوتی موج صوتی زیر این آستانه باشد، گوش انسان آن را درک نمی کند. آستانه شنوایی نیروی صوتی برابر با 10-12 W/m2 یا 2x10-5 Pa در نظر گرفته می شود.

حد بالایی دامنه دینامیکی شنوایی آستانه درد نامیده می شود. اگر شدت صدا بیشتر از این حد باشد، فرد در گوش احساس درد می کند. آستانه درد با شدت صدا برابر با 10 W/m2 است.

در عمل، تغییرات شدت صدا معمولاً با بل و دسی بل بیان می شود. اگر من 1و من 2مقادیر اولیه و نهایی شدت صدا، سپس تغییر سطح صدا با استفاده از فرمول محاسبه می شود:

.

حداقل اختلاف سطح صدا که گوش انسان می تواند درک کند دقیقاً یک دسی بل است. این یکی از دلایل اصلی برای معرفی چنین سیستم اندازه گیری سطح صدا است. و کل محدوده دینامیکی شنوایی 130 دسی بل است:

.

اگرچه دسی بل برای اندازه گیری تغییر در یک کمیت فیزیکی استفاده می شود، اما می توان از آنها برای اندازه گیری قدر مطلق شدت صوت نیز استفاده کرد، به عنوان مقدار اولیه شدت صوت، مقدار آستانه شنوایی، یعنی 10-12 وات را در نظر گرفت. /m2. در این حالت مقدار شدت صدا بر حسب دسی بل نشان می دهد که این مقدار شدت صدا چند دسی بل از آستانه شنوایی فراتر می رود.

بنابراین، وقتی می گویند سطح صدا در بلندگوها 100 دسی بل است، به این معنی است که بلندگوها در سطحی کار می کنند که 100 دسی بل از آستانه شنوایی بیشتر است.

فشار صوت و شدت صوت در یک رابطه درجه دوم قرار دارند. این به آن معنا است:

.

در آکوستیک، قدرت صدا معمولاً با حجم آن مرتبط است، اما بلندی و قدرت صدا یکسان نیستند. بلندی، حس شنوایی ذهنی امواج صوتی است که نه تنها به قدرت صدا، بلکه به فرکانس آن نیز بستگی دارد.

در یک فرکانس ثابت، حجم صدا با افزایش شدت صدا افزایش می یابد. با این حال، درک ما از بلندی صدا تا حد زیادی به فرکانس صدا بستگی دارد. ما در فرکانس های متوسط ​​خیلی بهتر می شنویم، در حالی که در فرکانس های پایین و بالا حساسیت شنوایی ضعیف می شود. سطح صدای صفر مربوط به شدت صدای 10-12 وات بر متر مربع در فرکانس 1 کیلوهرتز است.

بر اساس مطالعات شنوایی انسان، نمودارهایی ساخته شده است که به عنوان منحنی های بلندی برابر شناخته می شوند. آنها خطوطی را به تصویر می کشند (آنها در فواصل 10 دسی بل در فرکانس 1000 هرتز قرار دارند) که با همان بلندی درک شده در فرکانس های مختلف مطابقت دارند (شکل 1).

دیجیتال سازی و فشرده سازی فایل های صوتی

تصوری که از گوش دادن به هر سیستم بلندگو ایجاد می شود تقریباً به طور کامل به کیفیت ماده منبع بستگی دارد. طبیعتاً این گفته فقط برای سیستم های چند رسانه ای طبقه متوسط ​​و بالاتر صادق است. بنابراین، در بلندگوهای پلاستیکی ارزان قیمت شنیدن تفاوت بین mp3 192 کیلوبیت بر ثانیه و mp3 256 کیلوبیت بر ثانیه دشوار است.

بیایید به یاد بیاوریم که چگونه یک سیگنال صوتی دیجیتالی می شود، یعنی سیگنال آنالوگ به شکل دیجیتالی نمایش تبدیل می شود. صدای دیجیتال به صورت مقادیر گسسته دامنه نمایش داده می شود. دیجیتال سازی (تبدیل یک سیگنال آنالوگ به شکل دیجیتال) شامل نمونه برداری سیگنال بر اساس زمان و کمی سازی بر اساس دامنه است (شکل 2). گسسته سازی به دست آوردن مقادیر دامنه پس از یک مرحله زمانی معین است. به عنوان مثال، برای یک CD صوتی، فرکانس نمونه برداری 44.1 کیلوهرتز است، به این معنی که در هر ثانیه 44100 نمونه دامنه سیگنال گرفته می شود.

کوانتیزاسیون دامنه جایگزینی مقادیر دامنه واقعی سیگنال با مقادیر تقریبی با دقت خاص است. دقت کوانتیزاسیون سیگنال با عمق بیت کدک مورد استفاده تعیین می شود. برای سی دی های صوتی، عمق بیت 16 بیت است که به شما امکان می دهد 216=65536 سطح دامنه مختلف را تنظیم کنید.

واضح است که هرچه نرخ نمونه برداری سیگنال بیشتر و عمق بیت کدک بیشتر باشد، سیگنال آنالوگ اصلی نزدیکتر با نمایش دیجیتال آن مطابقت خواهد داشت.

در ریاضیات ثابت شده است (قضیه Kotelnikov Nyquist) که برای مطابقت یک به یک بین سیگنال آنالوگ و نمایش دیجیتالی آن، فرکانس نمونه برداری باید دو برابر حداکثر فرکانس سیگنال آنالوگ باشد. بنابراین، برای به دست آوردن اطلاعات کامل در مورد سیگنال آنالوگ اصلی در محدوده فرکانس 0 تا 22050 هرتز (در محدوده فرکانس شنیداری)، لازم است سیگنال را در فرکانس حداقل 44.1 کیلوهرتز نمونه برداری کنید.

مقادیر نمونه به‌دست‌آمده در طول نمونه‌برداری سیگنال و کمیت‌سازی در فایل PCM (مدولاسیون کد پالس) به عنوان مجموعه‌ای از مقادیر دامنه متوالی نوشته می‌شوند. واضح است که هر چه فرکانس نمونه برداری بیشتر و عمق بیت کدک بیشتر باشد، حجم فایل حاصل پس از دیجیتالی شدن سیگنال بزرگتر خواهد بود. بنابراین، با فرکانس نمونه برداری 44.1 کیلوهرتز و کدک 16 بیتی در حالت استریو، یک ساعت فایل صوتی دارای حجم تقریبی 635 مگابایت است. توجه داشته باشید که نوع فایل استاندارد برای ذخیره سازی اطلاعات صوتی غیر فشرده دیجیتالی در حال حاضر فرمت WAV است.

نمایش سیگنال به عنوان یک فایل PCM بسیار بیهوده است و به فضای دیسک بسیار زیادی نیاز دارد. بنابراین، برای صرفه جویی در فضا، سیگنال صوتی فشرده می شود. فشرده سازی می تواند بر دو نوع باشد: با اتلاف و بدون اتلاف.

فشرده سازی اطلاعات بدون تلفات روشی برای رمزگذاری اطلاعات صوتی است که امکان بازیابی 100٪ داده ها را فراهم می کند. از این روش فشرده سازی داده ها در مواردی استفاده می شود که لازم است صد در صد کیفیت صدای اصلی داده های صوتی حفظ شود. به عنوان مثال، پس از میکس صدا در یک استودیوی ضبط، داده ها باید در یک آرشیو با کیفیت اصلی خود برای استفاده های بعدی ذخیره شوند. الگوریتم‌های فشرده‌سازی بدون تلفات موجود امروزی (به عنوان مثال، الگوریتم پیاده‌سازی شده در کدک‌های Monkeys Audio، Flac، WavPack، TTA، OptimFrog و دیگران) می‌توانند مقدار داده‌های اشغال شده را 20 تا 50 درصد کاهش دهند و در عین حال از بازیابی 100 درصدی داده‌های اصلی اطمینان حاصل کنند. پس از فشرده سازی

فشرده سازی داده های از دست رفته برای دستیابی به حداقل اندازه فایل در نتیجه استفاده می شود. این امر با حذف قطعات سخت شنیدنی از اصلی و قطع محدوده فرکانس به دست می آید.

پس از چنین تبدیلی، سیگنال رمزگشایی شده، هنگام پخش، شبیه به صدای اصلی است، اما هیچ مطابقت کاملی بین اصل و کپی تبدیل شده آن وجود ندارد.

روش های فشرده سازی با اتلاف می توانند اندازه نسخه اصلی را 7-14 برابر کاهش دهند. واضح است که هر چه نسبت فشرده سازی بیشتر باشد، مطابقت کمتری بین فایل صوتی اصلی و حاصل می شود.

روش های فشرده سازی با اتلاف زیادی وجود دارد. معروف ترین آنها MPEG-1 Layer 3 (نام رسمی mp3 معروف)، MPEG-2/4 AAC (MPEG-2 و MPEG-4 Advanced Audio Code)، Ogg Vorbis (OGG)، Windows Media است. صدا (WMA)، MusePask (MPC) و غیره

رمزگشایی صدا

رمزگشایی صدا فرآیند تبدیل فایل فشرده اصلی به فرمتی است که توسط کارت صدا قابل درک است. رمزگشایی فقط برای فرمت های فشرده مورد نیاز است، زیرا جریان غیرفشرده از قبل برای کارت های صدا قابل درک است. تفاوت هنگام گوش دادن به یک یا دیگر پخش کننده فقط هنگام گوش دادن به یک فایل فشرده شده با یک کدک با اتلاف قابل توجه است، زیرا هر پخش کننده الگوریتم رمزگشایی خاص خود را دارد.

پس از رمزگشایی، سیگنال به کارت صدا می رود که شامل یک مبدل آنالوگ به دیجیتال (ADC)، یک مبدل دیجیتال به آنالوگ (DAC) و یک سینت سایزر میدی است. برای گوش دادن به موسیقی، DAC از همه مهمتر است - هر چه کیفیت بالاتر باشد، کیفیت صدای حاصل نیز بالاتر است. بنابراین، اگر آکوستیک نسبتاً خوبی دارید، بهتر است کارت صدای یکپارچه را به یک کارت با کیفیت بالا تغییر دهید، به عنوان مثال Terratec Aureon Space/Sky، Audiotrack ProDigy 7.1 یا حتی Creative Live 24 bit 7.1. البته می‌توانید از کارت‌های صوتی گران‌تر استفاده کنید، اما در آکوستیک چند رسانه‌ای، احساس تفاوت بین آن‌ها و همان ProDigy 7.1 دشوار خواهد بود.

کابل ها

دو نوع کابل وجود دارد: آکوستیک و اتصال. کابل های بلندگو برای اتصال بلندگوها به آمپلی فایر و کابل های اتصال برای اتصال دستگاه های مختلف مانند کارت صدا و آمپلی فایر استفاده می شود. هدف اصلی کابل اتصال انتقال سیگنال به تقویت کننده بدون اتلاف است. از آنجایی که جریان های ضعیف از طریق کابل اینترکانکت جریان می یابد، محافظ این کابل از اهمیت بالایی برخوردار است. اگر کابل محافظ ضعیفی داشته باشد، مستعد انواع تداخل خواهد بود.

کابل بلندگو سیگنال تقویت شده قبلی را به بلندگوها منتقل می کند. جریان های قوی در این کابل جریان دارد، بنابراین نه تنها محافظ کابل، بلکه سطح مقطع آن نیز مهم است. هنگامی که جریان های زیادی در یک کابل نازک جریان می یابد، جریان های ضعیف از دست می رود و بخشی از فرکانس های بالا از بین می رود. علاوه بر این، به اصطلاح اثر پوستی اغلب رخ می دهد - اثر جابجایی جریان ها بر روی سطح کابل، که جریان های فرکانس بالا بیشتر مستعد آن هستند. با استفاده از کابلی با هسته های نازک می توان اثر پوستی را کاهش داد و با استفاده از کابلی با تعداد هسته های زیاد، جریان های ضعیف را کاهش داد.

برای سیستم های بلندگوی میان رده، کافی است از یک کابل اتصال با محافظ خوب و یک کابل OFC (مس بدون اکسیژن) با سطح مقطع حدود 1.0 میلی متر مربع برای بلندگوهای با توان 20 وات (هر بلندگو) استفاده کنید. و سطح مقطع 1.5 میلی متر مربع برای بلندگوهای با توان حداکثر 50 وات (هر بلندگو).

سیستم های آکوستیک

سیستم بوش (AS) دستگاهی است که برای تبدیل سیگنال های الکتریکی به ارتعاشات صوتی طراحی شده است. در اکثریت قریب به اتفاق بلندگوها، تبدیل سیگنال های الکتریکی به ارتعاشات صوتی از طریق سرهای الکترودینامیکی انجام می شود که اصل عملکرد آن بر اساس پدیده القای الکترومغناطیسی است.

قسمت اصلی سر الکترودینامیک یک دیفیوزر است که امواج صوتی را ایجاد می کند. دیفیوزر سر الکترودینامیک دو سطح دارد: جلو و عقب. بر این اساس، در حین حرکت نوسانی دیفیوزر، دو موج صوتی تولید می شود که یکی از سطح جلویی و دومی از سطح عقب آن می آید. این امواج نسبت به یکدیگر ضد فاز هستند و در فضای باز تا حدی یکدیگر را خنثی می کنند. برای از بین بردن این اثر میرایی، موج ساطع شده از سطح پشتی دیفیوزر با قرار دادن سر الکترودینامیک در یک فضای بسته (در محفظه بلندگو) میرا می شود.

در مورد دیفیوزر صحبت می کنیم، خاطرنشان می کنیم که انواع مختلفی از دیفیوزرها برای فرکانس های مختلف استفاده می شود. بنابراین از دیفیوزرهای کولار برای فرکانس های متوسط ​​و پایین و از دیفیوزرهای ابریشمی برای فرکانس های بالا استفاده می شود.

هد الکترودینامیک علاوه بر دیفیوزر دارای سیستم تعلیق نیز می باشد که وظیفه اصلی آن بازگرداندن دیفیوزر به حالت اولیه در حین حرکت نوسانی است. سیستم تعلیق باید به اندازه کافی سفت و سخت باشد تا به سرعت دیفیوزر را به حالت اولیه خود بازگرداند، اما در عین حال به اندازه کافی نرم باشد تا مانع حرکت دیفیوزر نشود.

اندازه ستونی که سر الکترودینامیک در آن قرار دارد نیز مهم است. اصولا هر چه بیشتر بهتر. در بدنه اسپیکر کوچک، الاستیسیته اضافی هوا در حجم داخلی ایجاد می شود که از سمت پشت به دیفیوزر فشار وارد می کند و باعث کاهش انعطاف پذیری تعلیق آن می شود. این امر به ویژه بر روی بلندگوهای فرکانس پایین تأثیر منفی دارد.

انواع سیستم های بلندگو

از نظر طراحی آکوستیک، سیستم های صوتی را می توان به انواع زیر تقسیم کرد:

  • محفظه باز یا طراحی بدون بار صوتی (دیواره پشتی محفظه بلندگو تا حدی یا به طور کامل وجود ندارد).
  • محفظه ای با هزارتویی برای میرایی امواج تولید شده توسط دیواره عقبی دیفیوزر.
  • محفظه بسته یا طراحی دارای بار صوتی؛
  • بدن با رفلکس باس رفلکس باس لوله ای با طول و مقطع مشخص است که در محفظه نصب شده است. رفلکس باس به شما امکان می دهد تا به بازتولید معمولی فرکانس های پایین برسید زیرا آنها چندین بار در لوله رفلکس باس تقویت می شوند. علاوه بر این، رفلکس باس فشار اضافی در ستون را کاهش می دهد.
  • مسکن با رادیاتور غیرفعال.

ویژگی های اصلی سیستم های صوتی

ویژگی های اصلی سیستم های صوتی به طور سنتی شامل موارد زیر است:

میزان صدای بلندگو؛

قدرت بلندگو؛

حساسیت؛

پاسخ دامنه فرکانس؛

اعوجاج هارمونیک؛

اعوجاج غیرخطی؛

نسبت سیگنال به نویز؛

جداسازی فرکانس

صدای بلندگودقیقاً به همان روشی که حجم صدا اندازه گیری می شود. تنها تفاوت این است که اندازه گیری بر اساس قدرت صدا نیست، بلکه بر اساس ولتاژ روی سر الکترودینامیک است، یعنی:

,

که در آن U 1 مقداری ولتاژ مرجع و U 2 حداکثر مجاز است.

ولتاژهای مرجع انواع مختلفی دارند، بنابراین برای جلوگیری از سردرگمی، از واحدهای اندازه گیری متفاوتی استفاده می شود. بنابراین، اگر واحد اندازه گیری dB (dBu) باشد، 775/0 ولت به عنوان ولتاژ مرجع استفاده می شود و برای واحدهای اندازه گیری dBV (dBV)، 1 ولت به عنوان ولتاژ مرجع در نظر گرفته می شود. یکدیگر با یک رابطه آشکار:

.

همچنین یک واحد اندازه گیری به نام dBm وجود دارد که از ولتاژ مرجع 0.775 ولت نیز استفاده می کند.

میزان صدای سیستم بلندگو ارتباط مستقیمی با میزان صدای تولید شده دارد. بنابراین، اگر گذرنامه گوینده نشان می دهد که مقدار حجم آن 60 دسی بل است، در اتاقی که چنین سیستمی تا حداکثر روشن است، باید با صدای بلند صحبت کنید.

از آنجا که قدرت بلندگومی توان به روش های مختلف اندازه گیری کرد و بر این اساس واحدهای مختلفی برای اندازه گیری توان وجود دارد.

توان اندازه گیری شده در RMS (ریشه میانگین مربع ریشه میانگین مربع)، با اعمال سیگنالی در فرکانس 1 کیلوهرتز در فاصله 1 متری از بلندگو و در حین دستیابی به یک اعوجاج هارمونیک مشخص (معمولاً 10٪) اندازه گیری می شود. بنابراین، اگر گفته شود قدرت سیستم بلندگو 50 وات RMS است، به این معنی است که وقتی یک سیگنال 50 وات به آن داده می شود، بلندگو می تواند برای مدت طولانی بدون آسیب مکانیکی به سر الکترودینامیکی (پارگی هد) کار کند. دیفیوزر، آسیب به سیستم تعلیق، آسیب به سیم پیچ و غیره. با این حال، با چنین اعوجاج شدید (10٪) شنیدن چیزی به دلیل خس خس شدید تقریبا غیرممکن است.

یکی دیگر از گزینه های اندازه گیری توان، خروجی قدرت موسیقی اوج (PMPO) است. این قدرت اوج بار کوتاه مدتی را که آکوستیک می تواند بدون آسیب مکانیکی تحمل کند را تعیین می کند. توجه داشته باشید که این قدرت معنای عملی ندارد.

حساسیت بلندگوفشار صوتی ایجاد شده توسط یک بلندگو در فاصله 1 متری زمانی که سیگنالی با توان 1 وات و فرکانس 1 کیلوهرتز ارائه می شود را مشخص می کند. حساسیت در دسی بل نسبت به آستانه شنوایی (2S10-5 Pa) اندازه گیری می شود. برای مثال، حساسیت 85 dB/W/m به این معنی است که بلندگو قادر است فشار صوتی 85 دسی بل را در فاصله 1 متری از بلندگو در هنگام ارسال سیگنال 1 W ایجاد کند.

به طور متعارف، در نظر گرفته می شود که حساسیت dB/W/m 88-84 کم، حساسیت dB/W/m 89-92 متوسط ​​و حساسیت dB/W/m 102-93 زیاد است.

حساسیت یک ویژگی نسبتاً نشان دهنده یک بلندگو است، زیرا مستقیماً میزان صدای آن را تعیین می کند. به عنوان مثال، هنگام مقایسه دو بلندگو با قدرت 60 وات RMS، باید به بلندگوی با حساسیت بالاتر اولویت داده شود، زیرا حجم صدای ایجاد شده توسط چنین بلندگوی بیشتر خواهد بود و همه چیزهای دیگر برابر هستند.

پاسخ دامنه فرکانس (AFC)

مشخصه دامنه فرکانس نموداری از تغییر دامنه سیگنال خروجی در برابر فرکانس آن در کل محدوده فرکانس های بازتولید شده است. پاسخ فرکانس با ارائه یک سیگنال سینوسی که دامنه ثابت و فرکانس متفاوت است اندازه گیری می شود. در نمودار، دامنه سیگنال سینوسی مربوط به فرکانس 1 کیلوهرتز 0 دسی بل در نظر گرفته شده است.

در حالت ایده آل، پاسخ فرکانسی یک خط مستقیم در کل محدوده فرکانس (از 20 هرتز تا 20 کیلوهرتز) است. در این حالت سیگنال بدون اعوجاج بازتولید می شود. با این حال، در واقعیت چنین پاسخ فرکانسی ایده آلی وجود ندارد.

گاهی به جای عبارت پاسخ فرکانسی از مفهوم FR (پاسخ فرکانس) استفاده می شود. در این حالت به جای نمودار پاسخ فرکانسی، فقط فرکانس های تکرارپذیر مرزی و ناهمواری ها آورده شده است. به عنوان مثال، اگر 120 هرتز-18 کیلوهرتز (± dB) نشان داده شده باشد، به این معنی است که این بلندگو در محدوده فرکانس 120 هرتز تا 18 کیلوهرتز دارای صدای قابل اعتماد و اعوجاج (تغییر در دامنه سیگنال نسبت به دامنه در فرکانس 1000 هرتز) از 3 دسی بل تجاوز نمی کند.

اعوجاج غیر خطیبا اعمال یک سیگنال سینوسی با فرکانس 1000 هرتز اندازه گیری می شود. با استفاده از یک فیلتر خاص، هارمونیک های "اضافی" در سیگنال صوتی شناسایی شده و قدرت آنها تعیین می شود. نتیجه نهایی به صورت اعوجاج هارمونی کل (THD) بیان می شود که وزن هارمونیک های اضافی در طیف سیگنال سینوسی اصلی 1 کیلوهرتز پس از عبور از مسیر اعوجاج است. این ضریب به عنوان جذر نسبت مجموع توان های همه هارمونیک ها، به جز اصلی، به توان سیگنال مفید محاسبه می شود. آکوستیک کلاس Hi-Fi باید دارای THD حداکثر 1.5٪ در فرکانس 1000 هرتز باشد.

که در آن S سطح سیگنال مفید، سطح نویز N.

نشانگر SNR برای یک سیستم بلندگوی بسیار خوب بیش از 90 دسی بل، برای یک سیستم طبقه متوسط ​​حدود 75-85 دسی بل و برای یک سیستم با کیفیت پایین کمتر از 60 دسی بل است.

متقاطعاین نشانگر تعیین می کند که چقدر فرکانس های متوسط ​​و پایین به توییتر منتقل می شود. Crosstalk به عنوان نسبت سیگنال ارسالی به سیگنال ضعیف شده با استفاده از فیلتر فرکانس محاسبه می شود. به عنوان مثال، مقدار 60 دسی بل نشان می دهد که فیلتر فرکانس سیگنال اصلی، هنگامی که روی توییتر اعمال می شود، فرکانس های پایین و متوسط ​​را 60 دسی بل کاهش می دهد.

صدای فراگیر دالبی (DSS)

فناوری Dolby Surround Sound یک فناوری رمزگذاری صوتی مبتنی بر فیلتر است که برای مصارف خانگی (سینماهای خانگی) طراحی شده است. با استفاده از رمزگشای Dolby Surround، این فناوری به شما امکان می دهد سه کانال صوتی را از یک سیگنال دو کاناله رمزگذاری شده (سیگنال استریو) انتخاب کنید: چپ، راست و عقب با محدوده فرکانسی از 100 هرتز تا 7 کیلوهرتز. در غیاب رمزگشا، صدا به صورت صدای استریو دو کاناله معمولی بازتولید می شود.

این فناوری توسط آزمایشگاه دالبی در سال 1982 معرفی شد.

Dolby Surround Pro Logic (DPL)

فناوری Dolby Surround Pro Logic قدم بعدی در توسعه صدای چند کاناله برای سیستم های سینمای خانگی است. این استاندارد توسط آزمایشگاه دالبی در سال 1987 ارائه شد. فناوری Dolby Surround Pro Logic به شما امکان می دهد چهار کانال صدای فراگیر (چپ، راست، مرکز و عقب) را از یک آهنگ استریو دو کاناله استخراج کنید. محدوده فرکانس از 100 هرتز تا 7 کیلوهرتز است.

دالبی دیجیتال

دالبی دیجیتال، که در سال 1992 معرفی شد، یک استاندارد رمزگشایی صوتی چند کاناله است که صدا را به صورت شش کانال مجزا نشان می‌دهد: پنج کانال فراگیر (چپ، راست، مرکز و دو جلو) و یک کانال فرکانس پایین (ساب ووفر). ارائه صوتی در ابتدا دیجیتال بود و محدوده فرکانس از 20 هرتز به 20 کیلوهرتز افزایش یافت (در حال حاضر محدوده فرکانس 3 هرتز تا 20 کیلوهرتز برای پنج کانال و 3 هرتز تا 120 کیلوهرتز برای کانال ساب ووفر است). این استاندارد امروزه یکی از رایج ترین است.

دالبی دیجیتال AC3

استاندارد Dolby Digital AC3 یک طرح فشرده سازی صدا است که به طور خاص برای استاندارد Dolby Digital ایجاد شده است. این طرح فشرده سازی از یک مدل سایکوآکوستیک استفاده می کند که راندمان بسیار بالایی دارد (نسبت فشرده سازی می تواند بیش از 12:1 باشد و میزان بیت از 64 تا 640 کیلوبیت بر ثانیه) و کیفیت صدای بسیار خوبی دارد.

Dolby Surround AC3

Dolby Surround AC3 نسخه ساده شده استاندارد Dolby Digital که برای سیستم های سینمای خانگی طراحی شده است. این استاندارد با استاندارد دالبی دیجیتال در کاهش نرخ جریان داده متفاوت است.

DTS (سیستم تئاتر دیجیتال)

مانند Dolby Digital، DTS یک استاندارد صوتی شش کاناله (5.1) است، اما با کیفیت بسیار بالاتر. نسبت فشرده سازی در اینجا 4:1 است و نرخ داده (بیت) 882 کیلوبیت بر ثانیه (الگوریتم apt-X100) است. به دلیل نرخ فشرده سازی پایین تر و الگوریتم پیشرفته تر، کیفیت صدای کدگذاری شده در DTS بسیار بالاتر از Dolby Digital است، اما استاندارد دوم به دلیل استفاده گسترده از DVD رایج تر است. کیفیت بالای DTS همچنین منجر به استفاده از آن برای ایجاد دیسک های موسیقی شد، البته به شکل کمی تغییر یافته (با نسبت فشرده سازی کمتر و الگوریتم رمزگذاری اصلاح شده). تولید دی وی دی DTS از نرخ نمونه برداری 48 کیلوهرتز استفاده می کند که آن را به بالاترین کیفیت استاندارد کدگذاری صدای DVD موجود امروز تبدیل می کند.

Dolby Pro Logic II

استاندارد Dolby Pro Logic II، که توسعه بیشتر استانداردهای Dolby Stereo Pro Logic است، به رسیور اجازه می دهد تا صدای استریو معمولی را به شش کانال (5.1) تجزیه کند.

Dolby Pro Logic IIx

Dolby Pro Logic IIx گام بعدی در توسعه Dolby Pro Logic II است. در این حالت، امکان تجزیه صدای استریو به هفت کانال (6.1) یا هشت (7.1) وجود دارد. استاندارد Dolby Pro Logic IIx تاکنون تنها استانداردی است که توانایی گسترش صحیح و کامل هر صدای استریو یا 5.1 را به فرمت های 6.1 و 7.1 ارائه می دهد. سه حالت رمزگشایی امکان پذیر است:

فیلم تکراری کانال مرکزی یا کانال های عقب.

بازی (بازی) سیگنال فقط به "کانال های جدید" ارسال می شود.

موسیقی (موسیقی).

هیچ یک از حالت ها از اطلاعات کانال های جلو (فقط از مرکز و عقب) استفاده نمی کند.

Dolby Digital EX

این استاندارد نوعی از استاندارد Dolby Pro Logic IIx است که برای سینماهای خانگی در نظر گرفته شده است.

Dolby Digital Surround EX

استاندارد Dolby Digital Surround EX یک نسخه نسبتاً جدید و توسعه یافته 6.1 از استاندارد Dolby Digital Surround است. این استاندارد کانال عقب دیگری دارد که اگر صدای منبع در فرمت 5.1 ضبط شده باشد، کانال مرکزی موجود را کپی می کند. اگر فایل منبع در قالب 6.1 ارائه شود، کانال اضافی به یک کانال صدای فراگیر کامل دیگر تبدیل می شود.

DTS-ES

استاندارد DTS-ES یک آنالوگ کامل از استاندارد Dolby Digital EX است، اما از DTS. این استاندارد همچنین به شما امکان می دهد صدا را با فرمت های 6.1 و 7.1 رمزگذاری کنید و صدای 5.1 کد شده در DTS را به ترتیب به هفت (6.1) یا هشت (7.1) کانال تجزیه کنید.

بهترین مقالات در این زمینه