نحوه راه اندازی گوشی های هوشمند و رایانه های شخصی پرتال اطلاعاتی
  • خانه
  • ویندوز 7، XP
  • روش کوانتیزاسیون تصویر انتقال از سیگنال ها و تبدیل های پیوسته به گسسته

روش کوانتیزاسیون تصویر انتقال از سیگنال ها و تبدیل های پیوسته به گسسته

سیگنال ها معمولاً به صورت پیوسته به سیستم پردازش اطلاعات وارد می شوند. برای پردازش کامپیوتری سیگنال های پیوسته، ابتدا باید آنها را به سیگنال های دیجیتال تبدیل کرد. برای این کار، عملیات نمونه برداری و کوانتیزاسیون انجام می شود.

نمونه برداری تصویر

نمونه برداریتبدیل یک سیگنال پیوسته به دنباله ای از اعداد (نمونه) است، یعنی نمایش این سیگنال در برخی از ابعاد محدود. این دیدگاه شامل ارائه یک سیگنال به یک مبنای معین است.

راحت ترین از نظر سازمان پردازش و روش طبیعی نمونه برداری، ارائه سیگنال ها در قالب نمونه ای از مقادیر آنها (نمونه ها) در نقاط جداگانه و با فاصله منظم است. این روش نامیده می شود شطرنجی سازی، و توالی گره هایی که از آنها نمونه برداری می شود است شطرنجی... فاصله ای که از طریق آن مقادیر سیگنال پیوسته گرفته می شود نامیده می شود مرحله نمونه برداری... مقدار معکوس مرحله نامیده می شود نرخ نمونهبرداری,

یک سوال اساسی در طول نمونه برداری: با چه فرکانسی از سیگنال نمونه برداری کنیم تا بتوانیم آن را از این نمونه ها بازیابی کنیم؟ بدیهی است که اگر نمونه‌ها به ندرت گرفته شوند، حاوی اطلاعاتی در مورد سیگنالی که به سرعت در حال تغییر است، نخواهند بود. نرخ تغییر یک سیگنال با فرکانس بالای طیف آن مشخص می شود. بنابراین، حداقل فاصله نمونه برداری مجاز مربوط به بالاترین فرکانس طیف سیگنال (به طور معکوس با آن) است.

در مورد نمونه گیری یکنواخت، درست است قضیه کوتلنیکوفدر سال 1933 در اثر "در مورد پهنای باند اتر و سیم در مخابرات" منتشر شد. می گوید: اگر یک سیگنال پیوسته دارای طیف فرکانس محدود باشد، می توان آن را به طور کامل و بدون ابهام از نمونه های گسسته آن که با نقطه گرفته شده است، بازسازی کرد، یعنی. با فرکانس

بازیابی سیگنال با استفاده از عملکرد انجام می شود ... کوتلنیکوف ثابت کرد که یک سیگنال پیوسته که معیارهای فوق را برآورده می کند می تواند به صورت یک سری نمایش داده شود:

.

به این قضیه، قضیه نمونه گیری نیز گفته می شود. تابع نیز نامیده می شود تابع شمارش یا کوتلنیکوف، اگرچه این نوع سری درون یابی توسط ویتاکر در سال 1915 مورد مطالعه قرار گرفت. تابع شمارش وسعت نامتناهی در زمان دارد و در نقطه ای که نسبت به آن متقارن است به حداکثر مقدار خود برابر با یک می رسد.

هر یک از این توابع را می توان به عنوان پاسخی به یک ایده آل در نظر گرفت فیلتر پایین گذر(LPF) روی پالس دلتا که در لحظه زمان می رسد. بنابراین، برای بازیابی سیگنال پیوسته از نمونه های گسسته آن، آنها باید از فیلتر پایین گذر مربوطه عبور داده شوند. لازم به ذکر است که چنین فیلتری غیر علّی و از نظر فیزیکی غیرقابل تحقق است.

نسبت داده شده به معنای امکان بازسازی دقیق سیگنال ها با طیف محدود از توالی نمونه های آنها است. سیگنال های طیف محدود- اینها سیگنالهایی هستند که طیف فوریه آنها فقط در بخش محدودی از دامنه تعریف غیر صفر است. سیگنال های نوری را می توان به آنها نسبت داد، زیرا طیف فوریه تصاویر به دست آمده در سیستم های نوری به دلیل اندازه محدود عناصر آنها محدود است. فرکانس نامیده می شود فرکانس نایکیست... این فرکانس قطعی است که بالاتر از آن نباید هیچ مولفه طیفی در سیگنال ورودی وجود داشته باشد.

کمی کردن تصاویر

در پردازش تصویر دیجیتال، محدوده دینامیکی پیوسته مقادیر روشنایی به تعدادی سطوح گسسته تقسیم می شود. این روش نامیده می شود کوانتیزاسیون... ماهیت آن در تبدیل یک متغیر پیوسته به یک متغیر گسسته است که مجموعه ای محدود از مقادیر را می گیرد. این مقادیر نامیده می شوند سطوح کوانتیزاسیون... در حالت کلی، تبدیل با یک تابع پله ای بیان می شود (شکل 1). اگر شدت نمونه تصویر به بازه زمانی تعلق داشته باشد (یعنی چه زمانی ، سپس نمونه اصلی با سطح کوانتیزاسیون جایگزین می شود، جایی که آستانه های کوانتیزاسیون... فرض بر این است که محدوده دینامیکی مقادیر روشنایی محدود و برابر است.

برنج. 1. تابعی که کوانتیزاسیون را توصیف می کند

وظیفه اصلی در این مورد تعیین مقادیر آستانه و سطوح کوانتیزاسیون است. ساده ترین راه برای حل این مشکل، تقسیم محدوده دینامیکی به فواصل مساوی است. با این حال، این بهترین راه حل نیست. اگر مقادیر شدت بیشتر نمونه های تصویر، به عنوان مثال، در منطقه "تاریک" گروه بندی شده اند و تعداد سطوح محدود است، توصیه می شود که به طور ناهموار کوانتیزه شود. در منطقه "تاریک"، شما باید بیشتر و کمتر در منطقه "روشن" کوانتیزه کنید. این باعث کاهش خطای کوانتیزاسیون می شود.

در سیستم‌های پردازش تصویر دیجیتال، آنها تلاش می‌کنند تا تعداد سطوح و آستانه‌های کوانتیزه‌سازی را کاهش دهند، زیرا مقدار اطلاعات مورد نیاز برای رمزگذاری یک تصویر به تعداد آنها بستگی دارد. با این حال، با تعداد نسبتاً کمی از سطوح در یک تصویر کوانتیزه، خطوط نادرست ممکن است ظاهر شوند. آنها در نتیجه تغییر ناگهانی در روشنایی تصویر کوانتیزه به وجود می آیند و به ویژه در نواحی ملایم تغییر آن قابل توجه هستند. خطوط کاذب به طور قابل توجهی کیفیت بصری یک تصویر را کاهش می دهند، زیرا بینایی انسان به خصوص به خطوط خطوط حساس است. با کوانتیزاسیون یکنواخت، تصاویر معمولی حداقل به 64 سطح نیاز دارند.


در پردازش تصویر دیجیتال، محدوده دینامیکی پیوسته مقادیر روشنایی به تعدادی سطوح گسسته تقسیم می شود. این روش کوانتیزاسیون نامیده می شود. یک کوانتایزر یک متغیر پیوسته را به یک متغیر گسسته تبدیل می کند که مجموعه ای محدود از مقادیر را می گیرد.
... به این مقادیر سطوح کوانتیزاسیون می گویند. در حالت کلی، تبدیل با یک تابع پله ای بیان می شود (شکل 8). اگر روشنایی مرجع تصویر متعلق به بازه باشد
(یعنی وقتی
، سپس نمونه اصلی با سطح کوانتیزاسیون جایگزین می شود، جایی که
- آستانه های کوانتیزاسیون فرض بر این است که محدوده دینامیکی مقادیر روشنایی محدود و برابر است
.

شکل 8 تابعی که کوانتیزاسیون را توصیف می کند
وظیفه ساخت یک کوانتایزر تعیین مقادیر آستانه ها و سطوح است. ساده ترین راه برای حل این مشکل، تقسیم محدوده دینامیکی به فواصل مساوی است. با این حال، این بهترین راه حل نیست. اگر مقادیر روشنایی بیشتر نمونه های تصویر، به عنوان مثال، در ناحیه "تاریک" گروه بندی شده باشند و تعداد سطوح محدود باشد، توصیه می شود که به صورت ناهموار کوانتیزه شود. در ناحیه "تاریک"، شما باید اغلب و کمتر در ناحیه "روشن" کوانتیزه کنید. این باعث کاهش خطای کوانتیزاسیون می شود.

در سیستم های واقعی، دو نوع کوانتیزاسیون عمدتاً استفاده می شود - گامای خطی تصحیح شده. در حالت دوم، سیگنال آنالوگ قبل از کوانتیزاسیون تحت یک تبدیل غیر خطی قرار می گیرد. x = x 1 / . این عملکرد تقریباً در تمام دوربین های CCD موجود تجاری اجرا می شود. مقدار استاندارد برای  1.4 است.

نیاز به تصحیح گاما (حتی برای سیستم های کاملا آنالوگ) از کنتراست محدود دستگاه های تصویربرداری مانند نمایشگرهای رایانه ناشی می شود. منحنی روشنایی چشم انسان دارای یک شخصیت تقریبا لگاریتمی است، بنابراین، فشرده سازی محدوده دینامیکی در ناحیه تن های روشن از نقطه نظر فیزیولوژیکی توجیه می شود.

انتخاب بهینه تعداد سطوح نمونه گیری تا حد زیادی به ویژگی های دستگاه گیرنده (مثلاً دوربین مداربسته) بستگی دارد. نسبت سیگنال به نویز بیشتر از 46 دسی بل در دوربین های CCD هدف عمومی به ندرت است. نسبت سیگنال به نویز با عبارت زیر تعیین می شود:
، جایی که
- حداکثر دامنه سیگنال مفید،
ریشه میانگین دامنه مربع نویز است. بر این اساس، زمانی که نسبت سیگنال به نویز 46 دسی بل باشد، تعداد مفید سطوح کوانتیزاسیون 200 است که نشان دهنده توصیه به استفاده از کوانتایزر هشت بیتی است.

روش های پنهان سازی در حوزه فضایی نیز می تواند شامل روش باشد کمی سازی تصویر، بر اساس وابستگی بین پیکسلی، که می تواند با برخی از عملکردها توصیف شود. در ساده ترین حالت، می توانید تفاوت بین پیکسل های مجاور را محاسبه کنید. و (یا و) و آن را به عنوان پارامتر تابع تنظیم کنید: ، که در آن یک تقریب گسسته از تفاوت سیگنال است.

از آنجایی که یک عدد صحیح است و تفاوت واقعی یک عدد واقعی است، خطاهای کوانتیزاسیون رخ می دهد. برای سیگنال های با همبستگی قوی، این خطا نزدیک به صفر است:.

با این روش، اطلاعات با تصحیح سیگنال تفاوت پنهان می شود. کلید جدولی است که یک بیت معین را به هر مقدار ممکن اختصاص می دهد، به عنوان مثال:

-4 -3 -2 -1
b i

برای پنهان کردن بیت پیام i، تفاوت محاسبه می شود. اگر b i با بیت مخفی مطابقت نداشته باشد، که باید پنهان شود، آنگاه مقدار با نزدیکترین چیزی که چنین شرطی برای آن برآورده شده است، جایگزین می شود. در این حالت، مقادیر شدت پیکسل هایی که تفاوت بین آنها محاسبه شده است، بر این اساس تنظیم می شود. استخراج پیام مخفی مطابق مقدار مربوط به تفاوت انجام می شود.

نمونه ای از برنامه ای را در نظر بگیرید که روش کمی سازی تصویر را پیاده سازی می کند

داده های اولیه استاندارد هستند.

گام 2

استگانکی توسط ماژول های (M.28) و (M.29) محاسبه می شود. در این حالت، ماژول (M.28) تمام تفاوت‌های سیگنال ممکن (از 255- تا 255+) را برمی‌گرداند و ماژول (M 29) مقادیر بیت مربوط به این تفاوت‌ها را برمی‌گرداند.

ارزش ها b iدر این حالت آنها بر اساس آرایه مولفه رنگ قرمز محاسبه می شوند. علاوه بر این، برای هر ستون از آرایه آرمجموع مدول 2 از عناصر تشکیل دهنده آن با یک جمع بولی به حاصل جمع یک در هر عنصر سوم محاسبه می شود. در انتهای مدول بردار حاصل ببا طول بردار منبسط می شود. بنابراین عناصر آرایه بشبه تصادفی هستند. قطعاتی از کلید لحافی شکل گرفته در شکل نشان داده شده است. 5.15.

l- b =
-255
-254
-253
-252
-2
-1

برنج. 6.15. تکه هایی از کلید لحاف

بیایید آرایه کانتینر را مستقر کنیم با(آرایه ای از مولفه رنگ آبی) با استفاده از ماژول (M.16) به بردار تبدیل می شود. بیایید شاخص شروع عنصر بردار حاصل را تنظیم کنیم، که از آن جاسازی بیت ها، پیام ها (مثلاً) انجام می شود.

برای محاسبه اندازه گام (فاصله شبه تصادفی) از ماژول (M.15) استفاده می کنیم. اجازه دهید در همان زمان به := 8.

مرحله 4

الگوریتم جاسازی توسط ماژول (M.30) پیاده سازی شده است. تشکیل یک بردار از داده های باینری از یک رشته کاراکتر مشابه آنچه در (M.21) ارائه شده است (اما در این مورد، باید با آن جایگزین شود).

برای هر بیت از پیام، شاخص محاسبه می شود zعنصر برداری ظرف رزومه... تفاوت بین پیکسل های مجاور محاسبه می شود C vzو C vz-1حلقه داخلی بردار را برای مقدار اختلاف مربوطه جستجو می کند. در صورت یافتن، مقدار شاخص به متغیر اختصاص داده می شود من،که با تفاوت داده شده در مطابقت دارد.

اگر مقدار با بیت فعلی پیام پنهان مطابقت نداشته باشد، جستجو برای نزدیکترین نمایه انجام می شود که در آن دوبرابر با بیت پیام است. جستجو در پایین (L)و تا (H)از شاخص

تخصیص اولیه متغیرها و مقدار 1000 ± عدم امکان تکرار مقادیر قبلی را تضمین می کند اگر حرکت به سمت پایین یا بالا منجر به تحقق شرایط تنظیم نشده باشد (اگر شاخص خیلی نزدیک به مرز پایین یا بالایی بردار ب). پس از یافتن مقادیر، مقداری که به مقدار اولیه نزدیکتر است انتخاب می شود.

شدت پیکسل ظرف Sv zبرابر است با شدت پیکسل مجاور که با مقدار افزایش یافته است Sv z -1... اگر این افزایش منجر به خارج شدن مقدار شدت رنگ از محدوده شود، برعکس، به شدت یک پیکسل مجاور Sv z -1 مقدار شدت پیکسل اختصاص داده می شود. Sv zکاهش به ارزش). پس از اینکه آخرین بیت پیام جاسازی شد، حلقه بیرونی قطع می شود.

انجام تا زدن معکوس بردار Svبه ماتریسی که ابعاد آرایه اولیه را دارد با(M.7). یک آرایه می گیریم اس.

از آنجایی که ایده DICM کاملاً ساده است، بنابراین، همانطور که از نمودارهای شکل 1 نشان داده شده است. 4.8، ویژگی‌های سیستم کاهش افزونگی تصویر DPCM توسط [ترتیب پیش‌بینی‌کننده تعیین می‌شود. پ،مقادیر ضرایب پیش بینی آ من , تعداد سطوح کوانتیزاسیون و مکان آنها.

ترتیب پیش بینی کننده به ویژگی های آماری تصویر بستگی دارد. به عنوان یک قاعده، اگر بتوان دنباله‌ای از نمونه‌ها را با فرآیند مارکوف اتورگرسیو مدل‌سازی کرد n-امینترتیب، سپس تفاوت های به دست آمده با استفاده از پیش بینی بهینه n-امینترتیب دنباله ای از اعداد نامرتبط را تشکیل می دهد. واضح است که تصاویر فرآیندهای مارکوفی نیستند n-امینترتیب، اما تجربه در فشرده‌سازی تصویر نشان می‌دهد که ویژگی‌های همبستگی تصاویر را می‌توان با فرآیند مارکوف مرتبه سوم توصیف کرد و این منجر به دستگاه‌های پیش‌بینی مرتبه سوم می‌شود. (n = 3)... به طور مشابه، هنگام شبیه‌سازی تصاویر، مشخص شد که DPCM با پیش‌بینی‌کننده‌های مرتبه بالاتر، افزایش بیشتری در کیفیت تصویر (هم از نظر داده‌های ذهنی و هم از نظر عینی) به همراه نمی‌آورد.

ضرایب پیش بینی آ منرا می توان با استفاده از تحلیل ریشه میانگین مربعات خطا تعیین کرد. اجازه دهید g ( ک ) - روی خط اسکن حساب می کند، الف

( ک ) - مقادیر پیش بینی شده این نمونه ها لازم است که ریشه میانگین مربعات خطا حداقل باشد، یعنی. نیاز به پیدا کردن

min e = E (g (k) - } (4.21)

همه جا k، و i

این یک مشکل شناخته شده است و اگر روند g ( ک ) ثابت است، سپس محلول آن شکل می گیرد

, (4.22)

r (j - i) = E [g (k - j) g (k -i)] (4.23)

معمولاً به عنوان تابع خودهمبستگی فرآیند نامیده می شود gشانس یک منبا حل سیستم معادلات (4.22) به دست می آیند.

مقادیر بهینه ضرایب پیش بینی به روابط نقاط تصویر توصیف شده توسط تابع همبستگی خودکار بستگی دارد. از تعریف (4.20) می توان دریافت که در مورد داده های ثابت، تابع خودهمبستگی با مقدار ثابتی با تابع فوق تفاوت دارد. برای داده های غیر ثابت، تابع r(در رابطه (4.23) به متغیرهای فضایی بستگی دارد و ضرایب پیش‌بینی بهینه باید بسته به مختصات مکانی تغییر کند. این برای تصاویر معمول است. خوشبختانه، ویژگی‌های آماری غیر ثابت تصاویر معمولاً می‌توانند به خوبی با توابع ثابت تقریب شوند، بنابراین هنگامی که اطلاعات ویدئویی با روش DPCM فشرده می شود، یک دستگاه پیش بینی خطی غیر قابل تنظیم نتایج بسیار خوبی می دهد، خطاها معمولاً در مرزهای اشیاء تصویر شده ظاهر می شوند، جایی که فرض ثابت بودن به کمترین میزان برآورده می شود، و در تصویر بازسازی شده. آنها از نظر بصری به عنوان نقاط غیرعادی - روشن یا تاریک درک می شوند.

انتخاب تعداد سطوح کوانتیزه شدن و محل آستانه های کمی سازی تا حدی کمی و تا حدی کیفی است. با محاسبات کمی می توان موقعیت آستانه های کمی سازی را پیدا کرد. کار مکس اولین کاری بود که کوانتیزاسیون غیریکنواخت را در نظر گرفت که به تابع توزیع سیگنال در حال کوانتیزه شدن بستگی دارد و خطای ریشه میانگین مربع ناشی از تعداد محدود سطوح کوانتیزه شدن را به حداقل می رساند. الگوریتم مکس به شما امکان می دهد مکان بهینه نقاط انتقال را برای تعداد معینی از سطوح کوانتیزه پیدا کنید. با این حال، تعداد سطوح کوانتیزاسیون بر اساس ملاحظات کیفی ذهنی انتخاب می‌شود.

حداقل تعداد سطوح کوانتیزاسیون برابر با دو (اعداد یک رقمی) است و مربوط به چنین کمی سازی تصاویر است که در آن تفاوت روشنایی مقدار ثابتی (مثبت یا منفی) به خود می گیرد. این روش معمولاً به عنوان دلتا - مدولاسیون،مدار DPCM (شکل 4.8) را می توان با جایگزینی کوانتایزر با یک محدود کننده و پیش بینی کننده ساده کرد. n هفتمسفارش در هر یکپارچه کننده هنگام کاهش افزونگی تصاویر با روش مدولاسیون دلتا، همان مضرات مدولاسیون دلتا سایر سیگنال ها، به عنوان مثال، گفتار، یعنی کشیدن لبه و اعوجاج قطعه قطعه مشاهده می شود. با این حال، اگر نرخ نمونه برداری از تصویر بسیار بالاتر از فرکانس Nyquist انتخاب شود، فشرده سازی با روش مدولاسیون دلتا منجر به خطاهای کوچک (به طور ذهنی قابل توجه) می شود. اگر فرکانس نمونه‌برداری به فرکانس Nyquist نزدیک شود، تصویر کشش لبه (روی لبه‌های تصویر) و اعوجاج خرد کردن (در مناطق با روشنایی ثابت) را به میزان بیشتری نشان می‌دهد. همانند فشرده سازی گفتار، مدولاسیون دلتا تطبیقی ​​می تواند این خطاها را کاهش دهد. با این حال، به طور کلی، هنگام انتقال تصاویر، مدولاسیون دلتا نسبت به هنگام انتقال گفتار مؤثرتر بود.

کوانتیزاسیون با بیش از دو سطح امکان به دست آوردن تصاویر با کیفیت بالاتر و کاهش افزونگی را فراهم می کند. یک سیستم فشرده سازی DPCM با کوانتیزاسیون 8 سطحی (3 بیتی) با قرارگیری بهینه آستانه ها تصاویری را ارائه می دهد که کیفیت آنها مانند یک سیستم PCM با عرض بیت از 6 تا 8 است. استثناء خطاهای نزدیک به خطوط است. تغییرات شدید در روشنایی

سیگنال خروجی کوانتایزر باید کدگذاری شود زیرا توزیع احتمال اختلافات کوانتیزه یکنواخت نیست. با انتخاب خوب کد (مثلا کد شانون فانو یا هافمن)، می توان سرعت کلی تولید اطلاعات را بیشتر کاهش داد. پرات اشاره می کند که هنگام استفاده از کد هافمن در حد، می توان سرعت ایجاد اطلاعات را به 2.5 بیت در نقطه کاهش داد. این کاهش سرعت اضافی باید با افزایش هزینه و پیچیدگی حافظه، ساعت ها و رجیسترهای حافظه کمکی مورد نیاز برای مدیریت کدهای هافمن سنجیده شود.

در بالا، ما در مورد مسائل فشرده‌سازی تصویر با استفاده از DPCM هنگام انتخاب عناصر بر اساس خط بحث کردیم (یعنی برای پیش‌بینی، نقاط واقع در خط اسکن فعلی گرفته شد). با توجه به ماهیت دو بعدی تصاویر، می توان (و توصیه می شود) روش DPCM را گسترش داد تا پیش بینی روشنایی را در نقاطی که نه تنها در جریان فعلی، بلکه در خطوط اسکن قبلی قرار دارند، در نظر بگیرد. طرح‌های فشرده‌سازی DPCM با این پیش‌بینی دو بعدی بر اساس همان اصولی است که برای پیش‌بینی یک‌بعدی انجام می‌شود. از آنجایی که تصاویر با وجود روابط آماری دو بعدی مشخص می‌شوند، امید است که پیش‌بینی دو بعدی نتایج بهتری در فشرده‌سازی تصویر داشته باشد، زیرا همبستگی تصاویر با استفاده از عملیات پیش‌بینی و تفریق در دو مختصات انجام می‌شود. در واقع، دستگاه های پیش بینی فضایی تصاویر بهتری تولید می کنند. حبیبی نشان داد که کوانتیزاسیون 8 سطحی (3 بیتی) با استفاده از یک پیش بینی کننده 2 بعدی مرتبه سوم، تصاویری را تولید می کند که از نظر بصری از عکس های اصلی پردازش شده توسط PCM با اعداد 11 بیتی قابل تشخیص نیستند.

برای تصاویری که از فریم‌های متوالی تشکیل شده‌اند، مانند تلویزیون، ایده‌های پیش‌بینی و تفریق مرتبط با DPCM را می‌توان به حوزه زمانی گسترش داد. در چنین تصاویری، روشنایی بسیاری از نقاط از فریم به فریم تغییر نمی کند یا به کندی تغییر می کند. بنابراین می توان یک سیستم فشرده سازی DPCM ساخت که در آن روشنایی نقطه بعدی بر اساس روشنایی مجموعه دو بعدی نقاط قاب فعلی و نقاط متناظر فریم های قبلی پیش بینی شود. در عمل، ترتیب پیش‌بینی زمانی نمی‌تواند زیاد باشد، زیرا برای هر ترم زمانی لازم است یک دستگاه حافظه داشته باشیم که در آن کل فریم ذخیره شود. شبیه‌سازی‌هایی با پیش‌بینی‌کننده مرتبه سوم، که در آن از نقاطی که در داده‌شده (و فریم‌های قبلی در سمت چپ نقطه مورد نظر و بالاتر از آن) قرار دارند، برای پیش‌بینی استفاده شد، نشان داد که می‌توان تصاویر بسیار خوبی با عمق بیت متوسط ​​به دست آورد. از 1 بیت / نقطه.

4.3.3. طرح‌های کاهش افزونگی برای تصاویر با پردازش تبدیل

برای توضیح عملیات اصلی انجام شده توسط سیستم فشرده سازی داده های ویدئویی با پردازش در حوزه تبدیل، اجازه دهید به ماتریس کوواریانس تعریف شده توسط رابطه (4.20) بپردازیم. ماتریس [ ج] همبستگی نمونه های تصویر را در صفحه توصیف می کند ( x، y)که صفحه مختصات تصویر است. یک روش مهم تحلیل آماری چند متغیره، مطالعه مجموعه داده‌ها نه تنها در مختصات طبیعی آنها، بلکه در سیستم‌های مختصات با ویژگی‌های راحت‌تر است. به طور خاص، سیستم های مختصات بر اساس مقادیر ویژه و بردارهای ویژه ماتریس کوواریانس

[C g] = [Ф] [

] [Ф] T = , (4.24)

جایی که [ اف] - ماتریس متشکل از بردارهای ویژه متعامد - ستون اف منآ [ ] - ماتریس مورب مقادیر ویژه.

تبدیل مختصات تعریف شده توسط ماتریس بردارهای ویژه [ اف]، این ویژگی را دارد که یک آرایه داده شده از اعداد را به آرایه ای دیگر با عناصر نامرتبط تبدیل می کند و مولفه های حاصل دارای واریانس های کاهشی هستند. اجازه دهید مقادیر ویژه ماتریس به ترتیب نزولی مرتب شده و به گونه ای شماره گذاری شوند

در پردازش تصویر دیجیتال، محدوده دینامیکی پیوسته مقادیر روشنایی به تعدادی سطوح گسسته تقسیم می شود. این روش کوانتیزاسیون نامیده می شود. کوانتایزر یک متغیر پیوسته را به یک متغیر گسسته تبدیل می کند که مجموعه ای محدود از مقادیر را به خود می گیرد. به این مقادیر سطوح کوانتیزاسیون می گویند. در حالت کلی، تبدیل با یک تابع پله ای بیان می شود (شکل 1.5). اگر روشنایی نمونه تصویر به بازه زمانی (یعنی زمانی) تعلق داشته باشد، نمونه اصلی با سطح کوانتیزاسیون جایگزین می شود، جایی که آستانه های کوانتیزه شدن هستند. فرض بر این است که محدوده دینامیکی مقادیر روشنایی محدود و برابر است.

شکل 1.5 تابعی که کوانتیزاسیون را توصیف می کند

وظیفه ساخت یک کوانتایزر تعیین مقادیر آستانه ها و سطوح است. ساده ترین راه برای حل این مشکل، تقسیم محدوده دینامیکی به فواصل مساوی است. با این حال، این بهترین راه حل نیست. اگر مقادیر روشنایی بیشتر نمونه های تصویر، به عنوان مثال، در ناحیه "تاریک" گروه بندی شده باشند و تعداد سطوح محدود باشد، توصیه می شود که به صورت ناهموار کوانتیزه شود. در ناحیه "تاریک"، شما باید اغلب و کمتر در ناحیه "روشن" کوانتیزه کنید. این باعث کاهش خطای کوانتیزاسیون می شود.

بنابراین، مسئله ساخت یک کوانتایزر را می توان به عنوان مسئله یافتن مقادیر بهینه و برآورده کردن برخی از معیارهای بهینه سازی فرموله کرد. معمولاً برای تعداد ثابتی از سطوح، کوانتایزر با توجه به معیار حداقل میانگین مربعات خطا بهینه می شود.

(1.12)

با این فرض که روشنایی یک متغیر تصادفی با چگالی احتمال شناخته شده است.

میانگین خطای کوانتیزاسیون مربع (1.12) است

. (1.13)

با افتراق (1.13) نسبت به متغیرها و معادل سازی مشتقات با صفر، معادلات غیرخطی به دست می آید.

.

لازم به ذکر است که آستانه شدید و با محدوده دینامیکی روشنایی تعیین می شود. معادلات (1.14) را می توان به راحتی به شکل کاهش داد

.

از (1.15) نتیجه می شود که آستانه ها باید در وسط بین دو سطح مجاور قرار گیرند و. راه حل این معادلات را می توان به صورت تکراری یافت. معیار برآورده کننده کوانتایزر بهینه (1.12) کوانتایزر Lloyd-Max نامیده می شود و خطای ریشه میانگین مربع برای چنین کوانتایزری است.

(1.16)

با توزیع روشنایی یکنواخت، معادلات غیر خطی (1.15) را می توان به صورت نمایش داد

,

و ریشه میانگین مربعات خطا می باشد.

در سیستم‌های پردازش تصویر دیجیتال، آنها تمایل به کاهش تعداد سطوح و آستانه‌های کوانتیزاسیون دارند، زیرا طول کلمه رمز دودویی که نمونه های کوانتیزه شده در کامپیوتر را نشان می دهد به تعداد آنها بستگی دارد. با این حال، با تعداد نسبتاً کم سطوح، خطوط کاذب روی تصویر کوانتیزه شده ظاهر می شوند. آنها در نتیجه تغییر ناگهانی در روشنایی تصویر کوانتیزه شده (شکل 1.6) بوجود می آیند و به ویژه در نواحی ملایم تغییر آن قابل توجه هستند.

خطوط کاذب به طور قابل توجهی کیفیت بصری یک تصویر را کاهش می دهند. بینایی انسان به خصوص به خطوط خطوط حساس است. با کوانتیزاسیون یکنواخت، تصاویر معمولی حداقل به 64 سطح نیاز دارند. شکل‌های 1.7.a و 1.7.b نتایج کمی‌سازی یکنواخت تصویر "Portrait" را به ترتیب با 256 و 14 سطح کوانتیزه‌سازی نشان می‌دهند.

شکل 1.6. به مکانیسم ظاهر خطوط کاذب

شکل 1.7. نتایج کوانتیزاسیون یکنواخت

شکل 1.8. نتیجه کوانتیزاسیون ناهموار

شکل 1.9. هیستوگرام تصویر "پرتره"

در قسمت های تاریک تصویر در شکل. خطوط کاذب 1.7.b قابل مشاهده است. استفاده از کوانتایزر Lloyd-Max می تواند سطح آنها را به میزان قابل توجهی کاهش دهد (شکل 1.8 را ببینید، جایی که تعداد سطوح کوانتیزاسیون نیز 14 است). در شکل 1.9 هیستوگرام روشنایی تصویر "Portrait" را در 256 سطح کوانتیزاسیون نشان می دهد و آستانه ها را در نشان می دهد. از شکل برمی آید که مناطقی از محدوده دینامیکی که مقادیر روشنایی نمونه ها در آنها گروه بندی می شوند اغلب کوانتیزه می شوند.

برای جلوگیری از کوانتیزاسیون ناهموار، که نمی تواند با ADC استاندارد انجام شود، از تبدیل های غیر خطی استفاده می شود (شکل 1.10). نمونه تصویر اصلی تحت یک تبدیل غیرخطی قرار می گیرد به طوری که چگالی توزیع احتمال نمونه های تبدیل شده یکنواخت است، یعنی. روش یکسان سازی انجام می شود که در فصل 2 به تفصیل توضیح داده شده است. سپس نمونه ها در مراحل مساوی کوانتیزه می شوند و تحت یک تبدیل غیرخطی معکوس قرار می گیرند.

شکل 1.10. کوانتیزاسیون با تبدیل غیرخطی اولیه

برای از بین بردن خطوط کاذب، رابرتز پیشنهاد کرد که نویز با چگالی احتمال یکنواخت به نمونه‌های درخشندگی قبل از کوانتیزاسیون یکنواخت اضافه شود. نویز اضافه شده، برخی از نمونه‌های تصویر را یک سطح و برخی دیگر را یک سطح پایین می‌آورد. این خطوط کاذب را از بین می برد. واریانس نویز اضافه شده باید کم باشد تا منجر به اعوجاج هایی نشود که به عنوان "برف" در تصویر درک می شود و در عین حال برای از بین بردن خطوط نادرست کافی است. معمولاً از نویز به طور مساوی توزیع شده در بازه استفاده می شود. نتایج کوانتیزاسیون یکنواخت در 14 و 8 سطح تصویر "Portrait" با اضافه کردن اولیه نویز در شکل 1.11.a و 1.11.b نشان داده شده است. در 8 سطح کوانتیزاسیون، نویز اضافه شده بیش از حد قابل توجه می شود، با این حال، خطوط کاذب تقریباً به طور کامل از بین می روند.

شکل 1.11. نتایج کوانتیزاسیون یکنواخت با اضافه کردن پیش نویز

روش کوانتیزاسیون دیگری در صنعت چاپ استفاده می شود. این روشی برای تولید تصاویر باینری شطرنجی (2 سطح) از تصاویر خاکستری است. هنگام چاپ (به عنوان مثال، روزنامه یا مجلات)، تصویر از نقاط سفید و سیاه تشکیل می شود. برای انجام این کار، کل تصویر اصلی با مختصات فضایی به بلوک های مربعی یکسان تقسیم می شود. معمولا یک بلوک حاوی عناصر است. یک عدد با مختصات مربوطه از ماتریس سیگنال مزاحم که ابعاد آن برابر با ابعاد بلوک است به هر نمونه بلوک اضافه می شود. به عنوان مثال، اعداد به عنوان ماتریس سیگنال مزاحم استفاده می شوند:

.

این عمل برای همه بلوک ها تکرار می شود. تصویر حاصل به دو سطح کوانتیزه می شود. در شکل 1.12.а یک تصویر در مقیاس خاکستری "Portrait" را با یک سیگنال مزاحم اضافه نشان می دهد. در شکل 1.12.b، c نتایج کوانتیزاسیون باینری تصویر "Portrait" را با یک سیگنال مزاحم اضافه شده (شکل 1.12.b) و بدون آن (شکل 1.12.c) نشان می دهد.

شکل 1.12 شطرنجی کردن تصاویر

یک بیت مپ باینری یک تجربه بصری قابل توجهی بهتر از یک تصویر باینری معمولی ارائه می دهد. انتقال مقیاس خاکستری در طول شطرنجی به دلیل تغییر در ابعاد هندسی لکه سفید مشاهده شده در زمینه سیاه حاصل می شود. اگر نمونه های "سبک" در یک بلوک گروه بندی شوند، ابعاد هندسی نقطه سفید حداکثر و برابر با اندازه بلوک است. با کاهش روشنایی، ابعاد هندسی آن نیز کاهش می یابد. چشم انسان میانگین‌گیری موضعی را انجام می‌دهد و این توهم مشاهده یک تصویر در مقیاس خاکستری را ایجاد می‌کند. هنگام چاپ تصاویر با وضوح بالا که در آن یک نقطه به سختی با چشم قابل مشاهده است، غربالگری بسیار موثر است.

مقالات مرتبط برتر