نحوه راه اندازی گوشی های هوشمند و رایانه های شخصی. پرتال اطلاعاتی
  • خانه
  • اخبار
  • معیار معنایی اطلاعات اقدامات اطلاعاتی نقشه برداری

معیار معنایی اطلاعات اقدامات اطلاعاتی نقشه برداری

برای اندازه گیری محتوای معنایی اطلاعات، به عنوان مثال. کمیت آن در سطح معنایی، شناخته شده ترین معیار اصطلاحنامه است که ویژگی های معنایی اطلاعات را با توانایی کاربر برای دریافت پیام دریافتی مرتبط می کند. برای این منظور از مفهوم استفاده می شود اصطلاحنامه کاربر

اصطلاحنامهمجموعه ای از اطلاعاتی است که یک کاربر یا سیستم در اختیار دارد.

بسته به رابطه بین محتوای معنایی اطلاعات اسو اصطلاحنامه کاربر Spمقدار اطلاعات معنایی تغییر می کند مدار مجتمع ،توسط کاربر درک شده و توسط وی در آینده در اصطلاحنامه خود گنجانده شود. ماهیت چنین وابستگی در شکل 2.2 نشان داده شده است. دو مورد محدود کننده را در نظر بگیرید، زمانی که مقدار اطلاعات معنایی مدار مجتمع 0 است:

در S p 0کاربر اطلاعات دریافتی را درک نمی کند، نمی فهمد.

در sp;کاربر همه چیز را می داند، او به اطلاعات ورودی نیاز ندارد.

برنج. 2.2. وابستگی به مقدار اطلاعات معنایی. درک شده توسط مصرف کننده، از اصطلاحنامه او Ic=f(Sp)

حداکثر مقدار اطلاعات معنایی مدار مجتمعمصرف کننده هنگام توافق بر سر محتوای معنایی آن به دست می آورد اسبا اصطلاحنامه شما S p (S p = Sp opt)، زمانی که اطلاعات دریافتی برای کاربر قابل درک است و اطلاعات ناشناخته قبلی را برای او به ارمغان می آورد.

بنابراین، مقدار اطلاعات معنایی در پیام، میزان دانش جدید دریافت شده توسط کاربر، یک مقدار نسبی است. همین پیام می تواند برای یک کاربر ذیصلاح محتوای معنایی داشته باشد و برای کاربر نالایق بی معنی باشد (نویز معنایی).

هنگام ارزیابی جنبه معنایی (معنی) اطلاعات، باید تلاش کرد تا ارزش ها را هماهنگ کرد. اسو S p .

معیار نسبی مقدار اطلاعات معنایی می تواند ضریب غنا باشد با، که به عنوان نسبت مقدار اطلاعات معنایی به حجم آن تعریف می شود:

اندازه گیری عملگرایانه اطلاعات

این معیار سودمندی اطلاعات (ارزش) را برای رسیدن به هدف کاربر تعیین می کند. این اندازه گیری نیز به دلیل ویژگی های استفاده از این اطلاعات در یک سیستم خاص، یک مقدار نسبی است. توصیه می شود ارزش اطلاعات را در همان واحدها (یا نزدیک به آنها) اندازه گیری کنید که در آن تابع هدف اندازه گیری می شود.



مثال 2.5.در یک سیستم اقتصادی، ویژگی‌های کاربردی (ارزش) اطلاعات را می‌توان با افزایش اثر اقتصادی عملکرد، که از طریق استفاده از این اطلاعات برای مدیریت سیستم حاصل می‌شود، تعیین کرد:

Inb(g)=P(g/b)-P(g)،

جایی که Inb(g)- مقدار پیام اطلاعاتی b برای سیستم کنترل g،

П(g)- اثر اقتصادی مورد انتظار پیشینی از عملکرد سیستم کنترل g ,

П(g/b)- اثر مورد انتظار از عملکرد سیستم g، مشروط بر اینکه از اطلاعات موجود در پیام b برای کنترل استفاده شود.

برای مقایسه، معیارهای معرفی شده اطلاعات در جدول 2.1 ارائه خواهد شد.

جدول 2.1. واحدهای اطلاعاتی و نمونه ها

کیفیت اطلاعات

امکان و کارایی استفاده از اطلاعات توسط مصرف کننده اصلی آن تعیین می شود شاخص های کیفیت،به عنوان نماینده، محتوا، کافی، در دسترس بودن، مرتبط بودن، به موقع بودن، دقت، قابلیت اطمینان، ثبات.

  • نماینده بودن اطلاعات مربوط به صحت انتخاب و شکل گیری آن به منظور انعکاس کافی ویژگی های جسم است. مهمترین آنها در اینجا عبارتند از:
  • صحت مفهومی که بر اساس آن مفهوم اصلی تدوین شده است.
  • اعتبار انتخاب ویژگی های اساسی و روابط پدیده نمایش داده شده.
  • نقض نمایندگی اطلاعات اغلب منجر به خطاهای قابل توجهی می شود.
  • صمیمیت اطلاعات منعکس کننده ظرفیت معنایی برابر با نسبت مقدار اطلاعات معنایی در پیام به مقدار داده های در حال پردازش است، یعنی. C=IC/Vd.

با افزایش محتوای اطلاعات، ظرفیت معنایی سیستم اطلاعاتی افزایش می یابد، زیرا برای به دست آوردن همان اطلاعات، نیاز به تبدیل حجم کمتری از داده ها است.

در کنار عامل محتوایی C که جنبه معنایی را منعکس می کند، می توان از عامل محتوای اطلاعاتی نیز استفاده کرد که با نسبت مقدار اطلاعات نحوی (طبق نظر شانون) به مقدار داده مشخص می شود. Y=I/Vd.

  • کفایت (کامل) اطلاعات به این معنی است که حاوی حداقل، اما ترکیب کافی (مجموعه شاخص ها) برای تصمیم گیری صحیح است. مفهوم کامل بودن اطلاعات با محتوای معنایی (معناشناسی) و عمل شناسی آن مرتبط است. به عنوان ناقص، یعنی. ناکافی بودن برای تصمیم گیری صحیح و اطلاعات اضافی، اثربخشی تصمیمات اتخاذ شده توسط کاربر را کاهش می دهد.
  • دسترسی اطلاعات به درک کاربر با اجرای رویه های مناسب برای دریافت و تغییر آن تضمین می شود. به عنوان مثال، در یک سیستم اطلاعاتی، اطلاعات به فرمی قابل دسترس و کاربر پسند تبدیل می شود. این امر به ویژه با هماهنگ کردن شکل معنایی آن با اصطلاحنامه کاربر به دست می آید.
  • ارتباط اطلاعات با درجه حفظ ارزش اطلاعات برای مدیریت در زمان استفاده تعیین می شود و به پویایی تغییرات در ویژگی های آن و به فاصله زمانی سپری شده از زمان وقوع این اطلاعات بستگی دارد.
  • به موقع بودن اطلاعات به معنای دریافت آن حداکثر تا یک نقطه از پیش تعیین شده در زمان، مطابق با زمان حل کار است.
  • دقت اطلاعات با درجه نزدیکی اطلاعات دریافتی به وضعیت واقعی شی، فرآیند، پدیده و غیره تعیین می شود. برای اطلاعات نمایش داده شده توسط یک کد دیجیتال، چهار مفهوم طبقه بندی دقت شناخته شده است:
  • دقت رسمی که با مقدار واحد کمترین رقم یک عدد اندازه گیری می شود.
  • دقت واقعی، تعیین شده توسط مقدار واحد آخرین رقم عدد، که صحت آن تضمین شده است.
  • حداکثر دقتی که می توان در شرایط خاص عملکرد سیستم به دست آورد.
  • دقت مورد نیاز که توسط هدف عملکردی نشانگر تعیین می شود.

قابلیت اطمیناناطلاعات با ویژگی آن تعیین می شود تا اشیاء واقعی را با دقت لازم منعکس کند. قابلیت اطمینان اطلاعات با سطح اطمینان از دقت مورد نیاز اندازه گیری می شود، به عنوان مثال. احتمال اینکه مقدار پارامتر نمایش داده شده توسط اطلاعات با مقدار واقعی این پارامتر در دقت مورد نیاز متفاوت باشد.

پایداریاطلاعات نشان دهنده توانایی آن در پاسخگویی به تغییرات داده های منبع بدون به خطر انداختن دقت مورد نیاز است. ثبات اطلاعات و همچنین نمایندگی، به دلیل انتخاب روش انتخاب و شکل گیری آن است.

در پایان، باید توجه داشت که پارامترهای کیفیت اطلاعات مانند نمایندگی، غنا، کفایت، دسترسی، ثبات، به طور کامل در سطح روش شناختی توسعه سیستم های اطلاعاتی تعیین می شود. پارامترهای مربوط، به موقع بودن، دقت و قابلیت اطمینان نیز در سطح روش شناختی به میزان بیشتری تعیین می شود، با این حال، ارزش آنها نیز به طور قابل توجهی تحت تأثیر ماهیت عملکرد سیستم، در درجه اول قابلیت اطمینان آن است. در عین حال، پارامترهای مربوط بودن و دقت به ترتیب با پارامترهای به موقع و قابلیت اطمینان مرتبط هستند.

اندازه گیری نحوی اطلاعات

به عنوان یک معیار نحوی، مقدار اطلاعات نشان دهنده مقدار داده است.

O حجم داده V d در پیام "in" با تعداد کاراکترها (اعداد) در این پیام اندازه گیری می شود. همانطور که اشاره کردیم در سیستم باینری واحد اندازه گیری بیت است. در عمل، همراه با این "کوچکترین" واحد اندازه گیری داده ها، واحد بزرگتر اغلب استفاده می شود - بایت برابر با 8 بیت. برای راحتی، کیلو- (10 3)، مگا- (10 6)، گیگا- (10 9) و tera- (10 12) بایت و غیره به عنوان متر استفاده می شود. در بایت های آشنا، حجم پیام های نوشته شده کوتاه، کتاب های قطور، آثار موسیقی، تصاویر و محصولات نرم افزاری اندازه گیری می شود. واضح است که این معیار به هیچ وجه نمی تواند مشخص کند که این واحدهای اطلاعاتی چه چیزی و چرا دارند. اندازه گیری بر حسب کیلوبایت رمان اثر L.N. برای مثال، "جنگ و صلح" تولستوی برای درک اینکه آیا می تواند در فضای آزاد یک هارد دیسک قرار بگیرد مفید است. این کار به اندازه اندازه‌گیری اندازه یک کتاب - ارتفاع، ضخامت و عرض آن - برای دیدن اینکه آیا روی قفسه کتاب قرار می‌گیرد یا وزن کردن آن برای دیدن اینکه آیا کیف وزن ترکیبی را نگه می‌دارد مفید است.

بنابراین. یک معیار نحوی از اطلاعات به وضوح برای توصیف پیام کافی نیست: در مثال آب و هوای ما، در مورد دوم، پیام دوست حاوی مقدار غیر صفر داده بود، اما حاوی اطلاعات مورد نیاز ما نبود. نتیجه گیری در مورد مفید بودن اطلاعات از در نظر گرفتن محتوای پیام حاصل می شود. برای اندازه گیری محتوای معنایی اطلاعات، به عنوان مثال. کمیت آن در سطح معنایی، مفهوم « اصطلاحنامه گیرنده اطلاعات » را معرفی می کنیم.

اصطلاحنامه مجموعه ای از اطلاعات و پیوندهای بین آنهاست که گیرنده اطلاعات دارد.می توان گفت که اصطلاحنامه دانش انباشته گیرنده است.

در یک مورد بسیار ساده، هنگامی که گیرنده یک دستگاه فنی است - یک رایانه شخصی، اصطلاحنامه توسط "سلاح" رایانه تشکیل می شود - برنامه ها و دستگاه های تعبیه شده در آن که به شما امکان می دهد پیام های متنی را دریافت، پردازش و ارائه کنید. زبان های مختلف با استفاده از حروف الفبا، فونت های مختلف و همچنین اطلاعات صوتی و تصویری از یک شبکه محلی یا سراسری. اگر رایانه مجهز به کارت شبکه نباشد، نمی‌توانید انتظار داشته باشید که پیام‌هایی را از دیگر کاربران شبکه به هر شکلی روی آن دریافت کنید. عدم وجود درایور با فونت روسی به شما اجازه نمی دهد با پیام های روسی و غیره کار کنید.

اگر گیرنده یک شخص باشد، اصطلاحنامه او نیز نوعی تسلیح فکری یک فرد، زرادخانه دانش اوست. همچنین نوعی فیلتر برای پیام های دریافتی تشکیل می دهد. پیام دریافتی با استفاده از دانش موجود برای به دست آوردن اطلاعات پردازش می شود. اگر اصطلاحنامه بسیار غنی باشد، پس زرادخانه دانش عمیق و متنوع است، به شما امکان می دهد تقریباً از هر پیامی اطلاعات استخراج کنید. یک اصطلاحنامه کوچک حاوی مقدار ناچیزی از دانش می تواند مانعی برای درک پیام هایی شود که نیاز به آماده سازی بهتر دارند.


با این حال، توجه داشته باشید که درک یک پیام به تنهایی برای تأثیرگذاری بر تصمیم گیری کافی نیست - باید حاوی اطلاعات لازم برای این امر باشد، که در اصطلاحنامه ما نیست و می خواهیم در آن گنجانده شود. در مورد آب و هوا، اصطلاحنامه ما آخرین اطلاعات "به روز" در مورد آب و هوا در منطقه دانشگاه را ندارد. اگر پیام دریافتی اصطلاحنامه ما را تغییر دهد، انتخاب راه حل نیز ممکن است تغییر کند. چنین تغییری در اصطلاحنامه به عنوان معیار معنایی مقدار اطلاعات، نوعی معیار سودمندی پیام دریافتی است.

به طور رسمی، مقدار اطلاعات معنایی است ،که بیشتر در اصطلاحنامه گنجانده شده است با نسبت اصطلاحنامه گیرنده S تعیین می شود منو محتوای اطلاعات ارسال شده در پیام "در" اس.نمای گرافیکی این وابستگی در شکل 1 نشان داده شده است.

مواردی را در نظر بگیرید که مقدار اطلاعات معنایی استمساوی یا نزدیک به صفر:

برای اس من= 0 گیرنده اطلاعات دریافتی را درک نمی کند.

در 0< Sمن< S 0 получатель воспринимает, но не понимает поступившую в сообщении информацию;

برای اس من-» ∞ گیرنده دانش جامعی دارد و اطلاعات دریافتی نمی تواند اصطلاحنامه او را تکمیل کند.

برنج. وابستگی مقدار اطلاعات معنایی به اصطلاحنامه گیرنده

با یک اصطلاحنامه اس من> S0مقدار اطلاعات معنایی استدریافت شده از پیام تعبیه شده β اطلاعات اسدر ابتدا به سرعت رشد می کند با رشد اصطلاحنامه خود گیرنده، و سپس - با شروع از مقداری S i - سقوط می کند . کاهش میزان اطلاعات مفید برای گیرنده به این دلیل است که پایگاه دانش گیرنده کاملاً مستحکم شده است و غافلگیر کردن او با چیز جدیدی به طور فزاینده ای دشوار می شود.

این را می توان با مثال دانشجویانی که در حال تحصیل علوم کامپیوتر اقتصادی هستند و مطالبی را از وب سایت های IP شرکتی می خوانند، نشان داد. . در ابتدا، هنگام شکل‌گیری اولین دانش در مورد سیستم‌های اطلاعاتی، خواندن اطلاعات کمی به دست می‌دهد - بسیاری از اصطلاحات نامفهوم، اختصارات، حتی عنوان‌ها همگی واضح نیستند. پشتکار در خواندن کتاب، شرکت در سخنرانی ها و سمینارها، ارتباط با متخصصان به پر کردن اصطلاحنامه کمک می کند. با گذشت زمان، مطالعه مطالب سایت دلپذیر و مفید می شود و در پایان دوران حرفه ای شما - پس از نوشتن مقالات و کتاب های فراوان - به دست آوردن اطلاعات مفید جدید از یک سایت محبوب بسیار کمتر اتفاق می افتد.

ما می توانیم در مورد بهینه برای این اطلاعات صحبت کنیم اساصطلاحنامه گیرنده که در آن حداکثر اطلاعات Is و همچنین اطلاعات بهینه در پیام "in" برای این اصطلاحنامه را دریافت می کند. sj.در مثال ما، زمانی که گیرنده یک کامپیوتر است، اصطلاحنامه بهینه به این معنی است که سخت افزار و نرم افزار نصب شده آن، تمام نمادهای موجود در پیام "به" را که معنای اطلاعات را منتقل می کنند، درک کرده و به درستی برای کاربر تفسیر می کنند. اس.اگر پیام حاوی کاراکترهایی باشد که با محتوای اصطلاحنامه مطابقت ندارند، برخی از اطلاعات از بین رفته و مقدار استنزول کردن.

از سوی دیگر، اگر بدانیم که گیرنده قادر به دریافت متن به زبان روسی نیست (کامپیوتر او درایورهای لازم را ندارد) و زبان های خارجی که می توان پیام ما را به آن ها ارسال کرد، نه او و نه ما مطالعه نکرده ایم. اطلاعات لازم را منتقل می کنیم که می توانیم به نویسه گردانی متوسل شویم - نوشتن متون روسی با استفاده از حروف الفبای خارجی که توسط رایانه گیرنده به خوبی درک می شود. به این ترتیب اطلاعات خود را با اصطلاحنامه کامپیوتری گیرنده مطابقت خواهیم داد. پیام زشت به نظر می رسد، اما گیرنده می تواند تمام اطلاعات لازم را بخواند.

بنابراین، حداکثر مقدار اطلاعات معنایی از پیام است β گیرنده با توافق محتوای معنایی آن را دریافت می کند اس سیاصطلاحنامه سی،(در سی = Sjopt).اطلاعات یک پیام ممکن است برای یک کاربر شایسته معنادار و برای یک کاربر نالایق بی معنی باشد. مقدار اطلاعات معنایی در یک پیام دریافتی توسط کاربر، برخلاف اطلاعات نحوی، یک ارزش فردی و شخصی است. با این حال، اطلاعات معنایی مانند اطلاعات نحوی - در بیت ها و بایت ها - اندازه گیری می شود.

معیار نسبی مقدار اطلاعات معنایی، فاکتور محتوایی C است که به عنوان نسبت مقدار اطلاعات معنایی به حجم داده آن تعریف می شود. V dموجود در پیام β:

C \u003d Is / Vd

سخنرانی 2 در مورد رشته "انفورماتیک و ICT"

اندازه گیری نحوی اطلاعات

این اندازه گیری از مقدار اطلاعات با اطلاعات غیر شخصی عمل می کند که رابطه معنایی را با شی بیان نمی کند. حجم داده Vdدر این حالت، پیام با تعداد کاراکترها (اعداد) پیام اندازه گیری می شود. در سیستم های اعداد مختلف، یک رقم وزن متفاوتی دارد و واحد داده ها بر این اساس تغییر می کند.

به عنوان مثال، در سیستم باینری، واحد اندازه گیری بیت است (رقم باینری بیت -رقم دودویی). بیت پاسخ به یک سوال دودویی ("بله" یا "خیر"، "0" یا "1") است که از طریق کانال های ارتباطی با استفاده از سیگنال ارسال می شود. بنابراین، مقدار اطلاعات موجود در پیام در بیت با تعداد کلمات دودویی یک زبان طبیعی، تعداد کاراکترهای هر کلمه، تعداد سیگنال های باینری مورد نیاز برای بیان هر کاراکتر تعیین می شود.

در رایانه های مدرن، همراه با حداقل واحد داده "بیت"، واحد اندازه گیری بزرگ شده "بایت" برابر با 8 بیت، به طور گسترده ای استفاده می شود. در سیستم اعداد اعشاری، واحد اندازه گیری "بیت" (مکان اعشاری) است.

مقدار اطلاعات Iدر سطح نحوی، تعیین بدون در نظر گرفتن مفهوم عدم قطعیت وضعیت سیستم (آنتروپی سیستم) غیرممکن است. در واقع، به دست آوردن اطلاعات در مورد یک سیستم همیشه با تغییر در میزان ناآگاهی گیرنده از وضعیت این سیستم همراه است، یعنی. مقدار اطلاعات با تغییر (کاهش) عدم قطعیت وضعیت سیستم اندازه گیری می شود.

ضریب (درجه) اطلاع رسانی(مختصر بودن) یک پیام با نسبت مقدار اطلاعات به مقدار داده تعیین می شود، یعنی.

Y= I / Vd،با 0

با افزایش Yحجم کار بر روی تبدیل اطلاعات (داده ها) در سیستم کاهش می یابد. بنابراین، آنها در تلاش برای افزایش محتوای اطلاعاتی هستند که روش های خاصی برای کدگذاری اطلاعات بهینه در حال توسعه است.

معیار معنایی اطلاعات

برای اندازه گیری محتوای معنایی اطلاعات، به عنوان مثال. کمیت آن در سطح معنایی، شناخته شده ترین معیار اصطلاحنامه است که ویژگی های معنایی اطلاعات را با توانایی کاربر برای دریافت پیام دریافتی مرتبط می کند. برای این منظور از مفهوم استفاده می شود اصطلاحنامه کاربر

اصطلاحنامهمجموعه ای از اطلاعاتی است که یک کاربر یا سیستم در اختیار دارد.

بسته به رابطه بین محتوای معنایی اطلاعات اسو اصطلاحنامه کاربر Spمقدار اطلاعات معنایی تغییر می کند مدار مجتمع،توسط کاربر درک شده و توسط وی در آینده در اصطلاحنامه خود گنجانده شود.

ماهیت این وابستگی در شکل نشان داده شده است. 1. دو مورد محدود کننده را در نظر بگیرید، زمانی که مقدار اطلاعات معنایی مدار مجتمع 0 است:

در Sp= 0 کاربر درک نمی کند، اطلاعات دریافتی را درک نمی کند.

در Sp کاربر همه چیز را می داند و نیازی به اطلاعات دریافتی ندارد.

مبحث 2. مبانی نمایش و پردازش اطلاعات در کامپیوتر

ادبیات

1. انفورماتیک در اقتصاد: کتاب درسی / ویرایش. بودن. اودینتسووا، A.N. رومانوا. - M .: کتاب درسی ووزوفسکی، 2008.

2. انفورماتیک: دوره پایه: کتاب درسی / ویرایش. S.V. سیمونوویچ - سن پترزبورگ: پیتر، 2009.

3. علوم کامپیوتر. دوره عمومی: کتاب درسی / نویسنده همکار: ع.ن. گودا، م.ا. بوتاکووا، ن.ام. نچیتایلو، A.V. چرنوف؛ زیر کل ویرایش در و. کولسنیکوف - M.: Dashkov i K، 2009.

4. انفورماتیک برای اقتصاددانان: کتاب درسی / ویرایش. ماتیوشکا V.M. - M.: Infra-M، 2006.

5. انفورماتیک اقتصادی: مقدمه ای بر تحلیل اقتصادی سیستم های اطلاعاتی - M.: INFRA-M، 2005.

اندازه گیری اطلاعات ( نحوی، معنایی، عملی)

برای اندازه گیری اطلاعات می توان از روش های مختلفی استفاده کرد، اما رایج ترین آنها هستند آماری(احتمالی) معناییو n راگماتیکمواد و روش ها.

آماریروش (احتمالی) اندازه گیری اطلاعات توسط سی. شانون در سال 1948 ایجاد شد که پیشنهاد کرد مقدار اطلاعات را به عنوان معیار عدم قطعیت وضعیت سیستم در نظر بگیرد که در نتیجه به دست آوردن اطلاعات حذف شده است. عدم قطعیت کمی آنتروپی نامیده می شود. اگر ناظر پس از دریافت پیامی، اطلاعات بیشتری در مورد سیستم به دست آورد ایکس،عدم قطعیت کاهش می یابد. مقدار اضافی اطلاعات دریافتی به صورت زیر تعریف می شود:

مقدار اضافی اطلاعات در مورد سیستم کجاست ایکسدریافت شده در قالب یک پیام؛

عدم قطعیت اولیه (آنتروپی) سیستم ایکس;

عدم قطعیت محدود (آنتروپی) سیستم ایکس،پس از دریافت پیام

اگر سیستم ایکسمی تواند در یکی از حالت های گسسته باشد که تعداد آنها nو احتمال یافتن سیستم در هر یک از آنها برابر و مجموع احتمالات همه حالت ها برابر با یک است، سپس آنتروپی با فرمول شانون محاسبه می شود:

آنتروپی سیستم X کجاست.

آ- پایه لگاریتم که واحد اندازه گیری اطلاعات را تعیین می کند.

n- تعداد حالت ها (مقادیر) که سیستم می تواند در آنها قرار گیرد.

آنتروپی یک مقدار مثبت است و از آنجایی که احتمالات همیشه کمتر از یک هستند و لگاریتم آنها منفی است، بنابراین علامت منفی در فرمول K. شانون آنتروپی را مثبت می کند. بنابراین، همان آنتروپی، اما با علامت مخالف، به عنوان اندازه گیری مقدار اطلاعات در نظر گرفته می شود.

رابطه بین اطلاعات و آنتروپی را می توان به صورت زیر درک کرد: به دست آوردن اطلاعات (افزایش آن) به طور همزمان به معنای کاهش ناآگاهی یا عدم قطعیت اطلاعات (انتروپی) است.

بنابراین، رویکرد آماری احتمال وقوع پیام‌ها را در نظر می‌گیرد: پیامی که احتمال کمتری دارد، آموزنده‌تر در نظر گرفته می‌شود، یعنی. کمترین انتظار اگر رویدادها به یک اندازه محتمل باشند، مقدار اطلاعات به حداکثر مقدار خود می رسد.

آر. هارتلی فرمول زیر را برای اندازه گیری اطلاعات پیشنهاد کرد:

I=log2n ,

جایی که n- تعداد رویدادهای به همان اندازه محتمل؛

من- اندازه گیری اطلاعات موجود در پیام در مورد وقوع یکی از nمناسبت ها

اندازه گیری اطلاعات در حجم آن بیان می شود. اغلب این به میزان حافظه رایانه و میزان داده های منتقل شده از طریق کانال های ارتباطی مربوط می شود. یک واحد به مقداری از اطلاعات در نظر گرفته می شود که عدم قطعیت آن به نصف کاهش می یابد، چنین واحد اطلاعاتی نامیده می شود. بیت .

اگر لگاریتم طبیعی () به عنوان پایه لگاریتم در فرمول هارتلی استفاده شود، واحد اطلاعات برابر است با نات ( 1 بیت = ln2 ≈ 0.693 nat). اگر از عدد 3 به عنوان پایه لگاریتم استفاده شود، - پیش پا افتاده، اگر 10، پس - دیت (هارتلی).

در عمل، یک واحد بزرگتر اغلب استفاده می شود - بایت(بایت) هشت بیت است. این واحد به این دلیل انتخاب شد که می توان از آن برای رمزگذاری هر یک از 256 کاراکتر الفبای صفحه کلید رایانه استفاده کرد (256=28).

علاوه بر بایت، اطلاعات در نیم کلمه (2 بایت)، کلمات (4 بایت) و دو کلمه (8 بایت) اندازه گیری می شود. حتی واحدهای بزرگتر اطلاعات نیز به طور گسترده مورد استفاده قرار می گیرند:

1 کیلوبایت (KB - کیلوبایت) = 1024 بایت = 210 بایت،

1 مگابایت (MB - مگابایت) = 1024 کیلوبایت = 220 بایت،

1 گیگابایت (GB - گیگابایت) = 1024 مگابایت = 230 بایت.

1 ترابایت (TB - ترابایت) = 1024 گیگابایت = 240 بایت،

1 پتابایت (PB - پتابایت) = 1024 ترابایت = 250 بایت.

در سال 1980، ریاضیدان روسی یو. مانین ایده ساخت یک کامپیوتر کوانتومی را ارائه کرد که در ارتباط با آن، چنین واحد اطلاعاتی به عنوان ظاهر می شود. کیوبیت (بیت کوانتومی، کیوبیت ) - "بیت کوانتومی" - اندازه گیری مقدار حافظه در یک شکل نظری ممکن از یک کامپیوتر که از حامل های کوانتومی، به عنوان مثال، اسپین الکترون ها استفاده می کند. یک کیوبیت می تواند نه دو مقدار متفاوت ("0" و "1")، بلکه چندین مورد را داشته باشد که مربوط به ترکیبات عادی دو حالت چرخش اصلی است که تعداد بیشتری از ترکیبات ممکن را به دست می دهد. بنابراین، 32 کیوبیت می تواند حدود 4 میلیارد حالت را رمزگذاری کند.

رویکرد معناییاگر بخواهید نه مقدار داده، بلکه مقدار اطلاعات مورد نیاز در پیام را تعیین کنید، اندازه نحوی کافی نیست. در این مورد، جنبه معنایی در نظر گرفته می شود که امکان تعیین محتوای اطلاعات را فراهم می کند.

برای اندازه‌گیری محتوای معنایی اطلاعات، می‌توانید از اصطلاحنامه گیرنده آن (مصرف‌کننده) استفاده کنید. ایده روش اصطلاحنامه توسط N. Wiener ارائه شد و توسط دانشمند داخلی ما A.Yu توسعه یافت. شریدر.

اصطلاحنامهتماس گرفت بدنه اطلاعاتتوسط گیرنده اطلاعات نگهداری می شود. همبستگی اصطلاحنامه با محتوای پیام دریافتی به شما این امکان را می دهد که بفهمید تا چه اندازه عدم اطمینان را کاهش می دهد.

وابستگی میزان اطلاعات معنایی پیام به اصطلاحنامه گیرنده

با توجه به وابستگی نشان داده شده در نمودار، اگر کاربر هیچ اصطلاحنامه ای نداشته باشد (دانش در مورد ماهیت پیام دریافتی، یعنی = 0)، یا وجود چنین اصطلاحنامه ای که در نتیجه تغییر نکرده باشد. پیام ()، سپس مقدار اطلاعات معنایی موجود در آن برابر با صفر است. اصطلاحنامه بهینه () چنین خواهد بود که در آن مقدار اطلاعات معنایی حداکثر () خواهد بود. به عنوان مثال، اطلاعات معنایی در یک پیام دریافتی در زبان خارجی ناآشنا صفر خواهد بود، اما وضعیت به همین صورت خواهد بود اگر اگر پیام دیگر خبری نیست،زیرا کاربر از قبل همه چیز را می داند.

اندازه گیری عملیاطلاعات سودمندی آن را مشخص می کنددر دستیابی به اهداف مصرف کننده برای این کار کافی است قبل و بعد از دریافت پیام، احتمال رسیدن به هدف را مشخص کرده و با هم مقایسه کنید. ارزش اطلاعات (طبق گفته A.A. Kharkevich) با فرمول محاسبه می شود:

احتمال رسیدن به هدف قبل از دریافت پیام کجاست.

احتمال دستیابی به میدان هدف دریافت پیام;

کمیت و کیفیت اطلاعات

سطوح مشکلات ارتباطی

هنگام اجرای فرآیندهای اطلاعاتی، همیشه انتقال اطلاعات در مکان و زمان از منبع اطلاعات به گیرنده (گیرنده) با استفاده از سیگنال ها وجود دارد. علامت - یک فرآیند فیزیکی (پدیده) که حامل پیام (اطلاعات) در مورد یک رویداد یا وضعیت یک شیء مشاهده است.

پیام- شکل نمایش اطلاعات در قالب مجموعه ای از علائم (نمادها) که برای انتقال استفاده می شود.

پیام به عنوان مجموعه ای از نشانه ها از دیدگاه نشانه شناسی - علمی که به بررسی ویژگی های نشانه ها و سیستم های نشانه ای می پردازد - در سه سطح قابل بررسی است:

1) نحوی،که در آن ویژگی‌های داخلی پیام‌ها در نظر گرفته می‌شود، یعنی روابط بین نشانه‌هایی که ساختار یک سیستم نشانه معین را منعکس می‌کنند.

2) معنایی،جایی که رابطه بین نشانه ها و اشیاء، اعمال، کیفیت هایی که آنها تعیین می کنند، تجزیه و تحلیل می شود، یعنی محتوای معنایی پیام، ارتباط آن با منبع اطلاعات.

3) عمل گرا،که در آن رابطه بین پیام و گیرنده در نظر گرفته می شود، یعنی محتوای مصرف کننده پیام، ارتباط آن با گیرنده.

چالش ها و مسائل سطح نحویبه ایجاد مبانی نظری برای ساختن سیستم های اطلاعاتی مربوط می شود. در این سطح با در نظر گرفتن نوع رسانه و نحوه ارائه اطلاعات، سرعت انتقال و پردازش، اندازه کدهای نمایش اطلاعات، قابلیت اطمینان، مشکلات ارسال پیام به گیرنده به صورت مجموعه ای از کاراکترها در نظر گرفته می شود. و دقت در تبدیل این کدها و غیره کاملا انتزاعی از محتوای معنایی پیام ها و هدف مورد نظر آنها. در این سطح، اطلاعاتی که فقط از موقعیت های نحوی در نظر گرفته می شوند، معمولاً داده نامیده می شوند، زیرا جنبه معنایی در این مورد مهم نیست.

چالش ها و مسائل سطح معناییبا رسمی سازی و در نظر گرفتن معنای اطلاعات ارسال شده، تعیین درجه مطابقت بین تصویر شی و خود شی مرتبط هستند. در این سطح، اطلاعاتی که اطلاعات منعکس می شود، تجزیه و تحلیل می شود، روابط معنایی در نظر گرفته می شود، مفاهیم و ایده ها شکل می گیرد، معنا و محتوای اطلاعات آشکار می شود و تعمیم آن انجام می شود.



در سطح عملگرایانهعلاقه مند به عواقب کسب و استفاده از این اطلاعات توسط مصرف کننده است. مشکلات در این سطح به تعیین ارزش و سودمندی استفاده از اطلاعات در تصمیم گیری مصرف کننده برای رسیدن به هدف خود مربوط می شود. مشکل اصلی در اینجا این است که ارزش، سودمندی اطلاعات می تواند برای گیرندگان مختلف کاملاً متفاوت باشد و علاوه بر این، به عوامل متعددی مانند، به عنوان مثال، به موقع بودن تحویل و استفاده از آن بستگی دارد.

اقدامات اطلاعاتی

اندازه گیری اطلاعات سطح نحوی

برای اندازه گیری اطلاعات در سطح نحوی، دو پارامتر معرفی می شود: میزان اطلاعات (داده) - V D(رویکرد حجمی) و میزان اطلاعات - من(رویکرد آنتروپی).

مقدار اطلاعات V D.هنگام اجرای فرآیندهای اطلاعاتی، اطلاعات در قالب یک پیام منتقل می شود که مجموعه ای از کاراکترهای برخی از حروف الفبا است. اگر مقدار اطلاعات موجود در یک پیام یک کاراکتر به عنوان یک در نظر گرفته شود، مقدار اطلاعات (داده) V Dدر هر پیام دیگری برابر با تعداد کاراکترها (اعداد) این پیام خواهد بود.

بنابراین، در سیستم اعداد اعشاری، یک رقم دارای وزنی برابر با 10 است و بر این اساس، واحد اطلاعات دیت (رقم اعشاری) خواهد بود. در این مورد، یک پیام در فرم n V D= پآن به عنوان مثال، عدد چهار رقمی 2003 دارای اندازه داده است V D = 4 عدد

در سیستم اعداد باینری، یک رقم دارای وزنی برابر با 2 است و بر این اساس، واحد اطلاعات یک بیت خواهد بود. (بیت (رقم دودویی)- رقم دودویی). در این مورد، یک پیام در فرم n- عدد بیت دارای حجم داده است V D \u003d nبیت به عنوان مثال، کد باینری هشت بیتی 11001011 دارای اندازه داده است V D= 8 بیت

در تکنولوژی مدرن کامپیوتری، همراه با حداقل بیت واحد داده، واحد بزرگ شده بایت برابر با 8 بیت به طور گسترده ای استفاده می شود. هنگام کار با مقادیر زیاد اطلاعات، واحدهای اندازه گیری بزرگتری برای محاسبه مقدار آن استفاده می شود، مانند کیلوبایت (کیلو بایت)، مگابایت (MB)، گیگابایت (GB)، ترابایت (TB):

1 کیلوبایت = 1024 بایت = 2 10 بایت;

1 مگابایت = 1024 کیلوبایت = 220 بایت = 1048576 بایت.

1 گیگابایت = 1024 مگابایت = 230 بایت = 1,073,741,824 بایت. .

1 ترابایت = 1024 گیگابایت = 240 بایت = 1,099,511,627,776 بایت.

مقدار اطلاعات I (رویکرد آنتروپی).در تئوری اطلاعات و کدگذاری، رویکرد آنتروپی برای اندازه گیری اطلاعات اتخاذ شده است. این رویکرد مبتنی بر این واقعیت است که واقعیت به دست آوردن اطلاعات همیشه با کاهش تنوع یا عدم قطعیت (آنتروپی) سیستم همراه است. بر این اساس، مقدار اطلاعات در یک پیام به عنوان معیاری برای کاهش عدم قطعیت وضعیت یک سیستم معین پس از دریافت پیام تعریف می شود. به محض اینکه ناظر چیزی را در سیستم فیزیکی شناسایی کرد، آنتروپی سیستم کاهش یافت، زیرا سیستم برای مشاهده‌گر منظم‌تر شد.

بنابراین، با رویکرد آنتروپی، اطلاعات به عنوان مقدار کمی عدم قطعیت درک می شود که در جریان هر فرآیندی (آزمون ها، اندازه گیری ها و غیره) ناپدید شده است. در این مورد، آنتروپی به عنوان معیار عدم قطعیت معرفی می شود Hو مقدار اطلاعات:

جایی که H آوریل - آنتروپی پیشینی در مورد وضعیت سیستم مورد مطالعه؛

خوشبختی- آنتروپی پسینی

پسینی- برگرفته از تجربه (آزمون ها، اندازه گیری ها).

پیشین- مفهومی که مشخص کننده دانشی است که مقدم بر تجربه (آزمون) و مستقل از آن است.

در صورتی که در طول آزمایش عدم قطعیت موجود حذف شود (نتیجه خاصی به دست می آید، به عنوان مثال. خوشبختی = 0)، مقدار اطلاعات دریافتی با آنتروپی اولیه منطبق است

اجازه دهید یک منبع اطلاعات گسسته (منبع پیام های گسسته) را به عنوان سیستم مورد مطالعه در نظر بگیریم، که منظور ما یک سیستم فیزیکی است که دارای مجموعه محدودی از حالت های ممکن است. این مجموعه آ= 1, آ 2 , ..., a p)حالات سیستم در تئوری اطلاعات را الفبای انتزاعی یا الفبای منبع پیام می نامند.

کشورهای جداگانه a 1، a 2،...، a "حروف یا نمادهای الفبا نامیده می شوند.

چنین سیستمی می تواند به طور تصادفی یکی از مجموعه های متناهی حالت های ممکن را در هر لحظه از زمان بگیرد و من .

از آنجایی که برخی از حالت ها بیشتر توسط منبع انتخاب می شوند، در حالی که برخی دیگر کمتر رایج هستند، در حالت کلی با یک مجموعه مشخص می شود. آ،یعنی مجموعه کاملی از حالات با احتمال وقوع آنها که جمع آنها یک می شود:

، و (2.2)

اجازه دهید معیاری از عدم قطعیت در انتخاب وضعیت منبع معرفی کنیم. همچنین می‌توان آن را معیاری برای میزان اطلاعات به‌دست‌آمده با حذف کامل عدم قطعیت در مورد حالت‌های احتمالی منبع در نظر گرفت.

سپس در N=1ما گرفتیم روی)= 0.

این معیار توسط دانشمند آمریکایی آر. هارتلی در سال 1928 پیشنهاد شد. پایه لگاریتم در فرمول (2.3) اهمیت اساسی ندارد و تنها مقیاس یا واحد اندازه گیری را تعیین می کند. بسته به مبنای لگاریتم واحدهای زیر می باشد. اندازه گیری استفاده می شود.

1. بیت - در حالی که پایه لگاریتم 2 است:

(2.4)

2. nits - در حالی که پایه لگاریتم است e:

3. دیتا - در حالی که پایه لگاریتم 10 است:

در علوم کامپیوتر معمولاً از فرمول (2.4) به عنوان معیار عدم قطعیت استفاده می شود. در این حالت، واحد عدم قطعیت یک واحد دودویی یا بیت نامیده می شود و نشان دهنده عدم قطعیت انتخاب از بین دو رویداد با احتمال مساوی است.

فرمول (2.4) را می توان به صورت تجربی به دست آورد: برای حذف عدم قطعیت در وضعیت دو رویداد با احتمال یکسان، یک تجربه و بر این اساس، یک بیت اطلاعات مورد نیاز است، با عدم قطعیت متشکل از چهار رویداد با احتمال مساوی، 2 بیت اطلاعات کافی است. برای حدس زدن واقعیت مورد نظر برای تعیین یک کارت از یک دسته 32 کارتی، 5 بیت اطلاعات کافی است، یعنی کافی است پنج سوال بله یا خیر بپرسید تا کارت مورد نظر مشخص شود.

معیار پیشنهادی امکان حل مشکلات عملی خاصی را زمانی که همه حالت‌های ممکن منبع اطلاعات دارای احتمال یکسان هستند را می‌دهد.

در حالت کلی، میزان عدم قطعیت در اجرای وضعیت منبع اطلاعات نه تنها به تعداد حالت‌ها، بلکه به احتمالات این حالت‌ها نیز بستگی دارد. اگر یک منبع اطلاعاتی، به عنوان مثال، دو حالت ممکن با احتمالات 0.99 و 0.01 داشته باشد، عدم قطعیت انتخاب آن بسیار کمتر از منبعی است که دو حالت احتمالی مساوی دارد، زیرا در این مورد نتیجه عملاً یک نتیجه‌گیری پیش‌فرض است. تحقق حالت، احتمال برابر با 0.99).

K. Shannon دانشمند آمریکایی مفهوم معیار عدم قطعیت انتخاب را تعمیم داد اچدر صورتی که اچنه تنها به تعداد حالت ها، بلکه به احتمالات این حالت ها نیز بستگی دارد (احتمالات p iانتخاب شخصیت یک من، الفبای الف). این اندازه گیری که عدم قطعیت در هر حالت به طور متوسط ​​است، نامیده می شود آنتروپی یک منبع گسسته اطلاعات:

(2.5)

اگر دوباره روی اندازه گیری عدم قطعیت در واحدهای دودویی تمرکز کنیم، پایه لگاریتم باید برابر با دو در نظر گرفته شود:

(2.6)

در یک انتخابات به همان اندازه احتمال، احتمال p i = 1/Nفرمول (2.6) به فرمول R. Hartley (2.3) تبدیل می شود:

معیار پیشنهادی آنتروپی نامیده شد نه تصادفی. نکته این است که ساختار رسمی عبارت (2.5) با آنتروپی سیستم فیزیکی، که قبلا توسط بولتزمن تعریف شده بود، همزمان است.

با استفاده از فرمول های (2.4) و (2.6)، می توانیم افزونگی را تعیین کنیم Dالفبای منبع پیام آ،که نشان می دهد چگونه به طور منطقی از نمادهای یک الفبای معین استفاده می شود:

جایی که H max (A) -حداکثر آنتروپی ممکن، تعیین شده توسط فرمول (2.4).

روی) -آنتروپی منبع، با فرمول (2.6) تعیین می شود.

ماهیت این اندازه گیری این است که با انتخابی به همان اندازه محتمل، می توان بار اطلاعاتی مشابهی را روی علامت با استفاده از الفبای حجم کمتری نسبت به انتخاب غیرمحتمل ارائه کرد.

برترین مقالات مرتبط