نحوه راه اندازی گوشی های هوشمند و رایانه های شخصی. پرتال اطلاعاتی

سیستم های چند بعدی با تلفات. STATISTICA تکنیک های اکتشافی چند متغیره فن آوری های تجزیه و تحلیل داده های چند متغیره

صفحات 513-523

فرآیندهای چند بعدی

تا کنون مدل هایی را در نظر گرفته ایم که تنها از یک رابطه متصل کننده سری زمانی تشکیل شده اند. در این حالت یکی از متغیرها را درون زا انتخاب کردیم و بقیه متغیرها برون زا بودند. چنین تقسیم‌بندی همیشه طبیعی نیست؛ اغلب لازم است چندین رابطه را به طور همزمان در نظر بگیریم که در آنها متغیرهای یکسانی هم به‌عنوان درون‌زا و هم برون‌زا گنجانده می‌شوند. همانطور که در سخنرانی گذشته مشاهده شد، یک متغیر همیشه نمی تواند به عنوان برون زا در نظر گرفته شود، و ما در واقع باید یک مدل DGP متشکل از چندین معادله را در نظر بگیریم. این به معنای مدل سازی چندین سری زمانی به طور همزمان است، به عبارت دیگر - مدل سازی یک فرآیند تصادفی چند متغیره.

بیایید با تعریف شروع کنیم. یک بردار را در نظر بگیرید =(xt 1، xt 2،...،xتیک)تیکه هر جزء آن یک سری زمانی است. بالانویس تعداد جزء را نشان می‌دهد و شاخص پایین‌تر، مانند قبل، نشان‌دهنده لحظه در زمان است. توزیع اجزا توسط یک خانواده مشخص می شود تراکم مفصلتوزیع فرم: f n( ایکسt1i1، xt2i2،...، xtnکه در)‚ n=1‚2،.... شرط ایستایی به معنای محدود همچنان استقلال کل خانواده چگالی توزیع مشترک از تغییر زمانی است. فقط در حال حاضر، علاوه بر تمام ترکیب‌های ممکن مقادیر یک فرآیند تصادفی در زمان‌های مختلف، استدلال‌های چگالی احتمال نیز همه ترکیب‌های ممکن از اجزای مختلف در زمان‌های مختلف هستند. به عنوان مثال، برای چگالی دوبعدی از شرط ایستایی به دست می آوریم: f 2 (ایکستی 1 ،ایکستی 2 ) = f 2 (x 1تی + r، x 2تی + r) برای هر ت. توزیع مشترک اجزاء برای یک نقطه از زمان به زمان بستگی ندارد. بیایید تابع توزیع دیگری را در نظر بگیریم، به عنوان مثال یک تابع سه بعدی، که شامل مقادیر مؤلفه اول در دو نقطه مختلف از زمان و مؤلفه دوم در نقطه سوم از زمان است. ایستایی یعنی همین f 3 (ایکستی 1 ،ایکستی + ساعت 1 ،ایکستی + س 2 ) = f 3 (x 1تی + τ ، x 2تی + س + τ ) . می توان گفت که این خاصیت تغییر ناپذیری نسبت به یک شیفت زمانی است. یعنی اگر مقدار τ را به هر لحظه زمان اضافه کنیم، تابع چگالی تغییر نمی کند. واضح است که ایستایی یک فرآیند چند بعدی مستلزم ایستایی هر یک از اجزای آن است.

مانند حالت تک بعدی، ایستایی به معنای محدود مستلزم تعدادی ویژگی از ویژگی های فرآیندهای تصادفی است. اول از همه، بیایید با انتظارات ریاضی شروع کنیم. انتظارات ریاضی برای هر جزء به اجزای دیگر بستگی ندارد. بنابراین، اگر یک فرآیند چند بعدی ثابت باشد، انتظار ریاضی از هر جزء به زمان بستگی ندارد. بردار انتظارات ریاضی E( به زمان بستگی ندارد

حال بیایید به لحظات مرتبه دوم نگاه کنیم. هر جزء با پراکندگی و تابع همبستگی خودکار. اگر یک سری تک بعدی ثابت باشد، توابع خودهمبستگی و خودکوواریانس آن فقط به تغییر τ بستگی دارد: Corr(τ) = Corr( ایکستیمن،ایکسjتی + r) = р i (τ)، با این حال، اکنون می توانیم دومین لحظه ترکیبی را برای اجزای مختلف و همچنین Corr( ایکستیمن،ایکسjتی + r). طبیعی است که چنین کمیتی را تابع همبستگی متقاطع بنامیم. اگر مولفه ها یک فرآیند ثابت چند متغیره را تشکیل دهند، آنگاه همبستگی متقابل تابعی از شیفت زمانی τ خواهد بود. بیایید این تابع را نشان دهیم R ij (τ) . کاملا واضح است که R ij (τ) = آر جی (-τ) . برای مقدار ثابت τ عناصر R ij (τ) بسته به τ ماتریس R را تشکیل دهید. مقدار τ برابر با صفر مربوط به ماتریس همبستگی بردار است

در بخش قبل، ما به یک نمودار انتقال حالت دو بعدی نگاه کردیم. برای تعداد فزاینده ای از جریان های بار، تعداد حالت ها (و در نتیجه معادلات) خیلی سریع افزایش می یابد. با این حال، می توان با استفاده از ساختار نمودار انتقال حالت، مسئله را ساده کرد. نمودار انتقال حالت دو بعدی را که در شکل نشان داده شده است در نظر بگیرید. 10.2. برای چهار ایالت همسایه، شار در جهت عقربه های ساعت باید با شار ورودی برابر باشد جهت مخالف(کینگمن، 1969)، (ساتون، 1980). بیایید نگاهی به شکل 10.2.


برنج. 10.2.

در جهت عقربه های ساعت:


پادساعتگرد:


می‌توانیم هر دو عبارت را به حالت احتمال کاهش دهیم و سپس شرط (10.12) را بدست آوریم. شرط لازم و کافی برای وارونگی این است که دو عبارت زیر برابر باشند.

در جهت عقربه های ساعت:

(10.12)

پادساعتگرد:

اگر این دو عبارت برابر باشند، وجود دارد تعادل موضعی یا جزئی. بدین ترتیب، یک شرط ضروریبرای برگشت پذیری این است که اگر یک جریان (فلش) از حالت i به حالت j وجود داشته باشد، باید یک جریان (فلش) از حالت j به حالت i نیز وجود داشته باشد. ما می توانیم معادلات بخش را بین هر دو حالت متصل اعمال کنیم. بنابراین، از شکل 10.2 دریافت می کنیم:

(10.13)

ما می توانیم هر احتمال یک حالت را با استفاده از احتمال حالت بیان کنیم و هر مسیری را بین این دو حالت طی کنیم ( معیارهای کولموگروف). برای مثال می توانیم مسیر زیر را انتخاب کنیم:

سپس معادله تعادل زیر را بدست می آوریم:

(10.17)

اگر یک سیستم با اتلاف چند متغیره با رشته های بار N را در نظر بگیریم، آنگاه هر نخ باری می تواند یک فرآیند پواسون وابسته به حالت باشد. یک موضوع خاص ممکن است بارهایی مانند BPP(برنولی، پواسون، پاسکال). برای N - بعدیسیستم ها، شرایط برگشت پذیری مشابه (10.12) است. معیار کولموگروف باید برای همه مسیرهای ممکن برآورده شود. در عمل، ما هیچ مشکلی را تجربه نمی کنیم زیرا راه حلی که تحت فرض برگشت پذیری به دست می آید، راه حل صحیح خواهد بود اگر و تنها در صورتی که معادلات تعادل گره برآورده شود. در بخش بعدی از این به عنوان مبنایی برای معرفی یک مدل بار چند بعدی کلی استفاده می کنیم.

سیستم های چند بعدی با اتلاف

در این بخش، تعمیم‌های تئوری ترافیک از راه دور کلاسیک را برای سیستم‌هایی در نظر می‌گیریم که از چندین نوع جریان ترافیکی تشکیل شده‌اند که به یک کانال یا گروهی از کانال‌ها یا دسته‌ای از کانال‌ها می‌رسند. هر جریان بار می تواند پارامترهای جداگانه ای داشته باشد و می تواند جریان های فراخوانی پواسون وابسته به حالت با کلاس های محدود و ترافیک چند شکافی باشد. این دسته کلی از مدل ها نسبت به توزیع زمان اقامت سیستم که ممکن است یک کلاس باشد، حساس نیستند. کلیات را یکی یکی معرفی می کنیم و یک مطالعه موردی کوچک برای نشان دادن ایده های اصلی ارائه می کنیم.

محدودیت کلاس

در مقایسه با موردی که در بخش 10.1 مورد بحث قرار گرفت، اکنون تعداد درخواست‌های همزمان برای هر رشته بارگذاری (کلاس) را محدود می‌کنیم. بنابراین، دسترسی کامل وجود نخواهد داشت، اما بر خلاف سیستم‌های تراکم، که تنها کانال‌های معین از نظر فیزیکی قابل دسترسی هستند، اکنون می‌توان از همه کانال‌ها استفاده کرد، اما در هر زمان فقط می‌توانیم تعداد محدودی از آنها را اشغال کنیم. این توسط حفاظت از سرویس (حفاظت از تعداد کانال های مجازی = محدودیت در کلاس خدمات = استراتژی آستانه اولویت) ارائه می شود. بنابراین، محدودیت‌هایی را برای تعداد تماس‌های همزمان در کلاس j به شرح زیر معرفی می‌کنیم:

(10.18)

اگر آخرین محدودیت ارضا نشد، آنگاه می گیریم گروه های جداگانه، مربوط به N یک بعدی مستقل معمولی است سیستم های با تلفات. به دلیل محدودیت ها، نمودار انتقال حالت کوتاه شده است. برای دو جریان بار در شکل 10.3 نشان داده شده است.


برنج. 10.3.

توجه داشته باشید که نمودار انتقال حالت کوتاه هنوز معکوس است و مقدار نسبت به مقدار کوتاه شده تغییر نمی کند. فقط ثابت عادی سازی تغییر می کند. در واقع به دلیل خاصیت تعادل محلی می توانیم هر حالتی را بدون تغییر ویژگی های فوق حذف کنیم. شما می‌توانید محدودیت‌های کلاسی عمومی‌تری را برای مجموعه‌ای از رشته‌های بار در نظر بگیرید تا هر رشته باری دارای حداقل (تضمین شده) تعداد کانال‌های اختصاص‌یافته باشد.

فرآیندهای خدمات بار عمومی

می توانیم در نظر بگیریم PCT-Iفقط مطابق با بخش 10.1 بارگذاری کنید. هر جریان بار می تواند وابسته به حالت باشد، به عنوان مثال، یک جریان فراخوانی پواسون با وابستگی خطی به حالت و نرخ خروج خود (مرگ)، به (10.16) و (10.17) مراجعه کنید.

سیستم شرایط برگشت پذیری را برآورده می کند، به (10.12) مراجعه کنید. بنابراین، فرم کار نیز برای وجود دارد BPP-جریان های بار و فرآیندهای پواسون به حالت کلی تر. اگر تمام جریان های بار فرآیندهای انگزت (دو جمله ای) باشند، فرمول چند متغیره انگزت را به دست می آوریم (جنسن، 1948). همانطور که در بالا ذکر شد، سیستم نسبت به توزیع زمان اقامت در سیستم حساس نیست. هر نخ بار می تواند توزیع زمان اقامت جداگانه خود را در سیستم داشته باشد.

بار چند شیار

در سیستم های خدمات یکپارچه، مورد نیاز توان عملیاتیممکن است به نوع خدمات بستگی داشته باشد. برای مثال، اتصال تلفنی فقط به یک کانال (اسلات) نیاز دارد، در حالی که، برای مثال، انتقال ویدئو ممکن است به کانال‌هایی به طور همزمان نیاز داشته باشد. ما محدودیت های اضافی دریافت می کنیم:

(10.19)
(10.20)

تعداد واقعی تماس‌هایی که باید تایپ کرد کجاست. نمودار انتقال حالت حاصل معکوس خواهد بود و شکل یک محصول را خواهد داشت.


A.L. پومرانتسف، O.E. رودیونوا


در ادبیات علمی و فنی داخلی، عبارت "کنترل فرآیند آماری چند بعدی" - MSPC - به طور فزاینده ای استفاده می شود. (کنترل فرآیند آماری چند متغیره).
MSPC یک رویکرد مدرن برای مدلسازی فرآیندهای چند بعدی (چند عاملی) بر اساس استفاده از طرح ریزی است. روش های ریاضی، به شما امکان می دهد موارد پنهان را برجسته کنید (نهفته)متغیرها و تجزیه و تحلیل ارتباطات موجود در سیستم مورد مطالعه. MSPC یک توسعه طبیعی از رویکرد شناخته شده به عنوان است SPC (کنترل فرآیند آماری)- کنترل آماری فرآیندها، با انتقال به سطح بالاتری از پردازش داده های انباشته شده.
MSPC چه فرآیندهایی را تجزیه و تحلیل می کند؟ اول از همه، البته، تولید. با این حال، می تواند برای شرکت های تجاری، بخش های بانکی و بیمه و غیره نیز مفید باشد، یعنی در مواردی که لازم است به طور منظم تصمیماتی اتخاذ شود که بر کارایی شرکت تأثیر می گذارد. MSPC به عنوان یک فعالیت چندوجهی مرتبط با نظارت چندعاملی، مدلسازی و کنترل فرآیند درک می شود که با هدف تثبیت عملکرد شرکت، افزایش کارایی آن و در نهایت تولید انجام می شود. محصولات با کیفیتیا ارائه خدمات با کیفیت
کنترل کیفیت- این اکنون یک موضوع شیک است ، اگرچه خود کار با کیفیت بالا همیشه برای هر شرکتی مرتبط بوده است. کلمه "کیفیت" معانی زیادی دارد و هم در زندگی روزمره و هم در ادبیات تخصصی کاربرد فراوانی دارد. به عنوان مثال، "کیفیت" یکی از مترادف های کلمه "مالکیت" است - یعنی ویژگی جدایی ناپذیر چیزی. اغلب مفهوم "کیفیت" ارزیابی ذهنی یک محصول یا خدمات را منعکس می کند.
دیدگاه سازنده را در نظر بگیرید، برای چه کسی کیفیت- این مطابقت با یک استاندارد خاص با حداقل هزینه است.
دقیقاً همین کیفیت است که کنترل فرآیند آماری چندبعدی در خدمت دستیابی به آن است.
چهار سطح اصلی کنترل کیفیت در یک شرکت وجود دارد.
کنترل بصری و متخصص . در هر بنگاهی شرایطی وجود دارد که یک تکنسین خبره، که می تواند هر فرد مسئولی باشد، شخصاً تصمیم می گیرد که آیا محصول تولید شده از کیفیت بالایی برخوردار است یا خیر. بر این اساس، او تصمیم می گیرد که برای به دست آوردن محصولات باکیفیت چه تاثیری باید روی فرآیند اعمال شود. این رویکرد، برای مثال، در یک رستوران خوب استفاده می شود، جایی که خود سرآشپز کیفیت غذاها را ارزیابی می کند و دستور پخت آنها را تنظیم می کند. این سطح از کنترل در شرکت های کوچک و تنها با یک متخصص واجد شرایط قابل توجیه است. جایگزینی یا صرفاً بیماری یک متخصص می تواند منجر به کاهش فاجعه بار کیفیت محصول شود. به محض اینکه شرکت رشد کرد و یک متخصص (یا گروهی از متخصصان) دیگر قادر به کنترل شخصاً کل فرآیند فناوری نباشند، شرکت باید به سطح دیگری از کنترل کیفیت برود.
کنترل توصیفی . با چنین سازماندهی کار، برای هر محل کار دستورالعمل هایی وجود دارد که توضیح می دهد چه کاری، چگونه، با چه ابزارهایی باید انجام شود و دقت عملیات خاص را تنظیم می کند. این دقیقا همان رویکردی است که مثلاً در شرکت ها وجود دارد فست فود (فست فود)، در نتیجه محصولات با کیفیت مشابه در سراسر جهان تولید می کنند. در حال حاضر، این رویکرد به ویژه از طریق صدور گواهینامه شرکت ها برای انطباق با الزامات استاندارد ISO 9001 گسترده است.
پایش آماری . روش‌های SPC در اوایل دهه 30 توسط شوهارت پیشنهاد شد، اما تنها در اواسط دهه 50 به طور گسترده در شرکت‌ها اجرا شدند. که در به طور کلیایده پشت این رویکرد به شرح زیر است. این کارخانه به طور منظم شاخص های فرآیند از پیش تعیین شده خاصی را اندازه گیری می کند. اگر این شاخص ها در محدوده تعیین شده (سطوح بحرانی) نوسان داشته باشند، در نظر گرفته می شود که فرآیند قابل کنترل است، در غیر این صورت، کنترل مختل شده و رویدادی رخ داده است که نیاز به مداخله برای بازگرداندن عملکرد طبیعی دارد. برای چنین نظارتی از آنها استفاده می شود نمودارهای کنترل شوهارتکارت‌های مبالغ انباشته شده و غیره. کارت‌ها مستقیماً در زمان تولید پر می‌شوند، بنابراین نتیجه‌گیری‌هایی که با کمک آن‌ها گرفته می‌شود اجازه می‌دهد در صورت لزوم اقدام فوری انجام شود.
دلایل متعددی وجود دارد که چرا روش های کنترلی که در بالا توضیح داده شد برای به دست آوردن محصول نهایی ضروری هستند اما کافی نیستند. با کیفیت مناسب. اولاً لازم است نه تنها کیفیت محصول نهایی، بلکه خود فرآیند تولید نیز کنترل شود. ثانیاً، نظارت بر شاخص‌های منفرد، بدون ارتباط متقابل آنها، یا کیفیت مناسب محصول خروجی را تضمین نمی‌کند، یا شاخص‌های تولید را بیش از حد متورم می‌کند که منجر به هشدارهای نادرست متعدد می‌شود.
کنترل آماری چند متغیره (MSPC) . فرآیند تولید یک سیستم پیچیده و چند بعدی است که معمولاً با ده ها، صدها یا حتی هزاران شاخص مشخص می شود و یک نفر نمی تواند به طور همزمان تغییرات هر شاخص را نظارت کند. دو راه حل ممکن برای این مشکل وجود دارد. اولاً، رایانه فقط می تواند اپراتور را در مورد آن شاخص هایی که "فراتر از" مقدار بحرانی هستند، مطلع کند. ثانیا، روش های چند متغیره را می توان برای ایجاد نمودارهای کنترل تعمیم یافته برای روش جزء اصلی.
روش های کنترل چند بعدی سیگنال های هشدار نادرست کمتری را ارائه می دهند، علاوه بر این، آنها نیز هستند ابزار قدرتمندبرای تجزیه و تحلیل شرایط اضطراری احتمالی برای درک ماهیت MSPC و با توجه به اینکه شخص و تجربه او نقش مهمی در این رویکرد ایفا می کند، در نظر بگیرید نمونه ای از مدل سازی اقدامات یک کاپیتان کشتی، که همه تصمیمات را در کشتی می گیرد و دستورات او بدون چون و چرا انجام می شود.
کارایی یک شرکت کشتیرانی که در حمل و نقل برنامه ریزی شده منظم مسافران و محموله فعالیت می کند، اولاً با دقت کار، یعنی رعایت دقیق برنامه زمان بندی تعیین می شود، و ثانیاً، با استفاده اقتصادی از سوخت، که مستقیماً به این بستگی دارد. اقدامات واجد شرایط کاپیتان
در یکی از این مسیرها کافی است مدت زمان طولانیپارامترهای مختلف مشخص کننده فرآیند ناوبری کشتی جمع آوری و ثبت شد (جدول). در مجموع 20 شاخص از این دست وجود داشت (تنها تعدادی از آنها در جدول نشان داده شده است)، در میان آنها بدون مدیریت و مدیریتمتغیرها و همچنین متغیرها - پاسخ، مشخص کردن کارایی (کیفیت) کار.
بندر متغیرهای مدیریت نشده متغیرهای مدیریت شده پاسخ
آب و هوا حالت های رانندگی نتیجه
باد جلد-
ما
فنی-
یون
عدد
عبور-
چربی
وزن محموله سرعت موتور پیش نویس کشتی تفاوت-
اجاره
مصرف
دارم میسوزم-
چی
اوپوز-
احترام
برگن 10 5 30 123 452 5000 25 10 120 0
لارویک 12 4 35 85 523 4500 40 5 150 0
مالوی 8 5 25 142 384 5000 50 0 180 -2
ولدا 2 2 10 102 412 4500 20 5 190 0
السوند 5 3 14 56 235 4000 -50 5 120 3
Molde 2 1 2 86 341 4000 -30 3 50 0
کریستیانسون 1 5 3 140 120 4000 -35 5 85 -5
تروندهایم 5 5 15 112 462 5000 20 8 320 0
مالم 6 6 3 50 385 4500 -25 10 105 1
نارویک 7 6 6 75 225 4500 -50 5 85 5
نامسوس 8 7 5 94 302 3500 -60 3 95 -4

تجزیه و تحلیل ریاضی داده های به دست آمده نشان داد که این سیستم همانطور که انتظار می رود 20 درجه آزادی ندارد، بلکه فقط 5 درجه آزادی دارد. فقط ذاتی این سیستم) کمتر از تعداد مشخصه های اندازه گیری شده است. این با این واقعیت توضیح داده می شود که سیستم دارای اتصالات داخلی است (همبستگی ها)بین شاخص ها ماهیت این ارتباطات دوگانه است. از یک طرف آنها تولید می شوند دلایل عینی- برای مثال، قدرت باد و ارتفاع موج آشکارا با هم مرتبط هستند. از سوی دیگر، همبستگی ها به دلایل ذهنی نیز به وجود می آیند - از این گذشته، کاپیتان به طور تصادفی مقادیر متغیرهای کنترل شده را تغییر نداد، بلکه هدایت شد. اهداف خاص، که منجر به ظهور اتصالات نسبتاً سفت و سخت اضافی شد. در نتیجه، امکان ساخت یک مدل ریاضی بسته به پنج متغیر نهفته وجود داشت که رفتار کاپیتان کشتی را در طیف گسترده ای از شرایط خارجی توصیف می کرد. اگر مقادیر خاصی از متغیرهای غیرقابل کنترل را در این مدل وارد کنید، می توانید مقادیر متغیرهای کنترل شده را محاسبه کنید، یعنی به کاپیتان پیشنهاد دهید که برای رسیدن به موقع به مقصد بعدی با حداقل سوخت، کدام حالت را باید انتخاب کنید. مصرف. از طرف دیگر، خود کاپیتان می تواند مقادیر پارامترهای کنترل شده را وارد سیستم کند تا ارزیابی اقدامات مورد نظر خود را به دست آورد، به عنوان مثال، برای اینکه بفهمد چقدر سوخت مصرف می کند.
چرا امکان ساخت این مدل وجود داشت؟ مدل رفتار اینکاپیتان، مدیر اینساخت کشتی در این شرایط تنها به دلیل مطالعه فعالیت هدفمند امکان پذیر بود با تجربهکاپیتان به همین دلیل است که سیستم مورد مطالعه در نهایت از درجات آزادی داخلی زیادی برخوردار نبود. اگر به جای یک کاپیتان با تجربه، مثلاً کودکی را قرار می دادیم که به طور تصادفی دستگیره ها را می کشید و پارامترهای کنترل شده را تغییر می داد، هیچ مدلی ایجاد نمی شد، زیرا سیستم شامل منطق داخلی و تعداد درجات نمی شد. آزادی بسیار زیاد خواهد بود در عین حال، لازم بود کاپیتان را متقاعد کنیم که اقداماتی را انجام دهد که گاهی اوقات از نظر او غیر منطقی بود، به عنوان مثال، فراتر رفتن از حد معمول در دریای آزاد، انتخاب نادرست تریم کشتی و غیره. برای مطالعه رفتار سیستم تا حداکثر امکان ممکن طیف گسترده ای از شرایط ضروری است - تنها در این صورت مدل ساخته شده به اندازه کافی سیستم مورد مطالعه را توصیف می کند.
کاربرد عملی این سیستم نتایج ملموسی به همراه داشت - علیرغم تردیدهای قابل توجه، شرکت حمل و نقل در نهایت از استفاده از آن سود برد. در این مورد، باید به نکات اساسی زیر توجه کنید: اولاً، هیچ کس قصد حذف کاپیتان را از کشتی نداشت - وظیفه ایجاد سیستمی بود که فقط توصیه هایی را ارائه دهد. ثانیاً، برای حل تنها از مدل‌های ساده و «رسمی» استفاده شد که متغیرهای ورودی و خروجی را به هم متصل می‌کردند و از وابستگی‌های فیزیکی پیچیده که تأثیر نیروهای مختلف بر کشتی، مسیر کشتی و غیره را توصیف می‌کرد، استفاده نمی‌شد. ثالثاً، کاربرد عملی این سیستم نتایج ملموسی به همراه داشت - علیرغم تردیدهای قابل توجه، شرکت حمل و نقل در نهایت از استفاده از آن سود برد. در این مورد، باید به نکات اساسی زیر توجه کنید: اولاً، هیچ کس قصد حذف کاپیتان را از کشتی نداشت - وظیفه ایجاد سیستمی بود که فقط توصیه هایی را ارائه دهد. ثانیاً، برای حل، تنها از مدل‌های ساده و «رسمی» استفاده شد که متغیرهای ورودی و خروجی را به هم متصل می‌کردند، و از وابستگی‌های فیزیکی پیچیده استفاده نشد، که تأثیر نیروهای مختلف بر کشتی، مسیر کشتی و غیره را توصیف می‌کرد. ثالثا، مشکل ساخت و ساز تنظیم نشده بود مدل جهانی، توصیف اقدامات هر کاپیتان در هر کشتی - فقط در مورد کلاس بسیار خاصی از کشتی ها بود که در یک مسیر خاص تردد می کردند.
به نظر ما می رسد که مثال تجزیه و تحلیل شده، با همه عجیب و غریب بودنش، ایده اصلی MSPC را با موفقیت نشان می دهد. در واقع، هدف کاپیتان رسیدن به استاندارد است، یعنی رسیدن به موقع به هر بندر با حداقل هزینه، یعنی مصرف سوخت. اقدامات کاپیتان، در واقع، تفاوت زیادی با اقدامات فناور ندارد: شاخص های کنترل نشده، کنترل شده و خروجی وجود دارد که حالت های عملکرد سیستم را مشخص می کند.
چرا MSPC مورد نیاز است؟ این جایگزین واقعیروش های پرهزینه برای بهبود کیفیت در شرایطی که شرکت نمی تواند تجهیزات جدید خریداری کند، مواد اولیه ورودی با خواص پایدار ندارد و نمی تواند دستگاه های کنترل گران قیمت را نصب کند. MSPC چه چیزی را ارائه می دهد؟ مطالعه، تعمیم و استفاده از تجربیات خود در شرایط عادی، روی تجهیزات موجود و با مواد اولیه موجود. این رویکرد را می توان با استفاده از سبک شعاری که اکنون محبوب شده است، به طور بسیار خلاصه بیان کرد.
هدف.از خودتان بیاموزید که در موقعیت های مختلف تصمیم درست بگیرید.
امکانات.جمع آوری منظم شاخص های واقعی و آنها تجزیه و تحلیل ریاضی.
نتیجه.کیفیت در عین کاهش هزینه ها در تولید پایدار.
لازم به ذکر است که MSPC مشخص نیست برنامه کامپیوتری، که فقط باید آن را بخرید و در شرکت نصب کنید. این یک رویکرد خاص است، حتی می توان گفت، فلسفه ای است که از یک طرف نیازمند تلاش های مشترک است - متخصصانی که در یک شرکت خاص کار می کنند و به خوبی از فرآیند فن آوری و آن آگاه هستند. مکان های باریکو از سوی دیگر، ریاضیدانانی که روش هایی را می شناسند که امکان حل چنین مسائلی را فراهم می کند. در عین حال دامنه فعالیت های مشترک شامل: تعیین مشکل، تعریف و جمع آوری شاخص ها، آزمایش مدل های ساخته شده در تولید می باشد.
برای درک ماهیت یک سیستم یا فرآیند خاص، اندازه گیری و جمع آوری ضروری است داده ها. با توجه به اینکه تجزیه و تحلیل داده های چند متغیره به طور کلی و MSPC به طور خاص بر اساس مدل های عملکردی (ماهوی) نیست، بلکه بر اساس مدل سازی داده های رسمی است، این سؤال که چه داده هایی جمع آوری شود نیاز به بررسی جداگانه دارد. اجازه دهید فقط در مورد برخی از نکات اساسی صحبت کنیم.
همه چیز با تعداد زیادی اندازه گیری شروع می شود، به عنوان مثال، با جمع آوری داده ها (جدول را ببینید). در یک جدول، هر ستون حاوی تمام مقادیر یک متغیر است و هر سطر (نامیده می شود نمونه) - مقادیر همه متغیرها برای یک نمونه. یک نمونه را می توان یک نقطه در زمان، یک شماره دسته یا نام مشتری در نظر گرفت، به عنوان مثال، هر رویداد مشخصه سیستم مورد مطالعه. بنابراین، در مثال در نظر گرفته شده، نمونه یک گذرگاه بین دو بندر مسیر کشتی است.
متغیرمی تواند هر کمیتی باشد که عملکرد سیستم را مشخص می کند. به عنوان مثال، اسیدیته یک نوشیدنی تولید شده را می توان به صورت کمی اندازه گیری کرد. pH، اما می توان آن را به صورت کیفی تعریف کرد ("شیرین"، "نیمه شیرین" و غیره).
جمع آوری داده های لازم در یک جدول به این معنی نیست که ما پدیده را مطالعه کرده ایم، زیرا این جدول نیاز به تجزیه و تحلیل با استفاده از روش های مناسب برای استخراج اطلاعات سیستماتیک دارد. اگر متغیرهای کمی وجود داشته باشد، به عنوان مثال دو یا سه، آنگاه تجزیه و تحلیل را می توان با استفاده از روش های سنتی، ساخت نمودارهایی برای داده های دو و سه بعدی انجام داد (شکل 1، 2). به محض وجود تعداد زیادی از این شاخص ها، لازم است از تجزیه و تحلیل داده های چند بعدی استفاده شود که اساس MSPC است.

درک این نکته مهم است که داده منبع همیشه حاوی هر دو اطلاعات ضروری است که نامیده می شود علامت، و تصادفی است که نامیده می شود سر و صدا. نویز ابتدا به خطاهای اندازه گیری، ویژگی های فردی نمونه های اندازه گیری شده، خطاهای مدل سازی و غیره اشاره دارد. تفکیک داده ها به سیگنال و نویز یک مشکل اصلی مدل سازی است که راه حل آن تعادل صحیح آنهاست. از یک طرف، شما نمی توانید سطح نویز را دست کم بگیرید، یعنی مدل را بیش از حد دقیق کنید، زیرا در این صورت مدل ناپایدار می شود. از سوی دیگر، با برآورد بیش از حد نویز، بخش معنی دار داده ها را از دست می دهیم و مدل قدرت پیش بینی خود را از دست می دهد. روش های تجزیه و تحلیل داده های چند بعدی، اولاً مدیریت نسبتاً آسان آرایه های بزرگ و ثانیاً جداسازی سیگنال و نویز را امکان پذیر می کند.
برای ساختن مدلی که نه تنها در محدوده باریکی از شرایط به اندازه کافی عمل کند، بلکه قادر به شبیه سازی فرآیندهای مختلف نیز باشد، به عنوان مثال، هنگام استفاده از مواد اولیه با کیفیت های مختلف، به وسیع ترین طیف ممکن تجربه نیاز است. تجارب بد و محصولات معیوب را نمی توان از داده ها حذف کرد، زیرا این اطلاعات برای ساخت مدل نیز ضروری است. نیازی به انتخاب اولیه نمونه ها یا متغیرها، انتخاب مهم ترین آنها نیست - این در فرآیند تجزیه و تحلیل سیستم تصمیم گیری می شود. متغیرها اغلب به هم متصل هستند و اطلاعات اصلی - سیگنال - دقیقاً در همین سیستم اتصالات موجود است. اگر بخشی از داده‌ها به هر دلیلی دور ریخته شود، خطر از دست دادن اطلاعات مهم را داریم.
البته، یک مدل (هرچقدر هم که پیچیده باشد) هرگز کاملا دقیق نخواهد بود. اما یک مدل خوب ابزاری موثر برای درک و در نتیجه مدیریت فرآیند است. برای ساخت چنین مدلی، به داده های آموزنده و باکیفیت نیاز است.
بیایید به نمودار مشخص کننده چهار سطح کنترل کیفیت برگردیم. با استفاده از مثال کاپیتان کشتی، دیدیم که حضور اولین سطح بصری-کارشناس شرط لازم برای ساخت مدل MSPC است. سطح دوم، توصیفی نیز ضروری است، اگرچه شاید نه در مقیاس کل سازمان، بلکه فقط برای تنظیم روند جمع آوری داده ها؛ شرح باید به طور جامع به سؤالات زیر پاسخ دهد: چه چیزی و چه زمانی اندازه گیری شود. چه کسی اندازه گیری ها را انجام می دهد. نتایج به چه شکلی ذخیره می شوند. سومین سطح کنترل - پایش آماری - به همه این سؤالات پاسخ می دهد و انتقال به MSPC را آماده می کند که به مقدار کمی بیشتر نیاز دارد - برای اعمال تجزیه و تحلیل ریاضی چند متغیره به داده های موجود که مبتنی بر رویکرد طرح ریزی است.
ما MSPC را از دیدگاه یک کارگر تولید توصیف خواهیم کرد و حواسمان را با جزئیات ریاضی بی‌اهمیت که می‌توان مثلاً در آن یافت، پرت نخواهیم کرد، اما سعی خواهیم کرد با استفاده از یک تفسیر هندسی، ماهیت رویکرد طرح‌ریزی را منتقل کنیم.
بیایید با ساده‌ترین مثال شروع کنیم: وقتی فقط دو متغیر اندازه‌گیری شده در سیستم وجود دارد، داده‌های جمع‌آوری‌شده را می‌توان در یک صفحه به تصویر کشید (شکل 1 را ببینید). هر ردیف از جدول منبع (یعنی نمونه) با یک نقطه در صفحه متغیرها با مختصات مربوطه مطابقت دارد. بیایید یک محور جدید (اولین جزء اصلی - PC1) معرفی کنیم تا حداکثر تغییر در داده ها در امتداد آن اتفاق بیفتد و همه نقاط را روی این محور جدید قرار دهیم. اگر موقعیت ایده آلی را فرض کنیم که در آن مقادیر سیگنال در امتداد این خط مستقیم قرار دارند و پراکندگی ناشی از نویز باشد، با نمایش داده های اصلی بر روی محور GK1، ساختار معنی دار داده ها را برجسته کرده و آن را توصیف می کنیم. فقط با یک متغیر جدید و قسمت باقی مانده از داده ها که با این توصیف توضیح داده نمی شود - فاصله نقطه تا محور جدید - می تواند نویز در نظر گرفته شود. این نویز را می توان بیشتر تجزیه و تحلیل کرد و به دنبال بخش معنادار در آن - دومین مؤلفه اصلی و غیره بود، تا زمانی که نویز دیگر به نویز واقعی تبدیل نشود، یعنی مجموعه ای از مقادیر بی نظم تصادفی.
که در مورد کلیفرآیند طرح ریزی مراحل زیر را طی می کند (شکل 2 را ببینید):
1) مرکز ابر داده قرار دارد و مبدا جدید مختصات به آنجا منتقل می شود - این جزء اصلی صفر است (PC0).
2) جهت حداکثر تغییر داده انتخاب شده است - این اولین مؤلفه اصلی (GC1) است.
3) اگر داده ها به طور کامل توصیف نشده باشند (نویز زیاد است)، جهت دیگری (GC2) انتخاب می شود - عمود بر اولی، به منظور توصیف تغییر باقی مانده در داده ها و غیره.
در نتیجه، تجزیه و تحلیل مؤلفه های اصلی نمونه ها را در یک فضای جدید با ابعاد پایین نشان می دهد. در این حالت، نه تنها یک سیستم مختصات با دیگری جایگزین می‌شود، بلکه سطح نویز (یعنی تأثیر عوامل مختلف خارجی) بر روی سیستم نیز کاهش می‌یابد. در شکل شکل 2 کاهش ابعاد سیستم را از سه به دو نشان می دهد که کاهش قابل توجهی در ابعاد نیست. غالباً با مرتبه های بزرگی کاهش می یابد، برای مثال، از 300 متغیر اولیه به 3-5 جزء اصلی.
نمونه ای از کنترل فرآیند، بر اساس داده های به دست آمده از یک کارخانه شیمیایی واقعی، اما برای اهداف توضیحی تا حدودی ساده شده است. برای مدتی، فرآیند فن آوری مورد مطالعه قرار گرفت (53 حالت سیستم - نمونه)، که توسط 17 سنسور (متغیر) نظارت شد. برای هر شاخص، حد بالا و پایین تعیین شد ارزش های قابل قبول. با توجه به رویکرد SPC، هر متغیر نمودار کنترل خود را دارد (شکل 3). هنگامی که نشانگر از سطح بحرانی فراتر می رود، اپراتور یک سیگنال هشدار دریافت می کند.

اگر متغیرهای کمی وجود داشت، این رویکرد مشکلی ایجاد نمی کرد. با این حال، به طور همزمان پویایی تغییر را در همه (در در این مورد 17) متغیرهای اپراتوردشوار است (شکل 4).

ساده ترین تجزیه و تحلیل به شما امکان می دهد تا تغییرات آشکاری را در داده های منبع ایجاد کنید:
1) هر متغیر را جابجا کنید تا میانگین مقدار صفر شود.
2) هر متغیر را عادی کنید تا آنها را به یک سطح بحرانی مشترک برسانید، به عنوان مثال + 1.
تبدیل های ساده مشابه، که در روش MSPC نامیده می شوند آماده سازی داده ها، به شما این امکان را می دهد که درک بصری اطلاعات در مورد فرآیند را به طور قابل توجهی ساده کنید.
در نتیجه، اپراتور تصویری را بر روی صفحه نمایش می بیند که وضعیت سیستم را در یک نقطه خاص از زمان منعکس می کند (خوانش های سنسور عادی)، که کنترل آن آسان است (شکل 5). بر روی آن، مقدار هر متغیر نرمال شده به صورت نمودار میله ای نشان داده می شود که ارتفاع آن در طول فرآیند تغییر می کند. در اینجا به وضوح قابل مشاهده است که هر شاخص چقدر از سطوح بحرانی فاصله دارد.

با این حال، چنین تحولی مشکل مهم دیگری را که هنگام نظارت بر تعداد زیادی از شاخص ها به وجود می آید را حل نمی کند - نحوه پاسخگویی به سیگنال های هشدار دهنده. در بین 17 متغیر اندازه گیری شده، چندین متغیر کنترل شده وجود دارد. اگر یکی از آنها به سطح بحرانی بالا نزدیک شد، کاهش آن طبیعی است و اگر به سطح پایین نزدیک شد، آن را افزایش دهید. در مورد متغیرهای دستکاری نشده که مقادیر آنها را نمی توان مستقیماً تغییر داد چطور؟ در اینجا کمک می کند که همه نشانگرها در سیستم به هم متصل باشند. به عنوان مثال، هر چه دما بیشتر باشد، فشار بیشتر می شود و ... بنابراین اپراتور می تواند به طور غیرمستقیم متغیرهای کنترل نشده را از طریق تنظیم متغیرهای کنترل شده تغییر دهد. به طور کلی، در چنین سیستم های پیچیده ای که با اتصالات داخلی نفوذ می کند، هر عمل اپراتور باعث تغییر همزمان در همه شاخص ها می شود و همیشه مطلوب نیست. در حالت ایده آل، برای دستیابی به نتیجه مورد نیاز، لازم است که مقادیر همه متغیرهای کنترل شده را به طور همزمان تغییر دهید، که عملا غیرممکن است. اینجاست که اشتباهاتی به وجود می آید که منجر به ازدواج می شود.
وجود اتصالات داخلی در یک رویکرد مرسوم برای یک مشکل کنترلی باعث ایجاد مشکلاتی می شود، اما برای MSPC، برعکس، یک مزیت است. هنگام اعمال آن، از روش های طرح ریزی برای شناسایی متغیرهای پنهان تعمیم یافته در سیستم استفاده می شود. بنابراین، در مثال مورد بررسی، مشخص شد که تنها با دو جزء اصلی می توان آن را توصیف کرد. در شکل شکل 6 پیش بینی تمام 53 حالت اندازه گیری شده سیستم (نمونه ها) را بر روی صفحه دو جزء اصلی نشان می دهد.

در همان زمان، سطح نویز، یعنی نسبت داده های غیرقابل توضیح، تنها 4٪ است. این بدان معنی است که هر مشاهده - رشته ای از 17 عدد - می تواند از دو مقدار پیش بینی در محورهای مؤلفه اصلی با دقت نسبی بدتر از 0.04 بازسازی شود. علاوه بر این، امکان برقراری ارتباط بدون ابهام بین مقدار سنسوری که فراتر از سطح کنترل است و نقطه ای در صفحه GC که از مرزهای بیضی بحرانی فراتر می رود وجود داشت (شکل 6 را ببینید). اکنون اپراتور می تواند تغییر در موقعیت نقطه مشخص کننده وضعیت سیستم در هواپیما را نظارت کند که البته بسیار ساده تر است.
مشکل کنترل نیز بسیار ساده شده است. اپراتور می تواند تنها دو متغیر پنهان را کنترل کند و در صورت لزوم آنها را تنظیم کند. در این حالت، یک تغییر همزمان همزمان در تمام متغیرهای اولیه، "فیزیکی" رخ می دهد. به هر حال، این تکنیک به طور ضمنی در بسیاری از پیچیده ها استفاده می شود لوازم خانگیبه عنوان مثال، در گیرنده های تلویزیون، که در آن کاربر تعداد محدودی از دکمه های کنترلی را در اختیار دارد که کنترل می کنند. تعداد زیادیمتغیرهای فیزیکی از او پنهان شده است. برای اینکه چنین سیستم کنترلی راحت و موثر باشد، ابتدا باید پیکربندی شود. این فرآیند نامیده می شود تنظیم(یا فارغ التحصیلی) - مشابه رویه راه اندازی ابزار اندازه گیری- بنابراین تحلیل داده های چند متغیره را کالیبراسیون چند متغیره نیز می گویند.
قبل از استفاده عملی از مدل ریاضی ساخته شده در حین کالیبراسیون، تحت این روش قرار می گیرد چک ها، یعنی باید اطمینان حاصل شود که قادر به پیش بینی صحیح حالات سیستم است. برای انجام این کار، اندازه گیری و جمع آوری جدید (بررسی)داده های مربوط به فرآیند مورد مطالعه و استفاده از مدل ساخته شده برای پیش بینی این مقادیر. اگر مقادیر پیش‌بینی‌شده کمی با مقادیر اندازه‌گیری شده متفاوت باشد، مدل اعتبارسنجی شده در نظر گرفته می‌شود و می‌توان در عمل از آن استفاده کرد. اگر نه، پس باید یک کالیبراسیون جدید و شفاف کننده انجام دهید. اغلب ویژگی‌های سیستم مدل‌سازی شده می‌تواند به طور ناگهانی (تغییر به مواد خام جدید) یا به تدریج (ساییدگی تجهیزات) تغییر کند. در این صورت، مدل ساخته شده قبلی نامناسب می شود و باید اصلاح شود. با این فرمول، وظیفه MSPC یک اقدام یکباره نیست، بلکه یک برنامه هدفمند برای تجزیه و تحلیل و بهبود کیفیت شرکت است.
در دهه گذشته، MSPC به طور گسترده در سراسر جهان در انواع کاربردهای صنعتی برای فرآیندهای پیوسته مانند:
کنترل و پیش بینی کیفیت کاغذ روزنامه بسته به ترکیب مواد اولیه.
کنترل کیفیت تولید مس و تجزیه و تحلیل ترکیب ناخالصی؛
کنترل کیفیت بنزین
علاوه بر این، MSPC در مواردی نیز استفاده می شود که فرآیند شامل مراحل جداگانه است و برای به دست آوردن محصولات با کیفیت بالا لازم است سینتیک فرآیندها در یک یا چند مرحله کنترل شود، به عنوان مثال:
کنترل تولید مخمر نانوایی؛
کنترل فرآیند پلیمریزاسیون در تولید پلی اتیلن با چگالی کم
نتیجه گیری MSPC یک رویکرد مدرن است که در سراسر جهان برای نظارت بر فرآیندهای تولید، بهبود عملکرد آنها، بهبود کیفیت محصول و توسعه فناوری ها و محصولات جدید استفاده می شود. مدل سازی ریاضی، که در MSPC استفاده می شود، بر اساس ساخت مدل های پیچیده فیزیکی (شیمیایی و غیره) نیست، بلکه بر اساس تحلیل سادهداده های ورودی و خروجی روند درخواست MSPC مراحل اصلی زیر را طی می کند:
1) بیان مشکل، ساخت یک طرح مشاهده؛
2) نظارت بر فرآیند، جمع آوری داده ها.
3) تجزیه و تحلیل داده ها، ایجاد اتصالات پنهانبین شاخص ها؛
3) ساخت و آزمایش مدل؛
4) کاربرد عملی مدل برای حل مشکلات فعلی.
5) تجزیه و تحلیل عملکرد برنامه و تنظیم مدل.
دو مرحله آخر یک بار مصرف نیستند، بلکه باید به طور مداوم برای دستیابی به نتایج تولید بهینه اعمال شوند.
MSPC وضعیت فرآیند تولید را به صورت ساده و بصری نشان می دهد و ادامه و توسعه منطقی است. روش های استانداردکنترل فرآیند آماری. این رویکرد به ما امکان می دهد حتی با تجهیزات قدیمی و کیفیت ناپایدار مواد اولیه به نتایج پایدار دست یابیم. با بازگشت به طبقه بندی سطوح کنترل کیفیت ارائه شده در ابتدای مقاله، می توان اشاره کرد که MSPC، به یک معنا، «دایره را می بندد»، تولید را به کنترل اصلی «پدرسالارانه» بازمی گرداند، اما از نظر کیفی و کمی متفاوت است. سطح سیستم بر کسی پوشیده نیست که کنترل تولید متخصص بصری (مادربزرگ در آشپزخانه خود) می تواند بالاترین کیفیت را ارائه دهد که با تولید انبوه قابل مقایسه نیست. با استفاده از MSPC می توان تجربیات فردی و ارزشمند هر متخصص را تعمیم و به صورت ریاضی رسمی کرد و در نتیجه آن را به فرآیندهای تولید انبوه تعمیم داد. به نظر ما روسیه با داشتن متخصصان مجرب متعددی که قادر به تضمین تولید پایدار در شرایط ناپایدار هستند، شی منحصر به فردبرای اعمال این رویکرد این جایی است که باید چشمگیرترین نتایج را ارائه دهد، به خصوص که هزینه های مربوط به اجرای MSPC به طور قابل توجهی کمتر از مثلاً خرید تجهیزات جدید است.

فهرست منابع استفاده شده
1. شوهارت دبلیو. کنترل اقتصادی کیفیت محصول تولیدی. - ون نوستراند، نیویورک، 1931.
2. MacGregor J., Kourti Th. کنترل فرآیندهای آماری فرآیندهای چند متغیره // عمل مهندسی کنترل، 1995 (3)، صفحات 403-413.
3. Kurti Th., MacGregor J. تحولات اخیر در روشهای SPC چند متغیره برای نظارت و تشخیص فرآیند و عملکرد محصول // J. از فناوری کیفیت. 1996 28 (4)، ص 309-323.
4. Htskuldsson A. روش های پیش بینی در علم و فناوری. انتشارات ثور، دانمارک 1996.
5. Eriksson L., Johansson E., Kettaneh-Wold N., Wold S. Multi- and Megavariate Data Analysis, Umetrics AB, Umea, 2001.
6. Esbensen K.H. تجزیه و تحلیل داده های چند متغیره - در عمل ویرایش چهارم، CAMO، 2000.
7. Martens H. and Nüs T. کالیبراسیون چند متغیره، جان وایلی و پسران، چیچستر، 1989.
8. خبرنامه اینفومتریکس 11-4/91. رتبه بندی اکتان بنزین توسط طیف سنجی مادون قرمز نزدیک. Infometix, Inc. سیاتل، واشنگتن ایالات متحده آمریکا
9. Kourti Th., MacGregor J. تجزیه و تحلیل فرآیند، نظارت و تشخیص، با استفاده از روش های طرح ریزی چند متغیره. شیمی. اینتل. آزمایشگاه. سیستم های. 1995 (28), R. 3-21.

تهیه شده بر اساس مواد از RIA "استانداردها و کیفیت"

مدل داده های رابطه ای، که توسط E.F. کاد در سال 1970، و برای آن جایزه تورینگ را یک دهه بعد دریافت کرد، اساس صنعت پایگاه داده چند میلیارد دلاری امروزی را تشکیل می دهد. در طول ده سال گذشته، یک مدل داده چند بعدی پدید آمده است، که زمانی استفاده می شود که هدف تجزیه و تحلیل داده ها به جای انجام تراکنش ها باشد. فناوری پایگاه داده چند بعدی - عامل کلیدیتجزیه و تحلیل تعاملی مجموعه داده های بزرگ برای حمایت از تصمیم گیری. چنین پایگاه های داده ای داده ها را به عنوان مکعب های چند بعدی در نظر می گیرند که برای تجزیه و تحلیل آنها بسیار راحت است.

مدل‌های چند بعدی داده‌ها را یا به‌عنوان حقایق با پارامترهای عددی متناظر یا به‌عنوان ابعاد متنی که آن حقایق را مشخص می‌کنند، مشاهده می‌کنند. به عنوان مثال در خرده فروشی، خرید یک واقعیت است، حجم خرید و هزینه، ابعاد و نوع محصول خریداری شده و زمان و مکان خرید، ابعاد هستند. کوئری ها مقادیر پارامترها را در کل محدوده اندازه گیری جمع آوری می کنند و در نتیجه مقادیری مانند کل فروش ماهانه یک محصول معین را به دست می آورند. مدل های داده های چند بعدی سه کاربرد مهم مرتبط با تحلیل داده ها دارند.

  • انبارهای داده برای تجزیه و تحلیل اطلاعات از منابع متعدد در سراسر سازمان یکپارچه شده اند.
  • سیستم‌های پردازش تحلیلی آنلاین (OLAP) به شما این امکان را می‌دهند که در جستجوی روندهای عمومی به سرعت به پرسش‌هایی که حجم زیادی از داده‌ها را پوشش می‌دهند پاسخ دهید.
  • برنامه های کاربردی داده کاوی برای کشف دانش با جستجوی نیمه خودکار برای الگوها و روابط ناشناخته قبلی در پایگاه های داده خدمت می کنند.

محققان رسمی پیشنهاد داده اند مدل های ریاضیپایگاه های داده چند بعدی، و سپس این پیشنهادات بازتابی تصفیه شده در یک خاص پیدا کردند ابزارهای نرم افزاریکه این مدل ها را پیاده سازی می کند. نوار کناری تکامل مدل داده چند بعدی را توصیف می کند.

صفحات گسترده و روابط

صفحات گسترده مانند آنچه در جدول 1 نشان داده شده است، ابزار مفیدی برای تجزیه و تحلیل داده های فروش ارائه می دهد: کدام محصولات فروخته شده، تعداد معاملات انجام شده و کجا. جدول محوری یک صفحه گسترده دوبعدی با جمع‌های فرعی مرتبط و نتایج خلاصه است که برای مشاهده داده‌های پیچیده‌تر با تودرتو کردن ابعاد x و y و نمایش داده‌ها در چندین صفحه استفاده می‌شود. جداول اصلی معمولاً از انتخاب تکراری زیر مجموعه‌های داده و تغییر سطح جزئیات نمایش داده شده پشتیبانی می‌کنند.

صفحات گسترده برای مدیریت و ذخیره داده های چند بعدی مناسب نیستند، زیرا داده ها را خیلی محکم به ظاهر آن و بدون جداسازی می بندند. اطلاعات ساختاریبسته به ارائه اطلاعات مورد نظر. مثلاً، افزودن بعد سوم مانند زمان، یا گروه‌بندی داده‌ها بر اساس انواع محصولات عمومی، به تنظیمات پیچیده‌تری نیاز دارد. راه حل واضح این است که برای هر بعد از یک صفحه گسترده جداگانه استفاده کنید. اما این راه حل تنها تا حدی محدود توجیه می شود، زیرا تجزیه و تحلیل چنین مجموعه ای از جداول به سرعت بیش از حد دست و پا گیر می شود.

استفاده از پایگاه داده های دارای SQL انعطاف پذیری پردازش داده های ساخت یافته را به شدت افزایش می دهد. با این حال، اگر نگوییم غیرممکن، فرموله کردن بسیاری از محاسبات، مانند مجموع (حجم فروش از سال تا به امروز)، ترکیبی از مجموع و مجموع فرعی، و رتبه بندی، مانند ده محصول برتر پرفروش، با استفاده از SQL استاندارد، دشوار است. . هنگام تنظیم مجدد ردیف ها و ستون ها، باید به صورت دستی نماهای مختلف را مشخص و ترکیب کنید. پسوندهای SQL، مانند عملگر مکعب داده و پنجره های پرس و جو، تا حدی این مشکلات را حل می کنند؛ به طور کلی، یک مدل رابطه ای خالص اجازه کار با ابعاد سلسله مراتبی را در سطح قابل قبولی نمی دهد.

صفحات گسترده و پایگاه داده های رابطه ایپردازشگرهای داده به اندازه کافی مجموعه داده هایی را مدیریت می کنند که دارای ابعاد کمی هستند، اما الزامات تجزیه و تحلیل عمیق داده ها را به طور کامل برآورده نمی کنند. راه حل استفاده از فناوری است که از طیف کاملی از ابزارهای مدل سازی داده های چند بعدی پشتیبانی می کند.

مکعبها

پایگاه های داده چند بعدی داده ها را به صورت مکعبی در نظر می گیرند که یک تعمیم است صفحات گستردهبرای هر تعداد اندازه گیری علاوه بر این، مکعب ها از سلسله مراتبی از ابعاد و فرمول ها بدون تکرار تعاریفشان پشتیبانی می کنند. مجموعه ای از مکعب های متناظر یک پایگاه داده (یا انبار داده) چند بعدی را تشکیل می دهد.

دستکاری مکعب ها با افزودن مقادیر ابعاد جدید آسان است. در اصطلاح رایج، این اصطلاح به شکلی با سه بعد اشاره دارد، اما از نظر تئوری یک مکعب می تواند هر تعداد ابعاد داشته باشد. در عمل، اغلب مکعب های داده از 4 تا 12 بعد دارند. ابزارهای مدرن اغلب زمانی با گلوگاه های عملکردی مواجه می شوند که به اصطلاح هایپر مکعب دارای ابعاد بیش از 10-15 باشد.

ترکیبی از مقادیر ابعاد سلول های مکعب را تعریف می کند. بسته به کاربرد خاصسلول های یک مکعب را می توان به صورت پراکنده یا متراکم قرار داد. با افزایش تعداد ابعاد و دانه بندی مقادیر ابعاد، مکعب ها تمایل دارند از هم جدا شوند.

در شکل شکل 1 مکعبی را نشان می دهد که حاوی داده های فروش برای دو شهر دانمارکی است که در جدول 1 نشان داده شده است با یک بعد اضافی - "زمان". سلول های مربوطه داده های حجم فروش را ذخیره می کنند. در مثال، می توانید یک "واقعیت" پیدا کنید - یک سلول غیر خالی حاوی پارامترهای عددی مربوطه - برای هر ترکیبی از زمان، محصول و شهری که حداقل یک فروش در آن انجام شده است. سلول شامل مقادیر عددی، مربوط به این واقعیت است - در این مورد، حجم فروش تنها پارامتر است.

به طور کلی، یک مکعب تنها می تواند دو یا سه بعد را در یک زمان نشان دهد، اما می تواند با قرار دادن یک بعد در بعد دیگر، بیشتر نشان دهد. بنابراین، با پرتاب کردن یک مکعب به فضای دو یا سه بعدی، می توان با تجمیع برخی از ابعاد، ابعاد مکعب را کاهش داد که منجر به کار با مقادیر پارامتر پیچیده تر می شود. به عنوان مثال، وقتی به فروش بر اساس شهر و زمان نگاه می کنیم، اطلاعات را برای هر ترکیبی از شهر و زمان جمع آوری می کنیم. بنابراین، در شکل. 1، با اضافه کردن فیلدهای 127 و 211، کل فروش کپنهاگ در سال 2001 را دریافت می کنیم.

اندازه گیری ها

ابعاد یک مفهوم کلیدی در پایگاه داده های چند بعدی است. مدل سازی چند بعدی شامل استفاده از ابعاد برای ارائه هر چه بیشتر زمینه برای حقایق است. برخلاف پایگاه‌های داده رابطه‌ای، افزونگی کنترل‌شده در پایگاه‌های داده چند بعدی معمولاً در صورت افزایش قابل توجیه است. ارزش اطلاعاتی. از آنجایی که داده‌ها در یک مکعب چند بعدی اغلب از منابع دیگر، مانند یک سیستم تراکنش، جمع‌آوری می‌شوند، مشکلات افزونگی مرتبط با به‌روزرسانی‌ها را می‌توان بسیار آسان‌تر حل کرد. به عنوان یک قاعده، هیچ افزونگی در حقایق وجود ندارد، فقط در اندازه گیری ها.

ابعاد برای انتخاب و جمع آوری داده ها در سطح مورد نظر از جزئیات استفاده می شود. ابعاد در سلسله مراتبی متشکل از چندین سطح سازماندهی می شوند که هر یک سطح جزئیات مورد نیاز برای تحلیل مربوطه را نشان می دهد.

گاهی اوقات تعریف چندین سلسله مراتب برای یک بعد مفید است. به عنوان مثال، مدل می تواند زمان را هم در سال مالی و هم در سال های تقویم تعریف کند. چندین سلسله مراتب یک یا چند سطح مشترک، پایین‌ترین سطح، مانند روز و ماه را به اشتراک می‌گذارند، و مدل آنها را به چندین سطح بالاتر تقسیم می‌کند - سه ماهه مالی و سه ماهه تقویم. برای جلوگیری از تعاریف تکراری، ابرداده های پایگاه داده چند بعدی سلسله مراتبی از ابعاد را تعریف می کنند.

در شکل شکل 2 نمودار مکان را برای داده های فروش از جدول 1 نشان می دهد. از بین سه سطح ابعاد مکان، شهر پایین ترین است. ارزش ها در سطح شهر به مقادیر در سطح کشور گروه بندی می شوند، به عنوان مثال آلبورگ و کپنهاگ در دانمارک هستند. سطح T همه ابعاد را نشان می دهد.

در برخی از مدل های چند بعدی، یک سطح دارای چندین ویژگی مرتبط است که حاوی اطلاعات ساده و غیر سلسله مراتبی است. برای مثال، Batch Size می تواند یک ویژگی سطح در بعد Product باشد. بعد Batch Size نیز می تواند این اطلاعات را دریافت کند. استفاده از مکانیسم خواص باعث افزایش تعداد ابعاد در مکعب نمی شود.

برخلاف فضاهای خطی که جبر ماتریسی با آنها سروکار دارد، مدل‌های چند بعدی معمولاً توابع ترتیب یا فاصله را برای مقادیر ابعاد ارائه نمی‌کنند. تنها "سفارش" این است که مقادیر سطح بالاتر حاوی مقادیر سطح پایین تر است. با این حال، برای برخی از ابعاد، مانند زمان، می‌توان از ترتیب مقادیر ابعاد برای محاسبه اطلاعات کل استفاده کرد، مانند کل فروش برای یک دوره خاص. اکثر مدل ها نیاز به تعریف سلسله مراتبی از ابعاد برای تشکیل درخت های متعادل دارند - سلسله مراتب باید داشته باشند همان ارتفاعدر امتداد همه شاخه‌ها، و هر مقدار سطح غیر ریشه فقط یک والد است.

داده ها

واقعیت ها یک موضوع را نشان می دهند - یک الگو یا رویداد که نیاز به تجزیه و تحلیل دارد. در اکثر مدل های داده چند بعدی، حقایق به طور منحصر به فردی با ترکیبی از مقادیر ابعاد تعریف می شوند. یک واقعیت تنها زمانی وجود دارد که سلول برای ترکیب خاصی از مقادیر خالی نباشد. با این حال، برخی از مدل ها حقایق را به عنوان "اشیاء درجه یک" با ویژگی های خاص در نظر می گیرند. بیشتر مدل‌های چند بعدی همچنین نیاز دارند که هر واقعیت با یک مقدار در سطح پایین‌تری از هر بعد مرتبط باشد، اما برخی از مدل‌ها به این نیاز ندارند.

هر واقعیت دارای مقداری دانه بندی است که توسط سطوحی که ترکیبی از مقادیر ابعاد آن ایجاد می شود، تعریف می شود. به عنوان مثال، دانه بندی یک واقعیت در مکعب نشان داده شده در شکل. 1 (سال x محصول x شهر) است. (سال x نوع x شهر) و (روز x محصول x شهر) - به ترتیب دانه بندی درشت تر و ریزتر.

انبارهای داده معمولاً شامل سه نوع واقعیت زیر هستند.

  • مناسبت هاحداقل در سطح بزرگترین دانه بندی، به عنوان یک قاعده، رویدادهای دنیای واقعی مدل می شوند، با هر واقعیت نشان دهنده یک نمونه خاص از پدیده مورد مطالعه است. به عنوان مثال می توان به فروش، کلیک ماوس روی یک صفحه وب یا جابجایی کالا در انبار اشاره کرد.
  • عکس های فوریوضعیت یک شی را در یک نقطه زمانی معین، مانند سطوح در دسترس بودن کالا در یک فروشگاه یا انبار و تعداد کاربران یک وب سایت، مدل کنید. یک نمونه مشابه از یک پدیده دنیای واقعی، مانند یک قوطی خاص لوبیا، می تواند در بیش از یک واقعیت ظاهر شود.
  • عکس فوری تجمعیحاوی اطلاعاتی در مورد فعالیت های سازمان برای مدت معینی باشد. به عنوان مثال فروش انباشته دوره قبل با احتساب ماه جاری را می توان به راحتی با ماه های مشابه سال قبل مقایسه کرد.

انبار داده اغلب شامل هر سه نوع واقعیت است. داده های منبع یکسان، به عنوان مثال، جابجایی کالا در یک انبار، می تواند در سه نوع مختلف مکعب باشد: جریان کالا در انبار، فهرست کالاها، و جریان برای سال تا تاریخ فعلی.

گزینه ها

پارامترها از دو جزء تشکیل شده است:

  • یک ویژگی عددی یک واقعیت، به عنوان مثال، قیمت یا درآمد فروش؛
  • یک فرمول، معمولاً یک تابع جمع ساده، مثلاً مجموع، که می تواند چندین مقدار پارامتر را در یک ترکیب کند.

در یک پایگاه داده چند بعدی، پارامترها معمولاً ویژگی های این واقعیت را نشان می دهند که کاربر می خواهد کاوش کند. پارامترها می پذیرند معانی مختلفبرای ترکیب های مختلف اندازه گیری ویژگی و فرمول برای نشان دادن یک مقدار معنی دار برای تمام ترکیبات سطوح تجمع انتخاب شده است. از آنجایی که فراداده فرمول را تعریف می کند، داده ها برخلاف صفحه گسترده، تکرار نمی شوند.

هنگام انجام محاسبات، سه کلاس مختلف پارامترها کاملاً متفاوت عمل می کنند.

  • پارامترهای افزودنیمی توان به طور معناداری در هر بعد ترکیب کرد. برای مثال، جمع کل فروش برای محصول، مکان و زمان منطقی است، زیرا این امر باعث همپوشانی بین پدیده‌های دنیای واقعی که هر یک از این ارزش‌ها را ایجاد می‌کنند، نمی‌شود.
  • پارامترهای نیمه افزودنی،که در یک یا چند بعد قابل ترکیب نیستند. برای مثال، جمع‌بندی موجودی‌ها در محصولات و انبارهای مختلف منطقی است، اما جمع‌بندی موجودی کالاها در زمان‌های مختلف بی‌معنی است، زیرا یک پدیده فیزیکی یکسان را می‌توان چندین بار شمارش کرد.
  • پارامترهای غیرافزودنیمعمولاً به این دلیل که فرمول انتخابی اجازه نمی دهد که ابزارهای سطح پایین به میانگین سطح بالاتر ترکیب شوند، روی هیچ بعد ترکیب نشوند.

پارامترهای افزودنی و غیرافزودنی می‌توانند حقایق را از هر نوع توصیف کنند، در حالی که پارامترهای نیمه افزودنی معمولاً با عکس‌های فوری یا عکس‌های فوری کل استفاده می‌شوند.

درخواست ها

یک پایگاه داده چند بعدی به طور طبیعی طراحی شده است تا انواع خاصیدرخواست ها.

  • پرس و جوهای تکه و تاسانتخابی انجام دهید که مکعب را کاهش دهد. برای مثال، می توانید سطح مقطع مکعب را در شکل در نظر بگیرید. 1، فقط سلول هایی را در نظر بگیرید که نان را لمس می کنند، و سپس آن را حتی بیشتر کاهش می دهند و سلول های مربوط به سال 2000 باقی می مانند. تثبیت یک مقدار ابعاد، ابعاد مکعب را کاهش می دهد، اما عملیات انتخاب کلی تری نیز امکان پذیر است.
  • درخواست هایی مانند تمرین کردن و جمع کردن- عملیات معکوس که از سلسله مراتبی از ابعاد و پارامترها برای تجمیع استفاده می کند. تعمیم به مقادیر بالاترمربوط به طرد بعد است. به عنوان مثال، مجموعه ای از سطح "شهر" به سطح "کشور" در شکل. 2 مقادیر آلبورگ و کپنهاگ را در یک مقدار جمع می کند - دانمارک.
  • پرس و جوهای همه جانبهمکعب هایی را که یک یا چند بعد مشترک دارند ترکیب کنید. از نقطه نظر جبر رابطه ای، چنین عملیاتی ادغام را انجام می دهد.
  • پرس و جو از نوع رتبه بندیتنها سلول‌هایی را برمی‌گرداند که در بالا یا پایین فهرستی که به روشی خاص سفارش داده شده‌اند ظاهر می‌شوند، به عنوان مثال، 10 محصول پرفروش در کپنهاگ در سال 2000.
  • در حال چرخش cube به کاربران این امکان را می دهد که داده ها را بر اساس ابعاد دیگر گروه بندی کنند.

پیاده سازی

پایگاه های داده چند بعدی به دو شکل اصلی پیاده سازی می شوند.

  • سیستم های پردازش تحلیلی آنلاین چند بعدی (MOLAP) داده ها را در ساختارهای چند بعدی تخصصی ذخیره می کنند. سیستم‌های MOLAP معمولاً شامل امکاناتی برای پردازش آرایه‌های پراکنده هستند و از نمایه‌سازی پیشرفته و هش برای جستجوی داده‌ها هنگام اجرای پرس‌وجوها استفاده می‌کنند.
  • رابطه ای سیستم های OLAP(ROLAP) از پایگاه داده های رابطه ای برای ذخیره داده ها استفاده می کند و همچنین از ساختارهای شاخص تخصصی مانند بیت مپ برای دستیابی به آن استفاده می کند. سرعت بالاانجام درخواست ها

سیستم های MOLAP، به عنوان یک قاعده، به شما این امکان را می دهند که به چیزهای بیشتری دست پیدا کنید استفاده موثر فضای دیسکو همچنین زمان پاسخ کوتاه‌تر هنگام پردازش درخواست‌ها.

کاهش زمان پاسخ در هنگام پردازش درخواست ها

بیشترین روش های مهمافزایش کارایی در پایگاه های داده چند بعدی پیش محاسبه است. همتای تخصصی آنها پیش انباشتگی است که زمان پاسخگویی به پرسش‌هایی را که حجم بالقوه عظیمی از داده‌ها را پوشش می‌دهند تا حدی که برای تجزیه و تحلیل داده‌های تعاملی کافی است کاهش می‌دهد.

محاسبه و ذخیره، یا «مادی کردن» حجم کل فروش بر اساس کشور و ماه نمونه‌ای از پیش تجمیع است. این رویکرد به شما این امکان را می دهد که به سرعت پاسخ سوالات مربوط به کل فروش را دریافت کنید، به عنوان مثال، در یک ماه، در یک کشور، یا بر اساس سه ماهه و کشور به طور همزمان. این پاسخ ها را می توان از داده های از پیش محاسبه شده به دست آورد و نیازی به دسترسی به اطلاعات واقع در انبار داده نیست.

پایگاه‌های داده‌های رابطه‌ای تجاری مدرن، و همچنین سیستم‌های چند بعدی تخصصی، حاوی ابزارهایی برای بهینه‌سازی پرس‌وجوها بر اساس انبوه‌های از پیش محاسبه‌شده (جمع) و محاسبه مجدد خودکار مجموعه‌های ذخیره‌شده هنگام به‌روزرسانی داده‌های اساسی هستند.

پیش انباشتگی کامل - تحقق همه ترکیبات سنگدانه ها - غیرممکن است زیرا به فضای دیسک و زمان زیادی برای محاسبات اولیه نیاز دارد. به جای این سیستم های مدرن OLAP رویکرد عملی تری را برای پیش انباشتگی دنبال می کند و تنها ترکیبات انتخابی از انباشته ها را عملی می کند و سپس از آنها برای محاسبه سایر انباشته ها به طور موثرتر استفاده می کند. استفاده مجدد از مجموعه ها مستلزم حفظ ساختار داده چند بعدی صحیح است.

ادبیات
  1. R. Winter، "پایگاه های داده: بازگشت به بازی OLAP"، مجله Intelligent Enterprise، جلد. 1، نه 4، 1998
  2. ای. تامسن، جی. اسپوفورد، دی. چیس، مایکروسافت OLAPراه حل ها، جان وایلی و پسران، نیویورک، 1999

توربن باخ پدرسن، کریستین اس. جنسن، فناوری پایگاه داده چند بعدی. IEEE Computer، دسامبر 2001. حق نشر IEEE Computer Society، 2001. تمامی حقوق محفوظ است. تجدید چاپ با اجازه.

تئوری متغیرهای تصادفی، پدیده‌های احتمالی را «در استاتیک» مطالعه می‌کند و آنها را به‌عنوان برخی از نتایج ثبت‌شده آزمایش‌ها در نظر می‌گیرد. برای توصیف سیگنال هایی که منعکس کننده پدیده های تصادفی در حال توسعه در طول زمان هستند، روش های نظریه احتمالات کلاسیک ناکافی هستند. چنین مسائلی توسط شاخه خاصی از ریاضیات به نام نظریه فرآیندهای تصادفی مورد مطالعه قرار می گیرند.

طبق تعریف، فرآیند تصادفی نوع خاصی از تابع است که با این واقعیت مشخص می شود که در هر لحظه از زمان مقادیری که می گیرد متغیرهای تصادفی هستند.

مجموعه های پیاده سازی

هنگام برخورد با سیگنال های قطعی، آنها را نمایش می دهیم وابستگی های عملکردییا اسیلوگرام اگر ما در مورددر مورد فرآیندهای تصادفی، وضعیت پیچیده تر به نظر می رسد. تثبیت در یک بازه زمانی مشخص ارزش های آنیسیگنال تصادفی، ما تنها یک پیاده سازی از یک فرآیند تصادفی را بدست می آوریم. یک فرآیند تصادفی مجموعه ای نامتناهی از چنین تحقق هایی است که یک مجموعه آماری را تشکیل می دهد. به عنوان مثال، یک مجموعه مجموعه ای از سیگنال ها است که می تواند به طور همزمان در خروجی ژنراتورهای ولتاژ نویز کاملاً یکسان مشاهده شود.

اصلاً لازم نیست که پیاده‌سازی یک فرآیند تصادفی توسط توابعی با رفتار پیچیده و نامنظم در زمان نمایش داده شود. اغلب لازم است که فرآیندهای تصادفی را در نظر بگیریم که به عنوان مثال توسط انواع مختلف تشکیل شده اند سیگنال های هارمونیک، که دارای یکی از سه پارامتر هستند - مقدار تصادفی، در هر پیاده سازی مقدار خاصی را می گیرد. ماهیت تصادفی چنین سیگنالی در عدم امکان دانستن مقدار این پارامتر از قبل، قبل از آزمایش است.

فرآیندهای تصادفی که توسط پیاده سازی ها بسته به تعداد محدودی از پارامترها تشکیل می شوند معمولاً فرآیندهای تصادفی شبه قطعی نامیده می شوند.

چگالی احتمال فرآیندهای تصادفی

بگذارید یک فرآیند تصادفی باشد که توسط مجموعه‌ای از پیاده‌سازی‌ها مشخص شده است، و اجازه دهید یک لحظه دلخواه در زمان باشد. با تثبیت مقادیر به‌دست‌آمده در پیاده‌سازی‌های جداگانه، یک بخش یک بعدی از این فرآیند تصادفی را انجام می‌دهیم و متغیر تصادفی را مشاهده می‌کنیم که چگالی احتمال آن را چگالی احتمال یک‌بعدی فرآیند در یک لحظه می‌گویند.

طبق تعریف، یک کمیت احتمال این است که تحقق یک فرآیند تصادفی در یک لحظه از زمان، مقادیری را در بازه زمانی دریافت کند.

اطلاعاتی که می توان از چگالی یک بعدی استخراج کرد برای قضاوت در مورد ماهیت توسعه تحقق یک فرآیند تصادفی در طول زمان کافی نیست. اطلاعات بسیار بیشتری را می توان با داشتن دو بخش از یک فرآیند تصادفی در لحظات واگرا از زمان به دست آورد. متغیر تصادفی دو بعدی که در چنین آزمایش فکری بوجود می آید با چگالی احتمال دو بعدی توصیف می شود. می توان احتمال رویداد را محاسبه کرد، که شامل این واقعیت است که اجرای فرآیند تصادفی در یک محله کوچک از نقطه اتفاق می افتد و زمانی که - در یک محله کوچک از نقطه اتفاق می افتد.

یک تعمیم طبیعی یک مقطع -بعدی از یک فرآیند تصادفی است که منجر به چگالی احتمال -بعدی می شود.

چگالی احتمال چند متغیره یک فرآیند تصادفی باید شرایط معمول تحمیل شده بر چگالی احتمال مجموعه ای از متغیرهای تصادفی را برآورده کند (به بند 6.2 مراجعه کنید). علاوه بر این، مقدار نباید به ترتیبی که آرگومان های آن در آن قرار دارند (شرط تقارن) بستگی داشته باشد.

گاهی اوقات، به جای چگالی احتمال - بعدی، راحت است از تابع مشخصه -بعدی استفاده شود که با تبدیل فوریه به چگالی مربوطه مربوط می شود:

توصیف خواص فرآیندهای تصادفی با استفاده از چگالی احتمال چند بعدی با ابعاد بالا می تواند بسیار مفصل باشد. با این حال، اغلب در این مسیر با مشکلات جدی ریاضی مواجه می‌شویم.

تابع لحظه ای فرآیندهای تصادفی

جزئیات کمتر، اما، به عنوان یک قاعده، از نظر عملی کاملاً رضایت بخش است، ویژگی های فرآیندهای تصادفی را می توان با محاسبه گشتاورهای آن متغیرهای تصادفی که در مقاطع مقطعی این فرآیندها مشاهده می شود، به دست آورد. از آنجایی که در حالت کلی این ممان ها به آرگومان های زمانی بستگی دارند، آنها را تابع لحظه ای می نامند.

برای مهندسی رادیو آماری بالاترین ارزشدارای سه تابع گشتاور مرتبه پایین تر به نام تابع انتظار ریاضی، پراکندگی و همبستگی.

ارزش مورد انتظار

مقدار متوسط ​​فرآیند X(t) در زمان جاری است. میانگین گیری در کل مجموعه پیاده سازی فرآیند انجام می شود.

پراکندگی

به شخص اجازه می دهد تا درجه پراکندگی مقادیر لحظه ای گرفته شده توسط پیاده سازی های فردی در یک بخش ثابت t را نسبت به مقدار متوسط ​​قضاوت کند.

لحظه مرکزی دو بعدی

تابع همبستگی یک فرآیند تصادفی نامیده می شود.این تابع لحظه ای درجه ارتباط آماری بین آن دسته از متغیرهای تصادفی را مشخص می کند که هنگام مقایسه فرمول های (6.37)، (6.38) مشاهده می شود، توجه می کنیم که هنگام ترکیب بخش ها، تابع همبستگی از نظر عددی برابر است. به پراکندگی:

فرآیندهای تصادفی ثابت

این نام مرسوم برای فرآیندهای تصادفی است که ویژگی های آماری آنها در همه بخش ها یکسان است.

یک فرآیند تصادفی به معنای محدود ثابت است. اگر هر یک از چگالی احتمال بعدی آن نسبت به شیفت زمانی ثابت باشد

اگر الزامات را به این واقعیت محدود کنیم که انتظارات ریاضی و پراکندگی فرآیند به زمان بستگی ندارد، و تابع همبستگی فقط به تفاوت بستگی دارد -، در این صورت چنین فرآیند تصادفی به معنای گسترده ساکن خواهد بود. روشن است که ایستایی به معنای مضیق، مستلزم ایستایی به معنای وسیع است، اما برعکس نه.

مطابق تعریف، تابع همبستگی یک فرآیند تصادفی ثابت زوج است:

علاوه بر این، مقادیر مطلق این تابع برای هر کدام از مقدار آن برای:

روش اثبات به این صورت است: از نابرابری آشکار

به دنبال آن است

از آنجا نابرابری (6.41) مستقیماً دنبال می شود.

اغلب استفاده از تابع همبستگی نرمال شده راحت است

برای کدام .

برای توضیح مفهوم فرآیند تصادفی ثابت، دو مثال را در نظر بگیرید.

مثال 6.5. یک فرآیند تصادفی با پیاده سازی فرم هایی که از قبل شناخته شده است تشکیل می شود، در حالی که زاویه فاز یک متغیر تصادفی است که به طور یکنواخت بر روی قطعه توزیع شده است -

از آنجایی که چگالی احتمال زاویه فاز انتظار ریاضی فرآیند است

به طور مشابه، می توانید واریانس را پیدا کنید:

در نهایت تابع همبستگی

بنابراین، این فرآیند تصادفی تمام شرایطی را که برای اطمینان از ایستایی به معنای گسترده لازم است، برآورده می‌کند.

مثال 6.6. یک فرآیند تصادفی دارای پیاده سازی هایی از فرم و علاوه بر این، اعداد داده شده است. - یک متغیر تصادفی با قانون توزیع دلخواه. ارزش مورد انتظار

تنها در زمان مستقل از زمان خواهد بود بنابراین، در حالت کلی، فرآیند تصادفی مورد بررسی غیر ثابت خواهد بود.

اموال Ergodicity.

یک فرآیند تصادفی ثابت در صورتی ارگودیک نامیده می‌شود که هنگام یافتن توابع گشتاور آن، میانگین‌گیری از یک مجموعه آماری را بتوان با میانگین‌گیری در طول زمان جایگزین کرد. عملیات میانگین گیری بر روی یک اجرای منفرد از مدت زمان T انجام می شود که از نظر تئوری می تواند به طور دلخواه طولانی باشد.

با نشان دادن میانگین زمان با براکت های زاویه، انتظارات ریاضی یک فرآیند تصادفی ارگودیک را می نویسیم:

که برابر با مولفه ثابت پیاده سازی انتخاب شده است.

واریانس یک فرآیند مشابه

از آنجایی که مقدار نشان دهنده توان متوسط ​​پیاده سازی است و مقدار قدرت جزء ثابت است، پراکندگی معنای روشنی از قدرت جزء نوسانی فرآیند ارگودیک دارد.

تابع همبستگی به طور مشابه یافت می شود:

یک شرط کافی برای ارگودیسیته یک فرآیند تصادفی، ثابت به معنای وسیع، تمایل تابع همبستگی به صفر با افزایش نامحدود در شیفت زمانی است:

ریاضیات نشان می دهد که این نیاز می تواند تا حدودی آرام شود. به نظر می رسد که اگر شرط Slutsky برآورده شود، فرآیند تصادفی ارگودیک است:

بنابراین، برابری (6.47) در رابطه با یک فرآیند هارمونیک با فاز اولیه تصادفی معتبر است (به مثال 6.5 مراجعه کنید).

اندازه گیری ویژگی های فرآیندهای تصادفی.

اگر یک فرآیند تصادفی ارگودیک باشد، در این صورت تحقق طول کافی آن، نماینده «معمولی» یک مجموعه آماری است. با مطالعه تجربی این پیاده سازی، می توان اطلاعات زیادی را که این فرآیند تصادفی را مشخص می کند، به دست آورد.

دستگاهی برای اندازه گیری چگالی احتمال یک بعدی یک فرآیند تصادفی را می توان به صورت زیر طراحی کرد. چگالی احتمال یک بعدی یک فرآیند تصادفی ارگودیک مقداری متناسب با زمان نسبی اجرای آن در سطح بین است.فرض کنید که دستگاهی با دو ورودی وجود دارد که یکی از آنها با اجرای تحت مطالعه x(t) عرضه شده است. ) و دیگری با یک ولتاژ ثابت مرجع عرضه می شود که سطح آن را تنظیم می کند. در خروجی دستگاه، پالس‌های ویدئویی مستطیلی با دامنه ثابت ظاهر می‌شوند که ابتدا و انتهای آن‌ها با لحظه‌های زمانی تعیین می‌شوند که مقادیر فعلی سیگنال تصادفی یا با سطح یا با سطح منطبق است. حالا مثلاً با استفاده از یک ابزار اشاره گر معمولی، مقدار متوسط ​​جریان ایجاد شده توسط یک دنباله از پالس های ویدئویی را اندازه گیری کنید، سپس خوانش های این دستگاه متناسب با چگالی احتمال خواهد بود.

هر وسیله اشاره گر به اندازه کافی اینرسی را می توان برای اندازه گیری انتظارات ریاضی یک فرآیند تصادفی استفاده کرد [نگاه کنید به. فرمول (6.43)].

دستگاهی که پراکندگی یک فرآیند تصادفی را اندازه گیری می کند، به شرح زیر از (6.44)، باید یک خازن در ورودی داشته باشد که جزء ثابت را جدا می کند. مراحل بعدی فرآیند اندازه گیری - مربع و میانگین زمان - توسط یک ولت متر درجه دوم اینرسی انجام می شود.

اصل عملکرد سنج تابع همبستگی (همبستگی سنج) از فرمول (6.45) پیروی می کند. در اینجا مقادیر لحظه ای یک سیگنال تصادفی پس از فیلتر کردن جزء ثابت به کانال ها تقسیم می شوند و به یک ضریب تغذیه می شوند و در یکی از کانال ها سیگنال برای مدتی به تاخیر می افتد. برای به دست آوردن مقدار تابع همبستگی، سیگنال خروجی ضریب توسط یک پیوند اینرسی پردازش می شود که میانگین گیری را انجام می دهد.

صرف نظر از اندازه

در اینجا از همان نمادی که در فرمول (6.26) استفاده شده است استفاده شده است. عناصر ماتریس همبستگی این فرآیند تصادفی توسط تابع همبستگی نرمال شده تعیین می شوند:

در ادامه، ما اغلب از چگالی گاوسی دو بعدی استفاده خواهیم کرد

یک فرآیند گاوسی ثابت جایگاه استثنایی را در میان سایر فرآیندهای تصادفی اشغال می کند - هر یک از چگالی احتمال چند بعدی آن با ویژگی های آن تعیین می شود: انتظارات ریاضی و تابع همبستگی.

بهترین مقالات در این زمینه