نحوه راه اندازی گوشی های هوشمند و رایانه های شخصی پرتال اطلاعاتی
  • خانه
  • ایمنی
  • تحلیل رگرسیون همبستگی چندگانه در اکسل. وظایف اصلی رگرسیون در اکسل: نمونه ای از ساخت یک مدل

تحلیل رگرسیون همبستگی چندگانه در اکسل. وظایف اصلی رگرسیون در اکسل: نمونه ای از ساخت یک مدل

رگرسیون و تحلیل همبستگی - روشهای تحقیق آماری. اینها رایج ترین راه ها برای نشان دادن اینکه چگونه یک پارامتر به یک یا چند متغیر مستقل بستگی دارد، هستند.

در زیر با استفاده از مثال های کاربردی خاص، این دو تحلیل را که در بین اقتصاددانان بسیار محبوب هستند، بررسی خواهیم کرد. و همچنین مثالی از به دست آوردن نتایج در هنگام ترکیب آنها خواهیم داد.

تحلیل رگرسیون در اکسل

تأثیر برخی از مقادیر (مستقل، مستقل) را بر روی متغیر وابسته نشان می دهد. به عنوان مثال، چگونگی تعداد جمعیت فعال اقتصادی به تعداد شرکت ها، اندازه دستمزدها و سایر پارامترها بستگی دارد. یا: سرمایه گذاری های خارجی، قیمت انرژی و غیره چگونه بر سطح تولید ناخالص داخلی تأثیر می گذارند.

نتیجه تجزیه و تحلیل به شما امکان می دهد اولویت بندی کنید. و بر اساس عوامل اصلی، پیش بینی، برنامه ریزی توسعه حوزه های اولویت دار، تصمیم گیری های مدیریتی.

رگرسیون اتفاق می افتد:

  • خطی (y = a + bx)؛
  • سهمی (y = a + bx + cx 2)؛
  • نمایی (y = a * exp (bx))؛
  • توان (y = a * x ^ b)؛
  • هذلولی (y = b / x + a)؛
  • لگاریتمی (y = b * 1n (x) + a)؛
  • نمایی (y = a * b ^ x).

بیایید نمونه ای از ساخت مدل رگرسیون در اکسل و تفسیر نتایج را بررسی کنیم. بیایید یک نوع رگرسیون خطی در نظر بگیریم.

وظیفه. در 6 شرکت، میانگین حقوق ماهانه و تعداد کارکنانی که ترک کردند، تجزیه و تحلیل شد. تعیین وابستگی تعداد کارکنانی که ترک می کنند به میانگین حقوق ضروری است.

مدل رگرسیون خطی به شرح زیر است:

Y = a 0 + a 1 x 1 + ... + a k x k.

جایی که a - ضرایب رگرسیون، x - متغیرهای تأثیرگذار، k - تعداد عوامل.

در مثال ما، Y نشانگر کارمندانی است که ترک می کنند. عامل تأثیرگذار دستمزد (x) است.

اکسل دارای توابع داخلی است که می توانید از آنها برای محاسبه پارامترهای یک مدل رگرسیون خطی استفاده کنید. اما افزونه Analysis Package این کار را سریعتر انجام می دهد.

ما یک ابزار تحلیلی قدرتمند را فعال می کنیم:

پس از فعال‌سازی، افزونه در برگه «داده‌ها» در دسترس خواهد بود.

حالا بیایید مستقیماً به تحلیل رگرسیون برویم.



اول از همه به مربع R و ضرایب توجه کنید.

R-square ضریب تعیین است. در مثال ما - 0.755 یا 75.5٪. این بدان معناست که پارامترهای محاسبه شده مدل، رابطه بین پارامترهای مورد مطالعه را 75.5 درصد توضیح می دهد. هر چه ضریب تعیین بیشتر باشد، مدل بهتر است. خوب - بالای 0.8. بد - کمتر از 0.5 (چنین تجزیه و تحلیل به سختی می تواند معقول در نظر گرفته شود). در مثال ما - "بد نیست".

ضریب 64.1428 نشان می دهد که اگر همه متغیرهای مدل مورد نظر برابر با 0 باشند Y چه مقدار خواهد بود. یعنی عوامل دیگری که در مدل توضیح داده نشده اند نیز بر مقدار پارامتر تحلیل شده تأثیر می گذارند.

ضریب 0.16285- وزن متغیر X را روی Y نشان می دهد. یعنی میانگین حقوق ماهانه در این مدل بر تعداد افرادی که با وزن 0.16285- دست از کار می کشند تأثیر می گذارد (این درجه تأثیر کمی است). علامت "-" نشان دهنده تأثیر منفی است: هر چه حقوق و دستمزد بالاتر باشد، کمتر ترک می کند. که منصفانه است.



تحلیل همبستگی در اکسل

تجزیه و تحلیل همبستگی به تعیین اینکه آیا رابطه ای بین شاخص ها در یک یا دو نمونه وجود دارد کمک می کند. به عنوان مثال بین زمان کارکرد دستگاه و هزینه تعمیرات، قیمت تجهیزات و مدت زمان کارکرد، قد و وزن کودکان و غیره.

اگر یک رابطه وجود داشته باشد، پس آیا افزایش در یک پارامتر منجر به افزایش (همبستگی مثبت) یا کاهش (منفی) در پارامتر دیگر می شود. تحلیل همبستگی به تحلیلگر کمک می کند تا تعیین کند که آیا مقدار یک شاخص می تواند ارزش احتمالی شاخص دیگر را پیش بینی کند یا خیر.

ضریب همبستگی با r نشان داده می شود. از +1 تا -1 متغیر است. طبقه بندی همبستگی ها برای حوزه های مختلف متفاوت خواهد بود. وقتی ضریب 0 باشد، هیچ رابطه خطی بین نمونه ها وجود ندارد.

بیایید نحوه استفاده از ابزار اکسل برای یافتن ضریب همبستگی را بررسی کنیم.

برای یافتن ضرایب زوج از تابع CORREL استفاده می شود.

هدف: تعیین اینکه آیا بین زمان کارکرد ماشین تراش و هزینه نگهداری آن رابطه وجود دارد یا خیر.

مکان نما را در هر سلولی قرار می دهیم و دکمه fx را فشار می دهیم.

  1. در دسته «آماری»، تابع CORREL را انتخاب کنید.
  2. آرگومان آرایه 1 - اولین محدوده مقادیر - زمان عملکرد ماشین: A2: A14.
  3. آرگومان آرایه 2 - محدوده دوم مقادیر - هزینه تعمیر: B2: B14. روی OK کلیک کنید.

برای تعیین نوع اتصال، باید به عدد مطلق ضریب نگاه کنید (هر زمینه فعالیت مقیاس خاص خود را دارد).

برای تجزیه و تحلیل همبستگی چندین پارامتر (بیش از 2)، استفاده از تجزیه و تحلیل داده ها (افزونه بسته تحلیلی) راحت تر است. در لیست، باید یک همبستگی را انتخاب کنید و یک آرایه را تعیین کنید. همه چیز.

ضرایب به دست آمده در ماتریس همبستگی نمایش داده می شود. مثل این:

تحلیل همبستگی-رگرسیون

در عمل، این دو تکنیک اغلب با هم استفاده می شوند.

مثال:


اکنون داده های رگرسیون نیز قابل مشاهده است.

ساخت یک رگرسیون خطی، تخمین پارامترهای آن و اهمیت آنها را می توان با استفاده از بسته تحلیل اکسل (رگرسیون) بسیار سریعتر انجام داد. تفسیر نتایج به دست آمده در حالت کلی را در نظر بگیرید ( کمتغیرهای توضیحی) مطابق مثال 3.6.

در جدول آمار رگرسیونمقادیر داده شده است:

چندگانه آر - ضریب همبستگی چندگانه؛

آر- مربع- ضریب تعیین آر 2 ;

عادی شد آر - مربع- تنظیم شده آر 2 برای تعداد درجات آزادی تصحیح شد.

خطای استاندارد- خطای استاندارد رگرسیون اس;

مشاهدات -تعداد مشاهدات n.

در جدول ANOVAداده می شود:

1. ستون df - تعداد درجات آزادی برابر است

برای رشته پسرفت df = ک;

برای رشته باقی ماندهdf = nک – 1;

برای رشته جمعdf = n– 1.

2. ستون اس اس -مجموع مربعات انحرافات برابر است با

برای رشته پسرفت ;

برای رشته باقی مانده ;

برای رشته جمع .

3. ستون خانمواریانس های تعیین شده توسط فرمول خانم = اس اس/df:

برای رشته پسرفت- واریانس فاکتوریل؛

برای رشته باقی مانده- واریانس باقیمانده

4. ستون اف - ارزش محاسبه شده اف-معیار محاسبه شده با فرمول

اف = خانم(پسرفت)/ خانم(باقی مانده).

5. ستون اهمیت اف - مقدار سطح معنی داری مربوط به محاسبه شده است اف-آمار .

اهمیت اف= FDIST ( F-آمار، df(پسرفت)، df(باقیمانده)).

اگر اهمیت اف < стандартного уровня значимости, то آر 2 از نظر آماری معنادار است.

ضرایب خطای استاندارد آماره t P-value 95% پایین 95% برتر
Y 65,92 11,74 5,61 0,00080 38,16 93,68
ایکس 0,107 0,014 7,32 0,00016 0,0728 0,142

این جدول نشان می دهد:

1. شانس- مقادیر ضرایب آ, ب.

2. خطای استاندارد- خطاهای استاندارد ضرایب رگرسیون S a, S ب.



3. t-آمار- مقادیر محاسبه شده تی - معیارهای محاسبه شده با فرمول:

t-statistic = ضرایب / خطای استاندارد.

4.آر-ارزش (اهمیت تی) آیا مقدار سطح معناداری مربوط به محاسبه شده است t-آمار.

آر-ارزش = TDIST(تی-آمار، df(باقیمانده)).

اگر آر- معنی< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5... 95% پایین و 95% بالا- مرزهای پایین و بالایی فاصله اطمینان 95% برای ضرایب معادله رگرسیون خطی نظری.

انصراف باقی مانده است
مشاهده y را پیش بینی کرد باقی می ماند e
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

در جدول انصراف باقی مانده استنشان داد:

در ستون مشاهده- شماره مشاهده؛

در ستون پیش بینی شده y - مقادیر محاسبه شده متغیر وابسته؛

در ستون باقی مانده ه - تفاوت بین مقادیر مشاهده شده و محاسبه شده متغیر وابسته.

مثال 3.6.داده ها (واحدهای متعارف) در مورد هزینه های غذا وجود دارد yو درآمد سرانه ایکسبرای نه گروه از خانواده ها:

ایکس
y

با استفاده از نتایج بسته تحلیل اکسل (رگرسیون)، وابستگی هزینه های مواد غذایی را به میزان درآمد سرانه تجزیه و تحلیل می کنیم.

مرسوم است که نتایج تحلیل رگرسیون را به شکل زیر بنویسید:

که در آن خطاهای استاندارد ضرایب رگرسیون در داخل پرانتز نشان داده شده است.

ضرایب رگرسیون آ = 65,92 و ب= 0.107. جهت ارتباط بین yو ایکسعلامت ضریب رگرسیون را تعیین می کند ب= 0.107، یعنی ارتباط مستقیم و مثبت است. ضریب ب 0.107 = نشان می دهد که با افزایش درآمد سرانه 1 تبدیل. واحدها هزینه های غذا 0.107 تبدیل افزایش می یابد. واحدها

اجازه دهید اهمیت ضرایب مدل حاصل را تخمین بزنیم. اهمیت ضرایب ( الف، ب) توسط بررسی می شود تی-تست:

مقدار P ( آ) = 0,00080 < 0,01 < 0,05

مقدار P ( ب) = 0,00016 < 0,01 < 0,05,

بنابراین، ضرایب ( الف، ب) در سطح 1% و حتی بیشتر از آن در سطح 5% معنی دار هستند. بنابراین، ضرایب رگرسیون معنی دار بوده و مدل برای داده های اصلی مناسب است.

نتایج تخمین رگرسیون نه تنها با مقادیر بدست آمده از ضرایب رگرسیون، بلکه با مقداری از مجموعه آنها (فاصله اطمینان) نیز سازگار است. با احتمال 95 درصد، فواصل اطمینان برای ضرایب (38.16 - 93.68) برای آو (0.0728 - 0.142) برای ب

کیفیت مدل با ضریب تعیین ارزیابی می شود آر 2 .

بزرگی آر 2 = 0.884 به این معنی است که 88.4 درصد از تغییرات (گسترش) در مخارج مواد غذایی را می توان با عامل درآمد سرانه توضیح داد.

اهمیت آر 2 توسط بررسی می شود F-آزمون: اهمیت اف = 0,00016 < 0,01 < 0,05, следовательно, آر 2 در سطح 1% و حتی بیشتر از آن در سطح 5% معنی دار است.

در مورد رگرسیون خطی زوجی، ضریب همبستگی را می توان به صورت تعریف کرد ... مقدار به دست آمده از ضریب همبستگی نشان می دهد که رابطه بین هزینه های غذایی و درآمد سرانه بسیار نزدیک است.

برای سرزمین های منطقه، داده ها برای سال 200X داده شده است.

شماره منطقه میانگین سرانه حداقل معیشت در روز یک کارگر توانمند، روبل، x متوسط ​​دستمزد روزانه، روبل، y
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

ورزش:

1. یک میدان همبستگی بسازید و فرضیه ای در مورد شکل رابطه ایجاد کنید.

2. پارامترهای معادله رگرسیون خطی را محاسبه کنید

4. با استفاده از میانگین (عمومی) ضریب کشش، ارزیابی مقایسه ای از قدرت رابطه بین عامل و نتیجه ارائه دهید.

7. مقدار پیش بینی شده نتیجه را در صورتی محاسبه کنید که مقدار پیش بینی شده ضریب 10 درصد از سطح متوسط ​​آن افزایش یابد. فاصله اطمینان پیش بینی کننده را برای سطح معنی داری تعیین کنید.

راه حل:

بیایید این مشکل را با استفاده از اکسل حل کنیم.

1. با مقایسه داده های موجود x و y، به عنوان مثال، رتبه بندی آنها به ترتیب صعودی ضریب x، می توان وجود رابطه مستقیم بین علائم را مشاهده کرد، زمانی که افزایش میانگین سرانه حداقل معیشت، میانگین روزانه را افزایش می دهد. حق الزحمه. بر این اساس می توان فرض کرد که ارتباط بین ویژگی ها مستقیم است و می توان آن را با معادله یک خط مستقیم توصیف کرد. همین نتیجه بر اساس تجزیه و تحلیل گرافیکی تأیید شده است.

برای ایجاد یک فیلد همبستگی، می توانید از PPP Excel استفاده کنید. داده های اولیه را به ترتیب وارد کنید: ابتدا x و سپس y.

ناحیه سلول های حاوی داده را انتخاب کنید.

سپس انتخاب کنید: درج / نمودار پراکندگی / پراکندگی با نشانگرهمانطور که در شکل 1 نشان داده شده است.

شکل 1 رسم فیلد همبستگی

تجزیه و تحلیل میدان همبستگی وجود یک وابستگی نزدیک به یک خط مستقیم را نشان می دهد، زیرا نقاط عملا در یک خط مستقیم قرار دارند.

2. برای محاسبه پارامترهای معادله رگرسیون خطی
بیایید از تابع آماری داخلی استفاده کنیم LINEST.

برای این:

1) یک فایل موجود حاوی داده های تجزیه و تحلیل شده را باز کنید.
2) یک منطقه سلول خالی 5 × 2 (5 ردیف، 2 ستون) را برای نمایش نتایج آمار رگرسیون انتخاب کنید.
3) فعال کنید جادوگر عملکرد: در منوی اصلی انتخاب کنید فرمول ها / درج تابع.
4) در پنجره دسته بندیشما در حال گرفتن هستید آماری، در پنجره تابع - LINEST... روی دکمه کلیک کنید خوبهمانطور که در شکل 2 نشان داده شده است؛

شکل 2 جعبه گفتگوی Function Wizard

5) آرگومان های تابع را پر کنید:

ارزش های شناخته شده برای

مقادیر شناخته شده x

مقدار ثابت- یک مقدار بولی که وجود یا عدم وجود یک وقفه در معادله را نشان می دهد. اگر ثابت = 1 باشد، ترم آزاد به روش معمول محاسبه می شود؛ اگر ثابت = 0 باشد، ترم آزاد 0 است.

آمار- یک مقدار بولی که نشان می دهد آیا اطلاعات اضافی در تجزیه و تحلیل رگرسیون نمایش داده می شود یا خیر. اگر Statistics = 1، اطلاعات اضافی نمایش داده می شود، اگر Statistics = 0، آنگاه فقط تخمین پارامترهای معادله نمایش داده می شود.

روی دکمه کلیک کنید خوب;

شکل 3 کادر محاوره ای آرگومان های تابع LINEST

6) اولین عنصر جدول نهایی در سلول سمت چپ بالای ناحیه انتخاب شده ظاهر می شود. برای بزرگ کردن کل جدول، کلید را فشار دهید و سپس ترکیب کلید ++ .

آمار رگرسیون اضافی به ترتیب نشان داده شده در نمودار زیر نمایش داده می شود:

مقدار ضریب b مقدار ضریب a
خطای استاندارد ب خطای استاندارد الف
خطای استاندارد y
آمار F
مجموع رگرسیون مربع ها

شکل 4 نتیجه محاسبه تابع LINEST

معادله رگرسیون را بدست آوردیم:

نتیجه می گیریم: با افزایش میانگین سرانه حداقل 1 روبل. متوسط ​​دستمزد روزانه به طور متوسط ​​0.92 روبل افزایش می یابد.

این به این معنی است که 52 درصد از تغییرات دستمزد (y) با تغییر عامل x - میانگین سرانه حداقل معیشت، و 48 درصد - با عملکرد سایر عواملی که در مدل گنجانده نشده اند توضیح داده می شود.

با توجه به ضریب تعیین محاسبه شده، ضریب همبستگی را می توان محاسبه کرد: .

اتصال نزدیک ارزیابی می شود.

4. با استفاده از میانگین (عمومی) ضریب کشش، قدرت تأثیر عامل بر نتیجه را تعیین می کنیم.

برای معادله یک خط مستقیم، میانگین ضریب کشش (عمومی) با فرمول تعیین می شود:

با انتخاب مساحت سلول های دارای مقادیر x، مقادیر متوسط ​​را بیابید و انتخاب کنید فرمول ها / جمع خودکار / میانگینو همین کار را با مقادیر y انجام دهید.

شکل 5 محاسبه مقادیر میانگین تابع و آرگومان

بنابراین، اگر میانگین سرانه حداقل معیشتی 1 درصد از ارزش متوسط ​​خود تغییر کند، متوسط ​​دستمزد روزانه به طور متوسط ​​0.51 درصد تغییر خواهد کرد.

استفاده از ابزار تجزیه و تحلیل داده ها پسرفتمی توانید آن را دریافت کنید:
- نتایج آمار رگرسیون،
- نتایج تحلیل واریانس،
- نتایج فواصل اطمینان،
- باقیمانده ها و نمودارها برای برازش خط رگرسیون،
- باقی مانده ها و احتمال عادی.

روند کار به صورت زیر است:

1) بررسی دسترسی به بسته تحلیلی... در منوی اصلی به ترتیب انتخاب کنید: فایل / گزینه ها / افزونه ها.

2) در منوی کشویی کنترلمورد را انتخاب کنید افزونه های اکسلو دکمه را فشار دهید برو

3) در پنجره افزونه هاکادر را علامت بزنید بسته تحلیلیو سپس کلیک کنید خوب.

اگر بسته تحلیلیدر لیست فیلد نیست افزونه های موجود، دکمه را فشار دهید بررسی اجمالیبرای جستجو

اگر پیامی مبنی بر عدم نصب بسته تجزیه و تحلیل بر روی رایانه شما ظاهر شد، کلیک کنید آرهبرای نصب آن

4) در منوی اصلی به صورت متوالی انتخاب کنید: داده ها / تجزیه و تحلیل داده ها / ابزارهای تجزیه و تحلیل / رگرسیونو سپس کلیک کنید خوب.

5) کادر محاوره ای پارامترهای ورودی و خروجی داده را کامل کنید:

دهانه ورودی Y- محدوده حاوی داده های ویژگی موثر؛

فاصله ورودی X- محدوده ای که حاوی داده های ویژگی عامل است.

برچسب ها- یک چک باکس که نشان می دهد ردیف اول شامل نام ستون است یا خیر.

ثابت - صفر- پرچمی که وجود یا عدم وجود یک رهگیری در معادله را نشان می دهد.

فاصله خروجی- کافی است سلول سمت چپ بالای محدوده آینده را نشان دهید.

6) کاربرگ جدید - می توانید یک نام دلخواه برای برگه جدید تعیین کنید.

سپس دکمه را فشار دهید خوب.

شکل 6 کادر محاوره ای برای وارد کردن پارامترهای ابزار Regression

نتایج تحلیل رگرسیون برای داده های وظیفه در شکل 7 ارائه شده است.

شکل 7 نتیجه اعمال ابزار رگرسیون

5. اجازه دهید کیفیت معادلات را با استفاده از میانگین خطای تقریب تخمین بزنیم. بیایید از نتایج تحلیل رگرسیون ارائه شده در شکل 8 استفاده کنیم.

شکل 8 نتیجه استفاده از ابزار رگرسیون "خروجی باقیمانده".

بیایید یک جدول جدید همانطور که در شکل 9 نشان داده شده است بسازیم. در ستون C ما خطای نسبی تقریب را با فرمول محاسبه می کنیم:

شکل 9 محاسبه میانگین خطای تقریب

میانگین خطای تقریب با فرمول محاسبه می شود:

کیفیت مدل ساخته شده خوب ارزیابی می شود، زیرا از 8 تا 10 درصد تجاوز نمی کند.

6. از جدول با آمار رگرسیون (شکل 4) مقدار واقعی آزمون F فیشر را می نویسیم:

تا جایی که در سطح معنی داری 5 درصد می توان نتیجه گرفت که معادله رگرسیون معنادار است (رابطه ثابت شده است).

8. برآورد اهمیت آماری پارامترهای رگرسیون با استفاده از آماره t Student و با محاسبه فاصله اطمینان برای هر یک از شاخص ها انجام خواهد شد.

ما فرضیه H 0 را در مورد تفاوت آماری ناچیز شاخص ها از صفر مطرح می کنیم:

.

برای تعداد درجات آزادی

شکل 7 مقادیر واقعی آماره t را نشان می دهد:

آزمون t برای ضریب همبستگی را می توان به دو روش محاسبه کرد:

روش اول:

جایی که - خطای تصادفی ضریب همبستگی.

داده های محاسبه را از جدول شکل 7 می گیریم.

روش دوم:

مقادیر آماری t واقعی نسبت به مقادیر جدولی برتری دارند:

بنابراین، فرضیه H 0 رد می شود، یعنی پارامترهای رگرسیون و ضریب همبستگی به طور تصادفی با صفر تفاوت ندارند، اما از نظر آماری معنادار هستند.

فاصله اطمینان برای پارامتر a به صورت تعریف شده است

برای پارامتر a، کران های 95% همانطور که در شکل 7 نشان داده شده است عبارتند از:

فاصله اطمینان برای ضریب رگرسیون به صورت تعریف شده است

برای ضریب رگرسیون b، کران های 95% همانطور که در شکل 7 نشان داده شده است عبارتند از:

تجزیه و تحلیل مرزهای بالا و پایین فواصل اطمینان به این نتیجه می رسد که با احتمال پارامترهای a و b که در داخل مرزهای مشخص شده قرار دارند، مقادیر صفر را نمی گیرند، یعنی. از نظر آماری معنی دار نیستند و از نظر مادی با صفر تفاوت دارند.

7. برآوردهای به دست آمده از معادله رگرسیون به ما امکان می دهد از آن برای پیش بینی استفاده کنیم. اگر مقدار پیش‌بینی حداقل معیشت:

سپس مقدار پیش‌بینی‌شده حداقل معیشت به صورت زیر خواهد بود:

خطای پیش بینی را با استفاده از فرمول محاسبه می کنیم:

جایی که

ما همچنین واریانس را با استفاده از PPP Excel محاسبه می کنیم. برای این:

1) فعال کنید جادوگر عملکرد: در منوی اصلی انتخاب کنید فرمول ها / درج تابع.

3) محدوده حاوی داده های عددی ویژگی عامل را پر کنید. را کلیک کنید خوب.

شکل 10 محاسبه واریانس

مقدار واریانس را دریافت کرد

برای محاسبه واریانس باقیمانده به ازای درجه آزادی، از نتایج ANOVA همانطور که در شکل 7 نشان داده شده است استفاده می کنیم.

فواصل اطمینان برای پیش بینی مقادیر فردی y در با احتمال 0.95 با عبارت:

این فاصله به اندازه کافی گسترده است، در درجه اول به دلیل حجم کم مشاهدات. در کل، پیش بینی برآورده شده از میانگین حقوق ماهانه قابل اعتماد بود.

شرط مسئله برگرفته از: کارگاه اقتصاد سنجی: کتاب درسی. کمک هزینه / I.I. Eliseeva، S.V. کوریشوا، ن.م. گوردینکو و دیگران؛ اد. I.I. السیوا - M .: امور مالی و آمار، 2003. - 192 ص .: ill.

MS Excel به شما این امکان را می دهد که هنگام ساخت یک معادله رگرسیون خطی، بیشتر کارها را خیلی سریع انجام دهید. درک چگونگی تفسیر نتایج به دست آمده بسیار مهم است. برای ساخت یک مدل رگرسیون، مورد Service \ Data Analysis \ Regression را انتخاب کنید (در Excel 2007 این حالت در بخش Data / Data Analysis / Regression قرار دارد). سپس نتایج به دست آمده را برای تجزیه و تحلیل در بلوک کپی کنید.

اطلاعات اولیه:

نتایج تجزیه و تحلیل

در گزارش لحاظ شود
محاسبه پارامترهای معادله رگرسیون
مطالب نظری
معادله رگرسیون در مقیاس استاندارد
ضریب همبستگی چندگانه (شاخص همبستگی چندگانه)
ضرایب کشسانی جزئی
ارزیابی مقایسه ای تأثیر عوامل تحلیل شده بر شاخص مؤثر (d - ضرایب تعیین جداگانه)

بررسی کیفیت معادله رگرسیون ساخته شده
اهمیت ضرایب رگرسیون b i (آمار t. آزمون دانشجویی)
اهمیت معادله به عنوان یک کل (آمار F. معیار فیشر). ضریب تعیین
آزمون های اف خصوصی

سطح اهمیت 0.005 0.01 0.025 0.05 0.1 0.25 0.4

V برتری داشتنراه سریعتر و راحت تری برای رسم رگرسیون خطی وجود دارد (و حتی انواع اصلی رگرسیون های غیرخطی، همانطور که در زیر بحث شده است). این میتواند بصورت زیر انجام شود:

1) ستون های دارای داده را انتخاب کنید ایکسو Y(آنها باید به این ترتیب باشند!)

2) تماس بگیرید جادوگر نمودارو در گروه انتخاب کنید یک نوعنقطهو بلافاصله فشار دهید آماده;

3) بدون حذف انتخاب از نمودار، مورد ظاهر شده از منوی اصلی را انتخاب کنید نمودار، که در آن باید مورد را انتخاب کنید خط روند را اضافه کنید;

4) در کادر محاوره ای که ظاهر می شود خط رونددر برگه یک نوعانتخاب کنید خطی;

5) در برگه مولفه هایسوئیچ را می توان فعال کرد نمایش معادله در نمودار، که به شما امکان می دهد معادله رگرسیون خطی (4.4) را مشاهده کنید که در آن ضرایب (4.5) محاسبه می شود.

6) در همان تب می توانید سوئیچ را فعال کنید مقدار اطمینان تقریبی (R ^ 2) را روی نمودار قرار دهید... این کمیت مجذور ضریب همبستگی (4.3) است و نشان می دهد که معادله محاسبه شده چقدر وابستگی تجربی را توصیف می کند. اگر آر 2 نزدیک به وحدت است، سپس معادله رگرسیون نظری وابستگی تجربی را به خوبی توصیف می کند (نظریه به خوبی با آزمایش موافق است) و اگر آر 2 نزدیک به صفر است، پس این معادله برای توصیف وابستگی تجربی مناسب نیست (نظریه با آزمایش موافق نیست).

در نتیجه انجام اقدامات توصیف شده، نموداری با نمودار رگرسیون و معادله آن دریافت خواهید کرد.

§4.3. انواع اصلی رگرسیون غیر خطی

رگرسیون سهموی و چند جمله ای

سهمویوابستگی به کمیت Yروی ارزش ایکسوابستگی بیان شده توسط یک تابع درجه دوم (پارابولای مرتبه دوم) نامیده می شود:

این معادله نامیده می شود معادله رگرسیون سهموی Yبر روی ایکس... مولفه های آ, ب, بانامیده می شوند ضرایب رگرسیون سهموی... محاسبه ضرایب رگرسیون سهموی همیشه دست و پا گیر است، بنابراین توصیه می شود از رایانه برای محاسبات استفاده کنید.

معادله (4.8) رگرسیون سهموی یک مورد خاص از یک رگرسیون عمومی تر به نام چند جمله ای است. چند جمله ایوابستگی به کمیت Yروی ارزش ایکسوابستگی بیان شده توسط چند جمله ای نامیده می شود n- مرتبه:

اعداد کجا هستند و من (من=0,1,…, n) نامیده می شوند ضرایب رگرسیون چند جمله ای.

رگرسیون قدرت.

نماییوابستگی به کمیت Yروی ارزش ایکسوابستگی فرم نامیده می شود:

این معادله نامیده می شود معادله رگرسیون توان Yبر روی ایکس... مولفه های آو بنامیده می شوند ضرایب رگرسیون توان.

ln = ln آ+بلوگاریتم ایکس. (4.11)

این معادله یک خط مستقیم را در یک صفحه با محورهای مختصات لگاریتمی ln توصیف می کند. ایکسو ln. بنابراین، معیار کاربردی بودن رگرسیون توانی این شرط است که نقاط لگاریتم داده های تجربی ln x iو ln مننزدیکترین به خط مستقیم بودند (4.11).

رگرسیون نمایی.

نشان دهنده(یا نمایی) با وابستگی به کمیت Yروی ارزش ایکسوابستگی فرم نامیده می شود:

(یا ). (4.12)

این معادله نامیده می شود معادله نمایی(یا نمایی) رگرسیون Yبر روی ایکس... مولفه های آ(یا ک) و بنامیده می شوند نمایی(یا نمایی) رگرسیون ها.

اگر لگاریتم دو طرف معادله رگرسیون توان را بگیریم، معادله را بدست می آوریم.

ln = ایکسلوگاریتم آ+ ln ب(یا ln = k x+ ln ب). (4.13)

این معادله وابستگی خطی لگاریتم یک کمیت ln به کمیت دیگر را توصیف می کند. ایکس... بنابراین، ملاک کاربردی بودن رگرسیون توانی این شرط است که داده های تجربی به یک مقدار اشاره کنند. x iو لگاریتم یک کمیت دیگر ln مننزدیکترین به خط مستقیم بودند (4.13).

رگرسیون لگاریتمی

لگاریتمیوابستگی به کمیت Yروی ارزش ایکسوابستگی فرم نامیده می شود:

=آ+بلوگاریتم ایکس. (4.14)

این معادله نامیده می شود معادله رگرسیون لگاریتمی Yبر روی ایکس... مولفه های آو بنامیده می شوند ضرایب رگرسیون لگاریتمی.

رگرسیون هایپربولیک.

هایپربولیکوابستگی به کمیت Yروی ارزش ایکسوابستگی فرم نامیده می شود:

این معادله نامیده می شود معادله رگرسیون هذلولی Yبر روی ایکس... مولفه های آو بنامیده می شوند ضرایب رگرسیون هایپربولیکو با روش حداقل مربعات تعیین می شوند. استفاده از این روش به فرمول های زیر منجر می شود:

در فرمول های (4.16-4.17)، جمع بر روی شاخص انجام می شود مناز یک به تعداد مشاهدات n.

متاسفانه در برتری داشتنهیچ تابعی وجود ندارد که ضرایب رگرسیون هذلولی را محاسبه کند. در مواردی که از قبل مشخص نیست که مقادیر اندازه گیری شده با نسبت معکوس مرتبط هستند، توصیه می شود به جای معادله رگرسیون هذلولی به دنبال معادله رگرسیون توان بگردید. برتری داشتنروشی برای یافتن آن وجود دارد. اگر یک وابستگی هذلولی بین مقادیر اندازه گیری شده در نظر گرفته شود، ضرایب رگرسیون آن باید با استفاده از جداول محاسبه کمکی و عملیات جمع با استفاده از فرمول های (4.16-4.17) محاسبه شود.

مقالات مرتبط برتر