Analiza e regresionit të korrelacionit të shumëfishtë në excel. Detyrat bazë të regresionit në Excel: shembull i ndërtimit të modelit

31.08.2019 Siguria

Analiza e regresionit dhe korrelacionit janë metoda kërkimore statistikore. Këto janë mënyrat më të zakonshme për të treguar varësinë e një parametri nga një ose më shumë variabla të pavarur.

Më poshtë, duke përdorur shembuj konkretë praktikë, do të shqyrtojmë këto dy analiza shumë të njohura midis ekonomistëve. Ne gjithashtu do të japim një shembull të marrjes së rezultateve kur i kombinojmë ato.

Analiza e regresionit në Excel

Tregon ndikimin e disa vlerave (të pavarura, të pavarura) në variablin e varur. Për shembull, si varet numri i popullsisë ekonomikisht aktive nga numri i ndërmarrjeve, pagat dhe parametrat e tjerë. Ose: si ndikojnë në nivelin e PBB-së investimet e huaja, çmimet e energjisë etj.

Rezultati i analizës ju lejon të nënvizoni përparësitë. Dhe bazuar në faktorët kryesorë, parashikoni, planifikoni zhvillimin e fushave prioritare dhe merrni vendime menaxheriale.

Regresioni ndodh:

lineare (y = a + bx);
parabolike (y = a + bx + cx 2);
eksponencial (y = a * exp(bx));
fuqia (y = a*x^b);
hiperbolike (y = b/x + a);
logaritmike (y = b * 1n(x) + a);
eksponencial (y = a * b^x).

Le të shohim një shembull të ndërtimit të një modeli regresioni në Excel dhe interpretimit të rezultateve. Le të marrim llojin linear të regresionit.

Detyrë. Në 6 ndërmarrje u analizua paga mesatare mujore dhe numri i punonjësve të larguar nga puna. Është e nevojshme të përcaktohet varësia e numrit të punonjësve që largohen nga paga mesatare.

Modeli i regresionit linear duket si ky:

Y = a 0 + a 1 x 1 +…+a k x k.

Ku a janë koeficientët e regresionit, x janë variabla ndikues, k është numri i faktorëve.

Në shembullin tonë, Y është treguesi i largimit nga punonjësit. Faktori ndikues është paga (x).

Excel ka funksione të integruara që mund t'ju ndihmojnë të llogaritni parametrat e një modeli të regresionit linear. Por shtesa "Paketa e analizës" do ta bëjë këtë më shpejt.

Ne aktivizojmë një mjet të fuqishëm analitik:

Pasi të aktivizohet, shtesa do të jetë e disponueshme në skedën e të dhënave.

Tani le të bëjmë vetë analizën e regresionit.

Para së gjithash, ne i kushtojmë vëmendje katrorit R dhe koeficientëve.

R-katror është koeficienti i përcaktimit. Në shembullin tonë - 0,755, ose 75,5%. Kjo do të thotë se parametrat e llogaritur të modelit shpjegojnë 75.5% të marrëdhënies ndërmjet parametrave të studiuar. Sa më i lartë të jetë koeficienti i përcaktimit, aq më i mirë është modeli. Mirë - mbi 0.8. E keqe - më pak se 0.5 (një analizë e tillë vështirë se mund të konsiderohet e arsyeshme). Në shembullin tonë - "jo keq".

Koeficienti 64.1428 tregon se çfarë do të jetë Y nëse të gjitha variablat në modelin në shqyrtim janë të barabartë me 0. Kjo do të thotë, vlera e parametrit të analizuar ndikohet edhe nga faktorë të tjerë që nuk janë përshkruar në model.

Koeficienti -0,16285 tregon peshën e variablit X në Y. Kjo do të thotë se paga mesatare mujore brenda këtij modeli ndikon në numrin e të larguarve me peshën -0,16285 (kjo është një shkallë e vogël ndikimi). Shenja "-" tregon një ndikim negativ: sa më e lartë të jetë paga, aq më pak njerëz e lënë. E cila është e drejtë.

Analiza e korrelacionit në Excel

Analiza e korrelacionit ndihmon në përcaktimin nëse ka një lidhje midis treguesve në një ose dy mostra. Për shembull, midis kohës së funksionimit të një makinerie dhe kostos së riparimeve, çmimit të pajisjeve dhe kohëzgjatjes së funksionimit, gjatësisë dhe peshës së fëmijëve, etj.

Nëse ka një lidhje, atëherë rritja e njërit parametër a çon në një rritje (korrelacion pozitiv) ose një ulje (negative) të tjetrit. Analiza e korrelacionit e ndihmon analistin të përcaktojë nëse vlera e një treguesi mund të përdoret për të parashikuar vlerën e mundshme të një tjetri.

Koeficienti i korrelacionit shënohet me r. Ndryshon nga +1 në -1. Klasifikimi i korrelacioneve për fusha të ndryshme do të jetë i ndryshëm. Kur koeficienti është 0, nuk ka lidhje lineare midis mostrave.

Le të shohim se si të gjejmë koeficientin e korrelacionit duke përdorur Excel.

Për të gjetur koeficientët e çiftuar, përdoret funksioni CORREL.

Objektivi: Përcaktoni nëse ka një lidhje midis kohës së funksionimit të një torno dhe kostos së mirëmbajtjes së saj.

Vendosni kursorin në çdo qelizë dhe shtypni butonin fx.

Në kategorinë "Statistikore", zgjidhni funksionin CORREL.
Argumenti "Array 1" - diapazoni i parë i vlerave - koha e funksionimit të makinës: A2:A14.
Argumenti "Array 2" - diapazoni i dytë i vlerave - kostoja e riparimit: B2:B14. Klikoni OK.

Për të përcaktuar llojin e lidhjes, duhet të shikoni numrin absolut të koeficientit (çdo fushë e veprimtarisë ka shkallën e vet).

Për analizën e korrelacionit të disa parametrave (më shumë se 2), është më i përshtatshëm të përdoret "Analiza e të dhënave" (shtesa "Paketa e Analizës"). Ju duhet të zgjidhni korrelacionin nga lista dhe të caktoni grupin. Të gjitha.

Koeficientët rezultues do të shfaqen në matricën e korrelacionit. Si kjo:

Analiza e korrelacionit dhe e regresionit

Në praktikë, këto dy teknika shpesh përdoren së bashku.

Shembull:

Tani të dhënat e analizës së regresionit janë bërë të dukshme.

Ndërtimi i regresionit linear, vlerësimi i parametrave të tij dhe rëndësia e tyre mund të kryhet shumë më shpejt kur përdoret paketa e analizës Excel (Regresioni). Le të shqyrtojmë interpretimin e rezultateve të marra në rastin e përgjithshëm ( k variablat shpjegues) sipas shembullit 3.6.

Ne tavoline statistikat e regresionit jepen vlerat e mëposhtme:

Të shumëfishta R – koeficienti i korrelacionit të shumëfishtë;

R- katrore– koeficienti i përcaktimit R 2 ;

Normalizuar R - katrore- rregulluar R 2 përshtatur për numrin e shkallëve të lirisë;

Gabim standard– Gabim standard i regresionit S;

Vëzhgimet - numri i vëzhgimeve n.

Ne tavoline Analiza e variancës janë dhënë:

1. Kolona df - numri i shkallëve të lirisë është i barabartë me

për vargun Regresioni df = k;

për vargun Pjesa e mbeturdf = n – k – 1;

për vargun Totaldf = n– 1.

2. Kolona SS - shuma e devijimeve në katror e barabartë me

për vargun Regresioni ;

për vargun Pjesa e mbetur ;

për vargun Total .

3. Kolona ZNJ variancat e përcaktuara nga formula ZNJ = SS/df:

për vargun Regresioni– dispersioni i faktorit;

për vargun Pjesa e mbetur– varianca e mbetur.

4. Kolona F – vlera e llogaritur F-kriteri i llogaritur duke përdorur formulën

F = ZNJ(regresion)/ ZNJ(mbetja).

5. Kolona Rëndësia F – vlera e nivelit të rëndësisë që korrespondon me atë të llogaritur F-statistikat .

Rëndësia F= FDIST( F- statistika, df(regresioni), df(mbetja)).

Nëse rëndësia F < стандартного уровня значимости, то R 2 është statistikisht i rëndësishëm.

	Shanset	Gabim standard	t-statistikat	P-vlera	95% e poshtme	95% e lartë
Y	65,92	11,74	5,61	0,00080	38,16	93,68
X	0,107	0,014	7,32	0,00016	0,0728	0,142

Kjo tabelë tregon:

1. Shanset– vlerat e koeficientit a, b.

2. Gabim standard– gabimet standarde të koeficientëve të regresionit S a, S b.

3. t- statistikat– vlerat e llogaritura t - kriteret e llogaritura me formulën:

t-statistika = Koeficientët/Gabimi standard.

4.R-vlera (rëndësia t) është vlera e nivelit të rëndësisë që korrespondon me të llogaritur t- statistikat.

R-vlera = STUDIST(t- statistikat, df(mbetja)).

Nëse R- kuptimi< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5. 95% e poshtme dhe 95% e lartë– kufijtë e poshtëm dhe të sipërm të intervaleve të besimit 95% për koeficientët e ekuacionit teorik të regresionit linear.

TËRHEQJA E PJESËS SË PJESËS
Vrojtim	Parashikuar y	Mbetjet e
	72,70	-29,70
	82,91	-20,91
	94,53	-4,53
	105,72	5,27
	117,56	12,44
	129,70	19,29
	144,22	20,77
	166,49	24,50
	268,13	-27,13

Ne tavoline TËRHEQJA E PJESËS SË PJESËS treguar:

në kolonë Vrojtim– numri i vëzhgimit;

në kolonë e parathënë y – vlerat e llogaritura të ndryshores së varur;

në kolonë Mbetjet e - diferenca midis vlerave të vëzhguara dhe të llogaritura të ndryshores së varur.

Shembulli 3.6. Ekzistojnë të dhëna (njësi konvencionale) për kostot e ushqimit y dhe të ardhurat për frymë x për nëntë grupe familjesh:

x
y

Duke përdorur rezultatet e paketës së analizës Excel (Regresioni), do të analizojmë varësinë e kostove të ushqimit nga të ardhurat për frymë.

Rezultatet e analizës së regresionit zakonisht shkruhen në formën:

ku gabimet standarde të koeficientëve të regresionit tregohen në kllapa.

Koeficientët e regresionit A = 65,92 dhe b= 0,107. Drejtimi i komunikimit ndërmjet y Dhe x përcakton shenjën e koeficientit të regresionit b= 0,107, d.m.th. lidhja është e drejtpërdrejtë dhe pozitive. Koeficient b= 0.107 tregon se me një rritje të të ardhurave për frymë me 1 konvencionale. njësi kostot e ushqimit rriten me 0.107 njësi konvencionale. njësi

Le të vlerësojmë rëndësinë e koeficientëve të modelit që rezulton. Rëndësia e koeficientëve ( a, b) kontrollohet nga t-test:

P-vlera ( a) = 0,00080 < 0,01 < 0,05

P-vlera ( b) = 0,00016 < 0,01 < 0,05,

prandaj, koeficientët ( a, b) janë të rëndësishme në nivelin 1%, dhe aq më tepër në nivelin e rëndësisë 5%. Kështu, koeficientët e regresionit janë domethënës dhe modeli është adekuat me të dhënat origjinale.

Rezultatet e vlerësimit të regresionit janë në përputhje jo vetëm me vlerat e marra të koeficientëve të regresionit, por edhe me një grup të caktuar të tyre (intervali i besimit). Me një probabilitet prej 95%, intervalet e besimit për koeficientët janë (38.16 – 93.68) për a dhe (0,0728 – 0,142) për b.

Cilësia e modelit vlerësohet nga koeficienti i përcaktimit R 2 .

Madhësia R 2 = 0,884 do të thotë se faktori i të ardhurave për frymë mund të shpjegojë 88,4% të variacionit (shpërndarjes) në shpenzimet e ushqimit.

Rëndësia R 2 kontrollohet nga F- test: rëndësi F = 0,00016 < 0,01 < 0,05, следовательно, R 2 është i rëndësishëm në nivelin 1%, dhe aq më tepër në nivelin e rëndësisë 5%.

Në rastin e regresionit linear në çift, koeficienti i korrelacionit mund të përkufizohet si . Vlera e përftuar e koeficientit të korrelacionit tregon se lidhja ndërmjet shpenzimeve ushqimore dhe të ardhurave për frymë është shumë e ngushtë.

Për territoret e rajonit jepen të dhëna për 200X.

Numri i rajonit	Paga mesatare e jetesës për frymë në ditë e një personi të aftë për punë, rubla, x	Paga mesatare ditore, rubla, y
1	78	133
2	82	148
3	87	134
4	79	154
5	89	162
6	106	195
7	67	139
8	88	158
9	73	152
10	87	162
11	76	159
12	115	173

Ushtrimi:

1. Ndërtoni një fushë korrelacioni dhe formuloni një hipotezë për formën e lidhjes.

2. Llogaritni parametrat e ekuacionit të regresionit linear

4. Duke përdorur koeficientin mesatar të elasticitetit (të përgjithshëm), jepni një vlerësim krahasues të forcës së marrëdhënies ndërmjet faktorit dhe rezultatit.

7. Llogaritni vlerën e parashikuar të rezultatit nëse vlera e parashikuar e faktorit rritet me 10% nga niveli mesatar i tij. Përcaktoni intervalin e besimit të parashikimit për nivelin e rëndësisë.

Zgjidhja:

Le ta zgjidhim këtë problem duke përdorur Excel.

1. Duke krahasuar të dhënat e disponueshme x dhe y, për shembull, duke i renditur ato në rend rritës të faktorit x, mund të vërehet prania e një lidhjeje të drejtpërdrejtë midis karakteristikave, kur një rritje e nivelit mesatar të jetesës për frymë rrit mesataren ditore. pagë. Bazuar në këtë, mund të supozojmë se marrëdhënia midis karakteristikave është e drejtpërdrejtë dhe mund të përshkruhet me një ekuacion të drejtë. I njëjti përfundim konfirmohet në bazë të analizave grafike.

Për të ndërtuar një fushë korrelacioni, mund të përdorni Excel PPP. Futni të dhënat fillestare në sekuencë: së pari x, pastaj y.

Zgjidhni zonën e qelizave që përmban të dhëna.

Pastaj zgjidhni: Insert / Scatter Plot / Scatter with Markers siç tregohet në figurën 1.

Figura 1 Ndërtimi i fushës së korrelacionit

Analiza e fushës së korrelacionit tregon praninë e një varësie të afërt drejtvizore, pasi pikat janë të vendosura pothuajse në një vijë të drejtë.

2. Të llogariten parametrat e ekuacionit të regresionit linear
Le të përdorim funksionin statistikor të integruar LINEST.

Për këtë:

1) Hapni një skedar ekzistues që përmban të dhënat e analizuara;
2) Zgjidhni një zonë 5x2 me qeliza boshe (5 rreshta, 2 kolona) për të shfaqur rezultatet e statistikave të regresionit.
3) Aktivizoni Funksioni Wizard: në menynë kryesore zgjidhni Formulat / Funksioni i Futjes.
4) Në dritare Kategoria ju jeni duke marrë Statistikore, në dritaren e funksionit - LINEST. Klikoni butonin Ne rregull siç tregohet në figurën 2;

Figura 2 Kutia e dialogut të magjistarit të funksionit

5) Plotësoni argumentet e funksionit:

Vlerat e njohura për

Vlerat e njohura të x

Konstante- një vlerë logjike që tregon praninë ose mungesën e një termi të lirë në ekuacion; nëse Konstanta = 1, atëherë termi i lirë llogaritet në mënyrën e zakonshme, nëse Konstanta = 0, atëherë termi i lirë është 0;

Statistikat- një vlerë logjike që tregon nëse duhet të shfaqet informacion shtesë për analizën e regresionit apo jo. Nëse Statistikat = 1, atëherë shfaqen informacione shtesë, nëse Statistikat = 0, atëherë shfaqen vetëm vlerësimet e parametrave të ekuacionit.

Klikoni butonin Ne rregull;

Figura 3 Kutia e dialogut e argumenteve të funksionit LINEST

6) Elementi i parë i tabelës përfundimtare do të shfaqet në qelizën e sipërme të majtë të zonës së zgjedhur. Për të hapur të gjithë tabelën, shtypni tastin , dhe më pas te kombinimi i tasteve ++ .

Statistikat shtesë të regresionit do të dalin sipas rendit të treguar në diagramin e mëposhtëm:

Vlera e koeficientit b	Koeficienti i një vlere
Gabim standard b	Gabim standard a
Gabim standard y
F-statistika
Shuma e regresionit të katrorëve

Figura 4 Rezultati i llogaritjes së funksionit LINEST

Ne morëm nivelin e regresionit:

Përfundojmë: Me një rritje të nivelit mesatar të jetesës për frymë me 1 rubla. paga mesatare ditore rritet me një mesatare prej 0.92 rubla.

Kjo do të thotë se 52% e variacionit në paga (y) shpjegohet nga variacioni i faktorit x - paga mesatare e jetesës për frymë, dhe 48% - nga veprimi i faktorëve të tjerë që nuk përfshihen në model.

Duke përdorur koeficientin e llogaritur të përcaktimit, mund të llogaritet koeficienti i korrelacionit: .

Lidhja vlerësohet si e ngushtë.

4. Duke përdorur koeficientin mesatar (të përgjithshëm) të elasticitetit, ne përcaktojmë forcën e ndikimit të faktorit në rezultat.

Për një ekuacion të drejtë, ne përcaktojmë koeficientin mesatar (total) të elasticitetit duke përdorur formulën:

Ne do të gjejmë vlerat mesatare duke zgjedhur zonën e qelizave me vlera x dhe duke zgjedhur Formulat / AutoSum / Mesatare, dhe ne do të bëjmë të njëjtën gjë me vlerat e y.

Figura 5 Llogaritja e vlerave mesatare të funksionit dhe argumentit

Kështu, nëse kostoja mesatare e jetesës për frymë ndryshon me 1% nga vlera mesatare e saj, paga mesatare ditore do të ndryshojë mesatarisht me 0.51%.

Duke përdorur një mjet për analizën e të dhënave Regresioni në dispozicion:
- rezultatet e statistikave të regresionit,
- rezultatet e analizës së variancës,
- rezultatet e intervaleve të besimit,
- mbetjet dhe grafikët e përshtatjes së vijës së regresionit,
- mbetjet dhe probabiliteti normal.

Procedura është si më poshtë:

1) kontrolloni aksesin në Paketa e analizës. Në menunë kryesore, zgjidhni: Skedari/Opsionet/Shtesat.

2) Në listën rënëse Kontrolli zgjidhni artikullin Shtesat në Excel dhe shtypni butonin Shkoni.

3) Në dritare Shtesa kontrolloni kutinë Paketa e analizës dhe pastaj klikoni butonin Ne rregull.

Nëse Paketa e analizës jo në listën e fushës Shtesa të disponueshme, Shtyp butonin Rishikimi për të kryer një kërkim.

Nëse merrni një mesazh që tregon se paketa e analizës nuk është e instaluar në kompjuterin tuaj, klikoni po për ta instaluar atë.

4) Në menunë kryesore, zgjidhni: Të dhënat / Analiza e të dhënave / Mjetet e analizës / Regresioni dhe pastaj klikoni butonin Ne rregull.

5) Plotësoni kutinë e dialogut të parametrave të hyrjes dhe daljes së të dhënave:

Intervali i hyrjes Y- vargu që përmban të dhëna të atributit rezultant;

Intervali i hyrjes X- diapazoni që përmban të dhëna të karakteristikës së faktorit;

Etiketat- një flamur që tregon nëse rreshti i parë përmban emrat e kolonave apo jo;

Konstante - zero- një flamur që tregon praninë ose mungesën e një termi të lirë në ekuacion;

Intervali i daljes- mjafton të tregohet qeliza e sipërme e majtë e diapazonit të ardhshëm;

6) Fletë e re pune - mund të specifikoni një emër arbitrar për fletën e re.

Pastaj klikoni butonin Ne rregull.

Figura 6 Kutia e dialogut për futjen e parametrave për mjetin Regresion

Rezultatet e analizës së regresionit për të dhënat e problemit janë paraqitur në Figurën 7.

Figura 7 Rezultati i përdorimit të mjetit të regresionit

5. Le të vlerësojmë cilësinë e ekuacioneve duke përdorur gabimin mesatar të përafrimit. Le të përdorim rezultatet e analizës së regresionit të paraqitur në Figurën 8.

Figura 8 Rezultati i përdorimit të mjetit të regresionit “Tërheqja e mbetjes”

Le të krijojmë një tabelë të re siç tregohet në figurën 9. Në kolonën C, ne llogarisim gabimin relativ të përafrimit duke përdorur formulën:

Figura 9 Llogaritja e gabimit mesatar të përafrimit

Gabimi mesatar i përafrimit llogaritet duke përdorur formulën:

Cilësia e modelit të ndërtuar vlerësohet si e mirë, pasi nuk kalon 8 - 10%.

6. Nga tabela me statistikat e regresionit (Figura 4) shkruajmë vlerën aktuale të testit F të Fisher:

Sepse në një nivel të rëndësisë 5%, atëherë mund të konkludojmë se ekuacioni i regresionit është domethënës (lidhja është vërtetuar).

8. Ne do të vlerësojmë rëndësinë statistikore të parametrave të regresionit duke përdorur statistikat t-student dhe duke llogaritur intervalin e besimit të secilit tregues.

Ne parashtruam hipotezën H 0 për një ndryshim statistikisht të parëndësishëm midis treguesve dhe zeros:

për numrin e shkallëve të lirisë

Figura 7 ka vlerat aktuale t-statistikore:

T-testi për koeficientin e korrelacionit mund të llogaritet në dy mënyra:

Metoda I:

Ku - gabim i rastësishëm i koeficientit të korrelacionit.

Të dhënat për llogaritje do t'i marrim nga tabela në Figurën 7.

Metoda II:

Vlerat aktuale të statistikave t tejkalojnë vlerat e tabelës:

Prandaj, hipoteza H 0 hidhet poshtë, domethënë parametrat e regresionit dhe koeficienti i korrelacionit nuk ndryshojnë rastësisht nga zero, por janë statistikisht të rëndësishëm.

Intervali i besimit për parametrin a përcaktohet si

Për parametrin a, kufijtë 95% siç tregohen në figurën 7 ishin:

Intervali i besimit për koeficientin e regresionit përcaktohet si

Për koeficientin e regresionit b, kufijtë 95% siç tregohen në Figurën 7 ishin:

Analiza e kufijve të sipërm dhe të poshtëm të intervaleve të besimit të çon në përfundimin se me probabilitet parametrat a dhe b, duke qenë brenda kufijve të specifikuar, nuk marrin vlera zero, d.m.th. nuk janë statistikisht të parëndësishme dhe dukshëm të ndryshme nga zero.

7. Vlerësimet e marra të ekuacionit të regresionit lejojnë që ai të përdoret për parashikim. Nëse kostoja e parashikuar e jetesës është:

Atëherë vlera e parashikuar e kostos së jetesës do të jetë:

Ne llogarisim gabimin e parashikimit duke përdorur formulën:

Ne gjithashtu do të llogarisim variancën duke përdorur Excel PPP. Për këtë:

1) Aktivizoni Funksioni Wizard: në menynë kryesore zgjidhni Formulat / Funksioni i Futjes.

3) Plotësoni diapazonin që përmban të dhënat numerike të karakteristikës së faktorit. Klikoni Ne rregull.

Figura 10 Llogaritja e variancës

Ne morëm vlerën e variancës

Për të llogaritur variancën e mbetur për shkallë lirie, ne do të përdorim rezultatet e analizës së variancës siç tregohet në figurën 7.

Intervalet e besimit për parashikimin e vlerave individuale të y me një probabilitet prej 0,95 përcaktohen nga shprehja:

Intervali është mjaft i gjerë, kryesisht për shkak të vëllimit të vogël të vëzhgimeve. Në përgjithësi, parashikimi për pagën mesatare mujore doli i besueshëm.

Gjendja e problemit është marrë nga: Workshop on econometrics: Proc. shtesa / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko dhe të tjerët; Ed. I.I. Eliseeva. - M.: Financa dhe Statistika, 2003. - 192 f.: ill.

Paketa MS Excel ju lejon të bëni shumicën e punës shumë shpejt kur ndërtoni një ekuacion linear regresioni. Është e rëndësishme të kuptohet se si të interpretohen rezultatet e marra. Për të ndërtuar një model regresioni, duhet të zgjidhni Tools\Analiza e të dhënave\Regresioni (në Excel 2007 ky modalitet është në bllokun Data/Analysis/Regresion). Pastaj kopjoni rezultatet në një bllok për analizë.

Të dhënat fillestare:

Rezultatet e analizës

Përfshi në raport
Llogaritja e parametrave të ekuacionit të regresionit
Materiali teorik
Ekuacioni i regresionit në shkallë standarde
Koeficienti i korrelacionit të shumëfishtë (Indeksi i korrelacionit të shumëfishtë)
Koeficientët e elasticitetit të pjesshëm
Vlerësimi krahasues i ndikimit të faktorëve të analizuar në karakteristikën që rezulton (d - koeficientët e përcaktimit të veçantë)

Kontrollimi i cilësisë së ekuacionit të regresionit të ndërtuar
Rëndësia e koeficientëve të regresionit b i (statistika t. Testi i studentit)
Rëndësia e ekuacionit në tërësi (F-statistika. Testi i Fisher-it). Koeficienti i përcaktimit
F-teste të pjesshme

Niveli i rëndësisë 0.005 0.01 0.025 0.05 0.1 0.25 0.4

NË Excel Ekziston një mënyrë edhe më e shpejtë dhe më e përshtatshme për të hartuar regresionin linear (dhe madje edhe llojet kryesore të regresioneve jolineare, siç diskutohet më poshtë). Kjo mund të bëhet si më poshtë:

1) zgjidhni kolonat me të dhëna X Dhe Y(ata duhet të jenë në atë rend!);

2) telefononi Magjistari i grafikut dhe zgjidhni në grup Lloji – Vend dhe shtypni menjëherë Gati;

3) pa hequr zgjedhjen e diagramit, zgjidhni artikullin e menysë kryesore që shfaqet Diagramë, në të cilin duhet të zgjidhni artikullin Shtoni një linjë trendi;

4) në kutinë e dialogut që shfaqet Linja e trendit në skedën Lloji zgjidhni Linear;

5) në skedën Opsione mund të aktivizoni çelësin Trego ekuacionin në diagram, i cili do t'ju lejojë të shihni ekuacionin e regresionit linear (4.4), në të cilin do të llogariten koeficientët (4.5).

6) Në të njëjtën skedë mund të aktivizoni çelësin Vendosni vlerën e besueshmërisë së përafrimit (R^2) në diagram. Kjo vlerë është katrori i koeficientit të korrelacionit (4.3) dhe tregon se sa mirë ekuacioni i llogaritur përshkruan varësinë eksperimentale. Nëse R 2 është afër unitetit, atëherë ekuacioni teorik i regresionit përshkruan mirë varësinë eksperimentale (teoria pajtohet mirë me eksperimentin), dhe nëse R 2 është afër zeros, atëherë ky ekuacion nuk është i përshtatshëm për të përshkruar varësinë eksperimentale (teoria nuk pajtohet me eksperimentin).

Si rezultat i kryerjes së veprimeve të përshkruara, do të merrni një diagram me një grafik regresioni dhe ekuacionin e tij.

§4.3. Llojet kryesore të regresionit jolinear

Regresioni parabolik dhe polinom.

Parabolike varësia e vlerës Y nga madhësia X quhet një varësi e shprehur nga një funksion kuadratik (parabola e rendit të dytë):

Ky ekuacion quhet ekuacioni i regresionit parabolik Y në X. Opsione A, b, Me quhen koeficientët e regresionit parabolik. Llogaritja e koeficientëve të regresionit parabolik është gjithmonë e rëndë, kështu që rekomandohet përdorimi i një kompjuteri për llogaritjet.

Ekuacioni (4.8) i regresionit parabolik është një rast i veçantë i një regresioni më të përgjithshëm të quajtur polinom. Polinom varësia e vlerës Y nga madhësia X quhet varësi e shprehur me një polinom n- urdhri:

ku janë numrat edhe une (i=0,1,…, n) quhen koeficientët e regresionit polinom.

Regresioni i fuqisë.

Fuqia varësia e vlerës Y nga madhësia X quhet varësi e formës:

Ky ekuacion quhet ekuacioni i regresionit të fuqisë Y në X. Opsione A Dhe b quhen koeficientët e regresionit të fuqisë.

ln =ln a+b· ln x. (4.11)

Ky ekuacion përshkruan një vijë të drejtë në një plan me boshte koordinative logaritmike ln x dhe ln. Prandaj, kriteri për zbatueshmërinë e regresionit të fuqisë është kërkesa që pikat e logaritmeve të të dhënave empirike ln x i dhe ln y i ishin më afër vijës së drejtë (4.11).

Regresioni eksponencial.

Indikative(ose eksponenciale) varësia e vlerës Y nga madhësia X quhet varësi e formës:

(ose ). (4.12)

Ky ekuacion quhet ekuacioni eksponencial(ose eksponenciale) regresioni Y në X. Opsione A(ose k) Dhe b quhen koeficientët eksponencialë(ose eksponenciale) regresioni.

Nëse marrim logaritmin e të dy anëve të ekuacionit të regresionit të fuqisë, marrim ekuacionin

ln = x ln a+ln b(ose ln = k x+ln b). (4.13)

Ky ekuacion përshkruan varësinë lineare të logaritmit të një sasie ln nga një sasi tjetër x. Prandaj, kriteri për zbatueshmërinë e regresionit të fuqisë është kërkesa që të dhënat empirike të tregojnë të njëjtën vlerë x i dhe logaritmet e një sasie tjetër ln y i ishin më afër vijës së drejtë (4.13).

Regresioni logaritmik.

Logaritmike varësia e vlerës Y nga madhësia X quhet varësi e formës:

=a+b· ln x. (4.14)

Ky ekuacion quhet ekuacioni i regresionit logaritmik Y në X. Opsione A Dhe b quhen koeficientët e regresionit logaritmik.

Regresioni hiperbolik.

Hiperbolike varësia e vlerës Y nga madhësia X quhet varësi e formës:

Ky ekuacion quhet ekuacioni i regresionit hiperbolik Y në X. Opsione A Dhe b quhen koeficientët e regresionit hiperbolik dhe përcaktohen me metodën e katrorëve më të vegjël. Aplikimi i kësaj metode çon në formulat:

Në formulat (4.16-4.17) përmbledhja kryhet mbi indeksin i nga një në numrin e vëzhgimeve n.

Fatkeqësisht, në Excel nuk ka funksione që llogaritin koeficientët e regresionit hiperbolik. Në rastet kur nuk dihet që sasitë e matura janë të lidhura me proporcion të zhdrejtë, rekomandohet të kërkohet një ekuacion i regresionit të fuqisë në vend të ekuacionit të regresionit hiperbolik, kështu që në Excel ekziston një procedurë për gjetjen e saj. Nëse supozohet një varësi hiperbolike midis sasive të matura, atëherë koeficientët e tij të regresionit do të duhet të llogariten duke përdorur tabela llogaritëse ndihmëse dhe operacionet e mbledhjes duke përdorur formulat (4.16-4.17).

Numri i rajonit	Paga mesatare e jetesës për frymë në ditë e një personi të aftë për punë, rubla, x	Paga mesatare ditore, rubla, y
1	78	133
2	82	148
3	87	134
4	79	154
5	89	162
6	106	195
7	67	139
8	88	158
9	73	152
10	87	162
11	76	159
12	115	173

Numri i rajonit	Paga mesatare e jetesës për frymë në ditë e një personi të aftë për punë, rubla, x	Paga mesatare ditore, rubla, y
1	78	133
2	82	148
3	87	134
4	79	154
5	89	162
6	106	195
7	67	139
8	88	158
9	73	152
10	87	162
11	76	159
12	115	173