Cum se configurează smartphone-uri și PC-uri. Portal informativ
  • Acasă
  • Siguranță
  • Analiza de regresie a corelațiilor multiple în Excel. Sarcini de regresie de bază în Excel: un exemplu de construire a unui model

Analiza de regresie a corelațiilor multiple în Excel. Sarcini de regresie de bază în Excel: un exemplu de construire a unui model

Analiza de regresie și corelație - metode de cercetare statistică. Acestea sunt cele mai comune moduri de a arăta cum un parametru depinde de una sau mai multe variabile independente.

Mai jos, folosind exemple practice specifice, vom lua în considerare aceste două analize care sunt foarte populare în rândul economiștilor. Și, de asemenea, vom da un exemplu de obținere a rezultatelor atunci când acestea sunt combinate.

Analiza de regresie în Excel

Afișează efectul unor valori (independente, independente) asupra variabilei dependente. De exemplu, modul în care numărul populației active din punct de vedere economic depinde de numărul de întreprinderi, de mărimea salariilor și de alți parametri. Sau: cum afectează investițiile străine, prețurile la energie etc. nivelul PIB-ului.

Rezultatul analizei vă permite să stabiliți priorități. Și pe baza factorilor principali, anticipați, planificați dezvoltarea zonelor prioritare, luați decizii de management.

Are loc regresia:

  • liniară (y = a + bx);
  • parabolic (y = a + bx + cx 2);
  • exponențial (y = a * exp (bx));
  • putere (y = a * x ^ b);
  • hiperbolic (y = b / x + a);
  • logaritmică (y = b * 1n (x) + a);
  • exponențial (y = a * b ^ x).

Să ne uităm la un exemplu de construire a unui model de regresie în Excel și de interpretare a rezultatelor. Să luăm un tip de regresie liniară.

Sarcină. La 6 întreprinderi s-a analizat salariul mediu lunar și numărul de angajați care au demisionat. Este necesar să se determine dependența numărului de angajați care renunță la salariul mediu.

Modelul de regresie liniară este următorul:

Y = a 0 + a 1 x 1 + ... + a k x k.

Unde a - coeficienți de regresie, x - variabile de influență, k - numărul de factori.

În exemplul nostru, Y este indicatorul angajaților care au demisionat. Factorul de influență este salariul (x).

Excel are funcții încorporate pe care le puteți utiliza pentru a calcula parametrii unui model de regresie liniară. Dar programul de completare Analysis Package o va face mai repede.

Activăm un instrument analitic puternic:

La activare, programul de completare va fi disponibil în fila „Date”.

Acum să trecem direct la analiza de regresie.



În primul rând, acordați atenție pătratului R și coeficienților.

R-pătratul este coeficientul de determinare. În exemplul nostru - 0,755 sau 75,5%. Aceasta înseamnă că parametrii calculați ai modelului explică relația dintre parametrii studiați cu 75,5%. Cu cât coeficientul de determinare este mai mare, cu atât modelul este mai bun. Bun - peste 0,8. Rău - mai puțin de 0,5 (o astfel de analiză nu poate fi considerată rezonabilă). În exemplul nostru - „nu e rău”.

Coeficientul 64,1428 arată ce va fi Y dacă toate variabilele din modelul luat în considerare sunt egale cu 0. Adică alți factori care nu sunt descriși în model afectează și valoarea parametrului analizat.

Coeficientul -0,16285 arată ponderea variabilei X pe Y. Adică salariul mediu lunar în cadrul acestui model afectează numărul de persoane care pleacă cu o pondere de -0,16285 (acesta este un grad mic de influență). Semnul „-” indică un impact negativ: cu cât salariul este mai mare, cu atât mai puțini renunțări. Ceea ce este corect.



Analiza corelației în Excel

Analiza corelației ajută la stabilirea dacă există o relație între indicatorii din unul sau două eșantioane. De exemplu, între timpul de funcționare al mașinii și costul reparațiilor, prețul echipamentului și durata de funcționare, înălțimea și greutatea copiilor etc.

Dacă există o relație, atunci dacă o creștere a unui parametru duce la o creștere (corelație pozitivă) sau o scădere (negativă) a celuilalt. Analiza corelației ajută analistul să determine dacă valoarea unui indicator poate prezice valoarea posibilă a altuia.

Coeficientul de corelație se notează cu r. Variază de la +1 la -1. Clasificarea corelațiilor pentru diferite zone va fi diferită. Când coeficientul este 0, nu există o relație liniară între eșantioane.

Să vedem cum să folosiți instrumentele Excel pentru a găsi coeficientul de corelație.

Pentru a găsi coeficienți perechi, este utilizată funcția CORREL.

Obiectiv: Determinați dacă există o relație între timpul de funcționare al strungului și costul întreținerii acestuia.

Punem cursorul în orice celulă și apăsăm butonul fx.

  1. În categoria „Statistică”, selectați funcția CORREL.
  2. Argumentul matricei 1 - primul interval de valori - timpul de funcționare a mașinii: A2: A14.
  3. Argumentul matricei 2 - al doilea interval de valori - costul reparației: B2: B14. Faceți clic pe OK.

Pentru a determina tipul de conexiune, trebuie să vă uitați la numărul absolut al coeficientului (fiecare domeniu de activitate are propria sa scară).

Pentru analiza corelației mai multor parametri (mai mult de 2), este mai convenabil să utilizați Data Analysis (complementul Analysis Package). În listă, trebuie să selectați o corelație și să desemnați o matrice. Tot.

Coeficienții obținuți vor fi afișați în matricea de corelație. Ca aceasta:

Analiza corelației-regresiune

În practică, aceste două tehnici sunt adesea folosite împreună.

Exemplu:


Acum sunt vizibile și datele de regresie.

Construirea unei regresii liniare, estimarea parametrilor acesteia și a semnificației acestora poate fi realizată mult mai rapid folosind pachetul de analiză Excel (Regression). Luați în considerare interpretarea rezultatelor obținute în cazul general ( k variabile explicative) conform exemplului 3.6.

In masa statistici de regresie valorile sunt date:

Multiplu R - coeficient de corelație multiplă;

R- pătrat- coeficient de determinare R 2 ;

Normalizat R - pătrat- ajustat R 2 corectat pentru numărul de grade de libertate;

Eroare standard- eroare standard de regresie S;

Observatii - numărul de observații n.

In masa ANOVA sunt date:

1. Coloana df - numărul de grade de libertate, egal cu

pentru sfoară Regresia df = k;

pentru sfoară Restdf = nk – 1;

pentru sfoară Totaldf = n– 1.

2. Coloana SS - suma pătratelor abaterilor egală cu

pentru sfoară Regresia ;

pentru sfoară Rest ;

pentru sfoară Total .

3. Coloana DOMNIȘOARĂ varianțe determinate de formulă DOMNIȘOARĂ = SS/df:

pentru sfoară Regresia- varianta factoriala;

pentru sfoară Rest- variaţia reziduală.

4. Coloana F - valoarea calculată F-criteriul calculat prin formula

F = DOMNIȘOARĂ(regresie)/ DOMNIȘOARĂ(rest).

5. Coloana Semnificaţie F - valoarea nivelului de semnificaţie corespunzător celui calculat F-statistici .

Semnificaţie F= FDIST ( F- statistici, df(regresie), df(rest)).

Dacă semnificaţia F < стандартного уровня значимости, то R 2 este semnificativ statistic.

Coeficienți Eroare standard t-statistică Valoarea P De jos 95% Top 95%
Y 65,92 11,74 5,61 0,00080 38,16 93,68
X 0,107 0,014 7,32 0,00016 0,0728 0,142

Acest tabel arată:

1. Cote- valorile coeficientului A, b.

2. Eroare standard–Erorile standard ale coeficienților de regresie S a, S b.



3. t- statistici- valori calculate t -criterii calculate prin formula:

t-statistic = Coeficienți / Eroare standard.

4.R-valoare (semnificație t) Este valoarea nivelului de semnificație corespunzătoare valorii calculate t- statistici.

R-valoare = TDIST(t-statistici, df(rest)).

Dacă R-sens< стандартного уровня значимости, то соответствующий коэффициент статистически значим.

5... 95% de jos și 95% de sus- limitele inferioare și superioare ale intervalelor de încredere de 95% pentru coeficienții ecuației teoretice de regresie liniară.

RETRAGERE RĂMÂNĂ
Observare A prezis y Rămâne e
72,70 -29,70
82,91 -20,91
94,53 -4,53
105,72 5,27
117,56 12,44
129,70 19,29
144,22 20,77
166,49 24,50
268,13 -27,13

In masa RETRAGERE RĂMÂNĂ indicat:

în coloană Observare- numarul de observatie;

în coloană Cel prezis y - valorile calculate ale variabilei dependente;

în coloană Resturi e - diferența dintre valorile observate și calculate ale variabilei dependente.

Exemplul 3.6. Există date (unități convenționale) privind costurile cu alimentele yși venitul pe cap de locuitor X pentru nouă grupuri de familii:

X
y

Folosind rezultatele pachetului de analiză Excel (Regresie), să analizăm dependența costurilor alimentare de valoarea venitului pe cap de locuitor.

Se obișnuiește să scrieți rezultatele analizei de regresie sub forma:

unde erorile standard ale coeficienților de regresie sunt indicate în paranteze.

Coeficienți de regresie A = 65,92 și b= 0,107. Direcția de comunicare între yși X determină semnul coeficientului de regresie b= 0,107, adică legătura este directă și pozitivă. Coeficient b= 0,107 arată că cu o creștere a venitului pe cap de locuitor cu 1 conv. unitati costurile cu alimente cresc cu 0,107 conv. unitati

Să estimăm semnificația coeficienților modelului rezultat. Semnificația coeficienților ( a, b) este verificat de t-Test:

valoarea p ( A) = 0,00080 < 0,01 < 0,05

valoarea p ( b) = 0,00016 < 0,01 < 0,05,

prin urmare, coeficienții ( a, b) sunt semnificative la nivelul de 1% și cu atât mai mult la nivelul de semnificație de 5%. Astfel, coeficienții de regresie sunt semnificativi și modelul este adecvat datelor originale.

Rezultatele estimării regresiei sunt compatibile nu numai cu valorile obținute ale coeficienților de regresie, ci și cu o parte din setul acestora (interval de încredere). Cu o probabilitate de 95%, intervalele de încredere pentru coeficienți sunt (38,16 - 93,68) pentru Aşi (0,0728 - 0,142) pentru b.

Calitatea modelului este evaluată prin coeficientul de determinare R 2 .

Magnitudinea R 2 = 0,884 înseamnă că 88,4% din variația (răspândirea) cheltuielilor cu alimente poate fi explicată prin factorul venit pe cap de locuitor.

Semnificaţie R 2 este verificat de F- test: semnificație F = 0,00016 < 0,01 < 0,05, следовательно, R 2 este semnificativ la nivelul de 1% și cu atât mai mult la nivelul de semnificație de 5%.

În cazul regresiei liniare perechi, coeficientul de corelație poate fi definit ca ... Valoarea obținută a coeficientului de corelație indică faptul că relația dintre cheltuielile alimentare și venitul pe cap de locuitor este foarte strânsă.

Pentru teritoriile regiunii sunt date date pentru anul 200X.

Numărul regiunii Mediu minim de existență pe cap de locuitor pe zi a unui muncitor apt de muncă, ruble, x Salariul mediu zilnic, ruble, a
1 78 133
2 82 148
3 87 134
4 79 154
5 89 162
6 106 195
7 67 139
8 88 158
9 73 152
10 87 162
11 76 159
12 115 173

Exercițiu:

1. Construiți un câmp de corelație și formulați o ipoteză despre forma relației.

2. Calculați parametrii ecuației de regresie liniară

4. Folosind coeficientul mediu (general) de elasticitate, dați o evaluare comparativă a puterii relației dintre factor și rezultat.

7. Calculați valoarea estimată a rezultatului dacă valoarea estimată a factorului crește cu 10% față de nivelul său mediu. Determinați intervalul de încredere predictiv pentru nivelul de semnificație.

Soluţie:

Să rezolvăm această problemă folosind Excel.

1. Comparând datele disponibile x și y, de exemplu, ierarhându-le în ordinea crescătoare a factorului x, se poate observa prezența unei relații directe între semne, atunci când o creștere a minimului mediu de existență pe cap de locuitor crește media zilnică. salariu. Pe baza acestui fapt, putem presupune că legătura dintre caracteristici este directă și poate fi descrisă prin ecuația unei linii drepte. Aceeași concluzie este confirmată pe baza analizei grafice.

Pentru a construi un câmp de corelare, puteți utiliza Excel PPP. Introduceți datele inițiale în succesiune: mai întâi x, apoi y.

Selectați zona celulelor care conțin date.

Atunci alege: Inserați / Diagramă de împrăștiere / Scatter cu marcatoare așa cum se arată în figura 1.

Figura 1 Trasarea câmpului de corelație

Analiza câmpului de corelație arată prezența unei dependențe apropiate de o dreaptă, întrucât punctele sunt situate practic în linie dreaptă.

2. Să se calculeze parametrii ecuației de regresie liniară
să folosim funcția statistică încorporată LINIST.

Pentru asta:

1) Deschideți un fișier existent care conține datele analizate;
2) Selectați o zonă de celule goale de 5 × 2 (5 rânduri, 2 coloane) pentru a afișa rezultatele statisticilor de regresie.
3) Activați Asistentul de funcții: în meniul principal selectați Formule / Funcție de inserare.
4) În fereastră Categorie iei Statistic, în fereastra funcția - LINIST... Faceți clic pe butonul O.K așa cum se arată în Figura 2;

Figura 2 Caseta de dialog Function Wizard

5) Completați argumentele funcției:

Valori cunoscute pentru

Valorile cunoscute ale lui x

Constant- o valoare booleană care indică prezența sau absența unei interceptări în ecuație; dacă Constant = 1, atunci termenul liber este calculat în mod obișnuit; dacă Constant = 0, atunci termenul liber este 0;

Statistici- o valoare booleană care indică dacă se afișează sau nu informații suplimentare despre analiza de regresie. Dacă Statistics = 1, atunci sunt afișate informații suplimentare, dacă Statistics = 0, atunci sunt afișate doar estimări ale parametrilor ecuației.

Faceți clic pe butonul O.K;

Figura 3 Caseta de dialog pentru argumentele funcției LINEST

6) Primul element al tabelului final va apărea în celula din stânga sus a zonei selectate. Pentru a extinde întregul tabel, apăsați tasta și apoi combinația de taste ++ .

Statisticile de regresie suplimentare vor fi afișate în ordinea prezentată în următoarea diagramă:

Valoarea coeficientului b Valoarea coeficientului a
Eroare standard b Eroare standard a
Eroare standard y
F-statistici
Suma de regresie a pătratelor

Figura 4 Rezultatul calculării funcției LINEST

Obținem ecuația de regresie:

Concluzionăm: Cu o creștere a minimului mediu de existență pe cap de locuitor cu 1 rublă. salariul mediu zilnic crește în medie cu 0,92 ruble.

Aceasta înseamnă că 52% din variația salariilor (y) se explică prin variația factorului x - minimul mediu de existență pe cap de locuitor, iar 48% - prin acțiunea altor factori neincluși în model.

În funcție de coeficientul de determinare calculat, coeficientul de corelație poate fi calculat: .

Conexiunea este evaluată ca fiind strânsă.

4. Folosind coeficientul mediu (general) de elasticitate, determinăm puterea influenței factorului asupra rezultatului.

Pentru ecuația unei linii drepte, coeficientul mediu (general) de elasticitate este determinat de formula:

Găsiți valorile medii selectând zona celulelor cu valori x și selectați Formule / AutoSum / Medieși faceți același lucru cu valorile lui y.

Figura 5 Calculul valorilor medii ale funcției și ale argumentului

Astfel, dacă minimul mediu de existență pe cap de locuitor se modifică cu 1% din valoarea sa medie, salariul mediu zilnic se va modifica în medie cu 0,51%.

Utilizarea unui instrument de analiză a datelor Regresia poti sa o obtii:
- rezultatele statisticilor de regresie,
- rezultatele analizei varianței,
- rezultatele intervalelor de încredere,
- reziduuri și grafice pentru potrivirea dreptei de regresie,
- reziduuri și probabilitate normală.

Procedura este următoarea:

1) verificați accesul la Pachet de analize... În meniul principal, selectați în ordine: Fișier / Opțiuni / Suplimente.

2) În meniul derulant Control selectați elementul Suplimente Excelși apăsați butonul Merge.

3) În fereastră Suplimente bifeaza casuta Pachet de analizeși apoi faceți clic O.K.

Dacă Pachet de analize nu este în lista de câmpuri Suplimente disponibile, apasa butonul Prezentare generală a căuta.

Dacă apare un mesaj care spune că pachetul de analiză nu este instalat pe computer, faceți clic pe da pentru a-l instala.

4) În meniul principal, selectați succesiv: Date / Analiza datelor / Instrumente de analiză / Regresieși apoi faceți clic O.K.

5) Completați caseta de dialog pentru introducerea datelor și parametrii de ieșire:

Interval de intrare Y- intervalul care contine datele atributului efectiv;

Intervalul de intrare X- un interval care conține datele atributului factorului;

Etichete- o casetă de selectare care indică dacă primul rând conține nume de coloane sau nu;

Constanta - zero- un steag care indică prezența sau absența unei interceptări în ecuație;

Interval de ieșire- este suficient să indicați celula din stânga sus a intervalului viitor;

6) Foaie de lucru nouă - puteți seta un nume arbitrar pentru noua foaie.

Apoi apăsați butonul O.K.

Figura 6 Caseta de dialog pentru introducerea parametrilor instrumentului de regresie

Rezultatele analizei de regresie pentru datele sarcinii sunt prezentate în Figura 7.

Figura 7 Rezultatul aplicării instrumentului de regresie

5. Să estimăm calitatea ecuațiilor folosind eroarea medie de aproximare. Să folosim rezultatele analizei de regresie prezentate în Figura 8.

Figura 8 Rezultatul utilizării instrumentului de regresie „Ieșire reziduală”.

Să compunem un nou tabel, așa cum se arată în Figura 9. În coloana C calculăm eroarea relativă de aproximare prin formula:

Figura 9 Calculul erorii medii de aproximare

Eroarea medie de aproximare se calculează cu formula:

Calitatea modelului construit este evaluată ca bună, deoarece nu depășește 8 - 10%.

6. Din tabelul cu statistici de regresie (Figura 4) scriem valoarea reală a testului F Fisher:

În măsura în care la un nivel de semnificație de 5% se poate concluziona că ecuația de regresie este semnificativă (relația este dovedită).

8. Estimarea semnificației statistice a parametrilor de regresie se va realiza folosind statisticile t a lui Student și prin calcularea intervalului de încredere pentru fiecare dintre indicatori.

Propunem ipoteza H 0 despre diferența statistic nesemnificativă a indicatorilor față de zero:

.

pentru numărul de grade de libertate

Figura 7 arată valorile reale ale statisticii t:

Testul t pentru coeficientul de corelație poate fi calculat în două moduri:

Metoda I:

Unde - eroarea aleatorie a coeficientului de corelare.

Preluăm datele pentru calcul din tabelul din Figura 7.

Metoda II:

Valorile t-statistice reale sunt superioare valorilor tabelare:

Prin urmare, ipoteza H 0 este respinsă, adică parametrii de regresie și coeficientul de corelație nu sunt diferiți aleatoriu de zero, ci semnificativi statistic.

Intervalul de încredere pentru parametrul a este definit ca

Pentru parametrul a, limitele de 95%, așa cum se arată în Figura 7, au fost:

Intervalul de încredere pentru coeficientul de regresie este definit ca

Pentru coeficientul de regresie b, limitele de 95%, așa cum se arată în Figura 7, au fost:

Analiza limitelor superioare și inferioare ale intervalelor de încredere duce la concluzia că cu probabilitatea parametrii a și b, fiind în limitele indicate, nu iau valori zero, adică. nu sunt nesemnificative din punct de vedere statistic și sunt semnificativ diferite de zero.

7. Estimările obţinute ale ecuaţiei de regresie ne permit să o folosim pentru prognoză. Dacă valoarea de prognoză a minimului de existență este:

Atunci valoarea estimată a minimului de existență va fi:

Calculăm eroarea de prognoză folosind formula:

Unde

De asemenea, calculăm varianța folosind PPP Excel. Pentru asta:

1) Activați Asistentul de funcții: în meniul principal selectați Formule / Funcție de inserare.

3) Completați intervalul care conține datele numerice ale atributului factorului. Click pe O.K.

Figura 10 Calculul varianței

A primit valoarea varianței

Pentru a calcula varianța reziduală pe grad de libertate, folosim rezultatele ANOVA așa cum se arată în Figura 7.

Intervalele de încredere pentru prezicerea valorilor individuale ale lui y at cu o probabilitate de 0,95 sunt determinate de expresia:

Intervalul este suficient de larg, în primul rând din cauza volumului mic de observații. În ansamblu, prognoza îndeplinită a salariului mediu lunar s-a dovedit a fi credibilă.

Starea problemei este preluată din: Atelier de econometrie: Manual. indemnizatie / I.I. Eliseeva, S.V. Kurysheva, N.M. Gordeenko și alții; Ed. I.I. Eliseeva. - M .: Finanţe şi statistică, 2003. - 192 p .: ill.

MS Excel vă permite să faceți cea mai mare parte a muncii foarte rapid atunci când construiți o ecuație de regresie liniară. Este important să înțelegeți cum să interpretați rezultatele obținute. Pentru a construi un model de regresie, selectați elementul Service \ Analiza datelor \ Regresie (în Excel 2007 acest mod se află în secțiunea Date / Analiza datelor / Regresie). Apoi copiați rezultatele obținute în bloc pentru analiză.

Date inițiale:

Rezultatele analizei

Includeți în raport
Calculul parametrilor ecuației de regresie
Material teoretic
Ecuație de regresie la scară standard
Coeficient de corelație multiplă (indice de corelație multiplă)
Coeficienți parțiali de elasticitate
Evaluarea comparativă a influenței factorilor analizați asupra indicatorului efectiv (d - coeficienți de determinare separată)

Verificarea calității ecuației de regresie construită
Semnificația coeficienților de regresie b i (t-statistica. Testul Student)
Semnificația ecuației în ansamblu (F-statistica. Criteriul lui Fisher). Coeficient de determinare
Teste F private

Nivel de semnificație 0.005 0.01 0.025 0.05 0.1 0.25 0.4

V excela există o modalitate și mai rapidă și mai convenabilă de a reprezenta un grafic regresia liniară (și chiar tipurile de bază de regresii neliniare, așa cum se discută mai jos). Acest lucru se poate face după cum urmează:

1) selectați coloanele cu date Xși Y(trebuie să fie în ordinea aceea!);

2) sunați Chart Wizardși alegeți în grup Un felPunctși apăsați imediat Gata;

3) fără a renunța la selecția din diagramă, selectați elementul apărut din meniul principal Diagramă, în care ar trebui să selectați elementul Adăugați linia de tendință;

4) în caseta de dialog care apare Linie de tendințeîn filă Un fel Selectați Liniar;

5) în filă Parametrii comutatorul poate fi activat Afișați ecuația în diagramă, care vă va permite să vedeți ecuația de regresie liniară (4.4), în care se vor calcula coeficienții (4.5).

6) În aceeași filă, puteți activa comutatorul Plasați valoarea de încredere a aproximării (R ^ 2) pe diagramă... Această mărime este pătratul coeficientului de corelație (4.3) și arată cât de bine ecuația calculată descrie dependența experimentală. Dacă R 2 este aproape de unitate, atunci ecuația de regresie teoretică descrie bine dependența experimentală (teoria este în acord cu experimentul) și dacă R 2 este aproape de zero, atunci această ecuație nu este potrivită pentru a descrie dependența experimentală (teoria nu este de acord cu experimentul).

Ca urmare a efectuării acțiunilor descrise, veți obține o diagramă cu un grafic de regresie și ecuația acestuia.

§4.3. Principalele tipuri de regresie neliniară

Regresie parabolică și polinomială.

Parabolic dependenta de cantitate Y asupra valorii X se numește dependență exprimată printr-o funcție pătratică (parabolă de ordinul 2):

Această ecuație se numește ecuația de regresie parabolică Y pe X... Parametrii A, b, Cu sunt numite coeficienții de regresie parabolic... Calcularea coeficienților de regresie parabolică este întotdeauna greoaie, de aceea se recomandă utilizarea unui computer pentru calcule.

Ecuația (4.8) a regresiei parabolice este un caz special al unei regresii mai generale numită polinom. Polinom dependenta de cantitate Y asupra valorii X se numește dependență exprimată prin polinom n-a comanda:

unde sunt numerele și eu (i=0,1,…, n) sunt numite coeficienții de regresie polinomială.

Regresia puterii.

Exponenţial dependenta de cantitate Y asupra valorii X dependența formei se numește:

Această ecuație se numește ecuația de regresie a puterii Y pe X... Parametrii Ași b sunt numite coeficienții de regresie a puterii.

ln = ln A+b ln X. (4.11)

Această ecuație descrie o dreaptă într-un plan cu axe de coordonate logaritmice ln Xși ln. Prin urmare, criteriul de aplicabilitate a regresiei puterii este cerința ca punctele logaritmilor datelor empirice ln x iși ln i erau cel mai aproape de linia dreaptă (4.11).

Regresie exponențială.

Indicativ(sau exponenţială) prin dependenţa cantităţii Y asupra valorii X dependența formei se numește:

(sau ). (4,12)

Această ecuație se numește ecuația exponențială(sau exponenţială) regresie Y pe X... Parametrii A(sau k) și b sunt numite exponenţială(sau exponenţială) regresii.

Dacă luăm logaritmul ambelor părți ale ecuației de regresie a puterii, obținem ecuația

ln = X ln A+ ln b(sau ln = k x+ ln b). (4.13)

Această ecuație descrie dependența liniară a logaritmului unei mărimi ln față de o altă mărime X... Prin urmare, criteriul de aplicabilitate a regresiei puterii este cerința ca datele empirice să pună în considerare aceeași cantitate. x i iar logaritmii unei alte mărimi ln i erau cel mai aproape de linia dreaptă (4.13).

Regresie logaritmică.

Logaritmic dependenta de cantitate Y asupra valorii X dependența formei se numește:

=A+b ln X. (4.14)

Această ecuație se numește ecuația de regresie logaritmică Y pe X... Parametrii Ași b sunt numite coeficienții de regresie logaritmică.

Regresie hiperbolica.

Hiperbolic dependenta de cantitate Y asupra valorii X dependența formei se numește:

Această ecuație se numește ecuația de regresie hiperbolică Y pe X... Parametrii Ași b sunt numite coeficienții de regresie hiperbolicși sunt determinate prin metoda celor mai mici pătrate. Aplicarea acestei metode conduce la formulele:

În formulele (4.16-4.17), însumarea se realizează peste indice i de la unu la numărul de observaţii n.

Din pacate in excela nu există nicio funcţie care să calculeze coeficienţii regresiei hiperbolice. În cazurile în care nu se știe dinainte că mărimile măsurate sunt legate prin proporționalitate inversă, se recomandă să se caute o ecuație de regresie a puterii în locul ecuației de regresie hiperbolice, deoarece în excela există o procedură pentru a-l găsi. Dacă se presupune o dependență hiperbolică între valorile măsurate, atunci coeficienții regresiei acesteia vor trebui să fie calculați folosind tabele de calcul auxiliare și operații de însumare folosind formule (4.16-4.17).

Top articole similare