Curs 3 Econometrie ANOVA-Management An II

Descărcați ca pdf sau txt
Descărcați ca pdf sau txt
Sunteți pe pagina 1din 15

ELEMENTE DE ANALIZ

DISPERSIONAL (ANOVA)

ELEMENTE DE ANALIZ
DISPERSIONAL (ANOVA)

Analiza dispersional (analiz de varian) (ANOVA), a fost introdus de


statisticianul Irving Fisher.

Analiza dispersianal se utilizeaz pentru a determina n ce msur


difer media variabilei analizate de la o grup la alta .
Analiza dispersional se poate face dup un model unifactorial, dup
modele bi sau multifactoriale.

Analiz dispersional unifactorial

n modelul de analiz dispersional unifactorial se testeaz ipoteza nul:


H0: y1 = y2 = ... = yr,
cu ipoteza alternativ cel puin dou medii din populaie nu sunt egale:
H1 : yi yj, (i j)
Dac rezultatul testului indic faptul c mediile sunt semnificativ diferite,
se concluzioneaz c factorul X are un impact asupra variabilei Y.
Setul de date pentru analiza dispersional unifactorial const n valorile
variabilei Y pentru cele r grupe independente.
Volumele grupelor pot fi diferite n1 n2 ... nr

Analiz dispersional unifactorial

Sistematizarea datelor pentru ANOVA


Grupe dup factorul cauz
Gr. 1
y11
y12
.
.
y 1n

Media
Vol. grup

y1

n1

Gr. 2

y21
y22
.
.
1

y 2n

... .

y2

n2

Gr.r
yr1
yr2

.....

y rn r

.....

yr

. . . ..

nr

Analiz dispersional unifactorial

Presupunerile sub care se aplic testul F n analiza dispersional


unifactorial:

Testul statistic F pentru analiza dispersional unifactorial este raportul


indicatorilor de variabilitate pentru cele dou surse de variaie:

cele r grupe din eantion sunt extrase aleator i independent din cele r grupe
ale colectivitii generale;
fiecare grup din colectivitatea general are o distribuie normal, iar abaterile
medii ptratice sunt egale s1 = s2 = ..... = sr.

variabilitatea dintre grupe


variabilitatea din interiorul grupelor.

Dac ipoteza nul este adevrat, mediile celor r populaii ar trebui s fie,
toate, egale. Ne ateptm atunci ca mediile celor r eantioane s fie
aproximativ egale.
Dac ipoteza alternativ este adevrat, exist diferene mari ntre unele
medii ale eantioanelor.

Analiz dispersional unifactorial

Pe baza datelor din eantion calculm:


ni

yi

y
j 1

ij

ni

ni

y
i 1 j 1

n
r

n ni
i 1

i 1, r

ij

y n
i

i 1

Analiz dispersional unifactorial

Variana dintre grupe, dat de influena factorului cauzal, numit i


variana factorial, este suma ptratelor abaterilor mediilor de grup de
la media general (SSR):
r

S1 y i y n i
i 1

Dac y1 y 2 ... y r
atunci: S1 = 0.
variana din interiorul grupelor (variana rezidual), este suma
ptratelor abaterilor valorilor individuale de la mediile de grup (SSE):
r

ni

S 2 yij y i
i 1 j 1

S
2

2
i

* ni

mprtierea total a valorilor individuale fa de media general


n
r
2
(variana total)-SST:
S y ij y
i

i 1

j 1

Analiz dispersional unifactorial

Pentru variana factorial S1, numrul gradelor de libertate este r-1;


msurm variabilitatea a r medii, se pierde un grad de libertate, deoarece
media total a fost estimat.
Pentru variana rezidual (din interiorul grupelor) S2, numrul gradelor de
libertate este nr; msurm variabilitatea tuturor celor n valori, dar
pierdem r grade de libertate.

Analiz dispersional unifactorial

Obinem astfel:

dispersia factorial corectat:

y
r

S
s12 1
r 1

y ni

i 1

r 1

dispersia corectat rezidual:

y
r

S2
2
s2

nr

i 1

ni

ij

yi

j 1

nr

Analiz dispersional unifactorial

Statistica F pentru analiza dispersional unifactorial are forma:

s12
var iabilitate a dintre grupe
F 2
s 2 variabilit atea din interiorul grupelor

cu gradele de libertate (r 1) la numrtor i (n r) la numitor.


Regiunea critic este dat de :
F> F(r- 1),(n- r),,

acest lucru indic diferene mai mari ntre mediile grupelor dect cele
datorate ntmplrii.

Analiz dispersional unifactorial

dac valoarea F este mai mic dect valoarea critic F, atunci :

acceptm ipoteza nul, H0;


nu acceptm ipoteza alternativ H1;
mediile grupelor nu sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor pot fi datorate doar ntmplrii;
rezultatul nu este semnificativ statistic.

Dac valoarea F este mai mare dect valoarea critic F, atunci:

acceptm ipoteza alternativ, H1;


respingem ipoteza nul, H0;
mediile grupelor sunt semnificativ diferite una fa de alta;
diferenele observate ntre mediile grupelor nu sunt datorate doar ntmplrii;
rezultatul este semnificativ statistic.

Analiz dispersional unifactorial


Calculul statisticii F
pentru analiza dispersional unifactorial
Sursa
variaiei

Gradele de
libertate

Variana
(suma ptratelor)

Dispersia corectat
(media ptratelor)

Statistica
F

Factorul X

r1

S1

s12

Rezidual

nr

S2

s 22

Total

n1

S = S1 + S2

2
2
s2 s1 s2

s12
s22

Concluzii

Modelele de analiz dispersional nu explic relaia dintre variabile;

Verific doar msura n care valorile reale ale unei caracteristici se abat
de la valorile teoretice, precum i msura n care aceste variaii sunt sau
nu dependente de factorul/factorii de grupare;
Metoda analizei dispersionale poate fi utilizat att naintea, ct i dup
aplicarea metodelor corelaiei i regresiei statistice;
Testul F se poate utiliza i pentru testarea validitii modelului de
regresie;
Permite compararea mediilor a dou sau mai multor colectiviti de date
cantitative

Exemplu

Pentru regiunile Romniei s-au cules i sistematizat date privind rata ocuprii (%). Folosind
analiza dispersional s se stabileasc dac exist diferene semnificative ntre regiuni.
Regiunea

Nr.
judee
(ni)

Rata medie a ocuprii

xi

Abaterea
medie
ptratic (si)

Dispersia

2
i

S 2 si2 (ni 1)

(%)
NE

47.77

4.89

23.91

119.55

SE

41.24

5.68

32.26

161.3

40.68

6.57

43.16

258.96

SV

41.9

3.31

10.96

43.84

42.71

6.18

38.19

114.57

NV

46.32

5.84

34.11

170.55

42.08

2.32

5.38

26.9

Buc

41.59

5.62

31.58

31.58

Total

42

43.16

5.41 = s

29.27 = s2

927.25

Exemplu
927.25
s
27.27
42 8
272.82
s12
38.97
8 1
1200.07
s2
29.27
42 1
2
2

S 2 927.25
S1 272.82
S 29.27 * 41 1200.07

38.97
1.42
27.27
F0.05;7;34 2.40

F F0.05;7;34 H 0

S-ar putea să vă placă și