Sprawozdanie NR 3: Spis Treści

Download as pdf or txt
Download as pdf or txt
You are on page 1of 10

Sprawozdanie nr 3

Michał Brodacki
nr albumu 262240
Adrian Siwak
nr albumu 242084
22 stycznia 2023

Spis treści
1 Krótki opis zagadnienia: 1
1.1 Informacje o badanch danych: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Teoretyczny opis narzedzi uzywanych przy analizie oraz waznych terminów teo-
retycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2

2 Lista 10 — część pierwsza 3


2.1 Zadanie 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Zadanie 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3 Zadanie 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

3 Lista 11 — część druga 6


3.1 Zadanie 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2 Zadanie 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.3 Zadanie dodatkowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1 Krótki opis zagadnienia:


1.1 Informacje o badanch danych:
Będziemy korzystać z danych o:
• Porównanie wyników dwóch kolokwiów w pewnej grupie studentów:

Negatywny Pozytywny
Negatywny 30.00 46.00
Pozytywny 24.00 36.00

• Tabela reakcji po godzinie od przyjęcia dwóch różnych leków przeciwbólowych

Negatywna Pozytywna
Negatywna 1.00 5.00
Pozytywna 2.00 4.00

1
• Tabela zawierająca dane na temat oceny pracy rządu przez społeczeństwo, które było
zadane w dwóch badanych okresach tej samej grupie respondentów pewnej populecja

-2 -1 0 1 2
-2 5.00 2.00 1.00 0.00 0.00
-1 6.00 3.00 2.00 2.00 0.00
0 1.00 4.00 5.00 5.00 2.00
1 0.00 10.00 15.00 18.00 5.00
2 1.00 2.00 5.00 3.00 2.00

gdzie odpowiedzi są kodowane w następujący sposób: −2 — zdecydowanie źle, −1 — raczej


źle, 0 — nie mam zdania, 1 — raczej dobrze, 2 — zdecydowanie dobrze.

1.2 Teoretyczny opis narzedzi uzywanych przy analizie oraz wa-


znych terminów teoretycznych
• Test Bowkera (funkcja mcnemary dla symetri) — jest testem dla sprawdzenia symetrii
danych. Oparty jest na statystyce testowej Pearsona χ2

1. Liczba stopni swobody jest równa:

I(I − 1)
r=
2
2. Wartość poziomu krytycznego wyznaczamy ze wzoru:

p = 1 − Fχ2 (r) (x2 )

• Test ilorazu wiarygodności dla symetrii — przy weryfikacji hipotezy o symetrii statystyka
G2 jest postaci:
X I XI
2
G =2 Yij ln(Yij /np̂ij )
i=1 j=1

gdzie p̂ij , i, j ∈ {1, 2, . . . , I} są estymatorami najwyższej wiarygodności parametrów pij


przy założeniu symetrii, czyli
Yij + Yji
p̂ij = , i, j = 1, . . . , I
2n
Wartość poziomu krytycznego w teście Ilorazu Wiarygodności wyznaczamy ze wzoru

p = 1 − Fχ2 (r) (g 2 )

gidze Fχ2 (r) jest dystrybuantą rozkładu χ2 z r = I(I − 1)/2 stopniami swobody, a g 2 jest
wartością statystyki G2

• Moc testu — prawdopodobieństwo wykrycia różnicy między dwoma populacjami, gdy rze-
czywiście istnieje ta różnica. Im wyższa moc testu, tym bardziej prawdopodobne jest, że
test wykryje różnicę, gdy ona faktycznie istnieje.

2
• Test ilorazu wiarygodności dla quasi-symetrii — modelem quasi-symetrii dla danych po-
wtarzanych jednokrotnie nazywamy model, w ktrórym

pij = αi βj γij

gdzie γij = γji dla każdego i < j gdzie i, j = {1, . . . , I} oraz wszystkie parametry są
dodatnie. Model quasi-symetrii nie pociąga za sobą jednorodności rozkładów brzegowych
(w przeciwieństwie do modelu symetrii). Liczba stopni swobody granicznego rozkładu χ2
tych statystyk testowych wynosi

(I − 1)(I − 2)
r=
2

• Model jednorodności rozkładów brzegowych — rozkład {pij : i, j = 1, . . . , I} podlega


modelowi jednorodności rozkładów brzegowych wtedy i tylko wtedy, gdy

pi+ = p+i , ∀i=1,...,I

2 Lista 10 — część pierwsza


2.1 Zadanie 1
Przyjmując, że poziom trudności zadań na pierwszym i drugim kolokwium był taki sam, na
podstawie danych:

Negatywny Pozytywny
Negatywny 30.00 46.00
Pozytywny 24.00 36.00

zweryfikujemy na poziomie istotności 0.05 hipotezę, że studenci byli tak samo przygotowani
do obu kolokwiów:

mcnemar.test(m1, correct = FALSE)$p.value

## [1] 0.008550979

mcnemar.test(m1, correct = TRUE)$p.value

## [1] 0.0120738

Widzimy, że na podstawie testu chi-kwadrat Mcnemar’y z oraz bez poprawki na ciągłość,


możemy odrzucić hipotezę zerową na poziomie istotności 0.05, więc studenci nie byli tak samo
przygotowani na oba kolokwia.

2.2 Zadanie 2
Na podstawie danych dotyczących reakcji po godzinie od przyjęcia dwóch różnych leków prze-
ciwbólowych stosowanych w migrenie:

3
Negatywna Pozytywna
Negatywna 1.00 5.00
Pozytywna 2.00 4.00

sprawdzimy hipotezę, że leki te są jednakowo skuteczne korzystając z testu


• McNemary’ego z poprawką na ciągłość

mcnemar.test(m2, correct = TRUE)$p.value

## [1] 0.4496918

• dokładnego

pvalue <- function(dane){


if (dane[1,2] < (dane[1,2]+dane[2,1])/2) {
list = c()
for (k in 1:dane[1,2]) {
new_el = choose(dane[1,2] + dane[2,1],k)*((1/2)^k)*
((1/2)^(dane[1,2]+dane[2,1] - k))
list = append(list, new_el)
}
result = 2*sum(list)
} else if ( dane[1,2] > (dane[1,2]+dane[2,1])/2) {
list = c()
for (k in dane[1,2]:(dane[1,2]+dane[2,1])) {
new_el = choose( dane[1,2] + dane[2,1],k)*
((1/2)^k)*((1/2)^(dane[1,2]+dane[2,1] - k))
list = append(list, new_el)
}
result = 2*sum(list)
} else {
result = 1
}
result
}
pvalue(m2)

## [1] 0.453125

mcnemar.exact(m2)$p.value

## [1] 0.453125

widać, że wynik nowej funkcji jest taki sam, jak funkcji wbudowanej więc jest ona napisana
poprawnie.
Zatem na podstawie obu testów, na poziomie istotności 0.05 możemy przyjąć hipotezę zerową,
czyli oba leki są tak samo skuteczne.

4
2.3 Zadanie 3
Przeprowadzimy symulację, w celu porównania mocy testu Z i testu Z0 :

TestZ<-function(matrix){
m=matrix/sum(matrix)
sigma=(sum(m[1,])*(1-sum(m[1,]))+sum(m[,1])*(1-sum(m[,1]))-
2*(m[1,1]*m[2,2]-m[1,2]*m[2,1]))/sum(matrix)
D=sum(m[1,])-sum(m[,1])
Z=D/sqrt(sigma)
2*(1-pnorm(abs(Z)))
}
#######################################################
TestZ0<-function(matrix){
Z0=(matrix[1,2]-matrix[2,1])/(sqrt(matrix[1,2]+matrix[2,1]))
2*(1-pnorm(abs(Z0)))
}

####################################################
#funkcja pomocnicza
wyniki<-function(p2){
m=1000
p1<-0.5

X<-sample(c(0,1),n,replace=TRUE,prob=c(1-p1,p1))
Y<-sample(c(0,1),n,replace=TRUE,prob=c(1-p2,p2))

X<-factor(X,levels=c("0","1"))
Y<-factor(Y,levels=c("0","1"))

dane<-ftable(X,Y)
}
############################################################

n=100
p2_vec=seq(0.01,0.99,0.01)
alpha=0.05
moc1=c()
moc2=c()

for (p in p2_vec){

M=1000
res1=0
res2=0

for(i in 1:M){
matrix<-wyniki(p)

5
test1<-TestZ(matrix)
res1=res1+(test1>alpha)

test2<-TestZ0(matrix)
res2=res2+(test2>alpha)

moc1=append(moc1,res1/M)
moc2=append(moc2,res2/M)

colors=c("blue","red")
shapes<-c(1,2)
plot(p2_vec,moc1,pch=1,cex = 2/3,main="porównanie mocy testów",
xlab="p",ylab="moc testu",col="blue")
points(p2_vec,moc2,pch=2,cex = 2/3,col="red")
legend("topleft", inset=.02, title="testy",
c("Z","Z0"), pch=shapes, horiz=FALSE, cex=1,col=colors)

porównanie mocy testów

testy
Z
0.8

Z0
0.6
moc testu

0.4
0.2
0.0

0.0 0.2 0.4 0.6 0.8 1.0

Widzimy, że test Z0 ma większą moc niż test Z, czyli jest skuteczniejszy.

6
3 Lista 11 — część druga
3.1 Zadanie 1
Korzystając z testu Bowkera i testu Ilorazu Wiarygodności, na poziomie istotności 0.05 zwery-
fikujemy hipotezę, że dane w tabeli

-2 -1 0 1 2
-2 5.00 2.00 1.00 0.00 0.00
-1 6.00 3.00 2.00 2.00 0.00
0 1.00 4.00 5.00 5.00 2.00
1 0.00 10.00 15.00 18.00 5.00
2 1.00 2.00 5.00 3.00 2.00

• podlegają modelowi symetrii

mcnemar.test(m3,correct=FALSE)$p.value

## [1] NaN

mcnemar.test(m3,correct=TRUE)$p.value

## [1] NaN

Test Bowkera nie działa, przez to, że w tabeli występują zera (dzielenie przez zero w
statystyce testowej).

count<-c(5,2,1,0,0,6,3,2,2,0,1,4,5,5,2,0,10,15,18,5,1,2,5,3,2)
Ocena1<-gl(5,5,labels=c("-2","-1","0","1","2"))
Ocena2<-gl(5,1,labels=c("-2","-1","0","1","2"))
DaneM3<-data.frame(Ocena1,Ocena2,count)
symmetry <- glm(count ~ Symm(Ocena1, Ocena2), data=DaneM3, family = poisson)
summary(symmetry)

##
## Call:
## glm(formula = count ~ Symm(Ocena1, Ocena2), family = poisson,
## data = DaneM3)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.8988 -0.6149 0.0000 0.5491 1.4888
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.609e+00 4.472e-01 3.599 0.00032 ***
## Symm(Ocena1, Ocena2)-2:-1 -2.231e-01 5.701e-01 -0.391 0.69549

7
## Symm(Ocena1, Ocena2)-2:0 -1.609e+00 8.367e-01 -1.924 0.05440 .
## Symm(Ocena1, Ocena2)-2:1 -1.991e+01 4.043e+03 -0.005 0.99607
## Symm(Ocena1, Ocena2)-2:2 -2.303e+00 1.095e+00 -2.102 0.03556 *
## Symm(Ocena1, Ocena2)-1:-1 -5.108e-01 7.303e-01 -0.699 0.48425
## Symm(Ocena1, Ocena2)-1:0 -5.108e-01 6.055e-01 -0.844 0.39889
## Symm(Ocena1, Ocena2)-1:1 1.823e-01 5.323e-01 0.343 0.73196
## Symm(Ocena1, Ocena2)-1:2 -1.609e+00 8.367e-01 -1.924 0.05440 .
## Symm(Ocena1, Ocena2)0:0 -5.943e-16 6.325e-01 0.000 1.00000
## Symm(Ocena1, Ocena2)0:1 6.931e-01 5.000e-01 1.386 0.16566
## Symm(Ocena1, Ocena2)0:2 -3.567e-01 5.855e-01 -0.609 0.54243
## Symm(Ocena1, Ocena2)1:1 1.281e+00 5.055e-01 2.534 0.01128 *
## Symm(Ocena1, Ocena2)1:2 -2.231e-01 5.701e-01 -0.391 0.69549
## Symm(Ocena1, Ocena2)2:2 -9.163e-01 8.367e-01 -1.095 0.27344
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 101.73 on 24 degrees of freedom
## Residual deviance: 19.82 on 10 degrees of freedom
## AIC: 115.26
##
## Number of Fisher Scoring iterations: 16

x = symmetry$deviance
r=nrow(m3)*(nrow(m3)-1)/2
(p.value=1-pchisq(x,r))

## [1] 0.03100543

zatem na poziomie istotności α = 0.05 możemy odrzucić hipotezę zerową, z czego wynika,
że tabela nie jest symetryczna.

• podlegają modelowi quasi-symetrii

quasi.symm <- glm(count ~ Ocena1+Ocena2 + Symm(Ocena1,Ocena2),data=DaneM3, family =


summary(quasi.symm)

##
## Call:
## glm(formula = count ~ Ocena1 + Ocena2 + Symm(Ocena1, Ocena2),
## family = poisson, data = DaneM3)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -0.87659 -0.08305 0.00000 0.10798 0.75209
##

8
## Coefficients: (4 not defined because of singularities)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.609e+00 4.472e-01 3.599 0.00032 ***
## Ocena1-1 -9.896e-01 9.272e-01 -1.067 0.28584
## Ocena10 6.561e-01 7.220e-01 0.909 0.36348
## Ocena11 1.477e+00 6.891e-01 2.143 0.03209 *
## Ocena12 6.601e-01 6.236e-01 1.058 0.28983
## Ocena2-1 -1.790e+00 9.077e-01 -1.972 0.04864 *
## Ocena20 -6.585e-01 6.981e-01 -0.943 0.34549
## Ocena21 -1.025e+00 6.969e-01 -1.470 0.14150
## Ocena22 -1.576e+00 6.236e-01 -2.528 0.01148 *
## Symm(Ocena1, Ocena2)-2:-1 1.089e+00 9.331e-01 1.167 0.24339
## Symm(Ocena1, Ocena2)-2:0 -1.810e+00 9.486e-01 -1.908 0.05634 .
## Symm(Ocena1, Ocena2)-2:1 -2.222e+01 8.316e+03 -0.003 0.99787
## Symm(Ocena1, Ocena2)-2:2 -2.371e+00 1.146e+00 -2.068 0.03862 *
## Symm(Ocena1, Ocena2)-1:-1 2.269e+00 1.738e+00 1.305 0.19174
## Symm(Ocena1, Ocena2)-1:0 8.473e-01 1.181e+00 0.717 0.47312
## Symm(Ocena1, Ocena2)-1:1 1.021e+00 1.108e+00 0.921 0.35703
## Symm(Ocena1, Ocena2)-1:2 NA NA NA NA
## Symm(Ocena1, Ocena2)0:0 2.381e-03 1.154e+00 0.002 0.99835
## Symm(Ocena1, Ocena2)0:1 3.014e-01 9.090e-01 0.332 0.74019
## Symm(Ocena1, Ocena2)0:2 NA NA NA NA
## Symm(Ocena1, Ocena2)1:1 8.285e-01 1.030e+00 0.804 0.42119
## Symm(Ocena1, Ocena2)1:2 NA NA NA NA
## Symm(Ocena1, Ocena2)2:2 NA NA NA NA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 101.733 on 24 degrees of freedom
## Residual deviance: 2.206 on 6 degrees of freedom
## AIC: 105.65
##
## Number of Fisher Scoring iterations: 18

x=quasi.symm$deviance
r=(nrow(m3)-1)*(nrow(m3)-2)/2
(p.value=1-pchisq(x,r))

## [1] 0.899807

na poziomie istotnośc α = 0.05 nie mamy podstaw do odrzucenia hipotezy zerowej, zatem
tabela jest quasi-symetryczna.

9
3.2 Zadanie 2
Zweryfikujemy hipotezę, że ocena prac rządu w dwóch badanych okresach w badanej populacji
nie uległa zmianie: Tabela jest rozmiaru większego niż 2 × 2 więc nie możemy powiedzieć nic o
jednorodności na podstawie informacji o symetrii uzyskanej powyżej (dane nie są symetryczne).

comparison <- anova(symmetry, quasi.symm)


(p.value=1-pchisq(comparison$Deviance[2],comparison$Df[2]))

## [1] 0.00146819

Zatem na poziomie istotności α = 0.05 możemy odrzucić hipotezę zerową. Czyli na pod-
stawie wyniku testu jednorodności, możemy stwierdzić, że ocena pracy rządu uległa zmianie
między okresami.

3.3 Zadanie dodatkowe

10

You might also like