Sprawozdanie NR 3: Spis Treści
Sprawozdanie NR 3: Spis Treści
Sprawozdanie NR 3: Spis Treści
Michał Brodacki
nr albumu 262240
Adrian Siwak
nr albumu 242084
22 stycznia 2023
Spis treści
1 Krótki opis zagadnienia: 1
1.1 Informacje o badanch danych: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Teoretyczny opis narzedzi uzywanych przy analizie oraz waznych terminów teo-
retycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
Negatywny Pozytywny
Negatywny 30.00 46.00
Pozytywny 24.00 36.00
Negatywna Pozytywna
Negatywna 1.00 5.00
Pozytywna 2.00 4.00
1
• Tabela zawierająca dane na temat oceny pracy rządu przez społeczeństwo, które było
zadane w dwóch badanych okresach tej samej grupie respondentów pewnej populecja
-2 -1 0 1 2
-2 5.00 2.00 1.00 0.00 0.00
-1 6.00 3.00 2.00 2.00 0.00
0 1.00 4.00 5.00 5.00 2.00
1 0.00 10.00 15.00 18.00 5.00
2 1.00 2.00 5.00 3.00 2.00
I(I − 1)
r=
2
2. Wartość poziomu krytycznego wyznaczamy ze wzoru:
• Test ilorazu wiarygodności dla symetrii — przy weryfikacji hipotezy o symetrii statystyka
G2 jest postaci:
X I XI
2
G =2 Yij ln(Yij /np̂ij )
i=1 j=1
p = 1 − Fχ2 (r) (g 2 )
gidze Fχ2 (r) jest dystrybuantą rozkładu χ2 z r = I(I − 1)/2 stopniami swobody, a g 2 jest
wartością statystyki G2
• Moc testu — prawdopodobieństwo wykrycia różnicy między dwoma populacjami, gdy rze-
czywiście istnieje ta różnica. Im wyższa moc testu, tym bardziej prawdopodobne jest, że
test wykryje różnicę, gdy ona faktycznie istnieje.
2
• Test ilorazu wiarygodności dla quasi-symetrii — modelem quasi-symetrii dla danych po-
wtarzanych jednokrotnie nazywamy model, w ktrórym
pij = αi βj γij
gdzie γij = γji dla każdego i < j gdzie i, j = {1, . . . , I} oraz wszystkie parametry są
dodatnie. Model quasi-symetrii nie pociąga za sobą jednorodności rozkładów brzegowych
(w przeciwieństwie do modelu symetrii). Liczba stopni swobody granicznego rozkładu χ2
tych statystyk testowych wynosi
(I − 1)(I − 2)
r=
2
Negatywny Pozytywny
Negatywny 30.00 46.00
Pozytywny 24.00 36.00
zweryfikujemy na poziomie istotności 0.05 hipotezę, że studenci byli tak samo przygotowani
do obu kolokwiów:
## [1] 0.008550979
## [1] 0.0120738
2.2 Zadanie 2
Na podstawie danych dotyczących reakcji po godzinie od przyjęcia dwóch różnych leków prze-
ciwbólowych stosowanych w migrenie:
3
Negatywna Pozytywna
Negatywna 1.00 5.00
Pozytywna 2.00 4.00
## [1] 0.4496918
• dokładnego
## [1] 0.453125
mcnemar.exact(m2)$p.value
## [1] 0.453125
widać, że wynik nowej funkcji jest taki sam, jak funkcji wbudowanej więc jest ona napisana
poprawnie.
Zatem na podstawie obu testów, na poziomie istotności 0.05 możemy przyjąć hipotezę zerową,
czyli oba leki są tak samo skuteczne.
4
2.3 Zadanie 3
Przeprowadzimy symulację, w celu porównania mocy testu Z i testu Z0 :
TestZ<-function(matrix){
m=matrix/sum(matrix)
sigma=(sum(m[1,])*(1-sum(m[1,]))+sum(m[,1])*(1-sum(m[,1]))-
2*(m[1,1]*m[2,2]-m[1,2]*m[2,1]))/sum(matrix)
D=sum(m[1,])-sum(m[,1])
Z=D/sqrt(sigma)
2*(1-pnorm(abs(Z)))
}
#######################################################
TestZ0<-function(matrix){
Z0=(matrix[1,2]-matrix[2,1])/(sqrt(matrix[1,2]+matrix[2,1]))
2*(1-pnorm(abs(Z0)))
}
####################################################
#funkcja pomocnicza
wyniki<-function(p2){
m=1000
p1<-0.5
X<-sample(c(0,1),n,replace=TRUE,prob=c(1-p1,p1))
Y<-sample(c(0,1),n,replace=TRUE,prob=c(1-p2,p2))
X<-factor(X,levels=c("0","1"))
Y<-factor(Y,levels=c("0","1"))
dane<-ftable(X,Y)
}
############################################################
n=100
p2_vec=seq(0.01,0.99,0.01)
alpha=0.05
moc1=c()
moc2=c()
for (p in p2_vec){
M=1000
res1=0
res2=0
for(i in 1:M){
matrix<-wyniki(p)
5
test1<-TestZ(matrix)
res1=res1+(test1>alpha)
test2<-TestZ0(matrix)
res2=res2+(test2>alpha)
moc1=append(moc1,res1/M)
moc2=append(moc2,res2/M)
colors=c("blue","red")
shapes<-c(1,2)
plot(p2_vec,moc1,pch=1,cex = 2/3,main="porównanie mocy testów",
xlab="p",ylab="moc testu",col="blue")
points(p2_vec,moc2,pch=2,cex = 2/3,col="red")
legend("topleft", inset=.02, title="testy",
c("Z","Z0"), pch=shapes, horiz=FALSE, cex=1,col=colors)
testy
Z
0.8
Z0
0.6
moc testu
0.4
0.2
0.0
6
3 Lista 11 — część druga
3.1 Zadanie 1
Korzystając z testu Bowkera i testu Ilorazu Wiarygodności, na poziomie istotności 0.05 zwery-
fikujemy hipotezę, że dane w tabeli
-2 -1 0 1 2
-2 5.00 2.00 1.00 0.00 0.00
-1 6.00 3.00 2.00 2.00 0.00
0 1.00 4.00 5.00 5.00 2.00
1 0.00 10.00 15.00 18.00 5.00
2 1.00 2.00 5.00 3.00 2.00
mcnemar.test(m3,correct=FALSE)$p.value
## [1] NaN
mcnemar.test(m3,correct=TRUE)$p.value
## [1] NaN
Test Bowkera nie działa, przez to, że w tabeli występują zera (dzielenie przez zero w
statystyce testowej).
count<-c(5,2,1,0,0,6,3,2,2,0,1,4,5,5,2,0,10,15,18,5,1,2,5,3,2)
Ocena1<-gl(5,5,labels=c("-2","-1","0","1","2"))
Ocena2<-gl(5,1,labels=c("-2","-1","0","1","2"))
DaneM3<-data.frame(Ocena1,Ocena2,count)
symmetry <- glm(count ~ Symm(Ocena1, Ocena2), data=DaneM3, family = poisson)
summary(symmetry)
##
## Call:
## glm(formula = count ~ Symm(Ocena1, Ocena2), family = poisson,
## data = DaneM3)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.8988 -0.6149 0.0000 0.5491 1.4888
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.609e+00 4.472e-01 3.599 0.00032 ***
## Symm(Ocena1, Ocena2)-2:-1 -2.231e-01 5.701e-01 -0.391 0.69549
7
## Symm(Ocena1, Ocena2)-2:0 -1.609e+00 8.367e-01 -1.924 0.05440 .
## Symm(Ocena1, Ocena2)-2:1 -1.991e+01 4.043e+03 -0.005 0.99607
## Symm(Ocena1, Ocena2)-2:2 -2.303e+00 1.095e+00 -2.102 0.03556 *
## Symm(Ocena1, Ocena2)-1:-1 -5.108e-01 7.303e-01 -0.699 0.48425
## Symm(Ocena1, Ocena2)-1:0 -5.108e-01 6.055e-01 -0.844 0.39889
## Symm(Ocena1, Ocena2)-1:1 1.823e-01 5.323e-01 0.343 0.73196
## Symm(Ocena1, Ocena2)-1:2 -1.609e+00 8.367e-01 -1.924 0.05440 .
## Symm(Ocena1, Ocena2)0:0 -5.943e-16 6.325e-01 0.000 1.00000
## Symm(Ocena1, Ocena2)0:1 6.931e-01 5.000e-01 1.386 0.16566
## Symm(Ocena1, Ocena2)0:2 -3.567e-01 5.855e-01 -0.609 0.54243
## Symm(Ocena1, Ocena2)1:1 1.281e+00 5.055e-01 2.534 0.01128 *
## Symm(Ocena1, Ocena2)1:2 -2.231e-01 5.701e-01 -0.391 0.69549
## Symm(Ocena1, Ocena2)2:2 -9.163e-01 8.367e-01 -1.095 0.27344
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 101.73 on 24 degrees of freedom
## Residual deviance: 19.82 on 10 degrees of freedom
## AIC: 115.26
##
## Number of Fisher Scoring iterations: 16
x = symmetry$deviance
r=nrow(m3)*(nrow(m3)-1)/2
(p.value=1-pchisq(x,r))
## [1] 0.03100543
zatem na poziomie istotności α = 0.05 możemy odrzucić hipotezę zerową, z czego wynika,
że tabela nie jest symetryczna.
##
## Call:
## glm(formula = count ~ Ocena1 + Ocena2 + Symm(Ocena1, Ocena2),
## family = poisson, data = DaneM3)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -0.87659 -0.08305 0.00000 0.10798 0.75209
##
8
## Coefficients: (4 not defined because of singularities)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.609e+00 4.472e-01 3.599 0.00032 ***
## Ocena1-1 -9.896e-01 9.272e-01 -1.067 0.28584
## Ocena10 6.561e-01 7.220e-01 0.909 0.36348
## Ocena11 1.477e+00 6.891e-01 2.143 0.03209 *
## Ocena12 6.601e-01 6.236e-01 1.058 0.28983
## Ocena2-1 -1.790e+00 9.077e-01 -1.972 0.04864 *
## Ocena20 -6.585e-01 6.981e-01 -0.943 0.34549
## Ocena21 -1.025e+00 6.969e-01 -1.470 0.14150
## Ocena22 -1.576e+00 6.236e-01 -2.528 0.01148 *
## Symm(Ocena1, Ocena2)-2:-1 1.089e+00 9.331e-01 1.167 0.24339
## Symm(Ocena1, Ocena2)-2:0 -1.810e+00 9.486e-01 -1.908 0.05634 .
## Symm(Ocena1, Ocena2)-2:1 -2.222e+01 8.316e+03 -0.003 0.99787
## Symm(Ocena1, Ocena2)-2:2 -2.371e+00 1.146e+00 -2.068 0.03862 *
## Symm(Ocena1, Ocena2)-1:-1 2.269e+00 1.738e+00 1.305 0.19174
## Symm(Ocena1, Ocena2)-1:0 8.473e-01 1.181e+00 0.717 0.47312
## Symm(Ocena1, Ocena2)-1:1 1.021e+00 1.108e+00 0.921 0.35703
## Symm(Ocena1, Ocena2)-1:2 NA NA NA NA
## Symm(Ocena1, Ocena2)0:0 2.381e-03 1.154e+00 0.002 0.99835
## Symm(Ocena1, Ocena2)0:1 3.014e-01 9.090e-01 0.332 0.74019
## Symm(Ocena1, Ocena2)0:2 NA NA NA NA
## Symm(Ocena1, Ocena2)1:1 8.285e-01 1.030e+00 0.804 0.42119
## Symm(Ocena1, Ocena2)1:2 NA NA NA NA
## Symm(Ocena1, Ocena2)2:2 NA NA NA NA
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 101.733 on 24 degrees of freedom
## Residual deviance: 2.206 on 6 degrees of freedom
## AIC: 105.65
##
## Number of Fisher Scoring iterations: 18
x=quasi.symm$deviance
r=(nrow(m3)-1)*(nrow(m3)-2)/2
(p.value=1-pchisq(x,r))
## [1] 0.899807
na poziomie istotnośc α = 0.05 nie mamy podstaw do odrzucenia hipotezy zerowej, zatem
tabela jest quasi-symetryczna.
9
3.2 Zadanie 2
Zweryfikujemy hipotezę, że ocena prac rządu w dwóch badanych okresach w badanej populacji
nie uległa zmianie: Tabela jest rozmiaru większego niż 2 × 2 więc nie możemy powiedzieć nic o
jednorodności na podstawie informacji o symetrii uzyskanej powyżej (dane nie są symetryczne).
## [1] 0.00146819
Zatem na poziomie istotności α = 0.05 możemy odrzucić hipotezę zerową. Czyli na pod-
stawie wyniku testu jednorodności, możemy stwierdzić, że ocena pracy rządu uległa zmianie
między okresami.
10