Sprawozdanie NR 3: Spis Treści

Sprawozdanie nr 3
Michał Brodacki
nr albumu 262240
Adrian Siwak
nr albumu 242084
22 stycznia 2023
Spis treści
1 Krótki opis zagadnienia: 1
1.1 Informacje o badanch danych: . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Teoretyczny opis narzedzi uzywanych przy analizie oraz waznych terminów teo-
retycznych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
2 Lista 10 — część pierwsza 3

2.1 Zadanie 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.2 Zadanie 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2.3 Zadanie 3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
3 Lista 11 — część druga 6

3.1 Zadanie 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2 Zadanie 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
3.3 Zadanie dodatkowe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1 Krótki opis zagadnienia:

1.1 Informacje o badanch danych:
Będziemy korzystać z danych o:
• Porównanie wyników dwóch kolokwiów w pewnej grupie studentów:
Negatywny Pozytywny
Negatywny 30.00 46.00
Pozytywny 24.00 36.00
• Tabela reakcji po godzinie od przyjęcia dwóch różnych leków przeciwbólowych
Negatywna Pozytywna
Negatywna 1.00 5.00
Pozytywna 2.00 4.00
1
• Tabela zawierająca dane na temat oceny pracy rządu przez społeczeństwo, które było
zadane w dwóch badanych okresach tej samej grupie respondentów pewnej populecja
-2 -1 0 1 2
-2 5.00 2.00 1.00 0.00 0.00
-1 6.00 3.00 2.00 2.00 0.00
0 1.00 4.00 5.00 5.00 2.00
1 0.00 10.00 15.00 18.00 5.00
2 1.00 2.00 5.00 3.00 2.00
gdzie odpowiedzi są kodowane w następujący sposób: −2 — zdecydowanie źle, −1 — raczej

źle, 0 — nie mam zdania, 1 — raczej dobrze, 2 — zdecydowanie dobrze.
1.2 Teoretyczny opis narzedzi uzywanych przy analizie oraz wa-

znych terminów teoretycznych
• Test Bowkera (funkcja mcnemary dla symetri) — jest testem dla sprawdzenia symetrii
danych. Oparty jest na statystyce testowej Pearsona χ2
1. Liczba stopni swobody jest równa:
I(I − 1)
r=
2
2. Wartość poziomu krytycznego wyznaczamy ze wzoru:
p = 1 − Fχ2 (r) (x2 )
• Test ilorazu wiarygodności dla symetrii — przy weryfikacji hipotezy o symetrii statystyka
G2 jest postaci:
X I XI
2
G =2 Yij ln(Yij /np̂ij )
i=1 j=1
gdzie p̂ij , i, j ∈ {1, 2, . . . , I} są estymatorami najwyższej wiarygodności parametrów pij

przy założeniu symetrii, czyli
Yij + Yji
p̂ij = , i, j = 1, . . . , I
2n
Wartość poziomu krytycznego w teście Ilorazu Wiarygodności wyznaczamy ze wzoru
p = 1 − Fχ2 (r) (g 2 )
gidze Fχ2 (r) jest dystrybuantą rozkładu χ2 z r = I(I − 1)/2 stopniami swobody, a g 2 jest
wartością statystyki G2
• Moc testu — prawdopodobieństwo wykrycia różnicy między dwoma populacjami, gdy rze-
czywiście istnieje ta różnica. Im wyższa moc testu, tym bardziej prawdopodobne jest, że
test wykryje różnicę, gdy ona faktycznie istnieje.
2
• Test ilorazu wiarygodności dla quasi-symetrii — modelem quasi-symetrii dla danych po-
wtarzanych jednokrotnie nazywamy model, w ktrórym
pij = αi βj γij
gdzie γij = γji dla każdego i < j gdzie i, j = {1, . . . , I} oraz wszystkie parametry są
dodatnie. Model quasi-symetrii nie pociąga za sobą jednorodności rozkładów brzegowych
(w przeciwieństwie do modelu symetrii). Liczba stopni swobody granicznego rozkładu χ2
tych statystyk testowych wynosi
(I − 1)(I − 2)
r=
2
• Model jednorodności rozkładów brzegowych — rozkład {pij : i, j = 1, . . . , I} podlega

modelowi jednorodności rozkładów brzegowych wtedy i tylko wtedy, gdy
pi+ = p+i , ∀i=1,...,I
2 Lista 10 — część pierwsza

2.1 Zadanie 1
Przyjmując, że poziom trudności zadań na pierwszym i drugim kolokwium był taki sam, na
podstawie danych:
Negatywny Pozytywny
Negatywny 30.00 46.00
Pozytywny 24.00 36.00
zweryfikujemy na poziomie istotności 0.05 hipotezę, że studenci byli tak samo przygotowani
do obu kolokwiów:
mcnemar.test(m1, correct = FALSE)$p.value
## [1] 0.008550979
mcnemar.test(m1, correct = TRUE)$p.value
## [1] 0.0120738
Widzimy, że na podstawie testu chi-kwadrat Mcnemar’y z oraz bez poprawki na ciągłość,

możemy odrzucić hipotezę zerową na poziomie istotności 0.05, więc studenci nie byli tak samo
przygotowani na oba kolokwia.
2.2 Zadanie 2
Na podstawie danych dotyczących reakcji po godzinie od przyjęcia dwóch różnych leków prze-
ciwbólowych stosowanych w migrenie:
3
Negatywna Pozytywna
Negatywna 1.00 5.00
Pozytywna 2.00 4.00
sprawdzimy hipotezę, że leki te są jednakowo skuteczne korzystając z testu

• McNemary’ego z poprawką na ciągłość
mcnemar.test(m2, correct = TRUE)$p.value
## [1] 0.4496918
• dokładnego
pvalue <- function(dane){

if (dane[1,2] < (dane[1,2]+dane[2,1])/2) {
list = c()
for (k in 1:dane[1,2]) {
new_el = choose(dane[1,2] + dane[2,1],k)*((1/2)^k)*
((1/2)^(dane[1,2]+dane[2,1] - k))
list = append(list, new_el)
}
result = 2*sum(list)
} else if ( dane[1,2] > (dane[1,2]+dane[2,1])/2) {
list = c()
for (k in dane[1,2]:(dane[1,2]+dane[2,1])) {
new_el = choose( dane[1,2] + dane[2,1],k)*
((1/2)^k)*((1/2)^(dane[1,2]+dane[2,1] - k))
list = append(list, new_el)
}
result = 2*sum(list)
} else {
result = 1
}
result
}
pvalue(m2)
## [1] 0.453125
mcnemar.exact(m2)$p.value
## [1] 0.453125
widać, że wynik nowej funkcji jest taki sam, jak funkcji wbudowanej więc jest ona napisana
poprawnie.
Zatem na podstawie obu testów, na poziomie istotności 0.05 możemy przyjąć hipotezę zerową,
czyli oba leki są tak samo skuteczne.
4
2.3 Zadanie 3
Przeprowadzimy symulację, w celu porównania mocy testu Z i testu Z0 :
TestZ<-function(matrix){
m=matrix/sum(matrix)
sigma=(sum(m[1,])*(1-sum(m[1,]))+sum(m[,1])*(1-sum(m[,1]))-
2*(m[1,1]*m[2,2]-m[1,2]*m[2,1]))/sum(matrix)
D=sum(m[1,])-sum(m[,1])
Z=D/sqrt(sigma)
2*(1-pnorm(abs(Z)))
}
#######################################################
TestZ0<-function(matrix){
Z0=(matrix[1,2]-matrix[2,1])/(sqrt(matrix[1,2]+matrix[2,1]))
2*(1-pnorm(abs(Z0)))
}
####################################################
#funkcja pomocnicza
wyniki<-function(p2){
m=1000
p1<-0.5
X<-sample(c(0,1),n,replace=TRUE,prob=c(1-p1,p1))
Y<-sample(c(0,1),n,replace=TRUE,prob=c(1-p2,p2))
X<-factor(X,levels=c("0","1"))
Y<-factor(Y,levels=c("0","1"))
dane<-ftable(X,Y)
}
############################################################
n=100
p2_vec=seq(0.01,0.99,0.01)
alpha=0.05
moc1=c()
moc2=c()
for (p in p2_vec){
M=1000
res1=0
res2=0
for(i in 1:M){
matrix<-wyniki(p)
5
test1<-TestZ(matrix)
res1=res1+(test1>alpha)
test2<-TestZ0(matrix)
res2=res2+(test2>alpha)
moc1=append(moc1,res1/M)
moc2=append(moc2,res2/M)
colors=c("blue","red")
shapes<-c(1,2)
plot(p2_vec,moc1,pch=1,cex = 2/3,main="porównanie mocy testów",
xlab="p",ylab="moc testu",col="blue")
points(p2_vec,moc2,pch=2,cex = 2/3,col="red")
legend("topleft", inset=.02, title="testy",
c("Z","Z0"), pch=shapes, horiz=FALSE, cex=1,col=colors)
porównanie mocy testów
testy
Z
0.8
Z0
0.6
moc testu
0.4
0.2
0.0
0.0 0.2 0.4 0.6 0.8 1.0
Widzimy, że test Z0 ma większą moc niż test Z, czyli jest skuteczniejszy.
6
3 Lista 11 — część druga
3.1 Zadanie 1
Korzystając z testu Bowkera i testu Ilorazu Wiarygodności, na poziomie istotności 0.05 zwery-
fikujemy hipotezę, że dane w tabeli
-2 -1 0 1 2
-2 5.00 2.00 1.00 0.00 0.00
-1 6.00 3.00 2.00 2.00 0.00
0 1.00 4.00 5.00 5.00 2.00
1 0.00 10.00 15.00 18.00 5.00
2 1.00 2.00 5.00 3.00 2.00
• podlegają modelowi symetrii
mcnemar.test(m3,correct=FALSE)$p.value
## [1] NaN
mcnemar.test(m3,correct=TRUE)$p.value
## [1] NaN
Test Bowkera nie działa, przez to, że w tabeli występują zera (dzielenie przez zero w
statystyce testowej).
count<-c(5,2,1,0,0,6,3,2,2,0,1,4,5,5,2,0,10,15,18,5,1,2,5,3,2)
Ocena1<-gl(5,5,labels=c("-2","-1","0","1","2"))
Ocena2<-gl(5,1,labels=c("-2","-1","0","1","2"))
DaneM3<-data.frame(Ocena1,Ocena2,count)
symmetry <- glm(count ~ Symm(Ocena1, Ocena2), data=DaneM3, family = poisson)
summary(symmetry)
##
## Call:
## glm(formula = count ~ Symm(Ocena1, Ocena2), family = poisson,
## data = DaneM3)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -1.8988 -0.6149 0.0000 0.5491 1.4888
##
## Coefficients:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.609e+00 4.472e-01 3.599 0.00032 ***
## Symm(Ocena1, Ocena2)-2:-1 -2.231e-01 5.701e-01 -0.391 0.69549
7
## Symm(Ocena1, Ocena2)-2:0 -1.609e+00 8.367e-01 -1.924 0.05440 .
## Symm(Ocena1, Ocena2)-2:1 -1.991e+01 4.043e+03 -0.005 0.99607
## Symm(Ocena1, Ocena2)-2:2 -2.303e+00 1.095e+00 -2.102 0.03556 *
## Symm(Ocena1, Ocena2)-1:-1 -5.108e-01 7.303e-01 -0.699 0.48425
## Symm(Ocena1, Ocena2)-1:0 -5.108e-01 6.055e-01 -0.844 0.39889
## Symm(Ocena1, Ocena2)-1:1 1.823e-01 5.323e-01 0.343 0.73196
## Symm(Ocena1, Ocena2)0:0 -5.943e-16 6.325e-01 0.000 1.00000
## Symm(Ocena1, Ocena2)0:1 6.931e-01 5.000e-01 1.386 0.16566
## Symm(Ocena1, Ocena2)0:2 -3.567e-01 5.855e-01 -0.609 0.54243
## Symm(Ocena1, Ocena2)1:1 1.281e+00 5.055e-01 2.534 0.01128 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 101.73 on 24 degrees of freedom
## Residual deviance: 19.82 on 10 degrees of freedom
## AIC: 115.26
##
## Number of Fisher Scoring iterations: 16
x = symmetry$deviance
r=nrow(m3)*(nrow(m3)-1)/2
(p.value=1-pchisq(x,r))
## [1] 0.03100543
zatem na poziomie istotności α = 0.05 możemy odrzucić hipotezę zerową, z czego wynika,
że tabela nie jest symetryczna.
• podlegają modelowi quasi-symetrii
quasi.symm <- glm(count ~ Ocena1+Ocena2 + Symm(Ocena1,Ocena2),data=DaneM3, family =

summary(quasi.symm)
##
## Call:
## glm(formula = count ~ Ocena1 + Ocena2 + Symm(Ocena1, Ocena2),
## family = poisson, data = DaneM3)
##
## Deviance Residuals:
## Min 1Q Median 3Q Max
## -0.87659 -0.08305 0.00000 0.10798 0.75209
##
8
## Coefficients: (4 not defined because of singularities)
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 1.609e+00 4.472e-01 3.599 0.00032 ***
## Ocena1-1 -9.896e-01 9.272e-01 -1.067 0.28584
## Ocena10 6.561e-01 7.220e-01 0.909 0.36348
## Ocena11 1.477e+00 6.891e-01 2.143 0.03209 *
## Ocena12 6.601e-01 6.236e-01 1.058 0.28983
## Ocena2-1 -1.790e+00 9.077e-01 -1.972 0.04864 *
## Ocena20 -6.585e-01 6.981e-01 -0.943 0.34549
## Ocena21 -1.025e+00 6.969e-01 -1.470 0.14150
## Ocena22 -1.576e+00 6.236e-01 -2.528 0.01148 *
## Symm(Ocena1, Ocena2)-2:-1 1.089e+00 9.331e-01 1.167 0.24339
## Symm(Ocena1, Ocena2)-2:1 -2.222e+01 8.316e+03 -0.003 0.99787
## Symm(Ocena1, Ocena2)-2:2 -2.371e+00 1.146e+00 -2.068 0.03862 *
## Symm(Ocena1, Ocena2)-1:-1 2.269e+00 1.738e+00 1.305 0.19174
## Symm(Ocena1, Ocena2)-1:0 8.473e-01 1.181e+00 0.717 0.47312
## Symm(Ocena1, Ocena2)-1:1 1.021e+00 1.108e+00 0.921 0.35703
## Symm(Ocena1, Ocena2)-1:2 NA NA NA NA
## Symm(Ocena1, Ocena2)0:0 2.381e-03 1.154e+00 0.002 0.99835
## Symm(Ocena1, Ocena2)0:1 3.014e-01 9.090e-01 0.332 0.74019
## Symm(Ocena1, Ocena2)0:2 NA NA NA NA
## Symm(Ocena1, Ocena2)1:1 8.285e-01 1.030e+00 0.804 0.42119
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## (Dispersion parameter for poisson family taken to be 1)
##
## Null deviance: 101.733 on 24 degrees of freedom
## Residual deviance: 2.206 on 6 degrees of freedom
## AIC: 105.65
##
## Number of Fisher Scoring iterations: 18
x=quasi.symm$deviance
r=(nrow(m3)-1)*(nrow(m3)-2)/2
(p.value=1-pchisq(x,r))
## [1] 0.899807
na poziomie istotnośc α = 0.05 nie mamy podstaw do odrzucenia hipotezy zerowej, zatem
tabela jest quasi-symetryczna.
9
3.2 Zadanie 2
Zweryfikujemy hipotezę, że ocena prac rządu w dwóch badanych okresach w badanej populacji
nie uległa zmianie: Tabela jest rozmiaru większego niż 2 × 2 więc nie możemy powiedzieć nic o
jednorodności na podstawie informacji o symetrii uzyskanej powyżej (dane nie są symetryczne).
comparison <- anova(symmetry, quasi.symm)

(p.value=1-pchisq(comparison$Deviance[2],comparison$Df[2]))
## [1] 0.00146819
Zatem na poziomie istotności α = 0.05 możemy odrzucić hipotezę zerową. Czyli na pod-
stawie wyniku testu jednorodności, możemy stwierdzić, że ocena pracy rządu uległa zmianie
między okresami.
3.3 Zadanie dodatkowe
10

Sprawozdanie NR 3: Spis Treści

Uploaded by

Document Informationclick to expand document information

Document Informationclick to expand document information

Copyright:

Available Formats

Sprawozdanie NR 3: Spis Treści

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Sprawozdanie NR 3: Spis Treści

Uploaded by

Copyright:

Available Formats

Sprawozdanie nr 3

2 Lista 10 — część pierwsza 3

3 Lista 11 — część druga 6

1 Krótki opis zagadnienia:

• Tabela reakcji po godzinie od przyjęcia dwóch różnych leków przeciwbólowych

gdzie odpowiedzi są kodowane w następujący sposób: −2 — zdecydowanie źle, −1 — raczej

1.2 Teoretyczny opis narzedzi uzywanych przy analizie oraz wa-

1. Liczba stopni swobody jest równa:

p = 1 − Fχ2 (r) (x2 )

gdzie p̂ij , i, j ∈ {1, 2, . . . , I} są estymatorami najwyższej wiarygodności parametrów pij

• Model jednorodności rozkładów brzegowych — rozkład {pij : i, j = 1, . . . , I} podlega

pi+ = p+i , ∀i=1,...,I

2 Lista 10 — część pierwsza

mcnemar.test(m1, correct = FALSE)$p.value

mcnemar.test(m1, correct = TRUE)$p.value

Widzimy, że na podstawie testu chi-kwadrat Mcnemar’y z oraz bez poprawki na ciągłość,

sprawdzimy hipotezę, że leki te są jednakowo skuteczne korzystając z testu

mcnemar.test(m2, correct = TRUE)$p.value

pvalue <- function(dane){

porównanie mocy testów

0.0 0.2 0.4 0.6 0.8 1.0

Widzimy, że test Z0 ma większą moc niż test Z, czyli jest skuteczniejszy.

• podlegają modelowi symetrii

• podlegają modelowi quasi-symetrii

quasi.symm <- glm(count ~ Ocena1+Ocena2 + Symm(Ocena1,Ocena2),data=DaneM3, family =

comparison <- anova(symmetry, quasi.symm)

3.3 Zadanie dodatkowe

You might also like