Todo Análisis de Datos II Menos Libro
Todo Análisis de Datos II Menos Libro
Todo Análisis de Datos II Menos Libro
Estudio de las muestras para conocer la población a la que representan. La inferencia siempre se hace
en términos probabilísticos (afirmamos con una cierta probabilidad de éxito). El error muestral es la
diferencia entre el resultado obtenido en la muestra y el que habríamos obtenido si se hubiese trabajado
con la población.
Para cada característica de la muestra que evaluemos se obtiene lo que se conoce como estadístico:
índices descriptivos de centralidad (Media), variabilidad (Varianza), etc. A partir de los estadísticos
obtenidos en la muestra (lo concreto), se realizan afirmaciones sobre los parámetros de la población (lo
general)
DISTRIBUCIONES DE PROBABILIDAD !
Teorema Central del límite: Si una población tiene una media µ y una varianza σ2 finitas, la
distribución de las medias muestrales de tamaño “n” extraídas de manera aleatoria e independiente,
se aproxima a la forma de una distribución normal con varianza σ2/n y media µ conforme el
tamaño de n se va incrementando. __
N ( µ , σ / √ n)
PROBLEMAS EJEMPLO
Los tiempos requeridos por un cierto autobús para alcanzar uno de sus destinos en una ciudad
grande forman una distribución normal con una desviación típica σ =1 minuto. Si se elige al azar una
muestra de 17 tiempos, encuentre la probabilidad de que la cuasi varianza muestral sea mayor que 2.
Se busca el valor de ji-cuadrado correspondiente a S2n-1=2
(n-1) S2n-1 16 · 2
X2n-1 = --------------------- ! X2n-1 = ------------ = 32
σ2 12
El valor de 32 se busca en la tabla Chi Cuadrado con 16 grados de
libertad. A este valor le corresponde una probabilidad de 0,99. En
consecuencia, 1-0´99 = 0´01! P(S2n-1 >2)
Un partido político cree que el 60% del electorado está a favor de su programa. Como su líder
encuentra que esta predicción es demasiado optimista decide hacer un sondeo con una muestra de
90 personas. ¿Cuál es la probabilidad de que como máximo 60 personas estén a favor de su partido?
0´67 – 0´60
P (60/90 = 0´67)! Z = --------------------- ! Z = (1´35) se corresponde con p = 0´9115
√ 0´6 · 0´4 / 90
Generalmente se desconocen los parámetros de la población por lo que se hace necesario estimarlos a
partir de los valores muestrales. Un estimador es un estadístico que utilizamos para estimar
parámetros. Se pueden considerar dos formas de estimar los parámetros poblacionales: estimación
puntual (Conocida como método de los momentos de Pearson, se extrapola el estadístico de la
muestra directamente a la población) y estimación por intervalos (establece un rango de valores
dentro del cual estaría el valor del parámetro, con una determinada probabilidad)
1.- Carencia de sesgo: un estimador es insesgado o centrado cuando el valor del estadístico (en las
infinitas muestras de tamaño “n” extraídas de una población) coincide con el valor del parámetro que
queremos estimar ! U es un estimador insesgado de θ, si ! E (U) = θ
La media, la proporción y la cuasi varianza de la muestra son estimadores insesgados de sus valores
poblacionales
2.- Eficiencia (Precisión): Se considera la inversa de la varianza de su distribución muestral. Cuanto
mayor es el cociente, mayor es la eficiencia. Eficiencia ! θ = 1 / σ20 (A mayor varianza, menor
eficiencia). La Media Aritmética es más eficiente que la Mediana. La Varianza es más eficiente que la
Cuasi varianza. Cuando tenemos distintos estimadores y queremos determinar el más eficiente, se
comparan sus eficiencias. Ejemplo: La varianza de la distribución muestral de dos estimadores es 2 y
1,5. Para un mismo tamaño muestral, la eficiencia relativa sería 1,5 / 2 = 0,75. Si el cociente fuera 1
serían iguales.
3.- Suficiencia: el estimador utiliza toda la información de la muestra para estimar el parámetro
(Ejemplo: La media muestral sería suficiente para estimar la media poblacional. No lo sería la amplitud
intercuartílica para estimar la varianza poblacional)
4.- Consistencia: El requisito mínimo que se le exige a un estimador es que sea consistente. Un
estimador es consistente si, a medida que se dispone de más información (que aumenta el tamaño de
la muestra), aumenta la probabilidad de que la estimación coincida con el parámetro. La media, la
proporción y la varianza insesgada son consistentes porque son estimadores insesgados de los
parámetros correspondientes y en sus límites valen cero (su sesgo y su varianza tienden a 0 a media
que aumenta n)
Cuando el valor del parámetro (población) coincide con el valor del estadístico (muestra), se considera
que la estimación (inferencia sobre la población a partir de la muestra) es insesgada. Siempre que
operemos se debe procurar que nuestros estimadores sean insesgados y tengan una varianza pequeña;
estas dos características se denominan acuracidad.
Una estimación por intervalos expresa el grado de confianza con el que se espera que esté el valor
del parámetro dentro del intervalo, por lo que se suele llamar intervalo de confianza. La amplitud del
intervalo nos indicará su precisión. A menor amplitud, más precisión, más informativo es, más útil.
Una estimación por intervalos depende de cuatro parámetros: una estimación puntual del
parámetro; una medida de variabilidad; una probabilidad (nivel de confianza) y un supuesto acerca de
la distribución en la población.
N(0,1) t n-1 gl
Distribución Normal (Conocida σ2) Desconocida la σ2 (Muestras pequeñas)
_ _ _ _ _ _
X + (Z α/2) · (σX) < µ < X + (Z1- α/2) · (σX) X + (t α/2) · (Sn- 1/√ n) < µ < X + (t1- α/2) · (Sn- 1/√ n)
Problemas ejemplo: Se midieron los niveles de depresión en una muestra de 100 personas.
Asumiendo un nivel de medida de intervalo y que la variable se distribuye normalmente en la
población, se calculó la media de las puntuaciones y se obtuvo un valor de (Media = 8) y una cuasi
desviación típica = 2. Hallar los límites del intervalo de confianza para la media de la población
con un nivel de confianza del 99%.
_
Datos ! X = 8 Distribución normal de la VD α = 0,01 Sn- 1 = 2
Hallar los límites del intervalo de confianza suponiendo que la muestra está compuesta por 25
personas, a un nivel de confianza del 95%.
_
Datos ! X = 8 Distribución normal de la VD α = 0,05 Sn- 1 = 2
_ _
Intervalo de confianza ! X ± (t α · Sn- 1 / √ n) = Límite superior y Límite inferior
Problemas Ejemplo: En una muestra aleatoria de 20 sujetos, extraída de una población normal, se ha
obtenido una media de 24 puntos y una cuasi desviación típica de 10,8 puntos. Averiguar los límites del
intervalo de confianza para la varianza de la población, suponiendo α = 0,05.
Según las tablas χ2n-1 (χ219) ! para (α / 2 = 0,025) ! 8,91 y para (1 - α / 2 = 0,975) ! 32,9
(19 · 10,82) / 32,9 < σ2 < (19 · 10,82) / 8,91 ! Límites del intervalo de confianza ! [67,36 y 248,7]
Con un margen de error del 8% el tratamiento será efectivo entre el 69% y el 87% de los casos.
La amplitud del intervalo de confianza depende de dos factores: el nivel de confianza y el error típico de
la distribución muestral del estadístico (La suma de ambos E = Error máximo de estimación). Cuanto
mayor es el tamaño de la muestra mayor es la precisión del intervalo y mayor la precisión de la
estimación. Cuanto menor es el error típico, menor es el intervalo de confianza y, por tanto, más preciso
(para reducirlo se aumenta el tamaño muestral)
Problemas Ejemplo: Por experiencias anteriores se sabe que las estaturas de los soldados tienen una
varianza de 64 cm. ¿Qué tamaño debe tener la muestra para que la media estimada no se aleje más de
± 1, 5 puntos de la media poblacional?: considere (α = 0,02).
Con un margen de error del 2% debemos tomar una muestra de 154 soldados.
" Un estudio sobre la proporción de fumadores entre el personal de un hospital estableció que sólo
fumaban el 35%. Si el análisis se efectuó con un nivel de confianza del 95%, ¿Qué tamaño debió
tener la muestra para que la proporción estimada no se aleje más de ± 0,15 puntos de la proporción
poblacional?: considere (α = 0,05).
Hipótesis estadística: proposición (afirmación) sobre algún aspecto de la distribución de una población
(parámetro, forma, etc.) que puede someterse a prueba a través de una muestra aleatoria de esa
población. No tiene por qué suponerse interés científico.
Contraste de hipótesis: Procedimiento por el cual decidimos si una propuesta sobre la población
puede aceptarse o no. Su finalidad es generalizar un resultado muestral a la población de la que procede
la muestra. Siempre se formulan dos hipótesis (exhaustivas y mutuamente excluyentes); de tal modo,
que el rechazo de una implica la aceptación de la otra.
H0 (hipótesis nula): se acepta provisionalmente como verdadera y se somete a contraste.
H1 (hipótesis alternativa): se acepta al rechazar la hipótesis nula.
" La media (µ) es algún valor " La media (µ) es algún valor " La media (µ) es algún valor
Igual o distinto a (X) No inferior a (X). No superior a (X).
Ho : µ = X Ho : µ ≥ X Ho : µ ≤ X
H1 : µ ≠ X H1 : µ < X H1 : µ > X
Se trata de averiguar la discrepancia entre los datos empíricos observados en la muestra y los datos
teóricos que planteamos en la H0.
Regla de decisión: Tomando en consideración el valor o los valores críticos (máxima diferencia
que cabe esperar por simple azar entre los datos empíricos y los teóricos) y a partir del nivel de
significación. Acumulado en los contrastes unilaterales (α) y dividido por dos en los bilaterales (α/2)
Nivel crítico (p) ! Calcular la probabilidad de obtener unos resultados como los observados en la
muestra bajo el supuesto de que la H0 es cierta.
Zona de rechazo (depende de que el contraste sea bilateral o unilateral). Teniendo en cuenta el riesgo
adoptado se determinan los valores del estadístico y se decide si la hipótesis nula es verdadera o falsa.
Nunca puede afirmarse categóricamente que la hipótesis es cierta o falsa, se afirma con un determinado
nivel de probabilidad. Así, ¿Cómo decidir sobre la hipótesis nula? ! Dos métodos equivalentes:
Ho (Cierta) ! (p) es mayor que (α) ! El valor se encuentra en el intervalo de confianza. El valor del
estadístico está entre los valores críticos.
Ho (Falsa) ! (p) es menor o igual que (α) ! El valor está fuera del intervalo de confianza. El valor del
estadístico supera o es inferior a los valores críticos.
El nivel de significación (α) se fija de antemano, mientras que el nivel crítico p es consecuencia
del resultado obtenido al aplicar el estadístico de contraste.
El contraste bilateral es más conservador que el contraste unilateral (es más difícil rechazar la H0)
4.- Fijar α (regla de decisión). La zona de rechazo de la H0 estará formada por todos los valores del
estadístico cuya probabilidad de ser obtenidos es muy pequeña bajo el supuesto de que la H0 es
cierta.
5.- Cálculo del estadístico de contraste con los datos obtenidos en la muestra.
Queremos contrastar la hipótesis que supone que la media poblacional en un test de atención de los
estudiantes de la ESO es de 35 puntos. La distribución de la variable en la población es normal con
varianza = 225. Extraemos una muestra aleatoria de 144 alumnos y obtenemos: una media = 32 puntos.
Fijamos un nivel de significación α = 0,05.
Los contrastes de hipótesis están basados en estadísticos (medidas de discrepancia) y tienen una
distribución de probabilidad conocida; así, todas las decisiones llevan aparejadas una probabilidad de
ocurrencia. Al tomar una decisión sobre una H0 pueden darse cuatro situaciones (dos de ellas son
decisiones acertadas y dos erróneas). Siempre debemos proponernos que (1 - α) y (1 - β) sean altos
y que α y β sean bajos.
Siempre se cumple ! α + (1 - α) = 1 y β + (1 - β) = 1
Error tipo II (β) ! Bajo la distribución de H1 cuando aceptamos erróneamente la H0 siendo falsa (β =
probabilidad de cometer error de tipo II)
Potencia de contraste (1–β) ! Representa la probabilidad de rechazar la H0 siendo falsa = la
probabilidad de aceptar una H1 verdadera (probabilidad de obtener un resultado estadísticamente
significativo) 1 – β = Probabilidad de no cometer Error tipo II.
Tamaño del efecto: Expresa la magnitud de la diferencia observada entre la H0 (el valor teórico) y la
H1 (el valor observado)
Un contraste de hipótesis es un procedimiento para decidir si una hipótesis se acepta como válida
o se rechaza. Los principales pasos para tomar la decisión son:
MEDIA POBLACIONAL
2
PARAMÉTRICOS CONOCIDA σ
2
DESCONOCIDA σ
Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente sigue una distribución normal
en la población y está medida, al menos, a nivel de intervalo. Podemos conocer o no el valor de la
varianza poblacional (también aplicable a cualquier otro tipo de distribución, con varianza
desconocida, si n ≥ 30, según el Teorema Central del Límite)
Hipótesis Estadísticas: µ0 es el valor concreto de la media poblacional acerca del cual queremos
comprobar si µ es diferente, menor o mayor // Se aconseja formular primero H1
Estadístico de contraste:
_ __
Conocida la varianza de la población ! Z = (Y - µ0) / σ / √ n
_ _
Y es la media muestral // σ / √n es el error típico de la media
µ0 es el valor propuesto para la media poblacional por H0
El Estadístico de Contraste sigue la distribución N (0,1)
_ __
Desconocida la varianza de la población ! T = (Y - µ0) / S n-1 / √ n
_
S2n-1 = (Y – Y)2 / n – 1 es la cuasi varianza muestal (estimador insesgado de varianza poblacional)
El Estadístico de Contraste sigue la distribución T de Student con n – 1 gl. (Cuando gl > 30 la
distribución T de Student se aproxima a la normal).
n S2
Relación entre la varianza y la cuasi varianza muestral ! (n-1) S n-1 = n S // Luego S n-1 = ---------
2 2 2
n-1
Intervalo de confianza: _ _
Y + Z α/2 · σ / √n = LS y LI (conocida σ2 poblacional)
_ ______
Y + T n-1; α/2 · Sn-1 / √n = LS y LI (desconocida σ2 poblacional)
PRUEBA DE LOS SIGNOS: Considera que el valor de la mediana bajo la H0 es correcto; por tanto,
en la población, existirán similares valores por encima y por debajo (mismo número de signos
positivos y negativos al calcular la diferencia entre cada valor y la mediana propuesta en la H0)
Supuestos (Razones que justifican su elección): muestra aleatoria de “n” observaciones aleatorias
e independientes de una población con mediana desconocida. Contraste sobre el Promedio
Poblacional. Desconocemos el cumplimiento de los supuestos paramétricos. Asumimos que la
distribución de la variable es continua por lo que no debemos encontrar diferencias nulas, si
aparecen, se descartan). Datos directos, sin agrupar, medidos, al menos, en una escala ordinal.
Hipótesis Estadísticas:
Contraste Bilateral: H0: η = η0
H1: η ≠ η0
Contraste Unilateral Izquierdo H0: η ≥ η0
H1: η < η0
Contraste Unilateral Derecho H0: η ≤ η0
H1: η > η0
Estadístico de contraste: (S+ ó S-) se obtienen al restar cada una de las observaciones del valor
de la mediana propuesto por la H0. Si alguna diferencia es nula, se elimina, reduciéndose el tamaño
de la muestra. ____
Cuando la muestra es grande se aproxima a la normal mediante [S+ (ó S-) – n/2] / √ n/4
PRUEBA DE WILCOXON: Conocida como “prueba de rangos y signos”, gana en precisión con
respecto a la prueba de los Signos, ya que aprovecha mejor la información disponible; tiene en
cuenta, a la vez, el signo de las diferencias y la magnitud de las mismas. Wilcoxon es una prueba
más precisa.
Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. Se trata de un contraste sobre el Promedio Poblacional.
Desconocemos el cumplimiento de los supuestos paramétricos. La distribución de la variable en la
población ha de ser simétrica y continua. Datos directos, sin agrupar. Nivel de medida de los
datos, al menos, de intervalo.
Cálculo del Estadístico de Contraste: (∑R+ ó ∑R-) suma de rangos positivos y negativos.
Conocemos los datos obtenidos en la muestra // Calculamos las diferencias entre cada observación
y la mediana propuesta por la H0. Se eliminan las diferencias nulas, reduciendo el tamaño muestral
“n” // Estas diferencias, en valor absoluto, se ordenan de menor a mayor, y se sustituye cada una de
ellas por el rango que le corresponde // Si hay empates, se adopta el “criterio del rango medio”; es
decir, se le atribuye a cada una el rango promedio de los rangos que les hubieran correspondido de
ser diferentes // A cada rango se le añade el signo + o – de la puntuación de diferencia
correspondiente y se suman, obteniendo R+ y R-
Distribución muestral del estadístico: distribución de valores de Wilcoxon. Para utilizar la tabla W
de Wilcoxon se selecciona el sumatorio más pequeño y se toma la decisión mediante los valores
críticos.
PROBLEMAS EJEMPLO
CONTRASTE SOBRE LA MEDIA (VARIANZA POBLACIONAL CONOCIDA)
Vamos a plantear otro supuesto que modificaría la definición de las hipótesis ! Sospechamos,
antes de realizar el experimento, que la modificación en el proceso de fabricación aumenta el
grado alcohólico.
Supuestos: Similares; Hipótesis (Contraste unilateral derecho): H0: µ = 12´5 y H1: µ > 12´5
Estadístico de contraste: Similar
Valores críticos: con α = 0´05 y un contraste unilateral derecho ! 1´65
Decisión estadística: El valor del estadístico de contraste (0´217) se sitúa en la región de
aceptación (por debajo del valor crítico 1´65); por tanto aceptamos H0.
El nivel crítico (p): asociado al estadístico de contraste (0´217) es 0´4129 (1-0´5871) que resulta
mayor que el nivel de significación fijado (α = 0´05); por tanto, aceptamos H0
Conclusión: El cambio en la fabricación no ha modificado significativamente el grado alcohólico.
Interpretación: Con la información de la que disponemos no hemos encontrado evidencia
suficiente de que la media no sea igual a 12.5
Siguiendo con el ejemplo del grado alcohólico de los vinos de la denominación de origen de
Ribera de Duero, los resultados del contraste bilateral desconocida la varianza de la población
(suponiendo que no nos hubieran facilitado este parámetro), serían:
Problema ejemplo: Una determinada empresa utiliza, desde hace muchos años, un test de aptitudes
para seleccionar a sus empleados. Para dicho test tiene establecido que la mediana está en 180. El
psicólogo de la empresa quiere probar que efectivamente la mediana sigue siendo correcta (probar la
H0 de que la mediana en la población es igual a 180). Para ello obtiene una muestra de 15
trabajadores y les aplica el test obteniendo los siguientes resultados:
189 233 195 160 212 176 231 202 193 174 166 248 199 213 185
Estadísticos de Contraste: #
Signos: Previamente ordenamos las puntuaciones (la mediana es un índice de posición). Restando
180 a cada una de las 15 puntuaciones obtenidas por los sujetos, obtenemos 11 (S+) y 4 (S-)
160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
- - - - + + + + + + + + + + + SIGNOS
Wilcoxon: Más precisa. Después de ordenar las puntuaciones de menor a mayor y ordenar las
diferencias con la mediana en valor absoluto, obtenemos:
160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
-4 5 -6 9 13 -14 15 19 -20 22 32 33 51 53 68 ORDEN
- + - + + - + + - + + + + + + SIGNOS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 RANGOS
Decisión estadística:
Signos: Función de distribución Binomial (Tabla II); para n = 15 y probabilidad = 0,50, encontramos el
valor 0,0592 ! P (S- ≤ 4) = 0,0592. Para averiguar el nivel crítico p, multiplicamos por 2 la
probabilidad asociada al estadístico de contraste (0´0592 · 2 = 0´1184) dado que es bilateral.
Wilcoxon: Tablas ! para un contraste bilateral con α/2 = 0,025 y n = 15; el valor crítico es ! 26
Conclusión:
Signos: Como p (0´1184) es mayor que α (0,05) Mantenemos H0. También tabla (Test de signos dos
direcciones) para n =15 y α = 0,05, y un contraste bilateral, el valor crítico es igual a 3 ! como S- = 4 >
3 (Mantenemos H0)
Wilcoxon (más precisa): Como 19 (se toma la suma menor) < 26 ! Rechazamos la H0
Interpretación:
Signos: Teniendo en cuenta los resultados, es posible seguir manteniendo que la Mediana de la
población de referencia es 180, con un α = 0,05.
Wilcoxon: Teniendo en cuenta los resultados, no es posible seguir manteniendo que la Mediana de la
población de referencia es 180, con un α = 0,05.
Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente sigue una distribución normal y
está medida, al menos, a nivel de intervalo.
Hipótesis Estadísticas:
2 2
Contraste Bilateral: H0: σ = σ 0
2 2
H1: σ ≠ σ 0
2 2
Contraste Unilateral Izquierdo H0: σ ≥ σ 0
2 2
H1: σ < σ 0
2 2
Contraste Unilateral Derecho H0: σ ≤ σ 0
2 2
H1: σ > σ 0
σ20 es el valor concreto de la varianza poblacional acerca del cual queremos comprobar si la
varianza poblacional es diferente, menor o mayor // Se aconseja formular primero H1.
σ2o es el valor propuesto para la varianza poblacional por H0 y S2n-1 = la cuasi varianza muestral. El
Estadístico de Contraste sigue una distribución Chi-Cuadrado con (n-1) gl.
Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente es dicotómica.La proporción es
el cociente entre el número de veces que aparece la observación dividido entre el número total de
observaciones)
Hipótesis Estadísticas:
Contraste Bilateral: H0: π = π0
H1: π ≠ π0
Contraste Unilateral Izquierdo Ho: π ≥ π0
H1: π < π0
Contraste Unilateral Derecho H0: π ≤ π0
H1: π > π0
PROBLEMAS EJEMPLO
Contraste de hipótesis sobre la varianza: Los resultados de un reciente estudio indican que 81
estudiantes de primero de Psicología de la UNED, elegidos mediante muestreo aleatorio simple,
estudian una media de 6 horas a la semana, con una cuasi desviación típica de 3. La población
universitaria europea estudia, también, una media de 6 horas a la semana, pero con una desviación
típica de 2. Queremos saber si la variabilidad encontrada en nuestra muestra es estadísticamente
diferente de la de la población de estudiantes europeos. Trabajaremos a un nivel de confianza del
95 %.
_
Supuestos: Muestra aleatoria de 81 estudiantes de la UNED (X = 6 y SX = 3). Datos de la población
de estudiantes europea (µ = 6 y σ = 2) para α = 0,05. La variable dependiente está medida, al
menos, a nivel de intervalo. Se plantea un CH sobre la varianza.
Decisión estadística:
$ A partir de los valores críticos (80 gl; α/2 = 0,025 y 1-α/2 = 0,975) ! 57´15 y 106´63.
Rechazamos la H0 porque el valor muestral del estadístico de contraste (180) > el valor
crítico superior (χ2 = 106´63)
$ Si tenemos en cuenta el nivel crítico p (χ2 = 180 con 80 gl ! encontramos que p es < 0´005)
y dado que p < α (0´05) ! Rechazamos H0.
$ Considerando el intervalo de confianza: Rechazamos H0 (σ2 = 4 no está en el intervalo)
80 · 9 80 · 9
Intervalo de confianza ! ---------------- < σ2 < ----------------- (6´75 y 12´61)
106´63 57´11
Hipótesis: Contraste bilateral (no se especifica ninguna dirección a favor o en contra). Sabemos
que π = 3/5 = 0,6 y la hipótesis nula se centra si nuestros datos son compatibles con este resultado
(teóricamente poblacional). Luego ! H0: π = 0´6; H1: π ≠ 0´6
Estadístico de contraste: Nuestra proporción es ! 435/750 = 0´58. Con estos datos aplicamos la
fórmula del estadístico de contraste ! Z = (0´58 – 0´6) / (√ 0´6·0´4 / 750) = - 0´02 / 0´0179 = - 1´12.
Valores críticos: Al tratarse de un contraste bilateral deben ser dos valores. Buscando en las tablas
de la curva normal con α = 0´04 (bilateral α/2 = 0´02 y 1-α/2 = 0´98) encontramos las puntuaciones
típicas (- 2´05 y 2´05)
Decisión estadística:
$ Teniendo en cuenta los anteriores valores críticos (- 2´05 y 2´05), Aceptamos la H0 porque el
valor muestral del estadístico de contraste (- 1´12) > el valor crítico inferior (- 2´05)
$ Si tenemos en cuenta el nivel crítico p (Z (-1´12) = 0´1314; luego 2 · 0´1314 = 0´2628). Como p
(0´2628) > que α (0´04) ! Aceptamos H0.
$ Considerando el intervalo de confianza: Aceptamos H0 (0´6 está en el intervalo)
____________ __________________
P ± |Zα/2| √ (π0 (1 - π0) / n ! 0´58 ± 2´05 √ (0´58 (1 – 0´58) / 750 = (0´543 y 0´617)
Conclusión e interpretación: Dado que hemos aceptado la hipótesis nula (π = 0´6) podemos
afirmar que el 60% de la población española están en contra de la inmigración ilegal; por tanto, el
40% estará a favor.
Problema ejemplo: La aplicación de un test entre docentes tiene, por experiencias anteriores, una
media de 55 y una varianza de 121, N (55, 121). Un psicólogo educativo considera que en la actualidad
el promedio se ha incrementado, pasando a ser de 60 puntos. Para contrastar esta hipótesis somete al
test a 50 individuos extraídos aleatoriamente de la población y obtiene una media de 58. Fijando un
nivel de significación α = 0,01. ¿Puede aceptarse la hipótesis del psicólogo?
Hipótesis estadísticas (contraste unilateral derecho): H0: µ0 = 55 y H1: µ1 > 55 (µ1 = 60)
Descripción de la variable y de los datos muestrales: Variable medida a nivel de intervalo, distribución
normal, con varianza conocida N (55, 121) y observaciones aleatorias e independientes.
Estadístico de contraste y cálculo: Bajo la H0: µ0 = 55, tipificamos la media muestral = 58.
_ ___
Z = (Y – µ0) / σY ! Z = (58 - 55) / (11 / √ 50) = 1,93
Decisión estadística:
$ A partir del valor crítico (para α = 0,01. Se trata de un contraste unilateral, acumula α en una
sola cola ! Z = 2,33). Como 1´93 (valor del estadístico de contraste) < 2´33 (valor crítico) ! Se
acepta la H0.
$ A partir del nivel crítico p (al valor del estadístico de contraste 1´93 le corresponde en las tablas
una probabilidad de p (Z < 1,93) = 0,9732 ! 1-0´9732 = 0´0268). Al tratarse de un contraste
unilateral p = 0´0268 > α = 0´01; Por tanto, Se acepta la H0
Interpretación de los resultados: Para un nivel de significación α = 0,01, no podemos afirmar que la
media poblacional se ha incrementado en la actualidad.
Bajo la Hipótesis nula (H0: µ0 = 55) se determina el límite entre la región de aceptación y rechazo
(Contraste unilateral derecho)
_ -----------------------------------|-----
Z = (Yc – µ0) / σY ! Z = 2,33 Z = (Yc - 55) / (11 / √50); Yc = 58,62
_ ------------------|------------------------------
Z = (Yc – µ1) / σY Z = (58,62 - 60) / (11 / √50); Z = (- 0,89)
Probabilidad de obtener una Z ≤ (- 0,89) ! Z (-0,89) = 0,1867 ! β = 0,1867 (error tipo II)
Potencia de Contraste ! (1 – β) = 0,8133
TIPOS DE MUESTRAS
CONTRASTE DE HIPÓTESIS
Estadístico
de
Contraste
Dos centros de Educación Especial vienen utilizando, desde hace dos años, métodos diferentes
para estimular las funciones superiores de los niños con retraso mental. El director de uno de los
centros sostiene que su método (Método A) logra mejores resultados que el del otro centro (Método
B). Para estudiar esta cuestión, fijamos α = 0,03, extraemos aleatoria e independientemente dos
muestras de niños, una en cada centro (nA = 120 y nB = 50) y les medimos el cociente intelectual (CI)
en una escala de intervalo. Los niños de ambos centros iniciaron el programa de estimulación con
un CI medio igual a 70 y los CI medios tras el programa fueron 79 para los niños estimulados con el
método A y 74 para los estimulados con el método B. La distribución de los CI es normal en las
poblaciones con σA = 18 y σB = 12 y todas las observaciones son independientes entre sí.
Hipótesis: Planteamos un contraste unilateral derecho (queremos probar si el método A es más eficaz)
Regla de decisión:
Valores críticos (para un nivel de confianza del 97% y un contraste unilateral, el valor crítico es !
Z0´97 = (1´88)
Nivel crítico p (el estadístico de contraste 2´12 se asocia a una probabilidad p = P (Z ≥ 2,12)
! 1 – 0,983 = 0,017
Conclusión: Se rechaza H0 [el estadístico de contraste 2´12 > 1´88 (valor crítico) y también p =
0,017 (nivel crítico) < α = 0,03 (nivel de significación)].
Interpretación: El programa de estimulación del CI ha sido eficaz con un nivel de confianza del
97% (mejor el método A que el método B)
Intervalo de confianza: Para realizarlo suponemos que se trata de un contraste bilateral; por tanto,
habría que reformular las hipótesis:
_ _
(Y1 – Y2) ± | Z α/2 | · Error típico ! Límite superior y Límite inferior
(79 – 74) ± (0,03/2 = Z (-2´17) · 2,36 (denominador e. contraste) = 5 ± 5´12 ! (- 0´12 y 10´12)
Decisión: Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la
diferencia de medias en la población puede tomar ese valor
En una investigación psicopedagógica se pasó la misma prueba de nivel de lectura a dos grupos de
niños: los participantes habían sido elegidos de forma aleatoria de entre los alumnos de EGB de dos
provincias españolas. Los datos se muestran en la tabla. La variable se midió en una escala de
intervalo y se supone que σ2A = σ2B
Supuestos: Disponemos de dos muestras independientes (dos grupos de niños) que se someten a
una prueba de lectura. La variable dependiente medida a nivel de intervalo. Varianzas
poblacionales desconocidas y supuestamente iguales (σ2A = σ2B). Muestras grandes (121 y 61).
Hipótesis: Planteamos un contraste bilateral para ver si las diferencias se deben al azar.
_________________________________________________
Error típico = √[( n1 – 1) S21 + (n2 – 1) S22 / (n1 + n2 – 2)] · (1 / n1 ) + (1 / n2 )
______
Error típico = √0´1665 = 0,408
Regla de decisión:
Valores críticos (tabla t de Student con 121 + 61 – 2 = 180 grados de libertad y α = 0,05). Se trata
de un contraste bilateral y son muestras grandes; por tanto, utilizamos Z0´025 (- 1´96) y Z0´975 = (1´96)
Nivel crítico p (el estadístico de contraste 4´90 se asocia a una probabilidad < 0´0005 que es más
pequeña que α)
Conclusión: Rechazamos H0 (el estadístico de contraste 4´90 no está entre los valores críticos ±
1´96 y de igual forma, considerando el nivel p crítico, p < α)
Interpretación: El rendimiento medio en la prueba de lectura no es igual en los dos grupos con un
nivel de significación α = 0,05.
Intervalo de confianza:
_ _
(Y1 – Y2 ) ± | tα (n1 + n2 – 2) | · Error típico = (Límites inferior y superior)
(40 – 38) ± 1´96 · 0´408 = 2 ± 0´8 = (1´2 y 2´08) ! Rechazamos H0 (el intervalo de confianza no
contiene el valor 0, luego asumimos que la diferencia de medias en la población no puede tomar
ese valor)
Distintos estudios muestran que la relajación es eficaz para reducir la ansiedad precompetitiva.
Siguiendo esta línea de investigación y habiendo hipotetizado una reducción de la ansiedad en las
escaladoras tratadas con relajación, extraemos aleatoria e independientemente 12 escaladoras y
les asignamos aleatoriamente a las dos condiciones del experimento: la mitad de las escaladoras se
somete a un programa de relajación durante seis meses y la otra mitad no realiza ningún tipo de
relajación (suponemos que las poblaciones se distribuyen normalmente con distinta varianza). Al
finalizar el programa de relajación, medimos la ansiedad precompetitiva de todas las escaladoras,
obteniendo una ansiedad media de 8 y una varianza insesgada de 150 en el grupo “sin relajación” y
una ansiedad media de 6´5 y una varianza sesgada de 100 en el grupo “con relajación”. El nivel de
significación alfa se fijó en 0,05, la variable dependiente está medida a nivel de intervalo y a mayor
puntuación mayor ansiedad. ¿Podemos afirmar que realmente la ansiedad precompetitiva de las
escaladoras se reduce utilizando técnicas de relajación?
(150 / 6 + 83 / 6)2
gl = ----------------------------------------------------- =
[(150 / 6)2 / (6 – 1) + (83 / 6)2 / (6 – 1)
Regla de decisión:
Valor crítico para α = 0,05 ! Según la tabla t de Student (contraste unilateral derecho), con 9 gl
encontramos el valor ! t9; 0´05 = 1´833
Nivel crítico p ! el valor del E. Contraste T = 0´24, con 9 gl se encuentra entre 0´55 < p < 0´60
Conclusión e interpretación: Se acepta H0 para un nivel de confianza del 95%. Según el valor
crítico (contraste unilateral derecho) T (0´24) < 1´833 ! Aceptamos H0.
Según el nivel p crítico (0´55 < p < 0´60) > que el valor de α = 0,05. La ansiedad precompetitiva de
las escaladoras no disminuye utilizando técnicas de relajación.
U1 = S1 - ½ n 1 (n1 + 1) // U2 = S2 - ½ n 2 (n2 + 1)
Distribución
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon
PROBLEMA EJEMPLO
En una investigación de Psicología Social sobre valores, se han extraído dos muestras aleatorias de
personas. Una muestra se extrajo de una región del interior de la Península (n=5) y la otra de la
costa (n=6). Los participantes cumplimentaron un cuestionario de xenofobia, que ofrece
puntuaciones en una escala ordinal, obteniendo los resultados que se presentan en la Tabla 1 (a
mayor puntuación mayor xenofobia). Se desea saber si la tendencia central de los habitantes de la
costa es más baja que la de los del interior. Se asume que las distribuciones de la variable en las
dos poblaciones tienen la misma forma (si difieren sólo lo hacen en su tendencia central)
Interior 6 14 10 18 20
Costa 16 12 4 8 2 22
Hipótesis: La hipótesis nula siempre es aquella que afirma lo contrario de lo que el investigador
desea probar. Desea probar que la tendencia central (contraste no paramétrico, mediana) en
habitantes de la costa es menor que en habitantes del interior. Contraste unilateral izquierdo
Estadístico de contraste:
1º.- Ordenamos el total de las puntuaciones de menor a mayor (puntuaciones de interior en negrita)
2 4 6 8 10 12 14 16 18 20 22
2 4 6 8 10 12 14 16 18 20 22
1 2 3 4 5 6 7 8 9 10 11
3º.- Sumamos los rangos de cada grupo: Rangos de interior (negrita) S1 = 3+ 5+ 7+ 9 +10 = 34
Rangos de costa S2 = 1+2+4+6+8+11 = 32
Regla de decisión:
Conclusión: Dado que el nivel crítico p (0´268) es mayor que α (0´05) ! Aceptamos H0
Interpretación: Las distribuciones del interior y las de la costa no difieren en cuanto a las medianas
en sus apreciaciones sobre la xenofobia.
D=0 D≠0
_____________________
Z = (P1 – P2 ) - 0 / √ P (1 - P ) · (1 / n1 ) + (1 / n2 ) ___________________________
Estadístico Z = (P1 – P2) - λ. / √ P1 (1 – P1 ) / n1 + P2 (1 – P2 ) / n2
Contraste Donde P = (n1 · P1 ) + (n2 · P2 ) / (n1 + n2 )
Distribución
Muestral Normal tipificada N (0, 1)
PROBLEMAS EJEMPLO
El grado de dificultad de las preguntas de un test se suele medir por el número de los sujetos que
los aciertan, o más exactamente, por la proporción de aciertos. Para averiguar si dos preguntas de
un determinado test de aptitud general difieren en dificultad, hemos seleccionado una muestra
aleatoria simple de 200 sujetos y los hemos repartido aleatoriamente en dos grupos de 100. Un
grupo de sujetos ha respondido a la pregunta 1 y el otro a la pregunta 2. La pregunta 1 la han
acertado 70 sujetos y la 2 la han acertado 60. El nivel de significación α se fijó en 0,05.
Supuestos: Tenemos una muestra aleatoria de n = 200 sujetos, repartidos en dos grupos
independientes de 100 (cada uno responde a una pregunta y se considera el acierto o el error !
variable dicotómica). Se fija α = 0,05. Se dan los supuestos para realizar un Contraste de
Proporciones al comparar el grado de dificultad de las dos preguntas del test.
Hipótesis: Planteamos un contraste bilateral para ver si las preguntas difieren en dificultad.
H0: π1 = π2 // H1: π1 ≠ π2
P = (n1 · G1) + (n2 · G2) / (n1 + n2) ! (100 · 0,7) + (100 · 0,6) / (100 + 100) = 0,65
_______________________________
Z = (0,7 – 0,6) / √ 0,65 (1 – 0,65) · (1 / 100) + (1 / 100) = 1,48
Regla de decisión:
Valores críticos (para un nivel de confianza del 95% y un contraste bilateral, los valores críticos
son ! ± 1´96 ! Z0´025 (- 1´96) y Z0´975 = (1´96)
Nivel crítico p [el estadístico de contraste (Z = 1,48) en la tabla de la curva normal deja por debajo
0,9306] ! Probabilidad (Z ≥ 1,48) = 1 - 0,9306 = 0,0694; al ser bilateral ! 2 · 0,069 = 0,1388.
Conclusión: Aceptamos H0 (el estadístico de contraste 1´48 está entre los valores críticos ± 1´96 y
de igual forma, considerando el nivel p crítico, p (0´1388) > α (0´05)
Interpretación: Para un nivel de confianza del 95%, aceptamos la hipótesis nula (las preguntas no
difieren en dificultad)
Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la diferencia de
medias en la población puede tomar ese valor)
2 2 2 2
Estadístico F =S 1 / S 2 Donde S 1 ≥S 2 (varianzas insesgadas)
Contraste
Intervalo
2 2 2 2 2 2
confianza (f α / 2 ; n1 – 1 y n2 – 1) ·Ŝ 1 / Ŝ 2 < σ 1 / σ 2 < (f 1 – α / 2 ; n1 – 1 y n2 – 1) ·Ŝ1 / Ŝ 2
PROBLEMAS EJEMPLO
Deseamos contrastar si las pacientes anoréxicas (PA) son más variables, en cuanto a su nivel de
estrés, que las pacientes bulímicas (PB). Para ello, extraemos dos muestras aleatorias de dichas
pacientes y se obtienen los siguientes datos sobre su nivel de estrés (donde a mayor puntuación
mayor estrés), considere α = 0,05:
PA 4 6 8 12 16
PB 3 5 7 9 14
Sabemos que la variable “nivel de estrés” está medida a nivel de intervalo y distribuida normalmente en
ambas poblaciones.
Hipótesis: H0: σ2PA / σ2PB ≤ 1 y H1: σ2PA / σ2PB > 1. Contraste Unilateral Derecho.
Conclusión e interpretación: No se rechaza H0 porque 1,3 (estadístico de contraste) < 6,39 (valor
crítico). Por tanto, las pacientes anoréxicas (PA) no son más variables que las bulímicas (PB) en
cuanto a su nivel de estrés considerando un nivel de confianza del 95%.
0,10) · (23,2 / 17,8) = 0,13 < σ21 / σ22 < (9,60) · (23,2 / 17,8) = 12,48
Siendo los valores críticos: f 0,025; 4 y 4 gl = 9,60 y f 0,975; 4 y 4 gl = 1 / 9,60 ! 0,10 (propiedad recíproca).
Decisión: Como la H0 debe plantear que las varianzas son iguales (σ21 / σ22 = 1) y apreciamos que
uno está dentro del intervalo de confianza (0,13 y 12,48). Se aceptaría la H0 (las varianzas de
ambas poblaciones son iguales)
La magnitud o tamaño del efecto alude al índice que mide el efecto que tiene un tratamiento. Deben
estar implicados al menos dos grupos (el experimental y el control). Es independiente del tamaño
muestral.
|YTRATAMIENTO – YCONTROL |
Índice d = -------------------------------------------------------
√[( n1 – 1) Ŝ21 + (n2 – 1) Ŝ22 / (n1 + n2 – 2)]
Según Cohen (1988) ! Magnitud del efecto [pequeño (d = 0´2); mediano (d = 0´5) y grande (d =
0´8 o superior)
ENTRENAMIENTO PSICOLÓGICO 37 14 38 43 35
ENTRENAMIENTO TÉCNICO 29 36 11 17 13
La d = 1´35 es la distancia estandarizada entre las medias de los dos grupos y su probabilidad
asociada (0´9115) ! El 91´15% de los sujetos con entrenamiento psicológico mejoran respecto a
los que únicamente reciben entrenamiento técnico.
Las muestras relacionadas nos ayudan a reducir la varianza de error. Así, cuanto mayor sea la
relación entre ambas muestras, menor será la varianza de la distribución muestral de las diferencias
y, por tanto, mayor el estadístico de contraste.
CONTRASTES DE HIPÓTESIS:
_ __ _ __
2
Estadístico Z = (D – µd) / (σd / √ n ) T = (D – µd) / (Ŝ d / √ n )
Contraste
Distribución
Muestral Normal Tipificada: (0, 1) “t” de Student: gl = n-1
_ __ _ __
Intervalo D ± | Z α/2 | · σD / √ n = (Lím. infer y sup) D ± | t α/2; n– 1 | · SD / √ n = (Lím. infer y sup)
confianza Distribución Muestral Z con N (0,1) Distribución Muestral T con (n – 1) gl
Se desea estudiar si los alumnos de la ESO son más variables en cuanto a su nivel de
concentración antes y después de haberles sometido a una terapia. Sobre una muestra aleatoria de
7 alumnos se toman medidas del nivel de concentración previo y posterior a la aplicación de la
terapia, obteniéndose los siguientes resultados (a mayor puntuación, mayor concentración):
MEDIDA PREVIA 12 9 11 10 9 6 7
MEDIDA POSTERIOR 7 5 6 6 5 6 7
Sabiendo que para aplicar el estadístico de contraste se resta la medida posterior de la previa, que
la concentración es una variable medida a nivel de intervalo y que se distribuye normalmente en
ambas poblaciones, tómese un nivel de significación α = 0,05 y compruebe si los alumnos se
concentran más al finalizar la terapia.
Hipótesis: La hipótesis alternativa es la hipótesis del investigador. Del planteamiento del problema
se deduce de que se trata de un contraste unilateral izquierdo donde:
2
Medida Medida Diferencia D - DMedia (D - DMedia)
Previa Posterior Posterior - Previa
12 7 -5 - 1,86 3,4596
9 5 -4 - 0,86 0,7396
11 6 -5 - 1,86 3,4596
10 6 -4 - 0,86 0,7396
9 5 -4 - 0,86 0,7396
6 6 0 3,14 9,86
7 7 0 3,14 9,86
Σ = 64 Σ = 42 Σ = (- 22) Σ = 28,86
_
Averiguamos la media (D) y la varianza insesgada (Ŝ2d) de las puntuaciones diferencia:
_ __ __
Desconocida la varianza de la población: T = (D – 0) / (Ŝ2d) / √ n) ! T = (- 3,14) / (4,81 / √ 7) = - 1,7
__________________ _ _ _
Donde: Ŝ2d = √ Σ (Di – DMedia)2 / (n – 1) y D = Y1 – Y2 = Σ Di / n
________ _
Ŝ2d = √ 28,86 / 6 = 4,81 y D = (- 22) / 7 = (- 3,14)
Regla de decisión:
Valor crítico (contraste unilateral izquierdo) ! - 1,943 (valor crítico T0, 05 y 6 gl)
Nivel crítico p sólo puede obtenerse el valor aproximado, porque 1,7 no figura en la tabla T de
Student para n–1 = 6 gl. El valor 1,7 está entre 0,10 (1,4) y 0,05 (1,9).
(-3´14) ± 1´943 · 4´81 / 2´64 ! (- 3´14) ± 3´54 ! (0´4 y 6´68) ! No contiene el 0, Rechazamos H0
Unos psicólogos hipotetizan que los hombres (H) con más de 20 años son más afectuosos hacia su
pareja que las mujeres (M). Extrae una muestra aleatoria de 8 parejas casadas y les mide el grado
de afectividad hacia la pareja, obteniendo los datos que aparecen a continuación (a mayor
puntuación mayor afectividad hacia la pareja). Se sabe que la puntuación en afectividad es una
variable medida a nivel de intervalo que se distribuye normalmente y que las observaciones entre
las muestras no son independientes. Se fija alfa en 0´01. Suponemos conocida la varianza de las
diferencias (σ2d = 5).
PAREJAS 1 2 3 4 5 6 7 8
HOMBRES 13 5 6 9 10 7 11 8
MUJERES 1 9 8 6 5 8 3 5
Supuestos: Se sabe que la puntuación en afectividad es una variable medida a nivel de intervalo,
que se distribuye normalmente en ambas poblaciones y que conocemos la varianza de las
diferencias (σ2d = 25). Se fija α en 0,04. Según el enunciado ! Diferencia de medias (muestras
relacionadas)
Estadístico de contraste:
H M D
13 1 12
5 9 -4
6 8 -2
9 6 3
10 5 5
7 8 -1
11 3 8
8 5 3
Media = 8,7 Media = 5,7 Σ = 24
_ _ _ _
D = H – M = Σ Di / n ! D = 24 / 8 = 3 // σ2d = 5
_ __ _
Z = (D – 0) / (σ2d / √ n) ! T = 3 / (5 / √8) = 3 / 1´77 = 1,69
Regla de decisión:
El nivel crítico p (probabilidad de obtener un valor del estadístico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadístico de contraste (1,69) que buscando en la
tabla de la curva normal ! p = 1 – P (T ≤ 1´69) ! 1-0`9545 = 0´0455.
El valor crítico para un contraste unilateral derecho y un alfa = 0´01 es ! 2´33
Distribución
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon
PROBLEMA EJEMPLO
Un investigador desea comparar el grado de hiperactividad en obesos cuando están en un
programa para bajar de peso (dieta) y sin programa para bajar de peso. Dispone de 10 sujetos a los
que somete a las dos condiciones experimentales (con dieta y sin dieta). Las puntuaciones se
reflejan en la tabla. Sabiendo que la distribución de las diferencias es simétrica, con un nivel de
confianza del 95%, ¿se puede afirmar que hay diferencias en hiperactividad en obesos cuando
están o no en un programa de dieta?
Estadístico de contraste:
∑ R+ = (1´5 + 7´5 + 9´5 + 4´5 + 7´5 + 4´5 + 4´5) = 39´5 y ∑ R- = (1´5 + 9´5 + 4´5) = 15´5
Se toma el valor del más pequeño de los sumatorios ! W = 15´5 (Estadístico de Contraste)
Regla de decisión: Con α/2 = 0´05 (contraste bilateral) y n = 10, acudimos a la tabla de Wilcoxon y
obtenemos un valor crítico = W0´025; 10 = 9
Conclusión e interpretación: Dado que el estadístico de contraste (W = 15´5) > el valor crítico (W = 9)
no podemos rechazar la H0 con un nivel de confianza del 95%. Las diferencias en el incremento o
disminución de la hiperactividad en personas obesas con dieta o sin dieta, no son significativas.
Estadísticamente resultan iguales, en razón de que pueden ser diferencias dadas al azar.
_______
2 2
Z = (b - c) / √ (b + c) χ = (b – c) / (b + c)
Estadístico
Contraste b ! (sujetos que puntúan 1 en la primera medida y 2 en la segunda).
c ! (sujetos que puntúan 2 en la primera medida y 1 en la segunda)
Distribución
Muestral Normal tipificada N (0, 1) Chi Cuadrado con 1 grado de libertad
2 2
Regla (C. Bilateral) ! Z ≤ Z α / 2 y Z ≥ Z 1 - α / 2 χ < χ 1; 1-α → Mantener H0
decisión (C. Unilateral Izquierdo) ! Z ≤ Z α
2 2
(C. Unilateral Derecho) ! Z ≥ Z 1 – α χ > χ 1; 1-α → Rechazar H0
_______
Intervalo (P1 – P2 ) ± | Z α/2 | · √ (b + c) = (Límites inferior y superior)
confianza
PROBLEMA EJEMPLO
Supuestos: Muestra grande de 102 sujetos sometidos a dos medidas de la misma variable
(cometer o no cometer infracción)! Variable dependiente dicotómica. [b + c] > 25 Se trata de
contrastar las proporciones en dos muestras de observaciones relacionadas.
Estadístico de contraste:
Regla de decisión:
Los valores críticos, contraste bilateral, con α/2 = 0,005 y 1- α/2 = 0,995 ! ± 2´58.
El nivel crítico p (probabilidad de obtener un valor del estadístico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadístico de contraste (± 1´02) que buscando en
la tabla de la curva normal ! 2 [P (Z ≥ 1´02) = 2 · (1 – 0,8461) = 2 · 0,1539 ! 0,3078.
Conclusión e interpretación:
Como p (0,3078) > α (0,01) ! Aceptamos H0. También como 1´02 (valor muestral del estadístico de
contraste) < 2´58 (el mayor de los valores críticos). También 1´02 está entre los valores críticos (-
2´58 y 2´58).
Para α = 0´01, podemos afirmar que la proporción poblacional de los sujetos que se saltan el
semáforo es la misma antes de la proyección de imágenes que después.
También con el test de McNemar: χ2 = (b – c)2 / (b + c) ! χ2 = (34 – 43)2 / (34 + 43) = 1´05
Para χ2con un grado de libertad, el valor 1´05 se encuentra entre (0´10 < p < 0´90) por lo que el nivel p
crítico > que α (0,01) ! Aceptamos H0
Análisis de Varianza (ANOVA ó ANVAR) ! es una técnica paramétrica de análisis estadístico que
se utiliza para comparar las medias de más de dos grupos.
El diseño de más de dos grupos tiene por objeto estudiar la influencia de más de dos valores de la
variable independiente sobre la variable dependiente y, por tanto, tiene más posibilidades de establecer
la relación precisa entre ellas. Una de las características más importantes del diseño de experimentos
es la aleatoriedad: elección de un grupo (muestra) y su distribución en tres o más grupos de forma
aleatoria.
Al comparar distintos grupos para realizar un estudio tenemos en cuenta la variabilidad que aparezca
entre los sujetos en la variable dependiente que se considera formada por dos componentes: la que se
debe al factor estudiado (atribuible a los distintos tratamientos experimentales; variable independiente) y
la que se debe a factores extraños y no controlados (Error Experimental)
El Análisis de Varianza se fundamenta en el estudio de estas variabilidades. La varianza general o
común se divide en: varianza intergrupos (atribuible a los distintos niveles del factor estudiado) y
varianza intragrupos (atribuible al error experimental). Al comparar ambas varianzas obtenemos la
aceptación o rechazo de la hipótesis nula (que consiste en afirmar que no existe diferencia entre las
medias de los distintos grupos)
Lógica del método: Los sujetos se distribuyen aleatoriamente en los mencionados grupos (para
minimizar la influencia de las variables extrañas); por tanto, son semejantes en cuanto a la variable
estudiada dentro de cada grupo y entre los distintos grupos. Si después de aplicar el tratamiento
experimental existen diferencias, se puede pensar que son debidas a los procedimientos aplicados.
TERMINOLOGÍA:
Factores = Var. Independientes que se estudian. Niveles = categorías en que dividimos los factores.
Efectos Fijos = sólo nos interesan unos niveles concretos, los establecidos. Los resultados sólo afectan
a estos niveles. Efectos Aleatorios = los niveles actúan como una muestra y las conclusiones se pueden
generalizar en el sentido de los datos de la muestra.
Modelo Equilibrado = igual número de sujetos en los grupos. Modelo no Equilibrado = distinto número
de sujetos en los grupos.
1.- Probar los supuestos (independencia de las observaciones, normalidad de las distribuciones y
homogeneidad de las varianzas)para asegurarnos que se puede aplicar el ANOVA
2.- Enunciar las hipótesis estadísticas
3.- Decidir el estadístico de contraste que vamos a utilizar para probar la H0
4.- Con qué nivel de confianza vamos a trabajar (establecer la región crítica de rechazo de la H0
5.- Calcular el estadístico de contraste (Tabla del ANOVA)
6.- Tomar la decisión sobre la H0 (comparar el valor F obtenido con el valor crítico)
7.- Interpretación en el contexto de la investigación
Hipótesis estadísticas:
H0: Las observaciones y las muestras son independientes
H1: Las observaciones y las muestras no son independientes
Cálculo del Estadístico de Contraste: Para poder aplicar el Test hemos de dicotomizar la variable
observada. Para ello: A partir de la Mediana (Md) de todas las puntuaciones tomadas conjuntamente
(si una puntuación es mayor que la Md se sustituye por un signo + y si es menor por un signo –)
Valores Críticos: Si el estadístico es r ! Uα/2 y U1-α/2 (en la tabla de valores críticos del Test de
Rachas, buscamos los valores de n1 y n2) // Si el estadístico es T ! Zα/2 y Z1-α/2
PROBLEMA EJEMPLO
Un seleccionador de baloncesto desea averiguar como incide la hora del día a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de mañana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:
Para contrastar la independencia (Test Rachas) ! las observaciones pueden dicotomizarse, utilizando la
mediana (asignando un + cuando la puntuación sea mayor y un - cuando la puntuación sea menor)
Canastas 15 12 14 10 11 16 7 9 12 17 10 12 13 15 20 17 16 18
Signo + - + - - + - - - + - - - + + + + +
Rachas 1 2 3 4 5 6 7 8 9
r ! (nº de rachas) = 9 // n + = 9 (signos positivos) // n - = 9 (signos negativos)
Con un nivel de significación α = 0,05, buscamos los valores críticos en la tabla del test de Rachas
n - = 9; n + = 9; α / 2 = 0,025 y 1 - α / 2 = 0´975 (bilateral)
T (0,025) = 5 y T (0,975) = 14 ! Como (rachas = 9) está dentro del intervalo (entre 5 y 14), se acepta H0. Las
observaciones son independientes.
Este supuesto es el que más va a distorsionar los resultados, en caso de no cumplirse, porque si al
final hay diferencias entre los grupos, no podremos saber si se deben a la variable independiente o a
que ya existían con anterioridad. Supuestos (Modelo equilibrado)
Hipótesis estadísticas:
H0: σ21 = σ22 = σ23 =…… (Las varianzas poblacionales son iguales)
H1: σ21 ≠ σ22 ≠ σ23 ≠……. (Para alguna σ2i)
Decisión:
Zona de Rechazo: R ≥ R r,n,α Si R < R r,n,α ! Aceptamos Ho
Si R ≥ R r,n,α ! Rechazamos Ho
PROBLEMA EJEMPLO
Con el enunciado del problema utilizado para el test de rachas (Modelo equilibrado):
Sabiendo que se cumple el supuesto de normalidad de las distribuciones, comprobar si las varianzas
son homogéneas ! H0: Las varianzas son iguales // H1: No todas las varianzas son iguales
Para contrastar la homocedasticidad (Test de Cochran) ! R = máx Ŝ2I / Σ Ŝ2I
Con un nivel de significación α = 0,05, buscamos los valores críticos de las tablas de Cochran ! n = 6
// r (grupos) = 3 // R = 0,7071
Decisión ! Como 0,504 < 0,7071, se acepta H0 (Las varianzas no difieren significativamente)
Decisión:
2 2 2 2
Zona de Rechazo: X ≥ X (r-1)(1-α) Si X < X (r-1)(1-α) ! Aceptamos Ho
2 2
Si X ≥ X (r-1)(1-α) ! Rechazamos Ho
PROBLEMA EJEMPLO
ESTADÍSTICO DE CONTRASTE !
χ2 r-1 = 2,3026 / {1,0291 · [23 log 2,515 – (8 log 1 + 7 log 2,55 + 8 log 4)]} = 3,45
MODELO "Yij = µ + αij + εij // Cualquier puntuación (Y) tiene tres componentes: (µ) que es la media de
la población. (α) el nivel en que se encuentra, común a todos los componentes adscritos a ese nivel.
(ε) el error experimental o factores no controlados en el experimento (se asume que es una variable
aleatoria distribuida según N (0, σ). Ejemplo ! Y17 = puntuación del sujeto 7º del grupo 1º.
HIPÓTESIS " Efectos fijos (sobre las medias poblacionales) // Efectos aleatorios (sobre las
varianzas ! cuando son = 0, las medias son iguales).
El Numerador del estadístico de contraste contiene la Varianza de error + Efecto real de la VI. El
Denominador contiene la Varianza de error. Por tanto, cuanto menor es el efecto real de la VI más se
acerca el cociente a uno.
Valor Crítico: F (I-1) (N-I) (1-α) Zona de Aceptación: F < F ((I-1) (N-I) (1-α)
Decisión:
Zona de Rechazo: F ≥ F (I-1) (N-I) (1-α) Si F < F crítico ! Aceptamos H0
Si F ≥ F crítico ! Rechazamos H0
Cálculos abreviados (Utilizamos el sistema de notación propuesto por Keppel): El cálculo de las
Sumas de cuadrados se realiza sumando y restando las razones básicas: [Y] (relacionada con las
puntuaciones individuales); [A] con los totales de los niveles y [T] con la suma total.
Fórmulas para las razones básicas Sumas Cuadrados a partir de razones básicas
SCS | A = ∑∑ (Y –YA)2
PROBLEMA EJEMPLO
Un seleccionador de baloncesto desea averiguar cómo incide la hora del día a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de mañana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:
2
SUMATORIOS (Σ) Σ Nº DE CASOS MEDIAS
MAÑANA 78 1042 6 13
TARDE 67 807 6 11,17
NOCHE 99 1663 6 16,5
TOTAL 244 3512 18 13,55
SC INTER = Σ (Σ Y)2 / n – {(Σ Σ Y)2 / N} ! 3395,67 - (244)2 / 18 = 88,11 ! Abreviado: [A] – [T]
Decisión ! Comparando los resultados F (tablas) = 3,68 < F (experimental) = 5,68, por tanto
rechazamos la hipótesis nula. Existen diferencias significativas entre el rendimiento de los jugadores
dependiendo de la hora del día a la que entrenan a un nivel de confianza del 95%.
Permiten obtener información sobre las diferencias entre los distintos tratamientos considerados uno a
uno. El objetivo de las comparaciones múltiples es reducir la cantidad de Error Tipo I (α) que
cometeríamos si se compararan sin más, dos a dos, todas las muestras posibles. Dos tipos:
! Comparaciones planificadas o a priori (no interesan todas las comparaciones, sólo algunas)
! Comparaciones no planificadas, a posteriori o post hoc.
Las que vamos a utilizar se denominan no planificadas, a posteriori o post hoc (se llevan a cabo
cuando se ha realizado el Análisis de Varianza y la F ha sido significativa / hemos rechazado la H0). Las
más importantes ! TUKEY // SECHEFFÉ.
___________
PRUEBA TUKEY (HSD) ! HDS TUKEY = q α, gl, K √ MC error / n
q ! valor crítico en la tabla de rango studentizado. Se averigua considerando el nivel de confianza fijado
(α), los grados de libertad de la MC error y el número de grupos o tratamientos a comparar en el ANOVA.
MC ERROR ! media cuadrática error del Anova (MCINTRA / MCS | A)
n ! tamaño de cada grupo (los modelos han de ser equilibrados). Cuando el modelo no es equilibrado,
se sustituye n por n´ ! n´ = k / (1 / n1) + (1 / n2)...
_ _
Rechazamos H0 cuando (| Yi – Yj | ≥ HDS TUKEY
PRUEBA SCHEFFÉ (CR) ! Permite, además, realizar comparaciones complejas (una media con otras
dos consideradas en conjunto). Los coeficientes c (pesos) ! (2), (- 1) y (-1). Cuando se utiliza en lugar
de Tukey, para comparaciones dos a dos, es menos potente y más conservadora que Tukey, lo que
significa que, en igualdad de condiciones, el valor crítico de Scheffé es ligeramente superior al de
Tukey, por lo que resulta más difícil rechazar la hipótesis nula de la igualdad de medias.
_________________ ___________________
CR SCHEFFÉ = √ (k - 1) F (k - 1), gl ERROR √ MC ERROR [Σ (c2j / nj)]
k ! Número de grupos
ni = número de sujetos de cada grupo.
F (k - 1), gl ERROR ! F experimental del ANOVA.
MC ERROR ! Media cuadrática error.
c2j ! Coeficiente de las combinaciones lineales (en cada combinación la suma de coeficientes = 0)
_ _ _
φ1 = 2 ·Y1 – (Y2 + Y3) ! Entonces: c1 = 2, c2 = (-1), c3 = (-1) ! Dado que (∑cj = 0)
Para hallar los cj, se debe tener en cuenta que siempre deben sumar 0. Es más fácil calcular primero
los cj de los que se combinan conjuntamente, que siempre serán negativos, y luego el del que se
compara frente a todos, que será la suma de los otros, pero con signo positivo.
Decisión:
Si φ1 ≥ CR ! Existen diferencias significativas entre el nivel y los otros tomados conjuntamente.
Si φ1 < CR ! No existen diferencias significativas entre el nivel y los otros tomados conjuntamente
PROBLEMAS EJEMPLO !
Valor q para α = 0,05; 15 grados de libertad y tres grupos ! 3,67 MCINTRA ! 7,75
_______
HDS TUKEY = 3,67 √ 7,75 / 6 = 4,17 (modelo equilibrado)
Decisión ! Existen diferencias significativas entre entrenar por la tarde y por la noche, siendo el mejor
rendimiento por la noche (media más alta)
Prueba Scheffé (CR) ! Comparación entre la media del turno de noche con las de mañana y tarde
consideradas conjuntamente.
__________________ __________________
CR SCHEFFÉ = √ (k - 1) F (k - 1), gl ERROR √ MC ERRROR [Σ (c2j / nj)
Decisión ! Como 8,83 > 6,15 ! Rechazamos H0 (existen diferencias significativas entre el turno de
noche y los de mañana y tarde considerados conjuntamente.
HIPÓTESIS ! H0: ŋ1 = ŋ2 =… = ŋK
H1: ŋ1 ≠ ŋ2 ≠… ≠ ŋK Al menos para una ŋ
Cálculo: Se ordenan todas las puntuaciones en una sola serie, (es decir, tomándolas todas en cuenta),
asignamos rangos de 1 a n, dando a la puntuación menor el rango 1. En caso de empate ! (rango
medio); es decir, asignándoles la media aritmética de los rangos que les hubieran correspondido de ser
distintas.
Decisión: Cuando se rechaza la H0, se procede a realizar comparaciones múltiples (tratamientos entre
los que se producen las diferencias)
_________________
Diferencia mínima crítica ! MVKV = Z adj √ N(N+1) /12 · (∑1/ai)
PROBLEMA EJEMPLO
En un estudio sobre antojo por el chocolate varios autores querían determinar si la distribución
poblacional del consumo de chocolate en una semana era igual en una muestra de niños (N), que en una
muestra de mujeres adultas (MA) y que en una de hombres adultos (HA). Para ello se seleccionaron
aleatoriamente 5 sujetos de cada grupo y se midió su consumo de chocolate contabilizando (según se
recoge en la tabla) el número de alimentos con chocolate consumidos en una semana (C):
= 30,5 / 5 = 6´1
Rango Medio Rango Medio =
31 / 5 = 6´2 Rango Medio =
58,5 / 5 = 11´7
2 2 2
Σ RANGOS = 930,25 Σ RANGOS = 961 Σ RANGOS = 3422,25
2 2 2
Σ R / 5 = 186,05 Σ R / 5 = 192,20 Σ R / 5 = 684,45
Hipótesis !
H0: No existen diferencias poblacionales en el consumo semanal de chocolate entre N, MA y HA.
H1: Existen diferencias poblacionales en el consumo semanal de chocolate entre, al menos dos grupos.
El estadístico de contraste sigue la distribución X2 con (3-1) gl y α = 0,10 ! X22; 090 = 4´61
Decisión ! Como 5,135 > 4,61 Se Rechaza la Hipótesis Nula (Comparaciones múltiples ! Las tres
muestras son equilibradas)
_________________ _______________
MVKV = Z adj √ N(N+1) /12 · (∑1/ni) ! MVKV = 2´13 √ 15(16) /12 · (1/5) ! MVKV = 4´26
I
NTRODUCCI
ÓN.CONSEJOSBÁSI
COSDEESTUDI
O
I.
-Elexamenconst
adet r
essi
tuaci
ones,cadaunadelascual
escompr
ende
unmíni
mode7preguntasyunmáximode10, par
auntot
alde25:
II.
-Apr oximadament eent r
e2/ 5ylami taddel aspreguntassondet eorí
a.Es
fundament aldomi narl
a,por quesisecont estanbi enlaspr eguntasdet eoría,
supone2/ 3delapr obadoysisecont estanmal ,esimposibl
eapr obaraunquese
haganbi enl ospr oblemas.Ademássudomi nioper mit
epl antearyr esolv
erlos
correctament e.Esmuyi mpor t
antefij
arsebi enenl oquepidenyl osdat osque
nosof recenpar aident i
fi
carelpr obl
ema:“ Distintoodi f
erent
e”,implicacontraste
bil
ateral(doscol as);“may oromenorque” ,unil
at er
al(unacola).Cuandosehabl a
deunpar ámet r
ogenér i
co, seestánrefi
ri
endoal amedia;porcentaj
eesl omi smo
quepr oporciónyv ariabi
li
dadesv ari
anzaodesv i
acióntí
pica.
Latécni
caopr
ocedi
mient
opar
aelcont
rast
edehi
pót
esi
sessi
empr
ela
mi
sma:
1.-Det er
minaci
ón delossupuest osdelproblema(ti
posdedi seño yde
contr
aste).
2.-Formulaci
óndelashipót
esisest
adíst
icas(
nulayal
ter
nati
va).
3.-Elecci
ónycálculodelestadí
sti
codecontraste(
EC),el
i
giendolafór
mula
corr
ecta.
1
4.
-Deci si
ónsobreelrechazoonodel ahi
pótesi
snul
aplanteadaparaelnivel
designifi
caciónαdeseadooquenosden,medi ant
elacompar aci
ónentreel(o
l
os)v alor
(es)crí
ti
co(
s),cálculodelni
velpcr
ít
ico,t
amañodelef ect
oyav eces,
pot
enci adelcontr
ast
e.
6.
-Concl usión e i
nter
pr et
aci
ón de l
os r
esult
ados en elcontext
o de la
i
nvestigaci
ón.
TEMA1:
ESTI
MACI
ÓNDEPARÁMETROSYCONTRASTEDEHI
PÓTESI
S
1.
-Concept
osbási
cos.
Lainfer enci
aestadísticaesl apartedel acienci
aest adísticaqueestudi
alos
procedimi entosat r
avésdel oscualessepuede:
Esti
marconunel ev adogr adodepr obabi
li
daddet erminadaspr opi
edadeso
parámet ros de una pobl ación,parti
endo de l os estadísticos di
sponibl
es o
calculadosenunamuest r
adel ami smaobt eni
dadef ormaal eator
ia.
Al ai nversa,estudiarsidet erminados v al
ores muest ral
es se apart
an
si
gni f
icati
v ament edelospar ámet r
ospobl aci
onales.
-Eler
rormuestralesladi
fer
enci
aentreelresul
tadoobteni
doenlamuest
ray
el
quehabr í
amosobt eni
dosisehubi
esetrabaj
adocont odalapobl
aci
ón.
-Eler
rortí
picoesladesvi
aci
óntí
picadelestadí
sti
co.
a)Dist
ribuciónde( oen)l amuest ra:Sonl osdat osov al
ores(dist
ribuciónde
fr
ecuenci as)quet omal avariableenunamuest r
aconcr eta.Lamedi a,
medi ana,proporción, desvi
aci
ónt í
pica,correl
ación,
etc.delamuest ra,son
l
osest adísticos.
b)Dist
ribución pobl acional:Son l os dat os o v al
ores (distr
ibución de
fr
ecuenci as)quet omaunav ariableenelconj untodel apobl ación.Su
medi a,medi ana,pr oporci
ón,desv i
aciónt í
picas,et
c.sonl ospar ámet ros
poblacionales.
c)Dist
ribución muest ralde un est adíst
ico:Son l os datos o v alores
2
(di
stri
bucióndef r
ecuenci
as)quet omaunav ari
abl
eoest adísti
coenel
conjuntodet odaslasinf
init
asmuest r
asquepuedenobt ener sedeuna
población.Comoent odadist
ri
buci
ón,tambiéndeladist
ri
buci ónmuest ral
,
podemos obt enersu medi a ysu desvi
ación t
ípi
ca o errort í
pico del
estadísti
co.
Cuandolosestadíst
icos(muestrales)seref
ier
enaunamuest raconcreta,se
desi
gnanconl et
raslati
nasmayúscul as(Mediadelamuest r
a=Y,Varianzadel a
muest a=S2,
r Proporci
óndel amuest ra=P).Losmi smosparámet
rosrefer
idosa
l
apobl aci
ón,
seindicanconloscaracteresgri
egosequival
ent
esenminúsculas( µ,
2
π,σ) .
3
2.Di
str
ibuci
ónmuest
ral
del
aMEDI
A.
Hayquedi
sti
ngui
rtr
essupuest
os:
1.-Siladistr
ibuci
ónpoblacionaldel av ariabl
edeest udioesnor malcon
mediaµ yv ar
ianzao desvi
aciónt í
pica σ conocidas,coni ndependenciadel
tamañodel amuest r
a,ladi
stri
buciónmuest raldelestadíst
icomedi aest ambi
én
normal,siendo su media y desviaci
ón típica (o err
ort ípi
co de l a media),
respect
ivamenteµY yσ/n( fórmula1,pág.9delf ormulario).Sitipif
icamoslas
medidas,seráN(0,1)
.
2.-Sisedesconocel avari
anza(olaformadeladistr
ibuci
ónpobl
acional
),el
estadísti
co mediasedi st
ri
buyecomo unaT deSt udent,conn-1gradosde
l
ibertadyusar emosladesvi
aci
ónt í
picai
nsesgadaocuasidesvi
aci
óntí
picadela
muest ra(fór
mula2,pági
na9del f
ormular
io,oj
osiempren-1envezden).
3.Di
str
ibuci
ónmuest
ral
del
aPROPORCI
ÓN.
Enlasv ari
ablesdi cotómicasodi cotomi zadas(lasquesól opuedent omar
dos valores),la propor ci
ón es elpor centaje de elementos que t i
enen una
deter
minada pr opi
edad ( éxi
to)en r el
ación con elt otal
.Las probabi l
idades
asoci
adasacadav alorconcr etosedi st
ribuyensegúnl adist
ri
buciónbi nomi al
conparámet rosnyπ.Conmuest r
asgrandesl abinomi alti
endeaapr oximar sea
l
anor malN( π,σp),(f
ór mula3, pági
na9delcuader ni
ll
o).Enestaasignaturapar a
resol
verlospr oblemassól oseusal adistr
ibuciónnormal .
4.Di
str
ibuci
ónmuest
ral
del
aVARI
ANZA.
Ladistri
buci
ónmuestr
aldelavari
anzaseaj aaunaχ2(
ust chi
-cuadr
ado),con
2
n-
1gr adosdel i
ber
tad.Cuandolamuestraesmay orde100,laχ t i
endeal a
2
nor
mal ,aunquel
avari
anzasi
guedist
ri
buyéndosesegúnlaχ.
Esmuyimport
anter
etenerquecadaestadí
sti
cosedist
ribuy
econsupr opi
a
funci
óndedist
ri
buci
ónquenocambi aconelt amañodel amuest r
a;cuesti
ón
dif
erent
eesqueporelTCLcuantomay orsealamuest
ra,taldi
str
ibuci
ón(Tde
4
Student
,binomi
alochi
-cuadrado)seapr
oxi
memásal anormal,
perodebeusarse
si
empr elaf ór
mula delest adí
sti
co que cor
responda,aunque l
uego dicho
estadí
sti
coseuseenlatablanormal.
5.
-ESTI
MACI
ÓNDEPARÁMETROS:
PUNTUALYPORI
NTERVALOS.
Laspr
opi
edadespr
inci
pal
esdel
osest
imador
esson:
La propi
edad de l
os est
imador
es i
nsesgados yef
ici
ent
es (
con v
ari
anza
pequeña)sell
amaacuraci
dad.
Losest adí
sti
cosmedi a,pr oporciónycoef i
cientedecor rel
aciónmuest r
ales
son est imadores insesgados,ef icient
es,consi stent
es ysuf icientes de los
parámetros media,pr oporción y coef i
cient
e de cor rel
ación pobl aci
onal.La
medianaesef ici
enteyconsi st enteper onoesi nsesgada;nitampocosuf ici
ente
alusarsólolosvalor
escent ralesdel amuest r
a.
La v ari
anza muestralno es un est imador insesgado de l av ari
anza
poblacional
,aunquesícumpleconlasotrastrespropiedades.Porelcontrar
io,l
a
cuasivari
anzamuest r
al( ovar
ianzainsesgada,calculadasobren- 1)síesun
esti
madori nsesgadodel av
ari
anzapoblacional,per
oesmenosef i
cient
equel a
vari
anzamuest ral
.
5
Resumendel
aspr
opi
edadesdeest
adí
sti
cos
Car
enci
adesesgo Ef
ici
enci
a Suf
ici
enci
a Consi
stenci
a
Medi
aAr
it
mét
ica SI >Medi
ana SI SI
Medi
ana NO <Medi
a NO SI
Pr
opor
ción SI -
--
-- SI SI
Var
ianza NO >S2n-1 SI SI
2
Cuasi
var
ianza SI <S SI SI
Laesti
macióndepar ámet rosapar ti
rdel osest adí
sticosmuest ralespuede
serpuntualoporinter
valos.Enl aesti
maciónpunt ualseut i
li
zadi r
ectament eel
valordelest adí
sti
co calculado en una muest ra aleatori
a concret a como
verdaderoval
ordelpar ámetropobl acional.Sinembar go,comoesmuypoco
probablequeasíocurr
a,espr efer
ibl
edef i
niruni nt
ervalodev al
oresent r
ecuy os
l
ími tes i
nfer
ior y super i
or se encont r ar
á, con una al ta pr obabil
idad
predeter
minada,elver
dader ov al
ordelpar ámet r
o.A est epr ocedi
mient osel e
conoceconel nombredeest i
maci ónporinter v
alosdeconf ianza.
Lapr obabil
idadsobrelaquesecalcul
aelinterv
alodeconfianza,sel l
ama
ni
veldeconf i
anza(1-α)ysedefinecomol apr
obabil
idaddequeelpar ámetro
poblacionalestéconteni
do ent
relosextremosdeli nt
erv
alo.Lapr obabil
idad
compl ementari
a delnivelde confi
anza (α)r
ecibe elnombr e de nivelde
si
gnifi
cación.
Par auntamañodemuest r
adado, cuantomay orsealaamplituddeli nter
valo,
may orseráelni veldeconfianza(pr
obabi l
idaddequeelv al
orpobl aci
onalest é
dentrodelmi smo),peromenorl apr eci
sión( puestoqueeli nt er
valoesmás
ampl i
o).Cuant omay orsealadisper
siónmuest ral(var
ianzaodesv iaciónt í
pica,
sesgadaoi nsesgada),menorser áelni veldeconf i
anza.Sóloalaument arel
tamañodel amuest ra,seincrementanl apr ecisi
ónyelni veldeconf ianza.En
consecuencia,par aunni veldeconf ianzadado,l aampl i
tuddeli nt
er v
alo de
confianzatendráqueserporf uer
zamay orcuant omenorseaelt amañomuest ral
ocuant omay orsealadispersi
ónmuest r
al.
Losint
erval
osdeconf i
anzasecal cul
ansegúnl asfórmulascorrespondient
es
acadaestadíst
icoenlacolumna2ªdel apági na9delformular
io.Par alamedia
seuti
li
zaladelafil
a1ªsi l
avari
anzapobl acionalesconoci
da(normal )olasdela
2ªsiesdesconoci da(TdeSt udent,aproximadaporl anor mal,sin>100per o
usandolamismaf órmul
adelestadísti
co).Paralaproporci
ón,l
afila3ª( nor
mal)y
2
paralavar
ianza,l
a4ª( χ,aproxi
madaporl anormalsin>100,fi
la5ª ).Entodos
l
oscasos,unami taddelniveldesignifi
caciónα/ 2quedaporenci madell ímit
e
superi
orylaotr
a,pordebajodell
ímiteinf
eriordeli.
c.
Cuandol
afunci
óndedi
str
ibuci
óndelest
adí
sti
coessi
mét
ri
ca(
nor
maloTde
6
Student
),bastaráconcal cularelvalorcorrespondientea1- α/
2,calculareler ror
máximoysumar l
oyr estar
lodelv al
ordel amedi aopr oporci
ónmuest r
al,que
ocuparáelv alorcentral(mediaopr oporci
ónmuest ral+/ -Emax).Sinembar go,
cuandonol oes( varanza,χ2,chi
i -cuadrado),hayquebuscarenl at ablalosdos
valor
escorrespondi entesaα/ 2ya1- α/2par acal cularlosl ímit
esi nferiory
superi
ordeli nterval
odeconf i
anza,estandoelv alorinferi
ordeli nterval
omás
próxi
moal av arianzamuestralqueel superi
or.
N(
0,1) t
n-1gl
2 2
Dist
ri
buci
ónNor
mal
(Conoci
daσ) Desconoci
dal
aσ (
Muest
ras
pequeñas)
̅ ̅ ̅
X-(
Zα/2)·(
σX/ n)<µ<X +(
Z1-α/2)·(
σX/ n) X-( Sn-1/n)<µ<X +(
tα/2)·( t 2)
1-α/ ·(
Sn-
1/n)
7
6.
-CONTRASTE(
opr
ueba)DEHI
PÓTESI
S.
Una hipótesi
s estadísti
ca es una conjet
ura que se for
mula sobre una
pobl
aciónyquepuedesomet erseapruebaocont rast
aci
ónempír
icaaparti
rde
unamuest rarepresentat
ivadeesapobl aci
ón.Unav ezquelahi
pótesi
sseha
contr
astado se pueden t omardeci si
ones sobrel a mi
sma.Elcont r
aste de
hi
pótesisesunapar t
eesenci aldelmétodoci
entíf
ico.
Paraelcont
rast
edehi
pót
esi
ssedebenf or
marunahi
pót
esi
snulaH0 yot
ra
al
ternat
ivaH1.Enlahi
pót
esi
snula,f
orzosament
edebeest
arelsi
gnoigualy
8
ademáspuedenestarelmayorqueoelmenorque,per
onoambosalav ez.Enl
a
H1nuncaest
áelsignoigual
,conl
asexcepci
onesquesever
ánencadacaso.
Engener al,l
ahi pótesisnulaaf i
rmaquenoexi stedif
erenci
aent r
eelv alordel
estadí sti
co obt enido en l a muest ra yelque f or
mul amos como par ámet ro
pobl acional,esdeci r,
quel adiferenciaobser vadaentreestosdosv al
oresesnul a.
Sin embar go,como elv al
ordelest adísti
co muest raly eldelpar ámet ro
pobl acionalr aravezcoi ncidi
rán,loqueseaf i
rmaesquel adifer
enciaobser vada
entreambospuedeexpl i
carsecomo r esult
ado delazar .Esto es,quesise
repitiesel ai nvesti
gaciónunnúmer osuf ici
ent edev ecesconot r
asmuest ras
aleator i
as delmi smo t ipo yt amaño ext raídas de l
a poblaci
ón,l a mediao
esper anza mat emát i
ca de l as diferencias observadas entr
el os valores del
estadí sti
coyelpar ámet ropobl acionalformul adoenlahi pót
esisnulatenderíaa
desapar ecer( v
alorcero).
Paracadahipótesisnulaseplanteaunahipótesi
salter
nat
iva,r
epresentada
porH1,queeslanegaci óndel ahi
pótesi
snula,detalformaquesilahi pótesi
s
nul
aesf al
sal ahipótesisalt
ernat
ivati
enequeserf or
zosamenteverdader ay
vi
cever
sa.Por tanto,est as dos hipótesi
st i
enen que ser exhaustivas y
mutuamenteexcl
uyentes.
Dependiendodecómoest éformul
adalahi pótesisnulasemarcaladi recci
ón
delcontr
aste.Sil
ahipót
esisnulaH0estáplanteadacomoi gual
daddev aloresyla
al
ternati
vaessunegación,esuncont r
astebilateralporquelaH1 admitequel a
dif
erenci
apuedaserposi t
ivaonegat iv
a.Si,porelcont rari
o,conocemosquel a
dir
ección en quelaH0 puedeserf alsasólo puedeserposi ti
vao negat i
va,
entoncestendremosuncont r
asteunil
ater
al.Ser áuncont r
ast
eunilat
eralderecho
siestamosbuscandounv al
orsuper i
oralpost ul
adoporl aH0 ei zquierdosi
estamosbuscandounv alorinferi
orparaelpar ámetropoblaci
onal(θ)dequese
tr
ate:
Cont
rast
ebi
l
ater
al Uni
l
ater
alder
echo Uni
l
ater
ali
zqui
erdo
H0:θ=θ0 θ≤θ0
H0: θ≥θ0
H0:
H1:θ≠θ0 θ>θ0
H1: θ<θ0
H1:
Elcontr
astebilat
eralsi
empreesmásconservador
,enelsent
idodequehace
másdi
fíci
lrechazarl
ahipótesi
snul
apar
aunmi smoniveldeconf
ianza.
El
procedi
mient
opar
ael
cont
rast
edehi
pót
esi
sesel
sigui
ent
e:
9
a.
-Condici
onesde l ainvesti
gaci
ón ysupuest
osque cumplen l
osdatos
obser
vados.Lavar
iabledebesercuanti
tati
vaymedir
seconunaescal
aderazón
odeinter
val
o(nosirv
epar avar
iabl
esordinal
esonominal
es)
.
c.
-El
ecci
ónycál
cul
odel
est
adí
sti
codecont
rast
e.
Elestadí
sti
co de contr
aster epr
esenta una medida est
andari
zada de la
discrepanci
a entr
elai nf
ormación proporcionada porlos datos empír
icos
recogidosenlamuestr
ayl aproposici
ónteóricaplant
eadaenlahipót
esisnul
a.
Elest
adí
sti
codecont
rast
eomedi dadediscrepanci
anodependedel
as
uni
dadesenqueest
émedi
dalavar
iabl
eysuf
ormulaciónhabi
tual
es:
d.
-Regl
adedeci
sión,
deacuer
doconel
niv
eldesi
gni
fi
caci
ónα.
CONTRASTEUNI
LATERALI
ZQUI
ERDO CONTRASTEUNI
LATERALDERECHO
Zona ZonaAcept
aci
ón ZonaAcept
aci
ón Zona
RechazoH0 H0(
1–α) H0 (
1–α) RechazoH0
|
--
--
--
--
-|
--
--
--
--
--
--
--
---
--
---
--
----
--
--
--
--
--
--
--
-| |
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
|-
--
--
--
-|
α / VALOR CRÍ
TICO VALORCRÍ
TICO / 1-α
CONTRASTEBI
LATERAL Val
oresα/1-α/Zmásf
recuent
es
11
Val
orcr
ít
ico(
Zα/2) Val
orcr
ít
ico(
Zα/2) α 0´
05 0´
01 0´
001
1-α 0´
95 ´
99 0´
999
Z -1´
96 - -
α/
2 2´
58 3´
29
Z1-α/2 1´
96 2´
58 3´
29
α Ni
vel
desi
gni
fi
caci
ón
1–α Ni
vel
deconf
ianza
Zα/2 Z(
Tabl
aII
Inegat
iva)
Z1-α/2 Z(
Tabl
aIVposi
ti
va)
Lasgr
áfi
cassei
nter
pret
andel
asi
gui
ent
emaner
a:
Elnivelde signifi
cación que suele ut i
li
zarse en l a mayor í
a de las
i
nvest
igaci
onesesdel0, 05,aunqueeninvestigacionesmásr i
gur
osasset r
abaj
a
conunniveldesi
gnif
icaciónde0,01yauni nferi
or.Ser echazarál
ahipótesisnul
a
si
emprequel apr
obabili
daddeexpl i
carlosresultadosobt eni
dosenr el
aciónala
H0seamenorqueel niv
el designi
fi
caci
ón.
Unav ezfi
jadoelni
v eldesignif
icación,seobtienenelval
oroval
orescr í
ti
cos
deladi st
ri
buciónmuestralquemar caránl oslí
mitesdel azonadeaceptaci
óno
rechazodel aH0 oseal amáxi madi ferenci
aquepodemosadmi ti
r,porsimple
azar,entr
eelvalort
eór
icoplanteadoenH0yel valorobteni
doenlamuestra.
Lazonader echazodelaH0dependedelniveldesigni
fi
caciónαyeselár ea
deladistr
ibuci
ónmuest r
alquecorrespondeaunv al
ordel adiscr
epanci
at an
al
ejadodeH0quel aprobabi
li
daddeobtenerl
o,si
endoH0v erdader
a,esi
nfer
ioral
12
valordesi gni
fi
cación.Lar egi
óndenor echazodeaH0,compl ementari
aal a
anteri
or,dependedelni veldeconfianza,1- αyeselár eadel adistr
ibuci
ón
muest r
alquecor respondeav al
oresdel adi scr
epanci
atanpocoalejadosdel
formuladoenlaH0quel aprobabi
li
daddeobt ener
lossi
endoH0v
erdaderaesmuy
elevada,noexi
sti
endoev idenci
apararechazar l
a.
Port anto,sielestadísti
codecont rast
esesi t
úaenl azonadeNOr echazo, l
a
diferenciaobser vadanoessi gnif
icati
vaysedebeaer roresal
eat or
iosporl oque
nopodemosr echazarlahipótesisnulaconundet er
minadoni veldeconf ianza.En
caso de si tuarse en la zona de r echazo,diremos que elv alordelEC es
si
gni fi
cat i
vo par a un determinado ni velde signifi
cación y se r echazarál a
hipótesisnul a.Endef i
niti
va,sielv alorabsolutodelECesmay orqueelv al
or
críti
co( elcorrespondientealniveldesi gni
fi
cación),
ser echazalahipót esisnulay
noser echazar áencasocont r
ari
o.
Ladecisiónpuedetomarsetambiénmedi
anteelcálcul
odelnivelpcr í
ti
co,
queesl apr obabil
i
daddeobt enerunosr
esul
tadoscomol osobser
v adosenla
muest r
abaj oelsupuest
odequel aH0esci
ert
a.Laregl
adedecisi
ónat r
avésdel
nivelcrí
ti
coesj ustolainv
ersa:Sipes≤α,rechazar
emosH0,ysip>α,nol a
rechazaremos.Estoes:
Ho( Cierta) (
p)esmay orque( α) Elvalorseencuent raenelinter
val
ode
conf
ianza.Elv al
ordelestadí
sti
coest áentrelosvalorescr
ít
icos.
Ho( Falsa)(p)esmenoroi gualque( α)Elv alorest
áf uer
adelinter
val
ode
conf
ianza.Elv al
orabsolutodelestadíst
icoesmay orquelosv al
orescrí
ti
cos.
e.
-Conclusi
ón.Formulada l
a hipótesi
s nula,provisi
onalmenteverdadera,
someti
daacont r
asteempí
ri
coyunav ezcal
culadoelestadíst
icodecontr
aste,se
concl
uyerechazándol
aomant eniéndolasegúnseai ncompatibl
eonoconl a
evi
denci
amuest r
al.
f
.-Inter
pret
aci
ón.Laconclusi
ónsi
mpleyl l
anaentérminosderechazoonode
l
ahipót esi
snul
ati
enesucorrespondi
ent
ei nt
erpr
etaci
óndentrodelcontext
odel
a
i
nvestigaci
ónydel ahipótesisyobjet
ivosqueeli nvesti
gadorformulaensu
t
rabajo.
13
2.-For mulacióndel ashi pótesi sestadíst
icas( exhaust
ivasymut uamente
excluy entes)deacuer doconl ahi pótesi
sci ent
ífica(H1yH0).
3.-Elecciónycál cul
odelest adísti
codecont r
asteapropiadoalpr oblema
planteadoycál culoconl osdatosmuest rales.
4.-Fijarα( r
egladedeci sión).Lazonader echazodel aH0est ar
áf or
mada
port odosl osvaloresdelest adísticotanext r
emosquel aprobabili
daddeser
obteni dosesmuypequeñabaj oelsupuest odequel aH0esciert
a.
5.-Deci si
ónsobr eelr echazoonodel aH0 medi anteelnivelcrí
ti
co( p)o
medi ant eelolosv alorescrí
ti
cos( α).
6.-Concl usión ei nter
pretación del osresul t
adosen elcont exto dela
i
nv estigación.
7.
-ERRORESENLADECI
SIÓNENUNCONTRASTEDEHI
PÓTESI
S.
Aldecidirentrelahipótesisnulaosual ternat
ivapodemoscomet erdost i
pos
deerrores:
-Er r
ortipoI(α):Eslapr obabili
dadder echazarunahipótesisnulaverdadera.
Coincideconelni veldesi gnif
icaciónα,fij
adoapr i
oriporeli nvest
igador.Su
compl ement ar
io,probabil
i
dad de acept aruna H0 v erdadera es elni velde
confi
anza.
ErrortipoI I(
β):Esl apr obabil
idaddeacept arunahi pótesisnulafalsa.Su
compl ement ar
io1-β,probabili
dadder echazarunaH0 f alsaesl apotenciadel
contraste.
Deci
sión Nat
ural
ezadeH0
VERDADERA FALSA
Deci
sióncor
rect
a. Deci
sióner
rónea
Nose
Ni
vel
deconf
ianza Er
rort
ipoI
I
r
echaza
1-
α β
Deci
sióner
rónea Deci
sióncor
rect
a
Ser
echaza Er
rort
ipoI Potenciadel
Ni
vel
desi
gni
fi
caci
ónα contrast
e
1-
β
14
Paraigualtamañomuest rall
adi sminucióndelerrort
ipoIaumentaelerror
ti
poII.Laopci ónporunouot rodepender ádelt i
podeexperi
ment oydesus
consecuenci
as;en un t ratamient
o médi co elerrorde ti
po IIes peor( no
benefi
ciar
sedeunt rat
ami entomásef i
caz,frent
ealcostedeinversi
ónenuno
quenol oes).Sinembargo, enunjuicioelerrordetipoIesmásgrave(condenar
auninocente,frent
eadejarlibreauncul pabl
e).
15
TEMA2.
-CONTRASTEDEHI
PÓTESI
SENLOSDI
SEÑOSDEUNAMUESTRA.
1.
-INTRODUCCI
ÓN.(
Fór
mul
asdel
apági
na9del
for
mul
ari
o(UNAMUESTRA)
.
Cuandosetratadeinfer
irl
ascaracterí
sti
casdel apobl
aci
ónapar t
irdel
os
datosrecogi
dosdeunamuest r
a,l
ahi pótesi
sacont r
astarespreci
sament
euna
deter
minadacaract
erí
sti
cadeaquell
a.Loscont rast
esbasadosenunamuestra
puedenser:
-Par
amét r
icos,cuandoser efi
erenalestudiodeunparámet
ropobl
aci
onal
(medi
a,var
ianza,propor
ción,cor
rel
ación,et
c.)enunapobl
aci
ónconunaf
unción
dedensi
daddepr obabil
i
dadconocida.
-Noparamétr
icos,cuandonoser elaci
onanconpar
ámetr
ospoblaci
onaleso
seencuent
ranref
eri
dasadat osquepr ovi
enendeunapobl
aci
ónconunaf unci
ón
de densi
dad de probabil
idad desconoci
da.Son menos pot
entes que los
ant
eri
oresynoseest udi
anaquí.
Ademásdepar aesti
marparámetr
ospoblaci
onal
es,eli
nter
val
odeconfi
anza
puedetambiénaplicar
separaelcontrast
edehipót
esi
s.Sinembargo,esmucho
másf r
ecuenteobtenerelest
adí
sti
codecont r
ast
ecomounamedi damásexacta
deladi scr
epanci
aent r
eelv al
orplanteadoenlaH0 yelv al
orobteni
doenla
muestra.
Est
a medi da de la discrepanciat i
ene una di str
ibuci
ón de pr obabil
idad
conocidapar acadapar ámet r
oyv aacompañadadeunapr obabil
idad,ll
amada
niv
el crí
ti
cop, queeslaprobabi l
i
daddeobt enerunr esultadocomoel obteni
doen
l
a muest r
a,o más ext remo,baj o elsupuest o de que l a hipót
esis nula es
verdadera.Noesl apr obabil
idaddequel aH0 seaci ert
asinounapr obabil
idad
condicionada:SiH0fueraciert
a( condici
ón)elnivelpcr í
ti
coindicalaprobabil
idad
deobt enerunv al
ordelest adísti
codecont rastei gualomásext remoqueel
obtenidoefectiv
amenteenl amuest r
a( P(Y≥y i|H0)=p) .
2.
-CONTRASTESSOBRELAMEDI
APOBLACI
ONAL.
a)Cont
rast
esobr
elamedi
apobl
aci
onal
conoci
dal
avar
ianzapobl
aci
onal
.
Elest adí
sti
codecont rast
eeseldel afór
muladelafil
a1yl acolumna1del a
página9delf ormulari
o,quesedi st
ri
buyecomonormalN( 0,1),
siendoYl amedia
obtenidaenl amuest r
a,µo elv al
ordelamedi apoblaci
onalf ormuladoenl a
hi
pót esisnul
a,σY eler
rortípi
codel amediaodesvi
aci
ónt í
picadel adistri
buci
ón
muest raldel amedi a( denominador
),σ ladesvi
aci
ón típicapoblacionalque
suponemosconoci daynelt amañodel amuestr
aqueest amosut il
izandopara
16
cont
rast
arl
ahi
pót
esi
s.
Elestadí
sti
coZcuanti
fi
caladist
anci
adelamedi adelamuest
raalamedia
poblaci
onalenunidadesdelerr
ortípi
co(desv
iaci
óntípi
ca)deladi
str
ibuci
ón
muest r
al.
b)Cont
rast
esobr
elamedi
apobl
aci
onal
desconoci
dal
avar
ianzapobl
aci
onal
.
-Elestadísti
codecontrasteeselcor respondientealafi
la2del acolumna1
delapágina9del f
ormul
ario.
-Sedistri
buyeconarregloalaTdeSt udent,conn-1gradosdel i
ber
tad.
-Elerrortípi
codelamedi aodesv iacióntípicadeladist
ri
buciónmuestralde
l
a media se cal cul
a uti
l
izando la cuasidesviación t
ípi
ca o desvi
aci
ón típi
ca
i
nsesgadadel amuestr
a(denomi nador).
3.
-CONTRASTESOBRELAPROPORCI
ÓNPOBLACI
ONAL.
-Elestadí
sticoecont r
asteeselcorrespondient
ealafi
la3delacolumna1de
l
apági
na9del formul
ario.
-Sedistri
buy enor
mal menteconarregloalanormalN(0,1).
-Elerr
ort í
picodelamedi aodesv i
aci óntí
picadeladist
ri
buci
ónmuest ralde
l
amediasecal culaut
il
izandoladesvi
aciónt í
picadelamuestr
a(denominador).
4.
-CONTRASTEDEHI
PÓTESI
SSOBRELAVARI
ANZAPOBLACI
ONAL.
-Elestadísticodecont r
asteeselcor respondi entealafil
a4del acolumna1
delapágina9del f
ormul ar
io(usandolavar ianzamuest rali
nsesgada, conn-1).
2
-Sedi str
ibuy econar r
egloalaχ ( chi-cuadr ado)conn-1gr adosdel ibertad,
queadi f
erenciadel aN yl aT,noessi mét rica,aunquesít i
enel apropiedad
recí
procaoi nv ersa,demodoque,porej empl o,elv al
ordel adist r
ibuci
ónpar a
0,95esigualal 1/valorpara0,05.
-Paraelcál culodel osinter
valosdeconf i
anzaoer r
ormáximo, cuandon>100
sepuedeut i
l
izarl anormal ,per
oconl afórmul adel af i
la5yl av ari
anzanor mal
(noinsesgada).
5.
-CÁLCULODELAPOTENCI
ADELCONTRASTE.
Lapot enci
adelcont rasteesl aprobabil
idadder echazarunahipót esi
snula
queenr eali
dadesf alsa( i
gualal aprobabil
i
daddeacept arunaH1 verdadera)y
portantoesel compl ement ar
iodel er
rorti
poII(1−β)
, queeslaprobabil
idaddeno
rechazaruna hi pótesis nula que es fal
sa.Elcál culo de l
a potencia de un
contrast
epueder ef
erirseacual qui
erparámetro,per
oaquísól oseexponepar ala
mediayl aproporciónpobl aci
onales.
17
Par apodercal cularlapotenciadeuncont rastelashipótesisnulayal t
ernativ
a
debensersi mpl es,compar ándoseencadaunadeel lasunúni copar ámet r
o
pobl acional,env ezdeunr angodev alores(porej emplomedi a=7f renteamedi a
=9) .Port ant o,porexcepci ón,sepl anteandoshi pótesi
senl asquef i
guraelsigno
i
gualt antoenl ahi pótesisnulacomoenl aalternati
va.Lapot enciadelcont rast
e
variaráenf uncióndel tamañomuest ral yladistanciaentreelvalordel ahipótesis
nulayl ahipót esisalternati
va.
Par a un mi smo v al
ordeler rort ipo Iydi sti
ntos valores de H1,di chas
variacionesser epresent anmedi antel ascur vasdepot encia,quer epresentanla
potenci adeuncont rast
esegúnl osdi st
int
osv alor
esquepuedat omarH1 yel
tamañodel amuest r
a.
Par a calcularl a pot encia delcont r
aste,una v ezest ableci
do elni v
elde
signifi
cación:
a)Sedeterminaelv al
orcríti
codelestadísti
coquecor respondealni velde
si
gnifi
caci
ónelegido,segúnlafuncióndedistr
ibuci
ónapl i
cable.
b)A continuación,se calculala puntuación tí
pica correspondient
eal a
dif
erenci
aent
redi chov al
orobtenidoyeldelahipótesi
salternativa.
c)Laprobabili
dadasoci adaal apuntuacióntípi
cadedi chadiferenci
aesel
err
ortipoI
Io(β),siendolapotenciadelcontr
astelaprobabili
dadcompl ementari
a
será1−β.
Lodeseableenuncont rast
edehipótesi
sesquel asprobabi
li
dadesdeambos
ti
posdeer r
orfuer
anl omenorposi bl
e.Sinembar go,parauntamañodemuest r
a
prefi
j
ado, di
sminuirlaprobabil
i
daddelerrordetipoI ,
α,conduceaincrementarl
a
probabili
daddelerrordetipoII
,β.Elúni
cor ecur
sopar aaumentarlapotenci
adel
contrasteydisminuirlaprobabil
i
daddeer rordet ipoII
,esaument areltamaño
muest ral
.
6.
-NI
VELCRÍ
TICOpYERRORESENLOSCONTRASTES.
Aluti
lizarcomocr i
teri
oelnivelcrít
icopnohayqueest abl
ecerpreviament
e
unniv
eldesi gni
fi
caci
ón, y
aquel adecisiónset
omaenf unci
óndel v
alordep.Sip
espequeñoser echazar
áH0, siesgr andeseacept
aráH0ysiestáent ornoaese
val
or,
sev uelveatomarnuev aevidenciamuestr
alyserepi
teelcontr
aste.Elni
vel
18
cr
ít
icopcomocr
it
eri
odedeci
siónt
ambi
éndependedelt
amañodel
amuest
ra
ut
il
izada.
Elni velpcr í
ti
coes“ elniveldesignifi
cacióndelEC” ,esdeci r,l
apr obabili
dad
asoci adaal a(s)cola(s)paraelvalordelEC.Enelcont rasteuni l
ater
alder echo, es
l
apr obabi l
idadquehayal aderechadelEC( coladerecha) .Comol atablanosda
elv alordepr obabil
i
dadquehayal aizquierda,elni velcrít
ico psecal cula
restandode1di chov alor
.Eneluni later
alizqui
erdo,esl apr obabil
i
dadsi t
uadaa
l
ai zqui erdadelEC( colaizqui
erda)yport anto,eselv alorquenosdal at abla.En
l
osbi laterales,comol asdoscol astienenelmi smov alor
,semul t
ipl
icapor2el
valordel acol aderecha.
Comoelni velpcr í
ti
coi nf
ormadel apr obabil
idadasociadaalv al
ormuest r al
obtenido,proporci
onai nf
ormaciónmáspr ecisaqueelECporsísól oyper mite
mat i
zarlasconcl usionesdelest udi
o.Porej empl o,sip=0.
011,nopodr í
amos
rechazarlaH0 paraunni veldesignif
icacióndel0. 01,perosiseprescindieradel
establ
ecimientodeunni veldesi gni
ficaciónpr edet er
minadopodríar echazarse
coneseni velpcrít
ico.
Recapitulaci
ón:Disti
nciónconceptual entrevalorcrít
icoyniv
elcrít
ico.
1º .
-Elv al
orcrít
icoeselv al
ordelestadí
sti
coparaunni veldeconf i
anza
2
determinado.¿Cómosecal cul
a?Sebuscadi r
ect
amenteenl at
ablaZ,T,χ oF
para0.95o0. 99,siescontr
ast
eunil
ater
alo0.975o0.995siesbil
ater
al.Elval
or
crí
ticodeZyTosci l
aentremásymenosi nf
ini
to,
eldechi
-cuadr
adoyFent re0e
i
nfinit
o.
2º
.-Elni
velpcrí
ti
coeselniv
eldesigni
fi
caci
óndelestadí
sti
codecont r
aste,
esdeci
r,l
aprobabi
l
idaddequeelval
ordelavari
ableseaeldelamuestraomás
ext
remo.¿Cómopuedenpregunt
arl
oycómosecal cul
a?Vari
asposi
bil
idades:
a)Sinospidenelv alorpcrítcopar
i aundet erminadovalordel
av ar
iable,hay
quecalcul
arelestadí
sticocorrespondienteybuscarl aprobabil
i
dadasociadaal a
tabl
a.Sielcont
rasteesuni l
ateralderecho,elniv
el pcrí
ti
coes1menosel valorde
l
at abl
a.Siesbi l
ateraleser esultado semul t
ipli
capor2.Y siesuni l
ateral
i
zquier
do,elval
ordel atablaesel nivelpcrít
ico.
b)Sil
opidenpar
aunval
ordelest
adí
sti
codecont
rast
eseaelcal
cul
adou
otr
ohipot
éti
coquenosden,sebuscadi
rect
ament
eenl atabl
ayseprocede
comoena).
c)Sinocoi
nci
deexactamenteelval
ordelECconeldelat abl
a,sebuscanl os
val
oresdelest
adí
sti
comáspr óxi
mosporexcesoypordef ectoyl aprobabil
i
dad
asoci
adaal osmismoscalcul
adaconformea)ob) ,ent
rel oscualesest ar
áel
niv
elpcrít
ico(
nosofr
ecer
áncomor espuest
asvari
asdesi
gualdades).
19
3º
.-Cont
rast
edehi
pót
esi
sconel
val
orcr
ít
icoyel
niv
elpcr
ít
ico.
Cuant
omásext r
emoeselv al
ordelest
adísti
codecontr
aste,menoressu
ni
velpcrí
ti
co.Port
anto,
lar
egl
adedecisi
ónexpresadaent
érminosequi
val
ent
es
es:
-Si
elECesmásext
remoqueelVC,
ser
echazal
aH0yseacept
aH1.
-Sielnivelp crí
ti
co cor
respondi
ente alEC es menorque elni
velde
si
gnif
icaci
ónα,ser
echazal
aH0yseacept aH1.
20
TEMA3.ANÁLISI
SDEDATOSPARADISEÑOSDEDOSGRUPOS.MUESTRAS
I
NDEPENDIENTES.(
Fór
mul
aspági
na10delcuader
nil
l
o)
1.
-INTRODUCCI
ÓN.
2.
-CONTRASTES DE HI
PÓTESI
S SOBRE DOS MEDI
AS EN MUESTRAS
I
NDEPENDI
ENTES.
a)Var
ianzaspobl
aci
onal
esconoci
das.
b)Vari
anzas poblaci
onal
es desconoci
das supuest
as i
gual
es
(homocedast
icidad).
c)Var
ianzaspobl
aci
onal
esdesconoci
dasysupuest
asdi
sti
ntas.
Lascondi
cionesysupuestosson:Var i
abl
edependi
ent
emedidaaniv
elde
i
nterval
ooderazón,dospobl
acionessupuest
ament
edist
ri
bui
dasnor
mal
menteo
21
ensudef ectomuest rasgrandes( n1 ≥30y n2 ≥30) .Lasfórmul
aspar ael
estadíst
icodecontrasteyl
osgr adosdel i
bert
adsonlasquef i
gur
anenlafi
la4de
l
apági na10( Welch,1938)(di
stribuci
ónTdeSt udent,conl osgr
adosdeli
bertad
quer esult
andelaf ór
mula),
enl aqueseut il
i
zanlosvaloresdelascuasi
var
ianzas
ovarianzasinsesgadasmuest r
ales.
3.-CONTRASTE DE HI PÓTESI S SOBRE DOS VARI ANZAS EN MUESTRAS
INDEPENDI ENTES.
4.
-CONTRASTEDEHI
PÓTESI
SSOBREDOSPROPORCI
ONESENMUESTRAS
I
NDEPENDI
ENTES.
5.
-TAMAÑODELEFECTO(
índi
ce“
d”,
est
adí
sti
codeCohen)
.
22
TEMA4.ANÁLI
SISDEDATOSPARADISEÑOSDEDOSGRUPOS.MUESTRAS
RELACI
ONADAS.(
Fór
mulaspági
na11delcuader
nil
l
o)
1.
-CONTRASTES DE HI PÓTESIS SOBRE DOS MEDIAS EN MUESTRAS
RELACIONADAS.(Todos l
os sujet
os pasan por l
as mismas condi
ciones
exper
iment
ales)
a)Var
ianzadel
asdi
fer
enci
asconoci
da.
b)Var
ianzadel
asdi
fer
enci
asdesconoci
da.
3.
-CONTRASTEDEHI
PÓTESI
SSOBREDOSPROPORCI
ONESENMUESTRAS
RELACIONADAS.
Resumendet
rucost
emas1-
4:
-Si
pregunt
anporpor
cent
aje,
esuncontr
ast
edepr opor
ciones.
-Si
pregunt
anporundat
oengeneral
,esuncont
rastedemedi as,
sal
voquese
23
i
ndi queotr
acosa.
-Sinosdaneldatodecuasi
vari
anzaovar
ianzainsesgada,hacer
efer
enci
aa
valoresmuestral
es,nodel
apoblaci
ón.Sal
voquesedi gaotracosaosehagal a
prueba F,sepr esumequel asvari
anzaspoblaci
onalesson desconoci
dasy
supuestasdif
erentes.
TEMA5DI
SEÑOSCONMÁSDEDOSGRUPOSI
NDEPENDI
ENTES.
1.
-INTRODUCCI
ÓN.
2.
-CONCEPTOSBÁSI
COSDELANOVA.
Enelmodel omássimple,deunsol
of act
orounifact
ori
al,l
avar
iabi
l
idado
vari
anzagener
alocomúnqueseobser vaentr
elaspuntuaci
onesdel
osgr upos
despuésdehaberint
roduci
docambiosenlaVI,est
áformadapordospar t
eso
componentes:
ElcometidodelANOVA esdiscerni
rquév ari
abil
idadcor respondeacada
parte.En l
at er
minol
ogí
a delANOVA,l as v
ar i
ables independientes que se
estudi
anreci
benelnombredefactoresylascategoríasenquesedi videnlos
factor
es,
eldenivel
es.
3.
-FUNDAMENTOSDELANÁLI
SISDEVARI
ANZA.
Sipar
ahacercompar
aci
onesent
remásdedosmuest
rasut
il
izár
amosl
as
24
pruebasT( temas3y4),ademásdel acompleji
daddeloscál
culosport enerque
analizarl
asdedosendosent odaslascomplicaci
onesposi
bles,tendr
íamosdos
problemas:
a)Sepasar í
aporaltolainter
acci
ónent relasvari
abl
esi ndependient
eso
factores.
b)Aument arí
alapr
obabil
i
daddecomet erelerr
ordeti
poI.
Par
aev i
tarestosproblemasseut il
izaelAnál isi
sdeVar i
anza(ANOVA o
ANVAR)cont rast
andoladifer
enci
ademedi asentrev ar
iasmuest
ras.
Lahipótesisnul
ageneralesquenoexi st
ediferenci
aalgunaentr
elasmedi
as
(enlav
ariabledependi
ente)delosdi
sti
ntosgruposomuest r
as.
Parami ni
mizarl ainfl
uenci adelasv ari
ablesextrañas,conoci
dasonoyev i
tar
sesgossi stemáticosenl osr esult
adosqueseconf undenconl osef ect
osque
pudierandeber seal av ariableindependientesepr ocedeal aal
eatori
zacióndel
muest reot antoenl ael eccióndel ossuj etoscomoenelor dendeasi gnacióna
l
ascondi cionesexper i
ment al
esoni v
eles( contr
abalanceo).Estoreduceaunque
noel i
mi nal aposi bi
li
daddequel asdi f
erenciasobser vadasentrelosnivelesno
seanf rutodelef ectoconj untodel av ar
iableindependienteydef actor
esdeazar
yport anto,per mitesuponerquel oserroresexper i
ment al
essoni ndependient
es
delosef ect osdel osdisti
nt osnivel
esdel osf act
ores.
4.
-ANÁLI
SISDEVARI
ANZADEUNFACTOR(
ANOVAUNI
FACTORI
AL)
Lospasospar areali
zarelANOVAson:
1.
-Pr obarl ossupuest osqueper mit
enapl i
carelANOVA:VD cuant itati
va
medida a escal a de inter
valoor azón (no sir
ve sies or di
nalo nomi nal),
i
ndependenci a de l as observaci
ones (testde r achas),normali
dad de l as
di
stri
buciones( pruebasdel abondaddeaj uste,Li
ll
iefor
s,Kolmogorov-
Smir nov,
2
X dePear son),yhomogenei daddel asv ar
ianzas( homocedast
ici
dad,testde
Cochran par a model os equili
brados y testde Bar t
let
tpar a modelos no
equi
li
brados).
2.
-Enunci arlashipótesi
sestadísti
cas.
25
3.
-Deci di
rel estadíst
icodecont rastequevamosaut i
li
zarparaprobarl
aH0.
4.
-Est abl
ecerel niveldeconf i
anzaol aregi
óncrí
ti
cader echazodelaH0
5.
-Cal cul
arel valordelestadíst
icodecont r
aste(
TabladelANOVA)
6.
-Tomarl adeci si
ónsobr elaH0( comparandoelval
orFobt eni
doconelval
or
cr
ít
ico,contrasteuni l
ater
alderecho) .
7.
-Interpret
aciónenel contextodel ai
nvesti
gaci
ón.
26
HIPÓTESI
S Efectosf
ij
os(sobr
elasmediaspobl
aci
onal
es)/
/Ef
ect
osal
eat
ori
os(
sobr
elasv
ari
anzas
cuandoson=0,lasmedi
assonigual
es)
.
EFECTOSFI
JOS EFECTOSALEATORI
OS
H0:
µ1=µ2=µ3=…=µi σ2B=0
H0:
H1:
µ1≠µ2≠µ3≠…≠µial σ2B≠0
H1:
menospar
aunaµi
Cál
cul
osi
mil
ar
TABLAANOVAUNI
FACTORI
AL(
Últ
imocuadr
opági
na12f
ormul
ari
o)
CÁLCULOS:
Secumpl
e[SCTOTAL=SCINTER+SCINTRA]yG.l
i
ber
tad:
[N–1=(
I–1)+(
N–I
)]
SCTOTAL=ΣΣY2–{ 2
(ΣΣY)/N}
SCINTRA=SCTOTAL-SCINTER
2 2
SCINTER=Σ(
ΣY) /n–{ (ΣΣY) /N}
DECISIÓN:RechazamosH0 ( i
gualdad demediasenl osdisti
ntosni
vel
es)sielvalordelaF
experi
ment al(
estadíst
icodecont
raste)esmay orqueelv
alorFobteni
doenlastabl
as,
par
aunnivelde
si
gnifi
cación(α)predeter
minado.
ElNumer
adordelestadísti
codecontr
ast
e( MCINTER)conti
enelaVarianzadeer
ror+Efector
ealdela
VI
.ElDenomi
nador(
MCINTRA)c ont
ienel
aVari
anzadeer ror.Port
anto,cuantomenoreselefect
orealde
l
aVImásseacercaelcocienteauno.
Val
orCr
ít
ico:F(I-1)(N-I)(1-α) ZonadeAcept
aci
ón:F<F((I-1)(N-I)(1-α)
Deci
sión:
ZonadeRechazo:F≥F(I-1)(N-I)(1-α) SiF<Fcrítico AceptamosH0
SiF≥Fcrítico RechazamosH0
27
Cálcul
osabreviados(Util
izamoselsist
emadenot aci
ónpropuestoporKeppel
):ElcálculodelasSumas
de cuadrados se r eal
iza sumando y restando l
as r
azones básicas:[Y]( r
elacionada con l
as
puntuaci
onesindivi
duales);[
A]conlostot
alesdelosni
vel
esy[ T]conl
asumat otal
.
Estr
uctur
adecálculodelnumerador
:Seelevanalcuadr
adol
ascanti
dadesi
mpl
i
cadasypost
eri
orment
e
sesuman.
Estr
uctur
adecál cul
odeldenomi nador:Cual
quier
aqueseaelt ér
minosedivi
deporelnúmerode
puntuaci
onesquecontr
ibuyenasucálcul
o.
Fór
mul
aspar
alasr
azonesbási
cas SumasCuadr
adosapar
ti
rder
azonesbási
cas
[T]=T2/(a)(
n) Di
señoequi
l
ibr
ado SCTOTAL=[
Y]–[
T]
2
[T]=T /N Di
señono
2
equi
li
brado SCT=∑∑(
Y–YTOTAL)
A]=∑A2/n
[ Di
señoequi
l
ibr
ado SCA=[
A]–[
T] SCINTERGRUPO
2
SCA=∑n(
YA–YTOTAL)
[
A]=(∑A21/n1)+(
∑A22/n2)+…
(
Diseñono
equi
l
ibrado) SCS|A=[
Y]–[
A] SCINTRAGRUPO
Y]=∑Y2
[ SCS|A=∑∑(–
Y YA)
2
N=Númer
otot
aldeobser
vaci
ones/
/n=Obser
vaci
onesporni
vel
Recapi
tul
ando,enelANOVA uni
fact
ori
al,l
ashi
pót
esi
squesesomet
ena
contr
asteson:
Elestadí
stico de contr
aste es elcociente entr
el a medi
a cuadrát
ica
i
ntergr
uposylamedi acuadráti
caintr
agrupos,quesedistri
buy
esegúnunaFde
Fi
sher-
Snedecor,con( I-1)y( N -I)gradosdel iber
tad,enelnumeradory
denominador
,respect
ivamente(pági
na12del for
mulari
o).
En elexamen se suel
en f
aci
l
itarl
osdat
osde l
asmedi
aso l
assumas
28
cuadráti
casnecesar
iospar
acalcul
arlosr
estantesylomási mpor t
ant
eessaber
rel
aci
onar l
asambasmedi ant
elasf ór
mulascor r
espondi
entes(estátodoenel
formular
io,enelexamenhayquet enerpacienci
apar abuscarlosdatosenla
tabl
aquecor r
esponda):
SCtotal=SCInter.+SCintra(SC=sumacuadr áti
ca),midelavari
abili
dadt otalyes
i
gualal asumadet odasl aspuntuacionesmenosl amediatotalalcuadrado.
SCIntermi delav ar
iabilidadentr
elosnivelesov ari
abi
li
daddebidaalef ectodel
fact
oryesi gualal asumadel amediadecadani velmenoslamedi adelf actoral
cuadrado.
SCintra midelav ari
abilidaddentrodecadani velov ar
iabi
l
idaddebi daaler ror
experi
ment alyesl asumadecadapunt uaci
ónmenosl amedi adesuni velal
cuadrado.
Par aresolv
erelSudoku,convi
eneempezarporelfi
nal
:Losgradosdeliber
tad
tot
alesdelANOVAesN- 1yapar ti
rdeahísev acomplet
ando.Comoseexpl ica
enelr ecuadro,sinosdanlasrazonesbási
cas(comoensept i
embre) asA2son
,l
l
oscuadr adostotal
esdelassumasdel asA,nol assumasdel asAelevadasal
cuadradoyl asn,elnúmerodesujetosdecadamuestraoniv
el.
5.
-COMPARACI
ONESMÚLTI
PLES(
prev
ior
echazodeH0)
.
Parti
endodelrechazodel ahi
pótesi
snulasisóloint
eresacompararal
gunos
ni
v eles delf act
or el egi
dos de antemano,habl ar
emos de compar aci
ones
plani f
icadasoapr i
ori.Enestoscasos,l
osresul
tadosobtenidosdeFnisiquier
a
suel encitar
se.Perosii nt
eresahacer
lassobretodoslosnivelesdelANOVA,se
tr
at arádecompar acionesnoplani
fi
cadas,apost
erioroposthoc.
i
Una delaspruebasmásut i
li
zadasen est esegundo caso esl
a del as
compar aci
onesmúlt
ipl
esdeScheff
é,queademásdecompar arl
asmedi
asdel os
nivelesdelANOVAdosadosper mitereal
izarcomparacionesmáscompl ej
as
(porejemplolamediadeunni
velconunconj unt
odemedi asdeotr
osni
veles,un
29
conj
unt
odemedi
asdedi
sti
ntosni
vel
esconot
roconj
unt
odemedi
asdeot
ros
ni
vel
es,et
c.)
.
Est
apruebafi
jalatasadeerrordeti
poIenelαalqueest emost rabaj
andoy
obti
eneunv al
orll
amadodi fer
enciamínima,r
angoov al
orcr í
ti
coCR ( Cri
ti
cal
Range)deSchef
féporencimadelcualseconsi
der
aquehaydi ferenci
asentrelas
mediasogruposdemedi asqueest emoscomparando.Lafórmulaest áalfi
nal
delapági
na12del f
ormular
io:
__
___
___
____ __ ____ _ __
___
______
___
__ _
_
2
CRSCHEFFÉ=√(
k-1)F(k-1),glERROR ·√MCERROR[
Σ(cj/nj)
]
30
Regl
adedeci
sión:
Sielval
orabsol
utodeladiferenciadel asmedi asdel osgruposcomparados
es may or que elCR,existen di ferencias signi
fi
cati
v as ent
rel os ni
vel
es
consi
deradosynoencasocont r
ario.Elr esul
tadoindicar
áaquégr upoogrupos
corr
espondelavari
abi
li
dadsi
gnificati
v adetectada.
31
TEMA6.ANÁLI
SISDEDATOSENDI
SEÑOSI
NTRASUJETOS.
Un di seño intrasuj et
os,ANOVA uni factorialint
rasuj etos o de medi das
dependi entes or epet i
dasesaquelenelquesesomet eal osmi smosoalúni co
sujetoex periment alat odosl osni veles( estudiados)delf actor
.Par ami nimizar
(nuncael iminarporcompl eto)elprincipalriesgodeer ror( aprendizaje,
paut asno
detect adas,f ati
ga,et c.),l
asecuenci auor denenquesepr esentanoapl i
canl as
condi cionesal ossuj etosdeber eali
zarsecont r
abalanceando.Si nembar go,est o
sólo es est rict
ament e necesar i
o siut i
l
izamos un di seño en que t odos l os
estímul osdelmi smot iposepr esentanagr upadosenundet erminadoor deno, si
esenor denal eatori
o, sequi er
edescar t
arquehay apat
ronesdepr esentaciónque
hanpasadodesaper cibidos.Fór mulaspági nas12yss.delf ormulari
o,siendol os
valoresdel ossumat or i
osr epresentadosent r
ecor chet
esl asr azonesbási cas.
Condici
onesysupuest os:Lossupuestosquedebencumpl i
rsepar apoder
apli
carcor r
ectamente elANOVA son l os mi smos v i
stos par a elANOVA
i
ntersuj
etos,est
oes,VDmedi da,aunniveldeintervalooder azón, puntuaciones
de la VD en cada ni v
eldelf act
orindependi entes entre síy di stri
buidas
normalmenteyademás,doscondi ci
onespar t
icul
arespar areducireler r
orporl a
i
nteracci
ón:Lasv ari
anzasdel aspuntuacionespar al
osdi st
intosniv el
esdel
fact
ordebenseri gualesentresíylascovarianzasent retodosl osni vel
esdel
fact
ordebenserigualesentr
esí.
Supuestaslahomocedastici
dad (i
gual
dad dev arianzas)yl aigualdad de
correl
aciónent
recadapardet r
atami
entos,lamat r
izdev ari
anzas-
covari
anzas
tendrálapropi
edaddelasimet r
íacompuesta,condi
ciónsuf ici
entepar
ausarel
model operononecesar
ia,si
endo pococomúnenl aprácticayexcesi
v amente
restri
cti
va.
Metodologí
a: Lav ari
abil
idadtotalSCT=SCA+SCS+SCAxS, si
endo:
-SCA,lavar
iabil
idad( var
ianza)delfact
ormani pul σ2A)
ado( .
-SCS,lavar
iabil
idad( var
ianza)delossujetos( σ2S).
-SCAxS,l
avariabil
idad( v
arianza)delainteracciónentr
eelf act
oryl
ossuj
etos
2
(
σAxS,error)
.
(
SCAXS)=(
SCp)+(
SCresidual)si
endo(
g.l
.AxS)=(
g.l
.p)+(
g.l
.r
esi )
dual
32
El
est
adí
sti
codecont
rast
eesF=(
MCA/MCSxA)(
Fisher
-Snedecor
).
Lafor
madecálcul
oesmuysimil
araladelt
emaanteri
or,perouti
li
zandol as
fór
mulasdelapági
na13delf
ormul
ari
o(v
arí
anlosg.l
.yportanto,l
asrelaciones
entr
eMCySC) .
TEMA7.DISEÑOSCONMÁSDEDOSGRUPOSI NDEPENDI ENTES.ANÁLI SIS
DE VARIANZA CON DOS FACTORES COMPLETAMENTE ALEATORI ZADOS
(ANOVABIFACTORI
AL).
Enlosdi señosfactori
alessequi er
eestudiarelefectoquesobr eunav ari
abl
e
dependiente ejercen dos f actores o v ari
ables independientes A y B
completament ealeatori
zados,todosel l
osconi gualnúmer odecat egoríasde
modot odosl osnivelesdeunosecombi nanconl osdelot ro.Undiseñofactori
al
consi
steenunconj untodedi señossimplesdeunf actorenelcuall ami sma
var
iabl
ei ndependienteesmani puladaencombi naciónconunasegundav ari
abl
e
i
ndependi ent
e.
Conundi
señof
act
ori
alsepuedenanal
i
zar
:
1)Losef ectospr i
nci esdecadaunadel
pal asVI(factores)sobrel
aVD.Se
consi
derantantosef ectospri
nci
palescomof actoreshayimpl i
cadoseneldiseño
yseanal i
zanmedi anteunANOVA decadaf actorsi
nconsi derarelotr
o.Los
efect
ospr i
ncipalesdeunav ar
iableindependienteo factorser ef
ier
enal os
efect
ospromedi otot al
esdeunav ari
ableyseobt i
enecombi nandoelconjunto
complet
odecomponent esexper
imentalespresentesenesef actor
.
2)Elef ect
oi nt
eracci
ónent r
el osf act es.Exi
or steinter
accióncuandoelefecto
producidoporl osnivel
esdecadaunodel osfactoresdependedel osnivel
esde
otrofactor.Enelmodel oANOVA,l asVIseconsi deranindependi
entesentresí
perolosv alor
esdeunosf act
oresi nf
luy ensobrenlosdeot ros.Portanto,
además
de lai nfl
uencia que cada factorej erce porsepar ado en la VD,existe una
i
nfluencia debida a l a combinación de ambos.Se consi der
a que existe
i
nteracciónencual qui
eradelossi guient escasos:
3)Losefect
ossi
mples,omásf zadosdecadaf
ocal
i actorconcadani
veldel
ot
rofactor
.Sepuedenconsider
artant
osefect
ossimplescomol asumade
ni
vel
esdecadafact
or.
Procedimiento:Apar t
irdelatabladelANOVAf actori
alsereali
zal aprueba
ómnibus( efectosprinci
palesyefectointeracción).Sielefectointeracci
ónes
si
gnifi
cati
voseconcl uyequeelef ectoproduci doporl osnivel
esdeunf actor
dependedel osni v
elesdeot r
ofactoryrechazar emosH0. SiFnoessi gnifi
cati
va,
seacept aH0,seconsi deraquenoexi st
eef ect
oi nt
eracci
ónyelmodel ose
convi
erteenf actori
aladit
ivo(nor
mal )
,demodoqueenelcuadr odelANOVAl a
fi
ladelainteracci
ónsesumaal er
roryser ecalculaF.
Sielef
ect ointeracciónessi gni
fi
cati
vo,sereali
zalapr uebadelosef
ect
os
simplesycompar aci ónporpar esydespuésl adel osef ect
ospri
nci
pal
esen
funci
óndel osefectossi mples.Sinoessignif
icat
ivo,sereali
zalapr
uebadel
os
efect
osprincipal
esysial gunoessi gni
fi
cati
vo,sepr ocedealestudi
odelas
comparaci
onesmúl t
iples.
Model
oest
adí
sti
codeANOVAconi
nter
acci
ón:
Y=µ+α+β+(
αβ)+ε.
Cualquierpunt
uaci
ónYt i
ene5component es:Lamediatotaldelapoblación,
l
osni v
elesdel osdosfactor
es,comúnat odosloscomponentesadscrit
osaesos
ni
veles(promediosdel osefect
osdeltr
atamientoenlosniv
elesdel osfact
ores),
elef
ectointeracci
ónentreambosyel er
rorexperi
mentalnocontrol
able.
Model
oest
adí
sti
codeANOVAsi
nint
eracci
ón:
Y=µ+α+β+ε.
Cualqui
er punt
uaci
ón Y t
iene l
os mi
smos component
es,except
o l
a
i
nteracci
ón.
Alconsiderarlaint
eracción,l
aSCintra dismi
nuy
eenl acuantí
aquer ecogela
SCAxB delainteracci
ón,asícomol osgr adosdelibertad,demodoquel aF
resul
tant
eser ámay orporladi sminuci
óndel aMCerrory
,enconsecuencia,más
preci
soelcontrastedehipótesis.
Lashi
pót
esi
sest
adí
sti
cassepuedenexpr
esardel
asi
gui
ent
efor
ma:
Ef
ect
ospr
inci
pal
esf
act
orA:H0:
Todosl
osαi=0;
H1:
Not
odosl
osαi=0.
Ef
ect
ospr
inci
pal
esf
act
orB:
H0:Todosl
osβi=0;
H1:
Not
odosl
osβi=0.
34
Ef
ect
oint
eracci
ónAxB:
H0:
Todosl
osαβij=0;
H1:
Not
odosl
osαβij=0.
Losestadísti
cosdecont
rast
esonl asrazonesentr
elasmediascuadr
áti
cas
cor
respondientesyl
amediacuadrát
icai
ntr
agr upos,
quesedi
str
ibuy
esegúnF.
35
Fi
gur
a7.
5Secuenci
adeanál
i
sisenundi
señof
act
ori
al
36
TEMA8.
-ANÁLI
SISDEREGRESI
ÓNLI
NEALSI
MPLEYMÚLTI
PLE.
1.
-INTRODUCCI
ÓN.
Unabaj a corr
elaciónent r
ev ari
abl
esimplicaquenohayr el
aci
ónl i
nealentr
e
ell
as, per
onodescar t
aquepudi erahaberl
adeot rot
ipo(exponenci
al,l
ogarí
tmica,
etc.).Unaal t
acor relaciónl i
nealoi mpli
canecesar i
amentequehay arelaci
ón
causalent reellas,puespodr íaocurri
rqueambasf ueranafect
adasporuna
vari
abl eajenaalmodel o,porejemplo,C.I
.yal t
urat
ienenaltacorr
elaci
ónenl os
niñosper oambasest ánr el
aci
onadasconl aedad.
2.
-ANÁLI
SISDEREGRESI
ÓN(
LINEAL)SI
MPLE.
Cuando una v ar
iable,independi
ente(VI)
,aport
ai nformaci
ón sobre ot
ra,
dependient
e( VD),decimosqueambasest áncor
rel
acionadas.Elobjet
odel a
corr
elaciónesanal i
zarelgr adodeasoci aci
ónentrelasv ari
abl
esyeldel a
regr
esión,efect
uarpr edicci
onesacercadel osval
oresdel aVD paravalor
es
dadosdel aVI.LaVIser epresentaporX,l
aVDporYyl osv al
oresest
imadospor
Y’.
I
maginemosqueenunagr áfi
caserepr esentanlospunt os(nubedepuntos)
queindi
canl osv alor
esdeX eY.Lar egresi
ónl i
nealser eal
izamedianteel
métododel osmí nimoscuadr adosajustandoadi chosdat osunalí
nearect
aque
mini
micel oscuadr adosdel asdifer
enciasent r
el osv al
oresreal
esdeYpar aun
val
orcualquieradeXyl osv al
oresesti
madosdeY( Y’)queresul
tar
íandeapli
car
l
aecuaciónder egresiónresult
ante.
Ej
empl osderegr esi
ónlinealyexponencial:
37
El
model
oser
epr
esent
a:
a)Par
apunt
uaci
onesdi
rect
as:
Y’=BX+B0,
siendo:
-Y’elval
orest i
madodeY,
-B l a pendiente de lar ecta de regr
esi
ón (coefi
ciente de r egresi
ón)y
representaelaument odev al
orqueexper i
mentaYcuandoXaument aenuna
unidad;
-B0,eli
nterceptoov alordelaordenadaenelorigen(v alorpronosticadodeY
cuandoX es0) .Eli nter
cepto,ali gualquelosdemásv al
oresdeY’quese
encuent r
enf ueradelr angodev al
oresdel aVI,noesobj etodei nterpret
aci
ón,
salvoqueel valor0seencuent redent r
odel r
angodev al
oresdel aVI .
b)Par a puntuaciones di
fer
enci
ales (dif
erenci
as entr
elas punt
uaci
ones
di
rectasyl amedi a):Y’=B(
X-)
X.Laor denadaenelor igenpar
apuntuaci
ones
di
ferenci
alesval
e0.
c)Par
apunt
uaci
onest
ípi
cas:
Z’=rZ.Y XY X
Lasdiferenci
asent
relosval
oresdel avar
iabl
eobservadosylosesti
mados
sonloser r
oresdeesti
maciónopredicci
ón.Lasumadel amediadelosv al
ores
pronost
icadosesigual
alasumadel amediadelosval
oresobser
vados.
Enconsecuenciaelmodel oderegresi
ónlinealesY’=BX+B0+ε endoεel
,si
errordeest i
maciónolosr esiduosunav ezesti
madoelv alordelaVD.Par aque
sean v áli
das l
as inf
erencias sobrela VD se deben cumpl irlas sigui
entes
condicionesysupuest osbási cos(sucompr obaciónrequier
equehay av ar
ias
muest rasqueper mit
anest udiarl
adistri
buci
óndel osdisti
ntosv al
oresdeY
predichosparacadavalordeX) :
-Independenci
adel asobservaci
ones(muestraselecci
onadaal
eatori
amente)
.
- Homocedasti
cidad,var
ianzasdelasdi
str
ibucionesdeloserr
oresigual
es.
38
- Nor
mal i
daddelasdi
str
ibuci
onescondi
cionadas.
-Independenci
aentrelosv al
oresesti
madosyl oser
ror
esdeest
imaci
ón.
Expr
esadoent ér
minosdecoef
ici
ent
edecorr
elaci
óndePear
son,r’
ε=0,est
o Y
es,l
oserr
oressedist
ri
buy
endemaneraal
eat
ori
a,si
ncor
rel
aci
ónconlaVD.
3.
-BONDADDEAJUSTEDELARECTADEREGRESI
ÓN.
Elgradodeasoci aciónent r
el asvariabl
esseexpr esamedi anteelcoefi
cient
e
de cor r
elación de Pear son,cuy ov alorest á si
empr e compr endi
do entr
e- 1
(relaciónlinealnegativ
a)y1( r
elaci
ónl i
nealpositiv
a),indicandoel0quenohay
relaciónl i
nealentrelasv ar
iabl
es( podríahaber l
adeot r
ot ipo,noobst ant
e).Su
fórmul a(pági na15)es:
Rxy=Sxy
SxSy
2 2
Elcuadrado delcoefi
cient
edecor r
elaci
ónr xy o R e selcoeficientede
determinaci
ón( v
alorcomprendi
doentre0y1)yexpr esalaproporcióndel a
vari
anzadel aVDexpl i
cadaporlavari
anzadel aVIyl apr opor
ciónenquese
reduceelerrordelaVDcuandoempleamosl arectader egresi
ónparaest i
mar l
a.
Elvalorabsolut
odelcoefi
cient
ededet erminaciónesmenorqueelcor relaci
ón,
salvocuandores0o+/ -1,quecoi
nci
den.
2
Elcompl ementari
odelcoef i
cient
ededet erminaci
ón1-r xy eselcoefi
ciente
dealienaci
ónyesl apar
teresidualdelav ar
iabi
li
daddelaVD,at ri
bui
bleaot ros
fact
oresnor el
aci
onadosl i
nealmenteconl aVD,esdeci r
,lapr oporci
óndel a
vari
anzadel aVDnoexpl icadaporl avar
ianzadel aVIoloqueesl omismo,l a
vari
anzadeler r
or.
Ot
roindicadordelajust
eeselerr
ortí
pico,queesunest
imadorinsesgadode
l
a desvi
ación tí
pica delerror
.Su f
órmula esla úl
ti
ma dela página 15 del
f
ormular
io.
4.
-INFERENCI
ASSOBRECORRELACI
ÓNYREGRESI
ÓN.
Normalment
el oscoef
ici
entesdecorr
elaci
ónyregresi
óndelapoblaci
ónson
desconoci
dos. Los supuestos bási
cos y condici
ones par
a poder hacer
i
nferenci
asdelosdatosmuest ral
esalosdelconj
untodel apobl
aciónsonlos
39
vi
stosant es(independencia de l
asobservaci
ones,homocedast
ici
dad de l
as
var
ianzas,normalidaddel asdistr
ibuci
oneseindependenci
aentrelosval
ores
est
imadosyl oserroresdeestimaci
ón).
-Contr
ast esobreelcoef i
cientedecorrelaci
óndePearson.Lahipótesi
snula
esquenohayr elaci
ónentreVIyVD( coef
icientedecor
rel
aciónpoblaci
onaligual
acero),mientrasquel ahipótesisal
ter
nati
v apostul
aquelar el
aci
ónl i
nealentr
e
ambasessi gnif
icat
iva:H0:ρ=0.H1:ρ<>0( ρeslalet
ragr i
egaro).Haydos
for
masder eal
izarl
o:
-Conelest adíst
icodelaf
il
a1col
umna1delatabl
a1delapági
na16del
f
ormular
io,quesedi st
ri
buy
ecomounaTdeSt
udentconn-
2gr
adosdeli
ber
tad
(
cont
rastebil
ater
al).
-Medi ant
eelANOVAdel ar
egresi
ón, conlar azónF=MCregresión/
MCresiduos,que
sedistri
buyesegúnunaFdeSnedecorcon1yn- 2gradosdel iber tad(cont r
aste
unil
ater
alderecho)
,for
mulari
o,tabl
a2, página16, gradosdeli
ber tadtot
al esdel a
regr
esión n-1.Se usa cuando nos dan l os datos de l
as sumas o medi as
cuadráti
cas.
-Hayunar
el ónT2=F,
aci vieneenel
for
mul
ari
o.
-Cont r
astepar aloscoefi
cientesder egr esiónByB0 ( ANOVA).Lahipótesi
s
nulayl aalternati
vasonH0:B=0;H1:B≠0sielcont r
asteesbi l
ater
al.Sies
unil
ateral
,l
aH0ser áB≤oB≥queelv alorfor muladopar alaH0.Losest adí
sti
cos
seincluyenenl asfi
las2y3del aprimerat abl adelapági na16delformular
io(T
deStudentconn- 2gr adosdel
ibertad),
cont rastebilater
al.
Hayquet enercuidadoconl asfórmulas“ ocult
as”delf or
mulari
o,porsienel
examenpusi eranunat abl
adedat osparalar egresión(pocof r
ecuent
e,peropor
siacaso):
S2Y.Enl
-SCtotal=n· acal culador aCasi o, enmodor egr esión,hayqueut ilzarσ2y.
i
Estafórmul anov ieneenni ngunapar t
eyhancaí dopr obl
emasenex ámenes
2
anti
guosenl osquedabanl av ar ianzat otaldeY( SY)per onol aSCtotal.
-SCtotal=SCregresión+SCresidual.Sededucedel cuadrodel ANOVAdel aregresi
ón
enlapági na16delf or mular io.Apar ecedef ormaexpl íci
taysepar adaenel
cuadrodel aARM.Despej ando, SCresidual=SCtotal-SCregresión
2 2
-r=SCregresión/ SCtotal.Despej ando, SCregresión=r ·SCtotal.
Lacal cul
adoraCasiopr opor
cionaB( b),B0 (a)yr,sinosdier
anlat abl
ade
datos.Sidanl ossumat ori
os,hayqueut i
lizarlasfórmulasdelapágina15del
for
mul ar
io,conelcui dadodequel abet asenl asqueseusanpunt uaci
ones
tí
picasnohacenr ef
erencianoalosv al
oresdel osparámetrospobl
aci
onales
40
5.
-ANÁLI
SISDEREGRESI
ÓNMÚLTI
PLE.(
Fór
mul
as,
pági
na17del
for
mul
ari
o).
a)Regr
esi
óncondosv
ari
abl
esi
ndependi
ent
es.
Mi ent
rasqueelARSpr oducelalínearect
aquer elaci
onal aVD(Y)conlaVI
(X)
,elARM condosv ar
iablesi
ndependient
esproduceunpl anoderegresi
ónque
rel
acionalaVD( Y)conl osval
oresdel asdosVI( X1 yX2)(paramásdedosVI
serí
aunhi per
plano)
.
El
model
odeest
imaci
ónl
i
neal
múl
ti
plees:
Y’=B1X1+B2X2+B0+ε
b)Aj
ust
edel
model
o.Medi
dasdeasoci
aci
ón.
Elcoefici
ent
edecor r
elaci
ónmúltipl
eReselcoef i
cient equecor r
elacionala
VD conunacombi naci ónópt i
madedosomásv ar
iablesi ndependientes.Su
2
cuadr adoeselcoef icientededet erminaciónR,queexpl icaelpor centajede
variabil
idaddelaVIat r
ibuiblealaacciónconjunt
adel asVD.Comoocur reconla
2 2
varianzamuest r
alR noesunest i
madori nsesgadodeρ,por quecuant omás
pequeñaseal amuest ra,may orser
ál acontri
bucióndel av ari
acióndel aVIal a
2
del aVD.Elest imadori nsesgado deρ eselcoef i
cient ededet ermi naci
ón
ajustado, (
2ªfór
muladel a2ªtablapág.17del f
ormulari
o).
c)Cor
rel
aci
ónbi
var
iadaycor
rel
aci
ónsemi
par
cial
.
Sinembargo,estascorrel
acionessól
oof r
ecenunai ndi
caciónaparent
edel
i
nfl
ujodecadaVIenlaVDynosonpur aspuesnorefl
ejanlaverdader
ainfl
uenci
a
decadaVIai sl
adamenteconsi der
adasenl aV,alno t enerencuent anila
i
nfl
uenci
aentrelasdist
int
asVI ,nisuinf
luenci
aconjunt
aenl aVD.Poresol a
41
sumadel oscoef
ici
ent
esdecorrel
aci
ónbi
var
iadosser
ási
empr
emay
orqueel
coef
ici
ent
edecorrel
aci
ónmúl
ti
ple.
Elcálculodeloscoeficientesdecorrel
aci
ónsemiparcial (
sr1ys r
2)ser eal
i
zaa
partirdel oscoefici
entesdecor r
elaci
óndeor dencero(fórmul as,penúl
t i
maf il
a
de l a página 17 delcuader ni
ll
o).Los cuadrados correspondientes son los
coef i
cientes de determinación semiparci
al,que expresan l a proporción de
varianzadel aVIatri
buibleacadaVD,el i
minandoelinflujodel asdemásVIen
dichaVI .
Par
aent
ender
lomej
or,
veamosundi
agramadeVenn:
Y
a c
b
X1 X2
Loscontr
astesconest
oscoefici
ent
esconsist
enencomprobarsilavari
aci
ón
expl
icadaporlavari
abl
eov ar
iabl
esintr
oduci
dasessigni
fi
cati
varespectodela
vari
anzaal
eator
iaoresi
dual
.Lasfórmul
asestánenlapági
na17del f
ormulari
o.
d)Cor
rel
aci
ónpar
cial
.
Medi ant
eelestudiodel acor
rel
aci
ónentr
elosr esi
duos,esdeci
r,lav ar
ianza
noexpl i
cadaporlacorrel
aciónentr
eYyX2porunl adoyporl acorr
elaciónentre
X1 yX2 porotro,lacor r
elaci
ónparci
alseeli
mi naelefectodecual quierotra
var
iable,conocida o no,entrela VIconsi
derada yl a VD.En definiti
va,la
corr
elaciónpar
cialmidelacorrel
aci
ónpuradedosv ari
abl
eselimi
nandoeli nfl
ujo
decualquierot
ratantoenlaVIcomoenl aVD.
2 2
Elcuadradodeloscoef i
cientesdecorrel
aciónpar alpr
ci 1 ypr2 (coefici
ent
es
dedeterminaciónparci
al)sei nt
erpr
etacomol apropor
cióndel av arianzadela
VD no asoci ada a X2 que síest á asoci ada a X1 (yv i
cev ersa) y l
os
2
complement ar
ios1-
pr ,r
epresentanloscoefi
cientesdeal
ienaciónpar cial
.
Lasf
órmul
asestánenl
aspági
nas17y18del
cuader
nil
l
o.Vol
vi
endoal
di
agramadeVenn:
43
d
a c
b
X1 X2
2 2
pr
1 =a/(a+d)ypr
2 =c/(c+d)
Enconclusión,mientr
asl acorr
elaciónsemi par
cialsesi t
úaenelcont exto
excl
usi
v odelARM, tr
atandodeexpli
carl acontri
buci
óni ndependientedecadaVI
alaVD,l acorr
elaci
ónparcialponeelacent oenlaeli
mi naci
óndel osef
ectosde
cual
quiervari
ableextr
añaydel ascorrelaci
onesespúreaspr oducidasportales
vari
abl
esextrañasalmodelo.
RESUMENDETEORÍ
ADEARSYARM:
-Elanál i
sisdel osdiseñosexpostf actotrat
adedet erminarcómo un
conj
unto dev ariabl
es,quellamamosf act
ores,i
ndependient
es,pr edi
ctor
aso
expl
icati
vas,puedenexpli
carelcomport
amientodelavari
ableobjetodeestudi
o,
quellamamosdependi ent
eocr i
ter
io.
-Elmodel
oder egresi
ónli
nealest
imaelvalordel
aVD, mediant
eunafunci
ón
l
inealdeunaov ar
iasVI( Regr
esi
ónLinealSi
mpl eyMúlt
ipl
e,r
especti
vament
e).El
coefi
cient
edecor relaci
óndePear son(múlt
iple)mi
deelgr adodeasociaci
ón
entr
elaVDyla(s)VIyosci l
aentr
e-1y1.
-R2,eslapr
oporci
óndevar
ianzadeVDasoci adaalacombinaci
ónli
nealde
l
asVI ’
syt ambiénexpr
esal
areducciónproporci
onaldeler
rori
nici
aldelaVD
cuandoseajust
aunmodelodeesti
maciónconlasVI’
s.
-sr
i,
coef
ici
ent
edecor
rel
aci
ónsemi
par
cial
,expr
esal
acorr
elaci
ónent
reYyXi,
cuandodeestaúl
ti
masehaextraí
dol
aquemant i
eneconelr
estodelasVIdel
modelo.
2
-sri,coefi
cient
ededet er
minaciónsemipar
cialexpresal
apropor
ciónde
v
ar i
anzadeYasoci adaúni
camentelavari
anzadeXi,asícomoeli
ncr
ementoen
2
R cuandol
av ari
ableXient
raenelmodelo.
-pr,coef
i i
cient
edecorrel
aciónparcialexpr
esalacorr
elaci
ón“
pura”entr
eYy
Xi,el
i
mi nandolainfl
uenci
adecual quierotravar
iabl
e,estéonoenelmodel o.
Tambiénexpr esalarel
aci
ónent r
el apar t
edeYyl apartedeXiquenoest án
asoci
adasl i
nealment
econelrestodepr edi
ctor
as(var
iabi
li
dadent
rer
esiduos).
2
-pri,coef
ici
ent
ededeter
minaciónparci
alexpr
esal
apr
opor
cióndevar
ianza
deYnoasoci adaalr
est
odev ar
iabl
es,esténonoenelmodelo,quesíestá
asoci
adaconXi.
45
ADENDA:
PERLI
TASQUEHAYQUETENERENCUENTAPARANOFALLAREN
TONTERÍ
AS:
1.-Hayquel eerei nter pr etarbi enl osenunci ados.Sipi dencont rast essobr e
varianzas o sobr e pr opor ciones l o di r
án expr esament e o en elcaso de
propor ci ones,habl ando de por cent ajes o en elcaso de l as v ar i
anzas,de
variabilidades.Ent odosl osdemáscasos,si empr eesuncont r astedemedi as
(i
ncl usosihabl andepr opor ciónmedi aof recuenci adeaci ertos,elcont r ast ees
demedi as, sal voqueser ef i
er aapor cent aje, frecuenci aopr opor cióndesuj etos) .
Hayque f ij
ar se bi en siesbi later al( H0 esque no haydi fer enci as,H1,hay
diferenci as)ouni later al( der echo,H0 menoroi gual ,H1,may orque;i zquier do,HO
may oroi gual ,H1,menorque) .Cui dadoconf ij
arbi enn,cui dadocuandoden
muchosdat ospor queav ecesnospr egunt ansól osobr eunapar te.Cui dadocon
cadapr egunt a,not odassonsobr el omi smo.Enl asituaci ón1onor malesque
pregunt en pormedi as,pr opor ci ones yv arianzas.Sihaydos muest ras con
diferent enúmer odesuj et os,soni ndependi ent es.Sól osonr elaci onadassil os
mi smossuj et os( or elacionadosporpar es,i .
e.gemel os)sonsomet idosat odos
l
osdi stint osni velesdel fact or .
Sino sabemossegur al ar espuest a de pr imer ase i ncluso en t alcaso,
conv ienedescar tarl asqueseani mposi bles.Elv alorcr íticosebuscaenl at abla
par a1- αo1- α/ 2.
Par a ev itarer ror eso det ect arlos,conv ieneescr i
bi rdepuño yl et ra,con
claridad,t odosl osdat os,enl ugarsepar adoydest acadodedondehacemosl as
oper aciones.Par al acal cul ador a,conv i
eneescr ibirlasf órmul ast alv i
enenenel
formul ar io,si n si mpl ifi
caci ones que nos puedan i nduci ra er ror,con l os
par éntesi sensusi tio( est oesv i
t al).
2.-Pr uebapr ev iadelcont rast edei gual dad dev arianzas.Sedi videnl as
cuasi var i
anzaso v arianzasmuest ral esi nsesgadas,poni endo l amay orenel
numer ador( arriba) .Elcont rast eesbi l
at eral, port ant ohayqueacudi ral ast abl as
de l a F buscando 1- α/ 2;t i
ene que haber mucha di f
er enci a ent r
el as
cuasi var i
anzaspar aqueseconsi der el adi f
er enci adev ar ianzaspobl aci onal es
significat i
v a.SielEC >VC,ser echazal ahi pót esisdequel asv arianzasson
i
gual es.Si esmenor , seacept a.
3.-Ni velpcr íti
co:Eselni veldesi gni fi
caci óndelest adí st i
codecont rast e,es
deci r,lapr obabi l
idad,si endoH0 ci erta,deobt enerunv alori gualomásext r
emo
queeldelECquehemoscal culado.Lat abl anosdasi empr el apr obabi lidadque
hayal ai zqui er da, poreso:
-Sielcont rast eesuni lat eralder echo, elni velpcr í
ticoes1–pr obabi li
dadde
l
at abla.Buscamoselv alordel apr obabi l
idadquehayenl acol ader echadelECy
l
at abl anosdal aquehayal ai zqui erda, poresor estamosde1el v alordel at abl a.
-Sielcont rast eesuni l
at er alizqui erdo, elni velpcr í
ticoeselv al
ordel at abl a,
yaquebuscamosel valorquehayenl acol ai zqui erdayesel quenosdal at abla
-Si esbi lat eral,(1–pr obabi l
idaddel at abl a)semul tipl i
capor2.
Cuandonocoi nci de,ent oncesseest abl ecer áelni v elpcr í
ticocomomay oro
46
menorqueeldel at abla, dependi endodesielECesmásgr andeomáspequeño
queel VC.
¡Hazt eelesquemadel agr áf icayr ay al aszonasdeacept aci ónyr echazo!En
elej ehor i
zont alest ánl osv al oresdelest adí st i
coyelár eadelej econl acur v aes
l
apr obabi l
i
dad.Regl ai nf ali
ble:Cuant oMÁSGRANDEeselv al orabsol utodelEC
(est ámásal ejadodel cent ro), MENOResel ni velpcr í
ticoyv icev ersa.Port ant oel
rechazodeH0espor que| EC| >|VC| ol oqueesl omi smo, porquep<α.
4. -ANOVAS.Hayquer el l
enarelSudoku.Sinosei dent i
f icabi enelt ipode
ANOVA que es ( unifact orialcon muest ras i ndependi ent es o r elaci onadas;
bifact orialídem) ,ay udar áempezarporelmássenci l
loysisobr andat os,ser áel
otro.Sepuedehaceralr evés:Sif al tandat os,l onor malesqueseaelmásf áci
l
.
Par al osgr adosdel i
ber tadempi ezaporelf i
nal,puesesf áci li dentificarN- 1.A
par ti
rdeahí ,seponenl osgr adosdel iber taddecadaf actor ,al ai nteracci ónyl a
diferenci aaler roroMCi nter .Luegosev ancal culandol oquef alte,t eni endoen
cuent aqueMC=SC/ g.l.yquel asumat otaldeg. l
.esN- 1, salv oenr egr esi ón, que
esN- 2.Nor mal ment el osgr adosdel iber taddeler rorol aSCINTER ser ánmucho
may or esquel osdel aSCINTRA.Fór mul aquef al t
a:SC=n· S2(númer odeel ement os
porl av ari
anza) .
5. -Model odeef ect osf ij
os- aleat or i
os.Ef ectosf ij
os:Sól oi nteresanl osdat os
par al osni velesdel osf act oresmanej ados.Ef ectosal eator ios,i nter esanpar a
cual esqui erani velesdel osf act or es.Encasodeduda, nocont est ar.
6. -Cont rastes en r egr esi ón l ineal :Son bi laterales ( sal v o elANOVA de
regr esión)yport antohayquef unci onarcon1- α/2.Elgr adodel iber taddel a
regr esiónsi mpl ees1yel t
ot al del osg. l
.,n- 2.
7. -Di sti
nci ónent r
ecor r
el aci ónsemi par cialypar cial.Enl asemi par ci alse
eli
mi nadeli nfl
ujodeunaVIenl aVD,eli nf l
ujodet odasl asdemásVI .Enl a
par cialse el imi na además eli nflujo de cual esqui era ot ras v ariabl es no
consi der adas( incluidaseneler ror ).Lascor r
elacionescal cul adassi nmás,es
deci rsi nel iminareli nflujodeot rasv ariabl esest énonoenelmodel o,noson
pur asysel l
amanbi variadasodeor dencer o.
8. -Elcoef iciente de cor relaci ón mi de elgr ado de asoci ación ent rel as
variabl es.Sucuadr adoescoef i
ci ent ededet erminaciónymi deelpor cent aj ede
variabi li
daddel aVDat r
ibuibl eal aVI .Sucompl ement arioeselcoef icient ede
ali
enaci ón y mi de elpor cent aje de v ar iabil
idad at ri
bui bleav ariabl es no
consi der adas( error).
Enelexamen,cr
eoqueesmejorempezarporlaspregunt
asdet eorí
ano
asoci
adasdir
ect
amenteal
ospr
obl
emas(ser
ánentr
e7-10)yluegoirr
esolv
iendo
l
assituaci
onesenqueest
emosmásseguros,dej
andoparaelf i
nall
oqueno
sal
ga.
Par
aaprobarsenecesi
tancomomí ni
mo13aci er
tosy1error(cont
est
ando
14)yapar
tirdeaquí14/3(
17) ,
15/5(20),
16/7(23)
.Hayquecontarconfri
aldad
l
asqueestánbien(l
asdepr oblemaslassabr
emossegurascasial100%)ei ra
47
asegurar
.Sisabemosocr eemosquet enemosbien16,hayquecont est
ar23,
porquecontest
ando24o25necesitar
íamos17par aapr obarycont
est
ando21o
22,también16.Encasodedudasenal gunaspregunt
as,hayqueelegiraquel
las
enlasquepodamosdescartarunar
espuest a,
esdeci
r,sólodudemosentre2.
48
Diseños de Investigación y Análisis de Datos. 2018/19 -
1. En un contraste de hipótesis sobre dos medias para muestras independientes y con independencia de los resultados
obtenidos, ¿cuál de las siguientes afirmaciones es cierta?:
A) Si utilizásemos muestras más grandes aumentaría el valor del estadístico de contraste y con ello la
probabilidad de rechazar la hipótesis nula, aunque no cambiaría el tamaño del efecto.
C) Aumentando el tamaño de la muestra se consigue un efecto mayor pero no afecta al estadístico de contraste sobre la
significación de las diferencias.
B) Es innecesaria ya que el ajuste es muy bueno y, por consiguiente, el modelo debe ser lineal.
A) Tanto la variable dependiente como la independiente han de ser cuantitativas (de intervalo o razón).
A) La media aritmética.
B) La varianza.
C) La proporción.
Solución: La varianza muestral no es un estadístico insesgado de la varianza poblacional mientras que la media
aritmética y la proporción sí lo son.
A) 𝛼𝛼
B) 𝜷𝜷
C) 1 − 𝛽𝛽
Diseños de Investigación y Análisis de Datos. 2018/19 -
7. Cuando al realizar un ANOVA un investigador no está interesado en comprobar las diferencias entre todas las medias
y sabe de antemano que comparaciones le interesan, se denomina a las comparaciones múltiples que ha de realizar:
A) “a priori”.
B) “a posteriori”.
C) “post hoc”.
Solución: las comparaciones a posteriori se utilizan cuando el investigador no establece a priori las comparaciones a
realizar y solo lo hace después de ejecutado el experimento. Por el contrario, cuando sí conoce estos contrastes antes
de realizar el estudio, se denominan “a priori”.
Solución: el supuesto de homocedasticidad hace referencia a la igualdad de varianzas en las distribuciones de los
errores condicionadas a cada valor de X (no a la normalidad ni a la independencia entre valores de Y).
9. Los supuestos necesarios para realizar inferencias sobre correlación y regresión, incluyen:
C) Independencia entre los valores de la variable independiente X y los valores estimados Y´.
A) El investigador establece como niveles del factor sólo aquellos en los que está interesado en estudiar.
B) Se considera que los “i” niveles del factor son una muestra aleatoria de todos los posibles niveles.
11. La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es:
A) Que 𝛽 = 0.
C) Que las puntuaciones de la variable dependiente condicionadas a cada valor de la variable independiente
sean normales.
Diseños de Investigación y Análisis de Datos. 2018/19 -
Solución: Nos piden la correlación semi-parcial entre X1 e Y habiendo eliminado el influjo del resto de variables
independientes (VI´s) sobre la X1. Como solamente tenemos como otra variable independiente X2, significa que debemos
eliminar el influjo de X2 sobre X1 (ver página 264, “… para saber qué parte de la VD explica cada VI al margen de las
otras VI´s, para así poder determinar el influjo único que esa VI tiene sobre la VD. Esta relación entre cada VI y la VD
habiendo eliminado el influjo del resto de las VI´s sobre cada VI es lo que se llama Coeficiente de correlación
semiparcial”).
B) Establecemos hipótesis sobre las varianzas poblacionales y estas son siempre positivas.
C) Dada la lógica del Anova, la posibilidad de encontrar valores de F inferiores a la unidad es poco probable.
A) Una de las razones por las que se recomienda el Anova frente a las comparaciones dos a dos de muestras
(dependientes o independientes).
B) Es mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos experimental y control.
Solución: A diferencia de lo que sucede con los estadísticos de contraste, la magnitud del tamaño del efecto no depende
del tamaño muestral. La opción A contradice esta afirmación. La opción B es errónea porque, según la fórmula de la d
de Cohen, la diferencia de las medias entre el grupo experimental y control está en el numerador. Por tanto, cuanto mayor
sea esta diferencia, mayor será d; cuanto menor sea esta diferencia, menor será d.
Solución: por definición, el error típico es la desviación típica de los errores de pronóstico. La opción A es incorrecta porque define
el error de pronóstico para un sujeto, mientras que la opción B hace referencia a Sx de la variable dependiente pronosticada (T’) en
este caso.
21. Uno de los supuestos básicos del análisis de regresión simple es:
B) Las distribuciones condicionadas de los errores deben de tener una distribución uniforme.
22. En los diseños intra-sujetos se considera que la varianza de error viene dada por:
A) El factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.
23. Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el tamaño de la muestra:
25. Cuál de los siguientes estimadores para la media poblacional de una distribución es suficiente:
27. Con dos variables independientes (𝑋1; 𝑋2) y una variable dependiente (𝑌), el coeficiente de correlación parcial entre
𝑋1 e 𝑌, representa:
28. Para la regresión lineal simple se obtienen dos coeficientes, ordenada en el origen (𝐵0) y pendiente (𝐵).
Generalmente, estaremos más interesados en interpretar:
A) 𝐵0
B) 𝑩
29. Para que sean válidas las inferencias que sobre la variable dependiente se hagan con la recta de regresión, las
varianzas de las distribuciones de los errores, condicionadas a los diferentes valores de la variable independiente deben
de cumplir el supuesto de:
30. En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t de Student para realizar
comparaciones múltiples dos a dos?:
C) De obtener unos datos como los observados o más extremos siendo cierta la hipótesis nula.
32. Uno de los supuestos básicos del análisis de regresión simple es:
B) Las distribuciones condicionadas de los errores deben de tener una distribución uniforme.
33. En el caso de la regresión lineal simple, el signo del coeficiente de correlación y de la pendiente de la recta de
regresión:
34. Suponiendo que existieran dos estadísticos insesgados, consistentes y suficientes para estimar la misma
característica poblacional, la mejor elección es utilizar el estadístico:
A) Aumenta el tamaño de la muestra B) Aumenta el nivel de confianza C) Aumenta el error típico del estadístico.
A) La potencia del contraste; B) La amplitud del intervalo de confianza; C) El error tipo II.
38. El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula que es verdadera,
recibe el nombre de:
A) la máxima diferencia que cabe esperar por simple azar entre la media obtenida en la muestra y la media de la población
formulada en la 𝐻0;
9- Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el
tamaño de la muestra: A) Aumenta el error máximo. B) Disminuye el error típico. C) Aumenta
la cuasivarianza muestral
10- En los diseños intra-sujetos se considera que la varianza de error viene dada por: A) El
factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.
12- Cuál de los siguientes estimadores para la media poblacional de una distribución es
suficiente: A) La mediana. B) La media aritmética. C) La moda.
13- En un contraste de hipótesis sobre dos medias en el que el tamaño del efecto es
moderado: A) El estadístico de contraste puede ser significativo o no, dependiendo del
tamaño de la muestra. B) El estadístico de contraste siempre será significativo para 𝛼 = 0,05 C)
El estadístico de contraste siempre será significativo para 𝛼 = 0,01
17- La probabilidad de rechazar una hipótesis nula que es verdadera, recibe el nombre de: A)
Potencia del contraste. B) Error tipo II. C) Nivel de significación.
18- En un contraste de hipótesis bilateral sobre una media poblacional, ¿puede utilizarse el
intervalo de confianza para contrastar dicha hipótesis? A) Sí, y se rechaza 𝑯𝟎 cuando el valor
formulado en la 𝑯𝟎 se encuentra fuera del intervalo de confianza. B) Sí, y se rechaza 𝐻0
cuando el estadístico de contraste se encuentra fuera del intervalo de confianza. C) El intervalo
de confianza no aporta información para rechazar o no 𝐻0
20- En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t
de Student para realizar comparaciones múltiples dos a dos?: A) Sí, porque es la mejor opción.
B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa. C) No porque se
incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.
21- La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es: A)
Insesgada. B) Un parámetro. C) Una variable aleatoria.
22- La potencia del contraste se puede expresar simbólicamente como: A) 𝑃(𝐻0 = aceptar | 𝐻0
= falsa) B) 𝑃(𝐻0 = rechazar | 𝐻0 = cierta) C) 𝑷(𝑯𝟎 = rechazar | 𝑯𝟎 =falsa)
24- El tamaño del efecto: A) Es mayor a medida que aumenta el tamaño de las muestras. B) Es
mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos
experimental y control. C) No depende del tamaño muestral.
26- La posibilidad de analizar interacciones es: A) Una de las razones por las que se
recomienda el Anova frente a las comparaciones dos a dos de muestras (dependientes o
independientes). B) Es problemática porque incrementa el error Tipo I. C) Es difícil porque no
se conoce la distribución muestral de las F´s en esta situación.
27- En los Anovas el contraste es unilateral derecho porque: A) La distribución F no tiene
valores inferiores a 0. B) Establecemos hipótesis sobre las varianzas poblacionales y estas son
siempre positivas. C) Dada la lógica del Anova, la posibilidad de encontrar valores de F
inferiores a la unidad es poco probable.
28- El tamaño del efecto: A) se puede clasificar en tres categorías según Cohen. B) depende
del tamaño muestral. C) es una diferencia de medias no estandarizad
29- El investigador informó que, en su estudio, 1 − 𝛽 = 0,6. Esto significa que: A) la probabilidad
de no rechazar H0 siendo falsa vale 0,6. B) la probabilidad de rechazar H0 siendo falsa vale
0,6. C) la probabilidad de no rechazar H0 siendo verdadera vale 0,4
31- Si optase por utilizar muestras más grandes y suponiendo que se mantienen los mismos
estadísticos obtenidos en estas muestras, ¿cuál de las siguientes consecuencias se
producirían?: A) aumentaría el tamaño del efecto; B) aumentaría la probabilidad de rechazar
la hipótesis nula C) disminuiría la potencia del contraste.
32- El error típico de la media representa: A) la máxima diferencia que cabe esperar por simple
azar entre la media obtenida en la muestra y la media de la población formulada en la 𝐻0; B) la
desviación típica de la distribución muestral de la media C) el error que se comete al estimar
la media poblacional a partir de la media de la muestra
33- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis
nula que es verdadera, recibe el nombre de: A) Potencia del contraste; B) Error tipo II; C) Nivel
de significación
34- A medida que aumenta el tamaño de la muestra, aumenta también: A) La potencia del
contraste B) La amplitud del intervalo de confianza; C) El error tipo II
34- El error típico de la media es: A) el error que sumamos y restamos a la media aritmética
para calcular el intervalo de confianza; B) la desviación típica de la distribución muestral de la
media C) el error que cometemos si rechazamos una hipótesis nula verdadera.
33- Cuál de los siguientes estimadores sobre la tendencia central de una distribución es
suficiente: A) la mediana; B) la media aritmética C) la moda
34- El valor crítico para tomar una decisión respecto a la hipótesis nula depende: A) del nivel
de confianza que se establezca B) de los grados de libertad de la distribución muestral de la
diferencia de proporciones; C) de si se conoce o no la varianza poblacional de las diferencias.
35- En un contraste de hipótesis sobre la media aritmética, el valor absoluto del valor crítico:
A) es el mismo en un contraste unilateral izquierdo y un contraste unilateral derecho B) es el
mismo en un contraste bilateral y unilateral derecho; C) es el mismo en un contraste bilateral y
unilateral izquierdo.
36- La potencia de un contraste de hipótesis será mayor: A) a medida que aumenta el tamaño
de la muestra B) a medida que disminuye el tamaño de la muestra; C) siempre es la misma
suponiendo que H1 es verdadera.
37- Las curvas de potencia permiten localizar la potencia de un contraste en función de: A) el
tamaño de la población y de la muestra; B) el valor de H1 y el tamaño de la muestra C) el
tamaño de la población y el valor de H1
38- En un contraste de hipótesis sobre una media, si es cierta la hipótesis alternativa pero no
se detecta en el contraste estadístico, se comete un error: A) de tipo II B) de tipo I; C) igual al
nivel crítico.
39- La potencia del contraste es igual a: A) probabilidad de aceptar la hipótesis nula siendo
cierta; B) probabilidad de rechazar la hipótesis nula siendo falsa C) probabilidad de rechazar
la hipótesis alternativa siendo verdadera.
40- Las pruebas no paramétricas se utilizan en diseños en los que se trabaja con: A) Muestras
no representativas de la población objetivo del estudio; B) Muestras pequeñas o variables que
no alcanzan el nivel de medida de intervalo o razón C) Variables medidas con escala de
intervalo que provienen de poblaciones con distribución poblacional desconocida.
43- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en
muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas C) ninguna de las anteriores es correcta.
44- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1 C) El nivel de confianza más nivel significación es igual a 1.
45- El nivel de significación representa: A) el máximo error que el investigador está dispuesto
a admitir para rechazar una hipótesis nula que es verdadera B) el máximo error que el
investigador está dispuesto a admitir para rechazar una hipótesis nula que es falsa; C) la
probabilidad de rechazar una hipótesis nula que es falsa.
47- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume
como provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los
datos obtenidos en la muestra.
48- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria ordinaria.
49- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede
adoptar valores negativos porque: A) los valores de la ordenada (eje vertical) son todos
positivos; B) toda distribución de densidad de probabilidad se estandariza para que tenga un
área igual a la unidad; C) es el cociente entre dos varianzas y estas son siempre positivas
51- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el
tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.
53- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A)
cuya distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.
54- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
55- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un
nivel de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación;
B) aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.
59- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a
comparar deben de cumplir el supuesto de: A) complementariedad y exhaustividad; B)
homocedasticidad; C) independencia.
Susana R.
RCP respuesta única ( teoría) (si hay alguna pregunta que no os suena puede ser del libro
anterior y no es materia de estudio )
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS.
Tema 1
4. La varianza insesgada es: b) La varianza muestral multiplicada por n y dividida por n-1.
16. El sesgo del estimador es: c) La diferencia entre la media de la distribución muestral
del estimador y el parámetro.
19. En la estimación puntual: b) Se toma un valor muestral concreto como estimación del
parámetro.
24. El estadístico de contraste Z para una media vale -2,15, siendo alfa igual a 0,05, n= 145
y el contraste bilateral. b) Se rechaza Ho
27. Cuando ponemos a prueba una hipótesis, el método que se utiliza para tomar una
decisiónentre la hipótesis nula (Ho) y la hipótesis alternativa (H1) es: c) El contraste de
hipótesis.
28. El nivel crítico p: b) Para su cálculo se tiene en cuenta la dirección del contraste
(unilateral/bilateral)
38. Una estimación por intervalos: c) Establece un rango de valores dentro del cual se
estima esté el valor del parámetro.
40. La hipótesis nula: “la varianza del grupo 1 es mayor o igual que la varianza del grupo
2”, se refiere a un contraste: c) Unilateral izquierdo.
41. Con n = 50, la probabilidad del error tipo II es igual a 0,30. Con un n = 40 y
manteniendo constantes los demás factores: b) Beta será superior a 0,30
43. El nivel crítico p: b) Su valor depende del valor muestral del estadístico
45. Cuanto mayor es la probabilidad del error tipo II, manteniendo constantes los demás
factores: a) Menor es el nivel de significación
48. Que dos hipótesis sean mutuamente excluyentes significa que: c) El rechazo de una de
ellas implica necesariamente la aceptación de la otra
49. La idea general del contraste de hipótesis es hallar: a) La probabilidad asociada al valor
muestral del estadístico.
50. Una hipótesis alternativa del tipo μ<μ0 plantea un contraste: a) Unilateral izquierdo
55. Sobre alfa y el nivel crítico p: b) Si sus valores son iguales se rechaza la hipótesis nula
56. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la
muestra: a) Mayor es la precisión del intervalo
58. El error típico de la distribución muestral del estadístico varianza es: a) La desviación
típica de la distribución muestral de la varianza
60. Hemos extraído una muestra aleatoria de 49 sujetos y le hemos medido el pulso en
reposo, obteniendo una media igual a 60 pulsaciones por minuto. Sabemos que las
pulsaciones forman una escala de intervalo y se distribuyen normalmente con varianza
poblacional igual a 16. Tomamos un n.c. del 99%. ¿cuál será el error máximo (Emáx)
aproximado en el cálculo del intervalo de confianza para μ? b) 1,47
63. En el contraste de hipótesis, la elección de: b) μ0, μ1, α, β es arbitraria mientras que la σ2
y n no lo son.
66. Hemos extraído una muestra aleatoria de 36 sujetos y les hemos medido el tiempo de
reacción a un estímulo visual, obteniendo una media igual a 50 milisegundos. La varianza
poblacional de la distribución de los tiempos de reacción es igual a 9. Sabiendo esto, cuál
será el intervalo de confianza del 95% en torno a la media poblacional:
a) 49,02 < μ < 50,98
68. Atendiendo a los datos del problema anterior, entre qué valores esperamos se
encuentre la media poblacional de la ansiedad precompetitiva, a un nivel de confianza del
99%: a) 3,71 < μ < 6,29
69. Hemos estimado en una muestra de 16 españoles, la media del grado de acuerdo sobre
la legalización del aborto obteniendo Ȳ = 8. El grado de acuerdo sobre la legalización del
aborto es una variable medida a nivel de intervalo que se distribuye normalmente en la
población con σ2 = 36. Asumiendo un nivel de confianza del 95%, qué tamaño debe tener
la muestra para que la media no se aleje más de ± 1 punto de la media poblacional: 139
70. Con los datos del problema anterior, sin tener en cuenta que conocemos la varianza
poblacional, sino que conocemos desviación típica y la media del grado de acuerdo sobre
la legalización del aborto, Ȳ = 8 y S = 5. Queremos saber, a un nivel de confianza del 99%
qué tamaño debe tener la muestra para que la media estimada no se aleje más de ± 3
puntos de la media poblacional: b) 26
71. En una investigación sobre ansiedad, contrastamos la hipótesis nula de que la media
poblacional e igual o mayor que 10. i sabemos que el valor muestral del estad stico de
contraste z = 2,88 y el nivel crítico, p= 0,002, ¿qué significa esta p?:
a) Que la probabilidad de obtener un estadístico de contraste igual o menor que el hallado
es 0,002.
72. Teniendo en cuenta los datos del problema anterior y adoptando un α= 0,01:
a) Se rechaza H0, puesto que p < α
3. El estadístico de contraste Z para una media vale 3, siendo alfa igual a 0,05, n = 120, y el
contraste bilateral: c) Se rechaza H0
11. Cuál de las siguientes afirmaciones es correcta: b) En el caso de una sola muestra y si
se conoce la varianza de la población el estadístico de contraste para la varianza es Z.
12. Las condiciones para poder aplicar el estadístico de contraste Z en el caso de la
proporción (una sola muestra) incluyen: a) Muestra aleatoria de n observaciones y
población dicotómica.
13. Tenemos una población normal con varianza conocida. Se toma de ella una muestra de
tamaño n = 15. Para estimar el valor del parámetro media poblacional μ, utilizaremos un
estadístico de contraste cuya distribución es: a) Normal (N(0,1))
15. La prueba de Wilcoxon para una muestra: b) También conocida como prueba de
rangos y signos.
19. Las condiciones para poder aplicar el estadístico de contraste S (signos) en el caso de
una sola muestra: c) Muestra aleatoria de n observaciones y cualquier tipo de distribución
20. El estadístico S se aproxima a una distribución normal: c) Siempre.
22. Para probar hipótesis relativas a la mediana, cuando se cumple la aleatoriedad de las
observaciones, la distribución de la variable es simétrica en la población y el nivel de
medida de intervalos, aplicaremos la prueba de: a) Wilcoxon antes que la de signos porque
aporta más información.
23. Para contrastar hipótesis sobre la mediana, si queremos utilizar la prueba de Wilcoxon,
es necesario que el nivel de medida de los datos sea, al menos: c) De intervalo
27. En una distribución muestral normal (del estadístico media), con una media de 30 y
una desviación típica de 16, ¿qué probabilidad hay de obtener al azar una media
comprendida entre 14 y 26?: b) 0,6826
28. En una muestra aleatoria de 101 sujetos, procedentes de una población normal e
infinita, se ha obtenido una media igual a 40 y una desviación típica igual a 15. ¿Qué
porcentaje de medias hay comprendido entre los valores t picos = 2,4 y = 1,5 de la
distribución muestral de la media?: a) 92,5%
30. Teniendo en cuenta los datos del problema anterior, qué media de esa distribución
muestral dejará por debajo de sí el 90% de los casos: a) 47,02
31. A una muestra aleatoria de 17 estudiantes de secundaria se les aplicó una prueba cuya
finalidad era medir sus conocimientos sobre conceptos científicos básicos. En la variable
analizada, los estudiantes se distribuyen normalmente con una media igual a 78. Los
resultados del estudio en la muestra fueron: media igual a 84,984 y desviación típica igual
a 16. El intervalo de confianza de la distribución muestral será: α = 0,05 ± 2,12
32. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste será:
b) t = 1,746
33. con los datos de los dos problemas anteriores, el criterio de decisión será:
c) Para un n. c. del 0,95 no podemos aceptar la H1.
34. Una muestra aleatoria de 30 personas presenta una desviación típica, en la variable
“tiempo de ejecución” de una tarea de reconocimiento de palabras, igual a 120 segundos.
Queremos saber si es compatible este resultado, a un nivel de confianza de 99% con el
supuesto de que la desviación típica en la población (para esta variable), con una
distribución normal, es de 150 segundos. Teniendo esto en cuenta, el planteamiento de las
hipótesis sería: b) H0 : σ2 = 1502 y H1 : σ2≠ 1502
35. Con los datos del problema anterior, el estadístico de contraste será:
a) χ2 = 19,2
36. Teniendo en cuenta los datos de los dos problemas anteriores, el intervalo confidencial
será: c) 13,1 < χ2 < 52,3
37. La decisión tomada sobre los resultados será la siguiente: c) Como nuestro estadístico
de contraste se encuentra en el intervalo confidencial al 99% de n. c., no podemos rechazar
la hipótesis nula.
38. Con muestras aleatorias de 121 sujetos, la distribución muestral de la media (de una
variable que se distribuye normalmente en la población) tiene una media de 25 y como
desviacióntípica de 10. La formulación de las hipótesis será: n.c. : 95% a) H0 : μ = 25 y H1 : μ
≠ 2539. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste
para comprobar que una muestra del mismo tamaño con media = 28 y desviación típica =
30 pertenece a la misma población será: a) Z = 0,3
41. En una muestra aleatoria de 200 sujetos, procedentes de una población normal e
infinita, se ha obtenido una media igual a 60 y una desviación típica igual a 20. Cuál será el
error típico de la media: c) 1,42
42. Un educador piensa que sólo un 15% de los alumnos de cuarto de primaria, del colegio
en el que trabaja, son capaces de manejar con rapidez el diccionario. Para comprobar lo
que piensa, selecciona al azar una muestra de 150 alumnos de ese curso y les realiza una
prueba de manejo del diccionario. Teniendo en cuenta estos datos, la formulación de las
hipótesis estadísticas será: α = 0,05 a) H0: π = 0,15 y H1: π ≠ 0,15
43. Teniendo en cuenta los datos del problema anterior, el contraste será:
c) Bilateral
44. El estadístico de contraste para los datos de los dos problemas anteriores será:
b) Z = 1,715
45. Atendiendo a los datos de los problemas anteriores, la interpretación de los resultados
será: b) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador
está justificada, es decir, que sólo un 15% de los alumnos maneja con rapidez el
diccionario.
TEMA 3
1. Los diseños de investigación intersujetos determinan analizar los datos con estadísticos
de contraste para: b) Muestras independientes
7. Queremos contrastar que H0: π21 = π12. Hemos estimado que la diferencia entre las dos
proporciones poblacionales estará entre los valores 0,047 y 0,470 con una probabilidad
igual a 0,99. Se podría interpretar que: a) Ambas proporciones son distintas
12. El estadístico de contraste en el caso de los datos del problema anterior sería:
b) Z = 6,9
13. La conclusión obtenida en nuestro análisis sería: a) Para un n. c., igual a 0,99, la
diferencia entre la proporción poblacional de mujeres que detectan la presencia de
moléculas de androsterona y la de los varones es distinta de 0,10.
15. Atendiendo a los datos del problema anterior, la zona de rechazo de la hipótesis nula
está formada por: b) Todos los valores iguales y menores que t7, 0,025 = 2,36 e iguales y
mayores que t7, 0,975 = 2,36
16. Continuando con el problema anterior, el valor del estadístico de contraste será:
a) t = 3,52
17. Según los datos de los problemas anteriores (14, 15 y 16), podemos afirmar:
a) Que los resultados llevan al rechazo de H0, a un nivel de significación igual a 0,05, de
que las muestras proceden de dos poblaciones con medias iguales.
18. Queremos comparar el método tradicional (T) de la UNED con un método nuevo, en
concreto, un método multimedia (M), para la enseñanza a distancia de la estadística.
Nuestra hipótesis es que los alumnos que estudien con el método tradicional obtendrán
unas notas inferiores a las de los alumnos que estudien con el método multimedia.
Extraemos aleatoria e independientemente 7 alumnos del segundo curso de psicología de
la UNED y les asignamos también aleatoriamente a los dos métodos de enseñanza. Los
datos que aparecen a continuación representan las notas obtenidas en un examen de
estadística en ambas muestras de alumnos:
Método Tradicional (MT): 4 5 6 2
Método Multimedia (MM): 9 8 10
La nota en estadística es una variable medida a nivel de intervalo que se distribuye
normalmente en ambas poblaciones con varianzas: σ2T = 4 y σ2 M = 2. N. c. 95%. Teniendo
en cuenta estos datos, ¿cuál será la formulación de las hipótesis estadísticas?:
b) H0: μT ≥ μM y H1: μT < Μm
19. Atendiendo a los datos del problema anterior, el valor del estadístico de contraste será:
c) Z = 3,68
20. Continuando con los datos de los problemas anteriores, podemos afirmar que: b) A
nivel poblacional, los alumnos que estudiaron con el método tradicional tienen una
nota media en estadística inferior a los que estudiaron con el método multimedia,
asumiendo un nivel de significación igual a 0,05.
21. Algunas variables ejercen su influencia sobre las conductas haciendo éstas más o
menos variables. Un investigador quiere investigar esta cuestión en la conducta afectiva de
los niños. Su hipótesis es que la conducta afectiva de los niños es menos variable que la de
las niñas. Extrae una muestra aleatoria de 41 niñas y otra de 31 niños y les mide la
afectividad mediante un cuestionario obteniendo una varianza insesgada igual a 9 en la
muestra de niños y una de 36 en la muestra de niñas. La variable puntuación en el
cuestionario de afectividad está medidaa nivel de intervalo. ¿cuál será el planteamiento
de la hipótesis estadísticas? (N. c. 99%)
c) H0: σ2A ≤ σ2 O ó H0: σ2A / σ2 O ≤ 1 y H1: σ2A > σ2 O ó H1: σ2 A / σ2 O > 1
22. El estadístico de contraste, atendiendo a los datos del problema anterior será:
c) f = 4
23. La zona de rechazo de la hipótesis nula estará formada por todos los valores:
a) Todos los valores iguales y mayores que f0,99; 40, 30 = 2,30
26. Tras realizar análisis estadístico sobre dos muestras de 7 y 8 sujetos, los resultados
apoyan la hipótesis del investigador de que la relajación influye positivamente sobre la
elasticidad en los deportistas. Los resultados obtenidos son los siguientes:
Grupo 1: n=7 ȲR = 125,8 σ2 R = 68,7 (Grupo con relajación) Grupo 2: n=8 ȲNR=119,5 σ2
NR =61,67 (Grupo sin relajación) ¿Cuál será la magnitud de la mejoría de la elasticidad tras
aplicar la relación?: a) 0,78
27. Un psicofísico hipotetiza que los hombres y las mujeres no son igualmente variables en
sensibilidad olfativa. Extrae una muestra aleatoria de 13 hombres (H) y otra de 25 mujeres
(M) y les mide la sensibilidad olfativa, obteniendo una varianza insesgada igual a 10 en la
muestra de hombres y de 17 en la de mujeres. La sensibilidad olfativa es una variable
medida a nivel de intervalo que se distribuye normalmente en ambas poblaciones. N. c.
90%. ¿Cuál será la formulación de la hipótesis estadística?:
b) H0: σ2M = σ2 H ó H0: σ2M / σ2H = 1 y H1: σ2 M ≠ σ2 H ó H1: σ2M / σ2H ≠ 1
28. La zona de aceptación de la hipótesis nula, teniendo en cuenta los datos del problema
anterior, está formada por todos los valores : a)f0,05; 24, 12 = 0,46 < H0 < f0,95; 24, 12 = 2,51
29. El estadístico de contraste, atendiendo a los datos de los dos problemas anteriores
será: c) f = 1,70
30. atendiendo a los datos de los problemas anteriores, (27, 28, 29), ¿se rechaza la
hipótesis nula?: b) No, ya que el valor del estadístico de contraste cae dentro de la zona de
aceptación de la hipótesis nula
31. Siguiendo con los problemas anteriores, ¿apoyan los resultados la hipótesis del
investigador?: a) No, ya que se acepta la hipótesis nula.
35. Teniendo en cuenta los datos del problema anterior, se rechazará la hipótesis nula?:
a) No, porque p = 0,1416 > α = 0,01
36. Según los resultados de los problemas anteriores, a qué conclusiones llegaremos:
b) La relajación no ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.
37. Un investigador quiere estudiar el efecto de la privación de agua sobre el tiempo que
tardan las ratas en recorrer un laberinto. Extrae aleatoria e independientemente 60 ratas y
les asigna también aleatoriamente a las dos condiciones del experimento: 12 y 24 horas de
privación de agua. Las 30 ratas sometidas a 12 horas de privación de agua (muestra A)
tardaron un tiempo medio de 5,9 minutos en recorrer un laberinto y las 30 ratas
sometidas a 24 horas de privación (muestra B) tardaron 6,40 minutos en recorrer el
mismo laberinto, siendo las desviaciones típicas isesgadas 0,29 y 0,30 respectivamente.
Sabiendo que el n. c. fijado por el investigador es del 95%, cuál será el planteamiento de
las hipótesis estadísticas: a) H0: μA = μB ó μA μB = 0 y H1: μA ≠ μB ó μA μB ≠ 0
38. El estadístico de contraste atendiendo a los datos del problema anterior, será:
c) t = 6,58
40. ¿Se rechazaría la hipótesis nula?: b) Sí, porque la probabilidad asociada al estadístico
de contraste obtenido es menor que el nivel de significación acordado en nuestra
investigación.
TEMA 4
1. Un ejemplo de muestras relacionadas son las obtenidas:
a) Con un diseño clásico antes y después de un tratamiento.
2. Cuando hallamos los valores críticos del estadísticos T, para dos muestras relacionadas,
con más de 30 grados de libertad, acudimos a la tabla de distribución: c) Normal.
4. Cuando hallamos los valores críticos del estadístico T, para dos muestras relacionadas,
con más de 30 grados de libertad, acudimos a la tabla de distribución:
a) Normal
6. Cuando se mida una variable en los dos miembros de n pares de sujetos siendo los
miembros de cada par muy similares en variables relevantes del estudio, asumiremos que
las observaciones de ambas muestras: a) Están relacionadas pero ello no implica que las
diferencias entre cada par de observaciones lo estén.
7. Se desea estudiar si una terapia de relajación reduce el nivel de ansiedad. Se obtiene una
muestra aleatoria de 8 sujetos y se les toman medidas en ansiedad antes y después de
aplicarles la terapia. Sabemos que la variable está medida a nivel de intervalo y que la
distribución poblacional de las diferencias entre cada par de puntuaciones es simétrica en
torno a la medida de tendencia central. ¿Qué estadístico de contraste aplicaría?:
W de Wilcoxon
11. El cometido del Análisis de Varianza es: c) Discernir qué variabilidad corresponde al
factor estudiado y cuál al error experimental.
13. Con el ANOVA contrastamos, la diferencia de: b) Medias entre varias muestras
18. Cuál será el resultado de nuestro estadístico atendiendo a los datos del problema 24?.
c) F= 11,36
19. Cuál será nuestro valor crítico, atendiendo a los datos del problema 24? b) 4,414
20. A un n.c. del 95% aceptaríamos la Hipótesis alternativa?: (datos del problema 24)
a) Sí porque el valor del estadístico es mayor que nuestro valor crítico.
21. Teniendo en cuenta los resultados obtenidos en los ejercicios anteriores (24 al 27), la
conclusión a la que hemos llegado es la siguiente: c) Al haber obtenido una diferencia
significativa en nuestro estudio, se deduce que el ambiente en el que se desarrolle un niño
influye en las puntuaciones obtenidas en un test de inteligencia.
5. El valor crítico obtenido, atendiendo a los datos del problema anterior, será:
a) 4,87
6. Con un nivel de confianza del 99% podemos afirmar (según los datos de los problemas 4
y 5):
c) Que existen diferencias significativas entre al menos dos de los algoritmos en número
de emparejamientos incorrectos.
7. Se lleva a cabo una investigación para estudiar si las Técnicas de Inoculación de Estrés
(TIE) tienen efecto sobre la ansiedad precompetitiva de los corredores de velocidad. Para
ello, se seleccionaron aleatoriamente 12 atletas de entre todos aquéllos que puntuaron
alto en una batería de tests de ansiedad y se les enseñaron la TIE. Para estudiar el efecto
de las TIE se tomaron cuatro medidas de ansiedad precompetitiva mediante un
cuestionario específico en cuatro ocasiones: la 1ª fue tomada en una situación de
laboratorio antes de enseñarles las TIE (LA), la 2ª en una situación previa a la competición
antes de la TIE (CA), la 3ª en una situación de laboratorio después de las TIE (LD) y la 4ª
en una situación previa a la competición después de las TIE (CD). Teniendo en cuenta un
n.c. del 99% y que la suma de cuadrados del tratamiento vale 26,25, la suma de cuadrados
error vale 52,25 y la suma de cuadrados total vale 297,25, ¿cuál será el valor del
estadístico de contraste?: c) 5,526
8. El valor crítico, según los datos del problema anterior es: b) 4,51
9. Atendiendo a los datos de los dos problemas anteriores, podemos concluir que:
a) Existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.
3. Cuál sería el valor crítico para la interacción de ambos factores (AB): c) 3,55
4. Continuando con el problema 1, hemos obtenido las siguientes sumas de cuadrados:
SCA = 73,5 SCB = 312,33 SCAB = 7 SCS/AB = 47 A la luz de los resultados podemos concluir, con
respecto al factor A (ratas): b) Existen diferencias significativas entre los dos grupos de
ratas
10. Tras realizar el cálculo de los estadísticos, podemos concluir, refiriéndonos al factor A:
b) No existen diferencias significativas entre las ratas
11. Del mismo modo, podemos concluir acerca del factor B (adiestramiento):
b) No existen diferencias significativas entre los adiestramientos.
9- Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el
tamaño de la muestra: A) Aumenta el error máximo. B) Disminuye el error típico. C) Aumenta
la cuasivarianza muestral
10- En los diseños intra-sujetos se considera que la varianza de error viene dada por: A) El
factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.
12- Cuál de los siguientes estimadores para la media poblacional de una distribución es
suficiente: A) La mediana. B) La media aritmética. C) La moda.
13- En un contraste de hipótesis sobre dos medias en el que el tamaño del efecto es
moderado: A) El estadístico de contraste puede ser significativo o no, dependiendo del
tamaño de la muestra. B) El estadístico de contraste siempre será significativo para 𝛼 = 0,05 C)
El estadístico de contraste siempre será significativo para 𝛼 = 0,01
17- La probabilidad de rechazar una hipótesis nula que es verdadera, recibe el nombre de: A)
Potencia del contraste. B) Error tipo II. C) Nivel de significación.
18- En un contraste de hipótesis bilateral sobre una media poblacional, ¿puede utilizarse el
intervalo de confianza para contrastar dicha hipótesis? A) Sí, y se rechaza 𝑯𝟎 cuando el valor
formulado en la 𝑯𝟎 se encuentra fuera del intervalo de confianza. B) Sí, y se rechaza 𝐻0
cuando el estadístico de contraste se encuentra fuera del intervalo de confianza. C) El intervalo
de confianza no aporta información para rechazar o no 𝐻0
20- En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t
de Student para realizar comparaciones múltiples dos a dos?: A) Sí, porque es la mejor opción.
B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa. C) No porque se
incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.
21- La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es: A)
Insesgada. B) Un parámetro. C) Una variable aleatoria.
22- La potencia del contraste se puede expresar simbólicamente como: A) 𝑃(𝐻0 = aceptar | 𝐻0
= falsa) B) 𝑃(𝐻0 = rechazar | 𝐻0 = cierta) C) 𝑷(𝑯𝟎 = rechazar | 𝑯𝟎 =falsa)
24- El tamaño del efecto: A) Es mayor a medida que aumenta el tamaño de las muestras. B) Es
mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos
experimental y control. C) No depende del tamaño muestral.
26- La posibilidad de analizar interacciones es: A) Una de las razones por las que se
recomienda el Anova frente a las comparaciones dos a dos de muestras (dependientes o
independientes). B) Es problemática porque incrementa el error Tipo I. C) Es difícil porque no
se conoce la distribución muestral de las F´s en esta situación.
27- En los Anovas el contraste es unilateral derecho porque: A) La distribución F no tiene
valores inferiores a 0. B) Establecemos hipótesis sobre las varianzas poblacionales y estas son
siempre positivas. C) Dada la lógica del Anova, la posibilidad de encontrar valores de F
inferiores a la unidad es poco probable.
28- El tamaño del efecto: A) se puede clasificar en tres categorías según Cohen. B) depende
del tamaño muestral. C) es una diferencia de medias no estandarizad
29- El investigador informó que, en su estudio, 1 − 𝛽 = 0,6. Esto significa que: A) la probabilidad
de no rechazar H0 siendo falsa vale 0,6. B) la probabilidad de rechazar H0 siendo falsa vale
0,6. C) la probabilidad de no rechazar H0 siendo verdadera vale 0,4
31- Si optase por utilizar muestras más grandes y suponiendo que se mantienen los mismos
estadísticos obtenidos en estas muestras, ¿cuál de las siguientes consecuencias se
producirían?: A) aumentaría el tamaño del efecto; B) aumentaría la probabilidad de rechazar
la hipótesis nula C) disminuiría la potencia del contraste.
32- El error típico de la media representa: A) la máxima diferencia que cabe esperar por simple
azar entre la media obtenida en la muestra y la media de la población formulada en la 𝐻0; B) la
desviación típica de la distribución muestral de la media C) el error que se comete al estimar
la media poblacional a partir de la media de la muestra
33- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis
nula que es verdadera, recibe el nombre de: A) Potencia del contraste; B) Error tipo II; C) Nivel
de significación
34- A medida que aumenta el tamaño de la muestra, aumenta también: A) La potencia del
contraste B) La amplitud del intervalo de confianza; C) El error tipo II
34- El error típico de la media es: A) el error que sumamos y restamos a la media aritmética
para calcular el intervalo de confianza; B) la desviación típica de la distribución muestral de la
media C) el error que cometemos si rechazamos una hipótesis nula verdadera.
33- Cuál de los siguientes estimadores sobre la tendencia central de una distribución es
suficiente: A) la mediana; B) la media aritmética C) la moda
34- El valor crítico para tomar una decisión respecto a la hipótesis nula depende: A) del nivel
de confianza que se establezca B) de los grados de libertad de la distribución muestral de la
diferencia de proporciones; C) de si se conoce o no la varianza poblacional de las diferencias.
35- En un contraste de hipótesis sobre la media aritmética, el valor absoluto del valor crítico:
A) es el mismo en un contraste unilateral izquierdo y un contraste unilateral derecho B) es el
mismo en un contraste bilateral y unilateral derecho; C) es el mismo en un contraste bilateral y
unilateral izquierdo.
36- La potencia de un contraste de hipótesis será mayor: A) a medida que aumenta el tamaño
de la muestra B) a medida que disminuye el tamaño de la muestra; C) siempre es la misma
suponiendo que H1 es verdadera.
37- Las curvas de potencia permiten localizar la potencia de un contraste en función de: A) el
tamaño de la población y de la muestra; B) el valor de H1 y el tamaño de la muestra C) el
tamaño de la población y el valor de H1
38- En un contraste de hipótesis sobre una media, si es cierta la hipótesis alternativa pero no
se detecta en el contraste estadístico, se comete un error: A) de tipo II B) de tipo I; C) igual al
nivel crítico.
39- La potencia del contraste es igual a: A) probabilidad de aceptar la hipótesis nula siendo
cierta; B) probabilidad de rechazar la hipótesis nula siendo falsa C) probabilidad de rechazar
la hipótesis alternativa siendo verdadera.
40- Las pruebas no paramétricas se utilizan en diseños en los que se trabaja con: A) Muestras
no representativas de la población objetivo del estudio; B) Muestras pequeñas o variables que
no alcanzan el nivel de medida de intervalo o razón C) Variables medidas con escala de
intervalo que provienen de poblaciones con distribución poblacional desconocida.
43- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en
muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas C) ninguna de las anteriores es correcta.
44- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1 C) El nivel de confianza más nivel significación es igual a 1.
45- El nivel de significación representa: A) el máximo error que el investigador está dispuesto
a admitir para rechazar una hipótesis nula que es verdadera B) el máximo error que el
investigador está dispuesto a admitir para rechazar una hipótesis nula que es falsa; C) la
probabilidad de rechazar una hipótesis nula que es falsa.
47- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume
como provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los
datos obtenidos en la muestra.
48- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria ordinaria.
49- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede
adoptar valores negativos porque: A) los valores de la ordenada (eje vertical) son todos
positivos; B) toda distribución de densidad de probabilidad se estandariza para que tenga un
área igual a la unidad; C) es el cociente entre dos varianzas y estas son siempre positivas
51- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el
tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.
53- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A)
cuya distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.
54- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
55- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un
nivel de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación;
B) aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.
59- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a
comparar deben de cumplir el supuesto de: A) complementariedad y exhaustividad; B)
homocedasticidad; C) independencia.
1- Las curvas de potencia, permiten localizar la potencia de un contraste en función de: A) el
valor de 𝑯𝟏 y el tamaño de la muestra B) los valores de 𝐻0 y 𝐻1 C) el nivel de significación y
la potencia del contraste
9- Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el
tamaño de la muestra: A) Aumenta el error máximo. B) Disminuye el error típico. C) Aumenta
la cuasivarianza muestral
10- En los diseños intra-sujetos se considera que la varianza de error viene dada por: A) El
factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.
12- Cuál de los siguientes estimadores para la media poblacional de una distribución es
suficiente: A) La mediana. B) La media aritmética. C) La moda.
13- En un contraste de hipótesis sobre dos medias en el que el tamaño del efecto es
moderado: A) El estadístico de contraste puede ser significativo o no, dependiendo del
tamaño de la muestra. B) El estadístico de contraste siempre será significativo para 𝛼 = 0,05 C)
El estadístico de contraste siempre será significativo para 𝛼 = 0,01
17- La probabilidad de rechazar una hipótesis nula que es verdadera, recibe el nombre de: A)
Potencia del contraste. B) Error tipo II. C) Nivel de significación.
18- En un contraste de hipótesis bilateral sobre una media poblacional, ¿puede utilizarse el
intervalo de confianza para contrastar dicha hipótesis? A) Sí, y se rechaza 𝑯𝟎 cuando el valor
formulado en la 𝑯𝟎 se encuentra fuera del intervalo de confianza. B) Sí, y se rechaza 𝐻0
cuando el estadístico de contraste se encuentra fuera del intervalo de confianza. C) El intervalo
de confianza no aporta información para rechazar o no 𝐻0
20- En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t
de Student para realizar comparaciones múltiples dos a dos?: A) Sí, porque es la mejor opción.
B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa. C) No porque se
incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.
21- La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es: A)
Insesgada. B) Un parámetro. C) Una variable aleatoria.
22- La potencia del contraste se puede expresar simbólicamente como: A) 𝑃(𝐻0 = aceptar | 𝐻0
= falsa) B) 𝑃(𝐻0 = rechazar | 𝐻0 = cierta) C) 𝑷(𝑯𝟎 = rechazar | 𝑯𝟎 =falsa)
24- El tamaño del efecto: A) Es mayor a medida que aumenta el tamaño de las muestras. B) Es
mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos
experimental y control. C) No depende del tamaño muestral.
26- La posibilidad de analizar interacciones es: A) Una de las razones por las que se
recomienda el Anova frente a las comparaciones dos a dos de muestras (dependientes o
independientes). B) Es problemática porque incrementa el error Tipo I. C) Es difícil porque no
se conoce la distribución muestral de las F´s en esta situación.
27- En los Anovas el contraste es unilateral derecho porque: A) La distribución F no tiene
valores inferiores a 0. B) Establecemos hipótesis sobre las varianzas poblacionales y estas son
siempre positivas. C) Dada la lógica del Anova, la posibilidad de encontrar valores de F
inferiores a la unidad es poco probable.
28- El tamaño del efecto: A) se puede clasificar en tres categorías según Cohen. B) depende
del tamaño muestral. C) es una diferencia de medias no estandarizad
29- El investigador informó que, en su estudio, 1 − 𝛽 = 0,6. Esto significa que: A) la probabilidad
de no rechazar H0 siendo falsa vale 0,6. B) la probabilidad de rechazar H0 siendo falsa vale
0,6. C) la probabilidad de no rechazar H0 siendo verdadera vale 0,4
31- Si optase por utilizar muestras más grandes y suponiendo que se mantienen los mismos
estadísticos obtenidos en estas muestras, ¿cuál de las siguientes consecuencias se
producirían?: A) aumentaría el tamaño del efecto; B) aumentaría la probabilidad de rechazar
la hipótesis nula C) disminuiría la potencia del contraste.
32- El error típico de la media representa: A) la máxima diferencia que cabe esperar por simple
azar entre la media obtenida en la muestra y la media de la población formulada en la 𝐻0; B) la
desviación típica de la distribución muestral de la media C) el error que se comete al estimar
la media poblacional a partir de la media de la muestra
33- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis
nula que es verdadera, recibe el nombre de: A) Potencia del contraste; B) Error tipo II; C) Nivel
de significación
34- A medida que aumenta el tamaño de la muestra, aumenta también: A) La potencia del
contraste B) La amplitud del intervalo de confianza; C) El error tipo II
34- El error típico de la media es: A) el error que sumamos y restamos a la media aritmética
para calcular el intervalo de confianza; B) la desviación típica de la distribución muestral de la
media C) el error que cometemos si rechazamos una hipótesis nula verdadera.
33- Cuál de los siguientes estimadores sobre la tendencia central de una distribución es
suficiente: A) la mediana; B) la media aritmética C) la moda
34- El valor crítico para tomar una decisión respecto a la hipótesis nula depende: A) del nivel
de confianza que se establezca B) de los grados de libertad de la distribución muestral de la
diferencia de proporciones; C) de si se conoce o no la varianza poblacional de las diferencias.
35- En un contraste de hipótesis sobre la media aritmética, el valor absoluto del valor crítico:
A) es el mismo en un contraste unilateral izquierdo y un contraste unilateral derecho B) es el
mismo en un contraste bilateral y unilateral derecho; C) es el mismo en un contraste bilateral y
unilateral izquierdo.
36- La potencia de un contraste de hipótesis será mayor: A) a medida que aumenta el tamaño
de la muestra B) a medida que disminuye el tamaño de la muestra; C) siempre es la misma
suponiendo que H1 es verdadera.
37- Las curvas de potencia permiten localizar la potencia de un contraste en función de: A) el
tamaño de la población y de la muestra; B) el valor de H1 y el tamaño de la muestra C) el
tamaño de la población y el valor de H1
38- En un contraste de hipótesis sobre una media, si es cierta la hipótesis alternativa pero no
se detecta en el contraste estadístico, se comete un error: A) de tipo II B) de tipo I; C) igual al
nivel crítico.
39- La potencia del contraste es igual a: A) probabilidad de aceptar la hipótesis nula siendo
cierta; B) probabilidad de rechazar la hipótesis nula siendo falsa C) probabilidad de rechazar
la hipótesis alternativa siendo verdadera.
40- Las pruebas no paramétricas se utilizan en diseños en los que se trabaja con: A) Muestras
no representativas de la población objetivo del estudio; B) Muestras pequeñas o variables que
no alcanzan el nivel de medida de intervalo o razón C) Variables medidas con escala de
intervalo que provienen de poblaciones con distribución poblacional desconocida.
43- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en
muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas C) ninguna de las anteriores es correcta.
44- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1 C) El nivel de confianza más nivel significación es igual a 1.
45- El nivel de significación representa: A) el máximo error que el investigador está dispuesto
a admitir para rechazar una hipótesis nula que es verdadera B) el máximo error que el
investigador está dispuesto a admitir para rechazar una hipótesis nula que es falsa; C) la
probabilidad de rechazar una hipótesis nula que es falsa.
47- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume
como provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los
datos obtenidos en la muestra.
48- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria ordinaria.
49- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede
adoptar valores negativos porque: A) los valores de la ordenada (eje vertical) son todos
positivos; B) toda distribución de densidad de probabilidad se estandariza para que tenga un
área igual a la unidad; C) es el cociente entre dos varianzas y estas son siempre positivas
51- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el
tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.
53- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A)
cuya distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.
54- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
55- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un
nivel de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación;
B) aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.
59- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a
comparar deben de cumplir el supuesto de: A) complementariedad y exhaustividad; B)
homocedasticidad; C) independencia.
Diseños de Investigación y Análisis de Datos. 2018/19 -
1. En un contraste de hipótesis sobre dos medias para muestras independientes y con independencia de los resultados
obtenidos, ¿cuál de las siguientes afirmaciones es cierta?:
A) Si utilizásemos muestras más grandes aumentaría el valor del estadístico de contraste y con ello la
probabilidad de rechazar la hipótesis nula, aunque no cambiaría el tamaño del efecto.
C) Aumentando el tamaño de la muestra se consigue un efecto mayor pero no afecta al estadístico de contraste sobre la
significación de las diferencias.
B) Es innecesaria ya que el ajuste es muy bueno y, por consiguiente, el modelo debe ser lineal.
A) Tanto la variable dependiente como la independiente han de ser cuantitativas (de intervalo o razón).
A) La media aritmética.
B) La varianza.
C) La proporción.
Solución: La varianza muestral no es un estadístico insesgado de la varianza poblacional mientras que la media
aritmética y la proporción sí lo son.
A) 𝛼𝛼
B) 𝜷𝜷
C) 1 − 𝛽𝛽
Diseños de Investigación y Análisis de Datos. 2018/19 -
7. Cuando al realizar un ANOVA un investigador no está interesado en comprobar las diferencias entre todas las medias
y sabe de antemano que comparaciones le interesan, se denomina a las comparaciones múltiples que ha de realizar:
A) “a priori”.
B) “a posteriori”.
C) “post hoc”.
Solución: las comparaciones a posteriori se utilizan cuando el investigador no establece a priori las comparaciones a
realizar y solo lo hace después de ejecutado el experimento. Por el contrario, cuando sí conoce estos contrastes antes
de realizar el estudio, se denominan “a priori”.
Solución: el supuesto de homocedasticidad hace referencia a la igualdad de varianzas en las distribuciones de los
errores condicionadas a cada valor de X (no a la normalidad ni a la independencia entre valores de Y).
9. Los supuestos necesarios para realizar inferencias sobre correlación y regresión, incluyen:
C) Independencia entre los valores de la variable independiente X y los valores estimados Y´.
A) El investigador establece como niveles del factor sólo aquellos en los que está interesado en estudiar.
B) Se considera que los “i” niveles del factor son una muestra aleatoria de todos los posibles niveles.
11. La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es:
A) Que 𝛽 = 0.
C) Que las puntuaciones de la variable dependiente condicionadas a cada valor de la variable independiente
sean normales.
Diseños de Investigación y Análisis de Datos. 2018/19 -
Solución: Nos piden la correlación semi-parcial entre X1 e Y habiendo eliminado el influjo del resto de variables
independientes (VI´s) sobre la X1. Como solamente tenemos como otra variable independiente X2, significa que debemos
eliminar el influjo de X2 sobre X1 (ver página 264, “… para saber qué parte de la VD explica cada VI al margen de las
otras VI´s, para así poder determinar el influjo único que esa VI tiene sobre la VD. Esta relación entre cada VI y la VD
habiendo eliminado el influjo del resto de las VI´s sobre cada VI es lo que se llama Coeficiente de correlación
semiparcial”).
B) Establecemos hipótesis sobre las varianzas poblacionales y estas son siempre positivas.
C) Dada la lógica del Anova, la posibilidad de encontrar valores de F inferiores a la unidad es poco probable.
A) Una de las razones por las que se recomienda el Anova frente a las comparaciones dos a dos de muestras
(dependientes o independientes).
B) Es mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos experimental y control.
Solución: A diferencia de lo que sucede con los estadísticos de contraste, la magnitud del tamaño del efecto no depende
del tamaño muestral. La opción A contradice esta afirmación. La opción B es errónea porque, según la fórmula de la d
de Cohen, la diferencia de las medias entre el grupo experimental y control está en el numerador. Por tanto, cuanto mayor
sea esta diferencia, mayor será d; cuanto menor sea esta diferencia, menor será d.
Solución: por definición, el error típico es la desviación típica de los errores de pronóstico. La opción A es incorrecta porque define
el error de pronóstico para un sujeto, mientras que la opción B hace referencia a Sx de la variable dependiente pronosticada (T’) en
este caso.
21. Uno de los supuestos básicos del análisis de regresión simple es:
B) Las distribuciones condicionadas de los errores deben de tener una distribución uniforme.
22. En los diseños intra-sujetos se considera que la varianza de error viene dada por:
A) El factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.
23. Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el tamaño de la muestra:
25. Cuál de los siguientes estimadores para la media poblacional de una distribución es suficiente:
27. Con dos variables independientes (𝑋1; 𝑋2) y una variable dependiente (𝑌), el coeficiente de correlación parcial entre
𝑋1 e 𝑌, representa:
28. Para la regresión lineal simple se obtienen dos coeficientes, ordenada en el origen (𝐵0) y pendiente (𝐵).
Generalmente, estaremos más interesados en interpretar:
A) 𝐵0
B) 𝑩
29. Para que sean válidas las inferencias que sobre la variable dependiente se hagan con la recta de regresión, las
varianzas de las distribuciones de los errores, condicionadas a los diferentes valores de la variable independiente deben
de cumplir el supuesto de:
30. En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t de Student para realizar
comparaciones múltiples dos a dos?:
C) De obtener unos datos como los observados o más extremos siendo cierta la hipótesis nula.
32. Uno de los supuestos básicos del análisis de regresión simple es:
B) Las distribuciones condicionadas de los errores deben de tener una distribución uniforme.
33. En el caso de la regresión lineal simple, el signo del coeficiente de correlación y de la pendiente de la recta de
regresión:
34. Suponiendo que existieran dos estadísticos insesgados, consistentes y suficientes para estimar la misma
característica poblacional, la mejor elección es utilizar el estadístico:
A) Aumenta el tamaño de la muestra B) Aumenta el nivel de confianza C) Aumenta el error típico del estadístico.
A) La potencia del contraste; B) La amplitud del intervalo de confianza; C) El error tipo II.
38. El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula que es verdadera,
recibe el nombre de:
A) la máxima diferencia que cabe esperar por simple azar entre la media obtenida en la muestra y la media de la población
formulada en la 𝐻0;
9- Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el
tamaño de la muestra: A) Aumenta el error máximo. B) Disminuye el error típico. C) Aumenta
la cuasivarianza muestral
10- En los diseños intra-sujetos se considera que la varianza de error viene dada por: A) El
factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.
12- Cuál de los siguientes estimadores para la media poblacional de una distribución es
suficiente: A) La mediana. B) La media aritmética. C) La moda.
13- En un contraste de hipótesis sobre dos medias en el que el tamaño del efecto es
moderado: A) El estadístico de contraste puede ser significativo o no, dependiendo del
tamaño de la muestra. B) El estadístico de contraste siempre será significativo para 𝛼 = 0,05 C)
El estadístico de contraste siempre será significativo para 𝛼 = 0,01
17- La probabilidad de rechazar una hipótesis nula que es verdadera, recibe el nombre de: A)
Potencia del contraste. B) Error tipo II. C) Nivel de significación.
18- En un contraste de hipótesis bilateral sobre una media poblacional, ¿puede utilizarse el
intervalo de confianza para contrastar dicha hipótesis? A) Sí, y se rechaza 𝑯𝟎 cuando el valor
formulado en la 𝑯𝟎 se encuentra fuera del intervalo de confianza. B) Sí, y se rechaza 𝐻0
cuando el estadístico de contraste se encuentra fuera del intervalo de confianza. C) El intervalo
de confianza no aporta información para rechazar o no 𝐻0
20- En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t
de Student para realizar comparaciones múltiples dos a dos?: A) Sí, porque es la mejor opción.
B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa. C) No porque se
incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.
21- La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es: A)
Insesgada. B) Un parámetro. C) Una variable aleatoria.
22- La potencia del contraste se puede expresar simbólicamente como: A) 𝑃(𝐻0 = aceptar | 𝐻0
= falsa) B) 𝑃(𝐻0 = rechazar | 𝐻0 = cierta) C) 𝑷(𝑯𝟎 = rechazar | 𝑯𝟎 =falsa)
24- El tamaño del efecto: A) Es mayor a medida que aumenta el tamaño de las muestras. B) Es
mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos
experimental y control. C) No depende del tamaño muestral.
26- La posibilidad de analizar interacciones es: A) Una de las razones por las que se
recomienda el Anova frente a las comparaciones dos a dos de muestras (dependientes o
independientes). B) Es problemática porque incrementa el error Tipo I. C) Es difícil porque no
se conoce la distribución muestral de las F´s en esta situación.
27- En los Anovas el contraste es unilateral derecho porque: A) La distribución F no tiene
valores inferiores a 0. B) Establecemos hipótesis sobre las varianzas poblacionales y estas son
siempre positivas. C) Dada la lógica del Anova, la posibilidad de encontrar valores de F
inferiores a la unidad es poco probable.
28- El tamaño del efecto: A) se puede clasificar en tres categorías según Cohen. B) depende
del tamaño muestral. C) es una diferencia de medias no estandarizad
29- El investigador informó que, en su estudio, 1 − 𝛽 = 0,6. Esto significa que: A) la probabilidad
de no rechazar H0 siendo falsa vale 0,6. B) la probabilidad de rechazar H0 siendo falsa vale
0,6. C) la probabilidad de no rechazar H0 siendo verdadera vale 0,4
31- Si optase por utilizar muestras más grandes y suponiendo que se mantienen los mismos
estadísticos obtenidos en estas muestras, ¿cuál de las siguientes consecuencias se
producirían?: A) aumentaría el tamaño del efecto; B) aumentaría la probabilidad de rechazar
la hipótesis nula C) disminuiría la potencia del contraste.
32- El error típico de la media representa: A) la máxima diferencia que cabe esperar por simple
azar entre la media obtenida en la muestra y la media de la población formulada en la 𝐻0; B) la
desviación típica de la distribución muestral de la media C) el error que se comete al estimar
la media poblacional a partir de la media de la muestra
33- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis
nula que es verdadera, recibe el nombre de: A) Potencia del contraste; B) Error tipo II; C) Nivel
de significación
34- A medida que aumenta el tamaño de la muestra, aumenta también: A) La potencia del
contraste B) La amplitud del intervalo de confianza; C) El error tipo II
34- El error típico de la media es: A) el error que sumamos y restamos a la media aritmética
para calcular el intervalo de confianza; B) la desviación típica de la distribución muestral de la
media C) el error que cometemos si rechazamos una hipótesis nula verdadera.
33- Cuál de los siguientes estimadores sobre la tendencia central de una distribución es
suficiente: A) la mediana; B) la media aritmética C) la moda
34- El valor crítico para tomar una decisión respecto a la hipótesis nula depende: A) del nivel
de confianza que se establezca B) de los grados de libertad de la distribución muestral de la
diferencia de proporciones; C) de si se conoce o no la varianza poblacional de las diferencias.
35- En un contraste de hipótesis sobre la media aritmética, el valor absoluto del valor crítico:
A) es el mismo en un contraste unilateral izquierdo y un contraste unilateral derecho B) es el
mismo en un contraste bilateral y unilateral derecho; C) es el mismo en un contraste bilateral y
unilateral izquierdo.
36- La potencia de un contraste de hipótesis será mayor: A) a medida que aumenta el tamaño
de la muestra B) a medida que disminuye el tamaño de la muestra; C) siempre es la misma
suponiendo que H1 es verdadera.
37- Las curvas de potencia permiten localizar la potencia de un contraste en función de: A) el
tamaño de la población y de la muestra; B) el valor de H1 y el tamaño de la muestra C) el
tamaño de la población y el valor de H1
38- En un contraste de hipótesis sobre una media, si es cierta la hipótesis alternativa pero no
se detecta en el contraste estadístico, se comete un error: A) de tipo II B) de tipo I; C) igual al
nivel crítico.
39- La potencia del contraste es igual a: A) probabilidad de aceptar la hipótesis nula siendo
cierta; B) probabilidad de rechazar la hipótesis nula siendo falsa C) probabilidad de rechazar
la hipótesis alternativa siendo verdadera.
40- Las pruebas no paramétricas se utilizan en diseños en los que se trabaja con: A) Muestras
no representativas de la población objetivo del estudio; B) Muestras pequeñas o variables que
no alcanzan el nivel de medida de intervalo o razón C) Variables medidas con escala de
intervalo que provienen de poblaciones con distribución poblacional desconocida.
43- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en
muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas C) ninguna de las anteriores es correcta.
44- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1 C) El nivel de confianza más nivel significación es igual a 1.
45- El nivel de significación representa: A) el máximo error que el investigador está dispuesto
a admitir para rechazar una hipótesis nula que es verdadera B) el máximo error que el
investigador está dispuesto a admitir para rechazar una hipótesis nula que es falsa; C) la
probabilidad de rechazar una hipótesis nula que es falsa.
47- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume
como provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los
datos obtenidos en la muestra.
48- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria ordinaria.
49- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede
adoptar valores negativos porque: A) los valores de la ordenada (eje vertical) son todos
positivos; B) toda distribución de densidad de probabilidad se estandariza para que tenga un
área igual a la unidad; C) es el cociente entre dos varianzas y estas son siempre positivas
51- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el
tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.
53- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A)
cuya distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.
54- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
55- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un
nivel de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación;
B) aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.
59- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a
comparar deben de cumplir el supuesto de: A) complementariedad y exhaustividad; B)
homocedasticidad; C) independencia.
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
3. La eficiencia relativa:
a) Es un valor entre O y 1.
b) Es un cociente entre dos varianzas
c) Ambas respuestas son correctas.
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
18. Si la eficiencia relativa de un estimador, Ô1 respecto a otro estimador, Ô2 es del 85%, para un
mismo tamaño muestral:
a) El cociente entre sus respectivas varianzas poblacionales es 0,85
b) El cociente entre sus medias es 0,85
c) El cociente entre las varianzas de las distribuciones muestrales de los respectivos
estimadores es 0,85
19. En la estimación puntual:
a) Se establece un rango de valores dentro del cual estaría el valor del parámetro
b) Se toma un valor muestral concreto como estimación del parámetro
c) Se establece un intervalo confidencial.
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
24. El estadístico de contraste Z para una media vale -2,15, siendo alfa igual a 0,05, n= 145 y el
contraste bilateral.
a) Los valores críticos son -1,64 y 1,64
b) Se rechaza Ho
c) Se acepta Ho
27. Cuando ponemos a prueba una hipótesis, el método que se utiliza para tomar una decisión
entre la hipótesis nula (Ho) y la hipótesis alternativa (H1) es:
a) La prueba de significación.
b) El intervalo de confianza para una media
c) El contraste de hipótesis.
28. El nivel crítico p:
a) Es siempre un valor muy pequeño
b) Para su cálculo se tiene en cuenta la dirección del contraste (unilateral/bilateral)
c) Se fija en la planificación del estudio.
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
36. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la muestra:
a) Mayor es la precisión del intervalo
b) Menor es la precisión de nuestra estimación
c) Mayor es la amplitud del intervalo.
37. Cuando construimos un intervalo de confianza para la media, manteniendo constantes los
demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n.c.) del 95% en lugar del
99%.
a) Ganamos en precisión porque el intervalo es más preciso
b) Aumenta la probabilidad de cometer error tipo I.
c) Perdemos en precisión porque el intervalo es más grande.
40. La hipótesis nula: “la varianza del grupo 1 es mayor o igual que la varianza del grupo 2”,
se refiere a un contraste:
a) Bilateral.
b) Unilateral derecho
c) Unilateral izquierdo.
41. Con n = 50, la probabilidad del error tipo II es igual a 0,30. Con un n = 40 y manteniendo
constantes los demás factores:
a) 1-beta será 0,70
b) Beta será superior a 0,30
c) Beta será inferior a 0,30
45. Cuanto mayor es la probabilidad del error tipo II, manteniendo constantes los demás factores:
a) Menor es el nivel de significación
b) Mayor es la potencia estadística
c) Mayor es la probabilidad de error tipo I
53. Cuando construimos un intervalo de confianza para la media, manteniendo constantes los
demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n. c.) del 99% en lugar del
95%?:
a) Con un n.c. del 99% la probabilidad de α será menor y menor la probabilidad de
cometer error tipo I.
b) Con un n.c. del 99% aumentaría la probabilidad asociada a dicho intervalo
c) Con un n.c. del 99% perderíamos en precisión
54. Si obtenemos un nivel crítico p mayor que el alfa adoptado quiere decir que:
a) Los resultados son improbables bajo el supuesto de que H0 sea cierta
b) Los resultados son estadísticamente significativos
c) Los resultados no son estadísticamente significativos.
55. Sobre alfa y el nivel crítico p:
a) Ambos tienen valores constantes
b) Si sus valores son iguales se rechaza la hipótesis nula
c) Ambos se fijan antes de obtener los datos de la muestra.
56. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la muestra:
a) Mayor es la precisión del intervalo
b) Menor es la precisión de nuestra estimación
c) Ambas respuestas son incorrectas.
57. La distribución muestral de la media es normal:
a) Cuando es normal la distribución de la variable estudiada o cuando tiende a la
normalidad a medida que aumenta el tamaño de la muestra
b) Sólo cuando es normal la distribución de la variable estudiada.
c) Sólo cuando el tamaño de la muestra es el adecuado.
6
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
60. Hemos extraído una muestra aleatoria de 49 sujetos y le hemos medido el pulso en reposo,
obteniendo una media igual a 60 pulsaciones por minuto. Sabemos que las pulsaciones forman
una escala de intervalo y se distribuyen normalmente con varianza poblacional igual a 16.
Tomamos un n.c. del 99%. ¿cuál será el error máximo (Emáx) aproximado en el cálculo del
intervalo de confianza para µ?
a) 1,33
b) 1,47
c) 1,12
65. Cuando calculamos el intervalo de confianza para la proporción, en el caso de una muestra,
nuestro objetivo es determinar:
a) Los valores que limitan el valor del parámetro proporción que cumplen la característica
en estudio, a un nivel de confianza determinado.
b) Si la variable, antes de ser dicotomizada, se distribuía según la distribución normal.
7
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
67. Hemos aplicado un cuestionario de ansiedad a una muestra de 16 deportistas antes de una
competición y obtuvimos una puntuación media en ansiedad iguala 5. Las puntuaciones en el
cuestionario de ansiedad forman una escala de intervalo y se distribuyen normalmente con
varianza igual a 4. ¿Entre qué valores esperamos se encuentre la media poblacional de la
ansiedad precompetitiva, a un nivel de confianza del 95%?.:
a) 3,71 < μ < 6,29
b) 4,02 < μ < 5,98
c) 6,51 < μ < 7,63
68. Atendiendo a los datos del problema anterior, entre qué valores esperamos se encuentre la
media poblacional de la ansiedad precompetitiva, a un nivel de confianza del 99%:
a) 3,71 < μ < 6,29
b) 4,02 < μ < 5,98
c) 6,51 < μ < 7,63
69. Hemos estimado en una muestra de 16 españoles, la media del grado de acuerdo sobre la
legalización del aborto obteniendo Ȳ = 8. El grado de acuerdo sobre la legalización del aborto
es una variable medida a nivel de intervalo que se distribuye normalmente en la población
con σ2 = 36. Asumiendo un nivel de confianza del 95%, qué tamaño debe tener la muestra
para que la media no se aleje más de ± 1 punto de la media poblacional:
a) 139
b) 147
c) 154
70. Con los datos del problema anterior, sin tener en cuenta que conocemos la varianza
poblacional, sino que conocemos desviación típica y la media del grado de acuerdo sobre la
legalización del aborto, Ȳ = 8 y S = 5. Queremos saber, a un nivel de confianza del 99% qué
tamaño debe tener la muestra para que la media estimada no se aleje más de ± 3 puntos de la
media poblacional:
a) 23
b) 26
c) 20
8
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
71. En una investigación sobre ansiedad, contrastamos la hipótesis nula de que la media
poblacional e igual o mayor que 10. i sabemos que el valor muestral del estad stico de
contraste z = 2,88 y el nivel crítico, p= 0,002, ¿qué significa esta p?:
a) Que la probabilidad de obtener un estadístico de contraste igual o menor que el hallado
es 0,002.
b) Que la probabilidad de aceptar H0 siendo falsa es 0,002
c) Es el error tipo II.
72. Teniendo en cuenta los datos del problema anterior y adoptando un α= 0,01:
a) Se rechaza H0, puesto que p < α
b) Se acepta H0 , puesto que p < α
c) Ninguna de las dos opciones es válida.
9
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
1. La potencia:
a) Es igual a β
b) Es deseable que no sea inferior a 0,80
c) Es deseable que sea muy baja
2. Con n = 40, la potencia es igual a 0,70. Con un n = 60 y manteniendo constantes los demás
factores:
a) La probabilidad del error tipo II será 0,30
b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor que 0,70
c) La potencia será inferior a 0,70
3. El estadístico de contraste Z para una media vale 3, siendo alfa igual a 0,05, n = 120, y el
contraste bilateral:
a) Los valores críticos son -2,33 y 2,33
b) Se acepta H0
c) Se rechaza H0
4. En los contrastes de hipótesis referidos a una muestra, cuando el interés del investigador se
centra en el parámetro media, lo que se prueba es:
a) Si nuestros datos concretos han sido obtenidos de una población con esa media
b) Si la media obtenida para la muestra presenta un valor determinado
c) Si la media obtenida para la muestra es un estimador correcto dado el tamaño de la
muestra utilizada.
5. Con n = 30, la potencia es igual a 0,60. Con un n = 40 y manteniendo constantes los demás
factores:
a) La probabilidad del error tipo II será mayor que 0,60
b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor que 0,60
c) La potencia será inferior a 0,60
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
10. Un contraste de una media permite comprobar si los datos de la muestra proceden de una
población con media igual a la estipulada en la hipótesis nula:
a) Sí
b) No
c) Sólo si n es pequeño
12. Las condiciones para poder aplicar el estadístico de contraste Z en el caso de la proporción
(una sola muestra) incluyen:
a) Muestra aleatoria de n observaciones y población dicotómica.
b) Variable dependiente medida a nivel ordinal, al menos y se trata de muestras
independientes
c) Variable dependiente dicotómica (o dicotomizada) y se trata de muestras
independientes.
13. Tenemos una población normal con varianza conocida. Se toma de ella una muestra de
tamaño n = 15. Para estimar el valor del parámetro media poblacional µ, utilizaremos un
estadístico de contraste cuya distribución es:
a) Normal (N(0,1))
b) T de Student
c) F de Snedecor
14. La distribución muestral de un estadístico de contraste es la distribución T de Student con n –
1 g. L. Y el contraste es unilateral derecho. Para un valor muestral igual a 1,33 y 17 grados de
libertad, el nivel crítico p es:
a) 0,10
b) 0,90
c) Ambas respuestas son incorrectas.
19. Las condiciones para poder aplicar el estadístico de contraste S (signos) en el caso de una sola
muestra:
a) Muestra aleatoria de n observaciones y distribución normal.
b) Muestra aleatoria de n observaciones y distribución binomial.
c) Muestra aleatoria de n observaciones y cualquier tipo de distribución.
22. Para probar hipótesis relativas a la mediana, cuando se cumple la aleatoriedad de las
observaciones, la distribución de la variable es simétrica en la población y el nivel de medida
de intervalos, aplicaremos la prueba de:
a) Wilcoxon antes que la de signos porque aporta más información.
b) Signos antes que la de Wilcoxon ya que aporta la misma información y la segunda es
más restrictiva.
c) Wilcoxon o la de signos indistintamente ya que arroja resultados iguales.
23. Para contrastar hipótesis sobre la mediana, si queremos utilizar la prueba de Wilcoxon, es
necesario que el nivel de medida de los datos sea, al menos:
a) Nominal
b) Ordinal
c) De intervalo
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
24. La depresión es una variable medida a nivel de intervalo que se distribuye normalmente en la
población con varianza conocida. Para una muestra n = 16, ¿qué valor toma la probabilidad del
error tipo II si al contrastar H0: μ = 5 frente a H1: μ = 7, vale 0,70 la probabilidad de
rechazar la hipótesis nula siendo falsa?:
a) 0,30
b) 0,40
c) 0,70
25. Sabemos por trabajos anteriores que un antidepresivo tiene una tolerancia media, sobre los
pacientes que lo toman, de 1,5 según algún índice de tolerancia (cuanto mayor es el índice
mayor es la tolerancia) y una varianza igual a 1. Pensamos que modificando la fórmula
química del antidepresivo podríamos incrementar la tolerancia a este medicamento sin que se
modifique su propiedad antidepresiva. El grado de tolerancia al antidepresivo es una variable
medida a nivel de razón que se distribuye normalmente en la población. Para un n = 25, ¿cuál
es la probabilidad de obtener un resultado significativo, si hipotetizamos una diferencia de +
0,5 entre la media bajo la hipótesis alternativa y aquélla bajo la hipótesis nula (μ1 – μ0 =
0,5) teniendo en cuenta un α = 0,01?:
a) 0,63
b) 0,48
c) 0,56
26. En algunas investigaciones sobre conformismo social, los madrileños fueron calificados de
conformistas. Un investigador basándose en sus propios estudios, opina que los madrileños no
son conformistas, hipotetizando un puntuación inferior a 5 en una escala de conformismo
social que va de 0 a 10, lo cual indicaría inconformismo. Sabiendo que las puntuaciones en
conformismo social forman una escala de intervalo y se distribuyen normalmente en la
población con varianza igual a 1, ¿cuál será la potencia del contraste para H1 : μ = 4,
manteniendo constantes los demás factores?: α = 0,05 y n = 25
a) 0,8763
b) 0,9213
c) 0,9996
27. En una distribución muestral normal (del estadístico media), con una media de 30 y una
desviación típica de 16, ¿qué probabilidad hay de obtener al azar una media comprendida
entre 14 y 26?:
a) 0,7836
b) 0,6826
c) 0,5763
28. En una muestra aleatoria de 101 sujetos, procedentes de una población normal e infinita, se ha
obtenido una media igual a 40 y una desviación típica igual a 15. ¿Qué porcentaje de medias
hay comprendido entre los valores t picos = 2,4 y = 1,5 de la distribución muestral de
la media?:
a) 92,5%
b) 95,3%
c) 91,4%
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
29. Se ha realizado la distribución muestral de la media con 225 muestras, de 90 sujetos cada una,
y se ha comprobado que es normal. En la población, el valor de la media es de 45 (μ = 45) y el
de la desviación típica de 15 (σ = 15). Cuál será el valor típico (puntuación típica) que, llevado a
ambos lados de la media, comprende el 90% de los casos de esa distribución muestral?:
a) ± 1,54
b) ± 1,65
c) ± 1,78
30. Teniendo en cuenta los datos del problema anterior, qué media de esa distribución muestral
dejará por debajo de sí el 90% de los casos:
a) 47,02
b) 53,01
c) 42,37
31. A una muestra aleatoria de 17 estudiantes de secundaria se les aplicó una prueba cuya
finalidad era medir sus conocimientos sobre conceptos científicos básicos. En la variable
analizada, los estudiantes se distribuyen normalmente con una media igual a 78. Los
resultados del estudio en la muestra fueron: media igual a 84,984 y desviación típica igual
a 16. El intervalo de confianza de la distribución muestral será: α = 0,05
a) ± 2,12
b) ± 1,98
c) ± 2,72
32. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste será:
a) Z = 1,893
b) t = 1,746
c) χ2 = 1,572
33. con los datos de los dos problemas anteriores, el criterio de decisión será:
a) A ese nivel de confianza no podemos aceptar la hipótesis nula.
b) Como el valor del estadístico de contraste no se encuentra en el intervalo confidencial,
rechazamos H0.
c) Para un n. c. del 0,95 no podemos aceptar la H1.
34. Una muestra aleatoria de 30 personas presenta una desviación típica, en la variable “tiempo de
ejecución” de una tarea de reconocimiento de palabras, igual a 120 segundos. Queremos saber
si es compatible este resultado, a un nivel de confianza de 99% con el supuesto de que la
desviación típica en la población (para esta variable), con una distribución normal, es de 150
segundos. Teniendo esto en cuenta, el planteamiento de las hipótesis sería:
a) H0 : μ = 150 y H1 : μ ≠ 150
b) H0 : σ2 = 1502 y H1 : σ2≠ 1502
c) H0 : μ < 1502 y H1 : μ > 1502
35. Con los datos del problema anterior, el estadístico de contraste será:
a) χ2 = 19,2
b) Z = 17,3
c) t = 18,4
36. Teniendo en cuenta los datos de los dos problemas anteriores, el intervalo confidencial será:
a) 13,6 < χ2 < 16,3
b) 43,1 < χ2 < 54,2
c) 13,1 < χ2 < 52,3
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
38. Con muestras aleatorias de 121 sujetos, la distribución muestral de la media (de una variable
que se distribuye normalmente en la población) tiene una media de 25 y como desviación
típica de 10. La formulación de las hipótesis será: n.c. : 95%
a) H0 : μ = 25 y H1 : μ ≠ 25
b) H0 : σ2 = 25 y H1 : σ2≠ 25
c) H0 : μ < 25 y H1 : μ > 25
39. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste para
comprobar que una muestra del mismo tamaño con media = 28 y desviación típica = 30
pertenece a la misma población será:
a) Z = 0,3
b) t = 3,7
c) χ2 = 4,2
41. En una muestra aleatoria de 200 sujetos, procedentes de una población normal e infinita, se ha
obtenido una media igual a 60 y una desviación típica igual a 20. Cuál será el error típico de la
media:
a) 1,87
b) 1,63
c) 1,42
42. Un educador piensa que sólo un 15% de los alumnos de cuarto de primaria, del colegio en el
que trabaja, son capaces de manejar con rapidez el diccionario. Para comprobar lo que piensa,
selecciona al azar una muestra de 150 alumnos de ese curso y les realiza una prueba de manejo
del diccionario. Teniendo en cuenta estos datos, la formulación de las hipótesis estadísticas
será: α = 0,05
a) H0: π = 0,15 y H1: π ≠ 0,15
b) H0 : μ = 15 y H1 : μ ≠ 15
c) H0 : μ < 15 y H1 : μ > 15
43. Teniendo en cuenta los datos del problema anterior, el contraste será:
a) Unilateral izquierdo
b) Unilateral derecho
c) Bilateral
6
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
44. El estadístico de contraste para los datos de los dos problemas anteriores será:
a) t = 3,825
b) Z = 1,715
c) χ2 = 4,247
45. Atendiendo a los datos de los problemas anteriores, la interpretación de los resultados será:
a) Con un nivel de confianza del 95% no podemos afirmar que sólo ese porcentaje de
alumnos sea capaz de manejar el diccionario.
b) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador está
justificada, es decir, que sólo un 15% de los alumnos maneja con rapidez el diccionario.
c) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador está
justificada, es decir, que más del 15% de los alumnos maneja con rapidez el diccionario.
46. El equipo docente de la asignatura Diseños de Investigación y Análisis de Datos considera que
el 50% de los alumnos que se presentan a examen, obtienen una nota de 7 o más. Tras realizar
el examen de febrero, comprueban que en una muestra aleatoria de 200 exámenes, 70
obtienen la calificación de Notable, 20 son calificados con Sobresaliente, 80 obtienen la
calificación de Aprobado y 30 la de Suspenso.
Sabiendo que: Suspenso < 5; 7 > Aprobado ≥ 5; 9 > Notable ≥ 7; Sobresaliente ≥ 9
¿Qué planteamiento dará el equipo docente a las hipótesis estadísticas?: (n. c., 95%)
a) H0 : η = 7 y H1 : η ≠ 7
b) H0 : μ = 7 y H1 : μ ≠ 7
c) H0 : μ < 7 y H1 : μ > 7
47. Según los datos del problema anterior, el estadístico de contraste será:
a) t = 5,825
b) χ2 = 4,227
c) = 1,41
48. Atendiendo a los resultados obtenidos, la conclusión a la que se puede llegar es la siguiente:
a) Es posible seguir manteniendo que la mediana de la población de referencia está en la
puntuación 7, es decir, que el 50% de los alumnos que se presentan a examen obtienen
una nota de 7 o más, con un nivel de confianza del 95%.
b) Es posible seguir manteniendo que la media de la población de referencia está en la
puntuación 7 a un nivel de confianza del 95%.
c) No es posible seguir manteniendo el planteamiento de la investigación, es decir,
debemos afirmar que el 50% de los alumnos que se presentan a examen no obtienen
una nota de 7 o más a un nivel de confianza del 95%.
7
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
1. Los diseños de investigación intersujetos determinan analizar los datos con estadísticos de
contraste para:
a) Muestras relacionadas
b) Muestras independientes
c) Bondad de ajuste.
6. Para aplicar un contraste de medias en dos muestras independientes, se debe cumplir que:
a) La variable dependiente debe estar medida, al menos a nivel de razón
b) La variable dependiente debe estar medida, al menos, a nivel de intervalo
c) La variable dependiente debe estar medida, al menos, a nivel ordinal.
7. Queremos contrastar que H0: π21 = π12. Hemos estimado que la diferencia entre las dos
proporciones poblacionales estará entre los valores 0,047 y 0,470 con una probabilidad igual
a 0,99. Se podría interpretar que:
a) Ambas proporciones son distintas
b) Ambas proporciones son iguales
c) No se puede contestar porque faltan datos en el enunciado.
8. En el contraste estadístico de dos medias independientes:
a) Lo más habitual es desconocer el valor de las varianzas poblacionales
b) Lo más habitual es utilizar el estadístico de contraste Z
c) Debe utilizarse el estadístico de contraste X2
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
12. El estadístico de contraste en el caso de los datos del problema anterior sería:
a) F = 3,6
b) Z = 6,9
c) T = 5,4
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
15. Atendiendo a los datos del problema anterior, la zona de rechazo de la hipótesis nula está
formada por:
a) Todos los valores iguales y menores que t7, 0,025 = 2,36
b) Todos los valores iguales y menores que t7, 0,025 = 2,36 e iguales y mayores
que t7, 0,975 = 2,36
c) Todos los valores iguales y mayores que t7, 0,975 = 2,36
16. Continuando con el problema anterior, el valor del estadístico de contraste será:
a) t = 3,52
b) Z = 4,20
c) Z = 3,80
17. Según los datos de los problemas anteriores (14, 15 y 16), podemos afirmar:
a) Que los resultados llevan al rechazo de H0, a un nivel de significación igual a 0,05, de
que las muestras proceden de dos poblaciones con medias iguales.
b) Que el resultado del contraste no apoya la hipótesis del investigador de que la amplitud
de apertura de piernas es distinta cuando en el programa de estiramiento se
introducen ejercicios de relajación que cuando no se introducen.
c) Que el grupo experimental obtuvo una amplitud media de apertura de piernas menor
que el grupo control, lo que indica, a nivel descriptivo, que la relajación no aumenta la
amplitud de apertura de piernas.
18. Queremos comparar el método tradicional (T) de la UNED con un método nuevo, en concreto,
un método multimedia (M), para la enseñanza a distancia de la estadística. Nuestra hipótesis es
que los alumnos que estudien con el método tradicional obtendrán unas notas inferiores a las
de los alumnos que estudien con el método multimedia. Extraemos aleatoria e
independientemente 7 alumnos del segundo curso de psicología de la UNED y les asignamos
también aleatoriamente a los dos métodos de enseñanza. Los datos que aparecen a
continuación representan las notas obtenidas en un examen de estadística en ambas muestras
de alumnos:
Método Tradicional (MT): 4 5 6 2
Método Multimedia (MM): 9 8 10
La nota en estadística es una variable medida a nivel de intervalo que se distribuye
normalmente en ambas poblaciones con varianzas: σ2T = 4 y σ2M = 2. N. c. 95%. Teniendo
en cuenta estos datos, ¿cuál será la formulación de las hipótesis estadísticas?:
a) H0: μT μM = 0 y H1: μT μM ≠ 0
b) H0: μT ≥ μM y H1: μT < μM
c) H0: μT = μM y H1: μT ≠ μM
19. Atendiendo a los datos del problema anterior, el valor del estadístico de contraste será:
a) Z = 2,28
b) t = 3,80
c) Z = 3,68
20. Continuando con los datos de los problemas anteriores, podemos afirmar que:
a) La probabilidad de obtener un valor del estadístico tal como el hallado, o uno menor, no
es nula, por lo tanto rechazamos H0.
b) A nivel poblacional, los alumnos que estudiaron con el método tradicional tienen una
nota media en estadística inferior a los que estudiaron con el método multimedia,
asumiendo un nivel de significación igual a 0,05.
c) Este resultado sugiere que el método multimedia es peor método de enseñanza que el
método tradicional.
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
21. Algunas variables ejercen su influencia sobre las conductas haciendo éstas más o menos
variables. Un investigador quiere investigar esta cuestión en la conducta afectiva de los niños.
Su hipótesis es que la conducta afectiva de los niños es menos variable que la de las niñas.
Extrae una muestra aleatoria de 41 niñas y otra de 31 niños y les mide la afectividad mediante
un cuestionario obteniendo una varianza insesgada igual a 9 en la muestra de niños y una de
36 en la muestra de niñas. La variable puntuación en el cuestionario de afectividad está medida
a nivel de intervalo. ¿cuál será el planteamiento de la hipótesis estadísticas? (N. c. 99%)
a) H0: μA ≥ μO y H1: μA < μO
b) H0: σ2A = σ2O y H1: σ2A ≠ σ2O
c) H0: σ2A ≤ σ2O ó H0: σ2A / σ2O ≤ 1 y H1: σ2A > σ2O ó H1: σ2A / σ2O > 1
22. El estadístico de contraste, atendiendo a los datos del problema anterior será:
a) Z = 5,28
b) t = 2,80
c) f = 4
23. La zona de rechazo de la hipótesis nula estará formada por todos los valores:
a) Todos los valores iguales y mayores que f0,99; 40, 30 = 2,30
b) Todos los valores iguales y menores que f0,99; 40, 30 = 2,30
c) Todos los valores iguales y mayores que f0,99; 41, 31 = 3,50
25. Se quiere comprobar el efecto de un método novedoso de aprendizaje en dos grupos de niños,
uno de 4 alumnos y otro de 3. Sabemos que el análisis estadístico ha aportado diferencias
significativas del efecto del nuevo método con respecto al tradicional. Sabemos que el grupo
de n=4 al que se le aplicó el método nuevo, obtuvo una media igual a 6 y una desviación típica
insesgada de 4, y que el grupo de n=3 al que se le aplicó el método tradicional obtuvo una
media de 5 y una desviación típica insesgada de 2. ¿Cuál será la magnitud del efecto del método
novedoso sobre el tradicional?
a) 0,78
b) 0,30
c) 0,29
26. Tras realizar análisis estadístico sobre dos muestras de 7 y 8 sujetos, los resultados apoyan la
hipótesis del investigador de que la relajación influye positivamente sobre la elasticidad en los
deportistas. Los resultados obtenidos son los siguientes:
Grupo 1: n=7 ȲR = 125,8 σ2R = 68,7 (Grupo con relajación)
Grupo 2: n=8 ȲNR=119,5 σ2NR =61,67 (Grupo sin relajación)
¿Cuál será la magnitud de la mejoría de la elasticidad tras aplicar la relación?:
a) 0,78
b) 0,27
c) 0,35
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
27. Un psicofísico hipotetiza que los hombres y las mujeres no son igualmente variables en
sensibilidad olfativa. Extrae una muestra aleatoria de 13 hombres (H) y otra de 25 mujeres (M)
y les mide la sensibilidad olfativa, obteniendo una varianza insesgada igual a 10 en la muestra
de hombres y de 17 en la de mujeres. La sensibilidad olfativa es una variable medida a nivel de
intervalo que se distribuye normalmente en ambas poblaciones. N. c. 90%. ¿Cuál será la
formulación de la hipótesis estadística?:
a) H0: μM ≥ μH y H1: μM < μH
b) H0: σ2M = σ2H ó H0: σ2M / σ2H = 1 y H1: σ2M ≠ σ2H ó H1: σ2M / σ2H ≠ 1
c) H0: σ2M ≤ σ2H ó H0: σ2M / σ2H ≤ 1 y H1: σ2M > σ2H ó H1: σ2M / σ2H > 1
28. La zona de aceptación de la hipótesis nula, teniendo en cuenta los datos del problema anterior,
está formada por todos los valores :
a) f0,05; 24, 12 = 0,46 < H0 < f0,95; 24, 12 = 2,51
b) f0,95; 24, 12 = 0,46 < H0 < f0,05; 24, 12 = 2,51
c) f0,05; 25, 13 = 0,46 < H0 < f0,95; 25, 13 = 2,51
29. El estadístico de contraste, atendiendo a los datos de los dos problemas anteriores será:
a) f = 2,58
b) t = 1,28
c) f = 1,70
30. atendiendo a los datos de los problemas anteriores, (27, 28, 29), ¿se rechaza la hipótesis nula?:
a) Sí, ya que el valor de nuestro estadístico de contraste no está dentro de la zona de
aceptación de H0.
b) No, ya que el valor del estadístico de contraste cae dentro de la zona de aceptación de la
hipótesis nula
c) No, ya que el valor del estadístico de contraste cae en la zona de aceptación de la
hipótesis alternativa.
31. Siguiendo con los problemas anteriores, ¿apoyan los resultados la hipótesis del investigador?:
a) No, ya que se acepta la hipótesis nula.
b) No, ya que no se acepta la hipótesis nula.
c) Sí, ya que se rechaza la hipótesis nula.
33. El estadístico de contraste, teniendo en cuenta los datos del problema anterior, será:
a) t = 2,48
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
b) f = 1,98
c) z = 1,47
35. Teniendo en cuenta los datos del problema anterior, se rechazará la hipótesis nula?:
a) No, porque p = 0,1416 > α = 0,01
b) Sí , porque p = 0,0002 < α = 0,01
d) No, porque p = 0,3214 < α = 0,01
36. Según los resultados de los problemas anteriores, a qué conclusiones llegaremos:
a) Con un α = 0,01, la proporción de nadadores que dicen sentirse muy cansados tras el
periodo de entrenamiento intenso no es la misma en la población experimental que en
la de control.
b) La relajación no ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.
c) La relajación ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.
37. Un investigador quiere estudiar el efecto de la privación de agua sobre el tiempo que tardan las
ratas en recorrer un laberinto. Extrae aleatoria e independientemente 60 ratas y les asigna
también aleatoriamente a las dos condiciones del experimento: 12 y 24 horas de privación de
agua. Las 30 ratas sometidas a 12 horas de privación de agua (muestra A) tardaron un tiempo
medio de 5,9 minutos en recorrer un laberinto y las 30 ratas sometidas a 24 horas de privación
(muestra B) tardaron 6,40 minutos en recorrer el mismo laberinto, siendo las desviaciones
típicas isesgadas 0,29 y 0,30 respectivamente. Sabiendo que el n. c. fijado por el investigador es
del 95%, cuál será el planteamiento de las hipótesis estadísticas:
a) H0: μA = μB ó μA μB = 0 y H1: μA ≠ μB ó μA μB ≠ 0
b) H0: μA < μB ó μA μB < 0 y H1: μA > μB ó μA μB >0
c) H0: μA ≥ μB ó μA μB ≥ 0 y H1: μA < μB ó μA μB <0
38. El estadístico de contraste atendiendo a los datos del problema anterior, será:
a) t = 5,32
b) t = 4,28
c) t = 6,58
2. Cuando hallamos los valores críticos del estadísticos T, para dos muestras relacionadas, con
más de 30 grados de libertad, acudimos a la tabla de distribución:
a) T de Student
b) X2 de Pearson
c) Normal.
4. Cuando hallamos los valores críticos del estadístico T, para dos muestras relacionadas, con
más de 30 grados de libertad, acudimos a la tabla de distribución:
a) Normal
b) T de Student
c) X2
6. Cuando se mida una variable en los dos miembros de n pares de sujetos siendo los miembros
de cada par muy similares en variables relevantes del estudio, asumiremos que las
observaciones de ambas muestras:
a) Están relacionadas pero ello no implica que las diferencias entre cada par de
observaciones lo estén.
b) Son independientes.
c) Están relacionadas, lo cual implica que las diferencias entre cada par de observaciones
también lo están.
7. Se desea estudiar si una terapia de relajación reduce el nivel de ansiedad. Se obtiene una
muestra aleatoria de 8 sujetos y se les toman medidas en ansiedad antes y después de
aplicarles la terapia. Sabemos que la variable está medida a nivel de intervalo y que la
distribución poblacional de las diferencias entre cada par de puntuaciones es simétrica en
torno a la medida de tendencia central. ¿Qué estadístico de contraste aplicaría?:
a) W de Wilcoxon
b) S de signos
c) T para dos muestras relacionadas.
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4
8. La prueba de Wilcoxon:
a) Tiene las mismas restricciones que la prueba de signos.
b) Presenta restricciones en cuanto a la distribución de la variable en la población y en el
nivel de medida de los datos.
c) No tiene restricciones.
10. Un investigador desea estudiar si un vídeo preelectoral aumenta el número de votos a favor de
cierto partido político en la población española. Extrae una muestra aleatoria de 250 españoles
que vieron el vídeo en televisión. Las respuestas (a favor o en contra) de los 250 españoles
antes y después de ver el vídeo aparecen a continuación: (N. c. 95%)
Antes ¿Cuál será el planteamiento de las
hipótesis estadísticas?:
A favor En Contra a) H0: πc ≤ πb y H1: πc > πb
b) H0: πc ≥ πb y H1: πc < πb
Después A favor 100 60
c) H0: πc = πb y H1: πc ≠ πb
En Contra 35 55
12. Atendiendo a los datos de los problemas anteriores, el valor del estadístico de contraste
empleado será:
a) t = 3,28
b) z = 2,56
c) z = 3,28
13. Atendiendo a los datos de los problemas anteriores, se aceptará la hipótesis alternativa?:
a) No, porque el valor del estadístico de contraste cae fuera de la zona de aceptación de la
hipótesis nula.
b) Sí, porque el valor del estadístico de contraste cae fuera de la zona de aceptación de la
hipótesis nula.
c) No, porque p > 0,005
14. La probabilidad asociada a nuestro estadístico de contraste será:
a) 0,0052
b) 0,052
c) 0,002
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4
15. Un investigador desea estudiar si una campaña informativa sobre los beneficios de la práctica
deportivo aumenta dicha práctica. Extrae una muestra aleatoria de 100 españoles. Las
respuestas de los 8 españoles antes y después de la campaña informativa a la pregunta “ ¿
practica algún tipo de deporte?”, aparecen a continuación:
Antes Si tenemos en cuenta un n. c. del 95%, ¿cuál será el planteamiento
de las hipótesis?:
Sí No a) H0: πc = πb y H1: πc ≠ πb
b) H0: πc ≥ πb y H1: πc < πb
Después Sí 44 37
c) H0: πc ≤ πb y H1: πc > πb
No 9 10
18. Atendiendo a los datos del problema anterior, ¿Se aceptará la hipótesis nula?:
a) No, ya que el valor del estadístico de contraste es mayor que p
b) No, ya que p < α
c) Sí, ya que p < α
20. Un investigador quiere estudiar la influencia de una terapia cognitiva sobre la agresividad.
Extrae una muestra aleatoria de 36 sujetos violentos y les mide la agresividad mediante un
cuestionario (medida pretest). Posteriormente, les trata durante 3 meses con la terapia
cognitiva, y vuelve a pasarles el cuestionario de agresividad (medida postest). En el pretest,
obtuvo una media igual a 38 y una varianza igual a 35. En el postest obtuvo una media de 30 y
una varianza igual a 35. La varianza muestral de las diferencias entre las medidas pre y postest
es igual a 18,56. La puntuación en el cuestionario de agresividad es una variable medida a nivel
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4
21 15
28 13
40 25
13 11
20 20
26 22
10 19
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4
28. Las conclusiones a las que llegaremos a través de los resultados obtenidos serán:
a) A un nivel de confianza del 95%, los datos no permiten rechazar la hipótesis nula de
que las medianas poblacionales son iguales.
b) En promedio, el umbral sensorial medido en la primera sesión es distinto de aquél
medido en la segunda sesión.
c) Los resultados apoyan la hipótesis del investigador.
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5
2. En el análisis de varianza:
a) A las variables independientes se las denomina factores y a las categorías en que se
dividen, niveles.
b) A las variables dependientes se las denomina niveles y a sus efectos, factores.
c) A las variables extrañas se las denomina factores y a sus categorías o dosis de
tratamiento, niveles.
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5
12. El que un modelo sea o no equilibrado cuando aplicamos el análisis de varianza, depende
de:
a) Que el muestreo sea aleatorio.
b) El número de elementos de las muestras
c) El número de variables independientes.
16. En el razonamiento del análisis de varianza se supone que dentro de un mismo nivel, las
puntaciones deberían ser:
a) Semejantes
b) Correlacionadas
c) Diferentes.
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5
18. Cuál será el resultado de nuestro estadístico atendiendo a los datos del problema 24?.
a) T= 11,36
b) F = 3,37
c) F= 11,36
19. Cuál será nuestro valor crítico, atendiendo a los datos del problema 24?
a) 3,007
b) 4,414
c) 5,978
20. A un n.c. del 95% aceptaríamos la Hipótesis alternativa?: (datos del problema 24)
a) Sí porque el valor del estadístico es mayor que nuestro valor crítico.
b) No porque el valor del estadístico es menor que nuestro valor crítico.
c) Sí porque el valor del estadístico es mayor que nuestro valor crítico.
21. Teniendo en cuenta los resultados obtenidos en los ejercicios anteriores (24 al 27), la
conclusión a la que hemos llegado es la siguiente:
a) Al no haber obtenido una diferencia significativa en nuestro estudio, se deduce que
el ambiente en el que se desarrolle un niño no influye en las puntuaciones
obtenidas en un test de inteligencia.
b) Al haber obtenido una diferencia significativa en nuestro estudio, se deduce que el
ambiente en el que se desarrolle un niño no influye en las puntuaciones obtenidas
en un test de inteligencia.
c) Al haber obtenido una diferencia significativa en nuestro estudio, se deduce que el
ambiente en el que se desarrolle un niño influye en las puntuaciones obtenidas en
un test de inteligencia.
22. Se quiere estudiar la incidencia del número de hijos en la intensidad del lazo afectivo de las
madres hacia sus hijos. Tras realizar el muestreo aleatorio apropiado, se obtuvieron tres
grupos de 5 unidades familiares compuestas de madre e hijos, donde el Grupo 1 estaba
compuesto por familias con un hijo, el Grupo 2 por familias con 2 hijos el Grupo 3 por
familias con 3 hijos. Se procuró que las relaciones existentes en las unidades familiares no
fueran patológicas. A continuación, se midió la intensidad del lazo afectivo delas madres
hacia sus hijos en una escala de intervalo, obteniendo las siguientes puntuaciones (a mayor
puntuación, mayor intensidad afectiva):
Grupo 1 Grupo 2 Grupo 3
10 4 9
9 5 10
7 6 8
8 7 7
10 4 6
Sabemos que todas las observaciones son independientes, varianzas homogéneas y las
distribuciones poblacionales normales. Tómese un α=0,05 .
Según los datos y conociendo SCtotal = 59,33 y SCinter = 35,73, el valor muestral del
estadístico de contraste es aproximadamente:
a) 13,21
b) 14,38
c) 9,07
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5
25. Sabiendo que, Ȳ1= 8,8, Ȳ2= 5,2 y Ȳ3= 8, indique la alternativa correcta a un n.c. del 95%
(según los datos del problema 29):
a) Podemos decir que existen diferencias significativas entre las medias de todas las
poblaciones
b) Podemos decir que existen diferencias significativas entre las medias de las
poblaciones 1 y 2.
c) Podemos decir que existen diferencias significativas entre las medias de las
poblaciones 1 y 2 y entre las medias de las poblaciones 2 y 3.
27. Las comparaciones múltiples a posteriori son aquellas que se realizan después de un
análisis de varianza:
a) Si F es significativa.
b) Si F no es significativa.
c) Si p > α
28. Las puntuaciones obtenidas en un test por dos grupos de 10 alumnos cada grupo. Calcule el
estadístico F del análisis de varianza entre los dos grupos, sabiendo que:
SCintra = 1379,6 y g.l. = 18 SCT = 2250,8
a) 11,36
b) 14,57
c) 12,87
30. Cuál será el valor crítico atendiendo a los datos del problema anterior?:
a) 4,25
b) 2,18
c) 3,35
31. La interpretación de los resultados es la siguiente:
a) A un nivel de confianza del 95% debemos considerar que los tratamientos
suministrados influyen de forma distinta.
b) A un nivel de confianza del 95% debemos considerar que los tratamientos
suministrados influyen de igual forma.
c) A un nivel de confianza del 95% aceptamos la hipótesis nula.
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5
32. Disponemos de tres grupos de sujetos, uno de niños, otro de niñas y un tercero de adultos.
Se les aplica un test que mide dependencia de campo y los resultados fueron:
Niños Niñas Adult.
6 9 8
5 8 10
6 8 8
4 5 3
3 10 7
5 7 6
4 6 7
4 8 9
5 8 8
Se desea saber si los tres grupos difieren en la variable estudiada y, en caso de que fuese así, si hay
diferencias debidas al género. Para ello, se aportan los siguientes datos:
SCinter = 46,625 y SCT = 104,5 n.c. del 95%.
Teniendo en cuenta estos datos, el valor del estadístico de contraste será:
a) 9,67
b) 8,795
c) 10,152
35. Ahora queremos calcular a qué es debida tal diferencia. Para el cálculo de las
comparaciones múltiples, aplicando la prueba de Scheffé, obtenemos un valor del C.R. de:
a) 0,452
b) 0,2585
c) 2,1748
36. Teniendo en cuenta este resultado, al comparar las medias, podemos concluir:
a) No existe diferencia significativa debida al género
b) Existe diferencia significativa debida al género.
c) No es posible realizar las comparaciones múltiples.
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 6
4. De una muestra de imágenes con el mismo número de puntos (es decir, del mismo tamaño), se
han escogido al azar ocho imágenes diferentes (tomadas en distintas escenas) y se las ha
procesado mediante cuatro algoritmos de emparejamiento (A, B, C, D), con el objeto de ver el
número de emparejamientos incorrectos (EI) que se producía con cada uno y así determinar la
eficacia relativa de los mismos. Teniendo en cuenta un n. c. del 99% y sabiendo que la suma de
cuadrados del tratamiento es 248,5, la suma de cuadrados error es 22 y la suma de cuadrados
total es 341,5, cuál será el valor del estadístico de contraste:
a) 82,833
b) 79,04
c) 64,78
5. El valor crítico obtenido, atendiendo a los datos del problema anterior, será:
a) 4,87
b) 5,54
c) 3,25
6. Con un nivel de confianza del 99% podemos afirmar (según los datos de los problemas 4 y 5):
a) Que todas las medias son iguales
b) Que no existen diferencias significativas entre al menos dos de los algoritmos en
número de emparejamientos incorrectos.
c) Que existen diferencias significativas entre al menos dos de los algoritmos en número
de emparejamientos incorrectos.
7. Se lleva a cabo una investigación para estudiar si las Técnicas de Inoculación de Estrés (TIE)
tienen efecto sobre la ansiedad precompetitiva de los corredores de velocidad. Para ello, se
seleccionaron aleatoriamente 12 atletas de entre todos aquéllos que puntuaron alto en una
batería de tests de ansiedad y se les enseñaron la TIE. Para estudiar el efecto de las TIE se
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 6
9. Atendiendo a los datos de los dos problemas anteriores, podemos concluir que:
a) Existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.
b) No existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.
c) Se acepta H0
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 7
TEMA 7 : Diseños con más de dos grupos independientes. Análisis de la varianza con dos
factores completamente aleatorizados
1. El laboratorio de aprendizaje animal dispone de doce ratas de una cierta raza, con las que
realiza un experimento. Posteriormente adquieren otro grupo de doce ratas (de otra raza) y,
tras la realización del mismo experimento, en las mismas condiciones, sospechan que los
resultados son diferentes según con qué grupo de ratas se realice la experiencia.
La prueba consistía en tomar los tiempos que tardaban en travesar un corredor con
recompensa final, después de 1, 2 ó 3 días de privación de comida.
La variable dependiente (tiempos) se distribuye normalmente, además, las observaciones son
independientes y las varianzas homogéneas. (n. c. 95%)
Teniendo en cuenta estos datos, cuál sería el valor crítico para el factor A (tipo de rata):
a) 4,41
b) 3,49
c) 3,55
5. Teniendo en cuenta las sumas de cuadrados anteriores, podemos concluir en cuanto al factor B
(tiempo de privación):
a) Es necesario realizar las comparaciones múltiples entre 1 y 3 días de privación
b) Se acepta la hipótesis nula, es decir, el estar privadas de alimento tiene efectos sobre el
resultado de las pruebas.
c) Estar privadas de comida 1, 2 ó 3 días influye de forma distinta.
9. Por otro lado, el valor del estadístico de contraste para la interacción sería:
a) 3,99
b) 5,40
c) 1,98
10. Tras realizar el cálculo de los estadísticos, podemos concluir, refiriéndonos al factor A:
a) Existen diferencias significativas entre las ratas.
b) No existen diferencias significativas entre las ratas
c) Aceptamos la hipótesis alternativa.
11. Del mismo modo, podemos concluir acerca del factor B (adiestramiento):
a) Existen diferencias significativas entre los adiestramientos
b) No existen diferencias significativas entre los adiestramientos.
c) Rechazamos la hipótesis nula.
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS
GRADO
Nº TM-1 TM-2 TM-3 TM-4 TM-5 TM-6 TM-7 TM-8 TM-9 TM-2 TM-1 Nº
1 A B B A C C A C A 47
2 C B C C A C B A C 48
3 C C A A B C C A 49
4 B A C A C B B A 50
5 C B A C B A C B 51
6 A A B A C C A B 52
7 A A A A A C C A 53
8 A C A B B B A C 54
9 C B A A C A A B 55
10 C A C B B B A 56
11 B B A B C B A 57
12 A A B B B C A 58
13 A A A B B C 59
14 B A C A A B 60
15 A B B B A A 61
16 C A A A A A 62
17 A B A C A B 63
18 C A B B C A 64
19 B C C A B A 65
20 C A B A A A 66
21 C A C C C B 67
22 B A C C C A 68
23 A C A B B A 69
24 B A B C B B 70
25 C C C B C A 71
26 B C A A B A 72
27 C B B C A 73
28 B A A A A 74
29 B B C B
30 A A B C
31 C A A A
32 C B A A
33 A C C C
34 A B C B
35 C A A A
36 C C B B
37 B C A
38 C A C
39 B A B
40 C B B
41 B C
42 B A
43 B C
44 C B
45 A B
46 A A
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2
5- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A) cuya
distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más estrecho
alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza toda la
Información muestral relacionada con el parámetro.
6- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un nivel
de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación; B)
aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.
9- En un contraste de hipótesis, la máxima diferencia que cabe esperar por simple azar entre el
valor teórico formulado en la hipótesis nula y el valor empírico obtenido a partir de los datos
de la muestra, recibe el nombre de: A) estadístico de contraste; B) valor crítico; C) nivel crítico.
10- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1; C) El nivel de confianza más nivel significación es igual a 1.
11- ¿Cuál de las siguientes afirmaciones es VERDADERA?: A) Potencia más nivel de confianza es
mayor o igual que uno; B) Error tipo I más error tipo II es igual a 1; C) Nivel de confianza más
nivel crítico p es igual a 1.
12- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula
que es verdadera, se llama: A) nivel crítico p; B) nivel de confianza; C) nivel de significación.
-1-
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2
14- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume como
provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los datos
obtenidos en la muestra.
15- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones;
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria
ordinaria.
17- ¿Cuál de las siguientes afirmaciones es VERDADERA? Desde un punto de vista conceptual, la
potencia de un contraste: A) es el complementario del nivel de confianza; B) disminuye
cuando aumenta el nivel de significación; C) es la sensibilidad de un experimento para
detectar una diferencia significativa cuando la hipótesis nula es falsa.
18- A partir de una población con media 80 y desviación típica 8 ¿Cuánto vale la media y la
desviación típica, respectivamente, de la distribución muestral de la media generada a partir
de muestras de tamaño n = 16?: A) 10 y 2; B) 80 y 2; C) 10 y 8.
19- Si la variable dependiente está medida a nivel ordinal; A) debemos utilizar un contraste no
paramétrico; B) debemos utilizar un contraste paramétrico; C) ninguna de las opciones
anteriores es correcta.
20- El nivel crítico p: A) depende del nivel de confianza; B) es una probabilidad asociada al
estadístico de contraste; C) lo multiplicamos por dos cuando el contraste es unilateral.
21- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
22- Si trabajamos con dos grupos, siendo los tamaños de las muestras: ,
sabemos que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C)
las muestras son independientes.
-2-
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2
23- Partiendo de una población con varianza desconocida, la distribución muestral de la media es
una distribución: A) T de Student con grados de libertad; B) normal; C) Ji-cuadrado con
grados de libertad.
24- El objetivo del análisis inferencial de los datos es: A) realizar un análisis descriptivo de los
datos de la investigación; B) inferir los estadísticos muestrales a partir de lo observado; C)
inferir los parámetros de la población a partir de la información proporcionada por la
muestra.
25- Bajo qué condiciones podemos asumir que la distribución muestral de la proporción es
normal: A) cuando la muestra es grande; B) cuando la variable es cuantitativa continua; C)
sólo cuando es normal la distribución de la variable en la población.
26- Se llama error típico de un estadístico a la desviación típica de: A) el parámetro poblacional; B)
la distribución muestral de este estadístico; C) los datos recogidos en la muestra.
-3-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2
5- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A) cuya
distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.
6- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un nivel
de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación; B)
aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.
9- En un contraste de hipótesis, la máxima diferencia que cabe esperar por simple azar entre el
valor teórico formulado en la hipótesis nula y el valor empírico obtenido a partir de los datos
de la muestra, recibe el nombre de: A) estadístico de contraste; B) valor crítico; C) nivel crítico.
10- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II
es siempre igual a 1; C) El nivel de confianza más nivel significación es igual a 1.
11- ¿Cuál de las siguientes afirmaciones es VERDADERA?: A) Potencia más nivel de confianza es
mayor o igual que uno; B) Error tipo I más error tipo II es igual a 1; C) Nivel de confianza más
nivel crítico p es igual a 1.
12- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula
que es verdadera, se llama: A) nivel crítico p; B) nivel de confianza; C) nivel de significación.
-1-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2
14- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume como
provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los datos
obtenidos en la muestra.
15- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones;
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria
ordinaria.
17- ¿Cuál de las siguientes afirmaciones es VERDADERA? Desde un punto de vista conceptual, la
potencia de un contraste: A) es el complementario del nivel de confianza; B) disminuye
cuando aumenta el nivel de significación; C) es la sensibilidad de un experimento para
detectar una diferencia significativa cuando la hipótesis nula es falsa.
18- A partir de una población con media 80 y desviación típica 8 ¿Cuánto vale la media y la
desviación típica, respectivamente, de la distribución muestral de la media generada a partir
de muestras de tamaño n = 16?: A) 10 y 2; B) 80 y 2; C) 10 y 8.
19- Si la variable dependiente está medida a nivel ordinal; A) debemos utilizar un contraste no
paramétrico; B) debemos utilizar un contraste paramétrico; C) ninguna de las opciones
anteriores es correcta.
20- El nivel crítico p: A) depende del nivel de confianza; B) es una probabilidad asociada al
estadístico de contraste; C) lo multiplicamos por dos cuando el contraste es unilateral.
21- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
22- Si trabajamos con dos grupos, siendo los tamaños de las muestras: ,
sabemos que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C)
las muestras son independientes.
-2-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2
23- Partiendo de una población con varianza desconocida, la distribución muestral de la media es
una distribución: A) T de Student con grados de libertad; B) normal; C) Ji-cuadrado con
grados de libertad.
24- El objetivo del análisis inferencial de los datos es: A) realizar un análisis descriptivo de los
datos de la investigación; B) inferir los estadísticos muestrales a partir de lo observado; C)
inferir los parámetros de la población a partir de la información proporcionada por la
muestra.
25- Bajo qué condiciones podemos asumir que la distribución muestral de la proporción es
normal: A) cuando la muestra es grande; B) cuando la variable es cuantitativa continua; C)
sólo cuando es normal la distribución de la variable en la población.
26- Se llama error típico de un estadístico a la desviación típica de: A) el parámetro poblacional;
B) la distribución muestral de este estadístico; C) los datos recogidos en la muestra.
-3-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
SITUACIÓN 1. Para contrastar la hipótesis de si la edad media de inicio en el consumo de alcohol de los
jóvenes de una determinada comunidad es más tardía que la media de la población general establecida
en 13 años, un investigador utiliza una muestra de 25 jóvenes encontrando que la edad media en su
comunidad es de 14 años con una desviación típica insesgada de 2,8. Asumimos que la variable edad de
inicio en el consumo de alcohol se distribuye normalmente en la población.
SITUACIÓN 2. La empresa SND's de sondeos electorales ha pronosticado que el nivel de apoyo que
recibirá el partido X en las próximas elecciones será del 40%. Desde el propio partido X se promueve un
nuevo sondeo con el fin de contrastar la veracidad de esta afirmación. Se elige al azar una muestra
aleatoria de 400 personas, con derecho a voto, de los cuales 128 manifiestan su intención de votar al
partido X.
-1-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
SITUACIÓN 3. “La formación alcanzada por la población adulta española ha mejorado, de forma
continua, en los últimos 10 años. Desde 1998 el porcentaje de españoles de 25 a 64 años que poseen
estudios superiores a los obligatorios ha pasado de 33% al 51% en 2008. En la misma proporción ha
disminuido, por tanto, el porcentaje de españoles que sólo poseen estudios obligatorios, que ha pasado
del 67% en 1998 al 49% en 2008” (Panorama de la Educación. Informe OCDE 2010). Suponga que usted
quiere estudiar si estos datos son los que realmente existen en su Comunidad, para lo que utiliza una
muestra aleatoria de 900 adultos con edades comprendidas entre 25 y 64 años, encontrando que 378
de ellos tienen solo los estudios obligatorios.
1. Si decide trabajar con un nivel de confianza del 95% y se establece el error máximo de estimación en
el 3%, ¿cuál debe ser el tamaño de la muestra?: A) 1040; B) 544; C) 789.
2. Trabajando con un nivel de confianza del 95%, el intervalo de confianza de la proporción de adultos
de su Comunidad que solo tienen estudios obligatorios, se encuentra entre: A) 0,378 y 0,462; B)
0,388 y 0,452; C) 0,376 y 0,461.
3. Si el investigador quiere confirmar que la proporción de adultos de su Comunidad que solo tienen los
estudios obligatorios es significativamente inferior que el indicador de España en 2008, la hipótesis
alternativa es: A) H1: π< 0,49; B) H1: π> 0,49; C) H1: π≤ 0,42.
4. Si el investigador cree que la proporción de adultos que solo tienen los estudios obligatorios es
inferior que el indicador de España en 2008, el estadístico de contraste y el nivel p-crítico para
analizar si la diferencia es estadísticamente significativa es: A) 3,34 (p=0,0008); B) -4,2 (p<0,0002); C)
-2,33 (p=0,0198).
SITUACIÓN 4. “En Educación Primaria, la media de alumnos por clase en los centros públicos de España
(19,7) es más baja que en la OCDE (21,6) y que en la Unión Europea (20,3). En los centros privados
ocurre lo contrario, pues la media en España es de 24,4 frente a 20,8 de media de la OCDE y 19,1 de la
UE”. (Panorama de la Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos
difieren significativamente de los que existen en su Comunidad. Asumiendo que la variable número de
alumnos por clase se distribuye normalmente, selecciona una muestra aleatoria de 100 aulas de
educación primaria en centros públicos, encontrando que la media de alumnos por clase es de 20,9 con
una desviación típica poblacional de 5,8.
1. Trabajando con un nivel de confianza del 95%, el intervalo de confianza para la media de alumnos
por clase en los centros públicos de su Comunidad es: A) 19,98; 21,8; B) 19,4; 22,39; C) 19,76; 22,04.
2. El procedimiento que aplicaría para contrastar si la media de los datos de su Comunidad es
significativamente menor que de la media de la OCDE es: A) la prueba t con n-1 grados de libertad; B)
la prueba z; C) la prueba de chi-cuadrado con n grados de libertad.
-2-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
3. Si se decide trabajar con un nivel de confianza del 95% y se establece un error máximo de estimación
en 1 punto, ¿Cuál debe ser el tamaño de la muestra? A) 129; B) 12923; C) 378.
4. El estadístico de contraste para analizar si la media de alumnos en los centros públicos de su
Comunidad es significativamente mayor que la media de España, toma el valor: A) 1,056; B) 1,261; C)
2,069.
5. Si sospecha que la media de los centros públicos de su Comunidad es significativamente mayor que
la media de España, el nivel p-crítico es: A) p=0,1446; B) p< 0,05; C) p=0,0192.
6. Teniendo en cuenta el estadístico de contraste obtenido ¿cuál de las siguientes sentencias es
verdadera?: A) no hay evidencia suficiente para rechazar que la media de alumnos por clase en los
colegios públicos de la Comunidad es igual a la media de España; B) La media de alumnos por clase
en los colegios públicos de la Comunidad es mayor que la media de España (NC= 95%); C)
rechazamos la hipótesis nula con un nivel de confianza del 99%.
7. Trabajando con un nivel de confianza del 95%, la interpretación del intervalo de confianza para la
media de alumnos por clase en los centros públicos de su Comunidad, le permite afirmar que la
media de su comunidad es: A) significativamente distinta que la de España pero igual que la de la UE;
B) significativamente distinta a la de la OCDE pero igual que la de España; C) significativamente
distinta que la de la UE pero igual que la de la OCDE.
SITUACIÓN 5. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en
estudiantes de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7%
éxtasis. Además, el inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más
tempranas. Así, mientras que en el año 2004 la edad media de inicio para la cocaína era de 15,9 años en
los hombres y 15,7 en las mujeres, en el año 2008 disminuyó a 15,3 años y 15,2, respectivamente
(ENCUESTA ESTATAL SOBRE USO DE DROGAS EN ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los
datos disponibles por un equipo de atención primaria que cubre a un determinado sector de su
municipio indican que en la muestra de 37 jóvenes varones y 41 mujeres atendidos el pasado año, el 8%
habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el consumo de cocaína de
15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 para los
hombres y 1,1 en las mujeres.
1. Bajo el supuesto de que la edad media de los hombres que han consumido cocaína al menos una vez,
es de 15,9 años, el error típico de la distribución muestral de la media es: A) 0,453; B) 0,2166; C)
0,334.
2. Si la hipótesis del investigador es que la edad media de inicio en el consumo de cocaína en los
hombres de su municipio ha disminuido significativamente respecto a los datos del 2004, el
estadístico de contraste es: A) -2,43; B) -2,7; C) -2,3.
3. A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95% ¿cuál es el
tamaño de la muestra necesario para estimar la proporción poblacional de jóvenes de su municipio
que han consumido cocaína al menos una vez con un error máximo de estimación del 2%?: A) 707; B)
1536; C) 978.
4. A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95%, ¿entre qué
valores se encontrará la proporción poblacional de jóvenes de su municipio que han consumido
cocaína al menos una vez?: A) 0,71; 0,88; B) 0,02; 0,14; C) 0,04; 0,12.
5. Con un nivel de confianza del 95%, el intervalo de confianza de la varianza poblacional de la edad de
las mujeres de su municipio que han consumido al menos una vez cocaína es: A) 0,83; 2,03; B) 0,89;
1,87; C) 0,95; 1,23.
-3-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
SITUACIÓN 6. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en
estudiantes de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7%
éxtasis. Además, el inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más
tempranas. Así, mientras que en el año 2004 la edad media de inicio para la cocaína era de 15,9 años en
los hombres y 15,7 en las mujeres, en el año 2008 disminuyó a 15,3 años y 15,2, respectivamente
(ENCUESTA ESTATAL SOBRE EL USO DE DROGAS EN ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los
datos disponibles por un equipo de atención primaria que cubre un determinado sector de su municipio
indican que con 41 jóvenes varones y 51 mujeres atendidos el pasado año, el 8% habían consumido
cocaína, al menos un vez, siendo la edad media de inicio en el consumo de cocaína de 15,4 años en los
hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 años y 1,1 años,
respectivamente.
1. Bajo el supuesto de que el 8% de los jóvenes ha consumido cocaína al menos una vez, el error típico
de la distribución muestral de la proporción es: A) 0,901; B) 0,0282; C) 0,0417.
2. Para comprobar si la edad media del inicio en el consumo de cocaína ha disminuido respecto a los
datos del 2004, el estadístico de contraste que aplicaría, es: A) Z porque utilizamos una muestra
grande proveniente de una variable que se distribuye normalmente en la población; B) T porque
desconocemos la varianza y la forma de la distribución poblacional; C) El intervalo de confianza
porque proporciona más información sobre la seguridad al tomar una decisión.
3. Si fijamos un nivel de confianza del 95%, ¿entre qué valores se encontrará la edad media del
consumo de cocaína en las mujeres de su municipio?: A) 14,887; 15,512; B) 14,941; 15,962; C)
14,682; 15,621.
4. Si su hipótesis es que la edad media del inicio en el consumo de cocaína en los hombres de su
municipio ha disminuido respecto a los datos de 2004, el valor del estadístico de contraste que
obtiene es: A) 2,34; B) -3,11; C) -2,43.
5. Si desea contrastar la hipótesis de que la varianza poblacional en la edad de inicio del consumo de
cocaína en los hombres de su municipio es significativamente mayor que 1,1 el nivel crítico p que
obtiene para tomar una decisión respecto a la Ho, es: A) p> 0,10; B) p< 0,025; C) p< 0,01.
-4-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
1. Con un nivel de confianza del 95%, el tamaño de la muestra necesario para que el error de
estimación de la media en la escala de Identificación ideológica no supere 0,2 puntos, es: a) 150; b)
102; c) 138.
2. Con un nivel de confianza del 95%, el intervalo de confianza aproximado para la media en la escala
de identificación ideológica de los residentes en su localidad es: A) 4,98; 5,82; B) 5,03; 5,76; C) 4,952;
5,847.
3. De acuerdo a los objetivos del psicólogo, la hipótesis nula es: A) ; B) ; C)
4. El procedimiento que aplicaría para probar la hipótesis del psicólogo, es: A) la Prueba Z; B) la prueba t
con n-1 grados de libertad; C) la prueba Chi cuadrado con n-1 grados de libertad.
5. El estadístico de contraste para la hipótesis del psicólogo es: A) 2,352; B) 1,697; C) 2,5.
Si el psicólogo fija un nivel de significación de 0,05 el valor crítico para tomar una decisión respecto a
la hipótesis nula es: A) 1, 697; B) 1,96; C) 2,042.
6. Bajo el supuesto de que la H0 es verdadera, la probabilidad de obtener una muestra con una media
tan alejada o más de 5,39 es: A) p > 0,10; B) p < 0,001; C) p < 0,02.
7. Con los datos originales obtenidos en nuestra muestra, la decisión que toma respecto a la hipótesis
nula es: A) Rechazarla porque, bajo el supuesto de que fuera cierta, la probabilidad de obtener una
muestra con una media de 5,40 o superior es muy pequeña; B) Mantenerla porque el valor absoluto
del estadístico de contraste es menor que el valor absoluto del valor crítico; C) No se puede rechazar
la hipótesis nula.
SITUACIÓN 8. El “Síndrome Jubilación” es la situación que experimentan ciertas personas ante esta
nueva etapa vital con manifestaciones somáticas, psíquicas y sociales negativas que afectan la calidad de
vida del jubilado. Un estudio publicado por el GIE (Grupo de Investigación del Envejecimiento) mediante
una encuesta realizada en el 2006 utilizando una muestra de jubilados con edad media de 77,6 años y
desviación típica de 8,79 años encuentra que las manifestaciones psíquicas más frecuentes eran la
ansiedad (82%), el pesimismo (13,3%) y la depresión (4,7%) y que para el 32% de los expertos
consultados el apoyo psicológico constituye la estrategia de intervención más adecuada para superar
estos estados. Suponga que usted quiere estudiar la situación de los jubilados de su localidad respecto a
este "síndrome", para lo que utiliza una muestra aleatoria de 362 jubilados, con una edad media de 71,2
años y una desviación típica de 12,5 y de los cuales, el 59,8% presenta signos de ansiedad, el 35%
pesimismo y el 5,2% depresión.
1. Utilizando los datos del GIE y con un nivel de confianza del 95%: si le dicen que el intervalo de
confianza de la proporción de jubilados con manifestaciones de depresión, es un valor comprendido
entre 0,0387 (3,87%) y 0,0553 (5,53%), ¿Cuál es el tamaño más aproximado de la muestra que se ha
utilizado?: A) 1348; B) 2500; C) 3481.
2. Utilizando los datos de su estudio y con un nivel de confianza del 95%, la edad media de los jubilados
de su localidad es un valor comprendido, aproximadamente, entre: A) 69,9 y 72,5 años; B) 69,5 y 72,9
años; C) 70,2 y 73,1 años.
3. Con los datos de su estudio y un nivel de confianza del 99%, el intervalo de confianza para la
proporción de jubilados con manifestaciones psíquicas de ansiedad, es: A) 0,557 y 0,639; B) 0,547 y
0,648; C) 0,531 y 0,664.
-5-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
SITUACIÓN 9. El barómetro del CIS de marzo de 2012 realizado en 240 municipios de 48 provincias
señalaba que el 23,4% estaba en situación de paro y de éstos, a la pregunta ¿Y cree Ud. que es muy
probable, bastante, poco o nada probable que durante los próximos doce meses encuentre Ud. trabajo?,
el 22,6% manifestaba que “bastante probable”, frente al 43,1% que creía que “poco probable” y el
19,2% que “nada probable” y el resto “NS/NC”. Suponga que quiere estudiar si estos resultados se
reproducen actualmente en su localidad, para lo que realiza una encuesta sobre una muestra de 100
personas en situación de paro con una edad media de 39 años y desviación típica de 8,6 años de los
cuales 25 le responden que “bastante probable”, 35 responden que “poco probable” y 20 que “nada
probable” mientras que el resto “no saben o no contestan”.
1. Trabajando con un nivel de confianza del 95% y apoyándose en la distribución chi-cuadrado, el
intervalo de confianza de la varianza de la edad de las personas en situación de paro de su localidad
es un valor comprendido entre: A) 57,08 y 99,65; B) 6,64 y 11,59; C) 59,48 y 100,01.
Con los datos de su encuesta desea comprobar que la proporción de personas en paro que
consideran “poco probable” encontrar trabajo en los próximos doce meses en su localidad es
significativamente menor que el valor 43,1% proporcionados en el estudio del CIS:
-6-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
SITUACIÓN 10. Un psicólogo que investiga la percepción del tiempo, considera que dicha
habilidad se encuentra deteriorada en los fumadores durante la retirada de nicotina, para lo
que toma una muestra aleatoria de 41 fumadores a los que somete a una abstinencia de
tabaco con una duración de 24 horas, pidiéndoles que estimen el tiempo transcurrido (en
segundos) en un periodo que, objetivamente, fue de 45 segundos. La media aritmética de la
muestra fue igual a 51 segundos con una cuasivarianza igual a 164. El psicólogo desea
determinar si la abstinencia tiene un impacto negativo sobre la percepción temporal,
provocando que el tiempo se sobre-estime. Nivel de confianza 95%.
-7-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
SITUACIÓN 1. Para contrastar la hipótesis de si la edad media de inicio en el consumo de alcohol de los jóvenes
de una determinada comunidad es más tardía que la media de la población general establecida en 13 años, un
investigador utiliza una muestra de 25 jóvenes encontrando que la edad media en su comunidad es de 14 años
con una desviación típica insesgada de 2,8. Asumimos que la variable edad de inicio en el consumo de alcohol
se distribuye normalmente en la población.
1. A partir de la información de la muestra utilizada el intervalo de confianza más aproximado para la varianza
poblacional con un nivel de confianza del 95% es: A) 5,70; 14,41; B) 4,77; 15,17; C) 5,23; 15,13.
El intervalo de confianza para la varianza poblacional viene dado por la siguiente expresión:
2
(𝑛 − 1)𝑆𝑛−1 2
(𝑛 − 1)𝑆𝑛−1
2 < 𝜎2 <
𝜒1− 𝛼⁄ 𝜒𝛼2⁄
2 2
2
(𝑛 − 1)𝑆𝑛−1 2
(𝑛 − 1)𝑆𝑛−1
2
2 < 𝜎 < 2
𝜒0,975 𝜒0,025
24 ∙ 2,82 2
24 ∙ 2,82
<𝜎 < → (4,77 < 𝜎 2 < 15,17)
39,3641 12,4012
2. La hipótesis nula para contrastar la hipótesis sobre la edad media en el consumo de alcohol es: A)
𝑯𝟎 : 𝝁 ≤ 𝟏𝟑; B) 𝐻0 : 𝜇 = 13; C) 𝐻0 : 𝜇 ≥ 13
3. Con los datos de la situación 1, el estadístico de contraste para poner a prueba la media es: A) 2,102; B) 1,78;
C) 1,59.
𝑌̅ − 𝜇0 14 − 13
𝑇= = = 1,786
𝑆𝑛−1 2,8
⁄ ⁄
√𝑛 √25
4. Conforme a los objetivos del investigador y un “alfa”= 0’05, la máxima diferencia que puede producirse por
simple azar, si 𝐻0 es cierta, entre la media observada en la muestra y la media planteada en la hipótesis nula,
expresado en unidades de desviación típica es: A) 2,064; B) 1,711; C) 2,79.
Nos piden el valor crítico. El contraste de hipótesis es unilateral derecho, luego tenemos que buscar en la
tabla “t” de Student para 24 grados de libertad (𝑛 − 1), la puntuación que supera una proporción igual a
0’95. La respuesta correcta es “B”.
5. La interpretación de los resultados obtenidos es que la edad media de inicio en el consumo de alcohol de los
jóvenes de la comunidad: A) es más tardía que la media general con un nivel de confianza del 95%; B) es
más tardía que la media general con un nivel de confianza del 99%; C) no es más tardía que la media general
con un nivel de confianza del 95%.
-1-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
SITUACIÓN 2: La empresa SND's de sondeos electorales ha pronosticado que el nivel de apoyo que recibirá el
partido X en las próximas elecciones será del 40%. Desde el propio partido X se promueve un nuevo sondeo con
el fin de contrastar la veracidad de esta afirmación. Se elige al azar una muestra aleatoria de 400 personas, con
derecho a voto, de los cuales 128 manifiestan su intención de votar al partido X.
1- Con un nivel de confianza del 95%, el Intervalo de confianza aproximado de la proporción de personas que
votarán al partido X, es: A) 0,2743; 0,3657; B) 0,352; 0,424; C) 0,318; 0,322.
128
La proporción en la muestra es: 𝑝 = 400 = 0,32
Al nivel de confianza del 95%, las puntuaciones típicas son: ±1,96
𝑝(1 − 𝑝)
𝑝 ± 𝑍𝛼⁄2 √
𝑛
0,32(1 − 0,32)
0,32 ± 1,96√ → (0,2743; 0,3657)
400
El contraste es bilateral porque el enunciado no especifica si el partido X espera unos resultados inferiores o
superiores a los obtenidos por la empresas SND’s. Simplemente, el partido X pretende contrastar la veracidad
de los datos pronosticados por SND’s.
𝑝 − 𝜋0 0,32 − 0,40
𝑍= = = −3,266
√𝜋0 (1 − 𝜋0 ) √0,40 ∙ 0,60
𝑛 400
4- Con un nivel de confianza del 99%, si los dirigentes del partido X considerasen que Ia proporción de apoyos
no alcanza el valor pronosticado por la empresa SND's, el valor crítico para rechazar la hipótesis nula, es: A)
-2,58; B) 1,64; C) -2,33.
Marcamos como correctas las opciones A y C, porque esta pregunta puede plantear problemas de
interpretación.
Si nos ceñimos al enunciado planteado para esta situación, el contraste es bilateral. Es decir, inicialmente el
partido X no sabe si el nivel de apoyo que recibirá será superior o inferior al pronosticado por la empresa
SND’s, pero “después” de realizar el estudio, observa que la proporción es inferior a 0,40. En este caso el
valor crítico es -2,58.
Por otro lado, podríamos interpretar que “antes” de realizar el estudio, el partido X considera que la
proporción de apoyos será inferior a la proporción pronosticada por SND’s, por lo que el contraste sería
unilateral y por lo tanto la respuesta correcta sería C.
-2-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
5- Para un contraste bilateral con un nivel de significación de 0,01, la conclusión es: A) Rechazar la hipótesis
nula con un nivel de significación del 0,01; B) No hay evidencias para rechazar la hipótesis nula con un nivel
de significación 0,05; C) No hay evidencias para rechazar la hipótesis nula con un nivel de significación 0,01.
Rechazamos la hipótesis nula al nivel de confianza del 99% porque el estadístico de contraste es menor que el
valor crítico (−3,266 < −2,58), luego la opción A es correcta, siendo las opciones B y C claramente
incorrectas.
SITUACIÓN 3: “La formación alcanzada por la población adulta española ha mejorado, de forma continua, en los
últimos 10 años. Desde 1998 el porcentaje de españoles de 25 a 64 años que poseen estudios superiores a los
obligatorios ha pasado de 33% al 51% en 2008. En la misma proporción ha disminuido, por tanto, el porcentaje
de españoles que sólo poseen estudios obligatorios, que ha pasado del 67% en 1998 al 49% en 2008”
(Panorama de la Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos son los que
realmente existen en su Comunidad, para lo que utiliza una muestra aleatoria de 900 adultos con edades
comprendidas entre 25 y 64 años, encontrando que 378 de ellos tienen solo los estudios obligatorios.
1- Si decide trabajar con un nivel de confianza del 95% y se establece el error máximo de estimación en el 3%,
¿cuál debe ser el tamaño de la muestra?: A) 1040; B) 544; C) 789.
2
𝑍1− 𝛼⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) = 0,42 ∙ 0,58 ∙ = 1039,79 ≈ 1040
𝐸2 0,032
2- Trabajando con un nivel de confianza del 95%, el intervalo de confianza de la proporción de adultos de su
Comunidad que solo tienen estudios obligatorios, se encuentra entre: A) 0,378 y 0,462; B) 0,388 y 0,452; C)
0,376 y 0,461.
3- Si el investigador quiere confirmar que la proporción de adultos de su Comunidad que solo tienen los
estudios obligatorios es significativamente inferior que el indicador de España en 2008, la hipótesis
alternativa es: A) 𝑯𝟏 : 𝝅 < 𝟎, 𝟒𝟗; B) 𝐻1 : 𝜋 > 0,49; C) 𝐻1 : 𝜋 ≤ 0,42.
La respuesta correcta es “A”, puesto que las hipótesis que debemos plantear son:
𝐻0 : 𝜋 ≥ 0,49
𝐻1 : 𝜋 < 0,49
-3-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
4- Si el investigador cree que la proporción de adultos que solo tienen los estudios obligatorios es inferior que
el indicador de España en 2008, el estadístico de contraste y el nivel crítico p para analizar si la diferencia es
estadísticamente significativa es: A) 3,34 (p=0,0008); B) -4,2 (p<0,0002); C) -2,33 (p=0,0198);
5- Respecto a la hipótesis del investigador analizada en las preguntas anteriores, el investigador concluye que
la proporción de adultos que solo tienen estudios obligatorios en su Comunidad, es: A) inferior a la del
resto de España con un nivel de significación de 0,01; B) la misma que la del resto de España con un nivel
de significación de 0,05; C) superior a la del resto de España con un nivel de significación de 0,01.
SITUACIÓN 4. “En Educación Primaria, la media de alumnos por clase en los centros públicos de España (19,7)
es más baja que en la OCDE (21,6) y que en la Unión Europea (20,3). En los centros privados ocurre lo contrario,
pues la media en España es de 24,4 frente a 20,8 de media de la OCDE y 19,1 de la UE”. (Panorama de la
Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos difieren significativamente
de los que existen en su Comunidad. Asumiendo que la variable número de alumnos por clase se distribuye
normalmente, selecciona una muestra aleatoria de 100 aulas de educación primaria en centros públicos,
encontrando que la media de alumnos por clase es de 20,9 con una desviación típica poblacional de 5,8.
1- Trabajando con un nivel de confianza del 95%, el intervalo de confianza para la media de alumnos por clase
en los centros públicos de su Comunidad es: A) 19,98; 21,8; B) 19,4; 22,39; C) 19,76; 22,04.
5,8
20,9 ± 1,96 → (19,76; 22,04)
√100
2- El procedimiento que aplicaría para contrastar si la media de los datos de su Comunidad es
significativamente menor que de la media de la OCDE es: A) la prueba t con n-1 grados de libertad; B) la
prueba z; C) la prueba de chi-cuadrado con n grados de libertad.
3- Si se decide trabajar con un nivel de confianza del 95% y se establece un error máximo de estimación en 1
punto, ¿Cuál debe ser el tamaño de la muestra? A) 129; B) 12923; C) 378.
2
(𝑍1−𝛼⁄2 ) 1,962
𝑛 = 𝜎2 = 5,82 = 129,23 ≈ 129
𝐸2 12
-4-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
4- El estadístico de contraste para analizar si la media de alumnos en los centros públicos de su Comunidad es
significativamente mayor que la media de España, toma el valor: A) 1,056; B) 1,261; C) 2,069.
𝑌̅ − 𝜇0 20,9 − 19,7
𝑍= 𝜎 = = 2,069 ≈ 2,07
⁄ 𝑛 5,8⁄
√ 10
5- Si sospecha que la media de los centros públicos de su Comunidad es significativamente mayor que la media
de España, el nivel crítico p es: A) p=0,1446; B) p< 0,05; C) p=0,0192.
Acudiendo a la tabla de curva normal, deducimos que la probabilidad de obtener valores iguales o más
extremos que el estadístico de contraste (2,07) es 0,0192, luego la respuesta correcta es C.
6- Teniendo en cuenta el estadístico de contraste obtenido ¿cuál de las siguientes sentencias es verdadera?: A)
no hay evidencia suficiente para rechazar que la media de alumnos por clase en los colegios públicos de la
Comunidad es igual a la media de España; B) La media de alumnos por clase en los colegios públicos de la
Comunidad es mayor que la media de España (NC= 95%); C) rechazamos la hipótesis nula con un nivel de
confianza del 99%.
Los resultados obtenidos son significativos a un nivel de confianza del 95% (2,069 > 1,64), pero no a un nivel
de confianza del 99% (2,069 < 2,33) luego la respuesta correcta es B.
7- Trabajando con un nivel de confianza del 95%, la interpretación del intervalo de confianza para la media de
alumnos por clase en los centros públicos de su Comunidad, le permite afirmar que la media de su
comunidad es: A) significativamente distinta que la de España pero igual que la de la UE; B)
significativamente distinta a la de la OCDE pero igual que la de España; C) significativamente distinta que la
de la UE pero igual que la de la OCDE.
El intervalo de confianza (19,76; 22,04) incluye a la media de la OCDE (21,6) y la media de la UE (20,3), pero
no incluye la media de España (19,7). Luego la respuesta correcta es A.
SITUACIÓN 5. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en estudiantes
de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7% éxtasis. Además, el
inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más tempranas. Así, mientras que en el
año 2004 la edad media de inicio para la cocaína era de 15,9 años en los hombres y 15,7 en las mujeres, en el
año 2008 disminuyó a 15,3 años y 15,2, respectivamente (ENCUESTA ESTATAL SOBRE USO DE DROGAS EN
ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los datos disponibles por un equipo de atención primaria que
cubre a un determinado sector de su municipio indican que en la muestra de 37 jóvenes varones y 41 mujeres
atendidos el pasado año, el 8% habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el
consumo de cocaína de 15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3
para los hombres y 1,1 en las mujeres.
-5-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
1- Bajo el supuesto de que la edad media de los hombres que han consumido cocaína al menos una vez, es de
15,9 años, el error típico de la distribución muestral de la media es: A) 0,453; B) 0,2166; C) 0,334.
En el caso de los hombres, el error típico de la distribución cuando no conocemos la varianza poblacional
viene dado por:
𝑆𝑛 1,3
= = 0,2167
√𝑛 − 1 √37 − 1
2- Si la hipótesis del investigador es que la edad media de inicio en el consumo de cocaína en los hombres de
su municipio ha disminuido significativamente respecto a los datos del 2004, el estadístico de contraste es:
A) -2,43; B) -2,7; C) -2,3.
Contraste unilateral de medias para una muestra (varones) varianza poblacional desconocida:
𝑌̅ − 𝜇0 15,4 − 15,9
𝑇= = = −2,31
𝑆𝑛 1,3
√𝑛 − 1 √37 − 1
3- A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95% ¿cuál es el tamaño de
la muestra necesario para estimar la proporción poblacional de jóvenes de su municipio que han consumido
cocaína al menos una vez con un error máximo de estimación del 2%?: A) 707; B) 1536; C) 978.
2
𝑧1− 𝛼⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) 2 = 0,08 ∙ (1 − 0,08) = 706,85 ≈ 707
𝐸𝑚𝑎𝑥 0,022
4- A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95%, ¿entre qué valores se
encontrará la proporción poblacional de jóvenes de su municipio que han consumido cocaína al menos una
vez?: A) 0,71; 0,88; B) 0,02; 0,14; C) 0,04; 0,12.
5- Con un nivel de confianza del 95%, el intervalo de confianza de la varianza poblacional de la edad de las
mujeres de su municipio que han consumido al menos una vez cocaína es: A) 0,83; 2,03; B) 0,89; 1,87; C)
0,95; 1,23.
-6-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
6- Si desea contrastar la hipótesis de que la varianza poblacional de la edad de las mujeres de su municipio es
mayor que 1, el nivel crítico p que obtiene para tomar una decisión respecto a la 𝐻0 , es: A) p > 0,10; B) p <
0,05; C) p > 0,01.
𝑛𝑆𝑛2 41 ∙ 1,12
𝜒2 = 2 = = 49,61
𝜎0 1
Buscando en la Tabla de Chi-cuadrado observamos que para 40 grados de libertad, el valor 49,61 se
encuentra entre las puntuaciones:
29,05 que deja por encima de sí el 0,90 de la distribución
51,80 que deja por encima de sí el 0,10 de la distribución.
Luego sabemos que 49,61 deja por encima una proporción superior a 0,10.
SITUACIÓN 6. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en estudiantes
de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7% éxtasis. Además, el
inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más tempranas. Así, mientras que en el
año 2004 la edad media de inicio para la cocaína era de 15,9 años en los hombres y 15,7 en las mujeres, en el
año 2008 disminuyó a 15,3 años y 15,2, respectivamente (ENCUESTA ESTATAL SOBRE EL USO DE DROGAS EN
ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los datos disponibles por un equipo de atención primaria que
cubre un determinado sector de su municipio indican que con 41 jóvenes varones y 51 mujeres atendidos el
pasado año, el 8% habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el consumo de
cocaína de 15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 años y 1,1
años, respectivamente.
1. Bajo el supuesto de que el 8% de los jóvenes ha consumido cocaína al menos una vez, el error típico de la
distribución muestral de la proporción es: A) 0,901; B) 0,0282; C) 0,0417.
2. Para comprobar si la edad media del inicio en el consumo de cocaína ha disminuido respecto a los datos del
2004, el estadístico de contraste que aplicaría, es: A) Z porque utilizamos una muestra grande proveniente
de una variable que se distribuye normalmente en la población; B) T porque desconocemos la varianza y la
forma de la distribución poblacional; C) El intervalo de confianza porque proporciona más información
sobre la seguridad al tomar una decisión.
-7-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
3. Si fijamos un nivel de confianza del 95%, ¿entre qué valores se encontrará la edad media del consumo de
cocaína en las mujeres de su municipio?: A) 14,887; 15,512; B) 14,941; 15,962; C) 14,682; 15,621.
Nos están pidiendo el intervalo de confianza (con 𝛼 = 0,05) para la edad media del consumo de cocaína en
las mujeres. Este viene dada por las fórmulas:
𝑆𝑛−1 1,1
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 2,009 = 0,3125
√𝑛 √51 − 1
15,5125
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 15,2 ± 0,3125 → {
14,8875
4. Si su hipótesis es que la edad media del inicio en el consumo de cocaína en los hombres de su municipio ha
disminuido respecto a los datos de 2004, el valor del estadístico de contraste que obtiene es: A) 2,34; B) -
3,11; C) -2,43.
𝑌̅ − 𝜇0 15,4 − 15,9
𝑇= = = −2,4325
𝑆𝑛 1,3
√𝑛 − 1 √41 − 1
5. Si desea contrastar la hipótesis de que la varianza poblacional en la edad de inicio del consumo de cocaína
en los hombres de su municipio es significativamente mayor que 1,1 el nivel crítico p que obtiene para tomar
una decisión respecto a la 𝐻0 , es: A) p> 0,10; B) p< 0,025; C) p< 0,01.
En las tablas (𝑔. 𝑙. = 𝑛 − 1 = 40) no podemos encontrar el valor exacto, pero observamos que el estadístico
de contraste (62,99) se encuentra entre las puntuaciones 59,3417 y 63,6907 que dejan por encima de sí,
respectivamente unas probabilidades iguales a 0,025 y 0,01, luego la opción correcta es B.
SITUACIÓN 7. El Centro de Investigaciones Sociológicas (CIS) realiza constantes estudios sobre la ideología e
intención de voto de los españoles. Uno de los ítems que incluye en sus cuestionarios es el de la “identificación
ideológica”, para lo que se le pide al entrevistado que se ubique ideológicamente en una escala de 1 a 10
(donde 1 significa extrema izquierda y 10 extrema derecha). En su última encuesta a la población española la
media aritmética obtenida para la variable identificación ideológica fue de un 4,86. Un psicólogo social
interesado en estudiar esta temática en su localidad selecciona una muestra aleatoria formada por 31 sujetos a
los que aplica el ítem de identificación ideológica, obteniendo una media de 5,40 y una cuasi-desviación típica
de 1,2. Con esta información, responda a las siguientes preguntas:
-8-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
1- Con un nivel de confianza del 95%, el tamaño de la muestra necesario para que el error de estimación de la
media en la escala de Identificación ideológica no supere 0,2 puntos, es: A) 150; B) 102; C) 138.
2
𝑡𝑛−1;1− 𝛼⁄ 2,0422
2 2
𝑛= 𝑆𝑛−1 2 = 1,22 = 150,11 ≈ 150
𝐸𝑚𝑎𝑥 0,22
2- Con un nivel de confianza del 95%, el intervalo de confianza aproximado para la media en la escala de
identificación ideológica de los residentes en su localidad es: A) 4,98; 5,82; B) 5,03; 5,76; C) 4,952; 5,847.
𝑆𝑛−1 1,2
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 2,042 = 0,44
√𝑛 √31
5,84
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 5,40 ± 0,44 → {
4,96
3- De acuerdo a los objetivos del psicólogo, la hipótesis nula es: A) 𝑯𝟎 : 𝝁 = 𝟒, 𝟖𝟔; B) 𝐻0 : 𝜇 ≥ 4,86; C)
𝐻0 : 𝜇 ≤ 4,86
El contraste es bilateral, porque el psicólogo no parte de una hipótesis previa sobre los resultados de la
muestra.
4- El procedimiento que aplicaría para probar la hipótesis del psicólogo, es: A) la Prueba Z; B) la prueba t con
𝒏 − 𝟏 grados de libertad; C) la prueba Chi cuadrado con 𝑛 − 1 grados de libertad.
Tenemos un contraste sobre una media con una muestra de 31 sujetos y de la población no conocemos la
varianza.
5- El estadístico de contraste para la hipótesis del psicólogo es: A) 2,352; B) 1,697; C) 2,5.
𝑌̅ − 𝜇0 5,40 − 4,86
𝑇= = = 2,51
𝑆𝑛−1 1,2
√𝑛 √31
6- Si el psicólogo fija un nivel de significación de 0,05 el valor crítico para tomar una decisión respecto a la
hipótesis nula es: A) 1, 697; B) 1,96; C) 2,042.
7- Bajo el supuesto de que la 𝐻0 es verdadera, la probabilidad de obtener una muestra con una media tan
alejada o más de 5,39 es: A) p > 0,10; B) p < 0,001; C) p < 0,02.
El valor en las tablas más próximo al estadístico de contraste (𝑇 = 2,51) corresponde a la puntuación 2,457,
que deja por debajo de sí una proporción igual a 0,990 (1 − 0,990 = 0,01 por encima). Como el contraste
es bilateral, se multiplica por dos la probabilidad obtenida en la tabla.
-9-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
8- Con los datos originales obtenidos en nuestra muestra, la decisión que toma respecto a la hipótesis nula es:
A) Rechazarla porque, bajo el supuesto de que fuera cierta, la probabilidad de obtener una muestra con
una media de 5,40 o superior es muy pequeña; B) Mantenerla porque el valor absoluto del estadístico de
contraste es menor que el valor absoluto del valor crítico; C) No se puede rechazar la hipótesis nula.
SITUACIÓN 8: El “Síndrome Jubilación” es la situación que experimentan ciertas personas ante esta nueva etapa
vital con manifestaciones somáticas, psíquicas y sociales negativas que afectan la calidad de vida del jubilado.
Un estudio publicado por el GIE (Grupo de Investigación del Envejecimiento) mediante una encuesta realizada
en el 2006 utilizando una muestra de jubilados con edad media de 77,6 años y desviación típica de 8,79 años
encuentra que las manifestaciones psíquicas más frecuentes eran la ansiedad (82%), el pesimismo (13,3%) y la
depresión (4,7%) y que para el 32% de los expertos consultados el apoyo psicológico constituye la estrategia de
intervención más adecuada para superar estos estados. Suponga que usted quiere estudiar la situación de los
jubilados de su localidad respecto a este "síndrome", para lo que utiliza una muestra aleatoria de 362 jubilados,
con una edad media de 71,2 años y una desviación típica de 12,5 y de los cuales, el 59,8% presenta signos de
ansiedad, el 35% pesimismo y el 5,2% depresión.
1- Utilizando los datos del GIE y con un nivel de confianza del 95%: si le dicen que el intervalo de confianza de
la proporción de jubilados con manifestaciones de depresión, es un valor comprendido entre 0,0387 (3,87%)
y 0,0553 (5,53%), ¿Cuál es el tamaño más aproximado de la muestra que se ha utilizado?: A) 1348; B) 2500;
C) 3481.
Conociendo los límites superior e inferior del intervalo de confianza, deducimos fácilmente el error máximo:
𝑙𝑖 = 𝑝 − 𝐸 𝑙𝑠 − 𝑙𝑖 0,0553 − 0,0387
}→𝐸= = = 0,0083
𝑙𝑠 = 𝑝 + 𝐸 2 2
El tamaño de la muestra será igual a:
𝑧𝛼2⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) = 0,047(1 − 0,047) = 2497,73 ≈ 2500
𝐸2 0,00832
2- Utilizando los datos de su estudio y con un nivel de confianza del 95%, la edad media de los jubilados de su
localidad es un valor comprendido, aproximadamente, entre: A) 69,9 y 72,5 años; B) 69,5 y 72,9 años; C)
70,2 y 73,1 años.
12,5
71,2 ± 1,96 → 71,2 ± 1,29 → (69,91; 72,49)
√362 − 1
-10-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
3- Con los datos de su estudio y un nivel de confianza del 99%, el intervalo de confianza para la proporción de
jubilados con manifestaciones psíquicas de ansiedad, es: A) 0,557 y 0,639; B) 0,547 y 0,648; C) 0,531 y 0,664.
0,598(1 − 0,598)
0,598 ± 2,58√ → (0,5315; 0,6645)
362
𝑝 − 𝜋0 0,35 − 0,133
𝐻0 : 𝜋 ≤ 0,133 𝑧= = = 12,158
𝐻1 : 𝜋 > 0,133 √𝜋0 (1 − 𝜋0 ) √0,133(1 − 0,133)
𝑛 362
El estadístico de contraste es un valor muy extremo (z = 12,158). El valor máximo que podemos consultar en
las tablas de curva normal es z = 3,59, que deja por encima de sí una proporción: p = 0,0002
SITUACIÓN 9: El barómetro del CIS de marzo de 2012 realizado en 240 municipios de 48 provincias señalaba
que el 23,4% estaba en situación de paro y de éstos, a la pregunta ¿Y cree Ud. que es muy probable, bastante,
poco o nada probable que durante los próximos doce meses encuentre Ud. trabajo?, el 22,6% manifestaba que
“bastante probable”, frente al 43,1% que creía que “poco probable” y el 19,2% que “nada probable” y el resto
“NS/NC”. Suponga que quiere estudiar si estos resultados se reproducen actualmente en su localidad, para lo
que realiza una encuesta sobre una muestra de 100 personas en situación de paro con una edad media de 39
años y desviación típica de 8,6 años de los cuales 25 le responden que “bastante probable”, 35 responden que
“poco probable” y 20 que “nada probable” mientras que el resto “no saben o no contestan”.
-11-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
1- Trabajando con un nivel de confianza del 95% y apoyándose en la distribución chi-cuadrado, el intervalo de
confianza de la varianza de la edad de las personas en situación de paro de su localidad es un valor
comprendido entre: A) 57,08 y 99,65; B) 6,64 y 11,59; C) 59,48 y 100,01.
Con los datos de su encuesta desea comprobar que la proporción de personas en paro que consideran “poco
probable” encontrar trabajo en los próximos doce meses en su localidad es significativamente menor que el valor
43,1% proporcionados en el estudio del CIS:
0,55(1 − 0,55)
0,55 ± 1,96√ → (0,4525; 0,6475)
100
8- Si desea contrastar la hipótesis nula de que la edad media de los parados de su localidad es menor de 40
años, el estadístico de contraste que utilizaría es: A) Z por tratarse de una variable cuantitativa con
distribución normal; B) t por tratarse de una variable normalmente distribuida; C) t por tratarse de una
variable cuantitativa con varianza desconocida en la población.
-12-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
SITUACIÓN 10. Un psicólogo que investiga la percepción del tiempo, considera que dicha habilidad se
encuentra deteriorada en los fumadores durante la retirada de nicotina, para lo que toma una muestra
aleatoria de 41 fumadores a los que somete a una abstinencia de tabaco con una duración de 24 horas,
pidiéndoles que estimen el tiempo había transcurrido (en segundos) en un periodo que, objetivamente, fue
de 45 segundos. La media aritmética de la muestra fue igual a 51 segundos con una cuasivarianza igual a
164. El psicólogo desea determinar si la abstinencia tiene un impacto negativo sobre la percepción temporal,
provocando que el tiempo se sobre-estime. Nivel de confianza 95%.
Dado que el psicólogo desea comprobar si el tiempo se sobre-estima, hemos de plantear un contraste
unilateral derecho, cuyas hipótesis son:
𝐻0 : 𝜇 ≤ 45
𝐻1 : 𝜇 > 45
𝑌̅ − 𝜇0 51 − 45
𝑇= = =3
𝑆𝑛−1 164
√
√𝑛 41
4- Con los datos recogidos, se rechaza la hipótesis nula: A) Sí, porque el estadístico de contraste es superior al
valor crítico; B) Sí, porque el nivel de significación es menor que el nivel crítico; C) No, porque el estadístico
de contraste es menor que el valor crítico.
5- ¿Es significativo el estadístico de contraste?: A) No; B) Si para un nivel de confianza del 95%, pero no a un
nivel de confianza del 99%; C) Es significativo a un nivel de confianza del 99%.
El estadístico de contraste (𝑇 = 3) supera un nivel de confianza del 95% (3 > 1,684), pero también supera
un nivel de confianza del 99% (3 > 2,423), luego la respuesta correcta es C.
6- ¿Cuál es el valor del nivel crítico p?: A) 0,005; B) menor que 0,005; C) 0,005 < p < 0,01.
El valor más extremo que podemos consultar en las tablas t de Student, para 40 grados de libertad, es 2,704,
que deja por encima de sí una probabilidad igual a: 0,005, luego el estadístico de contraste (𝑇 = 3) que es
todavía más extremo, dejará por encima de sí una probabilidad menor que 0,005
7- Si hemos realizado un estudio donde el nivel crítico ha sido superior a α. A) Mantenemos la hipótesis nula;
B) Rechazamos la hipótesis nula; C) No tenemos información para mantener o rechazar la hipótesis nula.
8- La probabilidad de mantener 𝐻0 falsa se denomina: A) nivel de significación; B) error de tipo II; C) potencia
del contraste.
La probabilidad pedida es el error de tipo II, que también podemos definir como la probabilidad de rechazar
𝐻1 verdadera.
9- Un estadístico cuyo valor medio es igual al valor de esta característica en la población, se dice que es; A)
eficiente; B) suficiente; C) insesgado.
-13-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
10- Dados varios estadísticos insesgados para estimar la misma característica poblacional, la mejor elección es
utilizar el estadístico: A) con la desviación típica mas grande; B) con la desviación típica más pequeña; C) con
la media mas grande.
La respuesta correcta es B, puesto que el estimador con la desviación típica más pequeña es el más eficiente.
-14-
Diseños de experimentos y análisis de datos. Enunciados de preguntas teóricas temas 3 y 4
2- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
3- Si trabajamos con dos grupos siendo los tamaños de las muestras: n1 = 30 y n2 =35, sabemos
que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C) las
muestras son independientes.
7- En un contraste sobre dos proporciones con muestras relacionadas, cuál de los siguientes
estadísticos es insensible a la dirección del cambio producido: A) Chi cuadrado de la prueba de
McNemar; B) el estadístico Z; C) no es correcta ninguna de las opciones anteriores.
8- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
-1-
Diseños de experimentos y análisis de datos. Preguntas teóricas temas 3 y 4
2- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
3- Si trabajamos con dos grupos siendo los tamaños de las muestras: n1 = 30 y n2 =35, sabemos
que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C) las
muestras son independientes.
7- En un contraste sobre dos proporciones con muestras relacionadas, cuál de los siguientes
estadísticos es insensible a la dirección del cambio producido: A) Chi cuadrado de la prueba de
McNemar; B) el estadístico Z; C) no es correcta ninguna de las opciones anteriores.
8- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
SITUACIÓN 1. Se pretende comprobar si los profesionales que llevan menos de cinco años en una empresa
(Grupo 1) poseen mayores aspiraciones que las personas que llevan cinco o más años (Grupo 2). Para ello se
entrevista a 32 personas que llevan menos de cinco años y a otras 32 personas que llevan cinco o más años,
todas ellas elegidas al azar. Los resultados mostraron que dentro del primer grupo se identificó a 18 personas
con altas aspiraciones, mientras que en el segundo grupo se identificaron a 14 personas con altas aspiraciones.
Nivel de confianza 95%.
5- La decisión correcta es: A) Rechazar la hipótesis nula porque el nivel crítico p es menor que el nivel de
significación; B) Mantener la hipótesis nula porque el estadístico de contraste es menor que el valor crítico;
C) ninguna de las anteriores es correcta.
6- A un nivel de confianza del 95% concluimos que: A) los profesionales que llevan menos de cinco años
trabajando poseen mayores aspiraciones que el grupo que lleva trabajando 5 o más años; B) los
profesionales que llevan 5 o más años trabajando poseen mayores aspiraciones que el grupo que lleva
menos de 5 años; C) no existen diferencias en cuanto a las aspiraciones profesionales entre los dos grupos.
SITUACIÓN 2. En un estudio cuyo objeto es evaluar el efecto de la música clásica sobre la capacidad de
concentración disponemos de 62 sujetos con los que formamos de manera aleatoria dos grupos de 31 sujetos
cada uno. Al primero de ellos (Grupo 1) se le sometió a una prueba de concentración escuchando música clásica
y al segundo (Grupo 2) se le sometió a la misma prueba en condiciones normales de silencio. La puntuación
media para el Grupo 1 fue de 86 puntos con una cuasivarianza igual a 150. El Grupo 2 obtuvo una media
aritmética igual a 80 puntos y una cuasivarianza igual a 129. Sabiendo que la variable dependiente está medida
en una escala de intervalo, asumiendo varianzas poblacionales iguales y con un nivel de confianza del 9S%
¿podemos afirmar que la media en concentración es superior para el grupo que escuchó música clásica?
5- El nivel crítico p es igual a: A) entre 0,05 y 0,10; B) entre 0,05 y 0,95; C) 0,025.
6- Rechazamos la hipótesis nula porque: A) el nivel de significación es menor que el nivel crítico p; B) el
estadístico de contraste es mayor que el valor crítico; C) no rechazamos la hipótesis nula.
-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
SITUACIÓN 3: En una tarea sobre decisión léxica con estímulos visuales en la que se miden tiempos de reacción,
un investigador dispone de una muestra aleatoria de 26 sujetos. Utiliza dos grupos de palabras y parte de la
hipótesis de que los tiempos de reacción serán más cortos ante palabras de alta frecuencia léxica (aquellas que
utilizamos más frecuentemente en el lenguaje, Grupo 1) que ante palabras de baja frecuencia léxica (Grupo 2).
Tras realizar el experimento observa que el tiempo de reacción medio para el Grupo 1 fue igual a 612,04 ms,
mientras que para el Grupo 2 fue igual a 645 ms, siendo la cuasivarianza de las diferencias igual a 6656 ms 2.
Asumiendo que se cumplen los supuestos para realizar un contraste paramétrico, conteste a las siguientes
cuestiones:
5- Para un nivel de confianza del 95%, el valor absoluto del valor crítico es: A) 1,708; B) 2,06; C) 2,485.
SITUACIÓN 4: Para comparar la eficacia de dos terapias (“A” y “B”) utilizadas para tratar el trastorno de
personalidad “X”, se toma una muestra aleatoria de 400 personas que sufren el trastorno “X”, formándose dos
grupos al azar de 200 personas cada uno. Al primer grupo se le aplica la terapia “A”, siendo 172 personas las
que se recuperan, mientras que al aplicar la terapia “B” se recuperan 148 personas. Con un nivel de confianza
del 95%, ¿son las dos terapias igualmente eficaces?
5- Rechazamos la hipótesis nula porque: A) El valor absoluto del estadístico de contraste es superior al valor
absoluto del valor crítico; B) el nivel de significación es menor que el nivel de confianza; C) el nivel crítico p es
menor que el nivel de confianza.
6- ¿Se desprende de los resultados obtenidos que las dos terapias son igualmente eficaces? A) Si, porque
hemos aceptado la hipótesis alternativa; B) No, porque los resultados no son significativos; C) No, porque el
valor del estadístico de contraste es estadísticamente significativo.
7- Indique para qué niveles de confianza obtendremos resultados significativos: A) 95% y 99%; B) 99% y 99,9%;
C) para cualquier nivel de confianza.
-2-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
SITUACIÓN 5: En una tarea de reconocimiento de palabras, un investigador mantiene la hipótesis de que los
estudiantes de carreras de “letras” tardarán menos que los estudiantes de “ciencias” en reconocer los estímulos
presentados. Tras seleccionar dos muestras aleatorias de 31 observaciones cada una, y registrar el tiempo de
reacción, obtiene una media aritmética igual a 653,2 ms para el grupo de estudiantes de ciencias (Grupo 1) y de
600 ms para el grupo de estudiantes de letras (Grupo 2), siendo la cuasivarianza igual en ambas muestras, con
un valor de 6200 ms2. Con un nivel de confianza del 95%, conteste a las siguientes cuestiones:
1- Si queremos comprobar si las varianzas de ambas poblaciones son iguales o diferentes, observaremos que el
valor del estadístico de contraste: A) no es significativo; B) es significativo; C) es significativo al nivel de
confianza del 95%, pero no al 99%.
7- Aceptamos la hipótesis alternativa porque: A) el valor del estadístico de contraste es menor que el nivel
crítico p; B) el nivel crítico p es menor que el nivel de significación; C) el nivel crítico p es mayor que el valor
crítico.
8- ¿Podemos concluir que los resultados obtenidos avalan la hipótesis del investigador? A) Si; B) No; C) los
resultados son significativos al nivel de confianza del 95%, pero no del 99%.
SITUACIÓN 6. En un estudio piloto para un nuevo tratamiento contra el SIDA (Thompson, 1991), se midieron
diversas variables en 27 pacientes con SIDA. Entre ellas el número de células T-4 sanguíneas al inicio del
tratamiento y 90 días más tarde. Los resultados fueron: 𝑌̅0 𝑑𝑖𝑎𝑠 = 324; 𝑌̅90 𝑑𝑖𝑎𝑠 = 334,4. Por estudios
anteriores se sabe que la varianza poblacional de las diferencias en el contaje de células T-4 vale 150.
Asumiendo un nivel de confianza del 95%, conteste a las siguientes cuestiones:
1- Se trata de un diseño: A) de dos grupos dependientes; B) de más de dos grupos dependientes; C) de dos
grupos independientes.
2- La hipótesis nula en el caso de las medias es: A) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 = 𝜇90 𝑑𝑖𝑎𝑠 ; B) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 ≥ 𝜇90 𝑑𝑖𝑎𝑠 ; C)
𝐻0 : 𝜋0 𝑑𝑖𝑎𝑠 ≤ 𝜋90 𝑑𝑖𝑎𝑠
3- El valor del estadístico de contraste para comprobar si al inicio del tratamiento los sujetos tienen el mismo
número de células T-4 que al final del mismo es igual a: A) 1,045; B) -4,41; C) 1,841.
4- Los valores críticos que delimitan la zona de aceptación de 𝐻0 son: A) −1,05 𝑦 1,05; B) −1,96 𝑦 1,96; C)
−1,65 𝑦 1,65.
-3-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
5- El investigador: A) acepta 𝐻0 ya que el intervalo de confianza de la media incluye la media de las diferencias
entre ambas muestras; B) rechaza 𝐻0 porque la Z calculada es inferior al valor crítico; C) rechaza 𝐻1 ya que el
estadístico de contraste calculado se encuentra en la zona de rechazo.
6- Si el investigador hubiera vuelto a realizar una nueva medición del número de células T-4 180 días después
de iniciado el tratamiento, deberíamos aplicar como técnica de análisis: A) un ANOVA de medidas
independientes de un factor; B) un ANOVA de dos factores con interacción; C) un ANOVA de medidas
repetidas de un factor con tres niveles.
SITUACIÓN 7. Un psicólogo, sospecha que los alumnos de cuarto de grado (Grupo 1) presentan una media
superior y más variabilidad que los alumnos de primer curso de grado (Grupo 2) en la variable “autoestima”.
Para comprobar estas hipótesis selecciona dos muestras aleatorias de igual tamaño (𝑛1 = 𝑛2 = 31) a las que
aplica un test de autoestima. Los resultados fueron: 𝑌̅1 = 22,16, 𝑆̂12 = 76,42 para el Grupo 1 y 𝑌̅2 = 20,07,
𝑆̂22 = 47,58 para el Grupo 2. Asumiendo un nivel de confianza del 95% conteste a las siguientes cuestiones:
𝜎2 𝜎2 𝜎2
1- La hipótesis nula en el caso de las varianzas es: A) 𝐻0 : 𝜎12 = 1; B) 𝐻0 : 𝜎12 ≤ 1; C) B) 𝐻0 : 𝜎12 ≥ 1
2 2 2
2- El valor del estadístico de contraste para comprobar si los sujetos del Grupo 1 presentan más variabilidad
que los sujetos del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,841.
3- Asumiendo igualdad de varianzas poblacionales, el valor del estadístico de contraste para comprobar si la
media del Grupo 1 es superior a la media del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,671.
4- El nivel crítico en el caso del contraste sobre las varianzas es igual a: A) 0,05; B) 0,10; C) 0,15.
5- El nivel crítico en el caso del contraste sobre las medias es igual a: A) 0,05; B) 0,10; C) 0,15.
6- El tamaño del efecto en el caso del contraste sobre medias es igual a: A) 1,045; B) 0,265; C) 0,15.
7- Nuestro psicólogo mantiene la hipótesis nula: A) Para el contraste de las varianzas pero no para el contraste
de medias; B) Para el contraste de medias pero no para el contraste de varianzas; C) En ambos casos, tanto
en el caso de las medias, como en el caso de las varianzas.
SITUACIÓN 8: El equipo docente de una determinada asignatura quiere comprobar la eficacia de un material
docente nuevo respecto al utilizado en convocatorias anteriores. Selecciona una muestra aleatoria de 64
alumnos, con los que forma dos grupos de igual tamaño también al azar. A los sujetos del Grupo 1 les
proporciona en nuevo material, mientras que los del Grupo 2 trabajan con el material antiguo. El equipo
docente tiene la hipótesis de que con el nuevo material las notas serán más elevadas. Tras el examen de fin de
curso los alumnos del Grupo 1 obtienen una nota media igual a 7, con una cuasivarianza igual a 15, mientras
que para el Grupo 2 la media es igual a 5,2 y la cuasivarianza igual a 17.
1- Si con un nivel de confianza del 95% realizamos un contraste de hipótesis para comprobar si las varianzas
poblacionales son iguales o diferentes, aceptaremos: A) la hipótesis nula; B) la hipótesis alternativa; C) No
podemos saber qué cuasivarianza hay que poner en el numerador del estadístico de contraste.
2- Si realizamos un contraste de hipótesis sobre las medias para comprobar la hipótesis del equipo docente, el
estadístico de contraste vale: A) 2; B) 1,8; C) 1,67.
-4-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
4- Con un nivel de confianza del 95%, suponiendo que la hipótesis nula sobre el contraste de medias es cierta,
la probabilidad de obtener un valor igual o superior al estadístico de contraste que hemos obtenido: A) se
encuentra comprendida entre 0,01 y 0,025; B) se encuentra comprendida entre 0,025 y 0,05; C) es igual a
0,05.
5- Si trabajamos con un nivel de confianza del 95%, la probabilidad de rechazar la hipótesis nula suponiendo
que es cierta es igual a: A) se encuentra comprendida entre 0,01 y 0,025; B) es igual a 0,05; C) es igual a 0,95.
6- Tomando de las tablas el valor más próximo para los grados de libertad, el intervalo de confianza para la
diferencia de medias, para un nivel de confianza del 95% viene definido por los valores: A) 0,2 𝑦 3,8; B)
−0,2 𝑦 − 3,8; C) −0,2 𝑦 3,8.
7- El estadístico de contraste obtenido para contrastar la hipótesis del equipo docente: A) no es significativo; B)
Es significativo al nivel de confianza del 99%; C) es significativo al nivel de confianza del 95%.
SITUACIÓN 9: Un psicólogo imparte una conferencia a una muestra de 200 fumadores en la que les expone un
tratamiento para abandonar este hábito. También pregunta a los sujetos, antes y después de la conferencia,
que cuantifiquen en una escala de 0 a 10 si se sienten capaces de dejar de fumar tras recibir el tratamiento,
donde el cero indicaría que no se sienten capaces de ninguna forma y 10 que lo lograrán con absoluta certeza.
Antes de la conferencia, la mitad de los sujetos de la muestra están dispuestos a seguir el tratamiento. Tras la
conferencia, encuentra que 80 personas que estaban dispuestas a seguir la terapia mantienen la idea de
hacerlo, y que otras 80 personas que no estaban dispuestas a seguir la terapia han cambiado de opinión. El
psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia sea mayor tras la
conferencia. Respecto a la pregunta que plantea el psicólogo a los sujetos, se encuentra que aquellos que no se
sentían capaces de dejar de fumar antes de la conferencia obtienen una media superior después de la
conferencia, siendo dicha media un punto superior a la media antes de la conferencia y la cuasidesviación típica
de las diferencias es igual a 5. Con un nivel de confianza del 95%.
1- El valor absoluto del estadístico de contraste “Z” para comprobar la hipótesis del psicólogo es igual a: A)
1,64; B) 2,33; C) 6.
2- Si la hipótesis nula es cierta, la probabilidad de obtener un estadístico de contraste igual o más extremo que
el obtenido: A) es igual a 0,05; B) es igual a 0,95; C) es menor que 0,0002.
3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,64; B) 1,96; C) 2,33.
4- La hipótesis que antes de la conferencia tenía el psicólogo: A) queda confirmada porque mantenemos la
hipótesis nula; B) queda confirmada porque el nivel crítico es menor que el error de tipo I; C) queda
confirmada porque el nivel crítico es mayor que el valor crítico.
Si queremos comprobar que la media de los sujetos que inicialmente no están dispuestos a seguir el
tratamiento es superior después de la conferencia, y con un nivel de confianza del 95%:
-5-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
6- Si realmente no existen diferencias entre las medias antes y después, la probabilidad del obtener un
estadístico de contraste igual o más extremo que el que proporcionan los datos vale: A) entre 0,10 y 0,05; B)
entre 0,01 y 0,025; C) 0,05.
8- Podemos afirmar que los sujetos que inicialmente no están dispuestos a seguir el tratamiento inicialmente,
se sienten más seguros de poder dejar de fumar tras la conferencia del psicólogo. A) Sí, porque el nivel
crítico es inferior al nivel de significación; B) Sí, porque el nivel crítico es inferior al nivel de confianza; C) No,
los resultados no son significativos.
SITUACIÓN 10. Un partido político X elabora un vídeo pre-electoral con la intención de incrementar el número
de votos en las siguientes elecciones. Extrae una muestra aleatoria de 200 personas a las que muestra el
vídeo. Antes de verlo 120 personas declararon que no votarían al partido X, 60 de las cuales cambiaron de
opinión tras ver el vídeo, siendo 136 sujetos en total los que manifestaron su intención de votar al partido X
después de ver el vídeo. Con un nivel de confianza del 95%.
2- El valor del estadístico de contrate Chi cuadrado es igual a ; A) 10,24; B) 49; C) 1,96.
4- El valor crítico para el estadístico Chi cuadrado es; A) 5,0239; B) 2,7055; C) 3,8415.
5- El nivel crítico es: A) mayor que 0,001; B) menor que 0,005; C) igual a 0,05.
7- A la vista de los resultados, el partido X determina que: A) El vídeo resulta efectivo porque incrementa el
número de votantes del partido X; B) El vídeo no resulta efectivo porque hay pocas personas que cambian
de opinión a favor del partido X; C) El vídeo no resulta efectivo porque se rechaza la hipótesis nula.
8- Si la magnitud del efecto es pequeña: A) la diferencia entre dos medias nunca es significativa; B) la
diferencia entre dos medias siempre es significativa; C) la diferencia entre dos medias puede ser
significativa.
-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
SITUACIÓN 1. Se pretende comprobar si los profesionales que llevan menos de cinco años en una empresa
(Grupo 1) poseen mayores aspiraciones que las personas que llevan cinco o más años (Grupo 2). Para ello se
entrevista a 32 personas que llevan menos de cinco años y a otras 32 personas que llevan cinco o más años,
todas ellas elegidas al azar. Los resultados mostraron que dentro del primer grupo se identificó a 18 personas
con altas aspiraciones, mientras que en el segundo grupo se identificaron a 14 personas con altas aspiraciones.
Nivel de confianza 95%.
𝑝1 − 𝑝2 𝑛1 𝑝1 + 𝑛2 𝑝2
𝑍= 𝑠𝑖𝑒𝑛𝑑𝑜 𝑃=
1 1 𝑛1 + 𝑛2
√𝑃(1 − 𝑃) ( + )
𝑛1 𝑛2
Primero calculamos P
18 + 14
𝑃= = 0,5
32 + 32
Finalmente:
18 14
𝑍=
𝑝1 − 𝑝2
= 32 − 32 =
0,5625 − 0,4375
=1
1 1 0,125
√𝑃(1 − 𝑃) ( + ) √0,50(1 − 0,50) ( 1 + 1 )
𝑛1 𝑛2 32 32
Acudiendo a la tabla de curva normal, observamos que la probabilidad de encontrar valores superiores a una
puntuación típica igual a 1 es 0’1587.
5- La decisión correcta es: A) Rechazar la hipótesis nula porque el nivel crítico p es menor que el nivel de
significación; B) Mantener la hipótesis nula porque el estadístico de contraste es menor que el valor
crítico; C) ninguna de las anteriores es correcta.
6- A un nivel de confianza del 95% concluimos que: A) los profesionales que llevan menos de cinco años
trabajando poseen mayores aspiraciones que el grupo que lleva trabajando 5 o más años; B) los
profesionales que llevan 5 o más años trabajando poseen mayores aspiraciones que el grupo que lleva
menos de 5 años; C) no existen diferencias en cuanto a las aspiraciones profesionales entre los dos grupos.
SITUACIÓN 2. En un estudio cuyo objeto es evaluar el efecto de la música clásica sobre la capacidad de
concentración disponemos de 62 sujetos con los que formamos de manera aleatoria dos grupos de 31 sujetos
cada uno. Al primero de ellos (Grupo 1) se le sometió a una prueba de concentración escuchando música clásica
y al segundo (Grupo 2) se le sometió a la misma prueba en condiciones normales de silencio. La puntuación
media para el Grupo 1 fue de 86 puntos con una cuasivarianza igual a 150. El Grupo 2 obtuvo una media
aritmética igual a 80 puntos y una cuasivarianza igual a 129. Sabiendo que la variable dependiente está medida
en una escala de intervalo, asumiendo varianzas poblacionales iguales y con un nivel de confianza del 9S%
¿podemos afirmar que la media en concentración es superior para el grupo que escuchó música clásica?
-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
Queremos comprobar si la media es superior para el Grupo 1 (música clásica) que para el Grupo 2 (silencio),
luego la hipótesis alternativa es 𝐻1 : 𝜇1 − 𝜇2 > 0. La hipótesis nula, por lo tanto, es la especificada en la
opción A.
𝑌̅1 − 𝑌̅2 86 − 80
𝑇= = =2
(𝑛1 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 1 1 √30 ∙ 150 + 30 ∙ 129 ( 1 + 1 )
√ ( + ) 31 + 31 − 2 31 31
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2
𝑌̅1 − 𝑌̅2 86 − 80
𝐷= = = 0,508
(𝑛1 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 √30 ∙ 150 + 30 ∙ 129
√ 31 + 31 − 2
𝑛1 + 𝑛2 − 2
El contraste es unilateral derecho. Buscando en las tablas T de Student para 60 grados de libertad
(𝑛1 + 𝑛2 − 2 = 60) la puntuación que supera una proporción igual a 0,95, comprobamos que la respuesta
correcta es A.
5- El nivel crítico p es igual a: A) entre 0,05 y 0,10; B) entre 0,05 y 0,95; C) 0,025.
6- Rechazamos la hipótesis nula porque: A) el nivel de significación es menor que el nivel crítico p; B) el
estadístico de contraste es mayor que el valor crítico; C) no rechazamos la hipótesis nula.
Claramente la opción correcta es B. La opción A es falsa porque si el nivel de significación es menor que el
nivel crítico mantenemos la hipótesis nula.
SITUACIÓN 3: En una tarea sobre decisión léxica con estímulos visuales en la que se miden tiempos de reacción,
un investigador dispone de una muestra aleatoria de 26 sujetos. Utiliza dos grupos de palabras y parte de la
hipótesis de que los tiempos de reacción serán más cortos ante palabras de alta frecuencia léxica (aquellas que
utilizamos más frecuentemente en el lenguaje, Grupo 1) que ante palabras de baja frecuencia léxica (Grupo 2).
Tras realizar el experimento observa que el tiempo de reacción medio para el Grupo 1 fue igual a 612,04 ms,
mientras que para el Grupo 2 fue igual a 645 ms, siendo la cuasivarianza de las diferencias igual a 6656 ms 2.
Asumiendo que se cumplen los supuestos para realizar un contraste paramétrico, conteste a las siguientes
cuestiones:
-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
La respuesta correcta es “A”, debemos de plantear un contraste de hipótesis sobre dos medias para dos
muestras relacionadas, siendo las hipótesis:
𝐻0 : 𝜇1 − 𝜇2 ≥ 0
𝐻1 : 𝜇1 − 𝜇2 < 0
5- Para un nivel de confianza del 95%, el valor absoluto del valor crítico es: A) 1,708; B) 2,06; C) 2,485.
La respuesta correcta es “B”, puesto que el resultado es significativo para el nivel de confianza del 95%
(−2,06 < −1,708) pero no para el nivel de confianza del 99% (−2,06 > −2,485).
SITUACIÓN 4: Para comparar la eficacia de dos terapias (“A” y “B”) utilizadas para tratar el trastorno de
personalidad “X”, se toma una muestra aleatoria de 400 personas que sufren el trastorno “X”, formándose dos
grupos al azar de 200 personas cada uno. Al primer grupo se le aplica la terapia “A”, siendo 172 personas las
que se recuperan, mientras que al aplicar la terapia “B” se recuperan 148 personas. Con un nivel de confianza
del 95%, ¿son las dos terapias igualmente eficaces?
-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
𝑝1 − 𝑝2 0′ 86 − 0′74
𝑍= = =3
1 1
√𝑃(1 − 𝑃) ( + ) √0,8 ∙ 0,2 ∙ ( 1 + 1 )
𝑛1 𝑛2 200 200
Según el enunciado hemos de tomar un nivel de confianza del 95% y el contraste es bilateral, luego la
respuesta correcta es A.
Acudiendo a la tabla de curva normal, observamos que la probabilidad de encontrar valores iguales o más
extremos que 𝑍 = 3 es igual a 0,0013. Como el contraste es bilateral, el nivel crítico es igual a: 𝑝 = 0,0013 ∙
2 = 0,0026.
5- Rechazamos la hipótesis nula porque: A) El valor absoluto del estadístico de contraste es superior al valor
absoluto del valor crítico; B) el nivel de significación es menor que el nivel de confianza; C) el nivel crítico p
es menor que el nivel de confianza.
6- ¿Se desprende de los resultados obtenidos que las dos terapias son igualmente eficaces? A) Si, porque
hemos aceptado la hipótesis alternativa; B) No, porque los resultados no son significativos; C) No, porque el
valor del estadístico de contraste es estadísticamente significativo.
Aceptamos la hipótesis alternativa porque el resultado es significativo (3 > 1,96), luego las dos terapias no
son igualmente eficaces, y por lo tanto la respuesta correcta es C.
7- Indique para qué niveles de confianza obtendremos resultados significativos: A) 95% y 99%; B) 99% y 99,9%;
C) para cualquier nivel de confianza.
Los resultados son significativos al nivel de confianza del 95% (3 > 1,96), también al nivel de confianza del
99% (3 > 2,58), pero no al nivel de confianza del 99,9 (3 < 3,1), luego la respuesta correcta es A.
SITUACIÓN 5: En una tarea de reconocimiento de palabras, un investigador mantiene la hipótesis de que los
estudiantes de carreras de “letras” tardarán menos que los estudiantes de “ciencias” en reconocer los estímulos
presentados. Tras seleccionar dos muestras aleatorias de 31 observaciones cada una, y registrar el tiempo de
reacción, obtiene una media aritmética igual a 653,2 ms para el grupo de estudiantes de ciencias (Grupo 1) y de
600 ms para el grupo de estudiantes de letras (Grupo 2), siendo la cuasivarianza igual en ambas muestras, con
un valor de 6200 ms2. Con un nivel de confianza del 95%, conteste a las siguientes cuestiones:
1- Si queremos comprobar si las varianzas de ambas poblaciones son iguales o diferentes, observaremos que el
valor del estadístico de contraste: A) no es significativo; B) es significativo; C) es significativo al nivel de
confianza del 95%, pero no al 99%.
-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
653,2 − 600
𝑇= = 2,66
√30 ∙ 6200 + 30 ∙ 6200 ∙ ( 1 + 1 )
31 + 31 − 2 31 31
Se busca en la tabla de la distribución t con 60 grados de libertad y un nivel de confianza del 95%.
|653,2 − 600|
𝑇= = 0,6756
√30 ∙ 6200 + 30 ∙ 6200
31 + 31 − 2
7- Aceptamos la hipótesis alternativa porque: A) el valor del estadístico de contraste es menor que el nivel
crítico p; B) el nivel crítico p es menor que el nivel de significación; C) el nivel crítico p es mayor que el valor
crítico.
8- ¿Podemos concluir que los resultados obtenidos avalan la hipótesis del investigador? A) Si; B) No; C) los
resultados son significativos al nivel de confianza del 95%, pero no del 99%.
SITUACIÓN 6. En un estudio piloto para un nuevo tratamiento contra el SIDA (Thompson, 1991), se midieron
diversas variables en 27 pacientes con SIDA. Entre ellas el número de células T-4 sanguíneas al inicio del
tratamiento y 90 días más tarde. Los resultados fueron: 𝑌̅0 𝑑𝑖𝑎𝑠 = 324; 𝑌̅90 𝑑𝑖𝑎𝑠 = 334,4. Por estudios
anteriores se sabe que la varianza poblacional de las diferencias en el contaje de células T-4 vale 150.
Asumiendo un nivel de confianza del 95%, conteste a las siguientes cuestiones:
1- Se trata de un diseño: A) de dos grupos dependientes; B) de más de dos grupos dependientes; C) de dos
grupos independientes.
2- La hipótesis nula en el caso de las medias es: A) 𝑯𝟎 : 𝝁𝟎 𝒅𝒊𝒂𝒔 = 𝝁𝟗𝟎 𝒅𝒊𝒂𝒔; B) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 ≥ 𝜇90 𝑑𝑖𝑎𝑠 ; C)
𝐻0 : 𝜋0 𝑑𝑖𝑎𝑠 ≤ 𝜋90 𝑑𝑖𝑎𝑠
3- El valor del estadístico de contraste para comprobar si al inicio del tratamiento los sujetos tienen el mismo
número de células T-4 que al final del mismo es igual a: A) 1,045; B) -4,41; C) 1,841.
Nos encontramos con un contraste de medias para dos grupos dependientes conociendo la varianza de las
diferencias poblacionales. Luego el estadístico de contraste es:
-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
̅ − 𝜇𝑑
𝐷 324 − 334,4
𝑍= = = −4,41
2
√𝜎𝑑 √150
𝑛 27
4- Los valores críticos que delimitan la zona de aceptación de 𝐻0 son: A) −1,05 𝑦 1,05; B) −𝟏, 𝟗𝟔 𝒚 𝟏, 𝟗𝟔; C)
−1,65 𝑦 1,65.
5- El investigador: A) acepta 𝐻0 ya que el intervalo de confianza de la media incluye la media de las diferencias
entre ambas muestras; B) rechaza 𝑯𝟎 porque la Z calculada es inferior al valor crítico; C) rechaza 𝐻1 ya que
el estadístico de contraste calculado se encuentra en la zona de rechazo.
6- Si el investigador hubiera vuelto a realizar una nueva medición del número de células T-4 180 días después
de iniciado el tratamiento, deberíamos aplicar como técnica de análisis: A) un ANOVA de medidas
independientes de un factor; B) un ANOVA de dos factores con interacción; C) un ANOVA de medidas
repetidas de un factor con tres niveles.
En este caso se estaría midiendo la variable dependiente en los mismos sujetos en tres ocasiones distintas.
Por consiguiente son medidas dependientes y tenemos más de dos: deberíamos utilizar un ANOVA de
medidas dependientes con un factor de tres niveles (medición a 0 días, a 90 días y a 180 días).
SITUACIÓN 7. Un psicólogo, sospecha que los alumnos de cuarto de grado (Grupo 1) presentan una media
superior y más variabilidad que los alumnos de primer curso de grado (Grupo 2) en la variable “autoestima”.
Para comprobar estas hipótesis selecciona dos muestras aleatorias de igual tamaño (𝑛1 = 𝑛2 = 31) a las que
aplica un test de autoestima. Los resultados fueron: 𝑌̅1 = 22,16, 𝑆̂12 = 76,42 para el Grupo 1 y 𝑌̅2 = 20,07,
𝑆̂22 = 47,58 para el Grupo 2. Asumiendo un nivel de confianza del 95% conteste a las siguientes cuestiones:
𝜎2 𝝈𝟐 𝜎2
1- La hipótesis nula en el caso de las varianzas es: A) 𝐻0 : 𝜎12 = 1; B) 𝑯𝟎 : 𝝈𝟏𝟐 ≤ 𝟏; C) B) 𝐻0 : 𝜎12 ≥ 1
2 𝟐 2
2- El valor del estadístico de contraste para comprobar si los sujetos del Grupo 1 presentan más variabilidad
que los sujetos del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,841.
𝑆̂12 76,42
𝐹= = = 1,606
𝑆̂22 47,58
3- Asumiendo igualdad de varianzas poblacionales, el valor del estadístico de contraste para comprobar si la
media del Grupo 1 es superior a la media del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,671.
4- El nivel crítico en el caso del contraste sobre las varianzas es igual a: A) 0,05; B) 0,10; C) 0,15.
Mirando en las tablas de la F obtenemos un valor de 0,90, es decir, una F = 1,606 con 30 y 30 grados de
libertad, deja por debajo de sí un área de 0,90. Luego el valor pedido es 1- 0,90 = 0,10.
-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
5- El nivel crítico en el caso del contraste sobre las medias es igual a: A) 0,05; B) 0,10; C) 0,15.
En las tablas observamos que un valor de T = 1,045 con 60 grados de libertad deja por debajo de sí el 0,850
del área de la distribución. Luego el valor pedido será 1-0,850 = 0,15 en un contraste unilateral.
6- El tamaño del efecto en el caso del contraste sobre medias es igual a: A) 1,045; B) 0,265; C) 0,15.
|𝑌̅1 − 𝑌̅2 | 22,16 − 20,07
𝑇= = = 0,2654
(𝑛 ̂ 2 (𝑛 ̂2 √30 ∙ 76,42 + 30 ∙ 47,58
√ 1 − 1)𝑆1 + 2 − 1)𝑆2 31 + 31 − 2
𝑛1 + 𝑛2 − 2
7- Nuestro psicólogo mantiene la hipótesis nula: A) Para el contraste de las varianzas pero no para el contraste
de medias; B) Para el contraste de medias pero no para el contraste de varianzas; C) En ambos casos, tanto
en el caso de las medias, como en el caso de las varianzas.
Los niveles críticos para los contrastes F y T son: 0,10 y 0,15 respectivamente, ambos superiores a: 𝛼 = 0,05,
luego se mantiene la hipótesis nula en ambos casos.
SITUACIÓN 8: El equipo docente de una determinada asignatura quiere comprobar la eficacia de un material
docente nuevo respecto al utilizado en convocatorias anteriores. Selecciona una muestra aleatoria de 64
alumnos, con los que forma dos grupos de igual tamaño también al azar. A los sujetos del Grupo 1 les
proporciona en nuevo material, mientras que los del Grupo 2 trabajan con el material antiguo. El equipo
docente tiene la hipótesis de que con el nuevo material las notas serán más elevadas. Tras el examen de fin de
curso los alumnos del Grupo 1 obtienen una nota media igual a 7, con una cuasivarianza igual a 15, mientras
que para el Grupo 2 la media es igual a 5,2 y la cuasivarianza igual a 17.
1- Si con un nivel de confianza del 95% realizamos un contraste de hipótesis para comprobar si las varianzas
poblacionales son iguales o diferentes, aceptaremos: A) la hipótesis nula; B) la hipótesis alternativa; C) No
podemos saber qué cuasivarianza hay que poner en el numerador del estadístico de contraste.
Para un nivel de confianza del 95%, el valor que nos ofrece la tabla F para 30 grados de libertad en el
numerador y 30 grados de libertad en el denominador (los más próximos a 31) es igual a 1,841, luego los
valores críticos son:
1
𝐹0,025;30;30 = 2,074 = 0,482, 𝐹0,975;30;30 = 2,074
Dado que F = 0,88 se encuentra comprendido entre los valores críticos, aceptamos la hipótesis nula, por lo
que podemos suponer que las varianzas son iguales.
2- Si realizamos un contraste de hipótesis sobre las medias para comprobar la hipótesis del equipo docente, el
estadístico de contraste vale: A) 2; B) 1,8; C) 1,67.
-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
4- Con un nivel de confianza del 95%, suponiendo que la hipótesis nula sobre el contraste de medias es cierta,
la probabilidad de obtener un valor igual o superior al estadístico de contraste que hemos obtenido: A) se
encuentra comprendida entre 0,01 y 0,025; B) se encuentra comprendida entre 0,025 y 0,05; C) es igual a
0,05.
Nos piden calcular el nivel crítico. Buscando en las tablas para 60 grados de libertad (los más próximos a 62),
observamos que el estadístico de contraste obtenido (T =1,8), se encuentra comprendido entre los valores
1,671 y 2, que dejan por encima de sí las probabilidades: 0,05 y 0,025.
5- Si trabajamos con un nivel de confianza del 95%, la probabilidad de rechazar la hipótesis nula suponiendo
que es cierta es igual a: A) se encuentra comprendida entre 0,01 y 0,025; B) es igual a 0,05; C) es igual a 0,95.
6- Tomando de las tablas el valor más próximo para los grados de libertad, el intervalo de confianza para la
diferencia de medias, para un nivel de confianza del 95% viene definido por los valores: A) 0,2 𝑦 3,8; B)
−0,2 𝑦 − 3,8; C) −𝟎, 𝟐 𝒚 𝟑, 𝟖.
7- El estadístico de contraste obtenido para contrastar la hipótesis del equipo docente: A) no es significativo; B)
Es significativo al nivel de confianza del 99%; C) es significativo al nivel de confianza del 95%.
El contraste que hemos de aplicar es unilateral derecho y el estadístico de contraste es: T = 1,8. Este valor
supera al valor crítico t = 1,671 (NC = 95%), pero no supera al valor crítico t = 2,390 (NC=99%).
SITUACIÓN 9: Un psicólogo imparte una conferencia a una muestra de 200 fumadores en la que les expone un
tratamiento para abandonar este hábito. También pregunta a los sujetos, antes y después de la conferencia,
que cuantifiquen en una escala de 0 a 10 si se sienten capaces de dejar de fumar tras recibir el tratamiento,
donde el cero indicaría que no se sienten capaces de ninguna forma y 10 que lo lograrán con absoluta certeza.
Antes de la conferencia, la mitad de los sujetos de la muestra están dispuestos a seguir el tratamiento. Tras la
conferencia, encuentra que 80 personas que estaban dispuestas a seguir la terapia mantienen la idea de
hacerlo, y que otras 80 personas que no estaban dispuestas a seguir la terapia han cambiado de opinión. El
psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia sea mayor tras la
conferencia. Respecto a la pregunta que plantea el psicólogo a los sujetos, se encuentra que aquellos que no se
-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
sentían capaces de dejar de fumar antes de la conferencia obtienen una media superior después de la
conferencia, siendo dicha media un punto superior a la media antes de la conferencia y la cuasidesviación típica
de las diferencias es igual a 5. Con un nivel de confianza del 95%.
Después de la conferencia
SI NO
Antes de la SI a = 80 b = 20 100
conferencia NO c = 80 d =20 100
160 40 200
1- El valor absoluto del estadístico de contraste “Z” para comprobar la hipótesis del psicólogo es igual a: A)
1,64; B) 2,33; C) 6.
Para comprobar la hipótesis del psicólogo realizamos un contraste de hipótesis para dos proporciones con
muestras relacionadas. Para calcular el estadístico de contraste “Z” nos fijamos en los sujetos que han
cambiado de opinión (casillas b y c de la tabla)
𝑏−𝑐 20 − 80
𝑍= = = −6
√𝑏 + 𝑐 √20 + 80
2- Si la hipótesis nula es cierta, la probabilidad de obtener un estadístico de contraste igual o más extremo que
el obtenido: A) es igual a 0,05; B) es igual a 0,95; C) es menor que 0,0002.
Tenemos que calcular el nivel crítico. El estadístico de contraste es muy extremo, superior al valor mayor que
podemos consultar en las tablas (Z = 3,59, que deja por encima de sí una proporción igual a 0,0002), por lo
que la respuesta correcta es C.
3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,64; B) 1,96; C) 2,33.
Como el psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia se mayor
tras la conferencia, el contraste es unilateral. Buscando en las tablas de curva normal para NC = 95%,
comprobamos que la respuesta correcta es A.
4- La hipótesis que antes de la conferencia tenía el psicólogo: A) queda confirmada porque mantenemos la
hipótesis nula; B) queda confirmada porque el nivel crítico es menor que el error de tipo I; C) queda
confirmada porque el nivel crítico es mayor que el valor crítico.
Si queremos comprobar que la media de los sujetos que inicialmente no están dispuestos a seguir el
tratamiento es superior después de la conferencia, y con un nivel de confianza del 95%:
6- Si realmente no existen diferencias entre las medias antes y después, la probabilidad del obtener un
estadístico de contraste igual o más extremo que el que proporcionan los datos vale: A) entre 0,10 y 0,05; B)
entre 0,01 y 0,025; C) 0,05.
Los grados de libertad son: n – 1 = 100 – 1 = 99. En las tablas consultamos para 100 grados de libertad que
son los más próximos. Observamos que el estadístico de contraste se encuentra entre los valores 1,984 y
-9-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
2,364, que dejan por encima de sí, respectivamente, las proporciones: 0,025 y 0,01, luego la respuesta
correcta es B.
8- Podemos afirmar que los sujetos que inicialmente no están dispuestos a seguir el tratamiento inicialmente,
se sienten más seguros de poder dejar de fumar tras la conferencia del psicólogo. A) Sí, porque el nivel
crítico es inferior al nivel de significación; B) Sí, porque el nivel crítico es inferior al nivel de confianza; C) No,
los resultados no son significativos.
SITUACIÓN 10. Un partido político X elabora un vídeo pre-electoral con la intención de incrementar el número
de votos en las siguientes elecciones. Extrae una muestra aleatoria de 200 personas a las que muestra el
vídeo. Antes de verlo 120 personas declararon que no votarían al partido X, 60 de las cuales cambiaron de
opinión tras ver el vídeo, siendo 136 sujetos en total los que manifestaron su intención de votar al partido X
después de ver el vídeo. Con un nivel de confianza del 95%.
Después
SI NO
SI a = 76 b=4 80
Antes
NO c = 60 d = 60 120
136 64 200
2- El valor del estadístico de contrate Chi cuadrado es igual a; A) 10,24; B) 49; C) 1,96.
(𝑏 − 𝑐)2 (4 − 60)2
𝜒2 = = = 49
𝑏+𝑐 4 + 60
3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,28; B) 1,64; C) 1,96.
Buscando en la tabla de curva normal la puntuación típica que supera una proporción igual a 0,05,
observamos que la respuesta correcta es B.
4- El valor crítico para el estadístico Chi cuadrado es; A) 5,0239; B) 2,7055; C) 3,8415.
Buscando en la tabla de 𝜒 2 para un grado de libertad la puntuación que supera una proporción igual a
0,05, observamos que la respuesta correcta es C.
-10-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
5- El nivel crítico es: A) mayor que 0,001; B) menor que 0,005; C) igual a 0,05.
Tomando el estadístico de contraste Z y consultando las tablas de curva normal, observamos que la
puntuación más extrema que podemos consultar es igual a 3,59, que deja por encima de sí una
proporción igual a 0,0002, por lo que la respuesta correcta es B.
7- A la vista de los resultados, el partido X determina que: A) El vídeo resulta efectivo porque incrementa el
número de votantes del partido X; B) El vídeo no resulta efectivo porque hay pocas personas que
cambian de opinión a favor del partido X; C) El vídeo no resulta efectivo porque se rechaza la hipótesis
nula.
8- Si la magnitud del efecto es pequeña: A) la diferencia entre dos medias nunca es significativa; B) la
diferencia entre dos medias siempre es significativa; C) la diferencia entre dos medias puede ser
significativa.
Aunque la magnitud del efecto sea pequeña, si el tamaño de las muestras es grande, podemos obtener
resultados significativos
-11-
Cuestiones y ejercicios del Tema 5:
¿Se puede afirmar, con un nivel de confianza del 95%, que los tiempos
medios de los grupos son iguales?
Cuestiones y ejercicios del Tema 5: SOLUCIONES
𝑀𝐶inter
𝐹=
𝑀𝐶𝑖𝑛𝑡𝑟𝑎
FV SC gl MC F
Entre niveles 466,67 2 233,335 27,006
Dentro de niveles 233,33 27 8,64
Total 700 29
6) Decisión:
Comparando nuestro valor con el valor tabular tenemos que:
27,006 > 3,35
7) Interpretamos:
A un nivel de confianza del 95% debemos considerar que los
tratamientos suministrados influyen de forma distinta en la ansiedad.
8) El paso siguiente es ver entre qué tratamientos está la diferencia,
para lo que debemos realizar las comparaciones múltiples.
Como queremos comparar todas las medias entre sí, tenemos tres
posibles comparaciones y establecemos tres combinaciones lineales:
Solución:
Dado que tenemos tres muestras independientes, aplicamos un análisis de
varianza de un solo factor.
1) Hipótesis estadísticas:
H0: µ1 = µ2 = µ3
H1: µ1 ≠ µ2 ≠ µ3 al menos para una µi
2) Supuestos:
Vamos a suponer que hemos aplicado el test de rachas, el de Bartlett
y el de Lilliefors y que se cumplen los supuestos de independencia,
homogeneidad de varianzas y normalidad.
3) Estadístico de contraste:
𝑀𝐶inter
𝐹=
𝑀𝐶𝑖𝑛𝑡𝑟𝑎
6) Decisión:
Comparando nuestro valor con el valor tabular tenemos que:
9,264 > 3,42
Por lo tanto rechazamos la hipótesis nula.
7) Interpretamos:
Hemos comprobado, con un nivel de confianza del 95% que hay
diferencia entre los grupos. Vamos a comprobar si es debida a la
diferencia éntrelos niños y las niñas, tal como pide el enunciado del
problema.
¿Se puede afirmar, con un nivel de confianza del 95%, que los tiempos
medios de los grupos son iguales?
Solución:
Dado que queremos comparar cuatro grupos, parece lógico que el diseño
sea un ANOVA de un factor.
Veamos qué datos tenemos y qué datos necesitamos.
Los cálculos que hay que realizar son:
2
(ƩƩ𝑌𝑖𝑗 )
SCtotal = ƩƩ 𝑌𝑖𝑗2 -
𝑁
2 2
(Ʃ𝑌𝑖𝑗 ) (ƩƩ𝑌𝑖𝑗 )
SCinter = Ʃ -
𝑛𝑖 𝑁
2 2
9 = (Ʃ𝑌𝑖𝐴 /8) – (10,5)2 → Ʃ𝑌𝑖𝐴 = 954
2 2
16 = (Ʃ𝑌𝑖𝐵 /8) – (12,5)2 → Ʃ𝑌𝑖𝐵 = 1378
12,25 = (Ʃ𝑌𝑖𝐶2 /8) – (13)2 → Ʃ𝑌𝑖𝐶2 = 1450
2 2
20,25 = (Ʃ𝑌𝑖𝐷 /8) – (15)2 → Ʃ𝑌𝑖𝐷 = 1962
ƩƩ𝑌𝑖𝑗2 = 954 + 1378 + 1450 + 1962 = 5744
FV SC gl MC F
Entre niveles 82 3 27,33 1,66
Dentro de niveles 460 28 16,43
Total 542 31
Como 1,66 < 2,95 no podemos rechazar la hipótesis nula del análisis de
varianza. No podemos considerar que haya diferencias en los tiempos que
tardan las ratas en recorrer el laberinto en función de los tiempos de
privación de alimentos, con un nivel de confianza del 95%.
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
SITUACIÓN 1: Con el objetivo de mejorar la función hepática, un investigador medico está interesado en la
tasa máxima de síntesis de urea en pacientes con cirrosis que experimentaron una operación estándar
(bypass no selectivo), un bypass selectivo para pacientes con una síntesis de urea menor de 40 (grupo
selectivo I) y un bypass selectivo para pacientes con una síntesis de urea superior a 40 (grupo selectivo II).
Cada uno de los tres grupos (bypass no selectivo, bypass selectivo Grupo I y bypass selectivo grupo II) estuvo
compuesto por 6 pacientes. Sabemos que: 𝑆𝐶𝐼𝑛𝑡𝑒𝑟 = 160,44 y que 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 710,66
2- ¿Qué supuestos debo verificar que se cumplen en este caso para aplicar el ANOVA? A) las observaciones
se distribuyen según la distribución F en los tres grupos; B) las varianzas de los tres grupos deben ser
similares; C) la distribución de las puntuaciones es asimétrica en los tres grupos.
3- Los grados de libertad del estadístico F de contraste para evaluar el efecto del “tipo de operación
médica” valen: A) (15; 3); B) (2; 15); C) (2; 18).
4- El estadístico de contraste F para evaluar el efecto del “tipo de operación médica” vale
aproximadamente: A) 1,693; B) 3,295; C) 0,392
5- Si trabajamos a un nivel de confianza del 95%, el valor crítico para contrastar la F del “tipo de operación
médica” valdrá: A)1,693; B) 3,682; C) 2,695
SITUACIÓN 2. Un agrónomo desea conocer el efecto que sobre el rendimiento de una variedad de trigo tiene
la adición de 3 tipos diferentes de fosfatos al terreno. Para ello parcela un terreno en 12 áreas del mismo
tamaño y trata cada cuatro parcelas con un tipo distinto de fosfato (A, B o C). A continuación siembra trigo
en cada uno de ellos y, después de la recolección, mide la cantidad de trigo producida por cada superficie
(en hectólitros por hectárea o hl/ha). Nivel de confianza: 95%. Sabemos que:
Y la siguiente tabla muestra el rendimiento obtenido en función del tipo de fosfato añadido.
Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50
1- Se trata de un diseño: A) de una muestra con 12 observaciones; B) de un factor con tres niveles (tipo de
fosfato); C) de un factor (parcela de terreno) con cuatro niveles.
3- Los grados de libertad del estadístico F de contraste valen: A) (3;9); B) (2;11); C) (2;9).
4 - El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato” vale aproximadamente: A)
6; B) 3,295; C) 0,392.
-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
5- El diseño presentado es: A) de efectos fijos; B) desequilibrado; C) las dos opciones anteriores son
incorrectas.
6- El modelo estadístico que podemos aplicar a estos datos es: A) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖 + 𝜀𝑖𝑗 ; B) 𝐸(𝑀𝐶𝐼𝑛𝑡𝑒𝑟 ) =
1
𝜎 2 + (𝐼−1) 𝑛𝑖 𝛼𝑖2; C) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖 + (𝛼𝜀)𝑖𝑗 + 𝜀𝑖𝑗
7- El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196, 192, 200}; C) {2/3, 2/3,
2/3}.
10- El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es superior en, aproximadamente,
6 veces a la MCInter; B) No, porque la SCintra es casi igual a la SCinter indicando que la variabilidad asociada al
tratamiento es casi idéntica a la del error; C) Sí, porque la F obtenida (6) es superior al valor crítico
𝐹2;9;0,05 = 4,256
11- ¿Entre qué niveles podemos asegurar que existen diferencias según CR de Scheffé? A) sólo entre los
niveles B y C; B) Sólo entre los niveles A y C; C) sólo entre los niveles A y B.
12- El diseño presentado no permite evaluar la interacción: A) porque el factor manipulado (tipo de
fertilizante) no puede interaccionar con ningún otro factor; B) porque tal interacción no ha sido incluida
en el modelo; C) porque sólo existe un factor manipulado y la interacción siempre se predica, como
mínimo, de dos factores.
SITUACIÓN 3. Un investigador sospecha que los tiempos de coagulación de la sangre difieren en función del
tipo de dieta. Para ello, ha realizado un experimento donde ha formado varios grupos de ratones,
sometiendo a cada grupo a distintos tipos de dietas. Tras analizar los datos mediante un ANOVA, parte de los
siguientes resultados:
3- La hipótesis nula planteada en este diseño es: A) 𝐻0 : 𝜇𝑖 = 𝜇𝑗 para todo 𝑖 ≠ 𝑗; B) 𝐻0 : 𝜇𝑖 ≠ 𝜇𝑗 para todo
𝑖 = 𝑗; C) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖𝑗 + 𝜀𝑖𝑗 .
5- Siendo 𝛼 = 0,05, el valor de la F crítica para el factor “Tipo de dieta” fue: A) 3,098; B) 2,380; C) 4,938.
-2-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
6- ¿Tendremos que realizar comparaciones a posteriori? A) Sí; B) No porque tenemos más de 2 niveles del
factor; C) No porque las comparaciones a posteriori solo se aplican en diseños intrasujetos.
7- Con un nivel de confianza del 95%, ¿Cuál será el valor mínimo de la diferencia entre dos medias
cualesquiera en este experimento para que resulten significativas según Scheffé (𝛼 = 0,05)? A) 12,39; B)
0,59; C) 4,17.
8- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a comparar deben de
cumplir el supuesto de: A) complementariedad y exhaustividad; B) homocedasticidad; C) independencia.
SITUACIÓN 4: Un fabricante de bolsas de papel está interesado en mejorar la resistencia a la tensión de las
mismas. El ingeniero piensa que la resistencia a la tensión es una función de la concentración de madera
frondosa (hardwood) en la pulpa con la que se hace el papel y que el rango de concentración de este tipo de
madera se encuentra entre el 5 y el 20%. Por ello, el equipo de ingenieros decide investigar cuatro niveles de
esta concentración: 5%, 10%, 15% y 20%. Deciden componer seis especímenes de test en cada nivel de
concentración. Los 24 especímenes se evalúan en el laboratorio para determinar su resistencia a la tensión
en orden aleatorio. En el informe los investigadores indican que “El factor Concentración fue significativo
[𝐹(3, 20) = 19,60, 𝑀𝐶𝑒𝑟𝑟𝑜𝑟 = 6,51, 𝑝 = 0,00000359]”
5- Dados los resultados obtenidos ¿deberían los ingenieros realizar pruebas de comparaciones múltiples o a
posteriori? A) sí ya que hay más de 2 grupos y la F ha resultado significativa; B) no son necesarias porque
la F ha resultado significativa; C) No, porque sólo tenemos cuatro grupos.
7- El investigador también podría haber sustituido en el informe el valor de p = 0,00000359 por: A) p <
0,0001; B) p > 0,001; C) p > 0,05.
8- Como el factor manipulado es una variable numérica (no categórica), también sería posible: A) realizar un
análisis categórico para estos datos; B) realizar un análisis cualitativo sobre cada nivel del factor; C)
realizar un análisis de regresión lineal simple sobre estos datos.
9- El cumplimiento del supuesto de homocedasticidad en este análisis: A) implicaría que la varianza de los
valores de resistencia a la tensión del papel son semejantes independientemente de la concentración de
madera frondosa; B) implicaría que las medias de tensión del papel condicionadas a la concentración de
madera frondosa siguen una función lineal; C) implicaría que las medias de tensión del papel
condicionadas a la concentración de madera frondosa siguen una distribución lineal.
-3-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
1- Se trata de un diseño factorial: A) 2x2 ya que se han manipulado los tratamientos (ejercicio y dieta) y el
tipo de carnet (clínica, club y ambos); B) desequilibrado; C) 3x2 ya que se ha manipulado el tipo de
tratamiento (con tres niveles) y el lugar de selección de las mujeres (con dos niveles).
2- El investigador ha informado que ninguno de los factores principales ha resultado significativo. Esto
significa que: A) la interacción no puede ser significativa; B) ni el lugar de selección de las mujeres ni el
tratamiento han resultado significativos; C) el experimento ha resultado fallido.
3- El investigador ha informado que la F de la interacción fue 4,722. De manera aproximada, y utilizando las
tablas correspondientes ¿ha resultado significativa?: A) No es posible saberlo sin conocer la media
cuadrática del error; B) Sí, ya que 4,722 es superior a 3,493; C) No porque, siendo cierta H0, la
probabilidad de obtener un valor de 4,722 o superior es superior a 0,05.
SITUACIÓN 6: Diversos estudios ponen de manifiesto que las enfermedades de tipo alérgico se ven
agravadas por la presencia de fuerte estrés. Además, la época del año parece afectar de forma decisiva a la
gravedad de los trastornos alérgicos. En un estudio se ha utilizado una muestra aleatoria de 5 pacientes
alérgicos (todos con el mismo tipo de alergia) sometidos a condiciones de alto estrés. Un grupo de
especialistas ha evaluado la gravedad de la alergia de cada paciente (en una escala de 0 a 10) en los cuatro
periodos estacionales: primavera, verano, otoño e invierno. Para analizar estos datos, el investigador utilizó
un ANOVA cuyas razones básicas aparecen a continuación (utilice un 𝛼 = 0,05):
1- Se trata de un diseño: A) factorial de 2 factores (estrés y estación del año); B) factorial de un factor con 4
niveles; C) factorial de 2 factores con 2 niveles cada uno.
3- La Media Cuadrática del error (en este caso, AxS) vale aproximadamente: A) 5; B) 21,67; C) 1,87.
4- La F crítica para evaluar el efecto del factor vale: A) 3,49; B) 4,474; C) 5,953.
-4-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
5- El informe de este trabajo debería realizarse de la siguiente manera: A) F(3; 12) = 11.56, MSe = 1,875, p
< 0,05; B) F(3; 12) = 0,05, MSe = 11,59, p > 0,10; C) F(12; 3) = 11,59, MSe = 21,67, p = 0,05.
6- El análisis de los datos nos indicaron una potencia de 0.99 para el factor “Periodo estacional”. Esto
significa que: A) Como el valor es cercano a la unidad, no existen diferencias en la gravedad de la alergia
en función del periodo estacional; B) debemos realizar contrastes a posteriori; C) La probabilidad de
rechazar la hipótesis nula H 0 : Pr imavera Verano Otoño Invierno siendo esta falsa vale 0,99.
8- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede adoptar valores
negativos porque: A) los valores de la ordenada (eje vertical) son todos positivos; B) toda distribución de
densidad de probabilidad se estandariza para que tenga un área igual a la unidad; C) es el cociente entre
dos varianzas y estas son siempre positivas.
1- El diseño es: A) de medidas repetidas 2x3; B) de dos factores inter-sujetos 2x3; C) de un factor intersujeto
con tres niveles.
-5-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
3- Los valores de las MC para los efectos principales valen: A) 33,19 y 90392,1; B) 29019,3 y 29993,10; C)
1013,361 y 116,583.
5- El valor F para el factor Grupo (experimental vs. placebo) es: A) 17,174; B) 1,058; C) 3,392.
6- El valor F para el factor Tipo de Usuario de Marihuana es: A) 1,976; B) 5,302; C) 9,992.
7- Las comparaciones “a posteriori” para el factor Grupo: A) no son necesarias ya que este factor sólo tiene
2 niveles y la F ya nos indica que las medias son diferentes entre sí; B) son necesarias ya que la F ha
resultado significativa; C) se aplican sólo cuando la interacción es significativa.
8- Con respecto a la interacción: A) habrá que analizarla mediante los 5 efectos simples; B) no se debe
realizar un análisis de efectos simples porque la interacción no es significativa; C) la interacción muestra
que los sujetos sin experiencia previa del grupo experimental difiere significativamente de los otros dos
grupos de usuarios en el grupo experimental, pero no en el placebo.
9- El experimentador debe concluir que: A) los sujetos que tienen experiencia infrecuente y frecuente con la
marihuana tienen una respuesta diferente a los sujetos que no han tenido experiencia previa; B) el
tiempo de respuesta es superior cuando los sujetos han fumado marihuana que cuando no lo han hecho,
y este resultado no se muestra afectado por la experiencia previa del usuario con esta droga; C) la
experiencia con la marihuana no afecta a los sujetos que toman la droga placebo, pero afecta
notablemente a los sujetos sin ningún tipo de experiencia con la marihuana.
-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
SITUACIÓN 1: Con el objetivo de mejorar la función hepática, un investigador medico está interesado en la
tasa máxima de síntesis de urea en pacientes con cirrosis que experimentaron una operación estándar
(bypass no selectivo), un bypass selectivo para pacientes con una síntesis de urea menor de 40 (grupo
selectivo I) y un bypass selectivo para pacientes con una síntesis de urea superior a 40 (grupo selectivo II).
Cada uno de los tres grupos (bypass no selectivo, bypass selectivo Grupo I y bypass selectivo grupo II) estuvo
compuesto por 6 pacientes. Sabemos que: y que
Tenemos que aplicar un análisis de la varianza para tres muestras independientes con tres niveles
con 6 sujetos en cada uno de ellos . El número total de sujetos es: .
Con estos datos y las sumas de cuadrados del enunciado, completamos fácilmente la tabla de
ANOVA.
FV SC g.l. MC F
Factor
Error
Total
B)
C)
2- ¿Qué supuestos debo verificar que se cumplen en este caso para aplicar el ANOVA? A) las observaciones
se distribuyen según la distribución F en los tres grupos; B) las varianzas de los tres grupos deben ser
similares; C) la distribución de las puntuaciones es asimétrica en los tres grupos.
3- Los grados de libertad del estadístico F de contraste para evaluar el efecto del “tipo de operación
médica” valen: A) (15, 3); B) (2, 15); C) (2, 18).
4- El estadístico de contraste F para evaluar el efecto del “tipo de operación médica” vale
aproximadamente: A) 1.693; B) 3.295; C) 0.392
5- Si trabajamos a un nivel de confianza del 95%, el valor crítico para contrastar la F del “tipo de operación
médica” valdrá: A)1.693; B) 3.682; C) 2.695
Buscamos en la tabla F de Fisher para 2 y 15 grados de libertad la puntuación que supera una proporción
igual a 0,95 (nivel de confianza).
-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
SITUACIÓN 2. Un agrónomo desea conocer el efecto que sobre el rendimiento de una variedad de trigo tiene
la adición de 3 tipos diferentes de fosfatos al terreno. Para ello parcela un terreno en 12 áreas del mismo
tamaño y trata cada cuatro parcelas con un tipo distinto de fosfato (A, B o C). A continuación siembra trigo
en cada uno de ellos y, después de la recolección, mide la cantidad de trigo producida por cada superficie
(en hectólitros por hectárea o hl/ha). Nivel de confianza: 95%. Sabemos que:
Y la siguiente tabla muestra el rendimiento obtenido en función del tipo de fosfato añadido.
Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50
Tenemos un factor con tres niveles , en el que en cada nivel hay 4 observaciones . Las
muestras son independientes. Fácilmente construimos la tabla de ANOVA.
SC gl MC F
Entre niveles
Dentro niveles
Total
1- Se trata de un diseño: A) de una muestra con 12 observaciones; B) de un factor con tres niveles (tipo de
fosfato); C) de un factor (parcela de terreno) con cuatro niveles.
2- La hipótesis nula es A) ; B) ; C)
La hipótesis nula ha de postular la igualdad de las medias en todos los niveles, luego la opción
correcta es B.
3- Los grados de libertad del estadístico F de contraste valen: A) (3,9); B) (2,11); C) (2,9).
4 - El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato” vale aproximadamente: A)
6; B) 3.295; C) 0.392.
5- El diseño presentado es: A) de efectos fijos; B) desequilibrado ; C) las dos opciones anteriores son
incorrectas.
Se trata de un diseño de efectos fijos. No puede ser desequilibrado ya que hay 4 terrenos o parcelas
para cada tipo de fertilizante (lo cual indicaría que es equilibrado). Solo nos interesan estos
fertilizantes (A, B y C), ningún otro.
-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
La opción B no es un modelo sino la expresión del valor esperado de la Media Cuadrática Inter. La
expresión C es incorrecta ya que asume la interacción entre los errores y los niveles del tratamiento.
La opción correcta es la A ya que expresa cada puntuación de la variable dependiente (Yij) como la
suma de tres componentes: una media global común ( ), el efecto del factor del terreno concreto
del que estemos hablando y un error aleatorio
7- El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196, 192, 200}; C) {2/3, 2/3,
2/3}.
Para obtener el rendimiento medio para los diferentes tratamientos simplemente calculamos la
media de cada fertilizante:
10- El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es superior en, aproximadamente,
6 veces a la MCInter; B) No, porque la SCintra es casi igual a la SCinter indicando que la variabilidad asociada al
tratamiento es casi idéntica a la del error; C) Sí, porque la F obtenida (6) es superior al valor crítico
11- ¿Entre qué niveles podemos asegurar que existen diferencias según CR de Scheffé? A) sólo entre los
niveles B y C; B) Sólo entre los niveles A y C; C) sólo entre los niveles A y B.
Aplicamos la fórmula de la CR de Scheffé (como nos piden asegurar entre qué niveles existen
diferencias, ponemos los coeficientes típicos para la comparación entre dos niveles dejando el tercero
sin incluir):
√ √ ⁄ [∑ ( ⁄ )]
√ √ ⁄ ⁄
Ahora realizamos las diferencias (en valor absoluto) entre las tres medias:
| ̅ ̅| | |
| ̅ ̅| | |
|̅ ̅| | |
-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
12- El diseño presentado no permite evaluar la interacción: A) porque el factor manipulado (tipo de
fertilizante) no puede interaccionar con ningún otro factor; B) porque tal interacción no ha sido incluida
en el modelo; C) porque sólo existe un factor manipulado y la interacción siempre se predica, como
mínimo, de dos factores.
SITUACIÓN 3. Un investigador sospecha que los tiempos de coagulación de la sangre difieren en función del
tipo de dieta. Para ello, ha realizado un experimento donde ha formado varios grupos de ratones,
sometiendo a cada grupo a distintos tipos de dietas. Tras analizar los datos mediante un ANOVA, parte de los
siguientes resultados:
Conociendo los grados de libertad, deducimos el número de niveles, el número de sujetos en cada
nivel y número total de sujetos:
Total 340 23
3- La hipótesis nula planteada en este diseño es: A) para todo ; B) para todo
; C) .
5- Siendo 0.05 , el valor de la F crítica para el factor “Tipo de dieta” fue: A) 3,098; B) 2,380; C) 4,938.
Para un nivel de confianza del 95%, mirando en las tablas F de Fisher para 3 y 20 grados de libertad,
observamos que la F crítica es: 3,098, luego la alternativa correcta es “A”.
6- ¿Tendremos que realizar comparaciones a posteriori? A) Sí; B) No porque tenemos más de 2 niveles del
factor; C) No porque las comparaciones a posteriori solo se aplican en diseños intrasujetos.
-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
Tendremos que hacer comparaciones “a posteriori” porque hemos rechazado la hipótesis nula que
planteaba la igualdad entre las medias .
7- Con un nivel de confianza del 95%, ¿Cuál será el valor mínimo de la diferencia entre dos medias
cualesquiera en este experimento para que resulten significativas según Scheffé ( 0,05)? A) 12,39; B)
0,59; C) 4,17.
Como el modelo es equilibrado es igual para todas las diferencias entre pares de medias, dado
que:
∑( ⁄ ) ( ⁄ ) ( ⁄ ) ⁄
√ √ ⁄ [∑ ( ⁄ )]
√ √ ( ⁄ )
8- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a comparar deben de
cumplir el supuesto de: A) complementariedad y exhaustividad; B) homocedasticidad; C) independencia.
SITUACIÓN 4: Un fabricante de bolsas de papel está interesado en mejorar la resistencia a la tensión de las
mismas. El ingeniero piensa que la resistencia a la tensión es una función de la concentración de madera
frondosa (hardwood) en la pulpa con la que se hace el papel y que el rango de concentración de este tipo de
madera se encuentra entre el 5 y el 20%. Por ello, el equipo de ingenieros decide investigar cuatro niveles de
esta concentración: 5%, 10%, 15% y 20%. Deciden componer seis especímenes de test en cada nivel de
concentración. Los 24 especímenes se evalúan en el laboratorio para determinar su resistencia a la tensión
en orden aleatorio. En el informe los investigadores indican que “El factor Concentración fue significativo
[ , , ]”
-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
⁄ ⁄
⁄ ⁄
5- Dados los resultados obtenidos ¿deberían los ingenieros realizar pruebas de comparaciones múltiples o a
posteriori? A) sí ya que hay más de 2 grupos y la F ha resultado significativa; B) no son necesarias porque
la F ha resultado significativa; C) No, porque sólo tenemos cuatro grupos.
7- El investigador también podría haber sustituido en el informe el valor de p = 0,00000359 por: A) p <
0,0001; B) p > 0,001; C) p > 0,05.
8- Como el factor manipulado es una variable numérica (no categórica), también sería posible: A) realizar un
análisis categórico para estos datos; B) realizar un análisis cualitativo sobre cada nivel del factor; C)
realizar un análisis de regresión lineal simple sobre estos datos.
9- El cumplimiento del supuesto de homocedasticidad en este análisis: A) implicaría que la varianza de los
valores de resistencia a la tensión del papel son semejantes independientemente de la concentración
de madera frondosa; B) implicaría que las medias de tensión del papel condicionadas a la concentración
-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
de madera frondosa siguen una función lineal; C) implicaría que las medias de tensión del papel
condicionadas a la concentración de madera frondosa siguen una distribución lineal.
1- Se trata de un diseño factorial: A) 2x2 ya que se han manipulado los tratamientos (ejercicio y dieta) y el
tipo de carnet (clínica, club y ambos); B) desequilibrado; C) 3x2 ya que se ha manipulado el tipo de
tratamiento (con tres niveles) y el lugar de selección de las mujeres (con dos niveles).
El primer factor es el tipo de tratamiento con tres niveles (ejercicio, dieta y ejercicio+dieta) y el
segundo es el lugar con dos niveles (mujeres extraídas de la planta de manufactura y mujeres
extraídas de Secretaría). Luego se trata de un diseño intersujetos 3x2. El diseño está equilibrado
porque hay 5 mujeres en cada combinación de tratamiento con planta.
2- El investigador ha informado que ninguno de los factores principales ha resultado significativo. Esto
significa que: A) la interacción no puede ser significativa; B) ni el lugar de selección de las mujeres ni el
tratamiento han resultado significativos; C) el experimento ha resultado fallido.
Con la frase inicial (ninguno de los factores principales ha resultado significativo) lo único que
podemos concluir es que ninguno de los factores ha alcanzado la significatividad (ninguno ha
afectado a la pérdida de peso de las mujeres). No sabemos nada de la interacción (no nos lo han
dicho y de la afirmación realizada no podemos deducir nada ya que la significatividad de los factores
principales no nos dice nada sobre la significatividad de la interacción). Un experimento no resulta
fallido por sus resultados.
3- El investigador ha informado que la F de la interacción fue 4.722. De manera aproximada, y utilizando las
tablas correspondientes ¿ha resultado significativa?: A) No es posible saberlo sin conocer la media
cuadrática del error; B) Sí, ya que 4.722 es superior a 3.493; C) No porque, siendo cierta H0, la
probabilidad de obtener un valor de 4.722 o superior es superior a 0.05.
-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
Comparamos el estadístico de contraste ( ) con el valor crítico. Los grados de libertad son 2
y 24. Si sólo utilizamos las tablas buscamos con 2 y 20 grados de libertad, obteniendo un valor:
. Dado que: , existen diferencias significativas entre al menos un par
de medias.
SITUACIÓN 6: Diversos estudios ponen de manifiesto que las enfermedades de tipo alérgico se ven
agravadas por la presencia de fuerte estrés. Además, la época del año parece afectar de forma decisiva a la
gravedad de los trastornos alérgicos. En un estudio se ha utilizado una muestra aleatoria de 5 pacientes
alérgicos (todos con el mismo tipo de alergia) sometidos a condiciones de alto estrés. Un grupo de
especialistas ha evaluado la gravedad de la alergia de cada paciente (en una escala de 0 a 10) en los cuatro
periodos estacionales: primavera, verano, otoño e invierno. Para analizar estos datos, el investigador utilizó
un ANOVA cuyas razones básicas aparecen a continuación (utilice un 0,05 ):
Tenemos un diseño de un factor de medidas repetidas con cuatro niveles (periodos estacionales) y
cinco sujetos. En primer lugar calculamos las sumas de cuadrados a partir de las razones básicas:
[ ] [ ]
[ ] [ ]
[ ] [ ]
FV SC g.l. MC F
A 65 21,67 11,5573
S 7,5 1,875
AxS 22,5 12 1,875
T 95 5
1- Se trata de un diseño: A) factorial de 2 factores (estrés y estación del año); B) factorial de un factor con 4
niveles; C) factorial de 2 factores con 2 niveles cada uno.
3- La Media Cuadrática del error (en este caso, AxS) vale aproximadamente: A) 5; B) 21.67; C) 1.87.
4- La F crítica para evaluar el efecto del factor vale: A) 3.49; B) 4.474; C) 5.953.
Buscando en las Tablas F de Fisher para 3 y 12 grados de libertad, observamos que la respuesta
correcta es A.
-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
5- El informe de este trabajo debería realizarse de la siguiente manera: A) F(3, 12) = 11.56, MSe = 1.875, p
< 0.05; B) F(3, 12) = 0.05, MSe = 11.59, p > 0.10; C) F(12, 3) = 11.59, MSe = 21.67, p = 0.05.
6- El análisis de los datos nos indicaron una potencia de 0.99 para el factor “Periodo estacional”. Esto
significa que: A) Como el valor es cercano a la unidad, no existen diferencias en la gravedad de la alergia
en función del periodo estacional; B) debemos realizar contrastes a posteriori; C) La probabilidad de
rechazar la hipótesis nula H 0 : Pr imavera Verano Otoño Invierno siendo esta falsa vale 0.99.
8- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede adoptar valores
negativos porque: A) los valores de la ordenada (eje vertical) son todos positivos; B) toda distribución de
densidad de probabilidad se estandariza para que tenga un área igual a la unidad; C) es el cociente entre
dos varianzas y estas son siempre positivas.
-9-
Diseños de investigación y análisis de datos. Ejercicios Tema 8
SITUACIÓN 1. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final del curso (Y) y la obtenida en el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:
SITUACIÓN 2. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final de curso (Y) y la obtenida el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:
-1-
Diseños de investigación y análisis de datos. Ejercicios Tema 8
5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
son independientes; B) las distribuciones condicionadas de los errores deben de tener una
distribución uniforme; C) no deben estar relacionadas las variables predictora y la variable
dependiente o criterio.
SITUACIÓN 3. Anscombe (1973) presentó cuatro conjuntos de datos artificiales que tenían la
misma recta de regresión pero eran claramente diferentes. En la Figura 1 se puede ver uno de
estos conjuntos de datos (11 pares de datos) junto con la recta de regresión que mejor ajusta por
el criterio de mínimos cuadrados.
𝑆𝑥 = 3,316
𝑆𝑦 = 2,030
𝑟𝑥𝑦 = 0,816
𝛼 = 0,05
-2-
Diseños de investigación y análisis de datos. Ejercicios Tema 8
SITUACIÓN 4. Los siguientes datos relacionan el número de cigarrillos diarios (X) consumidos con
el número de radicales libres (Y) localizados en los pulmones de 8 individuos:
2 2
Sujeto X Y XY X Y
1 0 94 0 0 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
Sumatorio 137 1735 39218 3545 452493
Des. Típica 12,24 97,60
rxy = 0,99
-3-
Diseños de investigación y análisis de datos. Ejercicios Tema 8
10- En un modelo de regresión múltiple, el cálculo de las correlaciones de orden cero: A) implica el
cálculo de la regresión entre las variables independientes y, posteriormente, la extracción de los
residuos; B) no nos permite saber qué parte de la varianza de la VD es capaz de explicar
independientemente cada una de las VI’s; C) nos permite hallar relaciones bivariadas puras.
Sujetos X Y
1 6 8
SITUACIÓN 5. Un psicólogo escolar considera que la 2 4 3
comprensión lectora es un elemento que juega un papel 3 7 8
fundamental en el éxito académico de los estudiantes. Para 4 3 4
comprobar su hipótesis, selecciona aleatoriamente un grupo 5 5 4
de 16 estudiantes de 4º de la ESO a los que aplica un test de 6 9 10
comprensión lectora (X). A continuación, y en coordinación 7 7 7
con el profesor de ciencias sociales, se les aplica una prueba 8 4 5
sobre un tema de historia (Y) que acaban de estudiar, 9 2 4
10 5 2
consistiendo dicha prueba en una serie de preguntas sobre un
11 8 7
texto básico que tienen que leer y que está relacionado con el
12 9 9
tema estudiado. 13 10 8
14 6 6
15 3 5
16 1 3
-4-
Diseños de investigación y análisis de datos. Ejercicios Tema 8
nivel de significación de 0,01 existe relación entre X e Y; C) para un nivel de significación de 0,05
existe relación entre X e Y, pero no para un nivel de significación de 0,01.
8- El valor más aproximado del estadístico de contraste para la pendiente de regresión es: A) 5,407;
B) 1,996; C) 0,743.
9- Para un nivel de significación de 0,05, los límites del intervalo de confianza para la pendiente de la
regresión son: A) (-0,125; 3,487); B) (-0,125; 1,037); C) (0,448; 1,037).
10- Teniendo en cuenta los límites del intervalo de confianza obtenido para la pendiente de la
regresión, podemos decir que, a un nivel de significación de 0,05: A) se acepta la hipótesis
alternativa según la cual existe relación entre X e Y, ya que el intervalo de confianza no incluye el
valor cero; B) se acepta la hipótesis nula según la cual no existe relación entre X e Y, ya que el
intervalo de confianza incluye el valor cero; C) se acepta la hipótesis nula según la cual no existe
relación entre X e Y, ya que el intervalo de confianza no incluye el valor cero.
3- En regresión lineal simple, se asume que la desviación típica del error en la ecuación 𝑌 = 𝑎 +
𝑏 𝑋 + 𝜖 : A) es igual a la unidad; B) es la misma para cada valor particular de X; C) es igual a 0.
5- El estadístico de la Tabla del Anova para poner a prueba si la Regresión como fuente de variación
es significativa vale aproximadamente: A) 19,0; B) 1,2; C) 2,1.
7- El intervalo de confianza para contrastar la pendiente vale: A) (0’38, 0’06); B) (-0’15, +0’15); C) (-
0’32, -0’15).
-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
SITUACIÓN 1. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final del curso (Y) y la obtenida en el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:
23,778
𝑈 = 28,097 + 23,778 = 51,875 𝑇= = 3,963
6
28,097
𝑉= = 7,09
3,963
2- ¿Cuál es la varianza muestral insesgada de la calificación de los estudiantes (Y) al final del curso?:
A) 51,875; B) 7,411; C) 3,397.
∑(𝑌 − 𝑌̅)2
𝑆̂𝑦2 =
𝑛−1
Que podemos calcular con la tabla de ANOVA, dado que es igual a la media cuadrática total.
-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
2
𝑆𝐶𝑟𝑒𝑔 28,097
𝑟𝑥𝑦 = = = 0,542
𝑆𝐶𝑌 51,875
4- Con un nivel de confianza del 95%, ¿cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que no hay relación lineal significativa entre X e Y?: A) 5,987; B) 5,59; C)
6,608.
Consultando las tablas F para 1 y 6 grados de libertad comprobamos que la puntuación 5,987
supera una proporción igual a 5,987.
5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
están correlacionados; B) las distribuciones condicionadas de los errores deben de tener una
distribución normal; C) No deben estar relacionadas la variables predictora y la variable
dependiente o criterio.
SITUACIÓN 2. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final de curso (Y) y la obtenida el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:
SC gl MC F
Regresión 42,734 1 42,734 17,345
Residual 22,175 9 2,4639
Total 64,909 10
La varianza muestral insesgada de los errores del modelo de regresión coincide con la media
cuadrática residual.
-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
2- ¿Con un nivel de confianza del 95%, cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que hay no relación lineal significativa entre Y y X?; A) 5,117; B) 5,59; C)
6,608.
Buscando en las tablas F de Fisher para 1 y 9 grados de libertad, comprobamos que la respuesta
correcta es A.
42,734
𝑟𝑥𝑦 = √ = ±0,811
64,909
Suponemos que la relación entre la calificación obtenida a final del curso y la obtenida en el curso
anterior es directa, por lo que: 𝑟𝑥𝑦 = 0,811
5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
son independientes; B) las distribuciones condicionadas de los errores deben de tener una
distribución uniforme; C) no deben estar relacionadas las variables predictora y la variable
dependiente o criterio.
-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
SITUACIÓN 3. Anscombe (1973) presentó cuatro conjuntos de datos artificiales que tenían la
misma recta de regresión pero eran claramente diferentes. En la Figura 1 se puede ver uno de
estos conjuntos de datos (11 pares de datos) junto con la recta de regresión que mejor ajusta por
el criterio de mínimos cuadrados.
𝑆𝑥 = 3,316
𝑆𝑦 = 2,030
𝑟𝑥𝑦 = 0,816
𝛼 = 0,05
2. La recta de regresión no pasa exactamente por ningún punto porque: A) existe un valor atípico o
extremo; B) aunque la variabilidad es pequeña en este conjunto de datos, siempre existe una
cierta cantidad de ella que impide que el ajuste sea perfecto; C) el ajuste por mínimos cuadrados
está mal realizado.
Debemos observar que todos los puntos dados se sitúan exactamente de forma lineal entre sí. La
recta de regresión dibujada ha sido “alejada” debido a la influencia del valor “outlier” o extremo
en X = 13. Si no existiera este valor, la recta calculada habría pasado exactamente por el resto de
puntos. Luego la opción correcta es la A. La opción B es irrelevante en relación a la pregunta
planteada. La opción C es falsa ya que el ajuste por mínimos cuadrados se realizó correctamente
por Anscombe.
-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
𝑆𝑦 2,030
𝐵 = 𝑟𝑥𝑦 = 0,816 ∙ = 0,499542
𝑆𝑥 3,316
4. Si eliminamos el dato atípico que aparece en la gráfica (X10=13, Y10=12,74), el valor de rXY sería: A)
0,4992 = 0,249; B) igual al coeficiente de determinación; C) la unidad porque el ajuste sería
perfecto.
En este caso, el ajuste sería perfecto ya que todos los puntos se sitúan sobre una línea recta. Si
este es el caso, el ajuste sería perfecto (no habría error).
5. Si el valor de R2 es 0,666 esto significa que: A) también el error típico (𝜎𝜀 ) es de 0,666; B) la parte
de la variabilidad en Y atribuible a otros factores no relacionados linealmente con Y es de 0,666;
C) el porcentaje en que se reduce el error de Y cuando empleamos la recta de regresión para su
estimación es del 66,6%.
El componente del modelo representa el error que todavía queda cuando aplicamos la
pendiente y el punto de corte con la ordenada. Por consiguiente, representa la aportación de las
variables extrañas al experimento. Opción correcta C.
7. El análisis de la regresión para los datos de la Figura nos indicó que la regresión fue significativa
[F(1, 9) = 17,972, MCres = 1,528, p = 0,002]. Luego sabemos que el valor de t con 9 grados de
libertad fue aproximadamente: A) 4,24; B) 321,12; C) 0.
Una F y una t se relacionan según la fórmula: 𝑇𝑛2 = 𝐹1,𝑛 . Luego como sabemos que F1,9 = 17,972, el
valor de t será: √17,972 = 4,239
-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
SITUACIÓN 4. Los siguientes datos relacionan el número de cigarrillos diarios (X) consumidos con
el número de radicales libres (Y) localizados en los pulmones de 8 individuos:
2 2
Sujeto X Y XY X Y
1 0 94 0 0 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
Sumatorio 137 1735 39218 3545 452493
Des. Típica 12,24 97,60
rxy = 0,99
-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
2
𝑆𝑦 1 − 𝑟𝑥𝑦 97,60 1 − 0,992
𝜎𝐵 = √ = √ = 0,46
𝑆𝑥 𝑛 − 2 12,24 6
10- En un modelo de regresión múltiple, el cálculo de las correlaciones de orden cero: A) implica el
cálculo de la regresión entre las variables independientes y, posteriormente, la extracción de los
residuos; B) no nos permite saber qué parte de la varianza de la VD es capaz de explicar
independientemente cada una de las VI’s; C) nos permite hallar relaciones bivariadas puras.
Sujetos X Y
1 6 8
SITUACIÓN 5. Un psicólogo escolar considera que la 2 4 3
comprensión lectora es un elemento que juega un papel 3 7 8
fundamental en el éxito académico de los estudiantes. Para 4 3 4
comprobar su hipótesis, selecciona aleatoriamente un grupo 5 5 4
de 16 estudiantes de 4º de la ESO a los que aplica un test de 6 9 10
comprensión lectora (X). A continuación, y en coordinación 7 7 7
con el profesor de ciencias sociales, se les aplica una prueba 8 4 5
sobre un tema de historia (Y) que acaban de estudiar, 9 2 4
10 5 2
consistiendo dicha prueba en una serie de preguntas sobre un
11 8 7
texto básico que tienen que leer y que está relacionado con el 12 9 9
tema estudiado. 13 10 8
14 6 6
15 3 5
16 1 3
-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
Sujetos X Y X2 Y2 XY
1 6 8 36 64 48
∑ 𝑋2 ∑ 𝑌2
2 4 3 16 9 12 𝑆𝑥2 = 𝑛
− 𝑋̅ 2 = 6,621; 𝑆𝑦2 = 𝑛
− 𝑌̅ 2 = 5,402
3 7 8 49 64 56
4 3 4 9 16 12 𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌
5 5 4 25 16 20 𝑟𝑥𝑦 = = 0,822
6 9 10 81 100 90 √[𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 ][𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ]
7 7 7 49 49 49
8 4 5 16 25 20
9 2 4 4 16 8 𝒓𝟐𝒙𝒚 = 𝟎, 𝟖𝟐𝟐𝟐 = 𝟎, 𝟔𝟕𝟔
10 5 2 25 4 10
11 8 7 64 49 56 𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 𝑆𝑦
𝐵= 2 2
= 𝑟𝑥𝑦 = 0,743
12 9 9 81 81 81 𝑛 ∑ 𝑋 − (∑ 𝑋) 𝑆𝑥
13 10 8 100 64 80
14 6 6 36 36 36
15 3 5 9 25 15
𝐵0 = 𝑌̅ − 𝐵𝑋̅ = 1,681
16 1 3 1 9 3
Sumas 89 93 601 627 596
También podemos calcular 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 con la fórmula utilizada en los temas de ANOVA:
(∑ 𝑌𝑖 )2 932
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑌𝑖2 − = [𝑌] − [𝑇] = 627 − = 86,4375
𝑛 16
2
Dado que el coeficiente de determinación es igual a: 𝑟𝑥𝑦 = 0,676, la suma de cuadrados debida a
2
la regresión es: 𝑆𝐶𝑅𝑒𝑔 = 𝑟𝑥𝑦 ∙ 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 0,676 ∙ 86,4375 = 58,447
FV SC gl MC F
Regres. 58,447 1 58,447 29,233
Residual 27,991 14 1,999
Total 86,438 15
-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
𝐹 = 𝑇 2 → 𝑇 = √𝐹 = √29,233 = 5,407
9- Para un nivel de significación de 0,05, los límites del intervalo de confianza para la pendiente de la
regresión son: A) (-0,125; 3,487); B) (-0,125; 1,037); C) (0,448; 1,037)
2
𝑆𝑦 1 − 𝑟𝑥𝑦 2,324 1 − 0,676
𝐸𝑚𝑎𝑥 = 𝑡𝑛−2;1−𝛼⁄2 𝜎𝐵 = 𝑡𝑛−2;1−𝛼⁄2 √ = 2,145 √ = 0,2947
𝑆𝑥 𝑛 − 2 2,573 16 − 2
1,037
0,743 ± 0,2947 → {
0,448
10- Teniendo en cuenta los límites del intervalo de confianza obtenido para la pendiente de la
regresión, podemos decir que, a un nivel de significación de 0,05: A) se acepta la hipótesis
alternativa según la cual existe relación entre X e Y, ya que el intervalo de confianza no incluye
el valor cero; B) se acepta la hipótesis nula según la cual no existe relación entre X e Y, ya que el
intervalo de confianza incluye el valor cero; C) se acepta la hipótesis nula según la cual no existe
relación entre X e Y, ya que el intervalo de confianza no incluye el valor cero.
-9-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
3- En regresión lineal simple, se asume que la desviación típica del error en la ecuación 𝑌 = 𝑎 +
𝑏 𝑋 + 𝜖 : A) es igual a la unidad; B) es la misma para cada valor particular de X; C) es igual a 0.
𝑆𝑦 1,87
𝐵 = 𝑟𝑥𝑦 → 0,22 = 𝑟𝑥𝑦 → 𝑟𝑥𝑦 = 0,929
𝑆𝑥 7,90
𝑟𝑥𝑦 √𝑛 − 2 0,929√5 − 2
𝑡𝑛−2 = = = 4,36
√1 − 2
𝑟𝑥𝑦 √1 − 0,9292
5- El estadístico de la Tabla del Anova para poner a prueba si la Regresión como fuente de variación
es significativa vale aproximadamente: A) 19,0; B) 1,2; C) 2,1.
𝑡 2 = 𝐹 → 𝐹 = 4,362 = 19,01
7- El intervalo de confianza para contrastar la pendiente vale: A) (0’38, 0’06); B) (-0’15, +0’15); C) (-
0’32, -0’15).
2
𝑆𝑦 1 − 𝑟𝑥𝑦 1,87 1 − 0,9292 0,38
𝐵 ± 𝑡1−𝛼⁄ ( √ ) → 0,22 ± 3,182 ∙ √ →{
2,𝑛−2 𝑆𝑥 𝑛 − 2 7,90 5−2 0,06
-10-
Susana R.
RCP respuesta única ( teoría) (si hay alguna pregunta que no os suena puede ser del libro
anterior y no es materia de estudio )
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS.
Tema 1
4. La varianza insesgada es: b) La varianza muestral multiplicada por n y dividida por n-1.
16. El sesgo del estimador es: c) La diferencia entre la media de la distribución muestral
del estimador y el parámetro.
19. En la estimación puntual: b) Se toma un valor muestral concreto como estimación del
parámetro.
24. El estadístico de contraste Z para una media vale -2,15, siendo alfa igual a 0,05, n= 145
y el contraste bilateral. b) Se rechaza Ho
27. Cuando ponemos a prueba una hipótesis, el método que se utiliza para tomar una
decisiónentre la hipótesis nula (Ho) y la hipótesis alternativa (H1) es: c) El contraste de
hipótesis.
28. El nivel crítico p: b) Para su cálculo se tiene en cuenta la dirección del contraste
(unilateral/bilateral)
38. Una estimación por intervalos: c) Establece un rango de valores dentro del cual se
estima esté el valor del parámetro.
40. La hipótesis nula: “la varianza del grupo 1 es mayor o igual que la varianza del grupo
2”, se refiere a un contraste: c) Unilateral izquierdo.
41. Con n = 50, la probabilidad del error tipo II es igual a 0,30. Con un n = 40 y
manteniendo constantes los demás factores: b) Beta será superior a 0,30
43. El nivel crítico p: b) Su valor depende del valor muestral del estadístico
45. Cuanto mayor es la probabilidad del error tipo II, manteniendo constantes los demás
factores: a) Menor es el nivel de significación
48. Que dos hipótesis sean mutuamente excluyentes significa que: c) El rechazo de una de
ellas implica necesariamente la aceptación de la otra
49. La idea general del contraste de hipótesis es hallar: a) La probabilidad asociada al valor
muestral del estadístico.
50. Una hipótesis alternativa del tipo μ<μ0 plantea un contraste: a) Unilateral izquierdo
55. Sobre alfa y el nivel crítico p: b) Si sus valores son iguales se rechaza la hipótesis nula
56. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la
muestra: a) Mayor es la precisión del intervalo
58. El error típico de la distribución muestral del estadístico varianza es: a) La desviación
típica de la distribución muestral de la varianza
60. Hemos extraído una muestra aleatoria de 49 sujetos y le hemos medido el pulso en
reposo, obteniendo una media igual a 60 pulsaciones por minuto. Sabemos que las
pulsaciones forman una escala de intervalo y se distribuyen normalmente con varianza
poblacional igual a 16. Tomamos un n.c. del 99%. ¿cuál será el error máximo (Emáx)
aproximado en el cálculo del intervalo de confianza para μ? b) 1,47
63. En el contraste de hipótesis, la elección de: b) μ0, μ1, α, β es arbitraria mientras que la σ2
y n no lo son.
66. Hemos extraído una muestra aleatoria de 36 sujetos y les hemos medido el tiempo de
reacción a un estímulo visual, obteniendo una media igual a 50 milisegundos. La varianza
poblacional de la distribución de los tiempos de reacción es igual a 9. Sabiendo esto, cuál
será el intervalo de confianza del 95% en torno a la media poblacional:
a) 49,02 < μ < 50,98
68. Atendiendo a los datos del problema anterior, entre qué valores esperamos se
encuentre la media poblacional de la ansiedad precompetitiva, a un nivel de confianza del
99%: a) 3,71 < μ < 6,29
69. Hemos estimado en una muestra de 16 españoles, la media del grado de acuerdo sobre
la legalización del aborto obteniendo Ȳ = 8. El grado de acuerdo sobre la legalización del
aborto es una variable medida a nivel de intervalo que se distribuye normalmente en la
población con σ2 = 36. Asumiendo un nivel de confianza del 95%, qué tamaño debe tener
la muestra para que la media no se aleje más de ± 1 punto de la media poblacional: 139
70. Con los datos del problema anterior, sin tener en cuenta que conocemos la varianza
poblacional, sino que conocemos desviación típica y la media del grado de acuerdo sobre
la legalización del aborto, Ȳ = 8 y S = 5. Queremos saber, a un nivel de confianza del 99%
qué tamaño debe tener la muestra para que la media estimada no se aleje más de ± 3
puntos de la media poblacional: b) 26
71. En una investigación sobre ansiedad, contrastamos la hipótesis nula de que la media
poblacional e igual o mayor que 10. i sabemos que el valor muestral del estad stico de
contraste z = 2,88 y el nivel crítico, p= 0,002, ¿qué significa esta p?:
a) Que la probabilidad de obtener un estadístico de contraste igual o menor que el hallado
es 0,002.
72. Teniendo en cuenta los datos del problema anterior y adoptando un α= 0,01:
a) Se rechaza H0, puesto que p < α
3. El estadístico de contraste Z para una media vale 3, siendo alfa igual a 0,05, n = 120, y el
contraste bilateral: c) Se rechaza H0
11. Cuál de las siguientes afirmaciones es correcta: b) En el caso de una sola muestra y si
se conoce la varianza de la población el estadístico de contraste para la varianza es Z.
12. Las condiciones para poder aplicar el estadístico de contraste Z en el caso de la
proporción (una sola muestra) incluyen: a) Muestra aleatoria de n observaciones y
población dicotómica.
13. Tenemos una población normal con varianza conocida. Se toma de ella una muestra de
tamaño n = 15. Para estimar el valor del parámetro media poblacional μ, utilizaremos un
estadístico de contraste cuya distribución es: a) Normal (N(0,1))
15. La prueba de Wilcoxon para una muestra: b) También conocida como prueba de
rangos y signos.
19. Las condiciones para poder aplicar el estadístico de contraste S (signos) en el caso de
una sola muestra: c) Muestra aleatoria de n observaciones y cualquier tipo de distribución
20. El estadístico S se aproxima a una distribución normal: c) Siempre.
22. Para probar hipótesis relativas a la mediana, cuando se cumple la aleatoriedad de las
observaciones, la distribución de la variable es simétrica en la población y el nivel de
medida de intervalos, aplicaremos la prueba de: a) Wilcoxon antes que la de signos porque
aporta más información.
23. Para contrastar hipótesis sobre la mediana, si queremos utilizar la prueba de Wilcoxon,
es necesario que el nivel de medida de los datos sea, al menos: c) De intervalo
27. En una distribución muestral normal (del estadístico media), con una media de 30 y
una desviación típica de 16, ¿qué probabilidad hay de obtener al azar una media
comprendida entre 14 y 26?: b) 0,6826
28. En una muestra aleatoria de 101 sujetos, procedentes de una población normal e
infinita, se ha obtenido una media igual a 40 y una desviación típica igual a 15. ¿Qué
porcentaje de medias hay comprendido entre los valores t picos = 2,4 y = 1,5 de la
distribución muestral de la media?: a) 92,5%
30. Teniendo en cuenta los datos del problema anterior, qué media de esa distribución
muestral dejará por debajo de sí el 90% de los casos: a) 47,02
31. A una muestra aleatoria de 17 estudiantes de secundaria se les aplicó una prueba cuya
finalidad era medir sus conocimientos sobre conceptos científicos básicos. En la variable
analizada, los estudiantes se distribuyen normalmente con una media igual a 78. Los
resultados del estudio en la muestra fueron: media igual a 84,984 y desviación típica igual
a 16. El intervalo de confianza de la distribución muestral será: α = 0,05 ± 2,12
32. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste será:
b) t = 1,746
33. con los datos de los dos problemas anteriores, el criterio de decisión será:
c) Para un n. c. del 0,95 no podemos aceptar la H1.
34. Una muestra aleatoria de 30 personas presenta una desviación típica, en la variable
“tiempo de ejecución” de una tarea de reconocimiento de palabras, igual a 120 segundos.
Queremos saber si es compatible este resultado, a un nivel de confianza de 99% con el
supuesto de que la desviación típica en la población (para esta variable), con una
distribución normal, es de 150 segundos. Teniendo esto en cuenta, el planteamiento de las
hipótesis sería: b) H0 : σ2 = 1502 y H1 : σ2≠ 1502
35. Con los datos del problema anterior, el estadístico de contraste será:
a) χ2 = 19,2
36. Teniendo en cuenta los datos de los dos problemas anteriores, el intervalo confidencial
será: c) 13,1 < χ2 < 52,3
37. La decisión tomada sobre los resultados será la siguiente: c) Como nuestro estadístico
de contraste se encuentra en el intervalo confidencial al 99% de n. c., no podemos rechazar
la hipótesis nula.
38. Con muestras aleatorias de 121 sujetos, la distribución muestral de la media (de una
variable que se distribuye normalmente en la población) tiene una media de 25 y como
desviacióntípica de 10. La formulación de las hipótesis será: n.c. : 95% a) H0 : μ = 25 y H1 : μ
≠ 2539. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste
para comprobar que una muestra del mismo tamaño con media = 28 y desviación típica =
30 pertenece a la misma población será: a) Z = 0,3
41. En una muestra aleatoria de 200 sujetos, procedentes de una población normal e
infinita, se ha obtenido una media igual a 60 y una desviación típica igual a 20. Cuál será el
error típico de la media: c) 1,42
42. Un educador piensa que sólo un 15% de los alumnos de cuarto de primaria, del colegio
en el que trabaja, son capaces de manejar con rapidez el diccionario. Para comprobar lo
que piensa, selecciona al azar una muestra de 150 alumnos de ese curso y les realiza una
prueba de manejo del diccionario. Teniendo en cuenta estos datos, la formulación de las
hipótesis estadísticas será: α = 0,05 a) H0: π = 0,15 y H1: π ≠ 0,15
43. Teniendo en cuenta los datos del problema anterior, el contraste será:
c) Bilateral
44. El estadístico de contraste para los datos de los dos problemas anteriores será:
b) Z = 1,715
45. Atendiendo a los datos de los problemas anteriores, la interpretación de los resultados
será: b) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador
está justificada, es decir, que sólo un 15% de los alumnos maneja con rapidez el
diccionario.
TEMA 3
1. Los diseños de investigación intersujetos determinan analizar los datos con estadísticos
de contraste para: b) Muestras independientes
7. Queremos contrastar que H0: π21 = π12. Hemos estimado que la diferencia entre las dos
proporciones poblacionales estará entre los valores 0,047 y 0,470 con una probabilidad
igual a 0,99. Se podría interpretar que: a) Ambas proporciones son distintas
12. El estadístico de contraste en el caso de los datos del problema anterior sería:
b) Z = 6,9
13. La conclusión obtenida en nuestro análisis sería: a) Para un n. c., igual a 0,99, la
diferencia entre la proporción poblacional de mujeres que detectan la presencia de
moléculas de androsterona y la de los varones es distinta de 0,10.
15. Atendiendo a los datos del problema anterior, la zona de rechazo de la hipótesis nula
está formada por: b) Todos los valores iguales y menores que t7, 0,025 = 2,36 e iguales y
mayores que t7, 0,975 = 2,36
16. Continuando con el problema anterior, el valor del estadístico de contraste será:
a) t = 3,52
17. Según los datos de los problemas anteriores (14, 15 y 16), podemos afirmar:
a) Que los resultados llevan al rechazo de H0, a un nivel de significación igual a 0,05, de
que las muestras proceden de dos poblaciones con medias iguales.
18. Queremos comparar el método tradicional (T) de la UNED con un método nuevo, en
concreto, un método multimedia (M), para la enseñanza a distancia de la estadística.
Nuestra hipótesis es que los alumnos que estudien con el método tradicional obtendrán
unas notas inferiores a las de los alumnos que estudien con el método multimedia.
Extraemos aleatoria e independientemente 7 alumnos del segundo curso de psicología de
la UNED y les asignamos también aleatoriamente a los dos métodos de enseñanza. Los
datos que aparecen a continuación representan las notas obtenidas en un examen de
estadística en ambas muestras de alumnos:
Método Tradicional (MT): 4 5 6 2
Método Multimedia (MM): 9 8 10
La nota en estadística es una variable medida a nivel de intervalo que se distribuye
normalmente en ambas poblaciones con varianzas: σ2T = 4 y σ2 M = 2. N. c. 95%. Teniendo
en cuenta estos datos, ¿cuál será la formulación de las hipótesis estadísticas?:
b) H0: μT ≥ μM y H1: μT < Μm
19. Atendiendo a los datos del problema anterior, el valor del estadístico de contraste será:
c) Z = 3,68
20. Continuando con los datos de los problemas anteriores, podemos afirmar que: b) A
nivel poblacional, los alumnos que estudiaron con el método tradicional tienen una
nota media en estadística inferior a los que estudiaron con el método multimedia,
asumiendo un nivel de significación igual a 0,05.
21. Algunas variables ejercen su influencia sobre las conductas haciendo éstas más o
menos variables. Un investigador quiere investigar esta cuestión en la conducta afectiva de
los niños. Su hipótesis es que la conducta afectiva de los niños es menos variable que la de
las niñas. Extrae una muestra aleatoria de 41 niñas y otra de 31 niños y les mide la
afectividad mediante un cuestionario obteniendo una varianza insesgada igual a 9 en la
muestra de niños y una de 36 en la muestra de niñas. La variable puntuación en el
cuestionario de afectividad está medidaa nivel de intervalo. ¿cuál será el planteamiento
de la hipótesis estadísticas? (N. c. 99%)
c) H0: σ2A ≤ σ2 O ó H0: σ2A / σ2 O ≤ 1 y H1: σ2A > σ2 O ó H1: σ2 A / σ2 O > 1
22. El estadístico de contraste, atendiendo a los datos del problema anterior será:
c) f = 4
23. La zona de rechazo de la hipótesis nula estará formada por todos los valores:
a) Todos los valores iguales y mayores que f0,99; 40, 30 = 2,30
26. Tras realizar análisis estadístico sobre dos muestras de 7 y 8 sujetos, los resultados
apoyan la hipótesis del investigador de que la relajación influye positivamente sobre la
elasticidad en los deportistas. Los resultados obtenidos son los siguientes:
Grupo 1: n=7 ȲR = 125,8 σ2 R = 68,7 (Grupo con relajación) Grupo 2: n=8 ȲNR=119,5 σ2
NR =61,67 (Grupo sin relajación) ¿Cuál será la magnitud de la mejoría de la elasticidad tras
aplicar la relación?: a) 0,78
27. Un psicofísico hipotetiza que los hombres y las mujeres no son igualmente variables en
sensibilidad olfativa. Extrae una muestra aleatoria de 13 hombres (H) y otra de 25 mujeres
(M) y les mide la sensibilidad olfativa, obteniendo una varianza insesgada igual a 10 en la
muestra de hombres y de 17 en la de mujeres. La sensibilidad olfativa es una variable
medida a nivel de intervalo que se distribuye normalmente en ambas poblaciones. N. c.
90%. ¿Cuál será la formulación de la hipótesis estadística?:
b) H0: σ2M = σ2 H ó H0: σ2M / σ2H = 1 y H1: σ2 M ≠ σ2 H ó H1: σ2M / σ2H ≠ 1
28. La zona de aceptación de la hipótesis nula, teniendo en cuenta los datos del problema
anterior, está formada por todos los valores : a)f0,05; 24, 12 = 0,46 < H0 < f0,95; 24, 12 = 2,51
29. El estadístico de contraste, atendiendo a los datos de los dos problemas anteriores
será: c) f = 1,70
30. atendiendo a los datos de los problemas anteriores, (27, 28, 29), ¿se rechaza la
hipótesis nula?: b) No, ya que el valor del estadístico de contraste cae dentro de la zona de
aceptación de la hipótesis nula
31. Siguiendo con los problemas anteriores, ¿apoyan los resultados la hipótesis del
investigador?: a) No, ya que se acepta la hipótesis nula.
35. Teniendo en cuenta los datos del problema anterior, se rechazará la hipótesis nula?:
a) No, porque p = 0,1416 > α = 0,01
36. Según los resultados de los problemas anteriores, a qué conclusiones llegaremos:
b) La relajación no ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.
37. Un investigador quiere estudiar el efecto de la privación de agua sobre el tiempo que
tardan las ratas en recorrer un laberinto. Extrae aleatoria e independientemente 60 ratas y
les asigna también aleatoriamente a las dos condiciones del experimento: 12 y 24 horas de
privación de agua. Las 30 ratas sometidas a 12 horas de privación de agua (muestra A)
tardaron un tiempo medio de 5,9 minutos en recorrer un laberinto y las 30 ratas
sometidas a 24 horas de privación (muestra B) tardaron 6,40 minutos en recorrer el
mismo laberinto, siendo las desviaciones típicas isesgadas 0,29 y 0,30 respectivamente.
Sabiendo que el n. c. fijado por el investigador es del 95%, cuál será el planteamiento de
las hipótesis estadísticas: a) H0: μA = μB ó μA μB = 0 y H1: μA ≠ μB ó μA μB ≠ 0
38. El estadístico de contraste atendiendo a los datos del problema anterior, será:
c) t = 6,58
40. ¿Se rechazaría la hipótesis nula?: b) Sí, porque la probabilidad asociada al estadístico
de contraste obtenido es menor que el nivel de significación acordado en nuestra
investigación.
TEMA 4
1. Un ejemplo de muestras relacionadas son las obtenidas:
a) Con un diseño clásico antes y después de un tratamiento.
2. Cuando hallamos los valores críticos del estadísticos T, para dos muestras relacionadas,
con más de 30 grados de libertad, acudimos a la tabla de distribución: c) Normal.
4. Cuando hallamos los valores críticos del estadístico T, para dos muestras relacionadas,
con más de 30 grados de libertad, acudimos a la tabla de distribución:
a) Normal
6. Cuando se mida una variable en los dos miembros de n pares de sujetos siendo los
miembros de cada par muy similares en variables relevantes del estudio, asumiremos que
las observaciones de ambas muestras: a) Están relacionadas pero ello no implica que las
diferencias entre cada par de observaciones lo estén.
7. Se desea estudiar si una terapia de relajación reduce el nivel de ansiedad. Se obtiene una
muestra aleatoria de 8 sujetos y se les toman medidas en ansiedad antes y después de
aplicarles la terapia. Sabemos que la variable está medida a nivel de intervalo y que la
distribución poblacional de las diferencias entre cada par de puntuaciones es simétrica en
torno a la medida de tendencia central. ¿Qué estadístico de contraste aplicaría?:
W de Wilcoxon
11. El cometido del Análisis de Varianza es: c) Discernir qué variabilidad corresponde al
factor estudiado y cuál al error experimental.
13. Con el ANOVA contrastamos, la diferencia de: b) Medias entre varias muestras
18. Cuál será el resultado de nuestro estadístico atendiendo a los datos del problema 24?.
c) F= 11,36
19. Cuál será nuestro valor crítico, atendiendo a los datos del problema 24? b) 4,414
20. A un n.c. del 95% aceptaríamos la Hipótesis alternativa?: (datos del problema 24)
a) Sí porque el valor del estadístico es mayor que nuestro valor crítico.
21. Teniendo en cuenta los resultados obtenidos en los ejercicios anteriores (24 al 27), la
conclusión a la que hemos llegado es la siguiente: c) Al haber obtenido una diferencia
significativa en nuestro estudio, se deduce que el ambiente en el que se desarrolle un niño
influye en las puntuaciones obtenidas en un test de inteligencia.
5. El valor crítico obtenido, atendiendo a los datos del problema anterior, será:
a) 4,87
6. Con un nivel de confianza del 99% podemos afirmar (según los datos de los problemas 4
y 5):
c) Que existen diferencias significativas entre al menos dos de los algoritmos en número
de emparejamientos incorrectos.
7. Se lleva a cabo una investigación para estudiar si las Técnicas de Inoculación de Estrés
(TIE) tienen efecto sobre la ansiedad precompetitiva de los corredores de velocidad. Para
ello, se seleccionaron aleatoriamente 12 atletas de entre todos aquéllos que puntuaron
alto en una batería de tests de ansiedad y se les enseñaron la TIE. Para estudiar el efecto
de las TIE se tomaron cuatro medidas de ansiedad precompetitiva mediante un
cuestionario específico en cuatro ocasiones: la 1ª fue tomada en una situación de
laboratorio antes de enseñarles las TIE (LA), la 2ª en una situación previa a la competición
antes de la TIE (CA), la 3ª en una situación de laboratorio después de las TIE (LD) y la 4ª
en una situación previa a la competición después de las TIE (CD). Teniendo en cuenta un
n.c. del 99% y que la suma de cuadrados del tratamiento vale 26,25, la suma de cuadrados
error vale 52,25 y la suma de cuadrados total vale 297,25, ¿cuál será el valor del
estadístico de contraste?: c) 5,526
8. El valor crítico, según los datos del problema anterior es: b) 4,51
9. Atendiendo a los datos de los dos problemas anteriores, podemos concluir que:
a) Existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.
3. Cuál sería el valor crítico para la interacción de ambos factores (AB): c) 3,55
4. Continuando con el problema 1, hemos obtenido las siguientes sumas de cuadrados:
SCA = 73,5 SCB = 312,33 SCAB = 7 SCS/AB = 47 A la luz de los resultados podemos concluir, con
respecto al factor A (ratas): b) Existen diferencias significativas entre los dos grupos de
ratas
10. Tras realizar el cálculo de los estadísticos, podemos concluir, refiriéndonos al factor A:
b) No existen diferencias significativas entre las ratas
11. Del mismo modo, podemos concluir acerca del factor B (adiestramiento):
b) No existen diferencias significativas entre los adiestramientos.
I
NTRODUCCI
ÓN.CONSEJOSBÁSI
COSDEESTUDI
O
I.
-Elexamenconst
adet r
essi
tuaci
ones,cadaunadelascual
escompr
ende
unmíni
mode7preguntasyunmáximode10, par
auntot
alde25:
II.
-Apr oximadament eent r
e2/ 5ylami taddel aspreguntassondet eorí
a.Es
fundament aldomi narl
a,por quesisecont estanbi enlaspr eguntasdet eoría,
supone2/ 3delapr obadoysisecont estanmal ,esimposibl
eapr obaraunquese
haganbi enl ospr oblemas.Ademássudomi nioper mit
epl antearyr esolv
erlos
correctament e.Esmuyi mpor t
antefij
arsebi enenl oquepidenyl osdat osque
nosof recenpar aident i
fi
carelpr obl
ema:“ Distintoodi f
erent
e”,implicacontraste
bil
ateral(doscol as);“may oromenorque” ,unil
at er
al(unacola).Cuandosehabl a
deunpar ámet r
ogenér i
co, seestánrefi
ri
endoal amedia;porcentaj
eesl omi smo
quepr oporciónyv ariabi
li
dadesv ari
anzaodesv i
acióntí
pica.
Latécni
caopr
ocedi
mient
opar
aelcont
rast
edehi
pót
esi
sessi
empr
ela
mi
sma:
1.-Det er
minaci
ón delossupuest osdelproblema(ti
posdedi seño yde
contr
aste).
2.-Formulaci
óndelashipót
esisest
adíst
icas(
nulayal
ter
nati
va).
3.-Elecci
ónycálculodelestadí
sti
codecontraste(
EC),el
i
giendolafór
mula
corr
ecta.
1
4.
-Deci si
ónsobreelrechazoonodel ahi
pótesi
snul
aplanteadaparaelnivel
designifi
caciónαdeseadooquenosden,medi ant
elacompar aci
ónentreel(o
l
os)v alor
(es)crí
ti
co(
s),cálculodelni
velpcr
ít
ico,t
amañodelef ect
oyav eces,
pot
enci adelcontr
ast
e.
6.
-Concl usión e i
nter
pr et
aci
ón de l
os r
esult
ados en elcontext
o de la
i
nvestigaci
ón.
TEMA1:
ESTI
MACI
ÓNDEPARÁMETROSYCONTRASTEDEHI
PÓTESI
S
1.
-Concept
osbási
cos.
Lainfer enci
aestadísticaesl apartedel acienci
aest adísticaqueestudi
alos
procedimi entosat r
avésdel oscualessepuede:
Esti
marconunel ev adogr adodepr obabi
li
daddet erminadaspr opi
edadeso
parámet ros de una pobl ación,parti
endo de l os estadísticos di
sponibl
es o
calculadosenunamuest r
adel ami smaobt eni
dadef ormaal eator
ia.
Al ai nversa,estudiarsidet erminados v al
ores muest ral
es se apart
an
si
gni f
icati
v ament edelospar ámet r
ospobl aci
onales.
-Eler
rormuestralesladi
fer
enci
aentreelresul
tadoobteni
doenlamuest
ray
el
quehabr í
amosobt eni
dosisehubi
esetrabaj
adocont odalapobl
aci
ón.
-Eler
rortí
picoesladesvi
aci
óntí
picadelestadí
sti
co.
a)Dist
ribuciónde( oen)l amuest ra:Sonl osdat osov al
ores(dist
ribuciónde
fr
ecuenci as)quet omal avariableenunamuest r
aconcr eta.Lamedi a,
medi ana,proporción, desvi
aci
ónt í
pica,correl
ación,
etc.delamuest ra,son
l
osest adísticos.
b)Dist
ribución pobl acional:Son l os dat os o v al
ores (distr
ibución de
fr
ecuenci as)quet omaunav ariableenelconj untodel apobl ación.Su
medi a,medi ana,pr oporci
ón,desv i
aciónt í
picas,et
c.sonl ospar ámet ros
poblacionales.
c)Dist
ribución muest ralde un est adíst
ico:Son l os datos o v alores
2
(di
stri
bucióndef r
ecuenci
as)quet omaunav ari
abl
eoest adísti
coenel
conjuntodet odaslasinf
init
asmuest r
asquepuedenobt ener sedeuna
población.Comoent odadist
ri
buci
ón,tambiéndeladist
ri
buci ónmuest ral
,
podemos obt enersu medi a ysu desvi
ación t
ípi
ca o errort í
pico del
estadísti
co.
Cuandolosestadíst
icos(muestrales)seref
ier
enaunamuest raconcreta,se
desi
gnanconl et
raslati
nasmayúscul as(Mediadelamuest r
a=Y,Varianzadel a
muest a=S2,
r Proporci
óndel amuest ra=P).Losmi smosparámet
rosrefer
idosa
l
apobl aci
ón,
seindicanconloscaracteresgri
egosequival
ent
esenminúsculas( µ,
2
π,σ) .
3
2.Di
str
ibuci
ónmuest
ral
del
aMEDI
A.
Hayquedi
sti
ngui
rtr
essupuest
os:
1.-Siladistr
ibuci
ónpoblacionaldel av ariabl
edeest udioesnor malcon
mediaµ yv ar
ianzao desvi
aciónt í
pica σ conocidas,coni ndependenciadel
tamañodel amuest r
a,ladi
stri
buciónmuest raldelestadíst
icomedi aest ambi
én
normal,siendo su media y desviaci
ón típica (o err
ort ípi
co de l a media),
respect
ivamenteµY yσ/n( fórmula1,pág.9delf ormulario).Sitipif
icamoslas
medidas,seráN(0,1)
.
2.-Sisedesconocel avari
anza(olaformadeladistr
ibuci
ónpobl
acional
),el
estadísti
co mediasedi st
ri
buyecomo unaT deSt udent,conn-1gradosde
l
ibertadyusar emosladesvi
aci
ónt í
picai
nsesgadaocuasidesvi
aci
óntí
picadela
muest ra(fór
mula2,pági
na9del f
ormular
io,oj
osiempren-1envezden).
3.Di
str
ibuci
ónmuest
ral
del
aPROPORCI
ÓN.
Enlasv ari
ablesdi cotómicasodi cotomi zadas(lasquesól opuedent omar
dos valores),la propor ci
ón es elpor centaje de elementos que t i
enen una
deter
minada pr opi
edad ( éxi
to)en r el
ación con elt otal
.Las probabi l
idades
asoci
adasacadav alorconcr etosedi st
ribuyensegúnl adist
ri
buciónbi nomi al
conparámet rosnyπ.Conmuest r
asgrandesl abinomi alti
endeaapr oximar sea
l
anor malN( π,σp),(f
ór mula3, pági
na9delcuader ni
ll
o).Enestaasignaturapar a
resol
verlospr oblemassól oseusal adistr
ibuciónnormal .
4.Di
str
ibuci
ónmuest
ral
del
aVARI
ANZA.
Ladistri
buci
ónmuestr
aldelavari
anzaseaj aaunaχ2(
ust chi
-cuadr
ado),con
2
n-
1gr adosdel i
ber
tad.Cuandolamuestraesmay orde100,laχ t i
endeal a
2
nor
mal ,aunquel
avari
anzasi
guedist
ri
buyéndosesegúnlaχ.
Esmuyimport
anter
etenerquecadaestadí
sti
cosedist
ribuy
econsupr opi
a
funci
óndedist
ri
buci
ónquenocambi aconelt amañodel amuest r
a;cuesti
ón
dif
erent
eesqueporelTCLcuantomay orsealamuest
ra,taldi
str
ibuci
ón(Tde
4
Student
,binomi
alochi
-cuadrado)seapr
oxi
memásal anormal,
perodebeusarse
si
empr elaf ór
mula delest adí
sti
co que cor
responda,aunque l
uego dicho
estadí
sti
coseuseenlatablanormal.
5.
-ESTI
MACI
ÓNDEPARÁMETROS:
PUNTUALYPORI
NTERVALOS.
Laspr
opi
edadespr
inci
pal
esdel
osest
imador
esson:
La propi
edad de l
os est
imador
es i
nsesgados yef
ici
ent
es (
con v
ari
anza
pequeña)sell
amaacuraci
dad.
Losest adí
sti
cosmedi a,pr oporciónycoef i
cientedecor rel
aciónmuest r
ales
son est imadores insesgados,ef icient
es,consi stent
es ysuf icientes de los
parámetros media,pr oporción y coef i
cient
e de cor rel
ación pobl aci
onal.La
medianaesef ici
enteyconsi st enteper onoesi nsesgada;nitampocosuf ici
ente
alusarsólolosvalor
escent ralesdel amuest r
a.
La v ari
anza muestralno es un est imador insesgado de l av ari
anza
poblacional
,aunquesícumpleconlasotrastrespropiedades.Porelcontrar
io,l
a
cuasivari
anzamuest r
al( ovar
ianzainsesgada,calculadasobren- 1)síesun
esti
madori nsesgadodel av
ari
anzapoblacional,per
oesmenosef i
cient
equel a
vari
anzamuest ral
.
5
Resumendel
aspr
opi
edadesdeest
adí
sti
cos
Car
enci
adesesgo Ef
ici
enci
a Suf
ici
enci
a Consi
stenci
a
Medi
aAr
it
mét
ica SI >Medi
ana SI SI
Medi
ana NO <Medi
a NO SI
Pr
opor
ción SI -
--
-- SI SI
Var
ianza NO >S2n-1 SI SI
2
Cuasi
var
ianza SI <S SI SI
Laesti
macióndepar ámet rosapar ti
rdel osest adí
sticosmuest ralespuede
serpuntualoporinter
valos.Enl aesti
maciónpunt ualseut i
li
zadi r
ectament eel
valordelest adí
sti
co calculado en una muest ra aleatori
a concret a como
verdaderoval
ordelpar ámetropobl acional.Sinembar go,comoesmuypoco
probablequeasíocurr
a,espr efer
ibl
edef i
niruni nt
ervalodev al
oresent r
ecuy os
l
ími tes i
nfer
ior y super i
or se encont r ar
á, con una al ta pr obabil
idad
predeter
minada,elver
dader ov al
ordelpar ámet r
o.A est epr ocedi
mient osel e
conoceconel nombredeest i
maci ónporinter v
alosdeconf ianza.
Lapr obabil
idadsobrelaquesecalcul
aelinterv
alodeconfianza,sel l
ama
ni
veldeconf i
anza(1-α)ysedefinecomol apr
obabil
idaddequeelpar ámetro
poblacionalestéconteni
do ent
relosextremosdeli nt
erv
alo.Lapr obabil
idad
compl ementari
a delnivelde confi
anza (α)r
ecibe elnombr e de nivelde
si
gnifi
cación.
Par auntamañodemuest r
adado, cuantomay orsealaamplituddeli nter
valo,
may orseráelni veldeconfianza(pr
obabi l
idaddequeelv al
orpobl aci
onalest é
dentrodelmi smo),peromenorl apr eci
sión( puestoqueeli nt er
valoesmás
ampl i
o).Cuant omay orsealadisper
siónmuest ral(var
ianzaodesv iaciónt í
pica,
sesgadaoi nsesgada),menorser áelni veldeconf i
anza.Sóloalaument arel
tamañodel amuest ra,seincrementanl apr ecisi
ónyelni veldeconf ianza.En
consecuencia,par aunni veldeconf ianzadado,l aampl i
tuddeli nt
er v
alo de
confianzatendráqueserporf uer
zamay orcuant omenorseaelt amañomuest ral
ocuant omay orsealadispersi
ónmuest r
al.
Losint
erval
osdeconf i
anzasecal cul
ansegúnl asfórmulascorrespondient
es
acadaestadíst
icoenlacolumna2ªdel apági na9delformular
io.Par alamedia
seuti
li
zaladelafil
a1ªsi l
avari
anzapobl acionalesconoci
da(normal )olasdela
2ªsiesdesconoci da(TdeSt udent,aproximadaporl anor mal,sin>100per o
usandolamismaf órmul
adelestadísti
co).Paralaproporci
ón,l
afila3ª( nor
mal)y
2
paralavar
ianza,l
a4ª( χ,aproxi
madaporl anormalsin>100,fi
la5ª ).Entodos
l
oscasos,unami taddelniveldesignifi
caciónα/ 2quedaporenci madell ímit
e
superi
orylaotr
a,pordebajodell
ímiteinf
eriordeli.
c.
Cuandol
afunci
óndedi
str
ibuci
óndelest
adí
sti
coessi
mét
ri
ca(
nor
maloTde
6
Student
),bastaráconcal cularelvalorcorrespondientea1- α/
2,calculareler ror
máximoysumar l
oyr estar
lodelv al
ordel amedi aopr oporci
ónmuest r
al,que
ocuparáelv alorcentral(mediaopr oporci
ónmuest ral+/ -Emax).Sinembar go,
cuandonol oes( varanza,χ2,chi
i -cuadrado),hayquebuscarenl at ablalosdos
valor
escorrespondi entesaα/ 2ya1- α/2par acal cularlosl ímit
esi nferiory
superi
ordeli nterval
odeconf i
anza,estandoelv alorinferi
ordeli nterval
omás
próxi
moal av arianzamuestralqueel superi
or.
N(
0,1) t
n-1gl
2 2
Dist
ri
buci
ónNor
mal
(Conoci
daσ) Desconoci
dal
aσ (
Muest
ras
pequeñas)
̅ ̅ ̅
X-(
Zα/2)·(
σX/ n)<µ<X +(
Z1-α/2)·(
σX/ n) X-( Sn-1/n)<µ<X +(
tα/2)·( t 2)
1-α/ ·(
Sn-
1/n)
7
6.
-CONTRASTE(
opr
ueba)DEHI
PÓTESI
S.
Una hipótesi
s estadísti
ca es una conjet
ura que se for
mula sobre una
pobl
aciónyquepuedesomet erseapruebaocont rast
aci
ónempír
icaaparti
rde
unamuest rarepresentat
ivadeesapobl aci
ón.Unav ezquelahi
pótesi
sseha
contr
astado se pueden t omardeci si
ones sobrel a mi
sma.Elcont r
aste de
hi
pótesisesunapar t
eesenci aldelmétodoci
entíf
ico.
Paraelcont
rast
edehi
pót
esi
ssedebenf or
marunahi
pót
esi
snulaH0 yot
ra
al
ternat
ivaH1.Enlahi
pót
esi
snula,f
orzosament
edebeest
arelsi
gnoigualy
8
ademáspuedenestarelmayorqueoelmenorque,per
onoambosalav ez.Enl
a
H1nuncaest
áelsignoigual
,conl
asexcepci
onesquesever
ánencadacaso.
Engener al,l
ahi pótesisnulaaf i
rmaquenoexi stedif
erenci
aent r
eelv alordel
estadí sti
co obt enido en l a muest ra yelque f or
mul amos como par ámet ro
pobl acional,esdeci r,
quel adiferenciaobser vadaentreestosdosv al
oresesnul a.
Sin embar go,como elv al
ordelest adísti
co muest raly eldelpar ámet ro
pobl acionalr aravezcoi ncidi
rán,loqueseaf i
rmaesquel adifer
enciaobser vada
entreambospuedeexpl i
carsecomo r esult
ado delazar .Esto es,quesise
repitiesel ai nvesti
gaciónunnúmer osuf ici
ent edev ecesconot r
asmuest ras
aleator i
as delmi smo t ipo yt amaño ext raídas de l
a poblaci
ón,l a mediao
esper anza mat emát i
ca de l as diferencias observadas entr
el os valores del
estadí sti
coyelpar ámet ropobl acionalformul adoenlahi pót
esisnulatenderíaa
desapar ecer( v
alorcero).
Paracadahipótesisnulaseplanteaunahipótesi
salter
nat
iva,r
epresentada
porH1,queeslanegaci óndel ahi
pótesi
snula,detalformaquesilahi pótesi
s
nul
aesf al
sal ahipótesisalt
ernat
ivati
enequeserf or
zosamenteverdader ay
vi
cever
sa.Por tanto,est as dos hipótesi
st i
enen que ser exhaustivas y
mutuamenteexcl
uyentes.
Dependiendodecómoest éformul
adalahi pótesisnulasemarcaladi recci
ón
delcontr
aste.Sil
ahipót
esisnulaH0estáplanteadacomoi gual
daddev aloresyla
al
ternati
vaessunegación,esuncont r
astebilateralporquelaH1 admitequel a
dif
erenci
apuedaserposi t
ivaonegat iv
a.Si,porelcont rari
o,conocemosquel a
dir
ección en quelaH0 puedeserf alsasólo puedeserposi ti
vao negat i
va,
entoncestendremosuncont r
asteunil
ater
al.Ser áuncont r
ast
eunilat
eralderecho
siestamosbuscandounv al
orsuper i
oralpost ul
adoporl aH0 ei zquierdosi
estamosbuscandounv alorinferi
orparaelpar ámetropoblaci
onal(θ)dequese
tr
ate:
Cont
rast
ebi
l
ater
al Uni
l
ater
alder
echo Uni
l
ater
ali
zqui
erdo
H0:θ=θ0 θ≤θ0
H0: θ≥θ0
H0:
H1:θ≠θ0 θ>θ0
H1: θ<θ0
H1:
Elcontr
astebilat
eralsi
empreesmásconservador
,enelsent
idodequehace
másdi
fíci
lrechazarl
ahipótesi
snul
apar
aunmi smoniveldeconf
ianza.
El
procedi
mient
opar
ael
cont
rast
edehi
pót
esi
sesel
sigui
ent
e:
9
a.
-Condici
onesde l ainvesti
gaci
ón ysupuest
osque cumplen l
osdatos
obser
vados.Lavar
iabledebesercuanti
tati
vaymedir
seconunaescal
aderazón
odeinter
val
o(nosirv
epar avar
iabl
esordinal
esonominal
es)
.
c.
-El
ecci
ónycál
cul
odel
est
adí
sti
codecont
rast
e.
Elestadí
sti
co de contr
aster epr
esenta una medida est
andari
zada de la
discrepanci
a entr
elai nf
ormación proporcionada porlos datos empír
icos
recogidosenlamuestr
ayl aproposici
ónteóricaplant
eadaenlahipót
esisnul
a.
Elest
adí
sti
codecont
rast
eomedi dadediscrepanci
anodependedel
as
uni
dadesenqueest
émedi
dalavar
iabl
eysuf
ormulaciónhabi
tual
es:
d.
-Regl
adedeci
sión,
deacuer
doconel
niv
eldesi
gni
fi
caci
ónα.
CONTRASTEUNI
LATERALI
ZQUI
ERDO CONTRASTEUNI
LATERALDERECHO
Zona ZonaAcept
aci
ón ZonaAcept
aci
ón Zona
RechazoH0 H0(
1–α) H0 (
1–α) RechazoH0
|
--
--
--
--
-|
--
--
--
--
--
--
--
---
--
---
--
----
--
--
--
--
--
--
--
-| |
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
|-
--
--
--
-|
α / VALOR CRÍ
TICO VALORCRÍ
TICO / 1-α
CONTRASTEBI
LATERAL Val
oresα/1-α/Zmásf
recuent
es
11
Val
orcr
ít
ico(
Zα/2) Val
orcr
ít
ico(
Zα/2) α 0´
05 0´
01 0´
001
1-α 0´
95 ´
99 0´
999
Z -1´
96 - -
α/
2 2´
58 3´
29
Z1-α/2 1´
96 2´
58 3´
29
α Ni
vel
desi
gni
fi
caci
ón
1–α Ni
vel
deconf
ianza
Zα/2 Z(
Tabl
aII
Inegat
iva)
Z1-α/2 Z(
Tabl
aIVposi
ti
va)
Lasgr
áfi
cassei
nter
pret
andel
asi
gui
ent
emaner
a:
Elnivelde signifi
cación que suele ut i
li
zarse en l a mayor í
a de las
i
nvest
igaci
onesesdel0, 05,aunqueeninvestigacionesmásr i
gur
osasset r
abaj
a
conunniveldesi
gnif
icaciónde0,01yauni nferi
or.Ser echazarál
ahipótesisnul
a
si
emprequel apr
obabili
daddeexpl i
carlosresultadosobt eni
dosenr el
aciónala
H0seamenorqueel niv
el designi
fi
caci
ón.
Unav ezfi
jadoelni
v eldesignif
icación,seobtienenelval
oroval
orescr í
ti
cos
deladi st
ri
buciónmuestralquemar caránl oslí
mitesdel azonadeaceptaci
óno
rechazodel aH0 oseal amáxi madi ferenci
aquepodemosadmi ti
r,porsimple
azar,entr
eelvalort
eór
icoplanteadoenH0yel valorobteni
doenlamuestra.
Lazonader echazodelaH0dependedelniveldesigni
fi
caciónαyeselár ea
deladistr
ibuci
ónmuest r
alquecorrespondeaunv al
ordel adiscr
epanci
at an
al
ejadodeH0quel aprobabi
li
daddeobtenerl
o,si
endoH0v erdader
a,esi
nfer
ioral
12
valordesi gni
fi
cación.Lar egi
óndenor echazodeaH0,compl ementari
aal a
anteri
or,dependedelni veldeconfianza,1- αyeselár eadel adistr
ibuci
ón
muest r
alquecor respondeav al
oresdel adi scr
epanci
atanpocoalejadosdel
formuladoenlaH0quel aprobabi
li
daddeobt ener
lossi
endoH0v
erdaderaesmuy
elevada,noexi
sti
endoev idenci
apararechazar l
a.
Port anto,sielestadísti
codecont rast
esesi t
úaenl azonadeNOr echazo, l
a
diferenciaobser vadanoessi gnif
icati
vaysedebeaer roresal
eat or
iosporl oque
nopodemosr echazarlahipótesisnulaconundet er
minadoni veldeconf ianza.En
caso de si tuarse en la zona de r echazo,diremos que elv alordelEC es
si
gni fi
cat i
vo par a un determinado ni velde signifi
cación y se r echazarál a
hipótesisnul a.Endef i
niti
va,sielv alorabsolutodelECesmay orqueelv al
or
críti
co( elcorrespondientealniveldesi gni
fi
cación),
ser echazalahipót esisnulay
noser echazar áencasocont r
ari
o.
Ladecisiónpuedetomarsetambiénmedi
anteelcálcul
odelnivelpcr í
ti
co,
queesl apr obabil
i
daddeobt enerunosr
esul
tadoscomol osobser
v adosenla
muest r
abaj oelsupuest
odequel aH0esci
ert
a.Laregl
adedecisi
ónat r
avésdel
nivelcrí
ti
coesj ustolainv
ersa:Sipes≤α,rechazar
emosH0,ysip>α,nol a
rechazaremos.Estoes:
Ho( Cierta) (
p)esmay orque( α) Elvalorseencuent raenelinter
val
ode
conf
ianza.Elv al
ordelestadí
sti
coest áentrelosvalorescr
ít
icos.
Ho( Falsa)(p)esmenoroi gualque( α)Elv alorest
áf uer
adelinter
val
ode
conf
ianza.Elv al
orabsolutodelestadíst
icoesmay orquelosv al
orescrí
ti
cos.
e.
-Conclusi
ón.Formulada l
a hipótesi
s nula,provisi
onalmenteverdadera,
someti
daacont r
asteempí
ri
coyunav ezcal
culadoelestadíst
icodecontr
aste,se
concl
uyerechazándol
aomant eniéndolasegúnseai ncompatibl
eonoconl a
evi
denci
amuest r
al.
f
.-Inter
pret
aci
ón.Laconclusi
ónsi
mpleyl l
anaentérminosderechazoonode
l
ahipót esi
snul
ati
enesucorrespondi
ent
ei nt
erpr
etaci
óndentrodelcontext
odel
a
i
nvestigaci
ónydel ahipótesisyobjet
ivosqueeli nvesti
gadorformulaensu
t
rabajo.
13
2.-For mulacióndel ashi pótesi sestadíst
icas( exhaust
ivasymut uamente
excluy entes)deacuer doconl ahi pótesi
sci ent
ífica(H1yH0).
3.-Elecciónycál cul
odelest adísti
codecont r
asteapropiadoalpr oblema
planteadoycál culoconl osdatosmuest rales.
4.-Fijarα( r
egladedeci sión).Lazonader echazodel aH0est ar
áf or
mada
port odosl osvaloresdelest adísticotanext r
emosquel aprobabili
daddeser
obteni dosesmuypequeñabaj oelsupuest odequel aH0esciert
a.
5.-Deci si
ónsobr eelr echazoonodel aH0 medi anteelnivelcrí
ti
co( p)o
medi ant eelolosv alorescrí
ti
cos( α).
6.-Concl usión ei nter
pretación del osresul t
adosen elcont exto dela
i
nv estigación.
7.
-ERRORESENLADECI
SIÓNENUNCONTRASTEDEHI
PÓTESI
S.
Aldecidirentrelahipótesisnulaosual ternat
ivapodemoscomet erdost i
pos
deerrores:
-Er r
ortipoI(α):Eslapr obabili
dadder echazarunahipótesisnulaverdadera.
Coincideconelni veldesi gnif
icaciónα,fij
adoapr i
oriporeli nvest
igador.Su
compl ement ar
io,probabil
i
dad de acept aruna H0 v erdadera es elni velde
confi
anza.
ErrortipoI I(
β):Esl apr obabil
idaddeacept arunahi pótesisnulafalsa.Su
compl ement ar
io1-β,probabili
dadder echazarunaH0 f alsaesl apotenciadel
contraste.
Deci
sión Nat
ural
ezadeH0
VERDADERA FALSA
Deci
sióncor
rect
a. Deci
sióner
rónea
Nose
Ni
vel
deconf
ianza Er
rort
ipoI
I
r
echaza
1-
α β
Deci
sióner
rónea Deci
sióncor
rect
a
Ser
echaza Er
rort
ipoI Potenciadel
Ni
vel
desi
gni
fi
caci
ónα contrast
e
1-
β
14
Paraigualtamañomuest rall
adi sminucióndelerrort
ipoIaumentaelerror
ti
poII.Laopci ónporunouot rodepender ádelt i
podeexperi
ment oydesus
consecuenci
as;en un t ratamient
o médi co elerrorde ti
po IIes peor( no
benefi
ciar
sedeunt rat
ami entomásef i
caz,frent
ealcostedeinversi
ónenuno
quenol oes).Sinembargo, enunjuicioelerrordetipoIesmásgrave(condenar
auninocente,frent
eadejarlibreauncul pabl
e).
15
TEMA2.
-CONTRASTEDEHI
PÓTESI
SENLOSDI
SEÑOSDEUNAMUESTRA.
1.
-INTRODUCCI
ÓN.(
Fór
mul
asdel
apági
na9del
for
mul
ari
o(UNAMUESTRA)
.
Cuandosetratadeinfer
irl
ascaracterí
sti
casdel apobl
aci
ónapar t
irdel
os
datosrecogi
dosdeunamuest r
a,l
ahi pótesi
sacont r
astarespreci
sament
euna
deter
minadacaract
erí
sti
cadeaquell
a.Loscont rast
esbasadosenunamuestra
puedenser:
-Par
amét r
icos,cuandoser efi
erenalestudiodeunparámet
ropobl
aci
onal
(medi
a,var
ianza,propor
ción,cor
rel
ación,et
c.)enunapobl
aci
ónconunaf
unción
dedensi
daddepr obabil
i
dadconocida.
-Noparamétr
icos,cuandonoser elaci
onanconpar
ámetr
ospoblaci
onaleso
seencuent
ranref
eri
dasadat osquepr ovi
enendeunapobl
aci
ónconunaf unci
ón
de densi
dad de probabil
idad desconoci
da.Son menos pot
entes que los
ant
eri
oresynoseest udi
anaquí.
Ademásdepar aesti
marparámetr
ospoblaci
onal
es,eli
nter
val
odeconfi
anza
puedetambiénaplicar
separaelcontrast
edehipót
esi
s.Sinembargo,esmucho
másf r
ecuenteobtenerelest
adí
sti
codecont r
ast
ecomounamedi damásexacta
deladi scr
epanci
aent r
eelv al
orplanteadoenlaH0 yelv al
orobteni
doenla
muestra.
Est
a medi da de la discrepanciat i
ene una di str
ibuci
ón de pr obabil
idad
conocidapar acadapar ámet r
oyv aacompañadadeunapr obabil
idad,ll
amada
niv
el crí
ti
cop, queeslaprobabi l
i
daddeobt enerunr esultadocomoel obteni
doen
l
a muest r
a,o más ext remo,baj o elsupuest o de que l a hipót
esis nula es
verdadera.Noesl apr obabil
idaddequel aH0 seaci ert
asinounapr obabil
idad
condicionada:SiH0fueraciert
a( condici
ón)elnivelpcr í
ti
coindicalaprobabil
idad
deobt enerunv al
ordelest adísti
codecont rastei gualomásext remoqueel
obtenidoefectiv
amenteenl amuest r
a( P(Y≥y i|H0)=p) .
2.
-CONTRASTESSOBRELAMEDI
APOBLACI
ONAL.
a)Cont
rast
esobr
elamedi
apobl
aci
onal
conoci
dal
avar
ianzapobl
aci
onal
.
Elest adí
sti
codecont rast
eeseldel afór
muladelafil
a1yl acolumna1del a
página9delf ormulari
o,quesedi st
ri
buyecomonormalN( 0,1),
siendoYl amedia
obtenidaenl amuest r
a,µo elv al
ordelamedi apoblaci
onalf ormuladoenl a
hi
pót esisnul
a,σY eler
rortípi
codel amediaodesvi
aci
ónt í
picadel adistri
buci
ón
muest raldel amedi a( denominador
),σ ladesvi
aci
ón típicapoblacionalque
suponemosconoci daynelt amañodel amuestr
aqueest amosut il
izandopara
16
cont
rast
arl
ahi
pót
esi
s.
Elestadí
sti
coZcuanti
fi
caladist
anci
adelamedi adelamuest
raalamedia
poblaci
onalenunidadesdelerr
ortípi
co(desv
iaci
óntípi
ca)deladi
str
ibuci
ón
muest r
al.
b)Cont
rast
esobr
elamedi
apobl
aci
onal
desconoci
dal
avar
ianzapobl
aci
onal
.
-Elestadísti
codecontrasteeselcor respondientealafi
la2del acolumna1
delapágina9del f
ormul
ario.
-Sedistri
buyeconarregloalaTdeSt udent,conn-1gradosdel i
ber
tad.
-Elerrortípi
codelamedi aodesv iacióntípicadeladist
ri
buciónmuestralde
l
a media se cal cul
a uti
l
izando la cuasidesviación t
ípi
ca o desvi
aci
ón típi
ca
i
nsesgadadel amuestr
a(denomi nador).
3.
-CONTRASTESOBRELAPROPORCI
ÓNPOBLACI
ONAL.
-Elestadí
sticoecont r
asteeselcorrespondient
ealafi
la3delacolumna1de
l
apági
na9del formul
ario.
-Sedistri
buy enor
mal menteconarregloalanormalN(0,1).
-Elerr
ort í
picodelamedi aodesv i
aci óntí
picadeladist
ri
buci
ónmuest ralde
l
amediasecal culaut
il
izandoladesvi
aciónt í
picadelamuestr
a(denominador).
4.
-CONTRASTEDEHI
PÓTESI
SSOBRELAVARI
ANZAPOBLACI
ONAL.
-Elestadísticodecont r
asteeselcor respondi entealafil
a4del acolumna1
delapágina9del f
ormul ar
io(usandolavar ianzamuest rali
nsesgada, conn-1).
2
-Sedi str
ibuy econar r
egloalaχ ( chi-cuadr ado)conn-1gr adosdel ibertad,
queadi f
erenciadel aN yl aT,noessi mét rica,aunquesít i
enel apropiedad
recí
procaoi nv ersa,demodoque,porej empl o,elv al
ordel adist r
ibuci
ónpar a
0,95esigualal 1/valorpara0,05.
-Paraelcál culodel osinter
valosdeconf i
anzaoer r
ormáximo, cuandon>100
sepuedeut i
l
izarl anormal ,per
oconl afórmul adel af i
la5yl av ari
anzanor mal
(noinsesgada).
5.
-CÁLCULODELAPOTENCI
ADELCONTRASTE.
Lapot enci
adelcont rasteesl aprobabil
idadder echazarunahipót esi
snula
queenr eali
dadesf alsa( i
gualal aprobabil
i
daddeacept arunaH1 verdadera)y
portantoesel compl ement ar
iodel er
rorti
poII(1−β)
, queeslaprobabil
idaddeno
rechazaruna hi pótesis nula que es fal
sa.Elcál culo de l
a potencia de un
contrast
epueder ef
erirseacual qui
erparámetro,per
oaquísól oseexponepar ala
mediayl aproporciónpobl aci
onales.
17
Par apodercal cularlapotenciadeuncont rastelashipótesisnulayal t
ernativ
a
debensersi mpl es,compar ándoseencadaunadeel lasunúni copar ámet r
o
pobl acional,env ezdeunr angodev alores(porej emplomedi a=7f renteamedi a
=9) .Port ant o,porexcepci ón,sepl anteandoshi pótesi
senl asquef i
guraelsigno
i
gualt antoenl ahi pótesisnulacomoenl aalternati
va.Lapot enciadelcont rast
e
variaráenf uncióndel tamañomuest ral yladistanciaentreelvalordel ahipótesis
nulayl ahipót esisalternati
va.
Par a un mi smo v al
ordeler rort ipo Iydi sti
ntos valores de H1,di chas
variacionesser epresent anmedi antel ascur vasdepot encia,quer epresentanla
potenci adeuncont rast
esegúnl osdi st
int
osv alor
esquepuedat omarH1 yel
tamañodel amuest r
a.
Par a calcularl a pot encia delcont r
aste,una v ezest ableci
do elni v
elde
signifi
cación:
a)Sedeterminaelv al
orcríti
codelestadísti
coquecor respondealni velde
si
gnifi
caci
ónelegido,segúnlafuncióndedistr
ibuci
ónapl i
cable.
b)A continuación,se calculala puntuación tí
pica correspondient
eal a
dif
erenci
aent
redi chov al
orobtenidoyeldelahipótesi
salternativa.
c)Laprobabili
dadasoci adaal apuntuacióntípi
cadedi chadiferenci
aesel
err
ortipoI
Io(β),siendolapotenciadelcontr
astelaprobabili
dadcompl ementari
a
será1−β.
Lodeseableenuncont rast
edehipótesi
sesquel asprobabi
li
dadesdeambos
ti
posdeer r
orfuer
anl omenorposi bl
e.Sinembar go,parauntamañodemuest r
a
prefi
j
ado, di
sminuirlaprobabil
i
daddelerrordetipoI ,
α,conduceaincrementarl
a
probabili
daddelerrordetipoII
,β.Elúni
cor ecur
sopar aaumentarlapotenci
adel
contrasteydisminuirlaprobabil
i
daddeer rordet ipoII
,esaument areltamaño
muest ral
.
6.
-NI
VELCRÍ
TICOpYERRORESENLOSCONTRASTES.
Aluti
lizarcomocr i
teri
oelnivelcrít
icopnohayqueest abl
ecerpreviament
e
unniv
eldesi gni
fi
caci
ón, y
aquel adecisiónset
omaenf unci
óndel v
alordep.Sip
espequeñoser echazar
áH0, siesgr andeseacept
aráH0ysiestáent ornoaese
val
or,
sev uelveatomarnuev aevidenciamuestr
alyserepi
teelcontr
aste.Elni
vel
18
cr
ít
icopcomocr
it
eri
odedeci
siónt
ambi
éndependedelt
amañodel
amuest
ra
ut
il
izada.
Elni velpcr í
ti
coes“ elniveldesignifi
cacióndelEC” ,esdeci r,l
apr obabili
dad
asoci adaal a(s)cola(s)paraelvalordelEC.Enelcont rasteuni l
ater
alder echo, es
l
apr obabi l
idadquehayal aderechadelEC( coladerecha) .Comol atablanosda
elv alordepr obabil
i
dadquehayal aizquierda,elni velcrít
ico psecal cula
restandode1di chov alor
.Eneluni later
alizqui
erdo,esl apr obabil
i
dadsi t
uadaa
l
ai zqui erdadelEC( colaizqui
erda)yport anto,eselv alorquenosdal at abla.En
l
osbi laterales,comol asdoscol astienenelmi smov alor
,semul t
ipl
icapor2el
valordel acol aderecha.
Comoelni velpcr í
ti
coi nf
ormadel apr obabil
idadasociadaalv al
ormuest r al
obtenido,proporci
onai nf
ormaciónmáspr ecisaqueelECporsísól oyper mite
mat i
zarlasconcl usionesdelest udi
o.Porej empl o,sip=0.
011,nopodr í
amos
rechazarlaH0 paraunni veldesignif
icacióndel0. 01,perosiseprescindieradel
establ
ecimientodeunni veldesi gni
ficaciónpr edet er
minadopodríar echazarse
coneseni velpcrít
ico.
Recapitulaci
ón:Disti
nciónconceptual entrevalorcrít
icoyniv
elcrít
ico.
1º .
-Elv al
orcrít
icoeselv al
ordelestadí
sti
coparaunni veldeconf i
anza
2
determinado.¿Cómosecal cul
a?Sebuscadi r
ect
amenteenl at
ablaZ,T,χ oF
para0.95o0. 99,siescontr
ast
eunil
ater
alo0.975o0.995siesbil
ater
al.Elval
or
crí
ticodeZyTosci l
aentremásymenosi nf
ini
to,
eldechi
-cuadr
adoyFent re0e
i
nfinit
o.
2º
.-Elni
velpcrí
ti
coeselniv
eldesigni
fi
caci
óndelestadí
sti
codecont r
aste,
esdeci
r,l
aprobabi
l
idaddequeelval
ordelavari
ableseaeldelamuestraomás
ext
remo.¿Cómopuedenpregunt
arl
oycómosecal cul
a?Vari
asposi
bil
idades:
a)Sinospidenelv alorpcrítcopar
i aundet erminadovalordel
av ar
iable,hay
quecalcul
arelestadí
sticocorrespondienteybuscarl aprobabil
i
dadasociadaal a
tabl
a.Sielcont
rasteesuni l
ateralderecho,elniv
el pcrí
ti
coes1menosel valorde
l
at abl
a.Siesbi l
ateraleser esultado semul t
ipli
capor2.Y siesuni l
ateral
i
zquier
do,elval
ordel atablaesel nivelpcrít
ico.
b)Sil
opidenpar
aunval
ordelest
adí
sti
codecont
rast
eseaelcal
cul
adou
otr
ohipot
éti
coquenosden,sebuscadi
rect
ament
eenl atabl
ayseprocede
comoena).
c)Sinocoi
nci
deexactamenteelval
ordelECconeldelat abl
a,sebuscanl os
val
oresdelest
adí
sti
comáspr óxi
mosporexcesoypordef ectoyl aprobabil
i
dad
asoci
adaal osmismoscalcul
adaconformea)ob) ,ent
rel oscualesest ar
áel
niv
elpcrít
ico(
nosofr
ecer
áncomor espuest
asvari
asdesi
gualdades).
19
3º
.-Cont
rast
edehi
pót
esi
sconel
val
orcr
ít
icoyel
niv
elpcr
ít
ico.
Cuant
omásext r
emoeselv al
ordelest
adísti
codecontr
aste,menoressu
ni
velpcrí
ti
co.Port
anto,
lar
egl
adedecisi
ónexpresadaent
érminosequi
val
ent
es
es:
-Si
elECesmásext
remoqueelVC,
ser
echazal
aH0yseacept
aH1.
-Sielnivelp crí
ti
co cor
respondi
ente alEC es menorque elni
velde
si
gnif
icaci
ónα,ser
echazal
aH0yseacept aH1.
20
TEMA3.ANÁLISI
SDEDATOSPARADISEÑOSDEDOSGRUPOS.MUESTRAS
I
NDEPENDIENTES.(
Fór
mul
aspági
na10delcuader
nil
l
o)
1.
-INTRODUCCI
ÓN.
2.
-CONTRASTES DE HI
PÓTESI
S SOBRE DOS MEDI
AS EN MUESTRAS
I
NDEPENDI
ENTES.
a)Var
ianzaspobl
aci
onal
esconoci
das.
b)Vari
anzas poblaci
onal
es desconoci
das supuest
as i
gual
es
(homocedast
icidad).
c)Var
ianzaspobl
aci
onal
esdesconoci
dasysupuest
asdi
sti
ntas.
Lascondi
cionesysupuestosson:Var i
abl
edependi
ent
emedidaaniv
elde
i
nterval
ooderazón,dospobl
acionessupuest
ament
edist
ri
bui
dasnor
mal
menteo
21
ensudef ectomuest rasgrandes( n1 ≥30y n2 ≥30) .Lasfórmul
aspar ael
estadíst
icodecontrasteyl
osgr adosdel i
bert
adsonlasquef i
gur
anenlafi
la4de
l
apági na10( Welch,1938)(di
stribuci
ónTdeSt udent,conl osgr
adosdeli
bertad
quer esult
andelaf ór
mula),
enl aqueseut il
i
zanlosvaloresdelascuasi
var
ianzas
ovarianzasinsesgadasmuest r
ales.
3.-CONTRASTE DE HI PÓTESI S SOBRE DOS VARI ANZAS EN MUESTRAS
INDEPENDI ENTES.
4.
-CONTRASTEDEHI
PÓTESI
SSOBREDOSPROPORCI
ONESENMUESTRAS
I
NDEPENDI
ENTES.
5.
-TAMAÑODELEFECTO(
índi
ce“
d”,
est
adí
sti
codeCohen)
.
22
TEMA4.ANÁLI
SISDEDATOSPARADISEÑOSDEDOSGRUPOS.MUESTRAS
RELACI
ONADAS.(
Fór
mulaspági
na11delcuader
nil
l
o)
1.
-CONTRASTES DE HI PÓTESIS SOBRE DOS MEDIAS EN MUESTRAS
RELACIONADAS.(Todos l
os sujet
os pasan por l
as mismas condi
ciones
exper
iment
ales)
a)Var
ianzadel
asdi
fer
enci
asconoci
da.
b)Var
ianzadel
asdi
fer
enci
asdesconoci
da.
3.
-CONTRASTEDEHI
PÓTESI
SSOBREDOSPROPORCI
ONESENMUESTRAS
RELACIONADAS.
Resumendet
rucost
emas1-
4:
-Si
pregunt
anporpor
cent
aje,
esuncontr
ast
edepr opor
ciones.
-Si
pregunt
anporundat
oengeneral
,esuncont
rastedemedi as,
sal
voquese
23
i
ndi queotr
acosa.
-Sinosdaneldatodecuasi
vari
anzaovar
ianzainsesgada,hacer
efer
enci
aa
valoresmuestral
es,nodel
apoblaci
ón.Sal
voquesedi gaotracosaosehagal a
prueba F,sepr esumequel asvari
anzaspoblaci
onalesson desconoci
dasy
supuestasdif
erentes.
TEMA5DI
SEÑOSCONMÁSDEDOSGRUPOSI
NDEPENDI
ENTES.
1.
-INTRODUCCI
ÓN.
2.
-CONCEPTOSBÁSI
COSDELANOVA.
Enelmodel omássimple,deunsol
of act
orounifact
ori
al,l
avar
iabi
l
idado
vari
anzagener
alocomúnqueseobser vaentr
elaspuntuaci
onesdel
osgr upos
despuésdehaberint
roduci
docambiosenlaVI,est
áformadapordospar t
eso
componentes:
ElcometidodelANOVA esdiscerni
rquév ari
abil
idadcor respondeacada
parte.En l
at er
minol
ogí
a delANOVA,l as v
ar i
ables independientes que se
estudi
anreci
benelnombredefactoresylascategoríasenquesedi videnlos
factor
es,
eldenivel
es.
3.
-FUNDAMENTOSDELANÁLI
SISDEVARI
ANZA.
Sipar
ahacercompar
aci
onesent
remásdedosmuest
rasut
il
izár
amosl
as
24
pruebasT( temas3y4),ademásdel acompleji
daddeloscál
culosport enerque
analizarl
asdedosendosent odaslascomplicaci
onesposi
bles,tendr
íamosdos
problemas:
a)Sepasar í
aporaltolainter
acci
ónent relasvari
abl
esi ndependient
eso
factores.
b)Aument arí
alapr
obabil
i
daddecomet erelerr
ordeti
poI.
Par
aev i
tarestosproblemasseut il
izaelAnál isi
sdeVar i
anza(ANOVA o
ANVAR)cont rast
andoladifer
enci
ademedi asentrev ar
iasmuest
ras.
Lahipótesisnul
ageneralesquenoexi st
ediferenci
aalgunaentr
elasmedi
as
(enlav
ariabledependi
ente)delosdi
sti
ntosgruposomuest r
as.
Parami ni
mizarl ainfl
uenci adelasv ari
ablesextrañas,conoci
dasonoyev i
tar
sesgossi stemáticosenl osr esult
adosqueseconf undenconl osef ect
osque
pudierandeber seal av ariableindependientesepr ocedeal aal
eatori
zacióndel
muest reot antoenl ael eccióndel ossuj etoscomoenelor dendeasi gnacióna
l
ascondi cionesexper i
ment al
esoni v
eles( contr
abalanceo).Estoreduceaunque
noel i
mi nal aposi bi
li
daddequel asdi f
erenciasobser vadasentrelosnivelesno
seanf rutodelef ectoconj untodel av ar
iableindependienteydef actor
esdeazar
yport anto,per mitesuponerquel oserroresexper i
ment al
essoni ndependient
es
delosef ect osdel osdisti
nt osnivel
esdel osf act
ores.
4.
-ANÁLI
SISDEVARI
ANZADEUNFACTOR(
ANOVAUNI
FACTORI
AL)
Lospasospar areali
zarelANOVAson:
1.
-Pr obarl ossupuest osqueper mit
enapl i
carelANOVA:VD cuant itati
va
medida a escal a de inter
valoor azón (no sir
ve sies or di
nalo nomi nal),
i
ndependenci a de l as observaci
ones (testde r achas),normali
dad de l as
di
stri
buciones( pruebasdel abondaddeaj uste,Li
ll
iefor
s,Kolmogorov-
Smir nov,
2
X dePear son),yhomogenei daddel asv ar
ianzas( homocedast
ici
dad,testde
Cochran par a model os equili
brados y testde Bar t
let
tpar a modelos no
equi
li
brados).
2.
-Enunci arlashipótesi
sestadísti
cas.
25
3.
-Deci di
rel estadíst
icodecont rastequevamosaut i
li
zarparaprobarl
aH0.
4.
-Est abl
ecerel niveldeconf i
anzaol aregi
óncrí
ti
cader echazodelaH0
5.
-Cal cul
arel valordelestadíst
icodecont r
aste(
TabladelANOVA)
6.
-Tomarl adeci si
ónsobr elaH0( comparandoelval
orFobt eni
doconelval
or
cr
ít
ico,contrasteuni l
ater
alderecho) .
7.
-Interpret
aciónenel contextodel ai
nvesti
gaci
ón.
26
HIPÓTESI
S Efectosf
ij
os(sobr
elasmediaspobl
aci
onal
es)/
/Ef
ect
osal
eat
ori
os(
sobr
elasv
ari
anzas
cuandoson=0,lasmedi
assonigual
es)
.
EFECTOSFI
JOS EFECTOSALEATORI
OS
H0:
µ1=µ2=µ3=…=µi σ2B=0
H0:
H1:
µ1≠µ2≠µ3≠…≠µial σ2B≠0
H1:
menospar
aunaµi
Cál
cul
osi
mil
ar
TABLAANOVAUNI
FACTORI
AL(
Últ
imocuadr
opági
na12f
ormul
ari
o)
CÁLCULOS:
Secumpl
e[SCTOTAL=SCINTER+SCINTRA]yG.l
i
ber
tad:
[N–1=(
I–1)+(
N–I
)]
SCTOTAL=ΣΣY2–{ 2
(ΣΣY)/N}
SCINTRA=SCTOTAL-SCINTER
2 2
SCINTER=Σ(
ΣY) /n–{ (ΣΣY) /N}
DECISIÓN:RechazamosH0 ( i
gualdad demediasenl osdisti
ntosni
vel
es)sielvalordelaF
experi
ment al(
estadíst
icodecont
raste)esmay orqueelv
alorFobteni
doenlastabl
as,
par
aunnivelde
si
gnifi
cación(α)predeter
minado.
ElNumer
adordelestadísti
codecontr
ast
e( MCINTER)conti
enelaVarianzadeer
ror+Efector
ealdela
VI
.ElDenomi
nador(
MCINTRA)c ont
ienel
aVari
anzadeer ror.Port
anto,cuantomenoreselefect
orealde
l
aVImásseacercaelcocienteauno.
Val
orCr
ít
ico:F(I-1)(N-I)(1-α) ZonadeAcept
aci
ón:F<F((I-1)(N-I)(1-α)
Deci
sión:
ZonadeRechazo:F≥F(I-1)(N-I)(1-α) SiF<Fcrítico AceptamosH0
SiF≥Fcrítico RechazamosH0
27
Cálcul
osabreviados(Util
izamoselsist
emadenot aci
ónpropuestoporKeppel
):ElcálculodelasSumas
de cuadrados se r eal
iza sumando y restando l
as r
azones básicas:[Y]( r
elacionada con l
as
puntuaci
onesindivi
duales);[
A]conlostot
alesdelosni
vel
esy[ T]conl
asumat otal
.
Estr
uctur
adecálculodelnumerador
:Seelevanalcuadr
adol
ascanti
dadesi
mpl
i
cadasypost
eri
orment
e
sesuman.
Estr
uctur
adecál cul
odeldenomi nador:Cual
quier
aqueseaelt ér
minosedivi
deporelnúmerode
puntuaci
onesquecontr
ibuyenasucálcul
o.
Fór
mul
aspar
alasr
azonesbási
cas SumasCuadr
adosapar
ti
rder
azonesbási
cas
[T]=T2/(a)(
n) Di
señoequi
l
ibr
ado SCTOTAL=[
Y]–[
T]
2
[T]=T /N Di
señono
2
equi
li
brado SCT=∑∑(
Y–YTOTAL)
A]=∑A2/n
[ Di
señoequi
l
ibr
ado SCA=[
A]–[
T] SCINTERGRUPO
2
SCA=∑n(
YA–YTOTAL)
[
A]=(∑A21/n1)+(
∑A22/n2)+…
(
Diseñono
equi
l
ibrado) SCS|A=[
Y]–[
A] SCINTRAGRUPO
Y]=∑Y2
[ SCS|A=∑∑(–
Y YA)
2
N=Númer
otot
aldeobser
vaci
ones/
/n=Obser
vaci
onesporni
vel
Recapi
tul
ando,enelANOVA uni
fact
ori
al,l
ashi
pót
esi
squesesomet
ena
contr
asteson:
Elestadí
stico de contr
aste es elcociente entr
el a medi
a cuadrát
ica
i
ntergr
uposylamedi acuadráti
caintr
agrupos,quesedistri
buy
esegúnunaFde
Fi
sher-
Snedecor,con( I-1)y( N -I)gradosdel iber
tad,enelnumeradory
denominador
,respect
ivamente(pági
na12del for
mulari
o).
En elexamen se suel
en f
aci
l
itarl
osdat
osde l
asmedi
aso l
assumas
28
cuadráti
casnecesar
iospar
acalcul
arlosr
estantesylomási mpor t
ant
eessaber
rel
aci
onar l
asambasmedi ant
elasf ór
mulascor r
espondi
entes(estátodoenel
formular
io,enelexamenhayquet enerpacienci
apar abuscarlosdatosenla
tabl
aquecor r
esponda):
SCtotal=SCInter.+SCintra(SC=sumacuadr áti
ca),midelavari
abili
dadt otalyes
i
gualal asumadet odasl aspuntuacionesmenosl amediatotalalcuadrado.
SCIntermi delav ar
iabilidadentr
elosnivelesov ari
abi
li
daddebidaalef ectodel
fact
oryesi gualal asumadel amediadecadani velmenoslamedi adelf actoral
cuadrado.
SCintra midelav ari
abilidaddentrodecadani velov ar
iabi
l
idaddebi daaler ror
experi
ment alyesl asumadecadapunt uaci
ónmenosl amedi adesuni velal
cuadrado.
Par aresolv
erelSudoku,convi
eneempezarporelfi
nal
:Losgradosdeliber
tad
tot
alesdelANOVAesN- 1yapar ti
rdeahísev acomplet
ando.Comoseexpl ica
enelr ecuadro,sinosdanlasrazonesbási
cas(comoensept i
embre) asA2son
,l
l
oscuadr adostotal
esdelassumasdel asA,nol assumasdel asAelevadasal
cuadradoyl asn,elnúmerodesujetosdecadamuestraoniv
el.
5.
-COMPARACI
ONESMÚLTI
PLES(
prev
ior
echazodeH0)
.
Parti
endodelrechazodel ahi
pótesi
snulasisóloint
eresacompararal
gunos
ni
v eles delf act
or el egi
dos de antemano,habl ar
emos de compar aci
ones
plani f
icadasoapr i
ori.Enestoscasos,l
osresul
tadosobtenidosdeFnisiquier
a
suel encitar
se.Perosii nt
eresahacer
lassobretodoslosnivelesdelANOVA,se
tr
at arádecompar acionesnoplani
fi
cadas,apost
erioroposthoc.
i
Una delaspruebasmásut i
li
zadasen est esegundo caso esl
a del as
compar aci
onesmúlt
ipl
esdeScheff
é,queademásdecompar arl
asmedi
asdel os
nivelesdelANOVAdosadosper mitereal
izarcomparacionesmáscompl ej
as
(porejemplolamediadeunni
velconunconj unt
odemedi asdeotr
osni
veles,un
29
conj
unt
odemedi
asdedi
sti
ntosni
vel
esconot
roconj
unt
odemedi
asdeot
ros
ni
vel
es,et
c.)
.
Est
apruebafi
jalatasadeerrordeti
poIenelαalqueest emost rabaj
andoy
obti
eneunv al
orll
amadodi fer
enciamínima,r
angoov al
orcr í
ti
coCR ( Cri
ti
cal
Range)deSchef
féporencimadelcualseconsi
der
aquehaydi ferenci
asentrelas
mediasogruposdemedi asqueest emoscomparando.Lafórmulaest áalfi
nal
delapági
na12del f
ormular
io:
__
___
___
____ __ ____ _ __
___
______
___
__ _
_
2
CRSCHEFFÉ=√(
k-1)F(k-1),glERROR ·√MCERROR[
Σ(cj/nj)
]
30
Regl
adedeci
sión:
Sielval
orabsol
utodeladiferenciadel asmedi asdel osgruposcomparados
es may or que elCR,existen di ferencias signi
fi
cati
v as ent
rel os ni
vel
es
consi
deradosynoencasocont r
ario.Elr esul
tadoindicar
áaquégr upoogrupos
corr
espondelavari
abi
li
dadsi
gnificati
v adetectada.
31
TEMA6.ANÁLI
SISDEDATOSENDI
SEÑOSI
NTRASUJETOS.
Un di seño intrasuj et
os,ANOVA uni factorialint
rasuj etos o de medi das
dependi entes or epet i
dasesaquelenelquesesomet eal osmi smosoalúni co
sujetoex periment alat odosl osni veles( estudiados)delf actor
.Par ami nimizar
(nuncael iminarporcompl eto)elprincipalriesgodeer ror( aprendizaje,
paut asno
detect adas,f ati
ga,et c.),l
asecuenci auor denenquesepr esentanoapl i
canl as
condi cionesal ossuj etosdeber eali
zarsecont r
abalanceando.Si nembar go,est o
sólo es est rict
ament e necesar i
o siut i
l
izamos un di seño en que t odos l os
estímul osdelmi smot iposepr esentanagr upadosenundet erminadoor deno, si
esenor denal eatori
o, sequi er
edescar t
arquehay apat
ronesdepr esentaciónque
hanpasadodesaper cibidos.Fór mulaspági nas12yss.delf ormulari
o,siendol os
valoresdel ossumat or i
osr epresentadosent r
ecor chet
esl asr azonesbási cas.
Condici
onesysupuest os:Lossupuestosquedebencumpl i
rsepar apoder
apli
carcor r
ectamente elANOVA son l os mi smos v i
stos par a elANOVA
i
ntersuj
etos,est
oes,VDmedi da,aunniveldeintervalooder azón, puntuaciones
de la VD en cada ni v
eldelf act
orindependi entes entre síy di stri
buidas
normalmenteyademás,doscondi ci
onespar t
icul
arespar areducireler r
orporl a
i
nteracci
ón:Lasv ari
anzasdel aspuntuacionespar al
osdi st
intosniv el
esdel
fact
ordebenseri gualesentresíylascovarianzasent retodosl osni vel
esdel
fact
ordebenserigualesentr
esí.
Supuestaslahomocedastici
dad (i
gual
dad dev arianzas)yl aigualdad de
correl
aciónent
recadapardet r
atami
entos,lamat r
izdev ari
anzas-
covari
anzas
tendrálapropi
edaddelasimet r
íacompuesta,condi
ciónsuf ici
entepar
ausarel
model operononecesar
ia,si
endo pococomúnenl aprácticayexcesi
v amente
restri
cti
va.
Metodologí
a: Lav ari
abil
idadtotalSCT=SCA+SCS+SCAxS, si
endo:
-SCA,lavar
iabil
idad( var
ianza)delfact
ormani pul σ2A)
ado( .
-SCS,lavar
iabil
idad( var
ianza)delossujetos( σ2S).
-SCAxS,l
avariabil
idad( v
arianza)delainteracciónentr
eelf act
oryl
ossuj
etos
2
(
σAxS,error)
.
(
SCAXS)=(
SCp)+(
SCresidual)si
endo(
g.l
.AxS)=(
g.l
.p)+(
g.l
.r
esi )
dual
32
El
est
adí
sti
codecont
rast
eesF=(
MCA/MCSxA)(
Fisher
-Snedecor
).
Lafor
madecálcul
oesmuysimil
araladelt
emaanteri
or,perouti
li
zandol as
fór
mulasdelapági
na13delf
ormul
ari
o(v
arí
anlosg.l
.yportanto,l
asrelaciones
entr
eMCySC) .
TEMA7.DISEÑOSCONMÁSDEDOSGRUPOSI NDEPENDI ENTES.ANÁLI SIS
DE VARIANZA CON DOS FACTORES COMPLETAMENTE ALEATORI ZADOS
(ANOVABIFACTORI
AL).
Enlosdi señosfactori
alessequi er
eestudiarelefectoquesobr eunav ari
abl
e
dependiente ejercen dos f actores o v ari
ables independientes A y B
completament ealeatori
zados,todosel l
osconi gualnúmer odecat egoríasde
modot odosl osnivelesdeunosecombi nanconl osdelot ro.Undiseñofactori
al
consi
steenunconj untodedi señossimplesdeunf actorenelcuall ami sma
var
iabl
ei ndependienteesmani puladaencombi naciónconunasegundav ari
abl
e
i
ndependi ent
e.
Conundi
señof
act
ori
alsepuedenanal
i
zar
:
1)Losef ectospr i
nci esdecadaunadel
pal asVI(factores)sobrel
aVD.Se
consi
derantantosef ectospri
nci
palescomof actoreshayimpl i
cadoseneldiseño
yseanal i
zanmedi anteunANOVA decadaf actorsi
nconsi derarelotr
o.Los
efect
ospr i
ncipalesdeunav ar
iableindependienteo factorser ef
ier
enal os
efect
ospromedi otot al
esdeunav ari
ableyseobt i
enecombi nandoelconjunto
complet
odecomponent esexper
imentalespresentesenesef actor
.
2)Elef ect
oi nt
eracci
ónent r
el osf act es.Exi
or steinter
accióncuandoelefecto
producidoporl osnivel
esdecadaunodel osfactoresdependedel osnivel
esde
otrofactor.Enelmodel oANOVA,l asVIseconsi deranindependi
entesentresí
perolosv alor
esdeunosf act
oresi nf
luy ensobrenlosdeot ros.Portanto,
además
de lai nfl
uencia que cada factorej erce porsepar ado en la VD,existe una
i
nfluencia debida a l a combinación de ambos.Se consi der
a que existe
i
nteracciónencual qui
eradelossi guient escasos:
3)Losefect
ossi
mples,omásf zadosdecadaf
ocal
i actorconcadani
veldel
ot
rofactor
.Sepuedenconsider
artant
osefect
ossimplescomol asumade
ni
vel
esdecadafact
or.
Procedimiento:Apar t
irdelatabladelANOVAf actori
alsereali
zal aprueba
ómnibus( efectosprinci
palesyefectointeracción).Sielefectointeracci
ónes
si
gnifi
cati
voseconcl uyequeelef ectoproduci doporl osnivel
esdeunf actor
dependedel osni v
elesdeot r
ofactoryrechazar emosH0. SiFnoessi gnifi
cati
va,
seacept aH0,seconsi deraquenoexi st
eef ect
oi nt
eracci
ónyelmodel ose
convi
erteenf actori
aladit
ivo(nor
mal )
,demodoqueenelcuadr odelANOVAl a
fi
ladelainteracci
ónsesumaal er
roryser ecalculaF.
Sielef
ect ointeracciónessi gni
fi
cati
vo,sereali
zalapr uebadelosef
ect
os
simplesycompar aci ónporpar esydespuésl adel osef ect
ospri
nci
pal
esen
funci
óndel osefectossi mples.Sinoessignif
icat
ivo,sereali
zalapr
uebadel
os
efect
osprincipal
esysial gunoessi gni
fi
cati
vo,sepr ocedealestudi
odelas
comparaci
onesmúl t
iples.
Model
oest
adí
sti
codeANOVAconi
nter
acci
ón:
Y=µ+α+β+(
αβ)+ε.
Cualquierpunt
uaci
ónYt i
ene5component es:Lamediatotaldelapoblación,
l
osni v
elesdel osdosfactor
es,comúnat odosloscomponentesadscrit
osaesos
ni
veles(promediosdel osefect
osdeltr
atamientoenlosniv
elesdel osfact
ores),
elef
ectointeracci
ónentreambosyel er
rorexperi
mentalnocontrol
able.
Model
oest
adí
sti
codeANOVAsi
nint
eracci
ón:
Y=µ+α+β+ε.
Cualqui
er punt
uaci
ón Y t
iene l
os mi
smos component
es,except
o l
a
i
nteracci
ón.
Alconsiderarlaint
eracción,l
aSCintra dismi
nuy
eenl acuantí
aquer ecogela
SCAxB delainteracci
ón,asícomol osgr adosdelibertad,demodoquel aF
resul
tant
eser ámay orporladi sminuci
óndel aMCerrory
,enconsecuencia,más
preci
soelcontrastedehipótesis.
Lashi
pót
esi
sest
adí
sti
cassepuedenexpr
esardel
asi
gui
ent
efor
ma:
Ef
ect
ospr
inci
pal
esf
act
orA:H0:
Todosl
osαi=0;
H1:
Not
odosl
osαi=0.
Ef
ect
ospr
inci
pal
esf
act
orB:
H0:Todosl
osβi=0;
H1:
Not
odosl
osβi=0.
34
Ef
ect
oint
eracci
ónAxB:
H0:
Todosl
osαβij=0;
H1:
Not
odosl
osαβij=0.
Losestadísti
cosdecont
rast
esonl asrazonesentr
elasmediascuadr
áti
cas
cor
respondientesyl
amediacuadrát
icai
ntr
agr upos,
quesedi
str
ibuy
esegúnF.
35
Fi
gur
a7.
5Secuenci
adeanál
i
sisenundi
señof
act
ori
al
36
TEMA8.
-ANÁLI
SISDEREGRESI
ÓNLI
NEALSI
MPLEYMÚLTI
PLE.
1.
-INTRODUCCI
ÓN.
Unabaj a corr
elaciónent r
ev ari
abl
esimplicaquenohayr el
aci
ónl i
nealentr
e
ell
as, per
onodescar t
aquepudi erahaberl
adeot rot
ipo(exponenci
al,l
ogarí
tmica,
etc.).Unaal t
acor relaciónl i
nealoi mpli
canecesar i
amentequehay arelaci
ón
causalent reellas,puespodr íaocurri
rqueambasf ueranafect
adasporuna
vari
abl eajenaalmodel o,porejemplo,C.I
.yal t
urat
ienenaltacorr
elaci
ónenl os
niñosper oambasest ánr el
aci
onadasconl aedad.
2.
-ANÁLI
SISDEREGRESI
ÓN(
LINEAL)SI
MPLE.
Cuando una v ar
iable,independi
ente(VI)
,aport
ai nformaci
ón sobre ot
ra,
dependient
e( VD),decimosqueambasest áncor
rel
acionadas.Elobjet
odel a
corr
elaciónesanal i
zarelgr adodeasoci aci
ónentrelasv ari
abl
esyeldel a
regr
esión,efect
uarpr edicci
onesacercadel osval
oresdel aVD paravalor
es
dadosdel aVI.LaVIser epresentaporX,l
aVDporYyl osv al
oresest
imadospor
Y’.
I
maginemosqueenunagr áfi
caserepr esentanlospunt os(nubedepuntos)
queindi
canl osv alor
esdeX eY.Lar egresi
ónl i
nealser eal
izamedianteel
métododel osmí nimoscuadr adosajustandoadi chosdat osunalí
nearect
aque
mini
micel oscuadr adosdel asdifer
enciasent r
el osv al
oresreal
esdeYpar aun
val
orcualquieradeXyl osv al
oresesti
madosdeY( Y’)queresul
tar
íandeapli
car
l
aecuaciónder egresiónresult
ante.
Ej
empl osderegr esi
ónlinealyexponencial:
37
El
model
oser
epr
esent
a:
a)Par
apunt
uaci
onesdi
rect
as:
Y’=BX+B0,
siendo:
-Y’elval
orest i
madodeY,
-B l a pendiente de lar ecta de regr
esi
ón (coefi
ciente de r egresi
ón)y
representaelaument odev al
orqueexper i
mentaYcuandoXaument aenuna
unidad;
-B0,eli
nterceptoov alordelaordenadaenelorigen(v alorpronosticadodeY
cuandoX es0) .Eli nter
cepto,ali gualquelosdemásv al
oresdeY’quese
encuent r
enf ueradelr angodev al
oresdel aVI,noesobj etodei nterpret
aci
ón,
salvoqueel valor0seencuent redent r
odel r
angodev al
oresdel aVI .
b)Par a puntuaciones di
fer
enci
ales (dif
erenci
as entr
elas punt
uaci
ones
di
rectasyl amedi a):Y’=B(
X-)
X.Laor denadaenelor igenpar
apuntuaci
ones
di
ferenci
alesval
e0.
c)Par
apunt
uaci
onest
ípi
cas:
Z’=rZ.Y XY X
Lasdiferenci
asent
relosval
oresdel avar
iabl
eobservadosylosesti
mados
sonloser r
oresdeesti
maciónopredicci
ón.Lasumadel amediadelosv al
ores
pronost
icadosesigual
alasumadel amediadelosval
oresobser
vados.
Enconsecuenciaelmodel oderegresi
ónlinealesY’=BX+B0+ε endoεel
,si
errordeest i
maciónolosr esiduosunav ezesti
madoelv alordelaVD.Par aque
sean v áli
das l
as inf
erencias sobrela VD se deben cumpl irlas sigui
entes
condicionesysupuest osbási cos(sucompr obaciónrequier
equehay av ar
ias
muest rasqueper mit
anest udiarl
adistri
buci
óndel osdisti
ntosv al
oresdeY
predichosparacadavalordeX) :
-Independenci
adel asobservaci
ones(muestraselecci
onadaal
eatori
amente)
.
- Homocedasti
cidad,var
ianzasdelasdi
str
ibucionesdeloserr
oresigual
es.
38
- Nor
mal i
daddelasdi
str
ibuci
onescondi
cionadas.
-Independenci
aentrelosv al
oresesti
madosyl oser
ror
esdeest
imaci
ón.
Expr
esadoent ér
minosdecoef
ici
ent
edecorr
elaci
óndePear
son,r’
ε=0,est
o Y
es,l
oserr
oressedist
ri
buy
endemaneraal
eat
ori
a,si
ncor
rel
aci
ónconlaVD.
3.
-BONDADDEAJUSTEDELARECTADEREGRESI
ÓN.
Elgradodeasoci aciónent r
el asvariabl
esseexpr esamedi anteelcoefi
cient
e
de cor r
elación de Pear son,cuy ov alorest á si
empr e compr endi
do entr
e- 1
(relaciónlinealnegativ
a)y1( r
elaci
ónl i
nealpositiv
a),indicandoel0quenohay
relaciónl i
nealentrelasv ar
iabl
es( podríahaber l
adeot r
ot ipo,noobst ant
e).Su
fórmul a(pági na15)es:
Rxy=Sxy
SxSy
2 2
Elcuadrado delcoefi
cient
edecor r
elaci
ónr xy o R e selcoeficientede
determinaci
ón( v
alorcomprendi
doentre0y1)yexpr esalaproporcióndel a
vari
anzadel aVDexpl i
cadaporlavari
anzadel aVIyl apr opor
ciónenquese
reduceelerrordelaVDcuandoempleamosl arectader egresi
ónparaest i
mar l
a.
Elvalorabsolut
odelcoefi
cient
ededet erminaciónesmenorqueelcor relaci
ón,
salvocuandores0o+/ -1,quecoi
nci
den.
2
Elcompl ementari
odelcoef i
cient
ededet erminaci
ón1-r xy eselcoefi
ciente
dealienaci
ónyesl apar
teresidualdelav ar
iabi
li
daddelaVD,at ri
bui
bleaot ros
fact
oresnor el
aci
onadosl i
nealmenteconl aVD,esdeci r
,lapr oporci
óndel a
vari
anzadel aVDnoexpl icadaporl avar
ianzadel aVIoloqueesl omismo,l a
vari
anzadeler r
or.
Ot
roindicadordelajust
eeselerr
ortí
pico,queesunest
imadorinsesgadode
l
a desvi
ación tí
pica delerror
.Su f
órmula esla úl
ti
ma dela página 15 del
f
ormular
io.
4.
-INFERENCI
ASSOBRECORRELACI
ÓNYREGRESI
ÓN.
Normalment
el oscoef
ici
entesdecorr
elaci
ónyregresi
óndelapoblaci
ónson
desconoci
dos. Los supuestos bási
cos y condici
ones par
a poder hacer
i
nferenci
asdelosdatosmuest ral
esalosdelconj
untodel apobl
aciónsonlos
39
vi
stosant es(independencia de l
asobservaci
ones,homocedast
ici
dad de l
as
var
ianzas,normalidaddel asdistr
ibuci
oneseindependenci
aentrelosval
ores
est
imadosyl oserroresdeestimaci
ón).
-Contr
ast esobreelcoef i
cientedecorrelaci
óndePearson.Lahipótesi
snula
esquenohayr elaci
ónentreVIyVD( coef
icientedecor
rel
aciónpoblaci
onaligual
acero),mientrasquel ahipótesisal
ter
nati
v apostul
aquelar el
aci
ónl i
nealentr
e
ambasessi gnif
icat
iva:H0:ρ=0.H1:ρ<>0( ρeslalet
ragr i
egaro).Haydos
for
masder eal
izarl
o:
-Conelest adíst
icodelaf
il
a1col
umna1delatabl
a1delapági
na16del
f
ormular
io,quesedi st
ri
buy
ecomounaTdeSt
udentconn-
2gr
adosdeli
ber
tad
(
cont
rastebil
ater
al).
-Medi ant
eelANOVAdel ar
egresi
ón, conlar azónF=MCregresión/
MCresiduos,que
sedistri
buyesegúnunaFdeSnedecorcon1yn- 2gradosdel iber tad(cont r
aste
unil
ater
alderecho)
,for
mulari
o,tabl
a2, página16, gradosdeli
ber tadtot
al esdel a
regr
esión n-1.Se usa cuando nos dan l os datos de l
as sumas o medi as
cuadráti
cas.
-Hayunar
el ónT2=F,
aci vieneenel
for
mul
ari
o.
-Cont r
astepar aloscoefi
cientesder egr esiónByB0 ( ANOVA).Lahipótesi
s
nulayl aalternati
vasonH0:B=0;H1:B≠0sielcont r
asteesbi l
ater
al.Sies
unil
ateral
,l
aH0ser áB≤oB≥queelv alorfor muladopar alaH0.Losest adí
sti
cos
seincluyenenl asfi
las2y3del aprimerat abl adelapági na16delformular
io(T
deStudentconn- 2gr adosdel
ibertad),
cont rastebilater
al.
Hayquet enercuidadoconl asfórmulas“ ocult
as”delf or
mulari
o,porsienel
examenpusi eranunat abl
adedat osparalar egresión(pocof r
ecuent
e,peropor
siacaso):
S2Y.Enl
-SCtotal=n· acal culador aCasi o, enmodor egr esión,hayqueut ilzarσ2y.
i
Estafórmul anov ieneenni ngunapar t
eyhancaí dopr obl
emasenex ámenes
2
anti
guosenl osquedabanl av ar ianzat otaldeY( SY)per onol aSCtotal.
-SCtotal=SCregresión+SCresidual.Sededucedel cuadrodel ANOVAdel aregresi
ón
enlapági na16delf or mular io.Apar ecedef ormaexpl íci
taysepar adaenel
cuadrodel aARM.Despej ando, SCresidual=SCtotal-SCregresión
2 2
-r=SCregresión/ SCtotal.Despej ando, SCregresión=r ·SCtotal.
Lacal cul
adoraCasiopr opor
cionaB( b),B0 (a)yr,sinosdier
anlat abl
ade
datos.Sidanl ossumat ori
os,hayqueut i
lizarlasfórmulasdelapágina15del
for
mul ar
io,conelcui dadodequel abet asenl asqueseusanpunt uaci
ones
tí
picasnohacenr ef
erencianoalosv al
oresdel osparámetrospobl
aci
onales
40
5.
-ANÁLI
SISDEREGRESI
ÓNMÚLTI
PLE.(
Fór
mul
as,
pági
na17del
for
mul
ari
o).
a)Regr
esi
óncondosv
ari
abl
esi
ndependi
ent
es.
Mi ent
rasqueelARSpr oducelalínearect
aquer elaci
onal aVD(Y)conlaVI
(X)
,elARM condosv ar
iablesi
ndependient
esproduceunpl anoderegresi
ónque
rel
acionalaVD( Y)conl osval
oresdel asdosVI( X1 yX2)(paramásdedosVI
serí
aunhi per
plano)
.
El
model
odeest
imaci
ónl
i
neal
múl
ti
plees:
Y’=B1X1+B2X2+B0+ε
b)Aj
ust
edel
model
o.Medi
dasdeasoci
aci
ón.
Elcoefici
ent
edecor r
elaci
ónmúltipl
eReselcoef i
cient equecor r
elacionala
VD conunacombi naci ónópt i
madedosomásv ar
iablesi ndependientes.Su
2
cuadr adoeselcoef icientededet erminaciónR,queexpl icaelpor centajede
variabil
idaddelaVIat r
ibuiblealaacciónconjunt
adel asVD.Comoocur reconla
2 2
varianzamuest r
alR noesunest i
madori nsesgadodeρ,por quecuant omás
pequeñaseal amuest ra,may orser
ál acontri
bucióndel av ari
acióndel aVIal a
2
del aVD.Elest imadori nsesgado deρ eselcoef i
cient ededet ermi naci
ón
ajustado, (
2ªfór
muladel a2ªtablapág.17del f
ormulari
o).
c)Cor
rel
aci
ónbi
var
iadaycor
rel
aci
ónsemi
par
cial
.
Sinembargo,estascorrel
acionessól
oof r
ecenunai ndi
caciónaparent
edel
i
nfl
ujodecadaVIenlaVDynosonpur aspuesnorefl
ejanlaverdader
ainfl
uenci
a
decadaVIai sl
adamenteconsi der
adasenl aV,alno t enerencuent anila
i
nfl
uenci
aentrelasdist
int
asVI ,nisuinf
luenci
aconjunt
aenl aVD.Poresol a
41
sumadel oscoef
ici
ent
esdecorrel
aci
ónbi
var
iadosser
ási
empr
emay
orqueel
coef
ici
ent
edecorrel
aci
ónmúl
ti
ple.
Elcálculodeloscoeficientesdecorrel
aci
ónsemiparcial (
sr1ys r
2)ser eal
i
zaa
partirdel oscoefici
entesdecor r
elaci
óndeor dencero(fórmul as,penúl
t i
maf il
a
de l a página 17 delcuader ni
ll
o).Los cuadrados correspondientes son los
coef i
cientes de determinación semiparci
al,que expresan l a proporción de
varianzadel aVIatri
buibleacadaVD,el i
minandoelinflujodel asdemásVIen
dichaVI .
Par
aent
ender
lomej
or,
veamosundi
agramadeVenn:
Y
a c
b
X1 X2
Loscontr
astesconest
oscoefici
ent
esconsist
enencomprobarsilavari
aci
ón
expl
icadaporlavari
abl
eov ar
iabl
esintr
oduci
dasessigni
fi
cati
varespectodela
vari
anzaal
eator
iaoresi
dual
.Lasfórmul
asestánenlapági
na17del f
ormulari
o.
d)Cor
rel
aci
ónpar
cial
.
Medi ant
eelestudiodel acor
rel
aci
ónentr
elosr esi
duos,esdeci
r,lav ar
ianza
noexpl i
cadaporlacorrel
aciónentr
eYyX2porunl adoyporl acorr
elaciónentre
X1 yX2 porotro,lacor r
elaci
ónparci
alseeli
mi naelefectodecual quierotra
var
iable,conocida o no,entrela VIconsi
derada yl a VD.En definiti
va,la
corr
elaciónpar
cialmidelacorrel
aci
ónpuradedosv ari
abl
eselimi
nandoeli nfl
ujo
decualquierot
ratantoenlaVIcomoenl aVD.
2 2
Elcuadradodeloscoef i
cientesdecorrel
aciónpar alpr
ci 1 ypr2 (coefici
ent
es
dedeterminaciónparci
al)sei nt
erpr
etacomol apropor
cióndel av arianzadela
VD no asoci ada a X2 que síest á asoci ada a X1 (yv i
cev ersa) y l
os
2
complement ar
ios1-
pr ,r
epresentanloscoefi
cientesdeal
ienaciónpar cial
.
Lasf
órmul
asestánenl
aspági
nas17y18del
cuader
nil
l
o.Vol
vi
endoal
di
agramadeVenn:
43
d
a c
b
X1 X2
2 2
pr
1 =a/(a+d)ypr
2 =c/(c+d)
Enconclusión,mientr
asl acorr
elaciónsemi par
cialsesi t
úaenelcont exto
excl
usi
v odelARM, tr
atandodeexpli
carl acontri
buci
óni ndependientedecadaVI
alaVD,l acorr
elaci
ónparcialponeelacent oenlaeli
mi naci
óndel osef
ectosde
cual
quiervari
ableextr
añaydel ascorrelaci
onesespúreaspr oducidasportales
vari
abl
esextrañasalmodelo.
RESUMENDETEORÍ
ADEARSYARM:
-Elanál i
sisdel osdiseñosexpostf actotrat
adedet erminarcómo un
conj
unto dev ariabl
es,quellamamosf act
ores,i
ndependient
es,pr edi
ctor
aso
expl
icati
vas,puedenexpli
carelcomport
amientodelavari
ableobjetodeestudi
o,
quellamamosdependi ent
eocr i
ter
io.
-Elmodel
oder egresi
ónli
nealest
imaelvalordel
aVD, mediant
eunafunci
ón
l
inealdeunaov ar
iasVI( Regr
esi
ónLinealSi
mpl eyMúlt
ipl
e,r
especti
vament
e).El
coefi
cient
edecor relaci
óndePear son(múlt
iple)mi
deelgr adodeasociaci
ón
entr
elaVDyla(s)VIyosci l
aentr
e-1y1.
-R2,eslapr
oporci
óndevar
ianzadeVDasoci adaalacombinaci
ónli
nealde
l
asVI ’
syt ambiénexpr
esal
areducciónproporci
onaldeler
rori
nici
aldelaVD
cuandoseajust
aunmodelodeesti
maciónconlasVI’
s.
-sr
i,
coef
ici
ent
edecor
rel
aci
ónsemi
par
cial
,expr
esal
acorr
elaci
ónent
reYyXi,
cuandodeestaúl
ti
masehaextraí
dol
aquemant i
eneconelr
estodelasVIdel
modelo.
2
-sri,coefi
cient
ededet er
minaciónsemipar
cialexpresal
apropor
ciónde
v
ar i
anzadeYasoci adaúni
camentelavari
anzadeXi,asícomoeli
ncr
ementoen
2
R cuandol
av ari
ableXient
raenelmodelo.
-pr,coef
i i
cient
edecorrel
aciónparcialexpr
esalacorr
elaci
ón“
pura”entr
eYy
Xi,el
i
mi nandolainfl
uenci
adecual quierotravar
iabl
e,estéonoenelmodel o.
Tambiénexpr esalarel
aci
ónent r
el apar t
edeYyl apartedeXiquenoest án
asoci
adasl i
nealment
econelrestodepr edi
ctor
as(var
iabi
li
dadent
rer
esiduos).
2
-pri,coef
ici
ent
ededeter
minaciónparci
alexpr
esal
apr
opor
cióndevar
ianza
deYnoasoci adaalr
est
odev ar
iabl
es,esténonoenelmodelo,quesíestá
asoci
adaconXi.
45
ADENDA:
PERLI
TASQUEHAYQUETENERENCUENTAPARANOFALLAREN
TONTERÍ
AS:
1.-Hayquel eerei nter pr etarbi enl osenunci ados.Sipi dencont rast essobr e
varianzas o sobr e pr opor ciones l o di r
án expr esament e o en elcaso de
propor ci ones,habl ando de por cent ajes o en elcaso de l as v ar i
anzas,de
variabilidades.Ent odosl osdemáscasos,si empr eesuncont r astedemedi as
(i
ncl usosihabl andepr opor ciónmedi aof recuenci adeaci ertos,elcont r ast ees
demedi as, sal voqueser ef i
er aapor cent aje, frecuenci aopr opor cióndesuj etos) .
Hayque f ij
ar se bi en siesbi later al( H0 esque no haydi fer enci as,H1,hay
diferenci as)ouni later al( der echo,H0 menoroi gual ,H1,may orque;i zquier do,HO
may oroi gual ,H1,menorque) .Cui dadoconf ij
arbi enn,cui dadocuandoden
muchosdat ospor queav ecesnospr egunt ansól osobr eunapar te.Cui dadocon
cadapr egunt a,not odassonsobr el omi smo.Enl asituaci ón1onor malesque
pregunt en pormedi as,pr opor ci ones yv arianzas.Sihaydos muest ras con
diferent enúmer odesuj et os,soni ndependi ent es.Sól osonr elaci onadassil os
mi smossuj et os( or elacionadosporpar es,i .
e.gemel os)sonsomet idosat odos
l
osdi stint osni velesdel fact or .
Sino sabemossegur al ar espuest a de pr imer ase i ncluso en t alcaso,
conv ienedescar tarl asqueseani mposi bles.Elv alorcr íticosebuscaenl at abla
par a1- αo1- α/ 2.
Par a ev itarer ror eso det ect arlos,conv ieneescr i
bi rdepuño yl et ra,con
claridad,t odosl osdat os,enl ugarsepar adoydest acadodedondehacemosl as
oper aciones.Par al acal cul ador a,conv i
eneescr ibirlasf órmul ast alv i
enenenel
formul ar io,si n si mpl ifi
caci ones que nos puedan i nduci ra er ror,con l os
par éntesi sensusi tio( est oesv i
t al).
2.-Pr uebapr ev iadelcont rast edei gual dad dev arianzas.Sedi videnl as
cuasi var i
anzaso v arianzasmuest ral esi nsesgadas,poni endo l amay orenel
numer ador( arriba) .Elcont rast eesbi l
at eral, port ant ohayqueacudi ral ast abl as
de l a F buscando 1- α/ 2;t i
ene que haber mucha di f
er enci a ent r
el as
cuasi var i
anzaspar aqueseconsi der el adi f
er enci adev ar ianzaspobl aci onal es
significat i
v a.SielEC >VC,ser echazal ahi pót esisdequel asv arianzasson
i
gual es.Si esmenor , seacept a.
3.-Ni velpcr íti
co:Eselni veldesi gni fi
caci óndelest adí st i
codecont rast e,es
deci r,lapr obabi l
idad,si endoH0 ci erta,deobt enerunv alori gualomásext r
emo
queeldelECquehemoscal culado.Lat abl anosdasi empr el apr obabi lidadque
hayal ai zqui er da, poreso:
-Sielcont rast eesuni lat eralder echo, elni velpcr í
ticoes1–pr obabi li
dadde
l
at abla.Buscamoselv alordel apr obabi l
idadquehayenl acol ader echadelECy
l
at abl anosdal aquehayal ai zqui erda, poresor estamosde1el v alordel at abl a.
-Sielcont rast eesuni l
at er alizqui erdo, elni velpcr í
ticoeselv al
ordel at abl a,
yaquebuscamosel valorquehayenl acol ai zqui erdayesel quenosdal at abla
-Si esbi lat eral,(1–pr obabi l
idaddel at abl a)semul tipl i
capor2.
Cuandonocoi nci de,ent oncesseest abl ecer áelni v elpcr í
ticocomomay oro
46
menorqueeldel at abla, dependi endodesielECesmásgr andeomáspequeño
queel VC.
¡Hazt eelesquemadel agr áf icayr ay al aszonasdeacept aci ónyr echazo!En
elej ehor i
zont alest ánl osv al oresdelest adí st i
coyelár eadelej econl acur v aes
l
apr obabi l
i
dad.Regl ai nf ali
ble:Cuant oMÁSGRANDEeselv al orabsol utodelEC
(est ámásal ejadodel cent ro), MENOResel ni velpcr í
ticoyv icev ersa.Port ant oel
rechazodeH0espor que| EC| >|VC| ol oqueesl omi smo, porquep<α.
4. -ANOVAS.Hayquer el l
enarelSudoku.Sinosei dent i
f icabi enelt ipode
ANOVA que es ( unifact orialcon muest ras i ndependi ent es o r elaci onadas;
bifact orialídem) ,ay udar áempezarporelmássenci l
loysisobr andat os,ser áel
otro.Sepuedehaceralr evés:Sif al tandat os,l onor malesqueseaelmásf áci
l
.
Par al osgr adosdel i
ber tadempi ezaporelf i
nal,puesesf áci li dentificarN- 1.A
par ti
rdeahí ,seponenl osgr adosdel iber taddecadaf actor ,al ai nteracci ónyl a
diferenci aaler roroMCi nter .Luegosev ancal culandol oquef alte,t eni endoen
cuent aqueMC=SC/ g.l.yquel asumat otaldeg. l
.esN- 1, salv oenr egr esi ón, que
esN- 2.Nor mal ment el osgr adosdel iber taddeler rorol aSCINTER ser ánmucho
may or esquel osdel aSCINTRA.Fór mul aquef al t
a:SC=n· S2(númer odeel ement os
porl av ari
anza) .
5. -Model odeef ect osf ij
os- aleat or i
os.Ef ectosf ij
os:Sól oi nteresanl osdat os
par al osni velesdel osf act oresmanej ados.Ef ectosal eator ios,i nter esanpar a
cual esqui erani velesdel osf act or es.Encasodeduda, nocont est ar.
6. -Cont rastes en r egr esi ón l ineal :Son bi laterales ( sal v o elANOVA de
regr esión)yport antohayquef unci onarcon1- α/2.Elgr adodel iber taddel a
regr esiónsi mpl ees1yel t
ot al del osg. l
.,n- 2.
7. -Di sti
nci ónent r
ecor r
el aci ónsemi par cialypar cial.Enl asemi par ci alse
eli
mi nadeli nfl
ujodeunaVIenl aVD,eli nf l
ujodet odasl asdemásVI .Enl a
par cialse el imi na además eli nflujo de cual esqui era ot ras v ariabl es no
consi der adas( incluidaseneler ror ).Lascor r
elacionescal cul adassi nmás,es
deci rsi nel iminareli nflujodeot rasv ariabl esest énonoenelmodel o,noson
pur asysel l
amanbi variadasodeor dencer o.
8. -Elcoef iciente de cor relaci ón mi de elgr ado de asoci ación ent rel as
variabl es.Sucuadr adoescoef i
ci ent ededet erminaciónymi deelpor cent aj ede
variabi li
daddel aVDat r
ibuibl eal aVI .Sucompl ement arioeselcoef icient ede
ali
enaci ón y mi de elpor cent aje de v ar iabil
idad at ri
bui bleav ariabl es no
consi der adas( error).
Enelexamen,cr
eoqueesmejorempezarporlaspregunt
asdet eorí
ano
asoci
adasdir
ect
amenteal
ospr
obl
emas(ser
ánentr
e7-10)yluegoirr
esolv
iendo
l
assituaci
onesenqueest
emosmásseguros,dej
andoparaelf i
nall
oqueno
sal
ga.
Par
aaprobarsenecesi
tancomomí ni
mo13aci er
tosy1error(cont
est
ando
14)yapar
tirdeaquí14/3(
17) ,
15/5(20),
16/7(23)
.Hayquecontarconfri
aldad
l
asqueestánbien(l
asdepr oblemaslassabr
emossegurascasial100%)ei ra
47
asegurar
.Sisabemosocr eemosquet enemosbien16,hayquecont est
ar23,
porquecontest
ando24o25necesitar
íamos17par aapr obarycont
est
ando21o
22,también16.Encasodedudasenal gunaspregunt
as,hayqueelegiraquel
las
enlasquepodamosdescartarunar
espuest a,
esdeci
r,sólodudemosentre2.
48
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)
Estudio de las muestras para conocer la población a la que representan. La inferencia siempre se hace
en términos probabilísticos (afirmamos con una cierta probabilidad de éxito). El error muestral es la
diferencia entre el resultado obtenido en la muestra y el que habríamos obtenido si se hubiese trabajado
con la población.
Para cada característica de la muestra que evaluemos se obtiene lo que se conoce como estadístico:
índices descriptivos de centralidad (Media), variabilidad (Varianza), etc. A partir de los estadísticos
obtenidos en la muestra (lo concreto), se realizan afirmaciones sobre los parámetros de la población (lo
general)
DISTRIBUCIONES DE PROBABILIDAD !
Teorema Central del límite: Si una población tiene una media µ y una varianza σ2 finitas, la
distribución de las medias muestrales de tamaño “n” extraídas de manera aleatoria e independiente,
se aproxima a la forma de una distribución normal con varianza σ2/n y media µ conforme el
tamaño de n se va incrementando. __
N ( µ , σ / √ n)
PROBLEMAS EJEMPLO
Los tiempos requeridos por un cierto autobús para alcanzar uno de sus destinos en una ciudad
grande forman una distribución normal con una desviación típica σ =1 minuto. Si se elige al azar una
muestra de 17 tiempos, encuentre la probabilidad de que la cuasi varianza muestral sea mayor que 2.
Se busca el valor de ji-cuadrado correspondiente a S2n-1=2
(n-1) S2n-1 16 · 2
X2n-1 = --------------------- ! X2n-1 = ------------ = 32
σ2 12
El valor de 32 se busca en la tabla Chi Cuadrado con 16 grados de
libertad. A este valor le corresponde una probabilidad de 0,99. En
consecuencia, 1-0´99 = 0´01! P(S2n-1 >2)
Un partido político cree que el 60% del electorado está a favor de su programa. Como su líder
encuentra que esta predicción es demasiado optimista decide hacer un sondeo con una muestra de
90 personas. ¿Cuál es la probabilidad de que como máximo 60 personas estén a favor de su partido?
0´67 – 0´60
P (60/90 = 0´67)! Z = --------------------- ! Z = (1´35) se corresponde con p = 0´9115
√ 0´6 · 0´4 / 90
Generalmente se desconocen los parámetros de la población por lo que se hace necesario estimarlos a
partir de los valores muestrales. Un estimador es un estadístico que utilizamos para estimar
parámetros. Se pueden considerar dos formas de estimar los parámetros poblacionales: estimación
puntual (Conocida como método de los momentos de Pearson, se extrapola el estadístico de la
muestra directamente a la población) y estimación por intervalos (establece un rango de valores
dentro del cual estaría el valor del parámetro, con una determinada probabilidad)
1.- Carencia de sesgo: un estimador es insesgado o centrado cuando el valor del estadístico (en las
infinitas muestras de tamaño “n” extraídas de una población) coincide con el valor del parámetro que
queremos estimar ! U es un estimador insesgado de θ, si ! E (U) = θ
La media, la proporción y la cuasi varianza de la muestra son estimadores insesgados de sus valores
poblacionales
2.- Eficiencia (Precisión): Se considera la inversa de la varianza de su distribución muestral. Cuanto
mayor es el cociente, mayor es la eficiencia. Eficiencia ! θ = 1 / σ20 (A mayor varianza, menor
eficiencia). La Media Aritmética es más eficiente que la Mediana. La Varianza es más eficiente que la
Cuasi varianza. Cuando tenemos distintos estimadores y queremos determinar el más eficiente, se
comparan sus eficiencias. Ejemplo: La varianza de la distribución muestral de dos estimadores es 2 y
1,5. Para un mismo tamaño muestral, la eficiencia relativa sería 1,5 / 2 = 0,75. Si el cociente fuera 1
serían iguales.
3.- Suficiencia: el estimador utiliza toda la información de la muestra para estimar el parámetro
(Ejemplo: La media muestral sería suficiente para estimar la media poblacional. No lo sería la amplitud
intercuartílica para estimar la varianza poblacional)
4.- Consistencia: El requisito mínimo que se le exige a un estimador es que sea consistente. Un
estimador es consistente si, a medida que se dispone de más información (que aumenta el tamaño de
la muestra), aumenta la probabilidad de que la estimación coincida con el parámetro. La media, la
proporción y la varianza insesgada son consistentes porque son estimadores insesgados de los
parámetros correspondientes y en sus límites valen cero (su sesgo y su varianza tienden a 0 a media
que aumenta n)
Cuando el valor del parámetro (población) coincide con el valor del estadístico (muestra), se considera
que la estimación (inferencia sobre la población a partir de la muestra) es insesgada. Siempre que
operemos se debe procurar que nuestros estimadores sean insesgados y tengan una varianza pequeña;
estas dos características se denominan acuracidad.
Una estimación por intervalos expresa el grado de confianza con el que se espera que esté el valor
del parámetro dentro del intervalo, por lo que se suele llamar intervalo de confianza. La amplitud del
intervalo nos indicará su precisión. A menor amplitud, más precisión, más informativo es, más útil.
Una estimación por intervalos depende de cuatro parámetros: una estimación puntual del
parámetro; una medida de variabilidad; una probabilidad (nivel de confianza) y un supuesto acerca de
la distribución en la población.
N(0,1) t n-1 gl
Distribución Normal (Conocida σ2) Desconocida la σ2 (Muestras pequeñas)
_ _ _ _ _ _
X + (Z α/2) · (σX) < µ < X + (Z1- α/2) · (σX) X + (t α/2) · (Sn- 1/√ n) < µ < X + (t1- α/2) · (Sn- 1/√ n)
Problemas ejemplo: Se midieron los niveles de depresión en una muestra de 100 personas.
Asumiendo un nivel de medida de intervalo y que la variable se distribuye normalmente en la
población, se calculó la media de las puntuaciones y se obtuvo un valor de (Media = 8) y una cuasi
desviación típica = 2. Hallar los límites del intervalo de confianza para la media de la población
con un nivel de confianza del 99%.
_
Datos ! X = 8 Distribución normal de la VD α = 0,01 Sn- 1 = 2
Hallar los límites del intervalo de confianza suponiendo que la muestra está compuesta por 25
personas, a un nivel de confianza del 95%.
_
Datos ! X = 8 Distribución normal de la VD α = 0,05 Sn- 1 = 2
_ _
Intervalo de confianza ! X ± (t α · Sn- 1 / √ n) = Límite superior y Límite inferior
Problemas Ejemplo: En una muestra aleatoria de 20 sujetos, extraída de una población normal, se ha
obtenido una media de 24 puntos y una cuasi desviación típica de 10,8 puntos. Averiguar los límites del
intervalo de confianza para la varianza de la población, suponiendo α = 0,05.
Según las tablas χ2n-1 (χ219) ! para (α / 2 = 0,025) ! 8,91 y para (1 - α / 2 = 0,975) ! 32,9
(19 · 10,82) / 32,9 < σ2 < (19 · 10,82) / 8,91 ! Límites del intervalo de confianza ! [67,36 y 248,7]
Con un margen de error del 8% el tratamiento será efectivo entre el 69% y el 87% de los casos.
La amplitud del intervalo de confianza depende de dos factores: el nivel de confianza y el error típico de
la distribución muestral del estadístico (La suma de ambos E = Error máximo de estimación). Cuanto
mayor es el tamaño de la muestra mayor es la precisión del intervalo y mayor la precisión de la
estimación. Cuanto menor es el error típico, menor es el intervalo de confianza y, por tanto, más preciso
(para reducirlo se aumenta el tamaño muestral)
Problemas Ejemplo: Por experiencias anteriores se sabe que las estaturas de los soldados tienen una
varianza de 64 cm. ¿Qué tamaño debe tener la muestra para que la media estimada no se aleje más de
± 1, 5 puntos de la media poblacional?: considere (α = 0,02).
Con un margen de error del 2% debemos tomar una muestra de 154 soldados.
" Un estudio sobre la proporción de fumadores entre el personal de un hospital estableció que sólo
fumaban el 35%. Si el análisis se efectuó con un nivel de confianza del 95%, ¿Qué tamaño debió
tener la muestra para que la proporción estimada no se aleje más de ± 0,15 puntos de la proporción
poblacional?: considere (α = 0,05).
Hipótesis estadística: proposición (afirmación) sobre algún aspecto de la distribución de una población
(parámetro, forma, etc.) que puede someterse a prueba a través de una muestra aleatoria de esa
población. No tiene por qué suponerse interés científico.
Contraste de hipótesis: Procedimiento por el cual decidimos si una propuesta sobre la población
puede aceptarse o no. Su finalidad es generalizar un resultado muestral a la población de la que procede
la muestra. Siempre se formulan dos hipótesis (exhaustivas y mutuamente excluyentes); de tal modo,
que el rechazo de una implica la aceptación de la otra.
H0 (hipótesis nula): se acepta provisionalmente como verdadera y se somete a contraste.
H1 (hipótesis alternativa): se acepta al rechazar la hipótesis nula.
" La media (µ) es algún valor " La media (µ) es algún valor " La media (µ) es algún valor
Igual o distinto a (X) No inferior a (X). No superior a (X).
Ho : µ = X Ho : µ ≥ X Ho : µ ≤ X
H1 : µ ≠ X H1 : µ < X H1 : µ > X
Se trata de averiguar la discrepancia entre los datos empíricos observados en la muestra y los datos
teóricos que planteamos en la H0.
Regla de decisión: Tomando en consideración el valor o los valores críticos (máxima diferencia
que cabe esperar por simple azar entre los datos empíricos y los teóricos) y a partir del nivel de
significación. Acumulado en los contrastes unilaterales (α) y dividido por dos en los bilaterales (α/2)
Nivel crítico (p) ! Calcular la probabilidad de obtener unos resultados como los observados en la
muestra bajo el supuesto de que la H0 es cierta.
Zona de rechazo (depende de que el contraste sea bilateral o unilateral). Teniendo en cuenta el riesgo
adoptado se determinan los valores del estadístico y se decide si la hipótesis nula es verdadera o falsa.
Nunca puede afirmarse categóricamente que la hipótesis es cierta o falsa, se afirma con un determinado
nivel de probabilidad. Así, ¿Cómo decidir sobre la hipótesis nula? ! Dos métodos equivalentes:
Ho (Cierta) ! (p) es mayor que (α) ! El valor se encuentra en el intervalo de confianza. El valor del
estadístico está entre los valores críticos.
Ho (Falsa) ! (p) es menor o igual que (α) ! El valor está fuera del intervalo de confianza. El valor del
estadístico supera o es inferior a los valores críticos.
El nivel de significación (α) se fija de antemano, mientras que el nivel crítico p es consecuencia
del resultado obtenido al aplicar el estadístico de contraste.
El contraste bilateral es más conservador que el contraste unilateral (es más difícil rechazar la H0)
4.- Fijar α (regla de decisión). La zona de rechazo de la H0 estará formada por todos los valores del
estadístico cuya probabilidad de ser obtenidos es muy pequeña bajo el supuesto de que la H0 es
cierta.
5.- Cálculo del estadístico de contraste con los datos obtenidos en la muestra.
Queremos contrastar la hipótesis que supone que la media poblacional en un test de atención de los
estudiantes de la ESO es de 35 puntos. La distribución de la variable en la población es normal con
varianza = 225. Extraemos una muestra aleatoria de 144 alumnos y obtenemos: una media = 32 puntos.
Fijamos un nivel de significación α = 0,05.
Los contrastes de hipótesis están basados en estadísticos (medidas de discrepancia) y tienen una
distribución de probabilidad conocida; así, todas las decisiones llevan aparejadas una probabilidad de
ocurrencia. Al tomar una decisión sobre una H0 pueden darse cuatro situaciones (dos de ellas son
decisiones acertadas y dos erróneas). Siempre debemos proponernos que (1 - α) y (1 - β) sean altos
y que α y β sean bajos.
Siempre se cumple ! α + (1 - α) = 1 y β + (1 - β) = 1
Error tipo II (β) ! Bajo la distribución de H1 cuando aceptamos erróneamente la H0 siendo falsa (β =
probabilidad de cometer error de tipo II)
Potencia de contraste (1–β) ! Representa la probabilidad de rechazar la H0 siendo falsa = la
probabilidad de aceptar una H1 verdadera (probabilidad de obtener un resultado estadísticamente
significativo) 1 – β = Probabilidad de no cometer Error tipo II.
Tamaño del efecto: Expresa la magnitud de la diferencia observada entre la H0 (el valor teórico) y la
H1 (el valor observado)
Un contraste de hipótesis es un procedimiento para decidir si una hipótesis se acepta como válida
o se rechaza. Los principales pasos para tomar la decisión son:
MEDIA POBLACIONAL
2
PARAMÉTRICOS CONOCIDA σ
2
DESCONOCIDA σ
Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente sigue una distribución normal
en la población y está medida, al menos, a nivel de intervalo. Podemos conocer o no el valor de la
varianza poblacional (también aplicable a cualquier otro tipo de distribución, con varianza
desconocida, si n ≥ 30, según el Teorema Central del Límite)
Hipótesis Estadísticas: µ0 es el valor concreto de la media poblacional acerca del cual queremos
comprobar si µ es diferente, menor o mayor // Se aconseja formular primero H1
Estadístico de contraste:
_ __
Conocida la varianza de la población ! Z = (Y - µ0) / σ / √ n
_ _
Y es la media muestral // σ / √n es el error típico de la media
µ0 es el valor propuesto para la media poblacional por H0
El Estadístico de Contraste sigue la distribución N (0,1)
_ __
Desconocida la varianza de la población ! T = (Y - µ0) / S n-1 / √ n
_
S2n-1 = (Y – Y)2 / n – 1 es la cuasi varianza muestal (estimador insesgado de varianza poblacional)
El Estadístico de Contraste sigue la distribución T de Student con n – 1 gl. (Cuando gl > 30 la
distribución T de Student se aproxima a la normal).
n S2
Relación entre la varianza y la cuasi varianza muestral ! (n-1) S n-1 = n S // Luego S n-1 = ---------
2 2 2
n-1
Intervalo de confianza: _ _
Y + Z α/2 · σ / √n = LS y LI (conocida σ2 poblacional)
_ ______
Y + T n-1; α/2 · Sn-1 / √n = LS y LI (desconocida σ2 poblacional)
PRUEBA DE LOS SIGNOS: Considera que el valor de la mediana bajo la H0 es correcto; por tanto,
en la población, existirán similares valores por encima y por debajo (mismo número de signos
positivos y negativos al calcular la diferencia entre cada valor y la mediana propuesta en la H0)
Supuestos (Razones que justifican su elección): muestra aleatoria de “n” observaciones aleatorias
e independientes de una población con mediana desconocida. Contraste sobre el Promedio
Poblacional. Desconocemos el cumplimiento de los supuestos paramétricos. Asumimos que la
distribución de la variable es continua por lo que no debemos encontrar diferencias nulas, si
aparecen, se descartan). Datos directos, sin agrupar, medidos, al menos, en una escala ordinal.
Hipótesis Estadísticas:
Contraste Bilateral: H0: η = η0
H1: η ≠ η0
Contraste Unilateral Izquierdo H0: η ≥ η0
H1: η < η0
Contraste Unilateral Derecho H0: η ≤ η0
H1: η > η0
Estadístico de contraste: (S+ ó S-) se obtienen al restar cada una de las observaciones del valor
de la mediana propuesto por la H0. Si alguna diferencia es nula, se elimina, reduciéndose el tamaño
de la muestra. ____
Cuando la muestra es grande se aproxima a la normal mediante [S+ (ó S-) – n/2] / √ n/4
PRUEBA DE WILCOXON: Conocida como “prueba de rangos y signos”, gana en precisión con
respecto a la prueba de los Signos, ya que aprovecha mejor la información disponible; tiene en
cuenta, a la vez, el signo de las diferencias y la magnitud de las mismas. Wilcoxon es una prueba
más precisa.
Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. Se trata de un contraste sobre el Promedio Poblacional.
Desconocemos el cumplimiento de los supuestos paramétricos. La distribución de la variable en la
población ha de ser simétrica y continua. Datos directos, sin agrupar. Nivel de medida de los
datos, al menos, de intervalo.
Cálculo del Estadístico de Contraste: (∑R+ ó ∑R-) suma de rangos positivos y negativos.
Conocemos los datos obtenidos en la muestra // Calculamos las diferencias entre cada observación
y la mediana propuesta por la H0. Se eliminan las diferencias nulas, reduciendo el tamaño muestral
“n” // Estas diferencias, en valor absoluto, se ordenan de menor a mayor, y se sustituye cada una de
ellas por el rango que le corresponde // Si hay empates, se adopta el “criterio del rango medio”; es
decir, se le atribuye a cada una el rango promedio de los rangos que les hubieran correspondido de
ser diferentes // A cada rango se le añade el signo + o – de la puntuación de diferencia
correspondiente y se suman, obteniendo R+ y R-
Distribución muestral del estadístico: distribución de valores de Wilcoxon. Para utilizar la tabla W
de Wilcoxon se selecciona el sumatorio más pequeño y se toma la decisión mediante los valores
críticos.
PROBLEMAS EJEMPLO
CONTRASTE SOBRE LA MEDIA (VARIANZA POBLACIONAL CONOCIDA)
Vamos a plantear otro supuesto que modificaría la definición de las hipótesis ! Sospechamos,
antes de realizar el experimento, que la modificación en el proceso de fabricación aumenta el
grado alcohólico.
Supuestos: Similares; Hipótesis (Contraste unilateral derecho): H0: µ = 12´5 y H1: µ > 12´5
Estadístico de contraste: Similar
Valores críticos: con α = 0´05 y un contraste unilateral derecho ! 1´65
Decisión estadística: El valor del estadístico de contraste (0´217) se sitúa en la región de
aceptación (por debajo del valor crítico 1´65); por tanto aceptamos H0.
El nivel crítico (p): asociado al estadístico de contraste (0´217) es 0´4129 (1-0´5871) que resulta
mayor que el nivel de significación fijado (α = 0´05); por tanto, aceptamos H0
Conclusión: El cambio en la fabricación no ha modificado significativamente el grado alcohólico.
Interpretación: Con la información de la que disponemos no hemos encontrado evidencia
suficiente de que la media no sea igual a 12.5
Siguiendo con el ejemplo del grado alcohólico de los vinos de la denominación de origen de
Ribera de Duero, los resultados del contraste bilateral desconocida la varianza de la población
(suponiendo que no nos hubieran facilitado este parámetro), serían:
Problema ejemplo: Una determinada empresa utiliza, desde hace muchos años, un test de aptitudes
para seleccionar a sus empleados. Para dicho test tiene establecido que la mediana está en 180. El
psicólogo de la empresa quiere probar que efectivamente la mediana sigue siendo correcta (probar la
H0 de que la mediana en la población es igual a 180). Para ello obtiene una muestra de 15
trabajadores y les aplica el test obteniendo los siguientes resultados:
189 233 195 160 212 176 231 202 193 174 166 248 199 213 185
Estadísticos de Contraste: #
Signos: Previamente ordenamos las puntuaciones (la mediana es un índice de posición). Restando
180 a cada una de las 15 puntuaciones obtenidas por los sujetos, obtenemos 11 (S+) y 4 (S-)
160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
- - - - + + + + + + + + + + + SIGNOS
Wilcoxon: Más precisa. Después de ordenar las puntuaciones de menor a mayor y ordenar las
diferencias con la mediana en valor absoluto, obtenemos:
160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
-4 5 -6 9 13 -14 15 19 -20 22 32 33 51 53 68 ORDEN
- + - + + - + + - + + + + + + SIGNOS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 RANGOS
Decisión estadística:
Signos: Función de distribución Binomial (Tabla II); para n = 15 y probabilidad = 0,50, encontramos el
valor 0,0592 ! P (S- ≤ 4) = 0,0592. Para averiguar el nivel crítico p, multiplicamos por 2 la
probabilidad asociada al estadístico de contraste (0´0592 · 2 = 0´1184) dado que es bilateral.
Wilcoxon: Tablas ! para un contraste bilateral con α/2 = 0,025 y n = 15; el valor crítico es ! 26
Conclusión:
Signos: Como p (0´1184) es mayor que α (0,05) Mantenemos H0. También tabla (Test de signos dos
direcciones) para n =15 y α = 0,05, y un contraste bilateral, el valor crítico es igual a 3 ! como S- = 4 >
3 (Mantenemos H0)
Wilcoxon (más precisa): Como 19 (se toma la suma menor) < 26 ! Rechazamos la H0
Interpretación:
Signos: Teniendo en cuenta los resultados, es posible seguir manteniendo que la Mediana de la
población de referencia es 180, con un α = 0,05.
Wilcoxon: Teniendo en cuenta los resultados, no es posible seguir manteniendo que la Mediana de la
población de referencia es 180, con un α = 0,05.
Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente sigue una distribución normal y
está medida, al menos, a nivel de intervalo.
Hipótesis Estadísticas:
2 2
Contraste Bilateral: H0: σ = σ 0
2 2
H1: σ ≠ σ 0
2 2
Contraste Unilateral Izquierdo H0: σ ≥ σ 0
2 2
H1: σ < σ 0
2 2
Contraste Unilateral Derecho H0: σ ≤ σ 0
2 2
H1: σ > σ 0
σ20 es el valor concreto de la varianza poblacional acerca del cual queremos comprobar si la
varianza poblacional es diferente, menor o mayor // Se aconseja formular primero H1.
σ2o es el valor propuesto para la varianza poblacional por H0 y S2n-1 = la cuasi varianza muestral. El
Estadístico de Contraste sigue una distribución Chi-Cuadrado con (n-1) gl.
Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente es dicotómica.La proporción es
el cociente entre el número de veces que aparece la observación dividido entre el número total de
observaciones)
Hipótesis Estadísticas:
Contraste Bilateral: H0: π = π0
H1: π ≠ π0
Contraste Unilateral Izquierdo Ho: π ≥ π0
H1: π < π0
Contraste Unilateral Derecho H0: π ≤ π0
H1: π > π0
PROBLEMAS EJEMPLO
Contraste de hipótesis sobre la varianza: Los resultados de un reciente estudio indican que 81
estudiantes de primero de Psicología de la UNED, elegidos mediante muestreo aleatorio simple,
estudian una media de 6 horas a la semana, con una cuasi desviación típica de 3. La población
universitaria europea estudia, también, una media de 6 horas a la semana, pero con una desviación
típica de 2. Queremos saber si la variabilidad encontrada en nuestra muestra es estadísticamente
diferente de la de la población de estudiantes europeos. Trabajaremos a un nivel de confianza del
95 %.
_
Supuestos: Muestra aleatoria de 81 estudiantes de la UNED (X = 6 y SX = 3). Datos de la población
de estudiantes europea (µ = 6 y σ = 2) para α = 0,05. La variable dependiente está medida, al
menos, a nivel de intervalo. Se plantea un CH sobre la varianza.
Decisión estadística:
$ A partir de los valores críticos (80 gl; α/2 = 0,025 y 1-α/2 = 0,975) ! 57´15 y 106´63.
Rechazamos la H0 porque el valor muestral del estadístico de contraste (180) > el valor
crítico superior (χ2 = 106´63)
$ Si tenemos en cuenta el nivel crítico p (χ2 = 180 con 80 gl ! encontramos que p es < 0´005)
y dado que p < α (0´05) ! Rechazamos H0.
$ Considerando el intervalo de confianza: Rechazamos H0 (σ2 = 4 no está en el intervalo)
80 · 9 80 · 9
Intervalo de confianza ! ---------------- < σ2 < ----------------- (6´75 y 12´61)
106´63 57´11
Hipótesis: Contraste bilateral (no se especifica ninguna dirección a favor o en contra). Sabemos
que π = 3/5 = 0,6 y la hipótesis nula se centra si nuestros datos son compatibles con este resultado
(teóricamente poblacional). Luego ! H0: π = 0´6; H1: π ≠ 0´6
Estadístico de contraste: Nuestra proporción es ! 435/750 = 0´58. Con estos datos aplicamos la
fórmula del estadístico de contraste ! Z = (0´58 – 0´6) / (√ 0´6·0´4 / 750) = - 0´02 / 0´0179 = - 1´12.
Valores críticos: Al tratarse de un contraste bilateral deben ser dos valores. Buscando en las tablas
de la curva normal con α = 0´04 (bilateral α/2 = 0´02 y 1-α/2 = 0´98) encontramos las puntuaciones
típicas (- 2´05 y 2´05)
Decisión estadística:
$ Teniendo en cuenta los anteriores valores críticos (- 2´05 y 2´05), Aceptamos la H0 porque el
valor muestral del estadístico de contraste (- 1´12) > el valor crítico inferior (- 2´05)
$ Si tenemos en cuenta el nivel crítico p (Z (-1´12) = 0´1314; luego 2 · 0´1314 = 0´2628). Como p
(0´2628) > que α (0´04) ! Aceptamos H0.
$ Considerando el intervalo de confianza: Aceptamos H0 (0´6 está en el intervalo)
____________ __________________
P ± |Zα/2| √ (π0 (1 - π0) / n ! 0´58 ± 2´05 √ (0´58 (1 – 0´58) / 750 = (0´543 y 0´617)
Conclusión e interpretación: Dado que hemos aceptado la hipótesis nula (π = 0´6) podemos
afirmar que el 60% de la población española están en contra de la inmigración ilegal; por tanto, el
40% estará a favor.
Problema ejemplo: La aplicación de un test entre docentes tiene, por experiencias anteriores, una
media de 55 y una varianza de 121, N (55, 121). Un psicólogo educativo considera que en la actualidad
el promedio se ha incrementado, pasando a ser de 60 puntos. Para contrastar esta hipótesis somete al
test a 50 individuos extraídos aleatoriamente de la población y obtiene una media de 58. Fijando un
nivel de significación α = 0,01. ¿Puede aceptarse la hipótesis del psicólogo?
Hipótesis estadísticas (contraste unilateral derecho): H0: µ0 = 55 y H1: µ1 > 55 (µ1 = 60)
Descripción de la variable y de los datos muestrales: Variable medida a nivel de intervalo, distribución
normal, con varianza conocida N (55, 121) y observaciones aleatorias e independientes.
Estadístico de contraste y cálculo: Bajo la H0: µ0 = 55, tipificamos la media muestral = 58.
_ ___
Z = (Y – µ0) / σY ! Z = (58 - 55) / (11 / √ 50) = 1,93
Decisión estadística:
$ A partir del valor crítico (para α = 0,01. Se trata de un contraste unilateral, acumula α en una
sola cola ! Z = 2,33). Como 1´93 (valor del estadístico de contraste) < 2´33 (valor crítico) ! Se
acepta la H0.
$ A partir del nivel crítico p (al valor del estadístico de contraste 1´93 le corresponde en las tablas
una probabilidad de p (Z < 1,93) = 0,9732 ! 1-0´9732 = 0´0268). Al tratarse de un contraste
unilateral p = 0´0268 > α = 0´01; Por tanto, Se acepta la H0
Interpretación de los resultados: Para un nivel de significación α = 0,01, no podemos afirmar que la
media poblacional se ha incrementado en la actualidad.
Bajo la Hipótesis nula (H0: µ0 = 55) se determina el límite entre la región de aceptación y rechazo
(Contraste unilateral derecho)
_ -----------------------------------|-----
Z = (Yc – µ0) / σY ! Z = 2,33 Z = (Yc - 55) / (11 / √50); Yc = 58,62
_ ------------------|------------------------------
Z = (Yc – µ1) / σY Z = (58,62 - 60) / (11 / √50); Z = (- 0,89)
Probabilidad de obtener una Z ≤ (- 0,89) ! Z (-0,89) = 0,1867 ! β = 0,1867 (error tipo II)
Potencia de Contraste ! (1 – β) = 0,8133
TIPOS DE MUESTRAS
CONTRASTE DE HIPÓTESIS
Estadístico
de
Contraste
Dos centros de Educación Especial vienen utilizando, desde hace dos años, métodos diferentes
para estimular las funciones superiores de los niños con retraso mental. El director de uno de los
centros sostiene que su método (Método A) logra mejores resultados que el del otro centro (Método
B). Para estudiar esta cuestión, fijamos α = 0,03, extraemos aleatoria e independientemente dos
muestras de niños, una en cada centro (nA = 120 y nB = 50) y les medimos el cociente intelectual (CI)
en una escala de intervalo. Los niños de ambos centros iniciaron el programa de estimulación con
un CI medio igual a 70 y los CI medios tras el programa fueron 79 para los niños estimulados con el
método A y 74 para los estimulados con el método B. La distribución de los CI es normal en las
poblaciones con σA = 18 y σB = 12 y todas las observaciones son independientes entre sí.
Hipótesis: Planteamos un contraste unilateral derecho (queremos probar si el método A es más eficaz)
Regla de decisión:
Valores críticos (para un nivel de confianza del 97% y un contraste unilateral, el valor crítico es !
Z0´97 = (1´88)
Nivel crítico p (el estadístico de contraste 2´12 se asocia a una probabilidad p = P (Z ≥ 2,12)
! 1 – 0,983 = 0,017
Conclusión: Se rechaza H0 [el estadístico de contraste 2´12 > 1´88 (valor crítico) y también p =
0,017 (nivel crítico) < α = 0,03 (nivel de significación)].
Interpretación: El programa de estimulación del CI ha sido eficaz con un nivel de confianza del
97% (mejor el método A que el método B)
Intervalo de confianza: Para realizarlo suponemos que se trata de un contraste bilateral; por tanto,
habría que reformular las hipótesis:
_ _
(Y1 – Y2) ± | Z α/2 | · Error típico ! Límite superior y Límite inferior
(79 – 74) ± (0,03/2 = Z (-2´17) · 2,36 (denominador e. contraste) = 5 ± 5´12 ! (- 0´12 y 10´12)
Decisión: Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la
diferencia de medias en la población puede tomar ese valor
En una investigación psicopedagógica se pasó la misma prueba de nivel de lectura a dos grupos de
niños: los participantes habían sido elegidos de forma aleatoria de entre los alumnos de EGB de dos
provincias españolas. Los datos se muestran en la tabla. La variable se midió en una escala de
intervalo y se supone que σ2A = σ2B
Supuestos: Disponemos de dos muestras independientes (dos grupos de niños) que se someten a
una prueba de lectura. La variable dependiente medida a nivel de intervalo. Varianzas
poblacionales desconocidas y supuestamente iguales (σ2A = σ2B). Muestras grandes (121 y 61).
Hipótesis: Planteamos un contraste bilateral para ver si las diferencias se deben al azar.
_________________________________________________
Error típico = √[( n1 – 1) S21 + (n2 – 1) S22 / (n1 + n2 – 2)] · (1 / n1 ) + (1 / n2 )
______
Error típico = √0´1665 = 0,408
Regla de decisión:
Valores críticos (tabla t de Student con 121 + 61 – 2 = 180 grados de libertad y α = 0,05). Se trata
de un contraste bilateral y son muestras grandes; por tanto, utilizamos Z0´025 (- 1´96) y Z0´975 = (1´96)
Nivel crítico p (el estadístico de contraste 4´90 se asocia a una probabilidad < 0´0005 que es más
pequeña que α)
Conclusión: Rechazamos H0 (el estadístico de contraste 4´90 no está entre los valores críticos ±
1´96 y de igual forma, considerando el nivel p crítico, p < α)
Interpretación: El rendimiento medio en la prueba de lectura no es igual en los dos grupos con un
nivel de significación α = 0,05.
Intervalo de confianza:
_ _
(Y1 – Y2 ) ± | tα (n1 + n2 – 2) | · Error típico = (Límites inferior y superior)
(40 – 38) ± 1´96 · 0´408 = 2 ± 0´8 = (1´2 y 2´08) ! Rechazamos H0 (el intervalo de confianza no
contiene el valor 0, luego asumimos que la diferencia de medias en la población no puede tomar
ese valor)
Distintos estudios muestran que la relajación es eficaz para reducir la ansiedad precompetitiva.
Siguiendo esta línea de investigación y habiendo hipotetizado una reducción de la ansiedad en las
escaladoras tratadas con relajación, extraemos aleatoria e independientemente 12 escaladoras y
les asignamos aleatoriamente a las dos condiciones del experimento: la mitad de las escaladoras se
somete a un programa de relajación durante seis meses y la otra mitad no realiza ningún tipo de
relajación (suponemos que las poblaciones se distribuyen normalmente con distinta varianza). Al
finalizar el programa de relajación, medimos la ansiedad precompetitiva de todas las escaladoras,
obteniendo una ansiedad media de 8 y una varianza insesgada de 150 en el grupo “sin relajación” y
una ansiedad media de 6´5 y una varianza sesgada de 100 en el grupo “con relajación”. El nivel de
significación alfa se fijó en 0,05, la variable dependiente está medida a nivel de intervalo y a mayor
puntuación mayor ansiedad. ¿Podemos afirmar que realmente la ansiedad precompetitiva de las
escaladoras se reduce utilizando técnicas de relajación?
(150 / 6 + 83 / 6)2
gl = ----------------------------------------------------- =
[(150 / 6)2 / (6 – 1) + (83 / 6)2 / (6 – 1)
Regla de decisión:
Valor crítico para α = 0,05 ! Según la tabla t de Student (contraste unilateral derecho), con 9 gl
encontramos el valor ! t9; 0´05 = 1´833
Nivel crítico p ! el valor del E. Contraste T = 0´24, con 9 gl se encuentra entre 0´55 < p < 0´60
Conclusión e interpretación: Se acepta H0 para un nivel de confianza del 95%. Según el valor
crítico (contraste unilateral derecho) T (0´24) < 1´833 ! Aceptamos H0.
Según el nivel p crítico (0´55 < p < 0´60) > que el valor de α = 0,05. La ansiedad precompetitiva de
las escaladoras no disminuye utilizando técnicas de relajación.
U1 = S1 - ½ n 1 (n1 + 1) // U2 = S2 - ½ n 2 (n2 + 1)
Distribución
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon
PROBLEMA EJEMPLO
En una investigación de Psicología Social sobre valores, se han extraído dos muestras aleatorias de
personas. Una muestra se extrajo de una región del interior de la Península (n=5) y la otra de la
costa (n=6). Los participantes cumplimentaron un cuestionario de xenofobia, que ofrece
puntuaciones en una escala ordinal, obteniendo los resultados que se presentan en la Tabla 1 (a
mayor puntuación mayor xenofobia). Se desea saber si la tendencia central de los habitantes de la
costa es más baja que la de los del interior. Se asume que las distribuciones de la variable en las
dos poblaciones tienen la misma forma (si difieren sólo lo hacen en su tendencia central)
Interior 6 14 10 18 20
Costa 16 12 4 8 2 22
Hipótesis: La hipótesis nula siempre es aquella que afirma lo contrario de lo que el investigador
desea probar. Desea probar que la tendencia central (contraste no paramétrico, mediana) en
habitantes de la costa es menor que en habitantes del interior. Contraste unilateral izquierdo
Estadístico de contraste:
1º.- Ordenamos el total de las puntuaciones de menor a mayor (puntuaciones de interior en negrita)
2 4 6 8 10 12 14 16 18 20 22
2 4 6 8 10 12 14 16 18 20 22
1 2 3 4 5 6 7 8 9 10 11
3º.- Sumamos los rangos de cada grupo: Rangos de interior (negrita) S1 = 3+ 5+ 7+ 9 +10 = 34
Rangos de costa S2 = 1+2+4+6+8+11 = 32
Regla de decisión:
Conclusión: Dado que el nivel crítico p (0´268) es mayor que α (0´05) ! Aceptamos H0
Interpretación: Las distribuciones del interior y las de la costa no difieren en cuanto a las medianas
en sus apreciaciones sobre la xenofobia.
D=0 D≠0
_____________________
Z = (P1 – P2 ) - 0 / √ P (1 - P ) · (1 / n1 ) + (1 / n2 ) ___________________________
Estadístico Z = (P1 – P2) - λ. / √ P1 (1 – P1 ) / n1 + P2 (1 – P2 ) / n2
Contraste Donde P = (n1 · P1 ) + (n2 · P2 ) / (n1 + n2 )
Distribución
Muestral Normal tipificada N (0, 1)
PROBLEMAS EJEMPLO
El grado de dificultad de las preguntas de un test se suele medir por el número de los sujetos que
los aciertan, o más exactamente, por la proporción de aciertos. Para averiguar si dos preguntas de
un determinado test de aptitud general difieren en dificultad, hemos seleccionado una muestra
aleatoria simple de 200 sujetos y los hemos repartido aleatoriamente en dos grupos de 100. Un
grupo de sujetos ha respondido a la pregunta 1 y el otro a la pregunta 2. La pregunta 1 la han
acertado 70 sujetos y la 2 la han acertado 60. El nivel de significación α se fijó en 0,05.
Supuestos: Tenemos una muestra aleatoria de n = 200 sujetos, repartidos en dos grupos
independientes de 100 (cada uno responde a una pregunta y se considera el acierto o el error !
variable dicotómica). Se fija α = 0,05. Se dan los supuestos para realizar un Contraste de
Proporciones al comparar el grado de dificultad de las dos preguntas del test.
Hipótesis: Planteamos un contraste bilateral para ver si las preguntas difieren en dificultad.
H0: π1 = π2 // H1: π1 ≠ π2
P = (n1 · G1) + (n2 · G2) / (n1 + n2) ! (100 · 0,7) + (100 · 0,6) / (100 + 100) = 0,65
_______________________________
Z = (0,7 – 0,6) / √ 0,65 (1 – 0,65) · (1 / 100) + (1 / 100) = 1,48
Regla de decisión:
Valores críticos (para un nivel de confianza del 95% y un contraste bilateral, los valores críticos
son ! ± 1´96 ! Z0´025 (- 1´96) y Z0´975 = (1´96)
Nivel crítico p [el estadístico de contraste (Z = 1,48) en la tabla de la curva normal deja por debajo
0,9306] ! Probabilidad (Z ≥ 1,48) = 1 - 0,9306 = 0,0694; al ser bilateral ! 2 · 0,069 = 0,1388.
Conclusión: Aceptamos H0 (el estadístico de contraste 1´48 está entre los valores críticos ± 1´96 y
de igual forma, considerando el nivel p crítico, p (0´1388) > α (0´05)
Interpretación: Para un nivel de confianza del 95%, aceptamos la hipótesis nula (las preguntas no
difieren en dificultad)
Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la diferencia de
medias en la población puede tomar ese valor)
2 2 2 2
Estadístico F =S 1 / S 2 Donde S 1 ≥S 2 (varianzas insesgadas)
Contraste
Intervalo
2 2 2 2 2 2
confianza (f α / 2 ; n1 – 1 y n2 – 1) ·Ŝ 1 / Ŝ 2 < σ 1 / σ 2 < (f 1 – α / 2 ; n1 – 1 y n2 – 1) ·Ŝ1 / Ŝ 2
PROBLEMAS EJEMPLO
Deseamos contrastar si las pacientes anoréxicas (PA) son más variables, en cuanto a su nivel de
estrés, que las pacientes bulímicas (PB). Para ello, extraemos dos muestras aleatorias de dichas
pacientes y se obtienen los siguientes datos sobre su nivel de estrés (donde a mayor puntuación
mayor estrés), considere α = 0,05:
PA 4 6 8 12 16
PB 3 5 7 9 14
Sabemos que la variable “nivel de estrés” está medida a nivel de intervalo y distribuida normalmente en
ambas poblaciones.
Hipótesis: H0: σ2PA / σ2PB ≤ 1 y H1: σ2PA / σ2PB > 1. Contraste Unilateral Derecho.
Conclusión e interpretación: No se rechaza H0 porque 1,3 (estadístico de contraste) < 6,39 (valor
crítico). Por tanto, las pacientes anoréxicas (PA) no son más variables que las bulímicas (PB) en
cuanto a su nivel de estrés considerando un nivel de confianza del 95%.
0,10) · (23,2 / 17,8) = 0,13 < σ21 / σ22 < (9,60) · (23,2 / 17,8) = 12,48
Siendo los valores críticos: f 0,025; 4 y 4 gl = 9,60 y f 0,975; 4 y 4 gl = 1 / 9,60 ! 0,10 (propiedad recíproca).
Decisión: Como la H0 debe plantear que las varianzas son iguales (σ21 / σ22 = 1) y apreciamos que
uno está dentro del intervalo de confianza (0,13 y 12,48). Se aceptaría la H0 (las varianzas de
ambas poblaciones son iguales)
La magnitud o tamaño del efecto alude al índice que mide el efecto que tiene un tratamiento. Deben
estar implicados al menos dos grupos (el experimental y el control). Es independiente del tamaño
muestral.
|YTRATAMIENTO – YCONTROL |
Índice d = -------------------------------------------------------
√[( n1 – 1) Ŝ21 + (n2 – 1) Ŝ22 / (n1 + n2 – 2)]
Según Cohen (1988) ! Magnitud del efecto [pequeño (d = 0´2); mediano (d = 0´5) y grande (d =
0´8 o superior)
ENTRENAMIENTO PSICOLÓGICO 37 14 38 43 35
ENTRENAMIENTO TÉCNICO 29 36 11 17 13
La d = 1´35 es la distancia estandarizada entre las medias de los dos grupos y su probabilidad
asociada (0´9115) ! El 91´15% de los sujetos con entrenamiento psicológico mejoran respecto a
los que únicamente reciben entrenamiento técnico.
Las muestras relacionadas nos ayudan a reducir la varianza de error. Así, cuanto mayor sea la
relación entre ambas muestras, menor será la varianza de la distribución muestral de las diferencias
y, por tanto, mayor el estadístico de contraste.
CONTRASTES DE HIPÓTESIS:
_ __ _ __
2
Estadístico Z = (D – µd) / (σd / √ n ) T = (D – µd) / (Ŝ d / √ n )
Contraste
Distribución
Muestral Normal Tipificada: (0, 1) “t” de Student: gl = n-1
_ __ _ __
Intervalo D ± | Z α/2 | · σD / √ n = (Lím. infer y sup) D ± | t α/2; n– 1 | · SD / √ n = (Lím. infer y sup)
confianza Distribución Muestral Z con N (0,1) Distribución Muestral T con (n – 1) gl
Se desea estudiar si los alumnos de la ESO son más variables en cuanto a su nivel de
concentración antes y después de haberles sometido a una terapia. Sobre una muestra aleatoria de
7 alumnos se toman medidas del nivel de concentración previo y posterior a la aplicación de la
terapia, obteniéndose los siguientes resultados (a mayor puntuación, mayor concentración):
MEDIDA PREVIA 12 9 11 10 9 6 7
MEDIDA POSTERIOR 7 5 6 6 5 6 7
Sabiendo que para aplicar el estadístico de contraste se resta la medida posterior de la previa, que
la concentración es una variable medida a nivel de intervalo y que se distribuye normalmente en
ambas poblaciones, tómese un nivel de significación α = 0,05 y compruebe si los alumnos se
concentran más al finalizar la terapia.
Hipótesis: La hipótesis alternativa es la hipótesis del investigador. Del planteamiento del problema
se deduce de que se trata de un contraste unilateral izquierdo donde:
2
Medida Medida Diferencia D - DMedia (D - DMedia)
Previa Posterior Posterior - Previa
12 7 -5 - 1,86 3,4596
9 5 -4 - 0,86 0,7396
11 6 -5 - 1,86 3,4596
10 6 -4 - 0,86 0,7396
9 5 -4 - 0,86 0,7396
6 6 0 3,14 9,86
7 7 0 3,14 9,86
Σ = 64 Σ = 42 Σ = (- 22) Σ = 28,86
_
Averiguamos la media (D) y la varianza insesgada (Ŝ2d) de las puntuaciones diferencia:
_ __ __
Desconocida la varianza de la población: T = (D – 0) / (Ŝ2d) / √ n) ! T = (- 3,14) / (4,81 / √ 7) = - 1,7
__________________ _ _ _
Donde: Ŝ2d = √ Σ (Di – DMedia)2 / (n – 1) y D = Y1 – Y2 = Σ Di / n
________ _
Ŝ2d = √ 28,86 / 6 = 4,81 y D = (- 22) / 7 = (- 3,14)
Regla de decisión:
Valor crítico (contraste unilateral izquierdo) ! - 1,943 (valor crítico T0, 05 y 6 gl)
Nivel crítico p sólo puede obtenerse el valor aproximado, porque 1,7 no figura en la tabla T de
Student para n–1 = 6 gl. El valor 1,7 está entre 0,10 (1,4) y 0,05 (1,9).
(-3´14) ± 1´943 · 4´81 / 2´64 ! (- 3´14) ± 3´54 ! (0´4 y 6´68) ! No contiene el 0, Rechazamos H0
Unos psicólogos hipotetizan que los hombres (H) con más de 20 años son más afectuosos hacia su
pareja que las mujeres (M). Extrae una muestra aleatoria de 8 parejas casadas y les mide el grado
de afectividad hacia la pareja, obteniendo los datos que aparecen a continuación (a mayor
puntuación mayor afectividad hacia la pareja). Se sabe que la puntuación en afectividad es una
variable medida a nivel de intervalo que se distribuye normalmente y que las observaciones entre
las muestras no son independientes. Se fija alfa en 0´01. Suponemos conocida la varianza de las
diferencias (σ2d = 5).
PAREJAS 1 2 3 4 5 6 7 8
HOMBRES 13 5 6 9 10 7 11 8
MUJERES 1 9 8 6 5 8 3 5
Supuestos: Se sabe que la puntuación en afectividad es una variable medida a nivel de intervalo,
que se distribuye normalmente en ambas poblaciones y que conocemos la varianza de las
diferencias (σ2d = 25). Se fija α en 0,04. Según el enunciado ! Diferencia de medias (muestras
relacionadas)
Estadístico de contraste:
H M D
13 1 12
5 9 -4
6 8 -2
9 6 3
10 5 5
7 8 -1
11 3 8
8 5 3
Media = 8,7 Media = 5,7 Σ = 24
_ _ _ _
D = H – M = Σ Di / n ! D = 24 / 8 = 3 // σ2d = 5
_ __ _
Z = (D – 0) / (σ2d / √ n) ! T = 3 / (5 / √8) = 3 / 1´77 = 1,69
Regla de decisión:
El nivel crítico p (probabilidad de obtener un valor del estadístico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadístico de contraste (1,69) que buscando en la
tabla de la curva normal ! p = 1 – P (T ≤ 1´69) ! 1-0`9545 = 0´0455.
El valor crítico para un contraste unilateral derecho y un alfa = 0´01 es ! 2´33
Distribución
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon
PROBLEMA EJEMPLO
Un investigador desea comparar el grado de hiperactividad en obesos cuando están en un
programa para bajar de peso (dieta) y sin programa para bajar de peso. Dispone de 10 sujetos a los
que somete a las dos condiciones experimentales (con dieta y sin dieta). Las puntuaciones se
reflejan en la tabla. Sabiendo que la distribución de las diferencias es simétrica, con un nivel de
confianza del 95%, ¿se puede afirmar que hay diferencias en hiperactividad en obesos cuando
están o no en un programa de dieta?
Estadístico de contraste:
∑ R+ = (1´5 + 7´5 + 9´5 + 4´5 + 7´5 + 4´5 + 4´5) = 39´5 y ∑ R- = (1´5 + 9´5 + 4´5) = 15´5
Se toma el valor del más pequeño de los sumatorios ! W = 15´5 (Estadístico de Contraste)
Regla de decisión: Con α/2 = 0´05 (contraste bilateral) y n = 10, acudimos a la tabla de Wilcoxon y
obtenemos un valor crítico = W0´025; 10 = 9
Conclusión e interpretación: Dado que el estadístico de contraste (W = 15´5) > el valor crítico (W = 9)
no podemos rechazar la H0 con un nivel de confianza del 95%. Las diferencias en el incremento o
disminución de la hiperactividad en personas obesas con dieta o sin dieta, no son significativas.
Estadísticamente resultan iguales, en razón de que pueden ser diferencias dadas al azar.
_______
2 2
Z = (b - c) / √ (b + c) χ = (b – c) / (b + c)
Estadístico
Contraste b ! (sujetos que puntúan 1 en la primera medida y 2 en la segunda).
c ! (sujetos que puntúan 2 en la primera medida y 1 en la segunda)
Distribución
Muestral Normal tipificada N (0, 1) Chi Cuadrado con 1 grado de libertad
2 2
Regla (C. Bilateral) ! Z ≤ Z α / 2 y Z ≥ Z 1 - α / 2 χ < χ 1; 1-α → Mantener H0
decisión (C. Unilateral Izquierdo) ! Z ≤ Z α
2 2
(C. Unilateral Derecho) ! Z ≥ Z 1 – α χ > χ 1; 1-α → Rechazar H0
_______
Intervalo (P1 – P2 ) ± | Z α/2 | · √ (b + c) = (Límites inferior y superior)
confianza
PROBLEMA EJEMPLO
Supuestos: Muestra grande de 102 sujetos sometidos a dos medidas de la misma variable
(cometer o no cometer infracción)! Variable dependiente dicotómica. [b + c] > 25 Se trata de
contrastar las proporciones en dos muestras de observaciones relacionadas.
Estadístico de contraste:
Regla de decisión:
Los valores críticos, contraste bilateral, con α/2 = 0,005 y 1- α/2 = 0,995 ! ± 2´58.
El nivel crítico p (probabilidad de obtener un valor del estadístico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadístico de contraste (± 1´02) que buscando en
la tabla de la curva normal ! 2 [P (Z ≥ 1´02) = 2 · (1 – 0,8461) = 2 · 0,1539 ! 0,3078.
Conclusión e interpretación:
Como p (0,3078) > α (0,01) ! Aceptamos H0. También como 1´02 (valor muestral del estadístico de
contraste) < 2´58 (el mayor de los valores críticos). También 1´02 está entre los valores críticos (-
2´58 y 2´58).
Para α = 0´01, podemos afirmar que la proporción poblacional de los sujetos que se saltan el
semáforo es la misma antes de la proyección de imágenes que después.
También con el test de McNemar: χ2 = (b – c)2 / (b + c) ! χ2 = (34 – 43)2 / (34 + 43) = 1´05
Para χ2con un grado de libertad, el valor 1´05 se encuentra entre (0´10 < p < 0´90) por lo que el nivel p
crítico > que α (0,01) ! Aceptamos H0
Análisis de Varianza (ANOVA ó ANVAR) ! es una técnica paramétrica de análisis estadístico que
se utiliza para comparar las medias de más de dos grupos.
El diseño de más de dos grupos tiene por objeto estudiar la influencia de más de dos valores de la
variable independiente sobre la variable dependiente y, por tanto, tiene más posibilidades de establecer
la relación precisa entre ellas. Una de las características más importantes del diseño de experimentos
es la aleatoriedad: elección de un grupo (muestra) y su distribución en tres o más grupos de forma
aleatoria.
Al comparar distintos grupos para realizar un estudio tenemos en cuenta la variabilidad que aparezca
entre los sujetos en la variable dependiente que se considera formada por dos componentes: la que se
debe al factor estudiado (atribuible a los distintos tratamientos experimentales; variable independiente) y
la que se debe a factores extraños y no controlados (Error Experimental)
El Análisis de Varianza se fundamenta en el estudio de estas variabilidades. La varianza general o
común se divide en: varianza intergrupos (atribuible a los distintos niveles del factor estudiado) y
varianza intragrupos (atribuible al error experimental). Al comparar ambas varianzas obtenemos la
aceptación o rechazo de la hipótesis nula (que consiste en afirmar que no existe diferencia entre las
medias de los distintos grupos)
Lógica del método: Los sujetos se distribuyen aleatoriamente en los mencionados grupos (para
minimizar la influencia de las variables extrañas); por tanto, son semejantes en cuanto a la variable
estudiada dentro de cada grupo y entre los distintos grupos. Si después de aplicar el tratamiento
experimental existen diferencias, se puede pensar que son debidas a los procedimientos aplicados.
TERMINOLOGÍA:
Factores = Var. Independientes que se estudian. Niveles = categorías en que dividimos los factores.
Efectos Fijos = sólo nos interesan unos niveles concretos, los establecidos. Los resultados sólo afectan
a estos niveles. Efectos Aleatorios = los niveles actúan como una muestra y las conclusiones se pueden
generalizar en el sentido de los datos de la muestra.
Modelo Equilibrado = igual número de sujetos en los grupos. Modelo no Equilibrado = distinto número
de sujetos en los grupos.
1.- Probar los supuestos (independencia de las observaciones, normalidad de las distribuciones y
homogeneidad de las varianzas)para asegurarnos que se puede aplicar el ANOVA
2.- Enunciar las hipótesis estadísticas
3.- Decidir el estadístico de contraste que vamos a utilizar para probar la H0
4.- Con qué nivel de confianza vamos a trabajar (establecer la región crítica de rechazo de la H0
5.- Calcular el estadístico de contraste (Tabla del ANOVA)
6.- Tomar la decisión sobre la H0 (comparar el valor F obtenido con el valor crítico)
7.- Interpretación en el contexto de la investigación
Hipótesis estadísticas:
H0: Las observaciones y las muestras son independientes
H1: Las observaciones y las muestras no son independientes
Cálculo del Estadístico de Contraste: Para poder aplicar el Test hemos de dicotomizar la variable
observada. Para ello: A partir de la Mediana (Md) de todas las puntuaciones tomadas conjuntamente
(si una puntuación es mayor que la Md se sustituye por un signo + y si es menor por un signo –)
Valores Críticos: Si el estadístico es r ! Uα/2 y U1-α/2 (en la tabla de valores críticos del Test de
Rachas, buscamos los valores de n1 y n2) // Si el estadístico es T ! Zα/2 y Z1-α/2
PROBLEMA EJEMPLO
Un seleccionador de baloncesto desea averiguar como incide la hora del día a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de mañana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:
Para contrastar la independencia (Test Rachas) ! las observaciones pueden dicotomizarse, utilizando la
mediana (asignando un + cuando la puntuación sea mayor y un - cuando la puntuación sea menor)
Canastas 15 12 14 10 11 16 7 9 12 17 10 12 13 15 20 17 16 18
Signo + - + - - + - - - + - - - + + + + +
Rachas 1 2 3 4 5 6 7 8 9
r ! (nº de rachas) = 9 // n + = 9 (signos positivos) // n - = 9 (signos negativos)
Con un nivel de significación α = 0,05, buscamos los valores críticos en la tabla del test de Rachas
n - = 9; n + = 9; α / 2 = 0,025 y 1 - α / 2 = 0´975 (bilateral)
T (0,025) = 5 y T (0,975) = 14 ! Como (rachas = 9) está dentro del intervalo (entre 5 y 14), se acepta H0. Las
observaciones son independientes.
Este supuesto es el que más va a distorsionar los resultados, en caso de no cumplirse, porque si al
final hay diferencias entre los grupos, no podremos saber si se deben a la variable independiente o a
que ya existían con anterioridad. Supuestos (Modelo equilibrado)
Hipótesis estadísticas:
H0: σ21 = σ22 = σ23 =…… (Las varianzas poblacionales son iguales)
H1: σ21 ≠ σ22 ≠ σ23 ≠……. (Para alguna σ2i)
Decisión:
Zona de Rechazo: R ≥ R r,n,α Si R < R r,n,α ! Aceptamos Ho
Si R ≥ R r,n,α ! Rechazamos Ho
PROBLEMA EJEMPLO
Con el enunciado del problema utilizado para el test de rachas (Modelo equilibrado):
Sabiendo que se cumple el supuesto de normalidad de las distribuciones, comprobar si las varianzas
son homogéneas ! H0: Las varianzas son iguales // H1: No todas las varianzas son iguales
Para contrastar la homocedasticidad (Test de Cochran) ! R = máx Ŝ2I / Σ Ŝ2I
Con un nivel de significación α = 0,05, buscamos los valores críticos de las tablas de Cochran ! n = 6
// r (grupos) = 3 // R = 0,7071
Decisión ! Como 0,504 < 0,7071, se acepta H0 (Las varianzas no difieren significativamente)
Decisión:
2 2 2 2
Zona de Rechazo: X ≥ X (r-1)(1-α) Si X < X (r-1)(1-α) ! Aceptamos Ho
2 2
Si X ≥ X (r-1)(1-α) ! Rechazamos Ho
PROBLEMA EJEMPLO
ESTADÍSTICO DE CONTRASTE !
χ2 r-1 = 2,3026 / {1,0291 · [23 log 2,515 – (8 log 1 + 7 log 2,55 + 8 log 4)]} = 3,45
MODELO "Yij = µ + αij + εij // Cualquier puntuación (Y) tiene tres componentes: (µ) que es la media de
la población. (α) el nivel en que se encuentra, común a todos los componentes adscritos a ese nivel.
(ε) el error experimental o factores no controlados en el experimento (se asume que es una variable
aleatoria distribuida según N (0, σ). Ejemplo ! Y17 = puntuación del sujeto 7º del grupo 1º.
HIPÓTESIS " Efectos fijos (sobre las medias poblacionales) // Efectos aleatorios (sobre las
varianzas ! cuando son = 0, las medias son iguales).
El Numerador del estadístico de contraste contiene la Varianza de error + Efecto real de la VI. El
Denominador contiene la Varianza de error. Por tanto, cuanto menor es el efecto real de la VI más se
acerca el cociente a uno.
Valor Crítico: F (I-1) (N-I) (1-α) Zona de Aceptación: F < F ((I-1) (N-I) (1-α)
Decisión:
Zona de Rechazo: F ≥ F (I-1) (N-I) (1-α) Si F < F crítico ! Aceptamos H0
Si F ≥ F crítico ! Rechazamos H0
Cálculos abreviados (Utilizamos el sistema de notación propuesto por Keppel): El cálculo de las
Sumas de cuadrados se realiza sumando y restando las razones básicas: [Y] (relacionada con las
puntuaciones individuales); [A] con los totales de los niveles y [T] con la suma total.
Fórmulas para las razones básicas Sumas Cuadrados a partir de razones básicas
SCS | A = ∑∑ (Y –YA)2
PROBLEMA EJEMPLO
Un seleccionador de baloncesto desea averiguar cómo incide la hora del día a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de mañana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:
2
SUMATORIOS (Σ) Σ Nº DE CASOS MEDIAS
MAÑANA 78 1042 6 13
TARDE 67 807 6 11,17
NOCHE 99 1663 6 16,5
TOTAL 244 3512 18 13,55
SC INTER = Σ (Σ Y)2 / n – {(Σ Σ Y)2 / N} ! 3395,67 - (244)2 / 18 = 88,11 ! Abreviado: [A] – [T]
Decisión ! Comparando los resultados F (tablas) = 3,68 < F (experimental) = 5,68, por tanto
rechazamos la hipótesis nula. Existen diferencias significativas entre el rendimiento de los jugadores
dependiendo de la hora del día a la que entrenan a un nivel de confianza del 95%.
Permiten obtener información sobre las diferencias entre los distintos tratamientos considerados uno a
uno. El objetivo de las comparaciones múltiples es reducir la cantidad de Error Tipo I (α) que
cometeríamos si se compararan sin más, dos a dos, todas las muestras posibles. Dos tipos:
! Comparaciones planificadas o a priori (no interesan todas las comparaciones, sólo algunas)
! Comparaciones no planificadas, a posteriori o post hoc.
Las que vamos a utilizar se denominan no planificadas, a posteriori o post hoc (se llevan a cabo
cuando se ha realizado el Análisis de Varianza y la F ha sido significativa / hemos rechazado la H0). Las
más importantes ! TUKEY // SECHEFFÉ.
___________
PRUEBA TUKEY (HSD) ! HDS TUKEY = q α, gl, K √ MC error / n
q ! valor crítico en la tabla de rango studentizado. Se averigua considerando el nivel de confianza fijado
(α), los grados de libertad de la MC error y el número de grupos o tratamientos a comparar en el ANOVA.
MC ERROR ! media cuadrática error del Anova (MCINTRA / MCS | A)
n ! tamaño de cada grupo (los modelos han de ser equilibrados). Cuando el modelo no es equilibrado,
se sustituye n por n´ ! n´ = k / (1 / n1) + (1 / n2)...
_ _
Rechazamos H0 cuando (| Yi – Yj | ≥ HDS TUKEY
PRUEBA SCHEFFÉ (CR) ! Permite, además, realizar comparaciones complejas (una media con otras
dos consideradas en conjunto). Los coeficientes c (pesos) ! (2), (- 1) y (-1). Cuando se utiliza en lugar
de Tukey, para comparaciones dos a dos, es menos potente y más conservadora que Tukey, lo que
significa que, en igualdad de condiciones, el valor crítico de Scheffé es ligeramente superior al de
Tukey, por lo que resulta más difícil rechazar la hipótesis nula de la igualdad de medias.
_________________ ___________________
CR SCHEFFÉ = √ (k - 1) F (k - 1), gl ERROR √ MC ERROR [Σ (c2j / nj)]
k ! Número de grupos
ni = número de sujetos de cada grupo.
F (k - 1), gl ERROR ! F experimental del ANOVA.
MC ERROR ! Media cuadrática error.
c2j ! Coeficiente de las combinaciones lineales (en cada combinación la suma de coeficientes = 0)
_ _ _
φ1 = 2 ·Y1 – (Y2 + Y3) ! Entonces: c1 = 2, c2 = (-1), c3 = (-1) ! Dado que (∑cj = 0)
Para hallar los cj, se debe tener en cuenta que siempre deben sumar 0. Es más fácil calcular primero
los cj de los que se combinan conjuntamente, que siempre serán negativos, y luego el del que se
compara frente a todos, que será la suma de los otros, pero con signo positivo.
Decisión:
Si φ1 ≥ CR ! Existen diferencias significativas entre el nivel y los otros tomados conjuntamente.
Si φ1 < CR ! No existen diferencias significativas entre el nivel y los otros tomados conjuntamente
PROBLEMAS EJEMPLO !
Valor q para α = 0,05; 15 grados de libertad y tres grupos ! 3,67 MCINTRA ! 7,75
_______
HDS TUKEY = 3,67 √ 7,75 / 6 = 4,17 (modelo equilibrado)
Decisión ! Existen diferencias significativas entre entrenar por la tarde y por la noche, siendo el mejor
rendimiento por la noche (media más alta)
Prueba Scheffé (CR) ! Comparación entre la media del turno de noche con las de mañana y tarde
consideradas conjuntamente.
__________________ __________________
CR SCHEFFÉ = √ (k - 1) F (k - 1), gl ERROR √ MC ERRROR [Σ (c2j / nj)
Decisión ! Como 8,83 > 6,15 ! Rechazamos H0 (existen diferencias significativas entre el turno de
noche y los de mañana y tarde considerados conjuntamente.
HIPÓTESIS ! H0: ŋ1 = ŋ2 =… = ŋK
H1: ŋ1 ≠ ŋ2 ≠… ≠ ŋK Al menos para una ŋ
Cálculo: Se ordenan todas las puntuaciones en una sola serie, (es decir, tomándolas todas en cuenta),
asignamos rangos de 1 a n, dando a la puntuación menor el rango 1. En caso de empate ! (rango
medio); es decir, asignándoles la media aritmética de los rangos que les hubieran correspondido de ser
distintas.
Decisión: Cuando se rechaza la H0, se procede a realizar comparaciones múltiples (tratamientos entre
los que se producen las diferencias)
_________________
Diferencia mínima crítica ! MVKV = Z adj √ N(N+1) /12 · (∑1/ai)
PROBLEMA EJEMPLO
En un estudio sobre antojo por el chocolate varios autores querían determinar si la distribución
poblacional del consumo de chocolate en una semana era igual en una muestra de niños (N), que en una
muestra de mujeres adultas (MA) y que en una de hombres adultos (HA). Para ello se seleccionaron
aleatoriamente 5 sujetos de cada grupo y se midió su consumo de chocolate contabilizando (según se
recoge en la tabla) el número de alimentos con chocolate consumidos en una semana (C):
= 30,5 / 5 = 6´1
Rango Medio Rango Medio =
31 / 5 = 6´2 Rango Medio =
58,5 / 5 = 11´7
2 2 2
Σ RANGOS = 930,25 Σ RANGOS = 961 Σ RANGOS = 3422,25
2 2 2
Σ R / 5 = 186,05 Σ R / 5 = 192,20 Σ R / 5 = 684,45
Hipótesis !
H0: No existen diferencias poblacionales en el consumo semanal de chocolate entre N, MA y HA.
H1: Existen diferencias poblacionales en el consumo semanal de chocolate entre, al menos dos grupos.
El estadístico de contraste sigue la distribución X2 con (3-1) gl y α = 0,10 ! X22; 090 = 4´61
Decisión ! Como 5,135 > 4,61 Se Rechaza la Hipótesis Nula (Comparaciones múltiples ! Las tres
muestras son equilibradas)
_________________ _______________
MVKV = Z adj √ N(N+1) /12 · (∑1/ni) ! MVKV = 2´13 √ 15(16) /12 · (1/5) ! MVKV = 4´26
3. La eficiencia relativa:
a) Es un valor entre O y 1.
b) Es un cociente entre dos varianzas
c) Ambas respuestas son correctas.
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
18. Si la eficiencia relativa de un estimador, Ô1 respecto a otro estimador, Ô2 es del 85%, para un
mismo tamaño muestral:
a) El cociente entre sus respectivas varianzas poblacionales es 0,85
b) El cociente entre sus medias es 0,85
c) El cociente entre las varianzas de las distribuciones muestrales de los respectivos
estimadores es 0,85
19. En la estimación puntual:
a) Se establece un rango de valores dentro del cual estaría el valor del parámetro
b) Se toma un valor muestral concreto como estimación del parámetro
c) Se establece un intervalo confidencial.
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
24. El estadístico de contraste Z para una media vale -2,15, siendo alfa igual a 0,05, n= 145 y el
contraste bilateral.
a) Los valores críticos son -1,64 y 1,64
b) Se rechaza Ho
c) Se acepta Ho
27. Cuando ponemos a prueba una hipótesis, el método que se utiliza para tomar una decisión
entre la hipótesis nula (Ho) y la hipótesis alternativa (H1) es:
a) La prueba de significación.
b) El intervalo de confianza para una media
c) El contraste de hipótesis.
28. El nivel crítico p:
a) Es siempre un valor muy pequeño
b) Para su cálculo se tiene en cuenta la dirección del contraste (unilateral/bilateral)
c) Se fija en la planificación del estudio.
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
36. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la muestra:
a) Mayor es la precisión del intervalo
b) Menor es la precisión de nuestra estimación
c) Mayor es la amplitud del intervalo.
37. Cuando construimos un intervalo de confianza para la media, manteniendo constantes los
demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n.c.) del 95% en lugar del
99%.
a) Ganamos en precisión porque el intervalo es más preciso
b) Aumenta la probabilidad de cometer error tipo I.
c) Perdemos en precisión porque el intervalo es más grande.
40. La hipótesis nula: “la varianza del grupo 1 es mayor o igual que la varianza del grupo 2”,
se refiere a un contraste:
a) Bilateral.
b) Unilateral derecho
c) Unilateral izquierdo.
41. Con n = 50, la probabilidad del error tipo II es igual a 0,30. Con un n = 40 y manteniendo
constantes los demás factores:
a) 1-beta será 0,70
b) Beta será superior a 0,30
c) Beta será inferior a 0,30
45. Cuanto mayor es la probabilidad del error tipo II, manteniendo constantes los demás factores:
a) Menor es el nivel de significación
b) Mayor es la potencia estadística
c) Mayor es la probabilidad de error tipo I
53. Cuando construimos un intervalo de confianza para la media, manteniendo constantes los
demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n. c.) del 99% en lugar del
95%?:
a) Con un n.c. del 99% la probabilidad de α será menor y menor la probabilidad de
cometer error tipo I.
b) Con un n.c. del 99% aumentaría la probabilidad asociada a dicho intervalo
c) Con un n.c. del 99% perderíamos en precisión
54. Si obtenemos un nivel crítico p mayor que el alfa adoptado quiere decir que:
a) Los resultados son improbables bajo el supuesto de que H0 sea cierta
b) Los resultados son estadísticamente significativos
c) Los resultados no son estadísticamente significativos.
55. Sobre alfa y el nivel crítico p:
a) Ambos tienen valores constantes
b) Si sus valores son iguales se rechaza la hipótesis nula
c) Ambos se fijan antes de obtener los datos de la muestra.
56. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la muestra:
a) Mayor es la precisión del intervalo
b) Menor es la precisión de nuestra estimación
c) Ambas respuestas son incorrectas.
57. La distribución muestral de la media es normal:
a) Cuando es normal la distribución de la variable estudiada o cuando tiende a la
normalidad a medida que aumenta el tamaño de la muestra
b) Sólo cuando es normal la distribución de la variable estudiada.
c) Sólo cuando el tamaño de la muestra es el adecuado.
6
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
60. Hemos extraído una muestra aleatoria de 49 sujetos y le hemos medido el pulso en reposo,
obteniendo una media igual a 60 pulsaciones por minuto. Sabemos que las pulsaciones forman
una escala de intervalo y se distribuyen normalmente con varianza poblacional igual a 16.
Tomamos un n.c. del 99%. ¿cuál será el error máximo (Emáx) aproximado en el cálculo del
intervalo de confianza para µ?
a) 1,33
b) 1,47
c) 1,12
65. Cuando calculamos el intervalo de confianza para la proporción, en el caso de una muestra,
nuestro objetivo es determinar:
a) Los valores que limitan el valor del parámetro proporción que cumplen la característica
en estudio, a un nivel de confianza determinado.
b) Si la variable, antes de ser dicotomizada, se distribuía según la distribución normal.
7
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
67. Hemos aplicado un cuestionario de ansiedad a una muestra de 16 deportistas antes de una
competición y obtuvimos una puntuación media en ansiedad iguala 5. Las puntuaciones en el
cuestionario de ansiedad forman una escala de intervalo y se distribuyen normalmente con
varianza igual a 4. ¿Entre qué valores esperamos se encuentre la media poblacional de la
ansiedad precompetitiva, a un nivel de confianza del 95%?.:
a) 3,71 < μ < 6,29
b) 4,02 < μ < 5,98
c) 6,51 < μ < 7,63
68. Atendiendo a los datos del problema anterior, entre qué valores esperamos se encuentre la
media poblacional de la ansiedad precompetitiva, a un nivel de confianza del 99%:
a) 3,71 < μ < 6,29
b) 4,02 < μ < 5,98
c) 6,51 < μ < 7,63
69. Hemos estimado en una muestra de 16 españoles, la media del grado de acuerdo sobre la
legalización del aborto obteniendo Ȳ = 8. El grado de acuerdo sobre la legalización del aborto
es una variable medida a nivel de intervalo que se distribuye normalmente en la población
con σ2 = 36. Asumiendo un nivel de confianza del 95%, qué tamaño debe tener la muestra
para que la media no se aleje más de ± 1 punto de la media poblacional:
a) 139
b) 147
c) 154
70. Con los datos del problema anterior, sin tener en cuenta que conocemos la varianza
poblacional, sino que conocemos desviación típica y la media del grado de acuerdo sobre la
legalización del aborto, Ȳ = 8 y S = 5. Queremos saber, a un nivel de confianza del 99% qué
tamaño debe tener la muestra para que la media estimada no se aleje más de ± 3 puntos de la
media poblacional:
a) 23
b) 26
c) 20
8
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1
71. En una investigación sobre ansiedad, contrastamos la hipótesis nula de que la media
poblacional e igual o mayor que 10. i sabemos que el valor muestral del estad stico de
contraste z = 2,88 y el nivel crítico, p= 0,002, ¿qué significa esta p?:
a) Que la probabilidad de obtener un estadístico de contraste igual o menor que el hallado
es 0,002.
b) Que la probabilidad de aceptar H0 siendo falsa es 0,002
c) Es el error tipo II.
72. Teniendo en cuenta los datos del problema anterior y adoptando un α= 0,01:
a) Se rechaza H0, puesto que p < α
b) Se acepta H0 , puesto que p < α
c) Ninguna de las dos opciones es válida.
9
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
1. La potencia:
a) Es igual a β
b) Es deseable que no sea inferior a 0,80
c) Es deseable que sea muy baja
2. Con n = 40, la potencia es igual a 0,70. Con un n = 60 y manteniendo constantes los demás
factores:
a) La probabilidad del error tipo II será 0,30
b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor que 0,70
c) La potencia será inferior a 0,70
3. El estadístico de contraste Z para una media vale 3, siendo alfa igual a 0,05, n = 120, y el
contraste bilateral:
a) Los valores críticos son -2,33 y 2,33
b) Se acepta H0
c) Se rechaza H0
4. En los contrastes de hipótesis referidos a una muestra, cuando el interés del investigador se
centra en el parámetro media, lo que se prueba es:
a) Si nuestros datos concretos han sido obtenidos de una población con esa media
b) Si la media obtenida para la muestra presenta un valor determinado
c) Si la media obtenida para la muestra es un estimador correcto dado el tamaño de la
muestra utilizada.
5. Con n = 30, la potencia es igual a 0,60. Con un n = 40 y manteniendo constantes los demás
factores:
a) La probabilidad del error tipo II será mayor que 0,60
b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor que 0,60
c) La potencia será inferior a 0,60
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
10. Un contraste de una media permite comprobar si los datos de la muestra proceden de una
población con media igual a la estipulada en la hipótesis nula:
a) Sí
b) No
c) Sólo si n es pequeño
12. Las condiciones para poder aplicar el estadístico de contraste Z en el caso de la proporción
(una sola muestra) incluyen:
a) Muestra aleatoria de n observaciones y población dicotómica.
b) Variable dependiente medida a nivel ordinal, al menos y se trata de muestras
independientes
c) Variable dependiente dicotómica (o dicotomizada) y se trata de muestras
independientes.
13. Tenemos una población normal con varianza conocida. Se toma de ella una muestra de
tamaño n = 15. Para estimar el valor del parámetro media poblacional µ, utilizaremos un
estadístico de contraste cuya distribución es:
a) Normal (N(0,1))
b) T de Student
c) F de Snedecor
14. La distribución muestral de un estadístico de contraste es la distribución T de Student con n –
1 g. L. Y el contraste es unilateral derecho. Para un valor muestral igual a 1,33 y 17 grados de
libertad, el nivel crítico p es:
a) 0,10
b) 0,90
c) Ambas respuestas son incorrectas.
19. Las condiciones para poder aplicar el estadístico de contraste S (signos) en el caso de una sola
muestra:
a) Muestra aleatoria de n observaciones y distribución normal.
b) Muestra aleatoria de n observaciones y distribución binomial.
c) Muestra aleatoria de n observaciones y cualquier tipo de distribución.
22. Para probar hipótesis relativas a la mediana, cuando se cumple la aleatoriedad de las
observaciones, la distribución de la variable es simétrica en la población y el nivel de medida
de intervalos, aplicaremos la prueba de:
a) Wilcoxon antes que la de signos porque aporta más información.
b) Signos antes que la de Wilcoxon ya que aporta la misma información y la segunda es
más restrictiva.
c) Wilcoxon o la de signos indistintamente ya que arroja resultados iguales.
23. Para contrastar hipótesis sobre la mediana, si queremos utilizar la prueba de Wilcoxon, es
necesario que el nivel de medida de los datos sea, al menos:
a) Nominal
b) Ordinal
c) De intervalo
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
24. La depresión es una variable medida a nivel de intervalo que se distribuye normalmente en la
población con varianza conocida. Para una muestra n = 16, ¿qué valor toma la probabilidad del
error tipo II si al contrastar H0: μ = 5 frente a H1: μ = 7, vale 0,70 la probabilidad de
rechazar la hipótesis nula siendo falsa?:
a) 0,30
b) 0,40
c) 0,70
25. Sabemos por trabajos anteriores que un antidepresivo tiene una tolerancia media, sobre los
pacientes que lo toman, de 1,5 según algún índice de tolerancia (cuanto mayor es el índice
mayor es la tolerancia) y una varianza igual a 1. Pensamos que modificando la fórmula
química del antidepresivo podríamos incrementar la tolerancia a este medicamento sin que se
modifique su propiedad antidepresiva. El grado de tolerancia al antidepresivo es una variable
medida a nivel de razón que se distribuye normalmente en la población. Para un n = 25, ¿cuál
es la probabilidad de obtener un resultado significativo, si hipotetizamos una diferencia de +
0,5 entre la media bajo la hipótesis alternativa y aquélla bajo la hipótesis nula (μ1 – μ0 =
0,5) teniendo en cuenta un α = 0,01?:
a) 0,63
b) 0,48
c) 0,56
26. En algunas investigaciones sobre conformismo social, los madrileños fueron calificados de
conformistas. Un investigador basándose en sus propios estudios, opina que los madrileños no
son conformistas, hipotetizando un puntuación inferior a 5 en una escala de conformismo
social que va de 0 a 10, lo cual indicaría inconformismo. Sabiendo que las puntuaciones en
conformismo social forman una escala de intervalo y se distribuyen normalmente en la
población con varianza igual a 1, ¿cuál será la potencia del contraste para H1 : μ = 4,
manteniendo constantes los demás factores?: α = 0,05 y n = 25
a) 0,8763
b) 0,9213
c) 0,9996
27. En una distribución muestral normal (del estadístico media), con una media de 30 y una
desviación típica de 16, ¿qué probabilidad hay de obtener al azar una media comprendida
entre 14 y 26?:
a) 0,7836
b) 0,6826
c) 0,5763
28. En una muestra aleatoria de 101 sujetos, procedentes de una población normal e infinita, se ha
obtenido una media igual a 40 y una desviación típica igual a 15. ¿Qué porcentaje de medias
hay comprendido entre los valores t picos = 2,4 y = 1,5 de la distribución muestral de
la media?:
a) 92,5%
b) 95,3%
c) 91,4%
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
29. Se ha realizado la distribución muestral de la media con 225 muestras, de 90 sujetos cada una,
y se ha comprobado que es normal. En la población, el valor de la media es de 45 (μ = 45) y el
de la desviación típica de 15 (σ = 15). Cuál será el valor típico (puntuación típica) que, llevado a
ambos lados de la media, comprende el 90% de los casos de esa distribución muestral?:
a) ± 1,54
b) ± 1,65
c) ± 1,78
30. Teniendo en cuenta los datos del problema anterior, qué media de esa distribución muestral
dejará por debajo de sí el 90% de los casos:
a) 47,02
b) 53,01
c) 42,37
31. A una muestra aleatoria de 17 estudiantes de secundaria se les aplicó una prueba cuya
finalidad era medir sus conocimientos sobre conceptos científicos básicos. En la variable
analizada, los estudiantes se distribuyen normalmente con una media igual a 78. Los
resultados del estudio en la muestra fueron: media igual a 84,984 y desviación típica igual
a 16. El intervalo de confianza de la distribución muestral será: α = 0,05
a) ± 2,12
b) ± 1,98
c) ± 2,72
32. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste será:
a) Z = 1,893
b) t = 1,746
c) χ2 = 1,572
33. con los datos de los dos problemas anteriores, el criterio de decisión será:
a) A ese nivel de confianza no podemos aceptar la hipótesis nula.
b) Como el valor del estadístico de contraste no se encuentra en el intervalo confidencial,
rechazamos H0.
c) Para un n. c. del 0,95 no podemos aceptar la H1.
34. Una muestra aleatoria de 30 personas presenta una desviación típica, en la variable “tiempo de
ejecución” de una tarea de reconocimiento de palabras, igual a 120 segundos. Queremos saber
si es compatible este resultado, a un nivel de confianza de 99% con el supuesto de que la
desviación típica en la población (para esta variable), con una distribución normal, es de 150
segundos. Teniendo esto en cuenta, el planteamiento de las hipótesis sería:
a) H0 : μ = 150 y H1 : μ ≠ 150
b) H0 : σ2 = 1502 y H1 : σ2≠ 1502
c) H0 : μ < 1502 y H1 : μ > 1502
35. Con los datos del problema anterior, el estadístico de contraste será:
a) χ2 = 19,2
b) Z = 17,3
c) t = 18,4
36. Teniendo en cuenta los datos de los dos problemas anteriores, el intervalo confidencial será:
a) 13,6 < χ2 < 16,3
b) 43,1 < χ2 < 54,2
c) 13,1 < χ2 < 52,3
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
38. Con muestras aleatorias de 121 sujetos, la distribución muestral de la media (de una variable
que se distribuye normalmente en la población) tiene una media de 25 y como desviación
típica de 10. La formulación de las hipótesis será: n.c. : 95%
a) H0 : μ = 25 y H1 : μ ≠ 25
b) H0 : σ2 = 25 y H1 : σ2≠ 25
c) H0 : μ < 25 y H1 : μ > 25
39. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste para
comprobar que una muestra del mismo tamaño con media = 28 y desviación típica = 30
pertenece a la misma población será:
a) Z = 0,3
b) t = 3,7
c) χ2 = 4,2
41. En una muestra aleatoria de 200 sujetos, procedentes de una población normal e infinita, se ha
obtenido una media igual a 60 y una desviación típica igual a 20. Cuál será el error típico de la
media:
a) 1,87
b) 1,63
c) 1,42
42. Un educador piensa que sólo un 15% de los alumnos de cuarto de primaria, del colegio en el
que trabaja, son capaces de manejar con rapidez el diccionario. Para comprobar lo que piensa,
selecciona al azar una muestra de 150 alumnos de ese curso y les realiza una prueba de manejo
del diccionario. Teniendo en cuenta estos datos, la formulación de las hipótesis estadísticas
será: α = 0,05
a) H0: π = 0,15 y H1: π ≠ 0,15
b) H0 : μ = 15 y H1 : μ ≠ 15
c) H0 : μ < 15 y H1 : μ > 15
43. Teniendo en cuenta los datos del problema anterior, el contraste será:
a) Unilateral izquierdo
b) Unilateral derecho
c) Bilateral
6
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2
44. El estadístico de contraste para los datos de los dos problemas anteriores será:
a) t = 3,825
b) Z = 1,715
c) χ2 = 4,247
45. Atendiendo a los datos de los problemas anteriores, la interpretación de los resultados será:
a) Con un nivel de confianza del 95% no podemos afirmar que sólo ese porcentaje de
alumnos sea capaz de manejar el diccionario.
b) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador está
justificada, es decir, que sólo un 15% de los alumnos maneja con rapidez el diccionario.
c) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador está
justificada, es decir, que más del 15% de los alumnos maneja con rapidez el diccionario.
46. El equipo docente de la asignatura Diseños de Investigación y Análisis de Datos considera que
el 50% de los alumnos que se presentan a examen, obtienen una nota de 7 o más. Tras realizar
el examen de febrero, comprueban que en una muestra aleatoria de 200 exámenes, 70
obtienen la calificación de Notable, 20 son calificados con Sobresaliente, 80 obtienen la
calificación de Aprobado y 30 la de Suspenso.
Sabiendo que: Suspenso < 5; 7 > Aprobado ≥ 5; 9 > Notable ≥ 7; Sobresaliente ≥ 9
¿Qué planteamiento dará el equipo docente a las hipótesis estadísticas?: (n. c., 95%)
a) H0 : η = 7 y H1 : η ≠ 7
b) H0 : μ = 7 y H1 : μ ≠ 7
c) H0 : μ < 7 y H1 : μ > 7
47. Según los datos del problema anterior, el estadístico de contraste será:
a) t = 5,825
b) χ2 = 4,227
c) = 1,41
48. Atendiendo a los resultados obtenidos, la conclusión a la que se puede llegar es la siguiente:
a) Es posible seguir manteniendo que la mediana de la población de referencia está en la
puntuación 7, es decir, que el 50% de los alumnos que se presentan a examen obtienen
una nota de 7 o más, con un nivel de confianza del 95%.
b) Es posible seguir manteniendo que la media de la población de referencia está en la
puntuación 7 a un nivel de confianza del 95%.
c) No es posible seguir manteniendo el planteamiento de la investigación, es decir,
debemos afirmar que el 50% de los alumnos que se presentan a examen no obtienen
una nota de 7 o más a un nivel de confianza del 95%.
7
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
1. Los diseños de investigación intersujetos determinan analizar los datos con estadísticos de
contraste para:
a) Muestras relacionadas
b) Muestras independientes
c) Bondad de ajuste.
6. Para aplicar un contraste de medias en dos muestras independientes, se debe cumplir que:
a) La variable dependiente debe estar medida, al menos a nivel de razón
b) La variable dependiente debe estar medida, al menos, a nivel de intervalo
c) La variable dependiente debe estar medida, al menos, a nivel ordinal.
7. Queremos contrastar que H0: π21 = π12. Hemos estimado que la diferencia entre las dos
proporciones poblacionales estará entre los valores 0,047 y 0,470 con una probabilidad igual
a 0,99. Se podría interpretar que:
a) Ambas proporciones son distintas
b) Ambas proporciones son iguales
c) No se puede contestar porque faltan datos en el enunciado.
8. En el contraste estadístico de dos medias independientes:
a) Lo más habitual es desconocer el valor de las varianzas poblacionales
b) Lo más habitual es utilizar el estadístico de contraste Z
c) Debe utilizarse el estadístico de contraste X2
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
12. El estadístico de contraste en el caso de los datos del problema anterior sería:
a) F = 3,6
b) Z = 6,9
c) T = 5,4
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
15. Atendiendo a los datos del problema anterior, la zona de rechazo de la hipótesis nula está
formada por:
a) Todos los valores iguales y menores que t7, 0,025 = 2,36
b) Todos los valores iguales y menores que t7, 0,025 = 2,36 e iguales y mayores
que t7, 0,975 = 2,36
c) Todos los valores iguales y mayores que t7, 0,975 = 2,36
16. Continuando con el problema anterior, el valor del estadístico de contraste será:
a) t = 3,52
b) Z = 4,20
c) Z = 3,80
17. Según los datos de los problemas anteriores (14, 15 y 16), podemos afirmar:
a) Que los resultados llevan al rechazo de H0, a un nivel de significación igual a 0,05, de
que las muestras proceden de dos poblaciones con medias iguales.
b) Que el resultado del contraste no apoya la hipótesis del investigador de que la amplitud
de apertura de piernas es distinta cuando en el programa de estiramiento se
introducen ejercicios de relajación que cuando no se introducen.
c) Que el grupo experimental obtuvo una amplitud media de apertura de piernas menor
que el grupo control, lo que indica, a nivel descriptivo, que la relajación no aumenta la
amplitud de apertura de piernas.
18. Queremos comparar el método tradicional (T) de la UNED con un método nuevo, en concreto,
un método multimedia (M), para la enseñanza a distancia de la estadística. Nuestra hipótesis es
que los alumnos que estudien con el método tradicional obtendrán unas notas inferiores a las
de los alumnos que estudien con el método multimedia. Extraemos aleatoria e
independientemente 7 alumnos del segundo curso de psicología de la UNED y les asignamos
también aleatoriamente a los dos métodos de enseñanza. Los datos que aparecen a
continuación representan las notas obtenidas en un examen de estadística en ambas muestras
de alumnos:
Método Tradicional (MT): 4 5 6 2
Método Multimedia (MM): 9 8 10
La nota en estadística es una variable medida a nivel de intervalo que se distribuye
normalmente en ambas poblaciones con varianzas: σ2T = 4 y σ2M = 2. N. c. 95%. Teniendo
en cuenta estos datos, ¿cuál será la formulación de las hipótesis estadísticas?:
a) H0: μT μM = 0 y H1: μT μM ≠ 0
b) H0: μT ≥ μM y H1: μT < μM
c) H0: μT = μM y H1: μT ≠ μM
19. Atendiendo a los datos del problema anterior, el valor del estadístico de contraste será:
a) Z = 2,28
b) t = 3,80
c) Z = 3,68
20. Continuando con los datos de los problemas anteriores, podemos afirmar que:
a) La probabilidad de obtener un valor del estadístico tal como el hallado, o uno menor, no
es nula, por lo tanto rechazamos H0.
b) A nivel poblacional, los alumnos que estudiaron con el método tradicional tienen una
nota media en estadística inferior a los que estudiaron con el método multimedia,
asumiendo un nivel de significación igual a 0,05.
c) Este resultado sugiere que el método multimedia es peor método de enseñanza que el
método tradicional.
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
21. Algunas variables ejercen su influencia sobre las conductas haciendo éstas más o menos
variables. Un investigador quiere investigar esta cuestión en la conducta afectiva de los niños.
Su hipótesis es que la conducta afectiva de los niños es menos variable que la de las niñas.
Extrae una muestra aleatoria de 41 niñas y otra de 31 niños y les mide la afectividad mediante
un cuestionario obteniendo una varianza insesgada igual a 9 en la muestra de niños y una de
36 en la muestra de niñas. La variable puntuación en el cuestionario de afectividad está medida
a nivel de intervalo. ¿cuál será el planteamiento de la hipótesis estadísticas? (N. c. 99%)
a) H0: μA ≥ μO y H1: μA < μO
b) H0: σ2A = σ2O y H1: σ2A ≠ σ2O
c) H0: σ2A ≤ σ2O ó H0: σ2A / σ2O ≤ 1 y H1: σ2A > σ2O ó H1: σ2A / σ2O > 1
22. El estadístico de contraste, atendiendo a los datos del problema anterior será:
a) Z = 5,28
b) t = 2,80
c) f = 4
23. La zona de rechazo de la hipótesis nula estará formada por todos los valores:
a) Todos los valores iguales y mayores que f0,99; 40, 30 = 2,30
b) Todos los valores iguales y menores que f0,99; 40, 30 = 2,30
c) Todos los valores iguales y mayores que f0,99; 41, 31 = 3,50
25. Se quiere comprobar el efecto de un método novedoso de aprendizaje en dos grupos de niños,
uno de 4 alumnos y otro de 3. Sabemos que el análisis estadístico ha aportado diferencias
significativas del efecto del nuevo método con respecto al tradicional. Sabemos que el grupo
de n=4 al que se le aplicó el método nuevo, obtuvo una media igual a 6 y una desviación típica
insesgada de 4, y que el grupo de n=3 al que se le aplicó el método tradicional obtuvo una
media de 5 y una desviación típica insesgada de 2. ¿Cuál será la magnitud del efecto del método
novedoso sobre el tradicional?
a) 0,78
b) 0,30
c) 0,29
26. Tras realizar análisis estadístico sobre dos muestras de 7 y 8 sujetos, los resultados apoyan la
hipótesis del investigador de que la relajación influye positivamente sobre la elasticidad en los
deportistas. Los resultados obtenidos son los siguientes:
Grupo 1: n=7 ȲR = 125,8 σ2R = 68,7 (Grupo con relajación)
Grupo 2: n=8 ȲNR=119,5 σ2NR =61,67 (Grupo sin relajación)
¿Cuál será la magnitud de la mejoría de la elasticidad tras aplicar la relación?:
a) 0,78
b) 0,27
c) 0,35
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
27. Un psicofísico hipotetiza que los hombres y las mujeres no son igualmente variables en
sensibilidad olfativa. Extrae una muestra aleatoria de 13 hombres (H) y otra de 25 mujeres (M)
y les mide la sensibilidad olfativa, obteniendo una varianza insesgada igual a 10 en la muestra
de hombres y de 17 en la de mujeres. La sensibilidad olfativa es una variable medida a nivel de
intervalo que se distribuye normalmente en ambas poblaciones. N. c. 90%. ¿Cuál será la
formulación de la hipótesis estadística?:
a) H0: μM ≥ μH y H1: μM < μH
b) H0: σ2M = σ2H ó H0: σ2M / σ2H = 1 y H1: σ2M ≠ σ2H ó H1: σ2M / σ2H ≠ 1
c) H0: σ2M ≤ σ2H ó H0: σ2M / σ2H ≤ 1 y H1: σ2M > σ2H ó H1: σ2M / σ2H > 1
28. La zona de aceptación de la hipótesis nula, teniendo en cuenta los datos del problema anterior,
está formada por todos los valores :
a) f0,05; 24, 12 = 0,46 < H0 < f0,95; 24, 12 = 2,51
b) f0,95; 24, 12 = 0,46 < H0 < f0,05; 24, 12 = 2,51
c) f0,05; 25, 13 = 0,46 < H0 < f0,95; 25, 13 = 2,51
29. El estadístico de contraste, atendiendo a los datos de los dos problemas anteriores será:
a) f = 2,58
b) t = 1,28
c) f = 1,70
30. atendiendo a los datos de los problemas anteriores, (27, 28, 29), ¿se rechaza la hipótesis nula?:
a) Sí, ya que el valor de nuestro estadístico de contraste no está dentro de la zona de
aceptación de H0.
b) No, ya que el valor del estadístico de contraste cae dentro de la zona de aceptación de la
hipótesis nula
c) No, ya que el valor del estadístico de contraste cae en la zona de aceptación de la
hipótesis alternativa.
31. Siguiendo con los problemas anteriores, ¿apoyan los resultados la hipótesis del investigador?:
a) No, ya que se acepta la hipótesis nula.
b) No, ya que no se acepta la hipótesis nula.
c) Sí, ya que se rechaza la hipótesis nula.
33. El estadístico de contraste, teniendo en cuenta los datos del problema anterior, será:
a) t = 2,48
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3
b) f = 1,98
c) z = 1,47
35. Teniendo en cuenta los datos del problema anterior, se rechazará la hipótesis nula?:
a) No, porque p = 0,1416 > α = 0,01
b) Sí , porque p = 0,0002 < α = 0,01
d) No, porque p = 0,3214 < α = 0,01
36. Según los resultados de los problemas anteriores, a qué conclusiones llegaremos:
a) Con un α = 0,01, la proporción de nadadores que dicen sentirse muy cansados tras el
periodo de entrenamiento intenso no es la misma en la población experimental que en
la de control.
b) La relajación no ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.
c) La relajación ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.
37. Un investigador quiere estudiar el efecto de la privación de agua sobre el tiempo que tardan las
ratas en recorrer un laberinto. Extrae aleatoria e independientemente 60 ratas y les asigna
también aleatoriamente a las dos condiciones del experimento: 12 y 24 horas de privación de
agua. Las 30 ratas sometidas a 12 horas de privación de agua (muestra A) tardaron un tiempo
medio de 5,9 minutos en recorrer un laberinto y las 30 ratas sometidas a 24 horas de privación
(muestra B) tardaron 6,40 minutos en recorrer el mismo laberinto, siendo las desviaciones
típicas isesgadas 0,29 y 0,30 respectivamente. Sabiendo que el n. c. fijado por el investigador es
del 95%, cuál será el planteamiento de las hipótesis estadísticas:
a) H0: μA = μB ó μA μB = 0 y H1: μA ≠ μB ó μA μB ≠ 0
b) H0: μA < μB ó μA μB < 0 y H1: μA > μB ó μA μB >0
c) H0: μA ≥ μB ó μA μB ≥ 0 y H1: μA < μB ó μA μB <0
38. El estadístico de contraste atendiendo a los datos del problema anterior, será:
a) t = 5,32
b) t = 4,28
c) t = 6,58
2. Cuando hallamos los valores críticos del estadísticos T, para dos muestras relacionadas, con
más de 30 grados de libertad, acudimos a la tabla de distribución:
a) T de Student
b) X2 de Pearson
c) Normal.
4. Cuando hallamos los valores críticos del estadístico T, para dos muestras relacionadas, con
más de 30 grados de libertad, acudimos a la tabla de distribución:
a) Normal
b) T de Student
c) X2
6. Cuando se mida una variable en los dos miembros de n pares de sujetos siendo los miembros
de cada par muy similares en variables relevantes del estudio, asumiremos que las
observaciones de ambas muestras:
a) Están relacionadas pero ello no implica que las diferencias entre cada par de
observaciones lo estén.
b) Son independientes.
c) Están relacionadas, lo cual implica que las diferencias entre cada par de observaciones
también lo están.
7. Se desea estudiar si una terapia de relajación reduce el nivel de ansiedad. Se obtiene una
muestra aleatoria de 8 sujetos y se les toman medidas en ansiedad antes y después de
aplicarles la terapia. Sabemos que la variable está medida a nivel de intervalo y que la
distribución poblacional de las diferencias entre cada par de puntuaciones es simétrica en
torno a la medida de tendencia central. ¿Qué estadístico de contraste aplicaría?:
a) W de Wilcoxon
b) S de signos
c) T para dos muestras relacionadas.
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4
8. La prueba de Wilcoxon:
a) Tiene las mismas restricciones que la prueba de signos.
b) Presenta restricciones en cuanto a la distribución de la variable en la población y en el
nivel de medida de los datos.
c) No tiene restricciones.
10. Un investigador desea estudiar si un vídeo preelectoral aumenta el número de votos a favor de
cierto partido político en la población española. Extrae una muestra aleatoria de 250 españoles
que vieron el vídeo en televisión. Las respuestas (a favor o en contra) de los 250 españoles
antes y después de ver el vídeo aparecen a continuación: (N. c. 95%)
Antes ¿Cuál será el planteamiento de las
hipótesis estadísticas?:
A favor En Contra a) H0: πc ≤ πb y H1: πc > πb
b) H0: πc ≥ πb y H1: πc < πb
Después A favor 100 60
c) H0: πc = πb y H1: πc ≠ πb
En Contra 35 55
12. Atendiendo a los datos de los problemas anteriores, el valor del estadístico de contraste
empleado será:
a) t = 3,28
b) z = 2,56
c) z = 3,28
13. Atendiendo a los datos de los problemas anteriores, se aceptará la hipótesis alternativa?:
a) No, porque el valor del estadístico de contraste cae fuera de la zona de aceptación de la
hipótesis nula.
b) Sí, porque el valor del estadístico de contraste cae fuera de la zona de aceptación de la
hipótesis nula.
c) No, porque p > 0,005
14. La probabilidad asociada a nuestro estadístico de contraste será:
a) 0,0052
b) 0,052
c) 0,002
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4
15. Un investigador desea estudiar si una campaña informativa sobre los beneficios de la práctica
deportivo aumenta dicha práctica. Extrae una muestra aleatoria de 100 españoles. Las
respuestas de los 8 españoles antes y después de la campaña informativa a la pregunta “ ¿
practica algún tipo de deporte?”, aparecen a continuación:
Antes Si tenemos en cuenta un n. c. del 95%, ¿cuál será el planteamiento
de las hipótesis?:
Sí No a) H0: πc = πb y H1: πc ≠ πb
b) H0: πc ≥ πb y H1: πc < πb
Después Sí 44 37
c) H0: πc ≤ πb y H1: πc > πb
No 9 10
18. Atendiendo a los datos del problema anterior, ¿Se aceptará la hipótesis nula?:
a) No, ya que el valor del estadístico de contraste es mayor que p
b) No, ya que p < α
c) Sí, ya que p < α
20. Un investigador quiere estudiar la influencia de una terapia cognitiva sobre la agresividad.
Extrae una muestra aleatoria de 36 sujetos violentos y les mide la agresividad mediante un
cuestionario (medida pretest). Posteriormente, les trata durante 3 meses con la terapia
cognitiva, y vuelve a pasarles el cuestionario de agresividad (medida postest). En el pretest,
obtuvo una media igual a 38 y una varianza igual a 35. En el postest obtuvo una media de 30 y
una varianza igual a 35. La varianza muestral de las diferencias entre las medidas pre y postest
es igual a 18,56. La puntuación en el cuestionario de agresividad es una variable medida a nivel
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4
21 15
28 13
40 25
13 11
20 20
26 22
10 19
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4
28. Las conclusiones a las que llegaremos a través de los resultados obtenidos serán:
a) A un nivel de confianza del 95%, los datos no permiten rechazar la hipótesis nula de
que las medianas poblacionales son iguales.
b) En promedio, el umbral sensorial medido en la primera sesión es distinto de aquél
medido en la segunda sesión.
c) Los resultados apoyan la hipótesis del investigador.
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5
2. En el análisis de varianza:
a) A las variables independientes se las denomina factores y a las categorías en que se
dividen, niveles.
b) A las variables dependientes se las denomina niveles y a sus efectos, factores.
c) A las variables extrañas se las denomina factores y a sus categorías o dosis de
tratamiento, niveles.
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5
12. El que un modelo sea o no equilibrado cuando aplicamos el análisis de varianza, depende
de:
a) Que el muestreo sea aleatorio.
b) El número de elementos de las muestras
c) El número de variables independientes.
16. En el razonamiento del análisis de varianza se supone que dentro de un mismo nivel, las
puntaciones deberían ser:
a) Semejantes
b) Correlacionadas
c) Diferentes.
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5
18. Cuál será el resultado de nuestro estadístico atendiendo a los datos del problema 24?.
a) T= 11,36
b) F = 3,37
c) F= 11,36
19. Cuál será nuestro valor crítico, atendiendo a los datos del problema 24?
a) 3,007
b) 4,414
c) 5,978
20. A un n.c. del 95% aceptaríamos la Hipótesis alternativa?: (datos del problema 24)
a) Sí porque el valor del estadístico es mayor que nuestro valor crítico.
b) No porque el valor del estadístico es menor que nuestro valor crítico.
c) Sí porque el valor del estadístico es mayor que nuestro valor crítico.
21. Teniendo en cuenta los resultados obtenidos en los ejercicios anteriores (24 al 27), la
conclusión a la que hemos llegado es la siguiente:
a) Al no haber obtenido una diferencia significativa en nuestro estudio, se deduce que
el ambiente en el que se desarrolle un niño no influye en las puntuaciones
obtenidas en un test de inteligencia.
b) Al haber obtenido una diferencia significativa en nuestro estudio, se deduce que el
ambiente en el que se desarrolle un niño no influye en las puntuaciones obtenidas
en un test de inteligencia.
c) Al haber obtenido una diferencia significativa en nuestro estudio, se deduce que el
ambiente en el que se desarrolle un niño influye en las puntuaciones obtenidas en
un test de inteligencia.
22. Se quiere estudiar la incidencia del número de hijos en la intensidad del lazo afectivo de las
madres hacia sus hijos. Tras realizar el muestreo aleatorio apropiado, se obtuvieron tres
grupos de 5 unidades familiares compuestas de madre e hijos, donde el Grupo 1 estaba
compuesto por familias con un hijo, el Grupo 2 por familias con 2 hijos el Grupo 3 por
familias con 3 hijos. Se procuró que las relaciones existentes en las unidades familiares no
fueran patológicas. A continuación, se midió la intensidad del lazo afectivo delas madres
hacia sus hijos en una escala de intervalo, obteniendo las siguientes puntuaciones (a mayor
puntuación, mayor intensidad afectiva):
Grupo 1 Grupo 2 Grupo 3
10 4 9
9 5 10
7 6 8
8 7 7
10 4 6
Sabemos que todas las observaciones son independientes, varianzas homogéneas y las
distribuciones poblacionales normales. Tómese un α=0,05 .
Según los datos y conociendo SCtotal = 59,33 y SCinter = 35,73, el valor muestral del
estadístico de contraste es aproximadamente:
a) 13,21
b) 14,38
c) 9,07
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5
25. Sabiendo que, Ȳ1= 8,8, Ȳ2= 5,2 y Ȳ3= 8, indique la alternativa correcta a un n.c. del 95%
(según los datos del problema 29):
a) Podemos decir que existen diferencias significativas entre las medias de todas las
poblaciones
b) Podemos decir que existen diferencias significativas entre las medias de las
poblaciones 1 y 2.
c) Podemos decir que existen diferencias significativas entre las medias de las
poblaciones 1 y 2 y entre las medias de las poblaciones 2 y 3.
27. Las comparaciones múltiples a posteriori son aquellas que se realizan después de un
análisis de varianza:
a) Si F es significativa.
b) Si F no es significativa.
c) Si p > α
28. Las puntuaciones obtenidas en un test por dos grupos de 10 alumnos cada grupo. Calcule el
estadístico F del análisis de varianza entre los dos grupos, sabiendo que:
SCintra = 1379,6 y g.l. = 18 SCT = 2250,8
a) 11,36
b) 14,57
c) 12,87
30. Cuál será el valor crítico atendiendo a los datos del problema anterior?:
a) 4,25
b) 2,18
c) 3,35
31. La interpretación de los resultados es la siguiente:
a) A un nivel de confianza del 95% debemos considerar que los tratamientos
suministrados influyen de forma distinta.
b) A un nivel de confianza del 95% debemos considerar que los tratamientos
suministrados influyen de igual forma.
c) A un nivel de confianza del 95% aceptamos la hipótesis nula.
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5
32. Disponemos de tres grupos de sujetos, uno de niños, otro de niñas y un tercero de adultos.
Se les aplica un test que mide dependencia de campo y los resultados fueron:
Niños Niñas Adult.
6 9 8
5 8 10
6 8 8
4 5 3
3 10 7
5 7 6
4 6 7
4 8 9
5 8 8
Se desea saber si los tres grupos difieren en la variable estudiada y, en caso de que fuese así, si hay
diferencias debidas al género. Para ello, se aportan los siguientes datos:
SCinter = 46,625 y SCT = 104,5 n.c. del 95%.
Teniendo en cuenta estos datos, el valor del estadístico de contraste será:
a) 9,67
b) 8,795
c) 10,152
35. Ahora queremos calcular a qué es debida tal diferencia. Para el cálculo de las
comparaciones múltiples, aplicando la prueba de Scheffé, obtenemos un valor del C.R. de:
a) 0,452
b) 0,2585
c) 2,1748
36. Teniendo en cuenta este resultado, al comparar las medias, podemos concluir:
a) No existe diferencia significativa debida al género
b) Existe diferencia significativa debida al género.
c) No es posible realizar las comparaciones múltiples.
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 6
4. De una muestra de imágenes con el mismo número de puntos (es decir, del mismo tamaño), se
han escogido al azar ocho imágenes diferentes (tomadas en distintas escenas) y se las ha
procesado mediante cuatro algoritmos de emparejamiento (A, B, C, D), con el objeto de ver el
número de emparejamientos incorrectos (EI) que se producía con cada uno y así determinar la
eficacia relativa de los mismos. Teniendo en cuenta un n. c. del 99% y sabiendo que la suma de
cuadrados del tratamiento es 248,5, la suma de cuadrados error es 22 y la suma de cuadrados
total es 341,5, cuál será el valor del estadístico de contraste:
a) 82,833
b) 79,04
c) 64,78
5. El valor crítico obtenido, atendiendo a los datos del problema anterior, será:
a) 4,87
b) 5,54
c) 3,25
6. Con un nivel de confianza del 99% podemos afirmar (según los datos de los problemas 4 y 5):
a) Que todas las medias son iguales
b) Que no existen diferencias significativas entre al menos dos de los algoritmos en
número de emparejamientos incorrectos.
c) Que existen diferencias significativas entre al menos dos de los algoritmos en número
de emparejamientos incorrectos.
7. Se lleva a cabo una investigación para estudiar si las Técnicas de Inoculación de Estrés (TIE)
tienen efecto sobre la ansiedad precompetitiva de los corredores de velocidad. Para ello, se
seleccionaron aleatoriamente 12 atletas de entre todos aquéllos que puntuaron alto en una
batería de tests de ansiedad y se les enseñaron la TIE. Para estudiar el efecto de las TIE se
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 6
9. Atendiendo a los datos de los dos problemas anteriores, podemos concluir que:
a) Existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.
b) No existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.
c) Se acepta H0
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 7
TEMA 7 : Diseños con más de dos grupos independientes. Análisis de la varianza con dos
factores completamente aleatorizados
1. El laboratorio de aprendizaje animal dispone de doce ratas de una cierta raza, con las que
realiza un experimento. Posteriormente adquieren otro grupo de doce ratas (de otra raza) y,
tras la realización del mismo experimento, en las mismas condiciones, sospechan que los
resultados son diferentes según con qué grupo de ratas se realice la experiencia.
La prueba consistía en tomar los tiempos que tardaban en travesar un corredor con
recompensa final, después de 1, 2 ó 3 días de privación de comida.
La variable dependiente (tiempos) se distribuye normalmente, además, las observaciones son
independientes y las varianzas homogéneas. (n. c. 95%)
Teniendo en cuenta estos datos, cuál sería el valor crítico para el factor A (tipo de rata):
a) 4,41
b) 3,49
c) 3,55
5. Teniendo en cuenta las sumas de cuadrados anteriores, podemos concluir en cuanto al factor B
(tiempo de privación):
a) Es necesario realizar las comparaciones múltiples entre 1 y 3 días de privación
b) Se acepta la hipótesis nula, es decir, el estar privadas de alimento tiene efectos sobre el
resultado de las pruebas.
c) Estar privadas de comida 1, 2 ó 3 días influye de forma distinta.
9. Por otro lado, el valor del estadístico de contraste para la interacción sería:
a) 3,99
b) 5,40
c) 1,98
10. Tras realizar el cálculo de los estadísticos, podemos concluir, refiriéndonos al factor A:
a) Existen diferencias significativas entre las ratas.
b) No existen diferencias significativas entre las ratas
c) Aceptamos la hipótesis alternativa.
11. Del mismo modo, podemos concluir acerca del factor B (adiestramiento):
a) Existen diferencias significativas entre los adiestramientos
b) No existen diferencias significativas entre los adiestramientos.
c) Rechazamos la hipótesis nula.
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS
GRADO
Nº TM-1 TM-2 TM-3 TM-4 TM-5 TM-6 TM-7 TM-8 TM-9 TM-2 TM-1 Nº
1 A B B A C C A C A 47
2 C B C C A C B A C 48
3 C C A A B C C A 49
4 B A C A C B B A 50
5 C B A C B A C B 51
6 A A B A C C A B 52
7 A A A A A C C A 53
8 A C A B B B A C 54
9 C B A A C A A B 55
10 C A C B B B A 56
11 B B A B C B A 57
12 A A B B B C A 58
13 A A A B B C 59
14 B A C A A B 60
15 A B B B A A 61
16 C A A A A A 62
17 A B A C A B 63
18 C A B B C A 64
19 B C C A B A 65
20 C A B A A A 66
21 C A C C C B 67
22 B A C C C A 68
23 A C A B B A 69
24 B A B C B B 70
25 C C C B C A 71
26 B C A A B A 72
27 C B B C A 73
28 B A A A A 74
29 B B C B
30 A A B C
31 C A A A
32 C B A A
33 A C C C
34 A B C B
35 C A A A
36 C C B B
37 B C A
38 C A C
39 B A B
40 C B B
41 B C
42 B A
43 B C
44 C B
45 A B
46 A A
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2
5- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A) cuya
distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más estrecho
alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza toda la
Información muestral relacionada con el parámetro.
6- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un nivel
de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación; B)
aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.
9- En un contraste de hipótesis, la máxima diferencia que cabe esperar por simple azar entre el
valor teórico formulado en la hipótesis nula y el valor empírico obtenido a partir de los datos
de la muestra, recibe el nombre de: A) estadístico de contraste; B) valor crítico; C) nivel crítico.
10- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1; C) El nivel de confianza más nivel significación es igual a 1.
11- ¿Cuál de las siguientes afirmaciones es VERDADERA?: A) Potencia más nivel de confianza es
mayor o igual que uno; B) Error tipo I más error tipo II es igual a 1; C) Nivel de confianza más
nivel crítico p es igual a 1.
12- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula
que es verdadera, se llama: A) nivel crítico p; B) nivel de confianza; C) nivel de significación.
-1-
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2
14- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume como
provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los datos
obtenidos en la muestra.
15- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones;
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria
ordinaria.
17- ¿Cuál de las siguientes afirmaciones es VERDADERA? Desde un punto de vista conceptual, la
potencia de un contraste: A) es el complementario del nivel de confianza; B) disminuye
cuando aumenta el nivel de significación; C) es la sensibilidad de un experimento para
detectar una diferencia significativa cuando la hipótesis nula es falsa.
18- A partir de una población con media 80 y desviación típica 8 ¿Cuánto vale la media y la
desviación típica, respectivamente, de la distribución muestral de la media generada a partir
de muestras de tamaño n = 16?: A) 10 y 2; B) 80 y 2; C) 10 y 8.
19- Si la variable dependiente está medida a nivel ordinal; A) debemos utilizar un contraste no
paramétrico; B) debemos utilizar un contraste paramétrico; C) ninguna de las opciones
anteriores es correcta.
20- El nivel crítico p: A) depende del nivel de confianza; B) es una probabilidad asociada al
estadístico de contraste; C) lo multiplicamos por dos cuando el contraste es unilateral.
21- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
22- Si trabajamos con dos grupos, siendo los tamaños de las muestras: ,
sabemos que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C)
las muestras son independientes.
-2-
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2
23- Partiendo de una población con varianza desconocida, la distribución muestral de la media es
una distribución: A) T de Student con grados de libertad; B) normal; C) Ji-cuadrado con
grados de libertad.
24- El objetivo del análisis inferencial de los datos es: A) realizar un análisis descriptivo de los
datos de la investigación; B) inferir los estadísticos muestrales a partir de lo observado; C)
inferir los parámetros de la población a partir de la información proporcionada por la
muestra.
25- Bajo qué condiciones podemos asumir que la distribución muestral de la proporción es
normal: A) cuando la muestra es grande; B) cuando la variable es cuantitativa continua; C)
sólo cuando es normal la distribución de la variable en la población.
26- Se llama error típico de un estadístico a la desviación típica de: A) el parámetro poblacional; B)
la distribución muestral de este estadístico; C) los datos recogidos en la muestra.
-3-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2
5- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A) cuya
distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.
6- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un nivel
de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación; B)
aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.
9- En un contraste de hipótesis, la máxima diferencia que cabe esperar por simple azar entre el
valor teórico formulado en la hipótesis nula y el valor empírico obtenido a partir de los datos
de la muestra, recibe el nombre de: A) estadístico de contraste; B) valor crítico; C) nivel crítico.
10- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II
es siempre igual a 1; C) El nivel de confianza más nivel significación es igual a 1.
11- ¿Cuál de las siguientes afirmaciones es VERDADERA?: A) Potencia más nivel de confianza es
mayor o igual que uno; B) Error tipo I más error tipo II es igual a 1; C) Nivel de confianza más
nivel crítico p es igual a 1.
12- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula
que es verdadera, se llama: A) nivel crítico p; B) nivel de confianza; C) nivel de significación.
-1-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2
14- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume como
provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los datos
obtenidos en la muestra.
15- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones;
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria
ordinaria.
17- ¿Cuál de las siguientes afirmaciones es VERDADERA? Desde un punto de vista conceptual, la
potencia de un contraste: A) es el complementario del nivel de confianza; B) disminuye
cuando aumenta el nivel de significación; C) es la sensibilidad de un experimento para
detectar una diferencia significativa cuando la hipótesis nula es falsa.
18- A partir de una población con media 80 y desviación típica 8 ¿Cuánto vale la media y la
desviación típica, respectivamente, de la distribución muestral de la media generada a partir
de muestras de tamaño n = 16?: A) 10 y 2; B) 80 y 2; C) 10 y 8.
19- Si la variable dependiente está medida a nivel ordinal; A) debemos utilizar un contraste no
paramétrico; B) debemos utilizar un contraste paramétrico; C) ninguna de las opciones
anteriores es correcta.
20- El nivel crítico p: A) depende del nivel de confianza; B) es una probabilidad asociada al
estadístico de contraste; C) lo multiplicamos por dos cuando el contraste es unilateral.
21- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
22- Si trabajamos con dos grupos, siendo los tamaños de las muestras: ,
sabemos que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C)
las muestras son independientes.
-2-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2
23- Partiendo de una población con varianza desconocida, la distribución muestral de la media es
una distribución: A) T de Student con grados de libertad; B) normal; C) Ji-cuadrado con
grados de libertad.
24- El objetivo del análisis inferencial de los datos es: A) realizar un análisis descriptivo de los
datos de la investigación; B) inferir los estadísticos muestrales a partir de lo observado; C)
inferir los parámetros de la población a partir de la información proporcionada por la
muestra.
25- Bajo qué condiciones podemos asumir que la distribución muestral de la proporción es
normal: A) cuando la muestra es grande; B) cuando la variable es cuantitativa continua; C)
sólo cuando es normal la distribución de la variable en la población.
26- Se llama error típico de un estadístico a la desviación típica de: A) el parámetro poblacional;
B) la distribución muestral de este estadístico; C) los datos recogidos en la muestra.
-3-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
SITUACIÓN 1. Para contrastar la hipótesis de si la edad media de inicio en el consumo de alcohol de los
jóvenes de una determinada comunidad es más tardía que la media de la población general establecida
en 13 años, un investigador utiliza una muestra de 25 jóvenes encontrando que la edad media en su
comunidad es de 14 años con una desviación típica insesgada de 2,8. Asumimos que la variable edad de
inicio en el consumo de alcohol se distribuye normalmente en la población.
SITUACIÓN 2. La empresa SND's de sondeos electorales ha pronosticado que el nivel de apoyo que
recibirá el partido X en las próximas elecciones será del 40%. Desde el propio partido X se promueve un
nuevo sondeo con el fin de contrastar la veracidad de esta afirmación. Se elige al azar una muestra
aleatoria de 400 personas, con derecho a voto, de los cuales 128 manifiestan su intención de votar al
partido X.
-1-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
SITUACIÓN 3. “La formación alcanzada por la población adulta española ha mejorado, de forma
continua, en los últimos 10 años. Desde 1998 el porcentaje de españoles de 25 a 64 años que poseen
estudios superiores a los obligatorios ha pasado de 33% al 51% en 2008. En la misma proporción ha
disminuido, por tanto, el porcentaje de españoles que sólo poseen estudios obligatorios, que ha pasado
del 67% en 1998 al 49% en 2008” (Panorama de la Educación. Informe OCDE 2010). Suponga que usted
quiere estudiar si estos datos son los que realmente existen en su Comunidad, para lo que utiliza una
muestra aleatoria de 900 adultos con edades comprendidas entre 25 y 64 años, encontrando que 378
de ellos tienen solo los estudios obligatorios.
1. Si decide trabajar con un nivel de confianza del 95% y se establece el error máximo de estimación en
el 3%, ¿cuál debe ser el tamaño de la muestra?: A) 1040; B) 544; C) 789.
2. Trabajando con un nivel de confianza del 95%, el intervalo de confianza de la proporción de adultos
de su Comunidad que solo tienen estudios obligatorios, se encuentra entre: A) 0,378 y 0,462; B)
0,388 y 0,452; C) 0,376 y 0,461.
3. Si el investigador quiere confirmar que la proporción de adultos de su Comunidad que solo tienen los
estudios obligatorios es significativamente inferior que el indicador de España en 2008, la hipótesis
alternativa es: A) H1: π< 0,49; B) H1: π> 0,49; C) H1: π≤ 0,42.
4. Si el investigador cree que la proporción de adultos que solo tienen los estudios obligatorios es
inferior que el indicador de España en 2008, el estadístico de contraste y el nivel p-crítico para
analizar si la diferencia es estadísticamente significativa es: A) 3,34 (p=0,0008); B) -4,2 (p<0,0002); C)
-2,33 (p=0,0198).
SITUACIÓN 4. “En Educación Primaria, la media de alumnos por clase en los centros públicos de España
(19,7) es más baja que en la OCDE (21,6) y que en la Unión Europea (20,3). En los centros privados
ocurre lo contrario, pues la media en España es de 24,4 frente a 20,8 de media de la OCDE y 19,1 de la
UE”. (Panorama de la Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos
difieren significativamente de los que existen en su Comunidad. Asumiendo que la variable número de
alumnos por clase se distribuye normalmente, selecciona una muestra aleatoria de 100 aulas de
educación primaria en centros públicos, encontrando que la media de alumnos por clase es de 20,9 con
una desviación típica poblacional de 5,8.
1. Trabajando con un nivel de confianza del 95%, el intervalo de confianza para la media de alumnos
por clase en los centros públicos de su Comunidad es: A) 19,98; 21,8; B) 19,4; 22,39; C) 19,76; 22,04.
2. El procedimiento que aplicaría para contrastar si la media de los datos de su Comunidad es
significativamente menor que de la media de la OCDE es: A) la prueba t con n-1 grados de libertad; B)
la prueba z; C) la prueba de chi-cuadrado con n grados de libertad.
-2-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
3. Si se decide trabajar con un nivel de confianza del 95% y se establece un error máximo de estimación
en 1 punto, ¿Cuál debe ser el tamaño de la muestra? A) 129; B) 12923; C) 378.
4. El estadístico de contraste para analizar si la media de alumnos en los centros públicos de su
Comunidad es significativamente mayor que la media de España, toma el valor: A) 1,056; B) 1,261; C)
2,069.
5. Si sospecha que la media de los centros públicos de su Comunidad es significativamente mayor que
la media de España, el nivel p-crítico es: A) p=0,1446; B) p< 0,05; C) p=0,0192.
6. Teniendo en cuenta el estadístico de contraste obtenido ¿cuál de las siguientes sentencias es
verdadera?: A) no hay evidencia suficiente para rechazar que la media de alumnos por clase en los
colegios públicos de la Comunidad es igual a la media de España; B) La media de alumnos por clase
en los colegios públicos de la Comunidad es mayor que la media de España (NC= 95%); C)
rechazamos la hipótesis nula con un nivel de confianza del 99%.
7. Trabajando con un nivel de confianza del 95%, la interpretación del intervalo de confianza para la
media de alumnos por clase en los centros públicos de su Comunidad, le permite afirmar que la
media de su comunidad es: A) significativamente distinta que la de España pero igual que la de la UE;
B) significativamente distinta a la de la OCDE pero igual que la de España; C) significativamente
distinta que la de la UE pero igual que la de la OCDE.
SITUACIÓN 5. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en
estudiantes de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7%
éxtasis. Además, el inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más
tempranas. Así, mientras que en el año 2004 la edad media de inicio para la cocaína era de 15,9 años en
los hombres y 15,7 en las mujeres, en el año 2008 disminuyó a 15,3 años y 15,2, respectivamente
(ENCUESTA ESTATAL SOBRE USO DE DROGAS EN ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los
datos disponibles por un equipo de atención primaria que cubre a un determinado sector de su
municipio indican que en la muestra de 37 jóvenes varones y 41 mujeres atendidos el pasado año, el 8%
habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el consumo de cocaína de
15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 para los
hombres y 1,1 en las mujeres.
1. Bajo el supuesto de que la edad media de los hombres que han consumido cocaína al menos una vez,
es de 15,9 años, el error típico de la distribución muestral de la media es: A) 0,453; B) 0,2166; C)
0,334.
2. Si la hipótesis del investigador es que la edad media de inicio en el consumo de cocaína en los
hombres de su municipio ha disminuido significativamente respecto a los datos del 2004, el
estadístico de contraste es: A) -2,43; B) -2,7; C) -2,3.
3. A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95% ¿cuál es el
tamaño de la muestra necesario para estimar la proporción poblacional de jóvenes de su municipio
que han consumido cocaína al menos una vez con un error máximo de estimación del 2%?: A) 707; B)
1536; C) 978.
4. A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95%, ¿entre qué
valores se encontrará la proporción poblacional de jóvenes de su municipio que han consumido
cocaína al menos una vez?: A) 0,71; 0,88; B) 0,02; 0,14; C) 0,04; 0,12.
5. Con un nivel de confianza del 95%, el intervalo de confianza de la varianza poblacional de la edad de
las mujeres de su municipio que han consumido al menos una vez cocaína es: A) 0,83; 2,03; B) 0,89;
1,87; C) 0,95; 1,23.
-3-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
SITUACIÓN 6. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en
estudiantes de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7%
éxtasis. Además, el inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más
tempranas. Así, mientras que en el año 2004 la edad media de inicio para la cocaína era de 15,9 años en
los hombres y 15,7 en las mujeres, en el año 2008 disminuyó a 15,3 años y 15,2, respectivamente
(ENCUESTA ESTATAL SOBRE EL USO DE DROGAS EN ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los
datos disponibles por un equipo de atención primaria que cubre un determinado sector de su municipio
indican que con 41 jóvenes varones y 51 mujeres atendidos el pasado año, el 8% habían consumido
cocaína, al menos un vez, siendo la edad media de inicio en el consumo de cocaína de 15,4 años en los
hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 años y 1,1 años,
respectivamente.
1. Bajo el supuesto de que el 8% de los jóvenes ha consumido cocaína al menos una vez, el error típico
de la distribución muestral de la proporción es: A) 0,901; B) 0,0282; C) 0,0417.
2. Para comprobar si la edad media del inicio en el consumo de cocaína ha disminuido respecto a los
datos del 2004, el estadístico de contraste que aplicaría, es: A) Z porque utilizamos una muestra
grande proveniente de una variable que se distribuye normalmente en la población; B) T porque
desconocemos la varianza y la forma de la distribución poblacional; C) El intervalo de confianza
porque proporciona más información sobre la seguridad al tomar una decisión.
3. Si fijamos un nivel de confianza del 95%, ¿entre qué valores se encontrará la edad media del
consumo de cocaína en las mujeres de su municipio?: A) 14,887; 15,512; B) 14,941; 15,962; C)
14,682; 15,621.
4. Si su hipótesis es que la edad media del inicio en el consumo de cocaína en los hombres de su
municipio ha disminuido respecto a los datos de 2004, el valor del estadístico de contraste que
obtiene es: A) 2,34; B) -3,11; C) -2,43.
5. Si desea contrastar la hipótesis de que la varianza poblacional en la edad de inicio del consumo de
cocaína en los hombres de su municipio es significativamente mayor que 1,1 el nivel crítico p que
obtiene para tomar una decisión respecto a la Ho, es: A) p> 0,10; B) p< 0,025; C) p< 0,01.
-4-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
1. Con un nivel de confianza del 95%, el tamaño de la muestra necesario para que el error de
estimación de la media en la escala de Identificación ideológica no supere 0,2 puntos, es: a) 150; b)
102; c) 138.
2. Con un nivel de confianza del 95%, el intervalo de confianza aproximado para la media en la escala
de identificación ideológica de los residentes en su localidad es: A) 4,98; 5,82; B) 5,03; 5,76; C) 4,952;
5,847.
3. De acuerdo a los objetivos del psicólogo, la hipótesis nula es: A) ; B) ; C)
4. El procedimiento que aplicaría para probar la hipótesis del psicólogo, es: A) la Prueba Z; B) la prueba t
con n-1 grados de libertad; C) la prueba Chi cuadrado con n-1 grados de libertad.
5. El estadístico de contraste para la hipótesis del psicólogo es: A) 2,352; B) 1,697; C) 2,5.
Si el psicólogo fija un nivel de significación de 0,05 el valor crítico para tomar una decisión respecto a
la hipótesis nula es: A) 1, 697; B) 1,96; C) 2,042.
6. Bajo el supuesto de que la H0 es verdadera, la probabilidad de obtener una muestra con una media
tan alejada o más de 5,39 es: A) p > 0,10; B) p < 0,001; C) p < 0,02.
7. Con los datos originales obtenidos en nuestra muestra, la decisión que toma respecto a la hipótesis
nula es: A) Rechazarla porque, bajo el supuesto de que fuera cierta, la probabilidad de obtener una
muestra con una media de 5,40 o superior es muy pequeña; B) Mantenerla porque el valor absoluto
del estadístico de contraste es menor que el valor absoluto del valor crítico; C) No se puede rechazar
la hipótesis nula.
SITUACIÓN 8. El “Síndrome Jubilación” es la situación que experimentan ciertas personas ante esta
nueva etapa vital con manifestaciones somáticas, psíquicas y sociales negativas que afectan la calidad de
vida del jubilado. Un estudio publicado por el GIE (Grupo de Investigación del Envejecimiento) mediante
una encuesta realizada en el 2006 utilizando una muestra de jubilados con edad media de 77,6 años y
desviación típica de 8,79 años encuentra que las manifestaciones psíquicas más frecuentes eran la
ansiedad (82%), el pesimismo (13,3%) y la depresión (4,7%) y que para el 32% de los expertos
consultados el apoyo psicológico constituye la estrategia de intervención más adecuada para superar
estos estados. Suponga que usted quiere estudiar la situación de los jubilados de su localidad respecto a
este "síndrome", para lo que utiliza una muestra aleatoria de 362 jubilados, con una edad media de 71,2
años y una desviación típica de 12,5 y de los cuales, el 59,8% presenta signos de ansiedad, el 35%
pesimismo y el 5,2% depresión.
1. Utilizando los datos del GIE y con un nivel de confianza del 95%: si le dicen que el intervalo de
confianza de la proporción de jubilados con manifestaciones de depresión, es un valor comprendido
entre 0,0387 (3,87%) y 0,0553 (5,53%), ¿Cuál es el tamaño más aproximado de la muestra que se ha
utilizado?: A) 1348; B) 2500; C) 3481.
2. Utilizando los datos de su estudio y con un nivel de confianza del 95%, la edad media de los jubilados
de su localidad es un valor comprendido, aproximadamente, entre: A) 69,9 y 72,5 años; B) 69,5 y 72,9
años; C) 70,2 y 73,1 años.
3. Con los datos de su estudio y un nivel de confianza del 99%, el intervalo de confianza para la
proporción de jubilados con manifestaciones psíquicas de ansiedad, es: A) 0,557 y 0,639; B) 0,547 y
0,648; C) 0,531 y 0,664.
-5-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
SITUACIÓN 9. El barómetro del CIS de marzo de 2012 realizado en 240 municipios de 48 provincias
señalaba que el 23,4% estaba en situación de paro y de éstos, a la pregunta ¿Y cree Ud. que es muy
probable, bastante, poco o nada probable que durante los próximos doce meses encuentre Ud. trabajo?,
el 22,6% manifestaba que “bastante probable”, frente al 43,1% que creía que “poco probable” y el
19,2% que “nada probable” y el resto “NS/NC”. Suponga que quiere estudiar si estos resultados se
reproducen actualmente en su localidad, para lo que realiza una encuesta sobre una muestra de 100
personas en situación de paro con una edad media de 39 años y desviación típica de 8,6 años de los
cuales 25 le responden que “bastante probable”, 35 responden que “poco probable” y 20 que “nada
probable” mientras que el resto “no saben o no contestan”.
1. Trabajando con un nivel de confianza del 95% y apoyándose en la distribución chi-cuadrado, el
intervalo de confianza de la varianza de la edad de las personas en situación de paro de su localidad
es un valor comprendido entre: A) 57,08 y 99,65; B) 6,64 y 11,59; C) 59,48 y 100,01.
Con los datos de su encuesta desea comprobar que la proporción de personas en paro que
consideran “poco probable” encontrar trabajo en los próximos doce meses en su localidad es
significativamente menor que el valor 43,1% proporcionados en el estudio del CIS:
-6-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2
SITUACIÓN 10. Un psicólogo que investiga la percepción del tiempo, considera que dicha
habilidad se encuentra deteriorada en los fumadores durante la retirada de nicotina, para lo
que toma una muestra aleatoria de 41 fumadores a los que somete a una abstinencia de
tabaco con una duración de 24 horas, pidiéndoles que estimen el tiempo transcurrido (en
segundos) en un periodo que, objetivamente, fue de 45 segundos. La media aritmética de la
muestra fue igual a 51 segundos con una cuasivarianza igual a 164. El psicólogo desea
determinar si la abstinencia tiene un impacto negativo sobre la percepción temporal,
provocando que el tiempo se sobre-estime. Nivel de confianza 95%.
-7-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
SITUACIÓN 1. Para contrastar la hipótesis de si la edad media de inicio en el consumo de alcohol de los jóvenes
de una determinada comunidad es más tardía que la media de la población general establecida en 13 años, un
investigador utiliza una muestra de 25 jóvenes encontrando que la edad media en su comunidad es de 14 años
con una desviación típica insesgada de 2,8. Asumimos que la variable edad de inicio en el consumo de alcohol
se distribuye normalmente en la población.
1. A partir de la información de la muestra utilizada el intervalo de confianza más aproximado para la varianza
poblacional con un nivel de confianza del 95% es: A) 5,70; 14,41; B) 4,77; 15,17; C) 5,23; 15,13.
El intervalo de confianza para la varianza poblacional viene dado por la siguiente expresión:
2
(𝑛 − 1)𝑆𝑛−1 2
(𝑛 − 1)𝑆𝑛−1
2 < 𝜎2 <
𝜒1− 𝛼⁄ 𝜒𝛼2⁄
2 2
2
(𝑛 − 1)𝑆𝑛−1 2
(𝑛 − 1)𝑆𝑛−1
2
2 < 𝜎 < 2
𝜒0,975 𝜒0,025
24 ∙ 2,82 2
24 ∙ 2,82
<𝜎 < → (4,77 < 𝜎 2 < 15,17)
39,3641 12,4012
2. La hipótesis nula para contrastar la hipótesis sobre la edad media en el consumo de alcohol es: A)
𝑯𝟎 : 𝝁 ≤ 𝟏𝟑; B) 𝐻0 : 𝜇 = 13; C) 𝐻0 : 𝜇 ≥ 13
3. Con los datos de la situación 1, el estadístico de contraste para poner a prueba la media es: A) 2,102; B) 1,78;
C) 1,59.
𝑌̅ − 𝜇0 14 − 13
𝑇= = = 1,786
𝑆𝑛−1 2,8
⁄ ⁄
√𝑛 √25
4. Conforme a los objetivos del investigador y un “alfa”= 0’05, la máxima diferencia que puede producirse por
simple azar, si 𝐻0 es cierta, entre la media observada en la muestra y la media planteada en la hipótesis nula,
expresado en unidades de desviación típica es: A) 2,064; B) 1,711; C) 2,79.
Nos piden el valor crítico. El contraste de hipótesis es unilateral derecho, luego tenemos que buscar en la
tabla “t” de Student para 24 grados de libertad (𝑛 − 1), la puntuación que supera una proporción igual a
0’95. La respuesta correcta es “B”.
5. La interpretación de los resultados obtenidos es que la edad media de inicio en el consumo de alcohol de los
jóvenes de la comunidad: A) es más tardía que la media general con un nivel de confianza del 95%; B) es
más tardía que la media general con un nivel de confianza del 99%; C) no es más tardía que la media general
con un nivel de confianza del 95%.
-1-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
SITUACIÓN 2: La empresa SND's de sondeos electorales ha pronosticado que el nivel de apoyo que recibirá el
partido X en las próximas elecciones será del 40%. Desde el propio partido X se promueve un nuevo sondeo con
el fin de contrastar la veracidad de esta afirmación. Se elige al azar una muestra aleatoria de 400 personas, con
derecho a voto, de los cuales 128 manifiestan su intención de votar al partido X.
1- Con un nivel de confianza del 95%, el Intervalo de confianza aproximado de la proporción de personas que
votarán al partido X, es: A) 0,2743; 0,3657; B) 0,352; 0,424; C) 0,318; 0,322.
128
La proporción en la muestra es: 𝑝 = 400 = 0,32
Al nivel de confianza del 95%, las puntuaciones típicas son: ±1,96
𝑝(1 − 𝑝)
𝑝 ± 𝑍𝛼⁄2 √
𝑛
0,32(1 − 0,32)
0,32 ± 1,96√ → (0,2743; 0,3657)
400
El contraste es bilateral porque el enunciado no especifica si el partido X espera unos resultados inferiores o
superiores a los obtenidos por la empresas SND’s. Simplemente, el partido X pretende contrastar la veracidad
de los datos pronosticados por SND’s.
𝑝 − 𝜋0 0,32 − 0,40
𝑍= = = −3,266
√𝜋0 (1 − 𝜋0 ) √0,40 ∙ 0,60
𝑛 400
4- Con un nivel de confianza del 99%, si los dirigentes del partido X considerasen que Ia proporción de apoyos
no alcanza el valor pronosticado por la empresa SND's, el valor crítico para rechazar la hipótesis nula, es: A)
-2,58; B) 1,64; C) -2,33.
Marcamos como correctas las opciones A y C, porque esta pregunta puede plantear problemas de
interpretación.
Si nos ceñimos al enunciado planteado para esta situación, el contraste es bilateral. Es decir, inicialmente el
partido X no sabe si el nivel de apoyo que recibirá será superior o inferior al pronosticado por la empresa
SND’s, pero “después” de realizar el estudio, observa que la proporción es inferior a 0,40. En este caso el
valor crítico es -2,58.
Por otro lado, podríamos interpretar que “antes” de realizar el estudio, el partido X considera que la
proporción de apoyos será inferior a la proporción pronosticada por SND’s, por lo que el contraste sería
unilateral y por lo tanto la respuesta correcta sería C.
-2-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
5- Para un contraste bilateral con un nivel de significación de 0,01, la conclusión es: A) Rechazar la hipótesis
nula con un nivel de significación del 0,01; B) No hay evidencias para rechazar la hipótesis nula con un nivel
de significación 0,05; C) No hay evidencias para rechazar la hipótesis nula con un nivel de significación 0,01.
Rechazamos la hipótesis nula al nivel de confianza del 99% porque el estadístico de contraste es menor que el
valor crítico (−3,266 < −2,58), luego la opción A es correcta, siendo las opciones B y C claramente
incorrectas.
SITUACIÓN 3: “La formación alcanzada por la población adulta española ha mejorado, de forma continua, en los
últimos 10 años. Desde 1998 el porcentaje de españoles de 25 a 64 años que poseen estudios superiores a los
obligatorios ha pasado de 33% al 51% en 2008. En la misma proporción ha disminuido, por tanto, el porcentaje
de españoles que sólo poseen estudios obligatorios, que ha pasado del 67% en 1998 al 49% en 2008”
(Panorama de la Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos son los que
realmente existen en su Comunidad, para lo que utiliza una muestra aleatoria de 900 adultos con edades
comprendidas entre 25 y 64 años, encontrando que 378 de ellos tienen solo los estudios obligatorios.
1- Si decide trabajar con un nivel de confianza del 95% y se establece el error máximo de estimación en el 3%,
¿cuál debe ser el tamaño de la muestra?: A) 1040; B) 544; C) 789.
2
𝑍1− 𝛼⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) = 0,42 ∙ 0,58 ∙ = 1039,79 ≈ 1040
𝐸2 0,032
2- Trabajando con un nivel de confianza del 95%, el intervalo de confianza de la proporción de adultos de su
Comunidad que solo tienen estudios obligatorios, se encuentra entre: A) 0,378 y 0,462; B) 0,388 y 0,452; C)
0,376 y 0,461.
3- Si el investigador quiere confirmar que la proporción de adultos de su Comunidad que solo tienen los
estudios obligatorios es significativamente inferior que el indicador de España en 2008, la hipótesis
alternativa es: A) 𝑯𝟏 : 𝝅 < 𝟎, 𝟒𝟗; B) 𝐻1 : 𝜋 > 0,49; C) 𝐻1 : 𝜋 ≤ 0,42.
La respuesta correcta es “A”, puesto que las hipótesis que debemos plantear son:
𝐻0 : 𝜋 ≥ 0,49
𝐻1 : 𝜋 < 0,49
-3-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
4- Si el investigador cree que la proporción de adultos que solo tienen los estudios obligatorios es inferior que
el indicador de España en 2008, el estadístico de contraste y el nivel crítico p para analizar si la diferencia es
estadísticamente significativa es: A) 3,34 (p=0,0008); B) -4,2 (p<0,0002); C) -2,33 (p=0,0198);
5- Respecto a la hipótesis del investigador analizada en las preguntas anteriores, el investigador concluye que
la proporción de adultos que solo tienen estudios obligatorios en su Comunidad, es: A) inferior a la del
resto de España con un nivel de significación de 0,01; B) la misma que la del resto de España con un nivel
de significación de 0,05; C) superior a la del resto de España con un nivel de significación de 0,01.
SITUACIÓN 4. “En Educación Primaria, la media de alumnos por clase en los centros públicos de España (19,7)
es más baja que en la OCDE (21,6) y que en la Unión Europea (20,3). En los centros privados ocurre lo contrario,
pues la media en España es de 24,4 frente a 20,8 de media de la OCDE y 19,1 de la UE”. (Panorama de la
Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos difieren significativamente
de los que existen en su Comunidad. Asumiendo que la variable número de alumnos por clase se distribuye
normalmente, selecciona una muestra aleatoria de 100 aulas de educación primaria en centros públicos,
encontrando que la media de alumnos por clase es de 20,9 con una desviación típica poblacional de 5,8.
1- Trabajando con un nivel de confianza del 95%, el intervalo de confianza para la media de alumnos por clase
en los centros públicos de su Comunidad es: A) 19,98; 21,8; B) 19,4; 22,39; C) 19,76; 22,04.
5,8
20,9 ± 1,96 → (19,76; 22,04)
√100
2- El procedimiento que aplicaría para contrastar si la media de los datos de su Comunidad es
significativamente menor que de la media de la OCDE es: A) la prueba t con n-1 grados de libertad; B) la
prueba z; C) la prueba de chi-cuadrado con n grados de libertad.
3- Si se decide trabajar con un nivel de confianza del 95% y se establece un error máximo de estimación en 1
punto, ¿Cuál debe ser el tamaño de la muestra? A) 129; B) 12923; C) 378.
2
(𝑍1−𝛼⁄2 ) 1,962
𝑛 = 𝜎2 = 5,82 = 129,23 ≈ 129
𝐸2 12
-4-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
4- El estadístico de contraste para analizar si la media de alumnos en los centros públicos de su Comunidad es
significativamente mayor que la media de España, toma el valor: A) 1,056; B) 1,261; C) 2,069.
𝑌̅ − 𝜇0 20,9 − 19,7
𝑍= 𝜎 = = 2,069 ≈ 2,07
⁄ 𝑛 5,8⁄
√ 10
5- Si sospecha que la media de los centros públicos de su Comunidad es significativamente mayor que la media
de España, el nivel crítico p es: A) p=0,1446; B) p< 0,05; C) p=0,0192.
Acudiendo a la tabla de curva normal, deducimos que la probabilidad de obtener valores iguales o más
extremos que el estadístico de contraste (2,07) es 0,0192, luego la respuesta correcta es C.
6- Teniendo en cuenta el estadístico de contraste obtenido ¿cuál de las siguientes sentencias es verdadera?: A)
no hay evidencia suficiente para rechazar que la media de alumnos por clase en los colegios públicos de la
Comunidad es igual a la media de España; B) La media de alumnos por clase en los colegios públicos de la
Comunidad es mayor que la media de España (NC= 95%); C) rechazamos la hipótesis nula con un nivel de
confianza del 99%.
Los resultados obtenidos son significativos a un nivel de confianza del 95% (2,069 > 1,64), pero no a un nivel
de confianza del 99% (2,069 < 2,33) luego la respuesta correcta es B.
7- Trabajando con un nivel de confianza del 95%, la interpretación del intervalo de confianza para la media de
alumnos por clase en los centros públicos de su Comunidad, le permite afirmar que la media de su
comunidad es: A) significativamente distinta que la de España pero igual que la de la UE; B)
significativamente distinta a la de la OCDE pero igual que la de España; C) significativamente distinta que la
de la UE pero igual que la de la OCDE.
El intervalo de confianza (19,76; 22,04) incluye a la media de la OCDE (21,6) y la media de la UE (20,3), pero
no incluye la media de España (19,7). Luego la respuesta correcta es A.
SITUACIÓN 5. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en estudiantes
de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7% éxtasis. Además, el
inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más tempranas. Así, mientras que en el
año 2004 la edad media de inicio para la cocaína era de 15,9 años en los hombres y 15,7 en las mujeres, en el
año 2008 disminuyó a 15,3 años y 15,2, respectivamente (ENCUESTA ESTATAL SOBRE USO DE DROGAS EN
ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los datos disponibles por un equipo de atención primaria que
cubre a un determinado sector de su municipio indican que en la muestra de 37 jóvenes varones y 41 mujeres
atendidos el pasado año, el 8% habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el
consumo de cocaína de 15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3
para los hombres y 1,1 en las mujeres.
-5-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
1- Bajo el supuesto de que la edad media de los hombres que han consumido cocaína al menos una vez, es de
15,9 años, el error típico de la distribución muestral de la media es: A) 0,453; B) 0,2166; C) 0,334.
En el caso de los hombres, el error típico de la distribución cuando no conocemos la varianza poblacional
viene dado por:
𝑆𝑛 1,3
= = 0,2167
√𝑛 − 1 √37 − 1
2- Si la hipótesis del investigador es que la edad media de inicio en el consumo de cocaína en los hombres de
su municipio ha disminuido significativamente respecto a los datos del 2004, el estadístico de contraste es:
A) -2,43; B) -2,7; C) -2,3.
Contraste unilateral de medias para una muestra (varones) varianza poblacional desconocida:
𝑌̅ − 𝜇0 15,4 − 15,9
𝑇= = = −2,31
𝑆𝑛 1,3
√𝑛 − 1 √37 − 1
3- A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95% ¿cuál es el tamaño de
la muestra necesario para estimar la proporción poblacional de jóvenes de su municipio que han consumido
cocaína al menos una vez con un error máximo de estimación del 2%?: A) 707; B) 1536; C) 978.
2
𝑧1− 𝛼⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) 2 = 0,08 ∙ (1 − 0,08) = 706,85 ≈ 707
𝐸𝑚𝑎𝑥 0,022
4- A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95%, ¿entre qué valores se
encontrará la proporción poblacional de jóvenes de su municipio que han consumido cocaína al menos una
vez?: A) 0,71; 0,88; B) 0,02; 0,14; C) 0,04; 0,12.
5- Con un nivel de confianza del 95%, el intervalo de confianza de la varianza poblacional de la edad de las
mujeres de su municipio que han consumido al menos una vez cocaína es: A) 0,83; 2,03; B) 0,89; 1,87; C)
0,95; 1,23.
-6-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
6- Si desea contrastar la hipótesis de que la varianza poblacional de la edad de las mujeres de su municipio es
mayor que 1, el nivel crítico p que obtiene para tomar una decisión respecto a la 𝐻0 , es: A) p > 0,10; B) p <
0,05; C) p > 0,01.
𝑛𝑆𝑛2 41 ∙ 1,12
𝜒2 = 2 = = 49,61
𝜎0 1
Buscando en la Tabla de Chi-cuadrado observamos que para 40 grados de libertad, el valor 49,61 se
encuentra entre las puntuaciones:
29,05 que deja por encima de sí el 0,90 de la distribución
51,80 que deja por encima de sí el 0,10 de la distribución.
Luego sabemos que 49,61 deja por encima una proporción superior a 0,10.
SITUACIÓN 6. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en estudiantes
de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7% éxtasis. Además, el
inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más tempranas. Así, mientras que en el
año 2004 la edad media de inicio para la cocaína era de 15,9 años en los hombres y 15,7 en las mujeres, en el
año 2008 disminuyó a 15,3 años y 15,2, respectivamente (ENCUESTA ESTATAL SOBRE EL USO DE DROGAS EN
ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los datos disponibles por un equipo de atención primaria que
cubre un determinado sector de su municipio indican que con 41 jóvenes varones y 51 mujeres atendidos el
pasado año, el 8% habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el consumo de
cocaína de 15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 años y 1,1
años, respectivamente.
1. Bajo el supuesto de que el 8% de los jóvenes ha consumido cocaína al menos una vez, el error típico de la
distribución muestral de la proporción es: A) 0,901; B) 0,0282; C) 0,0417.
2. Para comprobar si la edad media del inicio en el consumo de cocaína ha disminuido respecto a los datos del
2004, el estadístico de contraste que aplicaría, es: A) Z porque utilizamos una muestra grande proveniente
de una variable que se distribuye normalmente en la población; B) T porque desconocemos la varianza y la
forma de la distribución poblacional; C) El intervalo de confianza porque proporciona más información
sobre la seguridad al tomar una decisión.
-7-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
3. Si fijamos un nivel de confianza del 95%, ¿entre qué valores se encontrará la edad media del consumo de
cocaína en las mujeres de su municipio?: A) 14,887; 15,512; B) 14,941; 15,962; C) 14,682; 15,621.
Nos están pidiendo el intervalo de confianza (con 𝛼 = 0,05) para la edad media del consumo de cocaína en
las mujeres. Este viene dada por las fórmulas:
𝑆𝑛−1 1,1
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 2,009 = 0,3125
√𝑛 √51 − 1
15,5125
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 15,2 ± 0,3125 → {
14,8875
4. Si su hipótesis es que la edad media del inicio en el consumo de cocaína en los hombres de su municipio ha
disminuido respecto a los datos de 2004, el valor del estadístico de contraste que obtiene es: A) 2,34; B) -
3,11; C) -2,43.
𝑌̅ − 𝜇0 15,4 − 15,9
𝑇= = = −2,4325
𝑆𝑛 1,3
√𝑛 − 1 √41 − 1
5. Si desea contrastar la hipótesis de que la varianza poblacional en la edad de inicio del consumo de cocaína
en los hombres de su municipio es significativamente mayor que 1,1 el nivel crítico p que obtiene para tomar
una decisión respecto a la 𝐻0 , es: A) p> 0,10; B) p< 0,025; C) p< 0,01.
En las tablas (𝑔. 𝑙. = 𝑛 − 1 = 40) no podemos encontrar el valor exacto, pero observamos que el estadístico
de contraste (62,99) se encuentra entre las puntuaciones 59,3417 y 63,6907 que dejan por encima de sí,
respectivamente unas probabilidades iguales a 0,025 y 0,01, luego la opción correcta es B.
SITUACIÓN 7. El Centro de Investigaciones Sociológicas (CIS) realiza constantes estudios sobre la ideología e
intención de voto de los españoles. Uno de los ítems que incluye en sus cuestionarios es el de la “identificación
ideológica”, para lo que se le pide al entrevistado que se ubique ideológicamente en una escala de 1 a 10
(donde 1 significa extrema izquierda y 10 extrema derecha). En su última encuesta a la población española la
media aritmética obtenida para la variable identificación ideológica fue de un 4,86. Un psicólogo social
interesado en estudiar esta temática en su localidad selecciona una muestra aleatoria formada por 31 sujetos a
los que aplica el ítem de identificación ideológica, obteniendo una media de 5,40 y una cuasi-desviación típica
de 1,2. Con esta información, responda a las siguientes preguntas:
-8-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
1- Con un nivel de confianza del 95%, el tamaño de la muestra necesario para que el error de estimación de la
media en la escala de Identificación ideológica no supere 0,2 puntos, es: A) 150; B) 102; C) 138.
2
𝑡𝑛−1;1− 𝛼⁄ 2,0422
2 2
𝑛= 𝑆𝑛−1 2 = 1,22 = 150,11 ≈ 150
𝐸𝑚𝑎𝑥 0,22
2- Con un nivel de confianza del 95%, el intervalo de confianza aproximado para la media en la escala de
identificación ideológica de los residentes en su localidad es: A) 4,98; 5,82; B) 5,03; 5,76; C) 4,952; 5,847.
𝑆𝑛−1 1,2
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 2,042 = 0,44
√𝑛 √31
5,84
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 5,40 ± 0,44 → {
4,96
3- De acuerdo a los objetivos del psicólogo, la hipótesis nula es: A) 𝑯𝟎 : 𝝁 = 𝟒, 𝟖𝟔; B) 𝐻0 : 𝜇 ≥ 4,86; C)
𝐻0 : 𝜇 ≤ 4,86
El contraste es bilateral, porque el psicólogo no parte de una hipótesis previa sobre los resultados de la
muestra.
4- El procedimiento que aplicaría para probar la hipótesis del psicólogo, es: A) la Prueba Z; B) la prueba t con
𝒏 − 𝟏 grados de libertad; C) la prueba Chi cuadrado con 𝑛 − 1 grados de libertad.
Tenemos un contraste sobre una media con una muestra de 31 sujetos y de la población no conocemos la
varianza.
5- El estadístico de contraste para la hipótesis del psicólogo es: A) 2,352; B) 1,697; C) 2,5.
𝑌̅ − 𝜇0 5,40 − 4,86
𝑇= = = 2,51
𝑆𝑛−1 1,2
√𝑛 √31
6- Si el psicólogo fija un nivel de significación de 0,05 el valor crítico para tomar una decisión respecto a la
hipótesis nula es: A) 1, 697; B) 1,96; C) 2,042.
7- Bajo el supuesto de que la 𝐻0 es verdadera, la probabilidad de obtener una muestra con una media tan
alejada o más de 5,39 es: A) p > 0,10; B) p < 0,001; C) p < 0,02.
El valor en las tablas más próximo al estadístico de contraste (𝑇 = 2,51) corresponde a la puntuación 2,457,
que deja por debajo de sí una proporción igual a 0,990 (1 − 0,990 = 0,01 por encima). Como el contraste
es bilateral, se multiplica por dos la probabilidad obtenida en la tabla.
-9-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
8- Con los datos originales obtenidos en nuestra muestra, la decisión que toma respecto a la hipótesis nula es:
A) Rechazarla porque, bajo el supuesto de que fuera cierta, la probabilidad de obtener una muestra con
una media de 5,40 o superior es muy pequeña; B) Mantenerla porque el valor absoluto del estadístico de
contraste es menor que el valor absoluto del valor crítico; C) No se puede rechazar la hipótesis nula.
SITUACIÓN 8: El “Síndrome Jubilación” es la situación que experimentan ciertas personas ante esta nueva etapa
vital con manifestaciones somáticas, psíquicas y sociales negativas que afectan la calidad de vida del jubilado.
Un estudio publicado por el GIE (Grupo de Investigación del Envejecimiento) mediante una encuesta realizada
en el 2006 utilizando una muestra de jubilados con edad media de 77,6 años y desviación típica de 8,79 años
encuentra que las manifestaciones psíquicas más frecuentes eran la ansiedad (82%), el pesimismo (13,3%) y la
depresión (4,7%) y que para el 32% de los expertos consultados el apoyo psicológico constituye la estrategia de
intervención más adecuada para superar estos estados. Suponga que usted quiere estudiar la situación de los
jubilados de su localidad respecto a este "síndrome", para lo que utiliza una muestra aleatoria de 362 jubilados,
con una edad media de 71,2 años y una desviación típica de 12,5 y de los cuales, el 59,8% presenta signos de
ansiedad, el 35% pesimismo y el 5,2% depresión.
1- Utilizando los datos del GIE y con un nivel de confianza del 95%: si le dicen que el intervalo de confianza de
la proporción de jubilados con manifestaciones de depresión, es un valor comprendido entre 0,0387 (3,87%)
y 0,0553 (5,53%), ¿Cuál es el tamaño más aproximado de la muestra que se ha utilizado?: A) 1348; B) 2500;
C) 3481.
Conociendo los límites superior e inferior del intervalo de confianza, deducimos fácilmente el error máximo:
𝑙𝑖 = 𝑝 − 𝐸 𝑙𝑠 − 𝑙𝑖 0,0553 − 0,0387
}→𝐸= = = 0,0083
𝑙𝑠 = 𝑝 + 𝐸 2 2
El tamaño de la muestra será igual a:
𝑧𝛼2⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) = 0,047(1 − 0,047) = 2497,73 ≈ 2500
𝐸2 0,00832
2- Utilizando los datos de su estudio y con un nivel de confianza del 95%, la edad media de los jubilados de su
localidad es un valor comprendido, aproximadamente, entre: A) 69,9 y 72,5 años; B) 69,5 y 72,9 años; C)
70,2 y 73,1 años.
12,5
71,2 ± 1,96 → 71,2 ± 1,29 → (69,91; 72,49)
√362 − 1
-10-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
3- Con los datos de su estudio y un nivel de confianza del 99%, el intervalo de confianza para la proporción de
jubilados con manifestaciones psíquicas de ansiedad, es: A) 0,557 y 0,639; B) 0,547 y 0,648; C) 0,531 y 0,664.
0,598(1 − 0,598)
0,598 ± 2,58√ → (0,5315; 0,6645)
362
𝑝 − 𝜋0 0,35 − 0,133
𝐻0 : 𝜋 ≤ 0,133 𝑧= = = 12,158
𝐻1 : 𝜋 > 0,133 √𝜋0 (1 − 𝜋0 ) √0,133(1 − 0,133)
𝑛 362
El estadístico de contraste es un valor muy extremo (z = 12,158). El valor máximo que podemos consultar en
las tablas de curva normal es z = 3,59, que deja por encima de sí una proporción: p = 0,0002
SITUACIÓN 9: El barómetro del CIS de marzo de 2012 realizado en 240 municipios de 48 provincias señalaba
que el 23,4% estaba en situación de paro y de éstos, a la pregunta ¿Y cree Ud. que es muy probable, bastante,
poco o nada probable que durante los próximos doce meses encuentre Ud. trabajo?, el 22,6% manifestaba que
“bastante probable”, frente al 43,1% que creía que “poco probable” y el 19,2% que “nada probable” y el resto
“NS/NC”. Suponga que quiere estudiar si estos resultados se reproducen actualmente en su localidad, para lo
que realiza una encuesta sobre una muestra de 100 personas en situación de paro con una edad media de 39
años y desviación típica de 8,6 años de los cuales 25 le responden que “bastante probable”, 35 responden que
“poco probable” y 20 que “nada probable” mientras que el resto “no saben o no contestan”.
-11-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
1- Trabajando con un nivel de confianza del 95% y apoyándose en la distribución chi-cuadrado, el intervalo de
confianza de la varianza de la edad de las personas en situación de paro de su localidad es un valor
comprendido entre: A) 57,08 y 99,65; B) 6,64 y 11,59; C) 59,48 y 100,01.
Con los datos de su encuesta desea comprobar que la proporción de personas en paro que consideran “poco
probable” encontrar trabajo en los próximos doce meses en su localidad es significativamente menor que el valor
43,1% proporcionados en el estudio del CIS:
0,55(1 − 0,55)
0,55 ± 1,96√ → (0,4525; 0,6475)
100
8- Si desea contrastar la hipótesis nula de que la edad media de los parados de su localidad es menor de 40
años, el estadístico de contraste que utilizaría es: A) Z por tratarse de una variable cuantitativa con
distribución normal; B) t por tratarse de una variable normalmente distribuida; C) t por tratarse de una
variable cuantitativa con varianza desconocida en la población.
-12-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
SITUACIÓN 10. Un psicólogo que investiga la percepción del tiempo, considera que dicha habilidad se
encuentra deteriorada en los fumadores durante la retirada de nicotina, para lo que toma una muestra
aleatoria de 41 fumadores a los que somete a una abstinencia de tabaco con una duración de 24 horas,
pidiéndoles que estimen el tiempo había transcurrido (en segundos) en un periodo que, objetivamente, fue
de 45 segundos. La media aritmética de la muestra fue igual a 51 segundos con una cuasivarianza igual a
164. El psicólogo desea determinar si la abstinencia tiene un impacto negativo sobre la percepción temporal,
provocando que el tiempo se sobre-estime. Nivel de confianza 95%.
Dado que el psicólogo desea comprobar si el tiempo se sobre-estima, hemos de plantear un contraste
unilateral derecho, cuyas hipótesis son:
𝐻0 : 𝜇 ≤ 45
𝐻1 : 𝜇 > 45
𝑌̅ − 𝜇0 51 − 45
𝑇= = =3
𝑆𝑛−1 164
√
√𝑛 41
4- Con los datos recogidos, se rechaza la hipótesis nula: A) Sí, porque el estadístico de contraste es superior al
valor crítico; B) Sí, porque el nivel de significación es menor que el nivel crítico; C) No, porque el estadístico
de contraste es menor que el valor crítico.
5- ¿Es significativo el estadístico de contraste?: A) No; B) Si para un nivel de confianza del 95%, pero no a un
nivel de confianza del 99%; C) Es significativo a un nivel de confianza del 99%.
El estadístico de contraste (𝑇 = 3) supera un nivel de confianza del 95% (3 > 1,684), pero también supera
un nivel de confianza del 99% (3 > 2,423), luego la respuesta correcta es C.
6- ¿Cuál es el valor del nivel crítico p?: A) 0,005; B) menor que 0,005; C) 0,005 < p < 0,01.
El valor más extremo que podemos consultar en las tablas t de Student, para 40 grados de libertad, es 2,704,
que deja por encima de sí una probabilidad igual a: 0,005, luego el estadístico de contraste (𝑇 = 3) que es
todavía más extremo, dejará por encima de sí una probabilidad menor que 0,005
7- Si hemos realizado un estudio donde el nivel crítico ha sido superior a α. A) Mantenemos la hipótesis nula;
B) Rechazamos la hipótesis nula; C) No tenemos información para mantener o rechazar la hipótesis nula.
8- La probabilidad de mantener 𝐻0 falsa se denomina: A) nivel de significación; B) error de tipo II; C) potencia
del contraste.
La probabilidad pedida es el error de tipo II, que también podemos definir como la probabilidad de rechazar
𝐻1 verdadera.
9- Un estadístico cuyo valor medio es igual al valor de esta característica en la población, se dice que es; A)
eficiente; B) suficiente; C) insesgado.
-13-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2
10- Dados varios estadísticos insesgados para estimar la misma característica poblacional, la mejor elección es
utilizar el estadístico: A) con la desviación típica mas grande; B) con la desviación típica más pequeña; C) con
la media mas grande.
La respuesta correcta es B, puesto que el estimador con la desviación típica más pequeña es el más eficiente.
-14-
Diseños de experimentos y análisis de datos. Enunciados de preguntas teóricas temas 3 y 4
2- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
3- Si trabajamos con dos grupos siendo los tamaños de las muestras: n1 = 30 y n2 =35, sabemos
que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C) las
muestras son independientes.
7- En un contraste sobre dos proporciones con muestras relacionadas, cuál de los siguientes
estadísticos es insensible a la dirección del cambio producido: A) Chi cuadrado de la prueba de
McNemar; B) el estadístico Z; C) no es correcta ninguna de las opciones anteriores.
8- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
-1-
Diseños de experimentos y análisis de datos. Preguntas teóricas temas 3 y 4
2- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
3- Si trabajamos con dos grupos siendo los tamaños de las muestras: n1 = 30 y n2 =35, sabemos
que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C) las
muestras son independientes.
7- En un contraste sobre dos proporciones con muestras relacionadas, cuál de los siguientes
estadísticos es insensible a la dirección del cambio producido: A) Chi cuadrado de la prueba de
McNemar; B) el estadístico Z; C) no es correcta ninguna de las opciones anteriores.
8- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
SITUACIÓN 1. Se pretende comprobar si los profesionales que llevan menos de cinco años en una empresa
(Grupo 1) poseen mayores aspiraciones que las personas que llevan cinco o más años (Grupo 2). Para ello se
entrevista a 32 personas que llevan menos de cinco años y a otras 32 personas que llevan cinco o más años,
todas ellas elegidas al azar. Los resultados mostraron que dentro del primer grupo se identificó a 18 personas
con altas aspiraciones, mientras que en el segundo grupo se identificaron a 14 personas con altas aspiraciones.
Nivel de confianza 95%.
5- La decisión correcta es: A) Rechazar la hipótesis nula porque el nivel crítico p es menor que el nivel de
significación; B) Mantener la hipótesis nula porque el estadístico de contraste es menor que el valor crítico;
C) ninguna de las anteriores es correcta.
6- A un nivel de confianza del 95% concluimos que: A) los profesionales que llevan menos de cinco años
trabajando poseen mayores aspiraciones que el grupo que lleva trabajando 5 o más años; B) los
profesionales que llevan 5 o más años trabajando poseen mayores aspiraciones que el grupo que lleva
menos de 5 años; C) no existen diferencias en cuanto a las aspiraciones profesionales entre los dos grupos.
SITUACIÓN 2. En un estudio cuyo objeto es evaluar el efecto de la música clásica sobre la capacidad de
concentración disponemos de 62 sujetos con los que formamos de manera aleatoria dos grupos de 31 sujetos
cada uno. Al primero de ellos (Grupo 1) se le sometió a una prueba de concentración escuchando música clásica
y al segundo (Grupo 2) se le sometió a la misma prueba en condiciones normales de silencio. La puntuación
media para el Grupo 1 fue de 86 puntos con una cuasivarianza igual a 150. El Grupo 2 obtuvo una media
aritmética igual a 80 puntos y una cuasivarianza igual a 129. Sabiendo que la variable dependiente está medida
en una escala de intervalo, asumiendo varianzas poblacionales iguales y con un nivel de confianza del 9S%
¿podemos afirmar que la media en concentración es superior para el grupo que escuchó música clásica?
5- El nivel crítico p es igual a: A) entre 0,05 y 0,10; B) entre 0,05 y 0,95; C) 0,025.
6- Rechazamos la hipótesis nula porque: A) el nivel de significación es menor que el nivel crítico p; B) el
estadístico de contraste es mayor que el valor crítico; C) no rechazamos la hipótesis nula.
-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
SITUACIÓN 3: En una tarea sobre decisión léxica con estímulos visuales en la que se miden tiempos de reacción,
un investigador dispone de una muestra aleatoria de 26 sujetos. Utiliza dos grupos de palabras y parte de la
hipótesis de que los tiempos de reacción serán más cortos ante palabras de alta frecuencia léxica (aquellas que
utilizamos más frecuentemente en el lenguaje, Grupo 1) que ante palabras de baja frecuencia léxica (Grupo 2).
Tras realizar el experimento observa que el tiempo de reacción medio para el Grupo 1 fue igual a 612,04 ms,
mientras que para el Grupo 2 fue igual a 645 ms, siendo la cuasivarianza de las diferencias igual a 6656 ms 2.
Asumiendo que se cumplen los supuestos para realizar un contraste paramétrico, conteste a las siguientes
cuestiones:
5- Para un nivel de confianza del 95%, el valor absoluto del valor crítico es: A) 1,708; B) 2,06; C) 2,485.
SITUACIÓN 4: Para comparar la eficacia de dos terapias (“A” y “B”) utilizadas para tratar el trastorno de
personalidad “X”, se toma una muestra aleatoria de 400 personas que sufren el trastorno “X”, formándose dos
grupos al azar de 200 personas cada uno. Al primer grupo se le aplica la terapia “A”, siendo 172 personas las
que se recuperan, mientras que al aplicar la terapia “B” se recuperan 148 personas. Con un nivel de confianza
del 95%, ¿son las dos terapias igualmente eficaces?
5- Rechazamos la hipótesis nula porque: A) El valor absoluto del estadístico de contraste es superior al valor
absoluto del valor crítico; B) el nivel de significación es menor que el nivel de confianza; C) el nivel crítico p es
menor que el nivel de confianza.
6- ¿Se desprende de los resultados obtenidos que las dos terapias son igualmente eficaces? A) Si, porque
hemos aceptado la hipótesis alternativa; B) No, porque los resultados no son significativos; C) No, porque el
valor del estadístico de contraste es estadísticamente significativo.
7- Indique para qué niveles de confianza obtendremos resultados significativos: A) 95% y 99%; B) 99% y 99,9%;
C) para cualquier nivel de confianza.
-2-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
SITUACIÓN 5: En una tarea de reconocimiento de palabras, un investigador mantiene la hipótesis de que los
estudiantes de carreras de “letras” tardarán menos que los estudiantes de “ciencias” en reconocer los estímulos
presentados. Tras seleccionar dos muestras aleatorias de 31 observaciones cada una, y registrar el tiempo de
reacción, obtiene una media aritmética igual a 653,2 ms para el grupo de estudiantes de ciencias (Grupo 1) y de
600 ms para el grupo de estudiantes de letras (Grupo 2), siendo la cuasivarianza igual en ambas muestras, con
un valor de 6200 ms2. Con un nivel de confianza del 95%, conteste a las siguientes cuestiones:
1- Si queremos comprobar si las varianzas de ambas poblaciones son iguales o diferentes, observaremos que el
valor del estadístico de contraste: A) no es significativo; B) es significativo; C) es significativo al nivel de
confianza del 95%, pero no al 99%.
7- Aceptamos la hipótesis alternativa porque: A) el valor del estadístico de contraste es menor que el nivel
crítico p; B) el nivel crítico p es menor que el nivel de significación; C) el nivel crítico p es mayor que el valor
crítico.
8- ¿Podemos concluir que los resultados obtenidos avalan la hipótesis del investigador? A) Si; B) No; C) los
resultados son significativos al nivel de confianza del 95%, pero no del 99%.
SITUACIÓN 6. En un estudio piloto para un nuevo tratamiento contra el SIDA (Thompson, 1991), se midieron
diversas variables en 27 pacientes con SIDA. Entre ellas el número de células T-4 sanguíneas al inicio del
tratamiento y 90 días más tarde. Los resultados fueron: 𝑌̅0 𝑑𝑖𝑎𝑠 = 324; 𝑌̅90 𝑑𝑖𝑎𝑠 = 334,4. Por estudios
anteriores se sabe que la varianza poblacional de las diferencias en el contaje de células T-4 vale 150.
Asumiendo un nivel de confianza del 95%, conteste a las siguientes cuestiones:
1- Se trata de un diseño: A) de dos grupos dependientes; B) de más de dos grupos dependientes; C) de dos
grupos independientes.
2- La hipótesis nula en el caso de las medias es: A) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 = 𝜇90 𝑑𝑖𝑎𝑠 ; B) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 ≥ 𝜇90 𝑑𝑖𝑎𝑠 ; C)
𝐻0 : 𝜋0 𝑑𝑖𝑎𝑠 ≤ 𝜋90 𝑑𝑖𝑎𝑠
3- El valor del estadístico de contraste para comprobar si al inicio del tratamiento los sujetos tienen el mismo
número de células T-4 que al final del mismo es igual a: A) 1,045; B) -4,41; C) 1,841.
4- Los valores críticos que delimitan la zona de aceptación de 𝐻0 son: A) −1,05 𝑦 1,05; B) −1,96 𝑦 1,96; C)
−1,65 𝑦 1,65.
-3-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
5- El investigador: A) acepta 𝐻0 ya que el intervalo de confianza de la media incluye la media de las diferencias
entre ambas muestras; B) rechaza 𝐻0 porque la Z calculada es inferior al valor crítico; C) rechaza 𝐻1 ya que el
estadístico de contraste calculado se encuentra en la zona de rechazo.
6- Si el investigador hubiera vuelto a realizar una nueva medición del número de células T-4 180 días después
de iniciado el tratamiento, deberíamos aplicar como técnica de análisis: A) un ANOVA de medidas
independientes de un factor; B) un ANOVA de dos factores con interacción; C) un ANOVA de medidas
repetidas de un factor con tres niveles.
SITUACIÓN 7. Un psicólogo, sospecha que los alumnos de cuarto de grado (Grupo 1) presentan una media
superior y más variabilidad que los alumnos de primer curso de grado (Grupo 2) en la variable “autoestima”.
Para comprobar estas hipótesis selecciona dos muestras aleatorias de igual tamaño (𝑛1 = 𝑛2 = 31) a las que
aplica un test de autoestima. Los resultados fueron: 𝑌̅1 = 22,16, 𝑆̂12 = 76,42 para el Grupo 1 y 𝑌̅2 = 20,07,
𝑆̂22 = 47,58 para el Grupo 2. Asumiendo un nivel de confianza del 95% conteste a las siguientes cuestiones:
𝜎2 𝜎2 𝜎2
1- La hipótesis nula en el caso de las varianzas es: A) 𝐻0 : 𝜎12 = 1; B) 𝐻0 : 𝜎12 ≤ 1; C) B) 𝐻0 : 𝜎12 ≥ 1
2 2 2
2- El valor del estadístico de contraste para comprobar si los sujetos del Grupo 1 presentan más variabilidad
que los sujetos del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,841.
3- Asumiendo igualdad de varianzas poblacionales, el valor del estadístico de contraste para comprobar si la
media del Grupo 1 es superior a la media del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,671.
4- El nivel crítico en el caso del contraste sobre las varianzas es igual a: A) 0,05; B) 0,10; C) 0,15.
5- El nivel crítico en el caso del contraste sobre las medias es igual a: A) 0,05; B) 0,10; C) 0,15.
6- El tamaño del efecto en el caso del contraste sobre medias es igual a: A) 1,045; B) 0,265; C) 0,15.
7- Nuestro psicólogo mantiene la hipótesis nula: A) Para el contraste de las varianzas pero no para el contraste
de medias; B) Para el contraste de medias pero no para el contraste de varianzas; C) En ambos casos, tanto
en el caso de las medias, como en el caso de las varianzas.
SITUACIÓN 8: El equipo docente de una determinada asignatura quiere comprobar la eficacia de un material
docente nuevo respecto al utilizado en convocatorias anteriores. Selecciona una muestra aleatoria de 64
alumnos, con los que forma dos grupos de igual tamaño también al azar. A los sujetos del Grupo 1 les
proporciona en nuevo material, mientras que los del Grupo 2 trabajan con el material antiguo. El equipo
docente tiene la hipótesis de que con el nuevo material las notas serán más elevadas. Tras el examen de fin de
curso los alumnos del Grupo 1 obtienen una nota media igual a 7, con una cuasivarianza igual a 15, mientras
que para el Grupo 2 la media es igual a 5,2 y la cuasivarianza igual a 17.
1- Si con un nivel de confianza del 95% realizamos un contraste de hipótesis para comprobar si las varianzas
poblacionales son iguales o diferentes, aceptaremos: A) la hipótesis nula; B) la hipótesis alternativa; C) No
podemos saber qué cuasivarianza hay que poner en el numerador del estadístico de contraste.
2- Si realizamos un contraste de hipótesis sobre las medias para comprobar la hipótesis del equipo docente, el
estadístico de contraste vale: A) 2; B) 1,8; C) 1,67.
-4-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
4- Con un nivel de confianza del 95%, suponiendo que la hipótesis nula sobre el contraste de medias es cierta,
la probabilidad de obtener un valor igual o superior al estadístico de contraste que hemos obtenido: A) se
encuentra comprendida entre 0,01 y 0,025; B) se encuentra comprendida entre 0,025 y 0,05; C) es igual a
0,05.
5- Si trabajamos con un nivel de confianza del 95%, la probabilidad de rechazar la hipótesis nula suponiendo
que es cierta es igual a: A) se encuentra comprendida entre 0,01 y 0,025; B) es igual a 0,05; C) es igual a 0,95.
6- Tomando de las tablas el valor más próximo para los grados de libertad, el intervalo de confianza para la
diferencia de medias, para un nivel de confianza del 95% viene definido por los valores: A) 0,2 𝑦 3,8; B)
−0,2 𝑦 − 3,8; C) −0,2 𝑦 3,8.
7- El estadístico de contraste obtenido para contrastar la hipótesis del equipo docente: A) no es significativo; B)
Es significativo al nivel de confianza del 99%; C) es significativo al nivel de confianza del 95%.
SITUACIÓN 9: Un psicólogo imparte una conferencia a una muestra de 200 fumadores en la que les expone un
tratamiento para abandonar este hábito. También pregunta a los sujetos, antes y después de la conferencia,
que cuantifiquen en una escala de 0 a 10 si se sienten capaces de dejar de fumar tras recibir el tratamiento,
donde el cero indicaría que no se sienten capaces de ninguna forma y 10 que lo lograrán con absoluta certeza.
Antes de la conferencia, la mitad de los sujetos de la muestra están dispuestos a seguir el tratamiento. Tras la
conferencia, encuentra que 80 personas que estaban dispuestas a seguir la terapia mantienen la idea de
hacerlo, y que otras 80 personas que no estaban dispuestas a seguir la terapia han cambiado de opinión. El
psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia sea mayor tras la
conferencia. Respecto a la pregunta que plantea el psicólogo a los sujetos, se encuentra que aquellos que no se
sentían capaces de dejar de fumar antes de la conferencia obtienen una media superior después de la
conferencia, siendo dicha media un punto superior a la media antes de la conferencia y la cuasidesviación típica
de las diferencias es igual a 5. Con un nivel de confianza del 95%.
1- El valor absoluto del estadístico de contraste “Z” para comprobar la hipótesis del psicólogo es igual a: A)
1,64; B) 2,33; C) 6.
2- Si la hipótesis nula es cierta, la probabilidad de obtener un estadístico de contraste igual o más extremo que
el obtenido: A) es igual a 0,05; B) es igual a 0,95; C) es menor que 0,0002.
3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,64; B) 1,96; C) 2,33.
4- La hipótesis que antes de la conferencia tenía el psicólogo: A) queda confirmada porque mantenemos la
hipótesis nula; B) queda confirmada porque el nivel crítico es menor que el error de tipo I; C) queda
confirmada porque el nivel crítico es mayor que el valor crítico.
Si queremos comprobar que la media de los sujetos que inicialmente no están dispuestos a seguir el
tratamiento es superior después de la conferencia, y con un nivel de confianza del 95%:
-5-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4
6- Si realmente no existen diferencias entre las medias antes y después, la probabilidad del obtener un
estadístico de contraste igual o más extremo que el que proporcionan los datos vale: A) entre 0,10 y 0,05; B)
entre 0,01 y 0,025; C) 0,05.
8- Podemos afirmar que los sujetos que inicialmente no están dispuestos a seguir el tratamiento inicialmente,
se sienten más seguros de poder dejar de fumar tras la conferencia del psicólogo. A) Sí, porque el nivel
crítico es inferior al nivel de significación; B) Sí, porque el nivel crítico es inferior al nivel de confianza; C) No,
los resultados no son significativos.
SITUACIÓN 10. Un partido político X elabora un vídeo pre-electoral con la intención de incrementar el número
de votos en las siguientes elecciones. Extrae una muestra aleatoria de 200 personas a las que muestra el
vídeo. Antes de verlo 120 personas declararon que no votarían al partido X, 60 de las cuales cambiaron de
opinión tras ver el vídeo, siendo 136 sujetos en total los que manifestaron su intención de votar al partido X
después de ver el vídeo. Con un nivel de confianza del 95%.
2- El valor del estadístico de contrate Chi cuadrado es igual a ; A) 10,24; B) 49; C) 1,96.
4- El valor crítico para el estadístico Chi cuadrado es; A) 5,0239; B) 2,7055; C) 3,8415.
5- El nivel crítico es: A) mayor que 0,001; B) menor que 0,005; C) igual a 0,05.
7- A la vista de los resultados, el partido X determina que: A) El vídeo resulta efectivo porque incrementa el
número de votantes del partido X; B) El vídeo no resulta efectivo porque hay pocas personas que cambian
de opinión a favor del partido X; C) El vídeo no resulta efectivo porque se rechaza la hipótesis nula.
8- Si la magnitud del efecto es pequeña: A) la diferencia entre dos medias nunca es significativa; B) la
diferencia entre dos medias siempre es significativa; C) la diferencia entre dos medias puede ser
significativa.
-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
SITUACIÓN 1. Se pretende comprobar si los profesionales que llevan menos de cinco años en una empresa
(Grupo 1) poseen mayores aspiraciones que las personas que llevan cinco o más años (Grupo 2). Para ello se
entrevista a 32 personas que llevan menos de cinco años y a otras 32 personas que llevan cinco o más años,
todas ellas elegidas al azar. Los resultados mostraron que dentro del primer grupo se identificó a 18 personas
con altas aspiraciones, mientras que en el segundo grupo se identificaron a 14 personas con altas aspiraciones.
Nivel de confianza 95%.
𝑝1 − 𝑝2 𝑛1 𝑝1 + 𝑛2 𝑝2
𝑍= 𝑠𝑖𝑒𝑛𝑑𝑜 𝑃=
1 1 𝑛1 + 𝑛2
√𝑃(1 − 𝑃) ( + )
𝑛1 𝑛2
Primero calculamos P
18 + 14
𝑃= = 0,5
32 + 32
Finalmente:
18 14
𝑍=
𝑝1 − 𝑝2
= 32 − 32 =
0,5625 − 0,4375
=1
1 1 0,125
√𝑃(1 − 𝑃) ( + ) √0,50(1 − 0,50) ( 1 + 1 )
𝑛1 𝑛2 32 32
Acudiendo a la tabla de curva normal, observamos que la probabilidad de encontrar valores superiores a una
puntuación típica igual a 1 es 0’1587.
5- La decisión correcta es: A) Rechazar la hipótesis nula porque el nivel crítico p es menor que el nivel de
significación; B) Mantener la hipótesis nula porque el estadístico de contraste es menor que el valor
crítico; C) ninguna de las anteriores es correcta.
6- A un nivel de confianza del 95% concluimos que: A) los profesionales que llevan menos de cinco años
trabajando poseen mayores aspiraciones que el grupo que lleva trabajando 5 o más años; B) los
profesionales que llevan 5 o más años trabajando poseen mayores aspiraciones que el grupo que lleva
menos de 5 años; C) no existen diferencias en cuanto a las aspiraciones profesionales entre los dos grupos.
SITUACIÓN 2. En un estudio cuyo objeto es evaluar el efecto de la música clásica sobre la capacidad de
concentración disponemos de 62 sujetos con los que formamos de manera aleatoria dos grupos de 31 sujetos
cada uno. Al primero de ellos (Grupo 1) se le sometió a una prueba de concentración escuchando música clásica
y al segundo (Grupo 2) se le sometió a la misma prueba en condiciones normales de silencio. La puntuación
media para el Grupo 1 fue de 86 puntos con una cuasivarianza igual a 150. El Grupo 2 obtuvo una media
aritmética igual a 80 puntos y una cuasivarianza igual a 129. Sabiendo que la variable dependiente está medida
en una escala de intervalo, asumiendo varianzas poblacionales iguales y con un nivel de confianza del 9S%
¿podemos afirmar que la media en concentración es superior para el grupo que escuchó música clásica?
-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
Queremos comprobar si la media es superior para el Grupo 1 (música clásica) que para el Grupo 2 (silencio),
luego la hipótesis alternativa es 𝐻1 : 𝜇1 − 𝜇2 > 0. La hipótesis nula, por lo tanto, es la especificada en la
opción A.
𝑌̅1 − 𝑌̅2 86 − 80
𝑇= = =2
(𝑛1 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 1 1 √30 ∙ 150 + 30 ∙ 129 ( 1 + 1 )
√ ( + ) 31 + 31 − 2 31 31
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2
𝑌̅1 − 𝑌̅2 86 − 80
𝐷= = = 0,508
(𝑛1 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 √30 ∙ 150 + 30 ∙ 129
√ 31 + 31 − 2
𝑛1 + 𝑛2 − 2
El contraste es unilateral derecho. Buscando en las tablas T de Student para 60 grados de libertad
(𝑛1 + 𝑛2 − 2 = 60) la puntuación que supera una proporción igual a 0,95, comprobamos que la respuesta
correcta es A.
5- El nivel crítico p es igual a: A) entre 0,05 y 0,10; B) entre 0,05 y 0,95; C) 0,025.
6- Rechazamos la hipótesis nula porque: A) el nivel de significación es menor que el nivel crítico p; B) el
estadístico de contraste es mayor que el valor crítico; C) no rechazamos la hipótesis nula.
Claramente la opción correcta es B. La opción A es falsa porque si el nivel de significación es menor que el
nivel crítico mantenemos la hipótesis nula.
SITUACIÓN 3: En una tarea sobre decisión léxica con estímulos visuales en la que se miden tiempos de reacción,
un investigador dispone de una muestra aleatoria de 26 sujetos. Utiliza dos grupos de palabras y parte de la
hipótesis de que los tiempos de reacción serán más cortos ante palabras de alta frecuencia léxica (aquellas que
utilizamos más frecuentemente en el lenguaje, Grupo 1) que ante palabras de baja frecuencia léxica (Grupo 2).
Tras realizar el experimento observa que el tiempo de reacción medio para el Grupo 1 fue igual a 612,04 ms,
mientras que para el Grupo 2 fue igual a 645 ms, siendo la cuasivarianza de las diferencias igual a 6656 ms 2.
Asumiendo que se cumplen los supuestos para realizar un contraste paramétrico, conteste a las siguientes
cuestiones:
-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
La respuesta correcta es “A”, debemos de plantear un contraste de hipótesis sobre dos medias para dos
muestras relacionadas, siendo las hipótesis:
𝐻0 : 𝜇1 − 𝜇2 ≥ 0
𝐻1 : 𝜇1 − 𝜇2 < 0
5- Para un nivel de confianza del 95%, el valor absoluto del valor crítico es: A) 1,708; B) 2,06; C) 2,485.
La respuesta correcta es “B”, puesto que el resultado es significativo para el nivel de confianza del 95%
(−2,06 < −1,708) pero no para el nivel de confianza del 99% (−2,06 > −2,485).
SITUACIÓN 4: Para comparar la eficacia de dos terapias (“A” y “B”) utilizadas para tratar el trastorno de
personalidad “X”, se toma una muestra aleatoria de 400 personas que sufren el trastorno “X”, formándose dos
grupos al azar de 200 personas cada uno. Al primer grupo se le aplica la terapia “A”, siendo 172 personas las
que se recuperan, mientras que al aplicar la terapia “B” se recuperan 148 personas. Con un nivel de confianza
del 95%, ¿son las dos terapias igualmente eficaces?
-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
𝑝1 − 𝑝2 0′ 86 − 0′74
𝑍= = =3
1 1
√𝑃(1 − 𝑃) ( + ) √0,8 ∙ 0,2 ∙ ( 1 + 1 )
𝑛1 𝑛2 200 200
Según el enunciado hemos de tomar un nivel de confianza del 95% y el contraste es bilateral, luego la
respuesta correcta es A.
Acudiendo a la tabla de curva normal, observamos que la probabilidad de encontrar valores iguales o más
extremos que 𝑍 = 3 es igual a 0,0013. Como el contraste es bilateral, el nivel crítico es igual a: 𝑝 = 0,0013 ∙
2 = 0,0026.
5- Rechazamos la hipótesis nula porque: A) El valor absoluto del estadístico de contraste es superior al valor
absoluto del valor crítico; B) el nivel de significación es menor que el nivel de confianza; C) el nivel crítico p
es menor que el nivel de confianza.
6- ¿Se desprende de los resultados obtenidos que las dos terapias son igualmente eficaces? A) Si, porque
hemos aceptado la hipótesis alternativa; B) No, porque los resultados no son significativos; C) No, porque el
valor del estadístico de contraste es estadísticamente significativo.
Aceptamos la hipótesis alternativa porque el resultado es significativo (3 > 1,96), luego las dos terapias no
son igualmente eficaces, y por lo tanto la respuesta correcta es C.
7- Indique para qué niveles de confianza obtendremos resultados significativos: A) 95% y 99%; B) 99% y 99,9%;
C) para cualquier nivel de confianza.
Los resultados son significativos al nivel de confianza del 95% (3 > 1,96), también al nivel de confianza del
99% (3 > 2,58), pero no al nivel de confianza del 99,9 (3 < 3,1), luego la respuesta correcta es A.
SITUACIÓN 5: En una tarea de reconocimiento de palabras, un investigador mantiene la hipótesis de que los
estudiantes de carreras de “letras” tardarán menos que los estudiantes de “ciencias” en reconocer los estímulos
presentados. Tras seleccionar dos muestras aleatorias de 31 observaciones cada una, y registrar el tiempo de
reacción, obtiene una media aritmética igual a 653,2 ms para el grupo de estudiantes de ciencias (Grupo 1) y de
600 ms para el grupo de estudiantes de letras (Grupo 2), siendo la cuasivarianza igual en ambas muestras, con
un valor de 6200 ms2. Con un nivel de confianza del 95%, conteste a las siguientes cuestiones:
1- Si queremos comprobar si las varianzas de ambas poblaciones son iguales o diferentes, observaremos que el
valor del estadístico de contraste: A) no es significativo; B) es significativo; C) es significativo al nivel de
confianza del 95%, pero no al 99%.
-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
653,2 − 600
𝑇= = 2,66
√30 ∙ 6200 + 30 ∙ 6200 ∙ ( 1 + 1 )
31 + 31 − 2 31 31
Se busca en la tabla de la distribución t con 60 grados de libertad y un nivel de confianza del 95%.
|653,2 − 600|
𝑇= = 0,6756
√30 ∙ 6200 + 30 ∙ 6200
31 + 31 − 2
7- Aceptamos la hipótesis alternativa porque: A) el valor del estadístico de contraste es menor que el nivel
crítico p; B) el nivel crítico p es menor que el nivel de significación; C) el nivel crítico p es mayor que el valor
crítico.
8- ¿Podemos concluir que los resultados obtenidos avalan la hipótesis del investigador? A) Si; B) No; C) los
resultados son significativos al nivel de confianza del 95%, pero no del 99%.
SITUACIÓN 6. En un estudio piloto para un nuevo tratamiento contra el SIDA (Thompson, 1991), se midieron
diversas variables en 27 pacientes con SIDA. Entre ellas el número de células T-4 sanguíneas al inicio del
tratamiento y 90 días más tarde. Los resultados fueron: 𝑌̅0 𝑑𝑖𝑎𝑠 = 324; 𝑌̅90 𝑑𝑖𝑎𝑠 = 334,4. Por estudios
anteriores se sabe que la varianza poblacional de las diferencias en el contaje de células T-4 vale 150.
Asumiendo un nivel de confianza del 95%, conteste a las siguientes cuestiones:
1- Se trata de un diseño: A) de dos grupos dependientes; B) de más de dos grupos dependientes; C) de dos
grupos independientes.
2- La hipótesis nula en el caso de las medias es: A) 𝑯𝟎 : 𝝁𝟎 𝒅𝒊𝒂𝒔 = 𝝁𝟗𝟎 𝒅𝒊𝒂𝒔; B) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 ≥ 𝜇90 𝑑𝑖𝑎𝑠 ; C)
𝐻0 : 𝜋0 𝑑𝑖𝑎𝑠 ≤ 𝜋90 𝑑𝑖𝑎𝑠
3- El valor del estadístico de contraste para comprobar si al inicio del tratamiento los sujetos tienen el mismo
número de células T-4 que al final del mismo es igual a: A) 1,045; B) -4,41; C) 1,841.
Nos encontramos con un contraste de medias para dos grupos dependientes conociendo la varianza de las
diferencias poblacionales. Luego el estadístico de contraste es:
-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
̅ − 𝜇𝑑
𝐷 324 − 334,4
𝑍= = = −4,41
2
√𝜎𝑑 √150
𝑛 27
4- Los valores críticos que delimitan la zona de aceptación de 𝐻0 son: A) −1,05 𝑦 1,05; B) −𝟏, 𝟗𝟔 𝒚 𝟏, 𝟗𝟔; C)
−1,65 𝑦 1,65.
5- El investigador: A) acepta 𝐻0 ya que el intervalo de confianza de la media incluye la media de las diferencias
entre ambas muestras; B) rechaza 𝑯𝟎 porque la Z calculada es inferior al valor crítico; C) rechaza 𝐻1 ya que
el estadístico de contraste calculado se encuentra en la zona de rechazo.
6- Si el investigador hubiera vuelto a realizar una nueva medición del número de células T-4 180 días después
de iniciado el tratamiento, deberíamos aplicar como técnica de análisis: A) un ANOVA de medidas
independientes de un factor; B) un ANOVA de dos factores con interacción; C) un ANOVA de medidas
repetidas de un factor con tres niveles.
En este caso se estaría midiendo la variable dependiente en los mismos sujetos en tres ocasiones distintas.
Por consiguiente son medidas dependientes y tenemos más de dos: deberíamos utilizar un ANOVA de
medidas dependientes con un factor de tres niveles (medición a 0 días, a 90 días y a 180 días).
SITUACIÓN 7. Un psicólogo, sospecha que los alumnos de cuarto de grado (Grupo 1) presentan una media
superior y más variabilidad que los alumnos de primer curso de grado (Grupo 2) en la variable “autoestima”.
Para comprobar estas hipótesis selecciona dos muestras aleatorias de igual tamaño (𝑛1 = 𝑛2 = 31) a las que
aplica un test de autoestima. Los resultados fueron: 𝑌̅1 = 22,16, 𝑆̂12 = 76,42 para el Grupo 1 y 𝑌̅2 = 20,07,
𝑆̂22 = 47,58 para el Grupo 2. Asumiendo un nivel de confianza del 95% conteste a las siguientes cuestiones:
𝜎2 𝝈𝟐 𝜎2
1- La hipótesis nula en el caso de las varianzas es: A) 𝐻0 : 𝜎12 = 1; B) 𝑯𝟎 : 𝝈𝟏𝟐 ≤ 𝟏; C) B) 𝐻0 : 𝜎12 ≥ 1
2 𝟐 2
2- El valor del estadístico de contraste para comprobar si los sujetos del Grupo 1 presentan más variabilidad
que los sujetos del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,841.
𝑆̂12 76,42
𝐹= = = 1,606
𝑆̂22 47,58
3- Asumiendo igualdad de varianzas poblacionales, el valor del estadístico de contraste para comprobar si la
media del Grupo 1 es superior a la media del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,671.
4- El nivel crítico en el caso del contraste sobre las varianzas es igual a: A) 0,05; B) 0,10; C) 0,15.
Mirando en las tablas de la F obtenemos un valor de 0,90, es decir, una F = 1,606 con 30 y 30 grados de
libertad, deja por debajo de sí un área de 0,90. Luego el valor pedido es 1- 0,90 = 0,10.
-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
5- El nivel crítico en el caso del contraste sobre las medias es igual a: A) 0,05; B) 0,10; C) 0,15.
En las tablas observamos que un valor de T = 1,045 con 60 grados de libertad deja por debajo de sí el 0,850
del área de la distribución. Luego el valor pedido será 1-0,850 = 0,15 en un contraste unilateral.
6- El tamaño del efecto en el caso del contraste sobre medias es igual a: A) 1,045; B) 0,265; C) 0,15.
|𝑌̅1 − 𝑌̅2 | 22,16 − 20,07
𝑇= = = 0,2654
(𝑛 ̂ 2 (𝑛 ̂2 √30 ∙ 76,42 + 30 ∙ 47,58
√ 1 − 1)𝑆1 + 2 − 1)𝑆2 31 + 31 − 2
𝑛1 + 𝑛2 − 2
7- Nuestro psicólogo mantiene la hipótesis nula: A) Para el contraste de las varianzas pero no para el contraste
de medias; B) Para el contraste de medias pero no para el contraste de varianzas; C) En ambos casos, tanto
en el caso de las medias, como en el caso de las varianzas.
Los niveles críticos para los contrastes F y T son: 0,10 y 0,15 respectivamente, ambos superiores a: 𝛼 = 0,05,
luego se mantiene la hipótesis nula en ambos casos.
SITUACIÓN 8: El equipo docente de una determinada asignatura quiere comprobar la eficacia de un material
docente nuevo respecto al utilizado en convocatorias anteriores. Selecciona una muestra aleatoria de 64
alumnos, con los que forma dos grupos de igual tamaño también al azar. A los sujetos del Grupo 1 les
proporciona en nuevo material, mientras que los del Grupo 2 trabajan con el material antiguo. El equipo
docente tiene la hipótesis de que con el nuevo material las notas serán más elevadas. Tras el examen de fin de
curso los alumnos del Grupo 1 obtienen una nota media igual a 7, con una cuasivarianza igual a 15, mientras
que para el Grupo 2 la media es igual a 5,2 y la cuasivarianza igual a 17.
1- Si con un nivel de confianza del 95% realizamos un contraste de hipótesis para comprobar si las varianzas
poblacionales son iguales o diferentes, aceptaremos: A) la hipótesis nula; B) la hipótesis alternativa; C) No
podemos saber qué cuasivarianza hay que poner en el numerador del estadístico de contraste.
Para un nivel de confianza del 95%, el valor que nos ofrece la tabla F para 30 grados de libertad en el
numerador y 30 grados de libertad en el denominador (los más próximos a 31) es igual a 1,841, luego los
valores críticos son:
1
𝐹0,025;30;30 = 2,074 = 0,482, 𝐹0,975;30;30 = 2,074
Dado que F = 0,88 se encuentra comprendido entre los valores críticos, aceptamos la hipótesis nula, por lo
que podemos suponer que las varianzas son iguales.
2- Si realizamos un contraste de hipótesis sobre las medias para comprobar la hipótesis del equipo docente, el
estadístico de contraste vale: A) 2; B) 1,8; C) 1,67.
-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
4- Con un nivel de confianza del 95%, suponiendo que la hipótesis nula sobre el contraste de medias es cierta,
la probabilidad de obtener un valor igual o superior al estadístico de contraste que hemos obtenido: A) se
encuentra comprendida entre 0,01 y 0,025; B) se encuentra comprendida entre 0,025 y 0,05; C) es igual a
0,05.
Nos piden calcular el nivel crítico. Buscando en las tablas para 60 grados de libertad (los más próximos a 62),
observamos que el estadístico de contraste obtenido (T =1,8), se encuentra comprendido entre los valores
1,671 y 2, que dejan por encima de sí las probabilidades: 0,05 y 0,025.
5- Si trabajamos con un nivel de confianza del 95%, la probabilidad de rechazar la hipótesis nula suponiendo
que es cierta es igual a: A) se encuentra comprendida entre 0,01 y 0,025; B) es igual a 0,05; C) es igual a 0,95.
6- Tomando de las tablas el valor más próximo para los grados de libertad, el intervalo de confianza para la
diferencia de medias, para un nivel de confianza del 95% viene definido por los valores: A) 0,2 𝑦 3,8; B)
−0,2 𝑦 − 3,8; C) −𝟎, 𝟐 𝒚 𝟑, 𝟖.
7- El estadístico de contraste obtenido para contrastar la hipótesis del equipo docente: A) no es significativo; B)
Es significativo al nivel de confianza del 99%; C) es significativo al nivel de confianza del 95%.
El contraste que hemos de aplicar es unilateral derecho y el estadístico de contraste es: T = 1,8. Este valor
supera al valor crítico t = 1,671 (NC = 95%), pero no supera al valor crítico t = 2,390 (NC=99%).
SITUACIÓN 9: Un psicólogo imparte una conferencia a una muestra de 200 fumadores en la que les expone un
tratamiento para abandonar este hábito. También pregunta a los sujetos, antes y después de la conferencia,
que cuantifiquen en una escala de 0 a 10 si se sienten capaces de dejar de fumar tras recibir el tratamiento,
donde el cero indicaría que no se sienten capaces de ninguna forma y 10 que lo lograrán con absoluta certeza.
Antes de la conferencia, la mitad de los sujetos de la muestra están dispuestos a seguir el tratamiento. Tras la
conferencia, encuentra que 80 personas que estaban dispuestas a seguir la terapia mantienen la idea de
hacerlo, y que otras 80 personas que no estaban dispuestas a seguir la terapia han cambiado de opinión. El
psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia sea mayor tras la
conferencia. Respecto a la pregunta que plantea el psicólogo a los sujetos, se encuentra que aquellos que no se
-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
sentían capaces de dejar de fumar antes de la conferencia obtienen una media superior después de la
conferencia, siendo dicha media un punto superior a la media antes de la conferencia y la cuasidesviación típica
de las diferencias es igual a 5. Con un nivel de confianza del 95%.
Después de la conferencia
SI NO
Antes de la SI a = 80 b = 20 100
conferencia NO c = 80 d =20 100
160 40 200
1- El valor absoluto del estadístico de contraste “Z” para comprobar la hipótesis del psicólogo es igual a: A)
1,64; B) 2,33; C) 6.
Para comprobar la hipótesis del psicólogo realizamos un contraste de hipótesis para dos proporciones con
muestras relacionadas. Para calcular el estadístico de contraste “Z” nos fijamos en los sujetos que han
cambiado de opinión (casillas b y c de la tabla)
𝑏−𝑐 20 − 80
𝑍= = = −6
√𝑏 + 𝑐 √20 + 80
2- Si la hipótesis nula es cierta, la probabilidad de obtener un estadístico de contraste igual o más extremo que
el obtenido: A) es igual a 0,05; B) es igual a 0,95; C) es menor que 0,0002.
Tenemos que calcular el nivel crítico. El estadístico de contraste es muy extremo, superior al valor mayor que
podemos consultar en las tablas (Z = 3,59, que deja por encima de sí una proporción igual a 0,0002), por lo
que la respuesta correcta es C.
3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,64; B) 1,96; C) 2,33.
Como el psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia se mayor
tras la conferencia, el contraste es unilateral. Buscando en las tablas de curva normal para NC = 95%,
comprobamos que la respuesta correcta es A.
4- La hipótesis que antes de la conferencia tenía el psicólogo: A) queda confirmada porque mantenemos la
hipótesis nula; B) queda confirmada porque el nivel crítico es menor que el error de tipo I; C) queda
confirmada porque el nivel crítico es mayor que el valor crítico.
Si queremos comprobar que la media de los sujetos que inicialmente no están dispuestos a seguir el
tratamiento es superior después de la conferencia, y con un nivel de confianza del 95%:
6- Si realmente no existen diferencias entre las medias antes y después, la probabilidad del obtener un
estadístico de contraste igual o más extremo que el que proporcionan los datos vale: A) entre 0,10 y 0,05; B)
entre 0,01 y 0,025; C) 0,05.
Los grados de libertad son: n – 1 = 100 – 1 = 99. En las tablas consultamos para 100 grados de libertad que
son los más próximos. Observamos que el estadístico de contraste se encuentra entre los valores 1,984 y
-9-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
2,364, que dejan por encima de sí, respectivamente, las proporciones: 0,025 y 0,01, luego la respuesta
correcta es B.
8- Podemos afirmar que los sujetos que inicialmente no están dispuestos a seguir el tratamiento inicialmente,
se sienten más seguros de poder dejar de fumar tras la conferencia del psicólogo. A) Sí, porque el nivel
crítico es inferior al nivel de significación; B) Sí, porque el nivel crítico es inferior al nivel de confianza; C) No,
los resultados no son significativos.
SITUACIÓN 10. Un partido político X elabora un vídeo pre-electoral con la intención de incrementar el número
de votos en las siguientes elecciones. Extrae una muestra aleatoria de 200 personas a las que muestra el
vídeo. Antes de verlo 120 personas declararon que no votarían al partido X, 60 de las cuales cambiaron de
opinión tras ver el vídeo, siendo 136 sujetos en total los que manifestaron su intención de votar al partido X
después de ver el vídeo. Con un nivel de confianza del 95%.
Después
SI NO
SI a = 76 b=4 80
Antes
NO c = 60 d = 60 120
136 64 200
2- El valor del estadístico de contrate Chi cuadrado es igual a; A) 10,24; B) 49; C) 1,96.
(𝑏 − 𝑐)2 (4 − 60)2
𝜒2 = = = 49
𝑏+𝑐 4 + 60
3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,28; B) 1,64; C) 1,96.
Buscando en la tabla de curva normal la puntuación típica que supera una proporción igual a 0,05,
observamos que la respuesta correcta es B.
4- El valor crítico para el estadístico Chi cuadrado es; A) 5,0239; B) 2,7055; C) 3,8415.
Buscando en la tabla de 𝜒 2 para un grado de libertad la puntuación que supera una proporción igual a
0,05, observamos que la respuesta correcta es C.
-10-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4
5- El nivel crítico es: A) mayor que 0,001; B) menor que 0,005; C) igual a 0,05.
Tomando el estadístico de contraste Z y consultando las tablas de curva normal, observamos que la
puntuación más extrema que podemos consultar es igual a 3,59, que deja por encima de sí una
proporción igual a 0,0002, por lo que la respuesta correcta es B.
7- A la vista de los resultados, el partido X determina que: A) El vídeo resulta efectivo porque incrementa el
número de votantes del partido X; B) El vídeo no resulta efectivo porque hay pocas personas que
cambian de opinión a favor del partido X; C) El vídeo no resulta efectivo porque se rechaza la hipótesis
nula.
8- Si la magnitud del efecto es pequeña: A) la diferencia entre dos medias nunca es significativa; B) la
diferencia entre dos medias siempre es significativa; C) la diferencia entre dos medias puede ser
significativa.
Aunque la magnitud del efecto sea pequeña, si el tamaño de las muestras es grande, podemos obtener
resultados significativos
-11-
Cuestiones y ejercicios del Tema 5:
¿Se puede afirmar, con un nivel de confianza del 95%, que los tiempos
medios de los grupos son iguales?
Cuestiones y ejercicios del Tema 5: SOLUCIONES
𝑀𝐶inter
𝐹=
𝑀𝐶𝑖𝑛𝑡𝑟𝑎
FV SC gl MC F
Entre niveles 466,67 2 233,335 27,006
Dentro de niveles 233,33 27 8,64
Total 700 29
6) Decisión:
Comparando nuestro valor con el valor tabular tenemos que:
27,006 > 3,35
7) Interpretamos:
A un nivel de confianza del 95% debemos considerar que los
tratamientos suministrados influyen de forma distinta en la ansiedad.
8) El paso siguiente es ver entre qué tratamientos está la diferencia,
para lo que debemos realizar las comparaciones múltiples.
Como queremos comparar todas las medias entre sí, tenemos tres
posibles comparaciones y establecemos tres combinaciones lineales:
Solución:
Dado que tenemos tres muestras independientes, aplicamos un análisis de
varianza de un solo factor.
1) Hipótesis estadísticas:
H0: µ1 = µ2 = µ3
H1: µ1 ≠ µ2 ≠ µ3 al menos para una µi
2) Supuestos:
Vamos a suponer que hemos aplicado el test de rachas, el de Bartlett
y el de Lilliefors y que se cumplen los supuestos de independencia,
homogeneidad de varianzas y normalidad.
3) Estadístico de contraste:
𝑀𝐶inter
𝐹=
𝑀𝐶𝑖𝑛𝑡𝑟𝑎
6) Decisión:
Comparando nuestro valor con el valor tabular tenemos que:
9,264 > 3,42
Por lo tanto rechazamos la hipótesis nula.
7) Interpretamos:
Hemos comprobado, con un nivel de confianza del 95% que hay
diferencia entre los grupos. Vamos a comprobar si es debida a la
diferencia éntrelos niños y las niñas, tal como pide el enunciado del
problema.
¿Se puede afirmar, con un nivel de confianza del 95%, que los tiempos
medios de los grupos son iguales?
Solución:
Dado que queremos comparar cuatro grupos, parece lógico que el diseño
sea un ANOVA de un factor.
Veamos qué datos tenemos y qué datos necesitamos.
Los cálculos que hay que realizar son:
2
(ƩƩ𝑌𝑖𝑗 )
SCtotal = ƩƩ 𝑌𝑖𝑗2 -
𝑁
2 2
(Ʃ𝑌𝑖𝑗 ) (ƩƩ𝑌𝑖𝑗 )
SCinter = Ʃ -
𝑛𝑖 𝑁
2 2
9 = (Ʃ𝑌𝑖𝐴 /8) – (10,5)2 → Ʃ𝑌𝑖𝐴 = 954
2 2
16 = (Ʃ𝑌𝑖𝐵 /8) – (12,5)2 → Ʃ𝑌𝑖𝐵 = 1378
12,25 = (Ʃ𝑌𝑖𝐶2 /8) – (13)2 → Ʃ𝑌𝑖𝐶2 = 1450
2 2
20,25 = (Ʃ𝑌𝑖𝐷 /8) – (15)2 → Ʃ𝑌𝑖𝐷 = 1962
ƩƩ𝑌𝑖𝑗2 = 954 + 1378 + 1450 + 1962 = 5744
FV SC gl MC F
Entre niveles 82 3 27,33 1,66
Dentro de niveles 460 28 16,43
Total 542 31
Como 1,66 < 2,95 no podemos rechazar la hipótesis nula del análisis de
varianza. No podemos considerar que haya diferencias en los tiempos que
tardan las ratas en recorrer el laberinto en función de los tiempos de
privación de alimentos, con un nivel de confianza del 95%.
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
SITUACIÓN 1: Con el objetivo de mejorar la función hepática, un investigador medico está interesado en la
tasa máxima de síntesis de urea en pacientes con cirrosis que experimentaron una operación estándar
(bypass no selectivo), un bypass selectivo para pacientes con una síntesis de urea menor de 40 (grupo
selectivo I) y un bypass selectivo para pacientes con una síntesis de urea superior a 40 (grupo selectivo II).
Cada uno de los tres grupos (bypass no selectivo, bypass selectivo Grupo I y bypass selectivo grupo II) estuvo
compuesto por 6 pacientes. Sabemos que: 𝑆𝐶𝐼𝑛𝑡𝑒𝑟 = 160,44 y que 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 710,66
2- ¿Qué supuestos debo verificar que se cumplen en este caso para aplicar el ANOVA? A) las observaciones
se distribuyen según la distribución F en los tres grupos; B) las varianzas de los tres grupos deben ser
similares; C) la distribución de las puntuaciones es asimétrica en los tres grupos.
3- Los grados de libertad del estadístico F de contraste para evaluar el efecto del “tipo de operación
médica” valen: A) (15; 3); B) (2; 15); C) (2; 18).
4- El estadístico de contraste F para evaluar el efecto del “tipo de operación médica” vale
aproximadamente: A) 1,693; B) 3,295; C) 0,392
5- Si trabajamos a un nivel de confianza del 95%, el valor crítico para contrastar la F del “tipo de operación
médica” valdrá: A)1,693; B) 3,682; C) 2,695
SITUACIÓN 2. Un agrónomo desea conocer el efecto que sobre el rendimiento de una variedad de trigo tiene
la adición de 3 tipos diferentes de fosfatos al terreno. Para ello parcela un terreno en 12 áreas del mismo
tamaño y trata cada cuatro parcelas con un tipo distinto de fosfato (A, B o C). A continuación siembra trigo
en cada uno de ellos y, después de la recolección, mide la cantidad de trigo producida por cada superficie
(en hectólitros por hectárea o hl/ha). Nivel de confianza: 95%. Sabemos que:
Y la siguiente tabla muestra el rendimiento obtenido en función del tipo de fosfato añadido.
Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50
1- Se trata de un diseño: A) de una muestra con 12 observaciones; B) de un factor con tres niveles (tipo de
fosfato); C) de un factor (parcela de terreno) con cuatro niveles.
3- Los grados de libertad del estadístico F de contraste valen: A) (3;9); B) (2;11); C) (2;9).
4 - El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato” vale aproximadamente: A)
6; B) 3,295; C) 0,392.
-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
5- El diseño presentado es: A) de efectos fijos; B) desequilibrado; C) las dos opciones anteriores son
incorrectas.
6- El modelo estadístico que podemos aplicar a estos datos es: A) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖 + 𝜀𝑖𝑗 ; B) 𝐸(𝑀𝐶𝐼𝑛𝑡𝑒𝑟 ) =
1
𝜎 2 + (𝐼−1) 𝑛𝑖 𝛼𝑖2; C) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖 + (𝛼𝜀)𝑖𝑗 + 𝜀𝑖𝑗
7- El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196, 192, 200}; C) {2/3, 2/3,
2/3}.
10- El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es superior en, aproximadamente,
6 veces a la MCInter; B) No, porque la SCintra es casi igual a la SCinter indicando que la variabilidad asociada al
tratamiento es casi idéntica a la del error; C) Sí, porque la F obtenida (6) es superior al valor crítico
𝐹2;9;0,05 = 4,256
11- ¿Entre qué niveles podemos asegurar que existen diferencias según CR de Scheffé? A) sólo entre los
niveles B y C; B) Sólo entre los niveles A y C; C) sólo entre los niveles A y B.
12- El diseño presentado no permite evaluar la interacción: A) porque el factor manipulado (tipo de
fertilizante) no puede interaccionar con ningún otro factor; B) porque tal interacción no ha sido incluida
en el modelo; C) porque sólo existe un factor manipulado y la interacción siempre se predica, como
mínimo, de dos factores.
SITUACIÓN 3. Un investigador sospecha que los tiempos de coagulación de la sangre difieren en función del
tipo de dieta. Para ello, ha realizado un experimento donde ha formado varios grupos de ratones,
sometiendo a cada grupo a distintos tipos de dietas. Tras analizar los datos mediante un ANOVA, parte de los
siguientes resultados:
3- La hipótesis nula planteada en este diseño es: A) 𝐻0 : 𝜇𝑖 = 𝜇𝑗 para todo 𝑖 ≠ 𝑗; B) 𝐻0 : 𝜇𝑖 ≠ 𝜇𝑗 para todo
𝑖 = 𝑗; C) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖𝑗 + 𝜀𝑖𝑗 .
5- Siendo 𝛼 = 0,05, el valor de la F crítica para el factor “Tipo de dieta” fue: A) 3,098; B) 2,380; C) 4,938.
-2-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
6- ¿Tendremos que realizar comparaciones a posteriori? A) Sí; B) No porque tenemos más de 2 niveles del
factor; C) No porque las comparaciones a posteriori solo se aplican en diseños intrasujetos.
7- Con un nivel de confianza del 95%, ¿Cuál será el valor mínimo de la diferencia entre dos medias
cualesquiera en este experimento para que resulten significativas según Scheffé (𝛼 = 0,05)? A) 12,39; B)
0,59; C) 4,17.
8- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a comparar deben de
cumplir el supuesto de: A) complementariedad y exhaustividad; B) homocedasticidad; C) independencia.
SITUACIÓN 4: Un fabricante de bolsas de papel está interesado en mejorar la resistencia a la tensión de las
mismas. El ingeniero piensa que la resistencia a la tensión es una función de la concentración de madera
frondosa (hardwood) en la pulpa con la que se hace el papel y que el rango de concentración de este tipo de
madera se encuentra entre el 5 y el 20%. Por ello, el equipo de ingenieros decide investigar cuatro niveles de
esta concentración: 5%, 10%, 15% y 20%. Deciden componer seis especímenes de test en cada nivel de
concentración. Los 24 especímenes se evalúan en el laboratorio para determinar su resistencia a la tensión
en orden aleatorio. En el informe los investigadores indican que “El factor Concentración fue significativo
[𝐹(3, 20) = 19,60, 𝑀𝐶𝑒𝑟𝑟𝑜𝑟 = 6,51, 𝑝 = 0,00000359]”
5- Dados los resultados obtenidos ¿deberían los ingenieros realizar pruebas de comparaciones múltiples o a
posteriori? A) sí ya que hay más de 2 grupos y la F ha resultado significativa; B) no son necesarias porque
la F ha resultado significativa; C) No, porque sólo tenemos cuatro grupos.
7- El investigador también podría haber sustituido en el informe el valor de p = 0,00000359 por: A) p <
0,0001; B) p > 0,001; C) p > 0,05.
8- Como el factor manipulado es una variable numérica (no categórica), también sería posible: A) realizar un
análisis categórico para estos datos; B) realizar un análisis cualitativo sobre cada nivel del factor; C)
realizar un análisis de regresión lineal simple sobre estos datos.
9- El cumplimiento del supuesto de homocedasticidad en este análisis: A) implicaría que la varianza de los
valores de resistencia a la tensión del papel son semejantes independientemente de la concentración de
madera frondosa; B) implicaría que las medias de tensión del papel condicionadas a la concentración de
madera frondosa siguen una función lineal; C) implicaría que las medias de tensión del papel
condicionadas a la concentración de madera frondosa siguen una distribución lineal.
-3-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
1- Se trata de un diseño factorial: A) 2x2 ya que se han manipulado los tratamientos (ejercicio y dieta) y el
tipo de carnet (clínica, club y ambos); B) desequilibrado; C) 3x2 ya que se ha manipulado el tipo de
tratamiento (con tres niveles) y el lugar de selección de las mujeres (con dos niveles).
2- El investigador ha informado que ninguno de los factores principales ha resultado significativo. Esto
significa que: A) la interacción no puede ser significativa; B) ni el lugar de selección de las mujeres ni el
tratamiento han resultado significativos; C) el experimento ha resultado fallido.
3- El investigador ha informado que la F de la interacción fue 4,722. De manera aproximada, y utilizando las
tablas correspondientes ¿ha resultado significativa?: A) No es posible saberlo sin conocer la media
cuadrática del error; B) Sí, ya que 4,722 es superior a 3,493; C) No porque, siendo cierta H0, la
probabilidad de obtener un valor de 4,722 o superior es superior a 0,05.
SITUACIÓN 6: Diversos estudios ponen de manifiesto que las enfermedades de tipo alérgico se ven
agravadas por la presencia de fuerte estrés. Además, la época del año parece afectar de forma decisiva a la
gravedad de los trastornos alérgicos. En un estudio se ha utilizado una muestra aleatoria de 5 pacientes
alérgicos (todos con el mismo tipo de alergia) sometidos a condiciones de alto estrés. Un grupo de
especialistas ha evaluado la gravedad de la alergia de cada paciente (en una escala de 0 a 10) en los cuatro
periodos estacionales: primavera, verano, otoño e invierno. Para analizar estos datos, el investigador utilizó
un ANOVA cuyas razones básicas aparecen a continuación (utilice un 𝛼 = 0,05):
1- Se trata de un diseño: A) factorial de 2 factores (estrés y estación del año); B) factorial de un factor con 4
niveles; C) factorial de 2 factores con 2 niveles cada uno.
3- La Media Cuadrática del error (en este caso, AxS) vale aproximadamente: A) 5; B) 21,67; C) 1,87.
4- La F crítica para evaluar el efecto del factor vale: A) 3,49; B) 4,474; C) 5,953.
-4-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
5- El informe de este trabajo debería realizarse de la siguiente manera: A) F(3; 12) = 11.56, MSe = 1,875, p
< 0,05; B) F(3; 12) = 0,05, MSe = 11,59, p > 0,10; C) F(12; 3) = 11,59, MSe = 21,67, p = 0,05.
6- El análisis de los datos nos indicaron una potencia de 0.99 para el factor “Periodo estacional”. Esto
significa que: A) Como el valor es cercano a la unidad, no existen diferencias en la gravedad de la alergia
en función del periodo estacional; B) debemos realizar contrastes a posteriori; C) La probabilidad de
rechazar la hipótesis nula H 0 : Pr imavera Verano Otoño Invierno siendo esta falsa vale 0,99.
8- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede adoptar valores
negativos porque: A) los valores de la ordenada (eje vertical) son todos positivos; B) toda distribución de
densidad de probabilidad se estandariza para que tenga un área igual a la unidad; C) es el cociente entre
dos varianzas y estas son siempre positivas.
1- El diseño es: A) de medidas repetidas 2x3; B) de dos factores inter-sujetos 2x3; C) de un factor intersujeto
con tres niveles.
-5-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7
3- Los valores de las MC para los efectos principales valen: A) 33,19 y 90392,1; B) 29019,3 y 29993,10; C)
1013,361 y 116,583.
5- El valor F para el factor Grupo (experimental vs. placebo) es: A) 17,174; B) 1,058; C) 3,392.
6- El valor F para el factor Tipo de Usuario de Marihuana es: A) 1,976; B) 5,302; C) 9,992.
7- Las comparaciones “a posteriori” para el factor Grupo: A) no son necesarias ya que este factor sólo tiene
2 niveles y la F ya nos indica que las medias son diferentes entre sí; B) son necesarias ya que la F ha
resultado significativa; C) se aplican sólo cuando la interacción es significativa.
8- Con respecto a la interacción: A) habrá que analizarla mediante los 5 efectos simples; B) no se debe
realizar un análisis de efectos simples porque la interacción no es significativa; C) la interacción muestra
que los sujetos sin experiencia previa del grupo experimental difiere significativamente de los otros dos
grupos de usuarios en el grupo experimental, pero no en el placebo.
9- El experimentador debe concluir que: A) los sujetos que tienen experiencia infrecuente y frecuente con la
marihuana tienen una respuesta diferente a los sujetos que no han tenido experiencia previa; B) el
tiempo de respuesta es superior cuando los sujetos han fumado marihuana que cuando no lo han hecho,
y este resultado no se muestra afectado por la experiencia previa del usuario con esta droga; C) la
experiencia con la marihuana no afecta a los sujetos que toman la droga placebo, pero afecta
notablemente a los sujetos sin ningún tipo de experiencia con la marihuana.
-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
SITUACIÓN 1: Con el objetivo de mejorar la función hepática, un investigador medico está interesado en la
tasa máxima de síntesis de urea en pacientes con cirrosis que experimentaron una operación estándar
(bypass no selectivo), un bypass selectivo para pacientes con una síntesis de urea menor de 40 (grupo
selectivo I) y un bypass selectivo para pacientes con una síntesis de urea superior a 40 (grupo selectivo II).
Cada uno de los tres grupos (bypass no selectivo, bypass selectivo Grupo I y bypass selectivo grupo II) estuvo
compuesto por 6 pacientes. Sabemos que: y que
Tenemos que aplicar un análisis de la varianza para tres muestras independientes con tres niveles
con 6 sujetos en cada uno de ellos . El número total de sujetos es: .
Con estos datos y las sumas de cuadrados del enunciado, completamos fácilmente la tabla de
ANOVA.
FV SC g.l. MC F
Factor
Error
Total
B)
C)
2- ¿Qué supuestos debo verificar que se cumplen en este caso para aplicar el ANOVA? A) las observaciones
se distribuyen según la distribución F en los tres grupos; B) las varianzas de los tres grupos deben ser
similares; C) la distribución de las puntuaciones es asimétrica en los tres grupos.
3- Los grados de libertad del estadístico F de contraste para evaluar el efecto del “tipo de operación
médica” valen: A) (15, 3); B) (2, 15); C) (2, 18).
4- El estadístico de contraste F para evaluar el efecto del “tipo de operación médica” vale
aproximadamente: A) 1.693; B) 3.295; C) 0.392
5- Si trabajamos a un nivel de confianza del 95%, el valor crítico para contrastar la F del “tipo de operación
médica” valdrá: A)1.693; B) 3.682; C) 2.695
Buscamos en la tabla F de Fisher para 2 y 15 grados de libertad la puntuación que supera una proporción
igual a 0,95 (nivel de confianza).
-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
SITUACIÓN 2. Un agrónomo desea conocer el efecto que sobre el rendimiento de una variedad de trigo tiene
la adición de 3 tipos diferentes de fosfatos al terreno. Para ello parcela un terreno en 12 áreas del mismo
tamaño y trata cada cuatro parcelas con un tipo distinto de fosfato (A, B o C). A continuación siembra trigo
en cada uno de ellos y, después de la recolección, mide la cantidad de trigo producida por cada superficie
(en hectólitros por hectárea o hl/ha). Nivel de confianza: 95%. Sabemos que:
Y la siguiente tabla muestra el rendimiento obtenido en función del tipo de fosfato añadido.
Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50
Tenemos un factor con tres niveles , en el que en cada nivel hay 4 observaciones . Las
muestras son independientes. Fácilmente construimos la tabla de ANOVA.
SC gl MC F
Entre niveles
Dentro niveles
Total
1- Se trata de un diseño: A) de una muestra con 12 observaciones; B) de un factor con tres niveles (tipo de
fosfato); C) de un factor (parcela de terreno) con cuatro niveles.
2- La hipótesis nula es A) ; B) ; C)
La hipótesis nula ha de postular la igualdad de las medias en todos los niveles, luego la opción
correcta es B.
3- Los grados de libertad del estadístico F de contraste valen: A) (3,9); B) (2,11); C) (2,9).
4 - El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato” vale aproximadamente: A)
6; B) 3.295; C) 0.392.
5- El diseño presentado es: A) de efectos fijos; B) desequilibrado ; C) las dos opciones anteriores son
incorrectas.
Se trata de un diseño de efectos fijos. No puede ser desequilibrado ya que hay 4 terrenos o parcelas
para cada tipo de fertilizante (lo cual indicaría que es equilibrado). Solo nos interesan estos
fertilizantes (A, B y C), ningún otro.
-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
La opción B no es un modelo sino la expresión del valor esperado de la Media Cuadrática Inter. La
expresión C es incorrecta ya que asume la interacción entre los errores y los niveles del tratamiento.
La opción correcta es la A ya que expresa cada puntuación de la variable dependiente (Yij) como la
suma de tres componentes: una media global común ( ), el efecto del factor del terreno concreto
del que estemos hablando y un error aleatorio
7- El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196, 192, 200}; C) {2/3, 2/3,
2/3}.
Para obtener el rendimiento medio para los diferentes tratamientos simplemente calculamos la
media de cada fertilizante:
10- El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es superior en, aproximadamente,
6 veces a la MCInter; B) No, porque la SCintra es casi igual a la SCinter indicando que la variabilidad asociada al
tratamiento es casi idéntica a la del error; C) Sí, porque la F obtenida (6) es superior al valor crítico
11- ¿Entre qué niveles podemos asegurar que existen diferencias según CR de Scheffé? A) sólo entre los
niveles B y C; B) Sólo entre los niveles A y C; C) sólo entre los niveles A y B.
Aplicamos la fórmula de la CR de Scheffé (como nos piden asegurar entre qué niveles existen
diferencias, ponemos los coeficientes típicos para la comparación entre dos niveles dejando el tercero
sin incluir):
√ √ ⁄ [∑ ( ⁄ )]
√ √ ⁄ ⁄
Ahora realizamos las diferencias (en valor absoluto) entre las tres medias:
| ̅ ̅| | |
| ̅ ̅| | |
|̅ ̅| | |
-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
12- El diseño presentado no permite evaluar la interacción: A) porque el factor manipulado (tipo de
fertilizante) no puede interaccionar con ningún otro factor; B) porque tal interacción no ha sido incluida
en el modelo; C) porque sólo existe un factor manipulado y la interacción siempre se predica, como
mínimo, de dos factores.
SITUACIÓN 3. Un investigador sospecha que los tiempos de coagulación de la sangre difieren en función del
tipo de dieta. Para ello, ha realizado un experimento donde ha formado varios grupos de ratones,
sometiendo a cada grupo a distintos tipos de dietas. Tras analizar los datos mediante un ANOVA, parte de los
siguientes resultados:
Conociendo los grados de libertad, deducimos el número de niveles, el número de sujetos en cada
nivel y número total de sujetos:
Total 340 23
3- La hipótesis nula planteada en este diseño es: A) para todo ; B) para todo
; C) .
5- Siendo 0.05 , el valor de la F crítica para el factor “Tipo de dieta” fue: A) 3,098; B) 2,380; C) 4,938.
Para un nivel de confianza del 95%, mirando en las tablas F de Fisher para 3 y 20 grados de libertad,
observamos que la F crítica es: 3,098, luego la alternativa correcta es “A”.
6- ¿Tendremos que realizar comparaciones a posteriori? A) Sí; B) No porque tenemos más de 2 niveles del
factor; C) No porque las comparaciones a posteriori solo se aplican en diseños intrasujetos.
-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
Tendremos que hacer comparaciones “a posteriori” porque hemos rechazado la hipótesis nula que
planteaba la igualdad entre las medias .
7- Con un nivel de confianza del 95%, ¿Cuál será el valor mínimo de la diferencia entre dos medias
cualesquiera en este experimento para que resulten significativas según Scheffé ( 0,05)? A) 12,39; B)
0,59; C) 4,17.
Como el modelo es equilibrado es igual para todas las diferencias entre pares de medias, dado
que:
∑( ⁄ ) ( ⁄ ) ( ⁄ ) ⁄
√ √ ⁄ [∑ ( ⁄ )]
√ √ ( ⁄ )
8- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a comparar deben de
cumplir el supuesto de: A) complementariedad y exhaustividad; B) homocedasticidad; C) independencia.
SITUACIÓN 4: Un fabricante de bolsas de papel está interesado en mejorar la resistencia a la tensión de las
mismas. El ingeniero piensa que la resistencia a la tensión es una función de la concentración de madera
frondosa (hardwood) en la pulpa con la que se hace el papel y que el rango de concentración de este tipo de
madera se encuentra entre el 5 y el 20%. Por ello, el equipo de ingenieros decide investigar cuatro niveles de
esta concentración: 5%, 10%, 15% y 20%. Deciden componer seis especímenes de test en cada nivel de
concentración. Los 24 especímenes se evalúan en el laboratorio para determinar su resistencia a la tensión
en orden aleatorio. En el informe los investigadores indican que “El factor Concentración fue significativo
[ , , ]”
-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
⁄ ⁄
⁄ ⁄
5- Dados los resultados obtenidos ¿deberían los ingenieros realizar pruebas de comparaciones múltiples o a
posteriori? A) sí ya que hay más de 2 grupos y la F ha resultado significativa; B) no son necesarias porque
la F ha resultado significativa; C) No, porque sólo tenemos cuatro grupos.
7- El investigador también podría haber sustituido en el informe el valor de p = 0,00000359 por: A) p <
0,0001; B) p > 0,001; C) p > 0,05.
8- Como el factor manipulado es una variable numérica (no categórica), también sería posible: A) realizar un
análisis categórico para estos datos; B) realizar un análisis cualitativo sobre cada nivel del factor; C)
realizar un análisis de regresión lineal simple sobre estos datos.
9- El cumplimiento del supuesto de homocedasticidad en este análisis: A) implicaría que la varianza de los
valores de resistencia a la tensión del papel son semejantes independientemente de la concentración
de madera frondosa; B) implicaría que las medias de tensión del papel condicionadas a la concentración
-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
de madera frondosa siguen una función lineal; C) implicaría que las medias de tensión del papel
condicionadas a la concentración de madera frondosa siguen una distribución lineal.
1- Se trata de un diseño factorial: A) 2x2 ya que se han manipulado los tratamientos (ejercicio y dieta) y el
tipo de carnet (clínica, club y ambos); B) desequilibrado; C) 3x2 ya que se ha manipulado el tipo de
tratamiento (con tres niveles) y el lugar de selección de las mujeres (con dos niveles).
El primer factor es el tipo de tratamiento con tres niveles (ejercicio, dieta y ejercicio+dieta) y el
segundo es el lugar con dos niveles (mujeres extraídas de la planta de manufactura y mujeres
extraídas de Secretaría). Luego se trata de un diseño intersujetos 3x2. El diseño está equilibrado
porque hay 5 mujeres en cada combinación de tratamiento con planta.
2- El investigador ha informado que ninguno de los factores principales ha resultado significativo. Esto
significa que: A) la interacción no puede ser significativa; B) ni el lugar de selección de las mujeres ni el
tratamiento han resultado significativos; C) el experimento ha resultado fallido.
Con la frase inicial (ninguno de los factores principales ha resultado significativo) lo único que
podemos concluir es que ninguno de los factores ha alcanzado la significatividad (ninguno ha
afectado a la pérdida de peso de las mujeres). No sabemos nada de la interacción (no nos lo han
dicho y de la afirmación realizada no podemos deducir nada ya que la significatividad de los factores
principales no nos dice nada sobre la significatividad de la interacción). Un experimento no resulta
fallido por sus resultados.
3- El investigador ha informado que la F de la interacción fue 4.722. De manera aproximada, y utilizando las
tablas correspondientes ¿ha resultado significativa?: A) No es posible saberlo sin conocer la media
cuadrática del error; B) Sí, ya que 4.722 es superior a 3.493; C) No porque, siendo cierta H0, la
probabilidad de obtener un valor de 4.722 o superior es superior a 0.05.
-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
Comparamos el estadístico de contraste ( ) con el valor crítico. Los grados de libertad son 2
y 24. Si sólo utilizamos las tablas buscamos con 2 y 20 grados de libertad, obteniendo un valor:
. Dado que: , existen diferencias significativas entre al menos un par
de medias.
SITUACIÓN 6: Diversos estudios ponen de manifiesto que las enfermedades de tipo alérgico se ven
agravadas por la presencia de fuerte estrés. Además, la época del año parece afectar de forma decisiva a la
gravedad de los trastornos alérgicos. En un estudio se ha utilizado una muestra aleatoria de 5 pacientes
alérgicos (todos con el mismo tipo de alergia) sometidos a condiciones de alto estrés. Un grupo de
especialistas ha evaluado la gravedad de la alergia de cada paciente (en una escala de 0 a 10) en los cuatro
periodos estacionales: primavera, verano, otoño e invierno. Para analizar estos datos, el investigador utilizó
un ANOVA cuyas razones básicas aparecen a continuación (utilice un 0,05 ):
Tenemos un diseño de un factor de medidas repetidas con cuatro niveles (periodos estacionales) y
cinco sujetos. En primer lugar calculamos las sumas de cuadrados a partir de las razones básicas:
[ ] [ ]
[ ] [ ]
[ ] [ ]
FV SC g.l. MC F
A 65 21,67 11,5573
S 7,5 1,875
AxS 22,5 12 1,875
T 95 5
1- Se trata de un diseño: A) factorial de 2 factores (estrés y estación del año); B) factorial de un factor con 4
niveles; C) factorial de 2 factores con 2 niveles cada uno.
3- La Media Cuadrática del error (en este caso, AxS) vale aproximadamente: A) 5; B) 21.67; C) 1.87.
4- La F crítica para evaluar el efecto del factor vale: A) 3.49; B) 4.474; C) 5.953.
Buscando en las Tablas F de Fisher para 3 y 12 grados de libertad, observamos que la respuesta
correcta es A.
-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7
5- El informe de este trabajo debería realizarse de la siguiente manera: A) F(3, 12) = 11.56, MSe = 1.875, p
< 0.05; B) F(3, 12) = 0.05, MSe = 11.59, p > 0.10; C) F(12, 3) = 11.59, MSe = 21.67, p = 0.05.
6- El análisis de los datos nos indicaron una potencia de 0.99 para el factor “Periodo estacional”. Esto
significa que: A) Como el valor es cercano a la unidad, no existen diferencias en la gravedad de la alergia
en función del periodo estacional; B) debemos realizar contrastes a posteriori; C) La probabilidad de
rechazar la hipótesis nula H 0 : Pr imavera Verano Otoño Invierno siendo esta falsa vale 0.99.
8- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede adoptar valores
negativos porque: A) los valores de la ordenada (eje vertical) son todos positivos; B) toda distribución de
densidad de probabilidad se estandariza para que tenga un área igual a la unidad; C) es el cociente entre
dos varianzas y estas son siempre positivas.
-9-
Diseños de investigación y análisis de datos. Ejercicios Tema 8
SITUACIÓN 1. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final del curso (Y) y la obtenida en el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:
SITUACIÓN 2. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final de curso (Y) y la obtenida el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:
-1-
Diseños de investigación y análisis de datos. Ejercicios Tema 8
5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
son independientes; B) las distribuciones condicionadas de los errores deben de tener una
distribución uniforme; C) no deben estar relacionadas las variables predictora y la variable
dependiente o criterio.
SITUACIÓN 3. Anscombe (1973) presentó cuatro conjuntos de datos artificiales que tenían la
misma recta de regresión pero eran claramente diferentes. En la Figura 1 se puede ver uno de
estos conjuntos de datos (11 pares de datos) junto con la recta de regresión que mejor ajusta por
el criterio de mínimos cuadrados.
𝑆𝑥 = 3,316
𝑆𝑦 = 2,030
𝑟𝑥𝑦 = 0,816
𝛼 = 0,05
-2-
Diseños de investigación y análisis de datos. Ejercicios Tema 8
SITUACIÓN 4. Los siguientes datos relacionan el número de cigarrillos diarios (X) consumidos con
el número de radicales libres (Y) localizados en los pulmones de 8 individuos:
2 2
Sujeto X Y XY X Y
1 0 94 0 0 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
Sumatorio 137 1735 39218 3545 452493
Des. Típica 12,24 97,60
rxy = 0,99
-3-
Diseños de investigación y análisis de datos. Ejercicios Tema 8
10- En un modelo de regresión múltiple, el cálculo de las correlaciones de orden cero: A) implica el
cálculo de la regresión entre las variables independientes y, posteriormente, la extracción de los
residuos; B) no nos permite saber qué parte de la varianza de la VD es capaz de explicar
independientemente cada una de las VI’s; C) nos permite hallar relaciones bivariadas puras.
Sujetos X Y
1 6 8
SITUACIÓN 5. Un psicólogo escolar considera que la 2 4 3
comprensión lectora es un elemento que juega un papel 3 7 8
fundamental en el éxito académico de los estudiantes. Para 4 3 4
comprobar su hipótesis, selecciona aleatoriamente un grupo 5 5 4
de 16 estudiantes de 4º de la ESO a los que aplica un test de 6 9 10
comprensión lectora (X). A continuación, y en coordinación 7 7 7
con el profesor de ciencias sociales, se les aplica una prueba 8 4 5
sobre un tema de historia (Y) que acaban de estudiar, 9 2 4
10 5 2
consistiendo dicha prueba en una serie de preguntas sobre un
11 8 7
texto básico que tienen que leer y que está relacionado con el
12 9 9
tema estudiado. 13 10 8
14 6 6
15 3 5
16 1 3
-4-
Diseños de investigación y análisis de datos. Ejercicios Tema 8
nivel de significación de 0,01 existe relación entre X e Y; C) para un nivel de significación de 0,05
existe relación entre X e Y, pero no para un nivel de significación de 0,01.
8- El valor más aproximado del estadístico de contraste para la pendiente de regresión es: A) 5,407;
B) 1,996; C) 0,743.
9- Para un nivel de significación de 0,05, los límites del intervalo de confianza para la pendiente de la
regresión son: A) (-0,125; 3,487); B) (-0,125; 1,037); C) (0,448; 1,037).
10- Teniendo en cuenta los límites del intervalo de confianza obtenido para la pendiente de la
regresión, podemos decir que, a un nivel de significación de 0,05: A) se acepta la hipótesis
alternativa según la cual existe relación entre X e Y, ya que el intervalo de confianza no incluye el
valor cero; B) se acepta la hipótesis nula según la cual no existe relación entre X e Y, ya que el
intervalo de confianza incluye el valor cero; C) se acepta la hipótesis nula según la cual no existe
relación entre X e Y, ya que el intervalo de confianza no incluye el valor cero.
3- En regresión lineal simple, se asume que la desviación típica del error en la ecuación 𝑌 = 𝑎 +
𝑏 𝑋 + 𝜖 : A) es igual a la unidad; B) es la misma para cada valor particular de X; C) es igual a 0.
5- El estadístico de la Tabla del Anova para poner a prueba si la Regresión como fuente de variación
es significativa vale aproximadamente: A) 19,0; B) 1,2; C) 2,1.
7- El intervalo de confianza para contrastar la pendiente vale: A) (0’38, 0’06); B) (-0’15, +0’15); C) (-
0’32, -0’15).
-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
SITUACIÓN 1. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final del curso (Y) y la obtenida en el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:
23,778
𝑈 = 28,097 + 23,778 = 51,875 𝑇= = 3,963
6
28,097
𝑉= = 7,09
3,963
2- ¿Cuál es la varianza muestral insesgada de la calificación de los estudiantes (Y) al final del curso?:
A) 51,875; B) 7,411; C) 3,397.
∑(𝑌 − 𝑌̅)2
𝑆̂𝑦2 =
𝑛−1
Que podemos calcular con la tabla de ANOVA, dado que es igual a la media cuadrática total.
-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
2
𝑆𝐶𝑟𝑒𝑔 28,097
𝑟𝑥𝑦 = = = 0,542
𝑆𝐶𝑌 51,875
4- Con un nivel de confianza del 95%, ¿cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que no hay relación lineal significativa entre X e Y?: A) 5,987; B) 5,59; C)
6,608.
Consultando las tablas F para 1 y 6 grados de libertad comprobamos que la puntuación 5,987
supera una proporción igual a 5,987.
5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
están correlacionados; B) las distribuciones condicionadas de los errores deben de tener una
distribución normal; C) No deben estar relacionadas la variables predictora y la variable
dependiente o criterio.
SITUACIÓN 2. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final de curso (Y) y la obtenida el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:
SC gl MC F
Regresión 42,734 1 42,734 17,345
Residual 22,175 9 2,4639
Total 64,909 10
La varianza muestral insesgada de los errores del modelo de regresión coincide con la media
cuadrática residual.
-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
2- ¿Con un nivel de confianza del 95%, cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que hay no relación lineal significativa entre Y y X?; A) 5,117; B) 5,59; C)
6,608.
Buscando en las tablas F de Fisher para 1 y 9 grados de libertad, comprobamos que la respuesta
correcta es A.
42,734
𝑟𝑥𝑦 = √ = ±0,811
64,909
Suponemos que la relación entre la calificación obtenida a final del curso y la obtenida en el curso
anterior es directa, por lo que: 𝑟𝑥𝑦 = 0,811
5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
son independientes; B) las distribuciones condicionadas de los errores deben de tener una
distribución uniforme; C) no deben estar relacionadas las variables predictora y la variable
dependiente o criterio.
-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
SITUACIÓN 3. Anscombe (1973) presentó cuatro conjuntos de datos artificiales que tenían la
misma recta de regresión pero eran claramente diferentes. En la Figura 1 se puede ver uno de
estos conjuntos de datos (11 pares de datos) junto con la recta de regresión que mejor ajusta por
el criterio de mínimos cuadrados.
𝑆𝑥 = 3,316
𝑆𝑦 = 2,030
𝑟𝑥𝑦 = 0,816
𝛼 = 0,05
2. La recta de regresión no pasa exactamente por ningún punto porque: A) existe un valor atípico o
extremo; B) aunque la variabilidad es pequeña en este conjunto de datos, siempre existe una
cierta cantidad de ella que impide que el ajuste sea perfecto; C) el ajuste por mínimos cuadrados
está mal realizado.
Debemos observar que todos los puntos dados se sitúan exactamente de forma lineal entre sí. La
recta de regresión dibujada ha sido “alejada” debido a la influencia del valor “outlier” o extremo
en X = 13. Si no existiera este valor, la recta calculada habría pasado exactamente por el resto de
puntos. Luego la opción correcta es la A. La opción B es irrelevante en relación a la pregunta
planteada. La opción C es falsa ya que el ajuste por mínimos cuadrados se realizó correctamente
por Anscombe.
-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
𝑆𝑦 2,030
𝐵 = 𝑟𝑥𝑦 = 0,816 ∙ = 0,499542
𝑆𝑥 3,316
4. Si eliminamos el dato atípico que aparece en la gráfica (X10=13, Y10=12,74), el valor de rXY sería: A)
0,4992 = 0,249; B) igual al coeficiente de determinación; C) la unidad porque el ajuste sería
perfecto.
En este caso, el ajuste sería perfecto ya que todos los puntos se sitúan sobre una línea recta. Si
este es el caso, el ajuste sería perfecto (no habría error).
5. Si el valor de R2 es 0,666 esto significa que: A) también el error típico (𝜎𝜀 ) es de 0,666; B) la parte
de la variabilidad en Y atribuible a otros factores no relacionados linealmente con Y es de 0,666;
C) el porcentaje en que se reduce el error de Y cuando empleamos la recta de regresión para su
estimación es del 66,6%.
El componente del modelo representa el error que todavía queda cuando aplicamos la
pendiente y el punto de corte con la ordenada. Por consiguiente, representa la aportación de las
variables extrañas al experimento. Opción correcta C.
7. El análisis de la regresión para los datos de la Figura nos indicó que la regresión fue significativa
[F(1, 9) = 17,972, MCres = 1,528, p = 0,002]. Luego sabemos que el valor de t con 9 grados de
libertad fue aproximadamente: A) 4,24; B) 321,12; C) 0.
Una F y una t se relacionan según la fórmula: 𝑇𝑛2 = 𝐹1,𝑛 . Luego como sabemos que F1,9 = 17,972, el
valor de t será: √17,972 = 4,239
-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
SITUACIÓN 4. Los siguientes datos relacionan el número de cigarrillos diarios (X) consumidos con
el número de radicales libres (Y) localizados en los pulmones de 8 individuos:
2 2
Sujeto X Y XY X Y
1 0 94 0 0 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
Sumatorio 137 1735 39218 3545 452493
Des. Típica 12,24 97,60
rxy = 0,99
-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
2
𝑆𝑦 1 − 𝑟𝑥𝑦 97,60 1 − 0,992
𝜎𝐵 = √ = √ = 0,46
𝑆𝑥 𝑛 − 2 12,24 6
10- En un modelo de regresión múltiple, el cálculo de las correlaciones de orden cero: A) implica el
cálculo de la regresión entre las variables independientes y, posteriormente, la extracción de los
residuos; B) no nos permite saber qué parte de la varianza de la VD es capaz de explicar
independientemente cada una de las VI’s; C) nos permite hallar relaciones bivariadas puras.
Sujetos X Y
1 6 8
SITUACIÓN 5. Un psicólogo escolar considera que la 2 4 3
comprensión lectora es un elemento que juega un papel 3 7 8
fundamental en el éxito académico de los estudiantes. Para 4 3 4
comprobar su hipótesis, selecciona aleatoriamente un grupo 5 5 4
de 16 estudiantes de 4º de la ESO a los que aplica un test de 6 9 10
comprensión lectora (X). A continuación, y en coordinación 7 7 7
con el profesor de ciencias sociales, se les aplica una prueba 8 4 5
sobre un tema de historia (Y) que acaban de estudiar, 9 2 4
10 5 2
consistiendo dicha prueba en una serie de preguntas sobre un
11 8 7
texto básico que tienen que leer y que está relacionado con el 12 9 9
tema estudiado. 13 10 8
14 6 6
15 3 5
16 1 3
-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
Sujetos X Y X2 Y2 XY
1 6 8 36 64 48
∑ 𝑋2 ∑ 𝑌2
2 4 3 16 9 12 𝑆𝑥2 = 𝑛
− 𝑋̅ 2 = 6,621; 𝑆𝑦2 = 𝑛
− 𝑌̅ 2 = 5,402
3 7 8 49 64 56
4 3 4 9 16 12 𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌
5 5 4 25 16 20 𝑟𝑥𝑦 = = 0,822
6 9 10 81 100 90 √[𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 ][𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ]
7 7 7 49 49 49
8 4 5 16 25 20
9 2 4 4 16 8 𝒓𝟐𝒙𝒚 = 𝟎, 𝟖𝟐𝟐𝟐 = 𝟎, 𝟔𝟕𝟔
10 5 2 25 4 10
11 8 7 64 49 56 𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 𝑆𝑦
𝐵= 2 2
= 𝑟𝑥𝑦 = 0,743
12 9 9 81 81 81 𝑛 ∑ 𝑋 − (∑ 𝑋) 𝑆𝑥
13 10 8 100 64 80
14 6 6 36 36 36
15 3 5 9 25 15
𝐵0 = 𝑌̅ − 𝐵𝑋̅ = 1,681
16 1 3 1 9 3
Sumas 89 93 601 627 596
También podemos calcular 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 con la fórmula utilizada en los temas de ANOVA:
(∑ 𝑌𝑖 )2 932
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑌𝑖2 − = [𝑌] − [𝑇] = 627 − = 86,4375
𝑛 16
2
Dado que el coeficiente de determinación es igual a: 𝑟𝑥𝑦 = 0,676, la suma de cuadrados debida a
2
la regresión es: 𝑆𝐶𝑅𝑒𝑔 = 𝑟𝑥𝑦 ∙ 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 0,676 ∙ 86,4375 = 58,447
FV SC gl MC F
Regres. 58,447 1 58,447 29,233
Residual 27,991 14 1,999
Total 86,438 15
-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
𝐹 = 𝑇 2 → 𝑇 = √𝐹 = √29,233 = 5,407
9- Para un nivel de significación de 0,05, los límites del intervalo de confianza para la pendiente de la
regresión son: A) (-0,125; 3,487); B) (-0,125; 1,037); C) (0,448; 1,037)
2
𝑆𝑦 1 − 𝑟𝑥𝑦 2,324 1 − 0,676
𝐸𝑚𝑎𝑥 = 𝑡𝑛−2;1−𝛼⁄2 𝜎𝐵 = 𝑡𝑛−2;1−𝛼⁄2 √ = 2,145 √ = 0,2947
𝑆𝑥 𝑛 − 2 2,573 16 − 2
1,037
0,743 ± 0,2947 → {
0,448
10- Teniendo en cuenta los límites del intervalo de confianza obtenido para la pendiente de la
regresión, podemos decir que, a un nivel de significación de 0,05: A) se acepta la hipótesis
alternativa según la cual existe relación entre X e Y, ya que el intervalo de confianza no incluye
el valor cero; B) se acepta la hipótesis nula según la cual no existe relación entre X e Y, ya que el
intervalo de confianza incluye el valor cero; C) se acepta la hipótesis nula según la cual no existe
relación entre X e Y, ya que el intervalo de confianza no incluye el valor cero.
-9-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8
3- En regresión lineal simple, se asume que la desviación típica del error en la ecuación 𝑌 = 𝑎 +
𝑏 𝑋 + 𝜖 : A) es igual a la unidad; B) es la misma para cada valor particular de X; C) es igual a 0.
𝑆𝑦 1,87
𝐵 = 𝑟𝑥𝑦 → 0,22 = 𝑟𝑥𝑦 → 𝑟𝑥𝑦 = 0,929
𝑆𝑥 7,90
𝑟𝑥𝑦 √𝑛 − 2 0,929√5 − 2
𝑡𝑛−2 = = = 4,36
√1 − 2
𝑟𝑥𝑦 √1 − 0,9292
5- El estadístico de la Tabla del Anova para poner a prueba si la Regresión como fuente de variación
es significativa vale aproximadamente: A) 19,0; B) 1,2; C) 2,1.
𝑡 2 = 𝐹 → 𝐹 = 4,362 = 19,01
7- El intervalo de confianza para contrastar la pendiente vale: A) (0’38, 0’06); B) (-0’15, +0’15); C) (-
0’32, -0’15).
2
𝑆𝑦 1 − 𝑟𝑥𝑦 1,87 1 − 0,9292 0,38
𝐵 ± 𝑡1−𝛼⁄ ( √ ) → 0,22 ± 3,182 ∙ √ →{
2,𝑛−2 𝑆𝑥 𝑛 − 2 7,90 5−2 0,06
-10-
RECOPILACIÓN EXÁMENES de 2011 a 2020 con respuestas marcadas
"DISEÑOS DE INVESTIGACIÓN y ANÁLISIS DE DATOS "- 2º CURSO
Yogui del Pirineo
Trabajamos con una variable con un nivel de medida de razón y suponemos que la
distribución en la población es normal, por lo que el contraste es paramétrico, por otro
lado el contraste es unilateral derecho, luego las opciones B) y C) no son correctas.
1
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A
5- El estadístico de contraste para poner a prueba la media es: A) 2,102; B) 1,78; C) 1,59.
6- Conforme a los objetivos del investigador y un “alfa”= 0’05, la máxima diferencia que
puede producirse por simple azar, si H0 es cierta, entre la media observada en la
muestra y la media planteada en la hipótesis nula, expresado en unidades de
desviación típica es: A) 2,064; B) 1,711; C) 2,79.
El enunciado se refiere al valor crítico. Buscando en la tabla “t” de Student para 24 g.l.
y NC = 95%, observamos que la respuesta correcta es B.
SITUACIÓN 2. Se pretende comprobar si los profesionales que llevan menos de cinco años en
una empresa (Grupo 1) poseen mayores aspiraciones que las personas que llevan cinco o más
años (Grupo 2). Para ello se entrevista a 32 personas que llevan menos de cinco años y a otras
32 personas que llevan cinco o más años, todas ellas elegidas al azar. Los resultados mostraron
que dentro del primer grupo se identificó a 18 personas con altas aspiraciones, mientras que
en el segundo grupo se identificaron a 14 personas con altas aspiraciones. Nivel de confianza
95%.
2
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A
La respuesta correcta es C)
Buscando en la tabla de curva normal la puntuación típica que supera el 95% de las
observaciones, comprobamos que la respuesta correcta es A).
12- La decisión correcta es: A) Rechazar la hipótesis nula porque el nivel p-crítico es menor
que el nivel de significación; B) Mantener la hipótesis nula porque el estadístico de
contraste es menor que el valor crítico; C) ninguna de las anteriores es correcta.
3
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A
13- A un nivel de confianza del 95% concluimos que: A) los profesionales que llevan menos
de cinco años trabajando poseen mayores aspiraciones que el grupo que lleva
trabajando 5 o más años; B) los profesionales que llevan 5 o más años trabajando
poseen mayores aspiraciones que el grupo que lleva menos de 5 años; C) no existen
diferencias en cuanto a las aspiraciones profesionales entre los dos grupos.
14- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en
muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas; C) ninguna de las anteriores es correcta.
15- Para aplicar el test de Wilcoxon, además de que la variable dependiente esté medida a
nivel ordinal, también se requiere: A) no son necesarios más supuestos; B) la
distribución de las diferencias de los rangos ha de ser simétrica; C) la distribución de
las diferencias ha de ser normal.
4
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A
FV SC g.l. MC F F tabla
Entre niveles 160,44 I-1 = 3-1 = 2 80,22
Dentro de niveles 710,66 N-I = 18-3 = 15 47,377 1,693 3,682
Total N-1 = 17
La respuesta correcta es B). Por otro lado, es la única posible, pues es la única, entre las
tres opciones que postula la igualdad de las tres medias.
17- ¿Qué supuestos debo verificar que se cumplen en este caso para aplicar el ANOVA? A)
las observaciones se distribuyen según la distribución F en los tres grupos; B) las
varianzas de los tres grupos deben ser similares; C) la distribución de las puntuaciones
es asimétrica en los tres grupos.
18- Los grados de libertad del estadístico F de contraste para evaluar el efecto del “tipo de
operación médica” valen: A) (15, 3); B) (2, 15); C) (2, 18).
La respuesta correcta es B). Por ejemplo, página 213 del libro de texto.
19- El estadístico de contraste F para evaluar el efecto del “tipo de operación médica” vale
aproximadamente: A) 1.693; B) 3.295; C) 0.392.
20- Si trabajamos a un nivel de confianza del 95%, el valor crítico para contrastar la F del
“tipo de operación médica” valdrá: A) 1.693; B) 3.682; C) 2.695.
SITUACIÓN 4. En un colegio se estudia la relación que puede existir entre la calificación global
de de los estudiantes al final del curso (Y) y la obtenida en el curso anterior (X). Efectuado un
análisis de regresión, con una muestra de estudiantes, la prueba para determinar la
significación del modelo de regresión ajustado es la siguiente:
5
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A
SC GL MC F Prob.
Residual 23,778 6 T
Total U
FV SC g.l. MC F
Regresión 28,097 1 28,097
Residual 23,778 6 3,963 7,0898
Total 51,875 7 7,4107
Dado que los grados de libertad totales son , el tamaño de la muestra es:
22- ¿Cuál es la varianza muestral insesgada de la calificación de los estudiantes (Y) al final
del curso?: A) 51,875; B) 7,411; C) 3,397.
6
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A
24- Con un nivel de confianza del 95%, ¿cuál es el valor de la F teórica, por encima del cual
se debería rechazar la hipótesis de que no hay relación lineal significativa entre X e Y?:
A) 5,987; B) 5,59; C) 6,608.
25- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y
los errores están correlacionados; B) las distribuciones condicionadas de los errores
deben de tener una distribución normal; C) No deben estar relacionadas la variables
predictora y la variable dependiente o criterio.
7
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
24/06/2013
Foro Asignatura
Febrero 2011 (2ª Semana – Tipo D)
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D
⁄
√
√ √
4- Con un nivel de confianza del 99%, si los dirigentes del partido X considerasen que Ia
proporción de apoyos no alcanza el valor pronosticado por la empresa SND's, el valor crítico
para rechazar la hipótesis nula, es: A) -2,58; B) 1,64; C) -2,33.
-1-
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D
A medida que aumenta el tamaño de la muestra, menor es el error típico, y cuanto menor es
el error típico, mayor la precisión del intervalo de confianza. Página 45 del libro de texto.
8- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A) cuya
distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que
utiliza toda la Información muestral relacionada con el parámetro.
9- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.
-2-
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D
10- Si trabajamos con dos grupos siendo los tamaños de las muestras: n1 = 30 y n2 =35,
sabemos que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas;
C) las muestras son independientes.
Queremos comprobar si la media es superior para el Grupo 1 (música clásica) que para el
Grupo 2 (silencio), luego la hipótesis alternativa es . La hipótesis nula, por lo
tanto, es la especificada en la opción A.
̅ ̅
̂ ̂ √ ( )
√ ( )
̅ ̅
̂ ̂ √
√
15- El nivel p-crítico es igual a: A) entre 0,05 y 0,10; B) entre 0,05 y 0,95; C) 0,025.
16- Rechazamos la hipótesis nula porque: A) el nivel de significación es menor que el nivel
p-crítico; B) el estadístico de contraste es mayor que el valor crítico; C) no rechazamos la
hipótesis nula.
-3-
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D
SITUACIÓN 3. Un agrónomo desea conocer el efecto que sobre el rendimiento de una variedad
de trigo tiene la adición de 3 tipos diferentes de fosfatos al terreno. Para ello parcela un
terreno en 12 áreas del mismo tamaño y trata cada cuatro parcelas con un tipo distinto de
fosfato (A, B o C). A continuación siembra trigo en cada uno de ellos y, después de la
recolección, mide la cantidad de trigo producida por cada superficie (en hectólitros por
hectárea o hl/ha). La Tabla 1 muestra el rendimiento obtenido en función del tipo de
fosfato añadido.
Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50
Sabemos que:
SC gl MC F
Entre niveles 8 I-1=2 8/2=4
Dentro niveles 6 N-I=9 6/9=0,67
Total 8+6=14 N-1=11
La hipótesis nula ha de postular la igualdad de las medias en todos los niveles, luego la
opción correcta es B.
18- Los grados de libertad del estadístico F de contraste valen: A) (3,9); B) (2,11); C) (2,9).
19- El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato” vale
aproximadamente: A) 6; B) 3.295; C) 0.392.
-4-
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D
SITUACIÓN 4. En un colegio se estudia la relación que puede existir entre la calificación global
de los estudiantes al final de curso (Y) y la obtenida el curso anterior (X). Efectuado un
análisis de regresión, con una muestra de estudiantes, la prueba para determinar la
significación del modelo de regresión ajustado es la siguiente:
SC gl MC F Prob.
Regresión 42,734 1 42,734
Residual U V W 17,345 #
Total 64,909 10
; ; ⁄ ⁄
SC gl MC F
Regresión 42,734 1 42,734
Residual 22,175 9 2,4639 17,345
Total 64,909 10
21- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y
los errores son independientes; B) las distribuciones condicionadas de los errores deben de
tener una distribución uniforme; C) no deben estar relacionadas las variables predictora y la
variable dependiente o criterio.
23- ¿Aproximadamente, cuál es la varianza muestral insesgada de los errores del modelo
de regresión? A) 2,217; B) 4,273; C) 2,464.
La varianza muestral insesgada de los errores del modelo de regresión coincide con la media
cuadrática residual.
-5-
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D
24- ¿Con un nivel de confianza del 95%, cuál es el valor de la F teórica, por encima del cual
se debería rechazar la hipótesis de que hay no relación lineal significativa entre Y y X?; A)
5,117; B) 5,59; C) 6,608.
25- ¿Cuál es el error típico del modelo de regresión? A) 2,464; B) 1,57; C) 1,665.
∑
√ √
-6-
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
24/06/2013
Foro Asignatura
Septiembre 2011 (Original – TipoA)
Diseños de investigación y Análisis de Datos. Septiembre 2011, soluciones al modelo A.
A continuación se presentan 3 situaciones. Cada situación viene seguida por una serie de preguntas referidas a la
misma y de preguntas teóricas generales.
SITUACIÓN 1: “La formación alcanzada por la población adulta española ha mejorado, de forma continua, en los últimos
10 años. Desde 1998 el porcentaje de españoles de 25 a 64 años que poseen estudios superiores a los obligatorios ha
pasado de 33% al 51% en 2008. En la misma proporción ha disminuido, por tanto, el porcentaje de españoles que sólo
poseen estudios obligatorios, que ha pasado del 67% en 1998 al 49% en 2008” (Panorama de la Educación. Informe
OCDE 2010). Suponga que usted quiere estudiar si estos datos son los que realmente existen en su Comunidad, para lo
que utiliza una muestra aleatoria de 900 adultos con edades comprendidas entre 25 y 64 años, encontrando que 378 de
ellos tienen solo los estudios obligatorios.
1.- Si decide trabajar con un nivel de confianza del 95% y se establece el error máximo de estimación en el 3%, ¿cuál
debe ser el tamaño de la muestra?: A) 1040; B) 544; C) 789.
( )
⁄
√
⁄
( )
2.- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un nivel de confianza
previamente fijado: A) aumenta cuando aumenta el error en la estimación; B) aumenta cuando disminuye el error en la
estimación; C) no depende del error en la estimación.
Simplemente observando la fórmula con la que obtenemos el tamaño de la muestra concluimos que la respuesta
correcta es “B”.
-1-
3.- Sean “X” e “Y” dos estimadores de un mismo parámetro, si la distribución de probabilidad de “X” tiene menor
variabilidad que “Y”: A) el estimador “Y” es más eficiente; B) el estimador “X” es más eficiente; C) el estimador “X” es
más suficiente.
4.- Trabajando con un nivel de confianza del 95%, el intervalo de confianza de la proporción de adultos de su Comunidad
que solo tienen estudios obligatorios, se encuentra entre: A) 0,378 y 0,462; B) 0,388 y 0,452; C) 0,376 y 0,461.
( )
⁄
√ √ {
5.- El nivel de confianza se refiere a: A) La probabilidad de que el parámetro se encuentre dentro de un intervalo de
confianza; B) El valor inverso del error típico; C) La probabilidad de que el estadístico se encuentre dentro de la
distribución muestral del parámetro.
6.- Si el investigador quiere confirmar que la proporción de adultos de su Comunidad que solo tienen los estudios
obligatorios es significativamente inferior que el indicador de España en 2008, la hipótesis alternativa es: A) H1: π< 0,49;
B) H1: π> 0,49; C) H1: π≤ 0,42.
La respuesta correcta es “A”, puesto que las hipótesis que debemos plantear son:
7.- Si el investigador cree que la proporción de adultos que solo tienen los estudios obligatorios es inferior que el
indicador de España en 2008, el estadístico de contraste y el nivel p-crítico para analizar si la diferencia es
estadísticamente significativa es: A) 3,34 (p=0,0008); B) -4,2 (p<0,0002); C) -2,33 (p=0,0198);
→
√
8.- Respecto a la hipótesis del investigador analizada en las preguntas anteriores, el investigador concluye que la
proporción de adultos que solo tienen estudios obligatorios en su Comunidad, es: A) inferior a la del resto de España
con un nivel de significación de 0,01; B) la misma que la del resto de España con un nivel de significación de 0,05; C)
superior a la del resto de España con un nivel de significación de 0,01.
9.- A la probabilidad de rechazar la hipótesis nula cuando es falsa se le denomina: A) nivel de confianza; B) potencia del
contraste; C) nivel p-crítico.
SITUACIÓN 2: En una tarea sobre decisión léxica con estímulos visuales en la que se miden tiempos de reacción, un
investigador dispone de una muestra aleatoria de 26 sujetos. Utiliza dos grupos de palabras y parte de la hipótesis de
que los tiempos de reacción serán más cortos ante palabras de alta frecuencia léxica (aquellas que utilizamos más
-2-
frecuentemente en el lenguaje, Grupo 1) que ante palabras de baja frecuencia léxica (Grupo 2). Tras realizar el
experimento observa que el tiempo de reacción medio para el Grupo 1 fue igual a 612,04 ms, mientras que para el
Grupo 2 fue igual a 645 ms, siendo la cuasivarianza de las diferencias igual a 6656 ms2. Asumiendo que se cumplen los
supuestos para realizar un contraste paramétrico, conteste a las siguientes cuestiones:
10.- Para comprobar si la diferencia entre dos medias es significativa, calculamos: A) el estadístico de contraste; B) el
tamaño del efecto; C) las dos opciones anteriores son verdaderas.
La respuesta correcta es “A”, debemos de plantear un contraste de hipótesis sobre dos medias para dos
muestras relacionadas, siendo las hipótesis:
14.- El valor absoluto del estadístico de contraste es: A) 1,708; B) 2,06; C) 2,485.
̅ ̅
̂
√ √
15.- Para un nivel de confianza del 95%, el valor absoluto del valor crítico es: A) 1,708; B) 2,06; C) 2,485.
17.- El resultado del experimento: A) no es significativo; B) es significativo al nivel de confianza del 95%; C) es
significativo al 95% y al 99%.
La respuesta correcta es “B”, puesto que los resultados son significativos para el nivel de confianza del 95%
( ) pero no son significativos al nivel de confianza del 99% ( ).
SITUACIÓN 3. Un investigador sospecha que los tiempos de coagulación de la sangre difieren en función del tipo de
dieta. Para ello, ha realizado un experimento donde ha formado varios grupos de ratones, sometiendo a cada grupo a
distintos tipos de dietas. Tras analizar los datos mediante un ANOVA, parte de los siguientes resultados:
-3-
Fuentes Sumas Grados Medias
F
de variación de cuadrados de libertad cuadráticas
Entre niveles 228 3
Dentro de niveles 112 20
Total 340 23
Conociendo los grados de libertad, deducimos el número de niveles, número de sujetos en cada nivel y número total
de sujetos:
20.- La hipótesis nula planteada en este diseño es: A) para todo ; B) para todo ; C)
.
21.- El valor de la F para el factor “Tipo de dieta” fue: A) 8,660; B) 2,380; C) 13,57.
22.- Siendo 0.05 , el valor de la F crítica para el factor “Tipo de dieta” fue: A) 3,098; B) 2,380; C) 4,938.
Para un nivel de confianza del 95%, mirando en las tablas F de Fisher para 3 y 20 grados de libertad, observamos
que la F crítica es: 3,098, luego la alternativa correcta es “A”.
23.- ¿Tendremos que realizar comparaciones a posteriori? A) Sí; B) No porque tenemos más de 2 niveles del factor; C)
No porque las comparaciones a posteriori solo se aplican en diseños intrasujetos.
Tendremos que hacer comparaciones “a posteriori” porque hemos rechazado la hipótesis nula que planteaba la
igualdad entre las medias ( ).
24.- Con un nivel de confianza del 95%, ¿Cuál será el valor mínimo de la diferencia entre dos medias cualesquiera en
este experimento para que resulten significativas según Tukey ( 0,05)? A) 12,39; B) 0,59; C) 3,83.
-4-
√ √
25.- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a comparar deben de cumplir el
supuesto de: A) complementariedad y exhaustividad; B) homocedasticidad; C) independencia.
-5-
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
24/06/2013
Foro Asignatura
Febrero 2012 (2ª Semana – Tipos C y D)
Diseños de Investigación y Análisis de Datos
Grado en Psicología
Material permitido
permitido: CÓDIGO CARRERA 6201
Formulario sin anotaciones y CÓDIGO ASIGNATURA 2054
Calculadora científica no
programable FEBRERO DE 2012 (2º semana)
MODELO C RESUELTO
A continuación se presentan 3 situaciones. Cada situación viene seguida por una serie de preguntas referidas a la
misma.
El Centro de Investigaciones Sociológicas (CIS) realiza constantes estudios sobre la ideología e intención de voto de los
españoles. Uno de los ítems que incluye en sus cuestionarios es el de la “identificación ideológica para lo que se le pide
ntificación ideológica”,
al entrevistado que se ubique ideológicamente en una escala de 1 a 10 (donde 1 significa extrema izquierda y 10 extrema
derecha). En su última encuesta a la población española la media aritmética obtenida par paraa la variable identificación
ideológica fue de un 4,86. Un psicólogo social interesado en estudiar esta temática en su localidad selecciona una
muestra aleatoria formada por 31 sujetos a los que aplica el ítem de identificación ideológica, obteniendo una media
m de
5,40 y una cuasi-desviación
desviación típica de 1,2. Con esta información, responda a las siguientes preguntas: preguntas
1. Con un nivel de confianza del 95%, el tamaño de la muestra necesario para que el error de estimación de la media en
la escala de Identificación ideológica no supere 0,2 puntos, es: a) 150; b) 102; c) 138.
Respuesta:
Aplicamos la fórmula para el cálculo del tamaño muestral necesario para obtener un error de estimación menor o
igual a uno prefijado (en nuestro caso E = 0.2) del estadístico media conociendo la cuasi-desviación
desviación típica muestral
( S n −1 = 1.2 ) y que el valor de α = 0.05 yya que el Nivel de Confianza es del 95%.. Aplicamos la fórmula desconocida la
varianza poblacional para muestras pequeñas ( α / 2 t31−1 = 2.042 ):
2
(α / 2 tn −1 ) 2 ( 2.042)
n = S n2−1 = 1 . 2 = 150.112
E2 0 .2 2
El valor obtenido debe truncarse al natural más cercano (1 (150). Luego la opción correcta: A.
2. Con un nivel de confianza del 95%, el intervalo de confianza aproximado para la media en la escala de identificación
ideológica de los residentes en su localidad es: A) 4,98 - 5,82; B) 5,03 – 5,76; C) 4,952 – 5,847
7.
Respuesta:
Desconocemos la varianza poblacional y si utilizamos la cuasivarianza (ya que es el valor muestral que nos
proporcionan) deberemos aplicar las fórmulas:
S n −1 1 .2 1 .2
li = X − t
n −1 α / 2 = 5.40 − − 2.042 = 5.40 − (2.042 ) = 4.9599
n 31 31
S 1 .2 1 .2
ls = X + n −1 t1−α / 2 n −1 = 5.40 + 2.042 = 5.40 + (2.042 ) = 5.8401
n 31 31
Opción correcta: C.
Sabiendo que el psicólogo sospecha que la población de su localidad es más conservadora que la población general,
3. De acuerdo a los objetivos del psicólogo, la hipótesis nula es: A) H0: μ ≤ 4,86; B) H0: μ < 4,86; C) H0: μ > 4,86.
Solución:
Si el psicólogo “sospecha” que en su localidad, la tendencia política es más conservadora que en la población general,
significa que esta es la hipótesis alternativa, es decir, la hipótesis alternativa es unilateral:
H1 : µ poblacion > 4.86
Luego la hipótesis alternativa es la complementaria:
H 0 : µ poblacion ≤ 4.86
Observamos que de las opciones que nos proporcionan para la hipótesis nula, solo una tiene el signo “igual”. Esto es
un índice añadido al razonamiento anterior que nos indica cuál es la correcta.
Opción correcta: A.
4. El procedimiento que aplicaría para probar la hipótesis del psicólogo, es: A) la Prueba Z; B) la prueba t con n-1 grados
de libertad; C) la prueba Chi cuadrado con n-1 grados de libertad.
Solución:
Tenemos un contraste de medias con una única muestra de 31 sujetos y de la población no conocemos la varianza.
Luego debemos utilizar como estadístico de contraste la prueba t con n-1 grados de libertad.
La prueba Z sería correcta si conociéramos la varianza poblacional.
Opción correcta: B.
5. El estadístico de contraste para la hipótesis del psicólogo es: A) 2,352; B) 1,697; C) 2,5.
Solución:
X − µ0 5.40 − 4.86
t= = = 2.50549
S n −1 1.2
n 31
Opción correcta: C.
6. Si el psicólogo fija un nivel de significación de 0,05 el valor crítico para tomar una decisión respecto a la hipótesis nula
es: A) 1, 697; B) 1,96; C) 2,042.
Solución:
Buscamos en las tablas con n-1 = 30 y α / 2 = 0.025 (recordemos que la hipótesis del psicólogo era unilateral), luego
buscamos en la tabla con 0.975, es decir 1 – 0.025:
Opción correcta: C.
7. Bajo el supuesto de que la H0 es verdadera, la probabilidad de obtener una muestra con una media tan alejada o más
de 5,39 es: A) p > 0,10; B) p < 0,001; C) p < 0,01.
Solución:
Nos están preguntando qué sucedería si, siendo H0 cierta, cuál es la probabilidad de obtener una media muestral igual
a 5.39 o superior (más extrema). Si realizamos el cálculo de la t con este nuevo valor:
X − µ0 5.39 − 4.86
t= = = 2.4591
S n −1 1.2
n 31
Podemos observar en las tablas de la t (con 30 g.l.) que la p sería:
El valor de t = 2.457 (el más cercano en la tabla a 2.4591) deja por debajo de sí el 0.990 del área de la distribución y
por encima de sí el 1-0.990 = 0.01. Luego la opción correcta es la C.
8. Con los datos originales obtenidos en nuestra muestra, la decisión que toma respecto a la hipótesis nula es: A)
Rechazarla porque, bajo el supuesto de que fuera cierta, la probabilidad de obtener una muestra con una media de
5,40 o superior es muy pequeña; B) Mantenerla porque el valor absoluto del estadístico de contraste es menor que el
valor absoluto del valor crítico; C) No se puede rechazar la hipótesis nula.
Solución:
Al indicarnos que está hablando de los datos originales, se está refiriendo a los datos proporcionados en el enunciado
del problema (para diferenciarlo claramente del enunciado del ejercicio anterior). Recordemos que la t obtenida fue
de 2.50549 y trabajando unilateralmente con un α = 0.05 , la t crítica sería 2.042, luego
t empírica > tcrítica
2.50 > 2.04
Luego el valor obtenido cae en la zona de rechazo de H0. La opción correcta en que se especifica este rechazo es la A.
Opción correcta: A.
Un psicólogo quiere comprobar si los alumnos de primero de grado (Grupo 1) y los de cuarto de grado (Grupo 2) difieren
en la variable “autoestima”. Tras seleccionar dos muestras aleatorias de igual tamaño ( n1 = n2 = 31 ) aplica a ambas un
test de autoestima. Los resultados fueron: Yˆ1 = 26, Sˆ12 = 64 para el Grupo 1 y Yˆ2 = 20, Sˆ22 = 60 para el
Grupo 2. Como el psicólogo no sabe si las varianzas poblacionales son iguales o diferentes, decide realizar un contraste
de hipótesis sobre dichas varianzas. Asumiendo un nivel de confianza del 99%, conteste a las siguientes cuestiones:
10. El estadístico de contraste para el contraste sobre las varianzas es igual a: A) 1,067; B) 2,386; C) 2,009.
Solución:
El estadístico de contraste es una razón F:
Sˆ12 64
F= = = 1.06667
Sˆ22 60
Opción correcta: A.
11. Tras realizar el contraste de hipótesis sobre las varianzas, el psicólogo asume que: A) las varianzas poblacionales son
diferentes porque el estadístico de contraste es mayor que el valor crítico superior; B) las varianzas poblacionales
son iguales porque el estadístico de contraste se encuentra comprendido entre los dos valores críticos que
buscamos en las tablas F; C) las varianzas poblacionales son iguales porque el nivel crítico es menor que el nivel de
significación.
Solución:
Para responder a esta pregunta necesitamos conocer el valor de la F crítica con 31-1 = 30 y 31-1 = 30 grados de
libertad en el numerador y denominador, respectivamente. Según las tablas (con un NC = 0.99 bilateral, α = 0.01 ,
significa que debemos utilizar la tabla del 0.995):
El valor obtenido es de 2.628. Por consiguiente, podemos afirmar que la F empírica (1.067) es inferior a la F crítica
superior. Debemos recordar que al ser un contraste bilateral, también tenemos un valor de F crítica inferior.
Sabemos que, por la distribución de la F, este valor de F crítica inferior cumple que es más pequeño que la unidad,
por lo que podríamos responder directamente a la pregunta. No obstante, para asegurarnos podemos calcularlo
utilizando la fórmula de la propiedad recíproca de la distribución F:
1
Fn1 −1, n2 −1, α / 2 =
Fn2 −1, n1 −1, 1−α / 2
La tarea se simplifica ya que los grados de libertad del numerador y del denominador son idénticos y por tanto,
intercambiables. Si queremos hallar la F que deja por debajo de sí un área de 0.01 la encontraremos como:
1 1 1
Fgl1 = 30, gl2 = 30, 0.01 / 2 = = = = 0.380518
Fgl2 = 30, gl1 = 30,1− 0.01 / 2 F30,30 , 0.995 2.628
Con este cálculo podemos afirmar que el valor de la F empírica se encuentra en la región de aceptación (o no rechazo)
de H0. El valor de la probabilidad de la F empírica (nivel crítico p) es mayor que el nivel de significación ( α = 0.01), es
decir, p > α .
La opción C es incorrecta porque afirma justamente lo inverso, es decir, que p < α .
La opción A es incorrecta ya que el estadístico de contraste (1.066) no es mayor que el valor crítico superior, sino
inferior.
La opción B es correcta ya que p > α y no podemos rechazar la H0.
12. La hipótesis alternativa en el caso del contraste para dos medias es: A) H1 : µ1 < µ2 ; B) H1 : µ1 > µ2 ; C) H1 : µ1 ≠ µ2
Solución:
Seguimos manteniendo el contraste bilateral, por consiguiente las opciones A y B son incorrectas. La opción correcta
es la C ya que es la hipótesis alternativa para un contraste bilateral de medias en dos grupos independientes.
Opción correcta: C.
13. El estadístico de contraste en el caso del contraste sobre las medias es igual a: A) 3; B) 2,66; C) -2,66.
Solución:
El estadístico a aplicar sería el correspondiente a desconocidas las varianzas poblacionales y supuestas iguales (según
hemos obtenido en el ejercicio 11):
Y1 − Y2 26 − 20
T= = =3
(n1 − 1) Sˆ12 + (n2 − 1) Sˆ22 1 1 30 ⋅ 64 + 30 ⋅ 60 1 1
+ +
n1 + n2 − 2 n1 n2 31 + 31 − 2 31 31
Opción correcta: A.
14. Los valores críticos en el contraste sobre las medias es igual a: A) -3 y +3; B) -2,66 y +2,66 C) 0,005 y 0,995.
Solución:
Los valores críticos de la t con n1+n2-2 = 31+31-2=60 grados de libertad y α = 0.01 bilateral (luego buscamos en las
tablas 1-(0.01/2) = 1 – 0.005= 0.995) son:
Opción correcta: B.
15. El nivel crítico en el caso del contraste sobre las medias es igual a: A) está comprendido entre 0,025 y 0,05; B) es igual
a 0,025; C) es menor que 0,01.
Solución:
El nivel crítico se corresponde con la probabilidad de la T empírica (que hemos obtenido antes y es igual a 3). Si
buscamos en las tablas para 60 grados de libertad observaremos que no aparece, luego este valor de probabilidad es
inferior a 1 – 0.995 = 0.005. Solo la opción C contempla esta posibilidad al indicar que “es menor que 0.01”.
Opción correcta: C.
16. En un contraste sobre dos proporciones con muestras relacionadas, cuál de los siguientes estadísticos es insensible a
la dirección del cambio producido: A) Chi cuadrado de la prueba de McNemar; B) el estadístico Z; C) no es correcta
ninguna de las opciones anteriores.
Solución:
En el desarrollo del Tema 4, se explicita y muestra numéricamente que la prueba de McNemar es insensible a la
dirección del cambio (pags. 11-13). Opción correcta A.
La Tabla 1 muestra los rendimientos (en hectólitros por hectárea o hl/ha) de trigo cultivado en un tipo particular de suelo
tratado con los fertilizantes A, B o C. El experimentador dispuso de 12 áreas de terreno del mismo tamaño y asignó
aleatoriamente 4 de ellas a cada tipo de fertilizante. Trabaje con un α = 0.05 sabiendo que SCfertilizante = 8 y
SCS/fertilizante= 6.
Tabla 1
Fertilizante
A B C
48 47 49
49 49 51
50 48 50
49 48 50
17. Se trata de un diseño factorial: A) 3x4 intersujetos; B) de 1 factor con tres niveles; C) de 1 factor con tres niveles
intrasujetos.
Solución:
Se trata de un diseño inter-sujetos (en este caso, inter-terrenos) ya que cada parcela (cada “sujeto”) solo fue
sometido a un nivel del factor (Tipo de fertilizante). El único factor manipulado (Fertilizante) se manipuló a tres
niveles (tipo de fertilizante: A, B o C). Luego se trata de un diseño de un factor con tres niveles.
Opción correcta B.
18. El diseño presentado es: A) de efectos fijos; B) desequilibrado ; C) las dos opciones anteriores son incorrectas.
Solución:
Se trata de un diseño de efectos fijos. No puede ser desequilibrado ya que hay 4 terrenos o parcelas para cada tipo de
fertilizante (lo cual indicaría que es equilibrado). Solo nos interesan estos fertilizantes (A, B y C), ningún otro.
Opción correcta: A.
19. El modelo estadístico que podemos aplicar a estos datos es: A) Yij = µ + α i + ε ij ;
1
B) E ( MCint er ) =σ2 + niα i2 ; C) Yij = µ + α i + (αε ) ij + ε ij .
( I − 1)
Solución Correcta: A.
La opción B no es un modelo sino la expresión del valor esperado de la Media Cuadrática Inter. La expresión C es
incorrecta ya que asume la interacción entre los errores y los niveles del tratamiento. La opción correcta es la A ya
que expresa cada puntuación de la variable dependiente (Yij) como la suma de tres componentes: una media global
común ( µ ), el efecto del factor del terreno concreto del que estemos hablando ( α i ) y un error aleatorio ( ε ij ).
20. El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196, 192, 200}; C) {2/3, 2/3, 2/3}.
Solución:
Para obtener el rendimiento medio para los diferentes tratamientos simplemente calculamos la media de cada
fertilizante:
Fertilizante
A B C
48 47 49
49 49 51
50 48 50
49 48 50
Media 49 48 50
Luego la opción correcta es la A. La opción B es incorrecta porque expresa no un valor medio sino el rendimiento total
(la suma).
21. La variación entre tratamientos vale: A) 4; B) 8; C) 14.
Solución:
Con los datos proporcionados en el enunciado podemos construir la Tabla del Anova (modelo de un factor de efectos
fijos):
22. La variación dentro de los tratamientos vale aproximadamente: A) 5/3; B) 4/3; C) 2/3.
Solución:
La tabla anterior nos indica que la solución correcta es 6/9. Si no aproximamos, podemos obtener el valor pedido
reduciendo la razón 6/9 a:
6
6 3 2
= =
9 9 3
3
Luego la opción correcta es C.
23. El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es superior en, aproximadamente, 6 veces a la
MCInter; B) No, porque la SCintra es casi igual a la SCinter indicando que la variabilidad asociada al tratamiento es casi
idéntica a la del error; C) Sí, porque la F obtenida (5.9999) es superior al valor crítico ( 0.05 F2,9 = 4,256 ).
Solución:
Para saber si la F obtenida es significativa, debemos buscar en la tabla de la F el valor crítico:
Hemos obtenido una F de 5.999 (aproximadamente 6) y el valor crítico de F es 4.256. Como 5.999 > 4.256, el valor de
la F obtenido cae en la zona de rechazo de H0.
Opción correcta: C.
La opción A es incorrecta porque la comparación entre las medias cuadráticas del factor y del error no es suficiente
para declarar un efecto significativo. Es necesario compararlo también con la F crítica.
24. ¿Entre qué niveles podemos asegurar que existen diferencias según CR de Scheffé? A) sólo entre los niveles B y C; B)
Sólo entre los niveles A y C; C) sólo entre los niveles A y C.
Solución:
Aplicamos la fórmula de la CR de Scheffé (como nos piden asegurar entre qué niveles existen diferencias, ponemos
los coeficientes típicos para la comparación entre dos niveles dejando el tercero sin incluir):
I c2 6 12 ( −1) 2 0 2
CRScheffé = ( I − 1) F( k −1), gl _ error MCerror ∑ i = (3 − 1) 4.256 + + = 1.68444
i =1 ni 9 4 4 4
Ahora realizamos las diferencias (en valor absoluto) entre las tres medias:
A − B = 49 − 48 = 1
A − C = 49 − 50 = 1
B − C = 48 − 50 = 2
Solamente la tercera diferencia (los fertilizantes B y C) obtiene un valor superior a la CR de Scheffé. Luego las
diferencias se encuentran entre B y C.
Opción correcta: A.
25. El diseño presentado no permite evaluar la interacción: A) porque el factor manipulado (tipo de fertilizante) no puede
interaccionar con ningún otro factor; B) porque tal interacción no ha sido incluida en el modelo; C) porque sólo existe
un factor manipulado y la interacción siempre se predica, como mínimo, de dos factores.
Solución:
La opción correcta es la C: solo si hubiéramos manipulado dos factores podríamos poner a prueba el efecto de
interacción. La opción A es incorrecta porque no sabemos si el factor manipulado interacciona con alguna otra
variable, podría ser pero como no hemos introducido ninguna otra variable en el diseño, es una cuestión que
tenemos que dejar en el aire. Por otro lado, la opción B es incorrecta porque introducir el efecto de interacción
cuando solo tenemos un factor no tiene sentido alguno.
PLANTILLA DE RESPUESTAS CORRECTAS PARA EL MODELO D
SITUACIÓN 1: El “Síndrome Jubilación” es la situación que experimentan ciertas personas ante esta nueva etapa
vital con manifestaciones somáticas, psíquicas y sociales negativas que afectan la calidad de vida del jubilado.
Un estudio publicado por el GIE (Grupo de Investigación del Envejecimiento) mediante una encuesta realizada
en el 2006 utilizando una muestra de jubilados con edad media de 77,6 años y desviación típica de 8,79 años
encuentra que las manifestaciones psíquicas más frecuentes eran la ansiedad (82%), el pesimismo (13,3%) y la
depresión (4,7%) y que para el 32% de los expertos consultados el apoyo psicológico constituye la estrategia de
intervención más adecuada para superar estos estados. Suponga que usted quiere estudiar la situación de los
jubilados de su localidad respecto a este "síndrome", para lo que utiliza una muestra aleatoria de 362 jubilados,
con una edad media de 71,2 años y una desviación típica de 12,5 y de los cuales, el 59,8% presenta signos de
ansiedad, el 35% pesimismo y el 5,2% depresión.
1.- Utilizando los datos del GIE y con un nivel de confianza del 95%: si le dicen que el intervalo de confianza de la
proporción de jubilados con manifestaciones de depresión, es un valor comprendido entre 0,0387 (3,87%) y 0,0553
(5,53%), ¿Cuál es el tamaño más aproximado de la muestra que se ha utilizado?: A) 1348; B) 2500; C) 3481.
Conociendo los límites superior e inferior del intervalo de confianza, deducimos fácilmente el error máximo:
⁄
( ) ( )
2.- Utilizando los datos de su estudio y con un nivel de confianza del 95%, la edad media de los jubilados de su
localidad es un valor comprendido, aproximadamente, entre: A) 69,9 y 72,5 años; B) 69,5 y 72,9 años; C) 70,2 y 73,1
años.
( )
√
3.- Con los datos de su estudio y un nivel de confianza del 99%, el intervalo de confianza para la proporción de
jubilados con manifestaciones psíquicas de ansiedad, es: A) 0,557 y 0,639; B) 0,547 y 0,648; C) 0,531 y 0,664.
( )
√ ( )
1
4.- Si desea comprobar que la proporción de jubilados de su localidad con manifestaciones psíquicas de pesimismo
es significativamente mayor que el valor 0,133 facilitado por el GIE en el 2006, ¿cuál es, aproximadamente, el valor
del estadístico de contraste que obtendría?: A) 8,77; B) 10,3; C) 12,18.
√ ( ) √ ( )
5.- Utilizando la información de su trabajo, si desea comprobar que la proporción de jubilados de su localidad con
manifestaciones psíquicas de pesimismo es significativamente mayor que el valor 0,133 facilitado por el GIE en el
2006, el nivel crítico que obtienes: A) es menor que 0,0002; B) es mayor que 0,001; C) depende del nivel de
confianza.
El estadístico de contraste es un valor muy extremo (z = 12,158). El valor máximo que podemos consultar en las
tablas de curva normal es z = 3,59, que deja por encima de sí una proporción: p = 0,0002
6.- En un contraste de hipótesis, el valor crítico representa: A) la probabilidad de rechazar la hipótesis nula siendo
verdadera; B) la máxima diferencia que cabe esperar entre el valor teórico formulado en la hipótesis nula y el
valor que encontramos en nuestros datos para esa hipótesis; C) la probabilidad de que siendo cierta la hipótesis
nula encontremos unos resultados como los observados en la muestra o más extremos.
7.- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume como provisionalmente
verdadera; B) es la hipótesis a contrastar; C) su valor depende de los datos obtenidos en la muestra.
8.- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un estudio de la Agencia
Tributaria que detalla los ingresos medios de la población activa por sectores profesionales; B) Un informe del
Centro de Investigaciones Sociológicas reflejando cómo sería la composición del Congreso de los Diputados si se
realizarán hoy las elecciones; C) Un análisis presentado por el Ministerio de Educación sobre las notas de
selectividad, por Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria ordinaria.
SITUACIÓN 2: El equipo docente de una determinada asignatura quiere comprobar la eficacia de un material
docente nuevo respecto al utilizado en convocatorias anteriores. Selecciona una muestra aleatoria de 64 alumnos,
con los que forma dos grupos de igual tamaño también al azar. A los sujetos del Grupo 1 les proporciona en nuevo
material, mientras que los del Grupo 2 trabajan con el material antiguo. El equipo docente tiene la hipótesis de que
con el nuevo material las notas serán más elevadas. Tras el examen de fin de curso los alumnos del Grupo 1
obtienen una nota media igual a 7, con una cuasivarianza igual a 15, mientras que para el Grupo 2 la media es igual a
5,2 y la cuasivarianza igual a 17.
9- Si con un nivel de confianza del 95% realizamos un contraste de hipótesis para comprobar si las varianzas
poblacionales son iguales o diferentes, aceptaremos: A) la hipótesis nula; B) la hipótesis alternativa; C) No podemos
saber qué cuasivarianza hay que poner en el numerador del estadístico de contraste.
2
̂
̂
Para un nivel de confianza del 95%, el valor que nos ofrece la tabla F para 30 grados de libertad en el numerador y 30
grados de libertad en el denominador (los más próximos a 31) es igual a 1,841, luego los valores críticos son:
Dado que F = 0,88 se encuentra comprendido entre los valores críticos, aceptamos la hipótesis nula, por lo que
podemos suponer que las varianzas son iguales.
10.- Si realizamos un contraste de hipótesis sobre las medias para comprobar la hipótesis del equipo docente, el
estadístico de contraste vale: A) 2; B) 1,8; C) 1,67.
̅ ̅
( )̂ ( )̂ √ ( )
√ ( )
̅ ̅
( )̂ ( )̂ √
√
12.- Con un nivel de confianza del 95%, suponiendo que la hipótesis nula sobre el contraste de medias es cierta, la
probabilidad de obtener un valor igual o superior al estadístico de contraste que hemos obtenido: A) se encuentra
comprendida entre 0,01 y 0,025; B) se encuentra comprendida entre 0,025 y 0,05; C) es igual a 0,05.
Nos piden calcular el nivel crítico. Buscando en las tablas para 60 grados de libertad (los más próximos a 62),
observamos que el estadístico de contraste obtenido (T =1,8), se encuentra comprendido entre los valores 1,671 y 2,
que dejan por encima de sí las probabilidades: 0,05 y 0,025.
13.- Si trabajamos con un nivel de confianza del 95%, la probabilidad de rechazar la hipótesis nula suponiendo que
es cierta es igual a: A) se encuentra comprendida entre 0,01 y 0,025; B) es igual a 0,05; C) es igual a 0,95.
Nos preguntan por el nivel de significación, la respuesta correcta es B.
14.- Tomando de las tablas el valor más próximo para los grados de libertad, el intervalo de confianza para la
diferencia de medias, para un nivel de confianza del 95% viene definido por los valores: A) 0,2 y 3,8; B) -0,2 y -3,8; C)
-0,2 y 3,8.
( )̂ ( )̂
(̅ ̅) ⁄
√ ( ) ( )
3
15.- El estadístico de contraste obtenido para contrastar la hipótesis del equipo docente: A) no es significativo; B) Es
significativo al nivel de confianza del 99%; C) es significativo al nivel de confianza del 95%.
El contraste que hemos de aplicar es unilateral derecho y el estadístico de contraste es: T = 1,8. Este valor supera al
valor crítico t = 1,671 (NC = 95%), pero no supera al valor crítico t = 2 (NC=99%), luego la respuesta correcta es C.
SITUACIÓN 3: Los siguientes datos relacionan el número de cigarrillos diarios (X) consumidos con el número de radicales libres
(Y) localizados en los pulmones de 8 individuos:
2 2
Sujeto X Y XY X Y
1 0 94 0 0 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
Sumatorio 137 1735 39218 3545 452493
Des. Típica 12,24 97,60
rxy = 0,99
16.- La ecuación de regresión en puntuaciones tipificadas que relaciona el número de cigarrillos con el número de
radicales libres viene dada por la expresión: A) ZY 2.1 Z X ; B) ZY 1.5 Z X ; C) ZY 0.99 Z X
La respuesta correcta es C. El propio enunciado nos proporciona el valor del coeficiente de correlación de Pearson.
17.- La ecuación de regresión en puntuaciones tipificadas que relaciona X e Y: A) tiene un único parámetro; B) tiene
como parámetro el mismo valor que la ecuación de regresión en puntuaciones diferenciales; C) tiene dos
parámetros: la pendiente y el punto de corte con la ordenada.
18.- La pendiente de la ecuación de regresión para predecir Y a partir de X en puntuaciones directas vale: A) -3.32; B)
7.92; C) 0.99.
19.- En regresión lineal por mínimos cuadrados se dice que la recta de regresión es una estimación insesgada debido
a que: A) se calculan los valores de pendiente y punto de corte con la ordenada tales que hacen mínimo el error al
cuadrado; B) cuantifica el incremento que se produce en la estimación de la variable dependiente (Y’) cuando la
independiente (X) aumenta en una unidad; C) los valores esperados de los estimadores coinciden con los
parámetros que estiman.
20.- Sabiendo que el punto de corte con la ordenada (B0) vale 81.09, a un sujeto que fume 0 cigarrillos le
pronosticaremos un número de radicales libres en pulmones igual a: A) 7.93; B) 81.09; C) 0.
21.- Conociendo la recta de regresión de mínimos cuadrados de Y sobre X podemos calcular Y’. La correlación de
estas puntuaciones predichas (Y’) con los errores (Y-Y’) vale: A) 0; B) lo mismo que la pendiente; C) lo mismo que el
coeficiente de alienación.
4
22.- Si queremos poner a prueba la hipótesis H 0 : 0 mediante el estadístico de contraste F obtendríamos un
valor aproximado de: A) 594.00; B) 295.51; C) 1.00.
( ) ( ) ( ) ( )
23.- El error típico de la distribución muestral de la pendiente vale, aproximadamente: A) 0.12; B) 7.97; C) 0.46.
√ √
24.- Si en la Situación 3 incluyéramos también la cantidad de grasas saturadas ingeridas a la semana para predecir el
número de radicales libres, el modelo de estimación lineal sería:
A) ;
B) ;
C) .
25.- En un modelo de regresión múltiple, el cálculo de las correlaciones de orden cero: A) implica el cálculo de la
regresión entre las variables independientes y, posteriormente, la extracción de los residuos; B) no nos permite
saber qué parte de la varianza de la VD es capaz de explicar independientemente cada una de las VI’s; C) nos
permite hallar relaciones bivariadas puras.
5
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
27/05/2015
Curso Virtual
Febrero 2013 (1ª Semana – Tipo A)
Diseños de investigación y análisis de datos. Soluciones examen febrero 2012. Modelo A
SITUACIÓN 1. Un sociólogo sabe, por investigaciones anteriores, que el sueldo medio de la población de
hombres en el trabajo T es igual a 1500 euros mensuales. Extrae una muestra aleatoria de 160 mujeres que
desempeñan el trabajo T, observando que el sueldo medio en dicha muestra es igual a 1400 euros
mensuales con una cuasivarianza igual a 64000. Quiere comprobar si el sueldo medio de las mujeres es
inferior al de los hombres. Nivel de confianza 95%.
1- Para comprobar la hipótesis del sociólogo, ¿se ha de asumir que la variable dependiente se distribuye
normalmente en la población? A) Sí, necesariamente si se utiliza un contraste paramétrico; B) No, porque el
tamaño de la muestra es grande; C) No, porque la variable dependiente está medida en una escala de
razón.
√ √
4- Si el sueldo medio de las mujeres es igual a la media poblacional de los hombres, la probabilidad de que en la
muestra el sueldo medio de las mujeres sea igual o inferior de 1400 euros mensuales es: A) menor que
; B) ; C) .
Dado que los grados de libertad son superiores a 100 consultamos la tabla de curva normal, donde
observamos que la puntuación deja por debajo de sí una proporción igual a 0,0002
5- ¿Mantiene el sociólogo la hipótesis nula? A) Sí, porque el estadístico de contraste es inferior al valor crítico;
B) No, porque “alfa” es menor que la probabilidad de rechazar H0 verdadera; C) No, porque el nivel crítico
es menor que el error de tipo I.
7- Cuál de las siguientes distribuciones de probabilidad NO es simétrica en torno a cero: A) la normal tipificada;
B) Chi cuadrado; C) T de Student.
8- El error típico de la media es: A) el error que sumamos y restamos a la media aritmética para calcular el
intervalo de confianza; B) la desviación típica de la distribución muestral de la media; C) el error que
cometemos si rechazamos una hipótesis nula verdadera.
9- Cuál de los siguientes estimadores sobre la tendencia central de una distribución es suficiente: A) la
mediana; B) la media aritmética; C) la moda.
-1-
Diseños de investigación y análisis de datos. Soluciones examen febrero 2012. Modelo A
SITUACIÓN 2. El Barómetro del CIS de septiembre de 2011 señala que a la pregunta: ¿Cuál es el principal
problema que existe actualmente en España?, respondieron 468 jóvenes con edades comprendidas entre 25
y 34 años, de los cuales el 57,3% señalaban “el paro”; el 19,2% indicaban “los problemas de índole
económica” y para el 9,4% el principal problema era “la clase política y los partidos políticos”. En el mismo
mes del 2012 ese rango de edad estaba compuesto por 480 jóvenes de de los cuales a la misma pregunta,
216 señalaban “el paro”, 114 se pronunciaban por “los problemas de índole económico” y 63 señalaban a “la
clase política y los partidos políticos” como el principal problema.
Problemas
Paro Clase política
económicos
2011
2012
10- Si queremos analizar los cambios producidos en la opinión de los jóvenes sobre el principal problema que
existe actualmente en España en septiembre de 2012 en comparación a los del mismo mes de 2011, el
diseño que utilizamos es: A) de dos muestras independientes; B) de dos muestras relacionadas; C) de una
muestra.
11- Para analizar si la consideración de “la clase política y los partidos políticos” como principal problema ha
aumentado significativamente en el 2012 respecto al año anterior, el valor absoluto del estadístico de
contraste que se obtiene es, aproximadamente: A) 0,69; B) 1,81; C) 2,74.
√ ( )( )
√ ( )( )
12- El nivel crítico para tomar una decisión respecto a la hipótesis nula de que “la consideración del paro como
principal problema de los jóvenes no ha variado significativamente en el 2012 respecto al 2011” vale,
aproximadamente: A) p=0,0002; B) p<0,0004; C) p>0,0002.
Las hipótesis que se deben de plantear sobre el paro y el estadístico de contraste son:
√ ( )( )
√ ( )( )
Consultando las tablas de curva normal, observamos que la mayor puntuación que podemos consultar
es: , que deja por encima de sí una proporción igual a: . Como el contraste es bilateral,
multiplicamos por dos esta probabilidad, por lo que el nivel crítico:
-2-
Diseños de investigación y análisis de datos. Soluciones examen febrero 2012. Modelo A
Imagine por un momento que tuviera usted acceso a la muestra de los 480 jóvenes encuestados en
septiembre del 2012 para volverles a realizar la misma pregunta y analizar los cambios de opinión sobre la
consideración del paro como principal problema. Encuentra que ahora son 233 los que siguen
considerando el paro como el problema principal y que de los 216 que en septiembre lo señalaban como
el problema principal ahora son 193 los que siguen manteniendo la misma opinión.
El contraste es sobre dos proporciones con muestras relacionadas. En primer lugar construimos la tabla
correspondiente con los datos del enunciado (en negrita) deduciendo fácilmente el resto.
2012
Paro Otros problemas
Paro 193 233
Ahora
Otros problemas 224 247
216 264 480
13- En esta nueva situación, el análisis de datos se realizaría sobre un diseño: A) de una muestra; B) de dos
muestras relacionadas; C) de dos muestras independientes.
14- Bajo esta nueva situación, el valor absoluto del estadístico de contraste Z vale, aproximadamente: A) 1,52; B)
2,14; C) 3,2.
√ √
15- El valor crítico para tomar una decisión respecto a la hipótesis nula depende: A) del nivel de confianza que
se establezca; B) de los grados de libertad de la distribución muestral de la diferencia de proporciones; C) de
si se conoce o no la varianza poblacional de las diferencias.
16- El valor más aproximado del nivel crítico del estadístico de contraste obtenido en esta situación es: A) menor
que 0,01; B) 0,129; C) 0,032.
Consultando las tablas de curva normal, observamos que la probabilidad de obtener puntuaciones más
extremas que z = 2,14 es igual a 0,0162. Dado que el contraste es bilateral, el nivel crítico es igual a:
17- La interpretación de sus análisis le permitiría afirmar que: “La valoración de paro como principal problema
que existe actualmente en España….: A) no ha variado en estos meses transcurridos con un nivel de
significación del 0,05; B) ha variado en estos meses transcurridos con un nivel de significación del 0,01; C) ha
variado en estos meses con una seguridad del 96,8%.
Dado que el nivel crítico es igual a: 0,0324, el resultado obtenido es significativo hasta un nivel de confianza
igual a:
-3-
Diseños de investigación y análisis de datos. Soluciones examen febrero 2012. Modelo A
SITUACIÓN 3. En la Tabla 1 se presentan los datos referidos a las tasas de criminalidad de distintas ciudades
americanas. Las ciudades están clasificadas según su especialización funcional: ciudades industriales, de
servicio o administrativas. Nivel de confianza: 95%.
Tipo de ciudad
Industrial Servicios Administrativa
4,3 5,1 12,5
2,8 6,2 3,1
12,3 1,8 1,6
16,3 9,5 6,2
5,9 4,1 3,8
7,8 3,6 7,1
9,1 11,2 11,4
10,2 3,3 1,9
∑ 68,7 44,8 47,6
[ ] [ ]
18- Si no se cumpliese el supuesto de normalidad de las tres subpoblaciones de ciudades deberíamos realizar un
contraste: A) de regresión lineal; B) no paramétrico; C) de medias independientes dos a dos.
19- La hipótesis alternativa en esta situación postula: A) que la media de las tasas de criminalidad son idénticas
entre los tres tipos de ciudades; B) que los tres tipos de ciudades tienen tasas de criminalidad diferente; C)
que existen, al menos, dos tipos de ciudades cuyas tasas de criminalidad difieren.
20- Se trata de un diseño: A) de dos factores de medidas independientes 3x8; B) de un factor de medidas
independientes con tres niveles; C) de un factor de medidas dependientes con tres niveles.
23- El valor del estadístico de contraste vale aproximadamente: A) 1,01; B) 10,1; C) 1,35.
24- El valor más aproximado de la F crítica que sirve como punto de separación para rechazar, o no, la H0 vale: A)
2,932; B) 2,339; C) 3,493.
Consultamos la tabla F para un nivel de confianza con 2 y 20 grados de libertad (los más próximos a 2 y 21) y
comprobamos que la respuesta correcta es C.
25- Según el análisis de esta situación, debemos: A) rechazar H0 con un nivel de confianza del 95%; B) no
rechazar H0; C) rechazar H0 con cualquier nivel de confianza.
-4-
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
27/05/2015
Curso Virtual
Febrero 2013 (2ª Semana – Tipo C)
Modelo C. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y calculadora científica no programable
A continuación se presentan 3 situaciones. Cada situación viene seguida por una serie de preguntas referidas a la
misma.
SITUACIÓN 1. Una preocupación creciente de los empresarios es el tiempo que los empleados dedican a actividades
como navegar por Internet o enviar e-mails a los amigos durante las horas de trabajo. Supongamos que el director de
una gran empresa desea determinar si la cantidad promedio de tiempo perdido durante un día de trabajo de 8 horas en
sus empleados es mayor que el valor informado por el anterior trabajo (120 minutos). En una muestra aleatoria de 26
empleados, se determinó que el promedio de tiempo perdido fue igual a 126 minutos con una varianza igual a 225.
Asumiendo que la variable dependiente se distribuye normalmente en la población y con un nivel de confianza 95%:
1- Se ha de suponer que la variable dependiente en la población se distribuye normalmente, porque: A) Es un supuesto que
siempre es necesario; B) porque la muestra es pequeña; C) porque el contraste es acerca de una media aritmética.
Respuesta: Como no nos han indicado la varianza poblacional y n < 30 tenemos que asumir la normalidad de la variable
en la población para poder aplicar el contraste de medias. Opción B.
4- Suponiendo que es cierta, la probabilidad de que los empleados de la empresa dediquen 126 o más minutos diarios a
navegar por Internet o enviar e-mails a sus amigos es igual a: A) 0,95; B) 0,05; C) se encuentra entre , , .
Respuesta: como X = 126 es el valor que hemos obtenido en la media muestral, nos están pidiendo la probabilidad
asociada a este valor. Buscamos en las tablas de la distribución t con 25 grados de libertad.
Observamos que un valor t=2 no aparece exactamente en las tablas, luego solo podemos estimar entre qué valores de
probabilidad se encuentra: como t = 2 se encuentra entre t=1.708 y t=2.060, su probabilidad se encontrará entre la de
estos mismos valores, es decir entre p = 1-0.950 = 0.05 y p = 1-0.975 = 0.025.
Opción correcta: C.
5- El número de horas que los empleados de la empresa dedican a navegar por Internet o enviar e-mails a sus amigos
oscila en la población entre los valores: A) , , ; B) 120,876 131,124; C) 118,545 133,455.
Respuesta: nos están pidiendo el intervalo de confianza al 95%. Aplicamos la fórmula después de calcular la cuasi-
desviación típica:
No hace falta calcular la cuasivarianza ya que en el formulario los alumnos tienen las fórmulas con la varianza, y así los
cálculos salen exactos. No obstante, presentamos los cálculos con el procedimiento (más costoso) de calcular la
cuasivarianza y luego su raíz cuadrada para mostrar que también con este procedimiento los cálculos son correcos.
y su cuasidesviación típica es, aproximadamente, 15.30. Sabiendo por las tablas que !"$# % .'() % 2.060, *uego:
La opción correcta es la A.
6- Los valores del intervalo de confianza para la varianza son: A) 132,01 y 556,10; B) 132,01 y 445,98; C) 143,92 y 445,89.
Respuesta:
# #
Sabiendo por las tablas que + .'() % 40.6465 y que + . #) % 13.1197
Opción correcta: C.
7- En un contraste de hipótesis sobre la media aritmética, el valor absoluto del valor crítico: A) es el mismo en un contraste
unilateral izquierdo y un contraste unilateral derecho; B) es el mismo en un contraste bilateral y unilateral derecho; C)
es el mismo en un contraste bilateral y unilateral izquierdo.
Respuesta:
A
8- La potencia de un contraste de hipótesis será mayor: A) a medida que aumenta el tamaño de la muestra; B) a medida
que disminuye el tamaño de la muestra; C) siempre es la misma suponiendo que H1 es verdadera.
Respuesta: la potencia depende de una manera importantísima del tamaño muestral ya que a medida que n aumenta, la
muestra se va pareciendo más a la población. Esto significa que la opción B es absolutamente incorrecta. La opción B
también es incorrecta por la misma razón. Opción válida A.
9- Las curvas de potencia permiten localizar la potencia de un contraste en función de: A) el tamaño de la población y de la
muestra; B) el valor de H1 y el tamaño de la muestra; C) el tamaño de la población y el valor de H1.
SITUACIÓN 2. El Barómetro del CIS de septiembre de 2011 señala que a la pregunta: ¿Cuál es el principal problema que
existe actualmente en España?, respondieron 468 jóvenes con edades comprendidas entre 25 y 34 años, de los cuales el
57,3% señalaban “el paro”, el 19,2% indicaban “los problemas de índole económica” y para el 9,4% el principal problema
era “la clase política y los partidos políticos”. En el mismo mes del 2012 ese rango de edad estaba compuesto por 480
jóvenes de los cuales a la misma pregunta, 216 señalaban “el paro”, 114 se pronunciaban por “los problemas de índole
económico” y 63 señalaban a “la clase política y los partidos políticos” como el principal problema. Nivel de confianza:
95%.
Si se quiere comprobar la hipótesis de que la percepción del paro como principal problema ha disminuido en 2012
respecto de 2011 en un porcentaje del 5%.
13- Respecto a la hipótesis nula: A) se rechaza porque el estadístico de contraste y el valor crítico son iguales; B) se rechaza
con un nivel de confianza del 95%; C) se rechaza con un nivel de confianza del 99%.
Respuesta:
la opción A es falsa porque el estadístico de contraste vale 2.26 mientras que el valor crítico (para un alpha unilateral de
0.05) es 1.65. Luego no son iguales.
La opción C es correcta ya que 2.26 > 1.65; o expresado en términos de las probabilidades 0.0119 < 0.05.
La opción C es incorrecta ya que al 99% unilateral, el valor crítico vale 2.33 pero el estadístico de contraste en este aso es
menor que el valor crítico (2.26 < 2.33); luego al 99% no se rechazaría H0. La opción C es falsa.
Si se quiere comprobar la hipótesis de que la percepción de los problemas de índole económica es la misma en 2011 y
en 2012:
Respuesta: a un nivel de confianza del 95%, 0.09 > 0.025 por lo que no podemos rechazar H0 ya que el estadístico de
contraste (1.70) es menor que el valor crítico (que sería según las tablas +/- 1.96), es decir, 1.70 < 1.96. Se encuentra en
la región de aceptación de H0.
SITUACIÓN 3. El artículo “Efecto de la temperatura sobre el pH de la leche” (Journal of Dairy Research, 1988, 277-280)
informó de un estudio en el que se utilizaron 5 temperaturas diferentes (medidas en grados centígrados) en condiciones
experimentales controladas en una granja y se midió el pH de la leche obtenida para cada temperatura. La ecuación de
regresión calculada fue 0 1 % 0,65 2 0,223. El objetivo era predecir el pH de la leche (Y) a partir de la temperatura (X).
Utilice un 4 % 0,05. Además se sabe que: 56 % 1,87 y 57 % 7,90.
18- La ecuación genérica de regresión de Y sobre X, 0 % 8 2 9 3 2 : , es una relación: A) probabilística ya que depende de
la cantidad aleatoria ;; B) funcional cúbica ya que existen tres componentes aditivos en la ecuación; C) determinista ya
que el valor de Y está completamente determinado por el valor de X.
Respuesta:
La relación es probabilística ya que aunque los dos primeros términos de la relación lineal sean deterministas, se asume
que el error (;) no lo es. Por consiguiente para cada valor de X, la parte 8 2 9 3 nos proporciona un valor determinista
pero al cual se le añade un valor aleatorio (;). La opción B es errónea porque la relación no es cúbica (para ello, X tendría
que estar elevado al cubo) y no, como dice el enunciado, el que hayan tres componentes aditivos. La opción C es
errónea por lo que hemos indicado en la opción A.
19- La distribución del error en la ecuación de regresión lineal simple 0 % 8 2 9 3 2 : tiene una media igual a: A) 0< ;B) 3< ;
C) 0.
Respuesta:
La opción de respuesta es C ya que es un supuesto del modelo de regresión lineal simple.
20- En regresión lineal simple, se asume que la desviación típica del error en la ecuación 0 % 8 2 9 3 2 : : A) es igual a la
unidad; B) es la misma para cada valor particular de X; C) es igual a 0.
Respuesta:
Este es otro de los supuestos del análisis de regresión simple: los errores se distribuyen con media igual a 0 y con la
misma varianza para los distintos valores de X. Luego la opción correcta es B. La opción A es incorrecta porque no se
asume que los errores sean puntuaciones típicas; la opción C es incorrecta porque si el error tuviese desviación típica (o
varianza) igual a 0, no existiría como tal error.
21- El estadístico para poner a prueba la significación del coeficiente de correlación entre el pH y la temperatura vale
aproximadamente: A) 3,91; B) 4,36; C) 1,32.
Respuesta:
El estadístico solicitado es una t que viene dada por la fórmula:
Para su cálculo tendremos que calcular previamente el coeficiente de correlación. Como nos proporcionan las
desviaciones típicas de X e Y (7,90 y 1,87 respectivamente) así como la pendiente (0,22), podemos utilizar la fórmula:
Y por consiguiente el estadístico buscado considerando que tenemos 5 datos (los cinco valores de temperatura
manipulados) es:
Opción correcta B.
22- El estadístico de la Tabla del Anova para poner a prueba si la Regresión como fuente de variación es significativa vale
aproximadamente: A) 19,0; B) 1,2; C) 2,1.
Respuesta:
Primera forma de hacerlo:
La otra forma de hacerlo es mucho más sencilla ya que disponemos del estadístico t y sabemos que t2 = F, luego:
Opción correcta A.
23- El contraste de hipótesis para determinar si la pendiente de la recta de regresión es significativa es: A) bilateral; B)
unilateral derecho; C) unilateral izquierdo.
Respuesta: en el apartado sobre regresión, no se plantea que los contrastes sean unilaterales, por lo que será bilateral.
Opción correcta A.
24- El intervalo de confianza para contrastar la pendiente vale aproximadamente: A) (0’38, 0’06); B) (-0’15, +0’15); C) (-0’32,
-0’15).
Respuesta:
Sabiendo que t con 5-2=3 grados de libertad y 0.975 vale 3.182, aplicamos la ecuación:
25- El coeficiente de correlación semiparcial entre el pH y la temperatura: A) coincide con el coeficiente de regresión
estandarizado; B) no tiene sentido calcularlo ya que estamos en una situación de regresión simple; C) coincide con el
coeficiente de determinación.
Respuesta: la opción correcta es la B ya que el coeficiente de correlación semi-parcial pretende calcular la correlación
entre dos variables eliminando el influjo de una tercera… pero aquí solo tenemos dos variables lo que hace absurdo su
cálculo.
Modelo D
Las preguntas y situaciones del modelo D son idénticas a las del modelo C con algunas variaciones en el orden. Por
consiguiente sólo incluimos la plantilla de este modelo:
SITUACIÓN 1. Chaves y Noguera (2008) estudiaron la inserción laboral de los titulados en Psicología de cinco
promociones consecutivas (desde 2002 hasta 2006). Entre aquellos sujetos que estaban trabajando 6 meses después
de finalizar sus estudios, el 81% son mujeres, el 31% accedieron al trabajo mediante contactos personales y el 54%
trabajaban a jornada completa. Suponiendo que el número de titulados que trabajaban 6 meses después de finalizar
sus estudios es igual a 400.
1- Con un nivel de confianza del 99%, los límites del intervalo de confianza para la proporción de mujeres tituladas
en psicología que estaban trabajando 6 meses después de finalizar sus estudios, son: A) 0,76 y 0,86; B) 0,70 y
0,92; C) 0,80 y 0,82
√ {
2- Si se quiere comprobar que la proporción de titulados que trabajan a jornada completa es distinta de los que
trabajan a media jornada, la hipótesis alternativa que se ha de plantear es: A) ; B) ; C)
3- Si se quiere comprobar que la proporción de titulados que trabajan a jornada completa es distinta de los que
trabajan a media jornada, el valor del estadístico de contraste es aproximadamente igual a: A) 2,33; B) 2,58; C)
1,6.
√ ( ) √
4- Si se quiere comprobar que la proporción de titulados que trabajan a jornada completa es distinta de los que
trabajan a media jornada, el nivel crítico es aproximadamente igual a: A) 2,58; B) 0,05; C) 0,1096.
En la tabla de curva normal comprobamos que la probabilidad de encontrar valores superiores a: es igual
a . Como el contraste es bilateral:
5- Si se quiere comprobar que la proporción de titulados que trabajan a jornada completa es distinta de los que
trabajan a media jornada, con un nivel de confianza del , concluimos que: A) La proporción de sujetos que
trabajan a media jornada no difiere significativamente de la proporción de sujetos que lo hacen a jornada
completa, B) en la población es superior la proporción de sujetos que trabajan a jornada completa; C) en la
población son diferentes ambas proporciones.
6- Con un nivel de confianza del 99%, ¿cuál debería ser el tamaño de la muestra para estimar con un error máximo
de 0,02 la proporción de titulados que accedieron al trabajo mediante contactos personales? A) 570; B) 2054; C)
3560.
⁄
( )
-1-
7- Trabajando con una muestra aleatoria de 100 observaciones extraídas de una población con varianza igual a 16,
planteamos un contraste sobre la media con: . Si fijamos un nivel de confianza del 99%, rechazaremos
la hipótesis nula si: A) la media de la muestra es superior a 10,66; B) la media de la muestra es superior a
10,932; C) necesitamos conocer la media muestral para determinar a partir de qué valor rechazaremos la
hipótesis nula.
̅ ̅
̅
√
8- En un contraste de hipótesis sobre una media, si es cierta la hipótesis alternativa pero no se detecta en el
contraste estadístico, se comete un error: A) de tipo II; B) de tipo I; C) igual al nivel crítico.
9- La potencia del contraste es igual a: A) probabilidad de aceptar la hipótesis nula siendo cierta; B) probabilidad de
rechazar la hipótesis nula siendo falsa; C) probabilidad de rechazar la hipótesis alternativa siendo verdadera.
SITUACIÓN 2. Uno de los mejores indicadores de la salud psicológica es el auto-concepto (Esnaola, Goñi y Madariaga
2008) que hace referencia a la idea u opinión que cada persona tiene de sí misma. En una investigación realizada por
Esnaola y Revuelta (2009) con una muestra de 300 jóvenes de la Comunidad Autónoma de Cantabria y País Vasco se
analizan las relaciones entre la actividad física y el auto-concepto. La edad media fue de 18,64 años y la desviación
típica igual a 3,51 años. Por sus respuestas a un cuestionario sobre prácticas físico-deportivas el 69% fueron
clasificados como activos frente al resto que fueron clasificados como inactivos. En la escala de auto-concepto físico,
la media y desviación típica insesgada de los inactivos fue de 22,41 y 4,1 respectivamente y en el grupo de activos,
de 23,7 y 4,83. Y en la escala de auto-concepto general, la media y desviación típica insesgada de los inactivos fue de
23,76 y 3,6 respectivamente y en el grupo de activos, de 25,51 y 3,4.
Muestra total: ̅
Escalas de autoconcepto:
̅ ̂
Activos 23,70 4,83
Físico
Inactivos 22,41 4,10
Activos 25,51 3,40 207
General
Inactivos 23,76 3,60 93
10- El análisis de las diferencias entre las puntuaciones obtenidas por los sujetos activos en las escalas de auto-
concepto físico y auto-concepto general se realizaría mediante un contraste de diferencia de medias entre: A)
muestras independientes con varianzas poblacionales desconocidas pero supuestas iguales; B) muestras
independientes con varianzas poblacionales desconocidas pero supuestas distintas; C) muestras relacionadas.
11- La comparación de los resultados obtenidos por los jóvenes activos e inactivos en la escala de auto-concepto
físico se realiza mediante un contraste: A) de dos muestras relacionadas con varianzas desconocidas; B) no
paramétrico para muestras independientes; C) de dos muestras independientes con varianzas poblacionales
desconocidas.
12- El investigador sospecha que el auto-concepto físico es mayor para los sujetos activos que para los inactivos. Con
un nivel de confianza del 95%, el valor absoluto del estadístico de contraste que obtiene en el contraste de esta
hipótesis es, aproximadamente: A) 4,37; B) 3,21; C) 2,24.
̅ ̅
( )̂ ( )̂ √ ( )
√ ( )
-2-
13- El investigador sospecha que el auto-concepto físico es mayor para los sujetos activos que para los inactivos. Del
estadístico de contraste obtenido, se desprende que: A) Los sujetos físicamente activos se perciben mejor en la
escala de auto-concepto físico que los sujetos inactivos (p<0,01); B) Los sujetos físicamente activos se perciben
mejor en la escala de auto-concepto físico que los sujetos inactivos (p<0,05); C) Los sujetos físicamente activos
no se perciben mejor en la escala de auto-concepto físico que los sujetos inactivos (p>0,05).
Dado que los grados de libertad son superiores a 100, acudimos a la tabla de curva normal para calcular el nivel
crítico: (con un programa informático observaríamos que el nivel crítico es: ). Por lo tanto,
el resultado es significativo para un nivel de confianza del 95% ( ), pero no lo es para un nivel de
confianza del 99% ( )
14- Con los datos de la investigación de Esnaola y Revuelta en la escala de auto-concepto físico, el índice “d” de
Cohen para analizar el tamaño del efecto vale, aproximadamente: A) 0,55; B) 0,28; C) 0,64.
|̅ ̅|
( )̂ ( )̂ √
√
15- La importancia o relevancia práctica de la diferencia entre las medias obtenidas por los sujetos activos e inactivos
en la escala de auto-concepto físico se interpreta a partir de: A) la magnitud del estadístico de contraste; B) el
valor del nivel crítico p; C) el estadístico d de Cohen.
16- Si el investigador quiere comprobar que los sujetos activos tienen un auto-concepto general mayor que los
sujetos inactivos, la hipótesis nula a contrastar que formularía es: A) B)
; C)
17- Las pruebas no paramétricas se utilizan en diseños en los que se trabaja con: A) Muestras no representativas de la
población objetivo del estudio; B) Muestras pequeñas o variables que no alcanzan el nivel de medida de
intervalo o razón; C) Variables medidas con escala de intervalo que provienen de poblaciones con distribución
poblacional desconocida.
SITUACIÓN 3. El artículo ”Growth hormone and sex steroid administration in healthy aged women and men” (Journal
of the American Medical Association, 2002, 2282-2292) describe un experimento para evaluar el efecto de cuatro
tratamientos en varias características corporales. En este experimento doble-ciego, 57 mujeres de 65 años o más se
asignaron al azar a uno de los siguientes tratamientos: (1) hormona del desarrollo placebo y esteroide placebo (P+P);
(2) hormona del desarrollo placebo y el esteroide estradiol (P+S); (3) hormona del desarrollo y esteroide placebo
(G+P) y (4) hormona del desarrollo y esteroide estradiol (G+S). Se midió el cambio en la grasa corporal durante un
periodo de 26 semanas después del tratamiento. Los investigadores informaron que el factor manipulado fue
significativo [F(3, 53) = 10,48, MCintra = 1,92]. Utilice un .
19- Los cuatro niveles del factor se manipularon de tal forma que: A) cada sujeto pasó por todas las condiciones; B)
cada sujeto pasó por una única condición; C) todos los sujetos recibían algún tratamiento diferente del placebo.
-3-
En la siguiente tabla de ANOVA se representan en negrita los valores proporcionados por el enunciado, de los que
fácilmente deducimos el resto.
FV SC g.l. MC F
Inter 3
Intra 53 1,92 10,48
Total 56
21- El cociente obtenido entre la media cuadrática inter-sujetos y la media cuadrática intra-sujetos, indica que: A) no
pudo rechazarse la hipótesis nula; B) el cambio medio en la grasa corporal es el mismo para los cuatro
tratamientos; C) el factor manipulado resultó significativo.
22- La Suma de Cuadrados inter-sujetos representa: A) la suma de las desviaciones al cuadrado de cada una de las
puntuaciones en relación a la media global; B) la variabilidad medida de forma separada dentro de cada muestra
y luego combinándola para todas las muestras; C) la variabilidad que puede explicarse, en cierto grado, por las
diferencias entre las medias de cada condición en relación a la media global.
23- El valor F obtenido en una Tabla del Anova es: A) el cociente entre dos estimaciones insesgadas de las varianzas
poblacionales; B) el resultado de dividir la Suma de Cuadrados entre-sujetos y sus grados de libertad; C) una
distribución de probabilidad.
24- El experimento es de efectos fijos porque: A) las cuatro condiciones utilizadas se han extraído al azar de entre
todas las condiciones posibles; B) solo interesan las cuatro condiciones manipuladas; C) en cada condición se
han mantenido fijas las condiciones durante todo el experimento.
25- Asumiendo la siguiente ordenación P+P, P+S, G+P, G+S, de las condiciones, si los investigadores hubiesen deseado
poner a prueba la existencia de diferencias entre el grupo bajo la condición (P+P) y el grupo bajo la condición
(G+S), los coeficientes que necesitaría utilizar en el contraste, son: A) (1, 0, 0, -1); B) (½, 0, ½, -1) ; C) (2, 0, 0, -1).
-4-
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS
Enero/febrero 2014. Código asignatura: 62012054
MODELO A DURACION: 2 HORAS
Material: Formulario, Tablas y calculadora no programable
Calificación= (0,4 x Aciertos) - (0,2 x Errores)
SITUACIÓN 1. Un psicólogo educacional interesado en estudiar el estilo educativo utilizado por los padres,
dispone de una muestra de 200 familias, observando que 40 de ellas aplican un estilo autoritario que prioriza
el cumplimiento de las normas, 100 emplean un estilo equilibrado, que a pesar de mantener valores altos en
exigencias y control, adapta las estrategias educativas a cada situación concreta, y el resto de las familias
utilizan un estilo permisivo, con poca consistencia en las normas y un elevado grado de sobreprotección.
Nivel de confianza 95%.
1- El error típico para la proporción de familias que utilizan un estilo permisivo, es: A) 0,05; B) 0,0324; C) 0,01.
( )
√ √
2- A partir de los datos obtenidos en la muestra, la proporción poblacional de familias que utilizan un sistema
permisivo es un valor comprendido entre: A) 0,2164; 0,3836; B) 0,2365; 0,3635; C) 0,1934; 0,4066
3- Si el psicólogo quiere comprobar que la proporción de familias que utilizan un sistema permisivo es distinta
de 0,25, ¿Cuál es la hipótesis nula? A) ; B) )
4- El psicólogo quiere comprobar que la proporción de familias que utilizan un sistema permisivo es distinta de
0,25. La conclusión a la que llega es: A) mantener la hipótesis nula; B) rechazar la hipótesis nula; C) rechazar
la hipótesis nula porque la proporción en la muestra se aleja mucho de la proporción postulada por la
hipótesis nula.
-1-
√ ( ) √
5- El psicólogo quiere comprobar que la proporción de familias que utilizan un sistema equilibrado es distinta
de 0,5. Con los datos de la muestra, la conclusión a la que llega es: A) rechazar la hipótesis nula; B) mantener
la hipótesis nula; C) no puede llegar a una conclusión, porque el estadístico de contraste es igual a cero.
La proporción de familias que utilizan un sistema equilibrado es: , luego no sería ni siquiera
necesario realizar el contraste de hipótesis, dado que la proporción de la muestra es igual que la hipótesis
nula. Efectivamente:
√ ( ) √
6- Si el psicólogo quiere comprobar que la proporción de familias que utilizan un sistema equilibrado es distinta
de 0,5 ¿Cuál es el nivel crítico?: A) uno; B) cero; C) no se puede calcular.
La distribución normal tipificada tiene por media cero, luego la probabilidad de obtener un valor más
extremo es 0,5, y como el contraste es bilateral, multiplicamos por dos esta probabilidad.
8- Suponiendo que es cierta, ¿Cuál de las siguientes probabilidades está asociada al estadístico de
contraste?: A) la probabilidad de rechazarla; B) la probabilidad de encontrar valores más extremos que el
valor crítico; C) la probabilidad de encontrar valores iguales a los obtenidos en la muestra, o más
extremos.
SITUACIÓN 2. “El Programa Internacional para la Evaluación de la Competencia de los Adultos del 2013
(PIAAC, por su sigla en Inglés) sitúa a España en los últimos puestos entre los países de la OCDE, solo por
encima de Italia, en comprensión lectora. Los españoles examinados de entre 15 y 65 años obtuvieron en
comprensión lectora una media igual a 252 puntos, 21 por debajo de la media de la OCDE y 19 por debajo de
la media de la UE. Entre sus conclusiones destaca la estrecha relación entre los niveles de comprensión
lectora de los adultos y sus posibilidades de encontrar trabajo”. Imagine que, ante estos resultados, usted
desea corroborar si el nivel de comprensión lectora de los jóvenes con empleo es significativamente mayor
que la de los jóvenes desempleados. Para ello, selecciona una muestra de 182 jóvenes de su localidad con
-2-
edades comprendidas entre 25 y 34 años, de los que el 33,5% están en situación de desempleo, y les aplica
la misma prueba. La media y desviación típica insesgada de los desempleados es de 251 y 115,
respectivamente, frente a 289 y 92 de los que tienen empleo. Establezca un nivel de significación de 0,05.
Con empleo
9- En función de sus objetivos, ¿cuál de las siguientes hipótesis está correctamente formulada?: A)
B) C)
10- El estadístico de contraste para comprobar si las dos muestras provienen de poblaciones con la misma
varianza es: A) 1,562; B) 1,391; C) 2,031.
̂
̂
11- El nivel crítico que corresponde al estadístico de contraste sobre la igualdad de las varianzas poblacionales
es: A) p < 0,01; B) p < 0,0025; C) p < 0,05.
En la distribución F con y grados de libertad figuran los valores 1,53 que deja
por debajo una probabilidad de 0,975 (y por encima de 0,025) y el valor 1,656 que deja por debajo una
probabilidad de 0,99 y por encima de 0,01.
-3-
Dado que el contraste es bilateral, hay que multiplicar por dos las probabilidades obtenidas en las tablas,
luego, finalmente:
12- El análisis de datos que utilizará en su estudio es el que corresponde a: A) una muestra con varianza
poblacional desconocida; B) dos muestras independientes extraídas de dos poblaciones con la misma
varianza; C) dos muestras independientes extraídas de dos poblaciones con varianzas distintas.
13- El error típico de la distribución muestral de la diferencia de medias es: A) 17,8; B) 15,74; C) 16,94.
Habiendo rechazado la de igualdad de varianzas, el error típico de la distribución muestral, es:
̂ ̂
̅ ̅ √ √
14- El valor absoluto del estadístico de contraste y el nivel crítico p para tomar una decisión respecto a su Ho,
son, aproximadamente: A) 2,24 (p > 0,05); B) 2,41 (p < 0,005); C) 2,24 (p < 0,025).
La distribución muestral de la diferencia de medias en muestras extraídas de poblaciones con varianzas
distintas es la distribución t de Student:
(̅ ̅) ( ) ( )
̅ ̅
̂ ̂
( ) ( )
̂ ̂ ( ⁄ ) ( ⁄ )
( ⁄ ) ( ⁄ )
En la distribución t con 100 gl (los más próximos a 99), el estadístico se encuentra entre los valores
1,984 y 2,364 que dejan por encima una probabilidad de 0,025 y 0,01, respectivamente. Por tanto, al valor
le corresponde un nivel mayor que 0,01 y menor que 0,025.
15- Si quiere contrastar la hipótesis de que la proporción de empleados entre los jóvenes de su localidad supera
en más de quince puntos porcentuales a la proporción de desempleados, el estadístico de contraste es, en
valor absoluto: A) 2,43; B) 4,22; C) 3,47.
( ) ( ) ( ) ( )
√ √
( ) ( )
16- Si optase por utilizar muestras más grandes y suponiendo que se mantienen los mismos estadísticos
obtenidos en estas muestras, ¿cuál de las siguientes consecuencias se producirían?: A) aumentaría el
-4-
tamaño del efecto; B) aumentaría la probabilidad de rechazar la hipótesis nula; C) disminuiría la potencia
del contraste.
En primer lugar, completamos la tabla de ANOVA con los datos del enunciado (en rojo y negrita):
FV SC gl MC F
A (Edad) 0,578 1 0,578 1,802
B (Grupo) 0,446 1 0,446 1,390
AxB 2,344 1 2,344 7,302
Intra 19,26 60 0,321
Total 22,629 63
17- Como tenemos un diseño equilibrado, esto significa que: A) los niveles elegidos son los únicos que nos
interesan; B) el número de sujetos en cada combinación de Edad y Grupo es de 16; C) los niveles elegidos
se han escogido al azar de entre todos los posibles.
Son 64 personas las que forman parte del experimento, como tenemos cuatro combinaciones de
tratamientos, en cada una de ellas hay 16 personas.
18- El número de razones básicas que tenemos que calcular en este diseño, para realizar la tabla de ANOVA, son:
A) 2; B) 4; C) 5.
Las razones básicas que hay que calcular son: [A], [B], [AB], [Y] y [T]
19- Si asumimos que una mayor CRP indica un mejor sistema inmune, y que tomar Omega-3 aumenta la
concentración de proteína c-reactiva entonces: A) no pueden producirse puntuaciones negativas en la
variable dependiente; B) según H0, las puntuaciones de la variable dependiente fluctuarán alrededor de la
unidad; C) para los sujetos que toman Omega-3, la mayor parte de las puntuaciones en la variable
dependiente serán negativas.
-5-
21- Los grados de libertad de la F para el factor Edad serán: A) (1, 60); B) (2, 60) C) 60.
22- El valor de la SC de los sujetos dentro de los tratamientos (S/AB o, lo que es lo mismo, del error) es
(aproximadamente): A) 19,26; B) 2,34; C) 0,321.
24- Como la interacción resultó significativa, se aplicó un test de efectos simples. Los resultados indicaron que
sólo las personas mayores que tomaron Omega-3 obtuvieron puntuaciones menores en la variable
dependiente respecto a los otros tres grupos. Esto significa que: A) sólo los jóvenes se beneficiaron de tomar
Omega -3; B) suplementar una dieta ya de por sí equilibrada es beneficioso para las personas mayores; C)
tomar Omega -3 no es beneficioso ni para jóvenes ni para mayores.
25- En esta situación deberíamos realizar el análisis de los efectos simples considerando: A) dos fuentes de
variación; B) cuatro fuentes de variación; C) tres fuentes de variación.
-6-
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS
Enero/febrero 2014. MODELO C
Calificación= (0,4 x Aciertos) - (0,2 x Errores)
SITUACIÓN 1. “PIAAC (Programme for International Assessment of Adult Skills) es un estudio internacional
que mide las destrezas cognitivas básicas que permite a las personas adultas participar en la vida social y
económica del siglo XXI y también las habilidades laborales básicas que exige su puesto de trabajo. En su
último estudio realizado en el año 2013 comparando los resultados de 23 países de la OCDE muestra que los
adultos españoles de entre 16 y 65 obtuvieron en matemáticas el último puesto, con una media de 246
puntos, 23 por debajo de la media de la OCDE y 22 por debajo de la media de la UE. Entre sus conclusiones
destaca que los jóvenes españoles puntúan mucho más alto que los mayores y están más cerca de la media
de la OCDE y que la tasa de paro de los españoles con competencias matemáticas en los niveles inferiores es
tres veces superior de la que están en los niveles superiores”. Imagine que usted aplica la misma prueba a una
muestra representativa de 121 jóvenes de su localidad con edades comprendidas entre 16 y 34 años
obteniendo una media de 252 puntos con una desviación típica insesgada de 77 puntos, siendo la proporción
de jóvenes desempleados del 28,5%.
Datos del enunciado:
España OCDE UE Sus datos
Media 246 269 268 252
Cuasi-desvTipica 77
Tamaño muestra 121
1- Utilizando los datos de su estudio y con un nivel de confianza del 95%, el intervalo de confianza de la media
de la población de los jóvenes españoles en competencias matemáticas: A) no se puede calcular porque
desconocemos el tamaño de la muestra general; B) es un valor comprendido entre 238,3 y 265,7; C) es un
valor comprendido entre 240,5 y 263,5.
⁄
√ √
̅ {
2- Si su interés es comprobar que la media de los jóvenes españoles es significativamente inferior que la media
general de los adultos de la UE, la hipótesis nula a contrastar es: A) B) C)
.
-1-
3- El estadístico de contraste para comprobar que la media de los jóvenes españoles es inferior a la media
general de los adultos de la UE es: A) 2,6; B) – 2,678 C) -2,29.
̅ ̅
̅
⁄ ⁄
√ √
4- El nivel crítico p asociado al estadístico de contraste para comprobar que la media de los jóvenes españoles
es inferior a la media general de los adultos de la OCDE es: A) p=0,0110; B) p=0,0220; C) p<0,01.
̅ ̅
̅
⁄ ⁄
√ √
Dado que trabajamos con más de 100 grados de libertad, acudimos a la tabla de curva normal, observando
que el nivel crítico es aproximadamente: p = 0,0075.
5- Un nivel crítico p = 0,0254 asociado a un estadístico de contraste indica que: A) la probabilidad de que la Ho
sea verdadera vale 0,0254; B) no podemos rechazar la Ho con un nivel de confianza del 99%; C) el error de
aceptar una hipótesis nula que es verdadera es de 0,0254.
El nivel crítico p representa la probabilidad de que siendo cierta la Ho, encontremos unos datos muestrales
como los obtenidos en nuestra investigación o más extremos. Se utiliza como criterio de decisión respecto a
la Ho de forma que se rechaza la hipótesis nula si p es menor que el nivel de significación y no se rechaza en
caso contrario. Por tanto, al ser el valor de p=0,0254 mayor que el nivel de significación establecido en 0,01,
la respuesta correcta es la B.
6- Con un nivel de confianza del 95%, el error máximo de estimación de la varianza poblacional de los jóvenes
españoles de su localidad es, aproximadamente: A) 2928; B) 1494; C) 19,4.
⁄
√ √
7- A partir de los datos de su estudio, y con un nivel de confianza del 95%, ¿entre que valores estimaría la
proporción jóvenes desempleados en su localidad?: A) 0,179 y 0,391 B) 0,217 y 0,352; C) 0,205 y 0,365.
( ) ( )
⁄
√ √
-2-
8- Si queremos estimar la varianza poblacional con un error máximo de estimación que no supere los 200
puntos, ¿cuál debería ser, aproximadamente, el tamaño de la muestra que deberíamos utilizar con un nivel
de confianza del 95%?: A) 11388; B) 6752; C) 5673.
SITUACIÓN 2. En una muestra de 64 mujeres que fueron sometidas a mastectomía se midió la autoestima
mediante la escala de Rosenberg, obteniéndose una media igual a 22 puntos y una cuasivarianza igual a 56.
Tras un tratamiento psicológico sobre manejo de estrés y habilidades de afrontamiento personal, se observa
la misma variabilidad (cuasivarianza igual a 56), siendo ahora la puntuación media en autoestima igual a 27
puntos. La cuasivarianza de las diferencias entre las puntuaciones “antes” y “después” del tratamiento fue
igual a 100. Por otro lado, en otra muestra de 64 mujeres, que no han sido sometidas a ninguna
intervención quirúrgica y que presentan unas características similares a las de la muestra anterior en las
variables edad, estado civil, profesión y nivel de estudios, la media en la escala de autoestima de Rosenberg
fue igual a 28,25 con cuasivarianza igual a 44. Con estos datos se pretende dar respuesta a las siguientes
preguntas: 1º) ¿es eficaz el tratamiento psicológico?, es decir ¿logra que las puntuaciones en autoestima se
incrementen después del mismo? 2º) ¿Es inferior la puntuación media en autoestima en la primera muestra
antes del tratamiento respecto de la puntuación media de la segunda muestra? 3º) ¿Es igual la media en
autoestima en la primera muestra después del tratamiento, respecto a la puntuación media de la segunda
muestra? Nivel de confianza 99%.
Media Cuasivarianza n
Muestra 1 ̅ ̅ ̂ ̂ 64 ̂
Muestra 2 ̅ ̂ 64
11- La probabilidad de encontrar un valor igual o más extremo que el estadístico de contraste es: A) menor que
0,005; B) 0,01; C) 0,05.
-3-
Consultando la tabla t de Student para 60 grados libertad (los más próximos a: n – 1 = 63), observamos que
el estadístico de contraste es más extremo que la puntuación -2,66, por lo que la respuesta es A.
12- A partir de los resultados obtenidos en el estudio podríamos decir que: A) el tratamiento psicológico no es
eficaz; B) el tratamiento psicológico es eficaz; C) se debería incrementar el tamaño de la muestra porque el
tamaño del efecto no es muy elevado.
√ ( )
14- Los resultados obtenidos indican que la media en autoestima en la primera muestra antes del tratamiento
es: A) inferior a la media en autoestima de la segunda muestra; B) superior a la media en autoestima de la
segunda muestra; C) inferior a la media en autoestima de la segunda muestra a un nivel de confianza del
95%, pero no a un nivel de confianza del 99%.
√ ( )
16- Los resultados indican que la media en autoestima de la primera muestra después del tratamiento es: A)
menor que la media en autoestima de la segunda muestra; B) igual que la media en autoestima de la
segunda muestra; C) distinta de la media en autoestima de la segunda muestra
SITUACIÓN 3. El artículo “¿Cómo comen hombres y mujeres después de la exposición a información textual e
imágenes de cuerpos ideales?” (Communication Research, 2006, 507-529) describe un experimento en el que
74 varones fueron asignados al azar a uno de cuatro tratamientos: 1) visionado de hombres musculosos y en
forma; 2) visionado de hombres musculosos y en forma acompañados por información textual relacionada
con la dieta y el ejercicio físico; 3) visionado de hombres musculosos y en forma acompañados por
información textual no relacionada con la dieta y el ejercicio físico; 4) a un cuarto grupo (control) no se les
presentó nada. Posteriormente los participantes fueron enviados a otra sala para completar un cuestionario.
En esta sala había cuencos con galletas (pretzels) que el participante podía comer a voluntad. Un ayudante
de investigación registró cuantas galletas consumió cada participante mientras completaba el cuestionario.
El investigador informó que el efecto del tratamiento sobre el consumo de galletas fue significativo [F(3, 70)
= 5’273, MCe = 10’264, p = 0’002].
-4-
Con los datos del enunciado (rojo y negrita en la tabla) completamos la tabla de ANOVA.
FV SC gl MC F
Inter 162,366 3 54,122 5,273
Intra 718,480 70 10,264
Total 880,846 74 - 1 = 73
17- La hipótesis que se pone a prueba en este análisis es que: A) la varianza poblacional de la variable
dependiente es igual en los 4 grupos; B) la media poblacional de la variable dependiente es idéntica en los
4 grupos; C) que la homocedasticidad se cumple en estos datos.
18- Un supuesto necesario para poder llevar a cabo el análisis de los datos de este experimento es que: A) la
hipótesis nula debe ser siempre bilateral; B) la variable dependiente tiene que ser continua; C) la escala de
medida debe ser de intervalo o razón.
19- Si hubiésemos aplicado pruebas T de Student para grupos independientes, deberíamos haber realizado: A)
un ANOVA; B) una regresión lineal; C) 6 tests.
22- El valor de la F crítica para un Nivel de Confianza del 99% es: A) igual a 4,126; B) menor que 4,126; C) al ser
un contraste bilateral, mayor que 4,729.
El valor más aproximado que podemos consultar en las tablas es para 1 y 60 grados de libertad, que es igual
a 4,126. Como los grados de libertad del denominador (73) son mayores que 60, el valor crítico será menor
que 4,126
24- Si el investigador quisiera comparar los tres primeros niveles vs el nivel del grupo de control debería utilizar
un vector de coeficientes igual a: A) ( ); B) ( ); C) ( ).
25- El cálculo de la interacción entre el consumo de galletas y el tratamiento: A) tiene los mismos grados de
libertad que el efecto del tratamiento; B) tiene la misma media cuadrática del error que el efecto del
tratamiento; C) no tiene sentido.
-5-
Modelo A. Septiembre 2014. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y cualquier tipo de calculadora
en la que no se pueda introducir texto
1. El error típico de la media representa: A) la máxima diferencia que cabe esperar por simple azar entre la
media obtenida en la muestra y la media de la población formulada en la 𝐻0 ; B) la desviación típica de la
distribución muestral de la media; C) el error que se comete al estimar la media poblacional a partir de
la media de la muestra.
2. Utilizando únicamente los datos de la muestra y fijando un nivel de confianza del 95%, el intervalo de
confianza en el que estimamos que se encontrará la media del cuestionario de depresión para la
población de jóvenes de familias inconsistentes es un valor comprendido entre: A) 3,21; 5,38; B) 3,65;
4,95; C) 3,18; 5,42.
𝑆𝑛 3,5 3,18
𝐼𝐶 = 𝑌̅ ± 𝐸𝑚𝑎𝑥 = 𝑌̅ ± 𝑡1−𝛼⁄2 = 4,3 ± 2,021 →{
√𝑛 − 1 √41 − 1 5,418
3. Con un nivel de confianza del 99%, el intervalo de confianza de la proporción de hijos provenientes de
familias inconsistentes, es: A) 0,231; 0,453; B) 0,196; 0,487; C) 0,151; 0,533.
4. Si el investigador desea contrastar la hipótesis de que la varianza del cuestionario de depresión para la
población de jóvenes que provienen de familias inconsistentes es significativamente distinto del
obtenido en las investigaciones anteriores, el estadístico de contraste que obtendría es: A) 34,27; B)
49,05; C) 20,55.
2
𝑛 𝑆𝑛2 41 ∙ 3,52
𝑋 = 2 = = 49,048
𝜎𝑜 3,22
5. El nivel crítico p asociado al estadístico de contraste de la varianza poblacional es: A) 𝒑 > 𝟎, 𝟎𝟓; B)
𝑝 < 0,01; C) 𝑝 < 0,05.
En la distribución chi-cuadrado con 40 gl, el valor 49,047 se encuentra entre los valores 29,05 y 51,805
que dejan por debajo probabilidades de 0,1 y 0,9. Por tanto, la probabilidad de encontrar valores tan
extremos o más que 49,047 es, para un contraste bilateral, mayor de 0,05 (el nivel de significación más
alto que suele utilizarse en la investigación psicológica).
6. A la luz de estos resultados el investigador concluye que, la varianza del cuestionario de depresión para
la población de su investigación: A) No difiere significativamente del obtenido en investigaciones
anteriores ( 𝒑 > 𝟎, 𝟎𝟓 ); B) Difiere significativamente del obtenido en investigaciones anteriores
(𝑝 < 0,01); C) Difiere significativamente con un nivel de confianza del 95%.
7. El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula que es
verdadera, recibe el nombre de: A) Potencia del contraste; B) Error tipo II; C) Nivel de significación.
8. A medida que aumenta el tamaño de la muestra, aumenta también: A) La potencia del contraste; B) La
amplitud del intervalo de confianza; C) El error tipo II.
SITUACIÓN 2: “Uno de los componentes de la crianza es la consistencia interparental, es decir, el grado de
coincidencia o similitud que padres y madres muestran en las diferentes prácticas educativas”. En un estudio
realizado por Rodríguez, Del Barrio y Carrasco (2009) se analizan las manifestaciones emocionales de los
hijos en relación con la inconsistencia interparental, mostrando que los hijos procedentes de hogares
inconsistentes manifiestan más conductas depresivas que los hijos de hogares consistentes. Un investigador
que desea replicar estas conclusiones, utiliza una muestra aleatoria de 120 jóvenes de los que los que el 35%
provienen de hogares inconsistentes (Grupo 1) frente al resto que provienen de hogares consistentes (Grupo
2). Todos los sujetos responden a un cuestionario para medir respuestas emocionales de agresividad. Las
medias y cuasi-desviaciones típicas del grupo 1 son 11,9 y 3,2 y para el grupo 2 son 10,7 y 2,9
respectivamente.
9. El diseño que utiliza el investigador es: A) De dos muestras independientes; B) De dos muestras
relacionadas; C) Intrasujetos pre-test post-test.
10. Para contrastar si las muestras provienen de poblaciones con la misma varianza, aplicaría la prueba: A) t
de Student porque se desconocen las varianzas poblacionales; B) F de Snedecor; C) Chi-cuadrado para
muestras independientes.
11. El estadístico de contraste sobre la igualdad de varianzas vale, aproximadamente: A) 1,49; B) 1,22; C)
0,92.
𝑆̂𝐺1
2
3,22
𝐹= 2 = = 1,217
𝑆̂𝐺2 2,92
12. Con un nivel de confianza del 99%, el valor crítico superior más aproximado que podemos encontrar en
las tablas para rechazar la 𝐻0 de igualdad de las varianzas poblacionales en un contraste bilateral, es: A)
2,079; B) 1,936; C) 1,744.
Si el investigador quiere comprobar que la respuesta emocional de agresividad en los jóvenes de familias
inconsistentes es mayor que la de jóvenes de familias consistentes.
13. La hipótesis nula que formula es: A) H0 : μG1 > μG2 ; B) H0 : μG1 − μG2 ≥ O; C) 𝐇𝟎 : 𝛍𝐆𝟐 ≥ 𝛍𝐆𝟏
14. Asumiendo que se cumple el supuesto de igualdad de varianzas, el estadístico de contraste que obtiene,
es: A) 2,08; B) -3,21; C) 0,39.
(𝑌̅𝑔1 − 𝑌̅𝑔2 ) − (𝜇𝑔1 − 𝜇𝑔2 ) (11,9 − 10,7) − 0
𝑇= = = 2,08
2 2
(𝑛 − 1)𝑆̂12 + (𝑛𝑔2 − 1)𝑆̂22 1 1 √(42 − 1)3,2 + (78 − 1)2,9 ( 1 + 1 )
√ 𝑔1 ( + ) 42 + 78 − 2 42 78
𝑛𝑔1 + 𝑛𝑔2 − 2 𝑛𝑔1 𝑛𝑔2
15. El nivel crítico p asociado al estadístico de contraste es: A) 𝑝 > 0,05; B) 𝑝 < 0,01; C) 𝒑 < 𝟎, 𝟎𝟓.
16. Con los resultados obtenidos, el investigador concluye que: La respuesta emocional de agresividad en los
jóvenes de familias inconsistentes….: A) no difiere de la de jóvenes de familias consistentes; B) es
significativamente mayor que la de los jóvenes de familias consistentes (𝑝 < 0,01); C) es
significativamente mayor que la de los jóvenes de familias consistentes (𝒑 < 𝟎, 𝟎𝟓).
SITUACIÓN 3: En un estudio publicado por García, Navas, Cuadrado, y Molero (2003) con el título:
"Inmigración y prejuicio: Actitudes de una muestra de adolescentes almerienses" se analiza la imagen que los
adolescentes de una zona, con alta recepción de trabajadores extranjeros, tienen acerca de los inmigrantes.
Entre sus resultados se indica que existen diferencias significativas en la imagen de los inmigrantes en
función del sexo y de la edad de los adolescentes, siendo más bajas para las chicas y para los de mayor edad.
Imagine que desea comprobar si estas diferencias existen también en otras zonas donde la recepción de
inmigrantes es menor. Para ello, selecciona una muestra de 20 adolescentes con edades comprendidas entre
14 y 16 años de los que el 50% son chicas. La mitad son de 2º de la ESO y el resto de 4º de la ESO. Todos ellos
responden a la Escala de Racismo Moderno de McConahay y cols. (1981). Se asume que los datos cumplen
los supuestos necesarios para realizar el análisis estadístico correspondiente. Representando por A la
variable sexo y por B la variable edad se obtienen los siguientes resultados parciales: 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 70,55;
𝑀𝐶𝐼𝑛𝑡𝑟𝑎 = 1,525; [𝑌] = 1303; [𝐴] = 1240,9; [𝐵] = 1243,7.
Se trata de una ANOVA de dos factores (sexo y edad) con dos niveles en cada factor. Hay 10 chicas, 5 de 2º y
otras 5 de 4º de la ESO. Y los mismo para los chicos, por lo que se trata de un diseño equilibrado con 5 sujetos
en cada nivel del factor. Con los datos del enunciado vamos completando la siguiente tabla del ANOVA:
FV SC GL MC F F CRIT P
A (SEXO) a-1= 1
B (EDAD) b-1= 1
AB (a-1)(b-1)=1
ERROR 16x1,525= 24,40 ab(n-1)= 16 1,525
TOTAL 70,55 n-1= 19
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = [𝑌] − [𝑇] → 70,55 = 1303 − [𝑇] → [𝑇] = 1303 − 70,55 = 1232,45
𝑆𝐶𝑖𝑛𝑡𝑟𝑎 𝑆𝐶𝑖𝑛𝑡𝑟𝑎
𝑀𝐶𝐼𝑛𝑡𝑟𝑎 = → 1,525 = → 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 1,525 ∙ 16 = 24,40
𝑎𝑏(𝑛 − 1) 16
𝑆𝐶𝐴𝐵 = 𝑆𝐶𝑇 − (𝑆𝐶𝐴 + 𝑆𝐶𝐵 + 𝑆𝐶𝐸𝑟𝑟𝑜𝑟 ) = 70,55 − (8,45 + 11,25 + 24,49) = 26,45
FV SC GL MC F F CRIT (95%) P
A (SEXO) 8,45 1 8,45 5,5409 4,4939 0,03169
B (EDAD) 11,25 1 11,25 7,377 4,4939 0,01526
AB 26,45 1 26,45 17,3442 4,4939 0,00073
ERROR 24,40 16 1,525
TOTAL 70,55 19
17. ¿Cuál o cuáles son las variables independientes?: A) el sexo y la edad; B) los datos registrados con la
Escala de Racismo Moderno; C) solo la edad.
18. El diseño de este trabajo es: A) de dos grupos independientes; B) factorial 2x2 efectos fijos; C) ANOVA
mixto de dos factores de efectos aleatorios.
19. Sin considerar las condiciones y supuestos que, según el enunciado, cumplen los datos, ¿Cuántos
contrastes de hipótesis formularía en su trabajo?: A) Una; B) Dos; C) Tres.
20. Con los datos obtenidos, el estadístico de contraste para analizar si la imagen de los inmigrantes es la
misma para los jóvenes de 2º y 4º de la ESO, es: A) 5,54; B) 7,38; C) 4,49.
21. Con los datos obtenidos, el estadístico de contraste para analizar si la imagen de los inmigrantes es la
misma para los chicos que para las chicas, es: A) 5,541; B) 7,38; C) 4,49.
22. Con un nivel de confianza del 95%, el valor crítico para tomar una decisión respecto a si la edad genera
diferencias en las puntuaciones en la escala de racismo, es: A) 5,54; B) 7,38; C) 4,49.
23. El nivel crítico p asociado al estadístico de contraste para tomar una decisión respecto a si la edad
genera diferencias en las puntuaciones en la escala de racismo, es: A) 𝑝 < 0,01; B) 𝒑 < 𝟎, 𝟎𝟓; C)
𝑝 > 0,05.
24. El estadístico de contraste para analizar la influencia del sexo para los diferentes niveles de la edad, es:
A) 4,49; B) 5,54; C) 17,34.
25. A partir del análisis de la interacción entre el sexo y la edad, ¿cuál de las siguientes afirmaciones es
correcta?: Con un nivel de confianza del 99% podemos afirmar que la imagen de los inmigrantes para los
chicos y chicas: A) es diferente para los dos grupos de edad; B) es el mismo con independencia de la
edad; C) es el mismo para cada uno de los grupos de edad.
Modelo A. Febrero 2015. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y cualquier tipo de calculadora en
la que no se pueda introducir texto
SITUACIÓN 1. Sandin et al. (2013) investigan sobre la asociación entre la sensibilidad al asco y los
síntomas de hipocondría y ansiedad hacia la salud, obteniendo asociaciones significativas entre la
sensibilidad al asco y los síntomas hipocondríacos. Concluyen, mediante un análisis de regresión
múltiple, que ciertas dimensiones del asco, predicen los síntomas hipocondríacos evaluados 10 meses
después. Emplearon una muestra de 424 estudiantes universitarios, de los cuales 312 eran mujeres; la
media de edad fue de 37,3 años, con una cuasi-desviación típica de 9,1 años. (Nivel de confianza,
95%).
𝑆𝑛−1 9,1
𝑁𝐶 = 0,95 → 𝑡𝑛−1;1−𝛼⁄2 = 𝑡423;0,975 ≈ 𝑧0,975 = 1,96 𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 1,96 == 0,866
√𝑛 √423
2 2
𝐸𝑚𝑎𝑥 = 𝑧1−𝛼⁄2 𝑆 2 √ = 1,96 ∙ 9,12 √ = 11,15 𝑆 2 ± 𝐸𝑚𝑎𝑥 → 9,12 ± 11,15 → (72; 94)
𝑛 424
1
4- El valor absoluto del estadístico de contraste vale, aproximadamente:
A) 1,96
B) 9,71
C) 1,64
𝑝 − 𝜋0 0,7358 − 0,5
312 𝑍= = = 9,71
𝑝𝑀𝑢𝑗𝑒𝑟𝑒𝑠 = = 0,7358
424 √𝜋0 (1 − 𝜋0 ) √0,5 ∙ 0,5
𝑛 424
8- Suponiendo que existieran dos estadísticos insesgados, consistentes y suficientes para estimar la
misma característica poblacional, la mejor elección es utilizar el estadístico:
A) con la desviación típica más pequeña
B) con la desviación típica más grande
C) cualquiera de ellos, dado que ambos gozan de las mismas propiedades.
En una muestra de ocho sujetos miden los síntomas depresivos antes y después de una terapia
basada en la psicología positiva. Antes de la terapia la media en depresión fue igual a 20,50 y la
cuasidesviación típica igual a 7,46, y después de la terapia la media fue de 13,75 y la cuasidesviación
típica igual a 7,53, siendo la cuasivarianza de las diferencias igual a 27,353. Por otro lado, Cuadra-
Peralta et al. (2010) comparan los resultados de estos ocho sujetos después de la terapia con otra
muestra de diez sujetos a los que se aplicó un tipo de terapia tradicional, obteniendo en este caso una
media igual a 18,30 y una cuasidesviación típica igual a 6,46.
Supongamos que estamos interesados en comprobar: 1º) si existen diferencias significativas antes y
después de la terapia basada en la psicología positiva y 2º) si existen diferencias significativas entre la
terapia basada en la psicología positiva y la terapia tradicional. Para ello se decide utilizar contrastes
paramétricos con un nivel de confianza del 95%.
2
(Recuerde que en un contraste sobre dos medias con varianzas desconocidas pero supuestas iguales:
𝑔. 𝑙. = 𝑛1 + 𝑛2 − 2)
9- El valor absoluto del estadístico de contraste para comprobar si existen diferencias antes y después de
aplicar la terapia basada en la psicología positiva vale, aproximadamente:
A) 3,65
B) 1,849
C) 2,365
𝑌̅1 − 𝑌̅2 20,5 − 13,75
𝑇= = = 3,65
̂2
√𝑆𝑑 √27,353
𝑛 8
10- El valor absoluto del valor crítico para comprobar si existen diferencias antes y después de aplicar la
terapia basada en la psicología positiva vale, aproximadamente:
A) 1,895
B) 2,365
C) 2,998
Buscando en las tablas t de Student para 7 g.l. y NC = 95% en un contraste bilateral, la opción correcta
es B.
11- El nivel crítico para comprobar si existen diferencias antes y después de aplicar la terapia basada en la
psicología positiva vale, aproximadamente:
A) 𝒑 < 𝟎, 𝟎𝟏
B) 𝑝 > 0,01
C) 𝑝 = 0,01
12- Suponiendo varianzas homogéneas, el valor absoluto del estadístico de contraste para comprobar si
existen diferencias entre las dos terapias aplicadas vale, aproximadamente:
A) 3,65
B) 3,29
C) 1,38
3
𝑌̅1 − 𝑌̅2 13,75 − 18,3
𝑇= = = −1,38
2 2
(𝑛 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 1 1 √7 ∙ 7,53 + 9 ∙ 6,46 (1 + 1 )
√ 1 (𝑛 + 𝑛 ) 8 + 10 − 2 8 10
𝑛1 + 𝑛2 − 2 1 2
13- Suponiendo varianzas homogéneas, el valor absoluto del valor crítico para comprobar si existen
diferencias entre las dos terapias aplicadas vale, aproximadamente:
A) 2,583
B) 1,746
C) 2,120
Para un contraste bilateral y 16 g.l. con un nivel de confianza del 95%, la opción correcta es C.
14- Suponiendo varianzas homogéneas, y con el objetivo de comparar la magnitud de las diferencias
entre las dos terapias aplicadas, el tamaño del efecto vale aproximadamente:
A) 1,38
B) 0,65
C) 2,12
16- Para comparar la eficacia de la terapia basada en la psicología positiva con la terapia tradicional:
A) sería recomendable replicar el estudio con una muestra mayor, dado que el tamaño del efecto es
moderado y la muestra pequeña
B) no es necesario realizar más estudios, porque los resultados de Cuadra-Peralta et al. (2010) son
concluyentes
C) no es necesario realizar más estudios porque el tamaño del efecto es muy pequeño.
4
SITUACIÓN 3. Un investigador desea estudiar la relación entre la sensibilidad al Asco y los miedos,
actitudes y creencias asociados a la psicopatología de la hipocondría. Para ello utiliza como variable
independiente la Escala Multidimensional de Sensibilidad al Asco (EMA; Sandín et al., 2013), y como
variable dependiente la Escala de Actitudes hacia la Enfermedad (IAS; Kellner, 1986). Supongamos,
que en una muestra de 102 sujetos se ha obtenido un coeficiente de correlación entre EMA y IAS igual
a 0,6.
17- Para comprobar si el coeficiente de correlación obtenido es significativo, la hipótesis alternativa que
se ha de plantear es:
A) 𝐻1 : 𝜌 ≥ 0
B) 𝑯𝟏 : 𝝆 ≠ 𝟎
C) 𝐻1 : 𝜌 < 0
𝑟𝑥𝑦 √𝑛 − 2 0,6√102 − 2
𝑇= = = 7,5
2
√1 − 𝑟𝑥𝑦 √1 − 0,62
Con 100 g.l., NC = 95% y contraste bilateral, el valor que obtenemos de las tablas t de Student,
coincide con la opción B.
20- Tras realizar el contraste de hipótesis sobre el coeficiente de correlación, el nivel crítico vale,
aproximadamente:
A) 𝑝 = 0,025
B) 𝑝 = 0,05
C) 𝒑 < 𝟎, 𝟎𝟏
2
𝑟𝑥𝑦 = 0,62 = 0,36
5
22- Los resultados obtenidos indican que la relación entre EMA e IAS:
A) Es significativa para un nivel de confianza del 99%
B) es significativa a un nivel de confianza del 95%, pero no a un nivel de confianza del 99%
C) no es significativa
23- Si queremos utilizar la escala EMA para predecir las puntuaciones en la escala IAS:
A) No tiene sentido, dado que la relación entre EMA e IAS es muy baja
B) Tiene sentido, porque obtendríamos un estadístico de contraste significativo para la pendiente
de la recta de regresión
C) Faltan datos en el enunciado para comprobar si el estadístico de contrate es significativo
24- En el caso de la regresión lineal simple, el signo del coeficiente de correlación y de la pendiente de la
recta de regresión:
A) son opuestos
B) son independientes
C) son iguales
25- Uno de los supuestos básicos del análisis de regresión simple es:
A) los pronósticos y los errores son independientes
B) las distribuciones condicionadas de los errores deben de tener una distribución uniforme
C) no deben estar relacionadas las variables predictora y la variable dependiente o criterio
6
Modelo C. Febrero 2015. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y cualquier tipo de
calculadora en la que no se pueda introducir texto
SITUACIÓN 1. Valero (1999) aplicó un test de ansiedad ante los exámenes a una amplia muestra de
estudiantes universitarios justo antes de realizar el examen final de la asignatura “X”, obteniendo una
media igual a 55 (a mayor puntuación mayor ansiedad). Para disminuir el nivel de ansiedad antes de los
exámenes, un profesor de la asignatura “X” enseña técnicas de relajación a una muestra aleatoria de 49
alumnos, obteniendo una media en ansiedad antes del examen de la asignatura “X” igual a 50 con una
cuasidesviación típica igual 10 (NC= 99%).
Para 50 g.l. (los más próximos en las tablas a: n = 49 – 1 = 48) y un NC = 99% para un contraste
unilateral, la opción correcta es B.
4- Suponiendo que la relajación no es efectiva para rebajar el nivel de ansiedad antes del examen de la
asignatura “X”, la probabilidad de obtener una media de 50 puntos o inferior con una muestra de 49
alumnos vale:
A) p = 0,01
B) p > 0,05
C) p < 0,005
La puntuación más extrema que podemos consultar en las tablas para 50 g.l. es -2,678, que deja por
debajo una proporción igual a 0,005, luego el nivel crítico es: p < 0,005
1
5- Tras examinar los resultados obtenidos, el profesor concluye:
A) las técnicas de relajación disminuyen la puntuación media en ansiedad ante el examen de la
asignatura “X”
B) las técnicas de relajación no disminuyen la ansiedad ante el examen de la asignatura “X”
C) el profesor ha de tomar una muestra más grande, porque los resultados no son concluyentes
2
(𝑛 − 1)𝑆𝑛−1 48 ∙ 102 2
(𝑛 − 1)𝑆𝑛−1 48 ∙ 102
𝑙𝑖 = 2 = = 60,385 𝑙𝑠 = 2 = = 171,486
𝜒𝑛−1;1−𝛼⁄ 79,49 𝜒𝑛−1; 𝛼⁄ 27,9907
2 2
2
SITUACIÓN 2: En un trabajo publicado en la Revista de Psicopatología y Psicología Clínica (Vol 13; Nº 1)
por Sanjuán, P; Pérez-García, A; Rueda, B y Ruiz, M.A (2008) se estudia -en una muestra de mujeres
universitarias- la relación entre el estilo atribucional y los síntomas depresivos, señalando que el estilo
atribucional negativo constituye un factor de vulnerabilidad para desarrollar malestar psicológico o
emociones negativas. Imagine que usted dispone de una muestra de varones a los que pasa el
Cuestionario de Estilo Atribucional y los divide, según la puntuación obtenida, en dos grupos: positivos o
negativos. Posteriormente les administra una Escala de Afecto Negativo (EAN). Los 31 varones clasificados
como positivos obtienen en la Escala EAN una media de 14,5 puntos y desviación típica insesgada de 4,5 y
los 41 varones clasificados como negativos obtienen una media de 17 con una cuasi-desviación típica de
6. Con estos datos, responda a las siguientes preguntas:
(Recuerde que en un contraste sobre dos medias con varianzas desconocidas pero supuestas iguales:
(𝑔. 𝑙. = 𝑛1 + 𝑛2 − 2).
10- Si quiere comparar el afecto negativo en los varones según su estilo atribucional positivo o negativo,
el diseño que utilizaría en su trabajo es de:
A) una muestra de varones extraída de dos poblaciones independientes
B) dos muestras independientes de varones extraídas de poblaciones con varianzas desconocidas
C) intrasujetos antes-después
11- Si desea comprobar que los varones clasificados como positivos o negativos provienen de
poblaciones con la misma varianza, ¿cuál de las siguientes hipótesis está correctamente formulada?:
2 2
A) 𝐻1 : 𝜎𝑃𝑜𝑠 = 𝜎𝑛𝑒𝑔
2 2
B) 𝐻0 : 𝜎𝑃𝑜𝑠 ≠ 𝜎𝑛𝑒𝑔
C) 𝑯𝟏 : 𝝈𝟐𝑷𝒐𝒔 ≠ 𝝈𝟐𝒏𝒆𝒈
12- El estadístico para contrastar la hipótesis de que los varones clasificados como positivos o negativos
provienen de poblaciones con la misma varianza, vale:
A) 1,33
B) 1,78
C) 0,667
𝑆̂12 62
𝐹= 2= = 1,78
𝑆̂2 4,52
13- El nivel crítico p para tomar una decisión respecto la hipótesis de que los varones clasificados como
positivos y los clasificados como negativos provienen de poblaciones con la misma varianza, vale:
A) p < 0,025
B) p < 0,05
C) p > 0,05
3
Para los siguientes pasos establece un nivel de confianza del 95% y desea comprobar si los varones con
estilo atribucional negativo tienen puntuaciones significativamente más altas en la escala EAN que los
varones con estilo atribucional positivo. Con esta finalidad:
17- A partir de los resultados obtenidos en su trabajo concluye que entre los varones con estilo
atribucional positivo y negativo respecto a sus puntuaciones en la Escala de AN:
A) no existen diferencias significativas con un nivel de significación del 5%
B) existen diferencias significativas con un nivel de significación del 1%
C) existen diferencias significativas con un nivel de significación del 5%.
SITUACIÓN 3.- Un psicólogo industrial ha realizado una investigación para conocer el efecto del tabaco
sobre el rendimiento laboral bajo diferentes condiciones de iluminación en una gran compañía industrial.
Para ello, seleccionó una muestra aleatoria de 15 trabajadores de género masculino de cada uno de tres
grupos distintos: no fumadores, fumadores moderados y fumadores intensos (más de 20 cigarrillos al día).
Cada muestra se dividió en tres grupos, o sub-muestras, con idéntico número de sujetos y cada sub-
muestra se asignó aleatoriamente a tres ambientes de trabajo con diferentes niveles de luz. Se registró el
tiempo para completar una tarea de ensamblado estándar (en minutos).
Los resultados de las SC fueron 84,90 para el factor “Grupo de fumadores”; 298,07 para el factor
“Condiciones de iluminación” y 2,81 para la interacción. La SC total fue de 445,03. Utilice un nivel de
confianza del 95%.
4
Se elabora la tabla de ANOVA (los datos proporcionados por el enunciado se muestran en negrita)
FV SC gl MC F
FUMA 84,9 2 42,45 25,79
LUZ 298,07 2 149,04 90,55
INTER. 2,81 4 0,70 0,43
ERROR 59,25 36 1,65
TOTAL 445,03 44 10,11
22- Cuál de los siguientes valores se aproxima más al valor de estadístico de contraste para el efecto
interacción:
A) 0,7025
B) 0,427
C) 1,646
23- Una vez comprobado el efecto de la interacción, ¿cuál de los siguientes valores se aproxima más
al valor de estadístico de contraste para el efecto “condiciones de iluminación”?:
A) 25,79
B) 90,54
C) 96,06
5
Al no ser significativa, la suma de cuadrados de la interacción pasa a formar parte de la suma de
cuadrados de error. La tabla de ANOVA queda:
FV SC gl MC F
FUMA 84,9 2 42,45 25,79
LUZ 298,07 2 149,04 96,06
ERROR 62,06 40 1,55
TOTAL 445,03 44 10,11
24- Si consideramos evaluar si el hecho de fumar versus no fumar es significativo, deberíamos utilizar
un contraste a posteriori con un conjunto de coeficientes igual a:
A) {1, -1, 0}
B) {1, 0, -1}
C) {-1, ½, ½ }
6
Modelo A. Septiembre 2015. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto.
SITUACIÓN 1. Para diferenciar entre los mayores sanos y los que presentan deterioro cognitivo (DC) se emplean
habitualmente pruebas de memoria. Entre éstas, el fenómeno de la punta de la lengua (PDL) constituye una de las
quejas subjetivas de memoria más frecuentes en las personas mayores. Se caracteriza por la dificultad para recordar
palabras conocidas, acompañada de la sensación de que su recuerdo puede ser inminente y se presenta,
especialmente, en tareas de recuperación de nombres propios (Facal, Juncos, Álvarez, Pereiro y Díaz, 2006).
Imagine que usted tiene acceso a un Centro asistencial de día para personas mayores que atiende a una muestra de
90 personas mayores de 70 años. De ellos el 30% presentan DC, a los cuales se presenta una pila de 30 fotografías
de alta calidad, de personajes famosos representativos de diferentes ámbitos y épocas. Para esta muestra de
mayores con DC, la frecuencia media de PDL fue de 18,5 con una desviación típica insesgada de 3,8.
1- Con un nivel de confianza del 95%, la frecuencia media de PDL en la población de mayores de 70 años con DC es
un valor comprendido, aproximadamente, entre:
A) 17 y 20
B) 17,07 y 19,93
C) 16,45 y 20,53
20
𝑌� ± 𝐸𝑚𝑎𝑥 → 18,5 ± 1,50 → �
17
2- Si decide trabajar con un nivel de confianza del 95% para estimar la frecuencia media de PDL en la población con
un error máximo de estimación de 2 puntos, el tamaño de la muestra que debe utilizar sería:
A) Mayor que la utilizada en su trabajo
B) Menor que la utilizada en su trabajo
C) Igual que la utilizada en su trabajo
Como podemos comprobar en la solución de la pregunta nº 1, para un tamaño de la muestra: 𝑛 = 27, el error
máximo es igual a 1,5. Puede observarse en la fórmula que cuanto mayor sea el tamaño de la muestra, n, menor
será el Emax. Por tanto, para un error máximo mayor, el tamaño de la muestra será menor. Efectivamente:
2
𝑡𝑛−1;1− 𝛼� 2,0562
2 2
𝑛= 𝑆𝑛−1 2 = 3,82 = 15,26
𝐸𝑚𝑎𝑥 22
3- Si quisiera demostrar que la frecuencia media de PDL obtenida en su muestra de mayores de 70 años con DC es
significativamente mayor que 13,2, que es la obtenida en la población general de mayores entre de entre 60 y 69
años, aplicaría el estadístico:
A) Z para una muestra
B) T de Student para una muestra
1
C) Z para dos muestras independientes
Se trataría de un contraste de hipótesis sobre una media con varianza poblacional desconocida, luego hay que
aplicar la T de Student para una muestra
4- Si desea comprobar que la proporción de mayores de 70 años que presentan deterior cognitivo (DC) es
significativamente mayor del 25% establecido para la población general, la hipótesis nula que formularía es:
A) 𝜋 > 0,25
B) 𝜋 ≥ 0,25
C) 𝝅 ≤ 𝟎, 𝟐𝟓
5- Si desea comprobar que la proporción de mayores de 70 años que presentan deterior cognitivo (DC) es
significativamente mayor del 25% establecido para la población general, el estadístico y nivel crítico que
obtendría son:
A) 𝑍 = 1,031 𝑦 𝑝 = 0,1515
B) 𝒁 = 𝟏, 𝟎𝟗𝟓 𝒚 𝒑 > 0,05
C) 𝑍 = 0,590 𝑦 𝑝 < 0,05
6- Si el intervalo de confianza para la proporción de mayores de 70 años que presentan DC está definido por los
valores 0,127 y 0,473, ¿Cuánto vale el error máximo de estimación?:
A) 0,173
B) 0,346
C) No se puede determinar porque se desconoce el nivel de confianza utilizado
7- Con un nivel de confianza del 99%, el intervalo de confianza de la cuasi-desviación típica de la frecuencia media
de PDL que presentan los mayores de 70 años con DC, se encuentra definido por los valores:
A) 8,95 y 27,12
B) 7,77 y 33,64
C) 2,79 y 5,8
Se calcula el intervalo de confianza para la varianza, y se extrae la raíz cuadrada de los valores obtenidos.
2
2
(𝑛 − 1)𝑆𝑛−1 26 ∙ 3.82
𝑙𝑠 = 2 = = 33,64 → �33,64 = 5,8
𝜒𝑛−1; 𝛼� 11,1602
2
2
(𝑛 − 1)𝑆𝑛−1 26 ∙ 3.82
𝑙𝑖 = 2 = = 7,77 → �7,77 → 2,79
𝜒𝑛−1;1− 𝛼� 48,2899
2
8- En alguna de las preguntas anteriores encontrará la respuesta a la siguiente: ¿qué decisión tomaría respecto a la
hipótesis de que la desviación típica insesgada de la frecuencia media de PDL para la población general de
mayores de 70 años con DC es de 5 puntos?:
A) Rechazarla porque se encuentra fuera del intervalo de confianza (𝑝 < 0,05)
B) No se podría rechazar porque se encuentra dentro del intervalo de confianza (𝒑 > 0,01)
C) Rechazarla porque se encuentra fuera del intervalo de confianza (𝑝 < 0,01)
Como se puede apreciar en la solución de la pregunta anterior, 5 se encuentra comprendido entre los valores que
definen el intervalo de confianza para la desviación típica insesgada, luego la respuesta correcta es B.
SITUACIÓN 2. En un trabajo publicado por García, Gómez y Canto (2001) se analizan las diferencias de género ante
situaciones desencadenantes de celos, encontrando que las mujeres presentan mayor malestar que los hombres ante
la infidelidad emocional (pérdida de atención, cuidado y protección que la pareja dirige hacia otra persona), no
existiendo diferencias significativas ante la infidelidad sexual, que es la que más celos e ira genera tanto en hombres
como en mujeres.
Imagine que está usted interesado en comprobar si estos resultados se mantienen en la actualidad para los hombres
y mujeres de su localidad. Selecciona una muestra de 140 personas con relación de pareja estable, de las que un 60%
son mujeres. Todos los participantes contemplan un escenario de infidelidad y posteriormente responden a un
cuestionario de reacciones emocionales que proporciona datos en la escala de celos ante la infidelidad emocional (E)
y ante la infidelidad sexual (S). Los resultados obtenidos son los siguientes: en la escala E la media de los hombres es
12 y la de las mujeres 14, y sus varianzas insesgadas 16 y 20,25, respectivamente, siendo el error típico de la
diferencia de medias 0,743. Con estos datos, y fijando un nivel de confianza de 0,95, responda a las siguientes
preguntas:
9- Si quisiéramos comprobar que no existen diferencias significativas entre hombres (H) y mujeres (M) ante la
infidelidad sexual, formularíamos la siguiente hipótesis nula:
A) 𝛍𝐇 = 𝛍𝐌
B) µH ≠ µM
C) 𝜇𝐻 ≤ 𝜇𝑀
10- Con los datos del enunciado, si quisiéramos comprobar que los hombres presentan mayor malestar ante la
infidelidad sexual que ante la infidelidad emocional utilizaríamos un diseño de:
A) Dos muestras independientes con varianzas poblacionales conocidas
B) Dos muestras relacionadas
C) Una sola muestra “pre-pos”
3
Se pretende comparar las puntuaciones del mismo grupo de personas (hombres) en dos condiciones diferentes,
luego la respuesta es B.
11- Con los datos del enunciado, si quisiéramos comprobar que las mujeres presentan mayor malestar que los
hombres ante la infidelidad emocional, utilizaríamos el estadístico:
A) Z para muestras relacionadas
B) t para muestras independientes
C) F para dos muestras independientes
En este caso se pretenden comparar las medias de diferentes grupos (hombres y mujeres) en la misma variable,
siendo desconocidas las variables poblacionales, luego la respuesta correcta es B.
12- Con un nivel de confianza de 95%, el intervalo de confianza en el que se encontrará la diferencia de medias entre
mujeres y hombres, en la escala E, (𝜇𝑀𝑢𝑗 − 𝜇𝐻𝑜𝑚 ), es, aproximadamente:
A) 0,54 y 3,45
B) 13,03 y 14,96
C) -0,08 y 3,91
3,46
(𝑌�1 − 𝑌�2 ) ± 𝐸𝑚𝑎𝑥 → (14 − 12) ± 1,45 → �
0,54
13- Sin necesidad de nuevos cálculos de los realizados hasta el momento, ¿Qué decisión tomaría respecto a la
hipótesis nula 𝐻𝑜 : 𝜇𝑀𝑢𝑗 = 𝜇𝐻𝑜𝑚 en la escala E?:
A) No existen evidencias suficientes para rechazarla (𝑝 > 0,05)
B) Rechazarla porque el intervalo de confianza no cubre la diferencia “nula” entre las dos medias poblacionales
(𝒑 < 0,05)
C) Falta información adicional para tomar una decisión
Como podemos comprobar en los cálculos de la solución de la pregunta anterior, la diferencia nula
�𝜇𝑀𝑢𝑗 − 𝜇𝐻𝑜𝑚 = 0� NO está incluida entre los límites del intervalo de confianza, por lo que se rechaza la
hipótesis nula.
15- Suponiendo que el estadístico de Cohen para esta situación valiese 𝑑 = 0,62 indicaría que:
A) El 62% de las mujeres tiene una reacción de celos superior a la media de los hombres
B) El 73,24% de las mujeres tiene una reacción de celos superior a la media de los hombres
C) El 26,76% de las mujeres tiene una reacción de celos superior a la media de los hombres
4
Acudiendo a la tabla de curva normal, la proporción correspondiente a 𝑧 = 0,62 es igual a 0,2679, siendo la
probabilidad complementaria de este valor: 1 − 0,2679 = 0,7324. Dado que la media de las mujeres es superior
a la de los hombres, este valor indica que, el 73,24% de las mujeres tiene una reacción de celos superior a la
media de los hombres.
17- ¿Cuál de las siguientes gráficas es la que mejor reflejaría los resultados del trabajo original de García y Col.
(2001)?
A) B) C)
La respuesta correcta es A, donde se aprecia que las mujeres obtienen una media superior que los hombres ante
“infidelidad emocional” siendo muy parecidas las medias de hombres y mujeres ante la “infidelidad sexual” que es la
que más celos e ira genera tanto en hombres como en mujeres.
SITUACIÓN 3: En un estudio, en residencias de la tercera edad, sobre el efecto que tenían dos terapias
ocupacionales diferentes sobre las interacciones entre los residentes, se eligieron al azar 24 participantes, ocho de
cada una de tres instituciones semejantes, elegidas, también al azar, entre las de una comunidad autónoma del
Estado. Uno de los centros se utilizó como grupo control y en él no se realizó ninguna terapia (residencia A), en las
otras dos se probaron las terapias (una en la residencia B y otra en la residencia C). Se desea averiguar si hay
diferencias, en la media de interacciones entre los residentes, en las tres residencias. Se ha comprobado que la
distribución de la variable dependiente es normal y que las varianzas son homogéneas.
Media de interacciones diarias entre los residentes: Residencia A: 5,45; Residencia B: 7,275; Residencia C: 6,55
5
19- Cuántos grados de libertad se asocian al estadístico de contraste (señale el más aproximado):
A) 2 y 21
B) 3 y 23
C) 2 y 24
Se trata de un ANOVA de un factor con tres niveles. Los grados de libertad intergrupos son a-1=2, siendo “a” el
número de niveles del factor a=3. Y los grados de libertad intragrupos son N-a=21, siendo N=24 y a=3.
20- El valor del estadístico de contraste fue 6,21; conociendo este dato, ¿se debe rechazar la 𝐻0 ?
A) Sí (con alfa 0,005)
B) Sí (con alfa 0,05)
C) No (con alfa 0,01)
Acudiendo a la tabla F de Fisher para 2 y 20 grados de libertad (los más próximos) obtenemos los valores:
Por lo que el resultado obtenido es significativo para 𝛼 = 0,01, pero no para 𝛼 = 0,005, luego la respuesta
correcta es B.
21- Según el diseño y el resto de información que se describe en el enunciado, la correcta formulación de la hipótesis
alternativa, es:
A) 𝜇𝐴 ≠ 𝜇𝐵 ≠ 𝜇𝐶
B) 𝝁𝑨 ≠ 𝝁𝑩 ≠ 𝝁𝑪 (al menos para una µ𝒊 )
C) 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 (al menos para una µ𝑖 )
22- Sabiendo que 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 36,345 y 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 22,835; ¿cuál es el valor de 𝑀𝐶𝐼𝑛𝑡𝑒𝑟 ? (señale el más aproximado):
A) 1,09
B) 13,51
C) 6,76
A partir de estos datos ya conocidos: 𝑁 = 24; 𝑎 = 3; 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 22,835; 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 36,345; 𝐹 = 6,21
FV SC gl MC F
Inter 13,510 2 6,755 6,21
Intra 22,835 21 1,087
Total 36,345 23
(Los datos representados en color rojo se obtienen a partir de los
datos proporcionados en el examen)
23- Sabiendo que 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 36,345 y 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 22,835. Para realizar comparaciones entre pares de medias, ¿cuál
es el valor más aproximado de 𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 ?:
A) 1,78 (alfa 0,01)
B) 1,37 (alfa 0,01)
C) 1,78 (alfa 0,05)
𝑐2
𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 = �(𝑎 − 1) ∙ 𝐹(1−𝛼),(𝑎−1),(𝑁−𝑎) �𝑀𝐶𝐼𝑛𝑡𝑟𝑎 �� � 𝑖 �𝑛𝑖 ��
2
Para 𝛼 = 0,05: 𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 = √2 ∙ 3,493�1,087 ∙ = 1,378
8
6
2
Para 𝛼 = 0,01: 𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 = �2 ∙ 5,849�1,087 ∙ = 1,783
8
24- Si se hubiera rechazado la hipótesis nula y el estadístico para realizar las comparaciones múltiples, nos hubiese
dado un valor de 1,3 (con alfa 0,05); ¿entre qué grupos se encuentran diferencias estadísticamente
significativas?:
A) Residencia A y residencia B
B) Residencia A y residencia C
C) Residencia B y residencia C
7
Modelo A. Febrero 2016. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y cualquier tipo de calculadora en la
que no se pueda introducir texto
Antes de aplicar el tratamiento se obtiene para el Grupo A una media en IFS igual a 10 y cuasidesviación típica igual a 3,
mientras que en el Grupo B la media es igual a 9,5 y la cuasidesviación típica igual a 3,5. Después de aplicar el tratamiento
en el Grupo A la media y cuasidesviación típica son 4 y 3,2, respectivamente. Para el Grupo B en el post-test se obtiene
una media igual a 9,25 con una cuasidesviación típica igual a 3,25.
Considerando a todos los sujetos de la muestra inicial, el investigador quiere comprobar si en la población de la
que se ha extraído esta muestra, la proporción de adolescentes de sexo femenino es superior a 0,6.
𝑝 − 𝜋0 0,75 − 0,6
𝑍= = = 1,73
√𝑝(1 − 𝑝) √0,6(1 − 0,6)
𝑛 32
1
Queremos comprobar si existen diferencias estadísticamente significativas entre las puntuaciones medias del
IFS entre el Grupo A y el Grupo B antes de aplicar el tratamiento.
4- Si previamente se aplica un contraste de hipótesis sobre las varianzas poblacionales para decidir si se asumen
iguales o diferentes, el nivel crítico que se obtiene en este contraste es:
A) 𝒑 > 𝟎, 𝟏𝟎
B) 𝑝 < 0,10
C) 𝑝 = 0,10
𝐻0 : 𝜎𝐴2 = 𝜎𝐵2
𝜎𝐵2 3,52
𝐻1 : 𝜎𝐴2 ≠ 𝜎𝐵2 𝐹= = 2 = 1,36
𝜎𝐴2 3
Los grados de libertad son: 𝑛1 − 1 = 15 𝑦 𝑛2 − 1 = 15. En la tabla los más próximos son 10 y 15, o bien 20
y 15. En el primer caso: 𝑓0,90;10;15 = 2,059 y en el segundo: 𝑓0,90;20;15 = 1,924. En cualquier caso, el
estadístico de contraste (𝐹 = 1,36) es inferior a ambas puntuaciones, y al ser el contraste bilateral el nivel
crítico es superior a 0,20.
5- Suponiendo que las medias poblacionales son iguales en los Grupos A y B, en el contraste de medias la
probabilidad de obtener un resultado como el observado en nuestros datos o más extremo, es:
A) 𝒑 > 𝟎, 𝟏𝟎
B) 𝑝 < 0,10
C) 𝑝 = 0,10
Tenemos que calcular el nivel crítico, es decir, la probabilidad de obtener un resultado igual o más extremo
que el observado en los datos suponiendo que es cierta la hipótesis nula, que en este caso especifica que las
medias poblacionales son iguales en los Grupos A y B.
El estadístico de contraste para comprobar si existen diferencias significativas entre las puntuaciones medias
del IFS entre el Grupo A y el Grupo B antes de aplicar el tratamiento:
Acudiendo a la tabla t de Student para 30 grados de libertad, observamos que el estadístico de contraste se
encuentra entre las puntuaciones 0,389 y 0,53, que dejan por encima de sí las probabilidades 0,35 y 0,30
respectivamente. Como el contraste es bilateral, el nivel crítico se encuentra entre: 0,60 < 𝑝 < 0,70.
2
Queremos comprobar si después de aplicar el tratamiento la puntuación media del IFS en el Grupo A es
inferior a la puntuación media del Grupo B en el post-test (asuma varianzas poblacionales iguales).
3
SITUACIÓN 2. Olivares y García-López (1998) desarrollaron un programa de tratamiento cognitivo-conductual para
adolescentes con fobia social generalizada. Imagine que ahora usted sólo dispone de una muestra de 6 adolescentes
que padecen fobia social generalizada. Para medir el grado de fobia social utiliza un inventario diseñado
específicamente para este fin (IFS). Se aplica el cuestionario IFS antes del tratamiento propuesto por Olivares y
García-López (1998) a estos 6 sujetos, y posteriormente se realizan dos seguimientos, uno a los 6 meses y otro a los
12 meses de finalizar la aplicación del tratamiento, para evaluar el mantenimiento o no de los resultados. Trabaje a
un nivel de confianza del 95%
Conociendo las siguientes sumas de cuadrados: 𝑆𝐶𝐴 = 148,11; 𝑆𝐶𝐸𝑟𝑟𝑜𝑟 = 19,22 y 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 174,94, y asumiendo
que se cumplen los supuestos pertinentes para ese diseño:
Se trata de un ANOVA de medidas repetidas con un factor y tres niveles. Con los datos aportados en el
enunciado podemos completar la tabla de ANOVA. En la siguiente tabla se representan en color negro los
datos aportados por el problema.
FV SC gl MC F
A 148,11 2 74,06 38,53
S 7,61 5 1,52
Error 19,22 10 1,92
Total 174,94 17
Al nivel de confianza del 95% para 2 y 10 grados de libertad, el valor crítico es igual a: 𝑓 = 4,103
4
16- Con los resultados obtenidos:
A) Se mantiene la hipótesis nula para 𝛼 = 0,05.
B) Se rechaza la hipótesis nula para 𝛼 = 0,05 pero no para 𝛼 = 0,01.
C) Se rechaza la hipótesis nula para 𝜶 = 𝟎, 𝟎𝟏.
17- En los diseños intra-sujetos se considera que la varianza de error viene dada por:
A) El factor manipulado.
B) Los sujetos.
C) La interacción entre el factor manipulado y los sujetos.
SITUACIÓN 3. A continuación se muestra la recta de regresión por mínimos cuadrados que mejor ajusta los datos y el
Anova de la regresión lineal entre el Volumen de los cilindros y la potencia del motor en ocho automóviles (Honda
Civic, Toyota Prius, VS Golf, VS Beetle, Toyota Corolla, VW Jetta, Mini Cooper y Toyota Yaris). Se asume que se
cumplen todos los supuestos para este tipo de análisis.
5
23- Determine al 95% de nivel de confianza (unilateral) si la regresión resultó significativa.
A) No porque el nivel crítico de la F obtenida es superior a 0,05.
B) Sí porque el estadístico de contraste es menor que el valor crítico.
C) Sí porque el nivel crítico de F vale 0,001.
24- Uno de los supuestos básicos del análisis de regresión simple es:
A) Los pronósticos y los errores son independientes.
B) Las distribuciones condicionadas de los errores deben de tener una distribución uniforme.
C) No deben estar relacionadas las variables predictora y la variable dependiente o criterio.
6
Modelo C. Febrero 2016. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y cualquier tipo de calculadora en la
que no se pueda introducir texto
Imagine que usted dispone de una muestra de 121 mujeres y 151 hombres que responden a una Escala de
Depresión (ED) obteniendo una puntuación media de 19,2 y una desviación típica insesgada de 9,5 para las mujeres
y de 16,8 y 8,5 respectivamente para los hombres. Además en un 18% de las mujeres presentan un predominio de
los autodiálogos negativos frente al 9% de los hombres.
Proporción
𝑛 𝑌̅ 𝑆̂ Autodiálogos
negativos
Mujeres (M) 121 19,2 9,5 0,18
Hombres (H) 151 16,8 8,5
1- Si desea determinar el intervalo de confianza para la varianza poblacional de la escala de depresión (ED) para
hombres, deberá asumir que la distribución muestral de la varianza es:
A) F de Fisher.
B) Chi-cuadrado.
C) T de Student.
0,248
𝑝 ± 𝐸𝑚𝑎𝑥 → 0,18 ± 0,0685 → {
0,112
1
3- Si quiere contrastar la hipótesis de que en la población el porcentaje de mujeres sintomáticas con predominio de
autodiálogos negativos es mayor del 10%, la hipótesis nula que formula es:
A) 𝜋 = 0,10
B) 𝝅 ≤ 𝟎, 𝟏𝟎
C) 𝜋 ≥ 0,10
4- El estadístico de contraste para la hipótesis nula de que el porcentaje de mujeres sintomáticas con predominio
de autodiálogos negativos es mayor del 10%, es, aproximadamente:
A) 2,93
B) 3,14
C) 1,74
𝑝 − 𝜋0 0,18 − 0,10
𝑍= = = 2,93
√𝜋0 (1 − 𝜋0 ) √0,10(1 − 0,10)
𝑛 121
5- Si desea comprobar que las muestras de hombres (H) y mujeres (M) provienen de poblaciones con la misma
varianza en la Escala de Depresión (ED), la hipótesis nula que formularía es:
A) 𝜎𝐻2 ≥ 𝜎𝑀
2
B) 𝜎𝐻2 ≤ 𝜎𝑀
2
𝝈𝟐
C) 𝝈𝟐𝑯 = 𝟏
𝑴
6- Si desea comprobar que las muestras de hombres y mujeres provienen de poblaciones con la misma varianza en
la Escala de Depresión (ED), el estadístico que obtiene y su valor crítico son, aproximadamente:
A) 2,19; p=0,05
B) 0,97; p<0,10
C) 1,25; p>0,10
Hay una errata en el enunciado, se debería pedir el “nivel” crítico en vez del “valor” crítico.
7- Si desea comprobar que las mujeres obtienen puntuaciones más altas que los varones en la Escala de Depresión
(ED) el estadístico de contraste que obtiene en valor absoluto, vale, aproximadamente:
A) 2,20
B) 2
C) 0,26
2
8- Si con los datos de su investigación el estadístico d de Cohen toma el valor 0,27 podría afirmar que:
A) El 60,64% de los hombres superan la media de depresión de las mujeres.
B) El 60,64% de las mujeres superan la media de depresión de los hombres.
C) El 27% de los hombres están por debajo de la media de depresión de las mujeres.
10- Cuál de los siguientes estimadores para la media poblacional de una distribución es suficiente:
A) La mediana.
B) La media aritmética.
C) La moda.
SITUACIÓN 2: El director de una escuela de ajedrez está interesado en identificar la mejor estrategia de control de la
atención (durante las partidas) para entrenar a los alumnos en la utilización de la más adecuada. Se han estudiado
tres estrategias: centrarse en estímulos internos (A), centrarse en estímulos externos (B) y hacer una parada de
pensamiento (C). El control de la atención se ha medido mediante una variable fisiológica (variaciones en la actividad
eléctrica de la piel). Se seleccionó una muestra aleatoria compuesta por 45 jugadores de ajedrez, que se asignaron al
azar a una de las tres condiciones experimentales. Se obtuvieron los siguientes resultados:
Tras realizar todas las comprobaciones necesarias se concluyó que las observaciones eran independientes, las
distribuciones normales y las varianzas homogéneas.
Se trata de un ANOVA de un factor (estrategia de control de la atención) con tres niveles, siendo el
modelo equilibrado (𝑛1 = 𝑛2 = 𝑛3 = 15)
FV SC gl MC F
Inter 1525,06 2 762,53 6,09
Intra 5258,4 42 125,2
Total 6783,46 44
3
11- Se trata de un diseño:
A) Con tres grupos no equilibrados.
B) Con muestras relacionadas.
C) Con muestras independientes.
13- Teniendo en cuenta la técnica apropiada para resolver este diseño, cuál sería el valor de los grados de libertad
del denominador del estadístico de contraste:
A) 42
B) 44
C) 28
14- La técnica de análisis de datos adecuada para probar la hipótesis del investigador es:
A) ANOVA de un factor con muestras independientes.
B) ANOVA bifactorial.
C) ANOVA de medidas repetidas.
16- Suponiendo que el cálculo del estadístico de contraste arrojó un valor igual a 6,09, con este dato:
A) No podemos tomar ninguna decisión respecto a la hipótesis de igualdad de medias.
B) Podemos rechazar la hipótesis de igualdad de medias (NC = 95%).
C) No podemos rechazar la hipótesis de igualdad de las medias (NC = 95%).
𝑓0,95;2;30 = 3,316
Dado que: 6,09 > 3,316, se rechaza la hipótesis nula para un nivel de confianza del 95%
𝑓0,99;2;30 = 5,39
4
18- Suponiendo que NO se rechazara la 𝐻0 , entre qué grupos sería conveniente realizar comparaciones:
A) Entre ninguno.
B) Entre los grupos B y C que son los que presentan la máxima diferencia en sus resultados.
C) Entre los grupos A, B y C
SITUACIÓN 3. Un estudio publicado en Acción Psicológica por Ramírez-Lucas, Ferrando, y Sainz (2015), analiza la
influencia de la inteligencia emocional (IE) de los padres y el desarrollo emocional de sus hijos escolarizados en el 2º
ciclo de educación infantil, indicando que los padres con mayor IE tienden a mostrar un estilo más democrático que
autoritario que, a su vez, influye positivamente en la IE de los niños.
Imagine que usted desea corroborar estos resultados con escolares de bachillerato para lo que dispone de
una muestra de 82 niños y sus respectivos padres que responden a un cuestionario de IE para adultos (IEA) y a un
segundo cuestionario de Estilos Parentales (EP), que valora el estilo parental que varía desde autoritario a
democrático sobre una única escala de intervalo. Por su parte, los hijos responden a un Inventario de IE para
Escolares (IEE), obteniendo los resultados que se muestran en las siguientes tablas.
Correlaciones
Media Varianza
EP IEA IEE
EP 2,9 0,9
EP - 0,65 0,42
IEA 2,7 1,1
IEA - 0,56
IEE 3,1 1,3
IEE -
Elevando al cuadrado los coeficientes de correlación proporcionados en el enunciado, obtenemos los siguientes
coeficientes de determinación:
EP IEA IEE
EP 0,4225 0,1764
IEA 0,3136
IEE
20- Si quisiéramos pronosticar la puntuación de IE de los hijos (IEE) a partir de la IE de sus padres (IEA), la pendiente
de la ecuación de regresión es:
A) 0,609
B) 0,662
C) 0,515
5
𝑆𝑦 √1,3
𝐵 = 𝑟𝑥𝑦 = 0,56 = 0,609
𝑆𝑥 √1,1
21- Con los datos de su investigación, la puntuación en la escala de IEE que pronosticamos para un estudiante cuyos
padres obtienen una puntuación de 3,1 puntos en la escala de IEA es:
A) 3,02
B) 3,34
C) Faltan datos para su cálculo.
22- Considerando que la IE de los Escolares (IEE) se puede predecir a partir de la IE de los padres y de los Estilos
Parentales (EP), la correlación semiparcial entre las variables IEA e IEE representa la contribución de la IE de los
padres sobre la IE de los hijos habiendo eliminado:
A) de la variable IEE la influencia de EP.
B) de la variable IEA la influencia de EP.
C) tanto de IEE como de IEA la influencia de EP.
23- Si en la ecuación de regresión para pronosticar la IE de los hijos (IEE) a partir de la IE de los padres (IEA) y su
Estilo Parental (EP) se obtuviese un coeficiente de determinación de 0,3969 podríamos afirmar que el 39,69% de
la varianza en la IE de los hijos (IEE) se debe a:
A) La IE de sus padres (IEA).
B) Al Estilo Parental (EP) de los padres.
C) Una combinación lineal de la IE y el EP de los padres.
24- La correlación entre la IE de los hijos (IEE) y IE de padres (IEA) eliminando de ésta la influencia del estilo parental
(EP) es, aproximadamente:
A) 0,56
B) 0,32
C) 0,38
𝑟𝑦1 − 𝑟𝑦2 𝑟12 𝑟𝐼𝐸𝐸;𝐼𝐸𝐴 − 𝑟𝐼𝐸𝐸;𝐸𝑃 𝑟𝐼𝐸𝐴;𝐸𝑃 0,56 − 0,65 ∙ 0,42
𝑠𝑟1 = = = = 0,38
√1 − 𝑟122 √1 2
2
√1 − 𝑟𝐼𝐸𝐴;𝐸𝑃 − 0,65
25- El valor del estadístico para contrastar la hipótesis de significación de la correlación lineal simple entre la IE de
los padres (IEA) y su estilo parental (EP) es, aproximadamente:
A) 6,05
B) 7,65
C) 4,14
𝑟𝑥𝑦 √𝑛 − 2 0,65√82 − 2
𝑇= = = 7,65
√1 − 2
𝑟𝑥𝑦 √1 − 0,652
6
Modelo A. Septiembre de 2016. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto
SITUACIÓN 1. Tras aplicar un programa de tratamiento del hábito de fumar a un grupo de 100 fumadores (50
hombres y 50 mujeres), 65 de ellos dejan de fumar (30 hombres y 35 mujeres). La edad media de la muestra
fue de 40 años con una cuasidesviación típica igual a 6.
1) El intervalo de confianza de la media poblacional de la variable edad, para un nivel de confianza del 99%, es
un valor comprendido entre:
A) 39,88 y 40,12
B) 38,42 y 41,58
C) 36,01 y 40,08
𝑆𝑛−1 6
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 𝑡99;0,995 = 2,626 = 1,575
√𝑛 √100
41,58
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 40 ± 1,5756 → {
38,42
Antes del tratamiento, el terapeuta informa a los sujetos que espera lograr que más de la mitad de ellos
dejen de fumar. Tras aplicar la terapia, y para comprobar si se cumplen las expectativas del terapeuta:
4) Asumiendo que tras la terapia la proporción de fumadores en la población es igual a 0,5, la probabilidad de
obtener un estadístico de contraste como el observado, o más extremo, es igual a:
A) 0,05
B) 0,95
C) 0,0013
Para comprobar si en la población son iguales las proporciones de hombres y mujeres que dejan de fumar,
realizamos otro contraste de hipótesis. En relación a éste:
35 30
𝑝1 − 𝑝2 −
𝑍= = 50 50 = 1,05
1 1
√𝑃(1 − 𝑃) ( + ) √0,65(1 − 0,65) ( 1 + 1 )
𝑛1 𝑛2 50 50
8) Con un nivel de confianza del 95%, la conclusión sobre las proporciones de hombres y mujeres que dejan de
fumar es que:
A) No podemos rechazar la hipótesis de que ambas proporciones sean iguales en la población.
B) La proporción poblacional de hombres que dejan de fumar es superior a la de mujeres.
C) La proporción poblacional de mujeres que dejan de fumar es superior a la de hombres.
9) En un contraste de hipótesis sobre dos medias en el que el tamaño del efecto es moderado:
A) El estadístico de contraste puede ser significativo o no, dependiendo del tamaño de la muestra.
B) El estadístico de contraste siempre será significativo para 𝛼 = 0,05
C) El estadístico de contraste siempre será significativo para 𝛼 = 0,01
SITUACIÓN 2. Para comparar la eficacia de tres métodos de enseñanza se dispone de una muestra de 9 sujetos,
que se asignan aleatoriamente a cada uno de los tres métodos (𝑎1 , 𝑎2 𝑦 𝑎3 ), obteniéndose los siguientes
resultados:
-2-
𝑎1 𝑎2 𝑎3 𝑎12 𝑎22 𝑎32
3 4 6 9 16 36
2 3 4 4 9 16
1 2 5 1 4 25
Ʃ 6 9 15 14 29 77
Se asume que estos datos cumplen los supuestos necesarios para aplicar el correspondiente análisis.
Se trata de un ANOVA para un factor con muestras independientes con tres niveles (𝑎 = 3) y un modelo
equilibrado (𝑛 = 3)
302 62 92 152
𝑻 = 6 + 9 + 15 = 30; [𝑻] = = 100; [𝒀] = 14 + 29 + 77 = 120; [𝑨] = + + = 114
9 3 3 3
FV SC gl MC F
Inter 14 2 7
Intra 6 6 1 7
Total 20 8
14) Para un nivel de confianza del 95%, el valor crítico es aproximadamente igual a:
A) 5,143
B) 7,260
C) 10,92
𝑐2 2
𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 = √(𝑎 − 1) ∙ 𝐹(1−𝛼),(𝑎−1),(𝑁−𝑎) √𝑀𝐶𝐼𝑛𝑡𝑟𝑎 [∑ ( 𝑖 ⁄𝑛𝑖 )] = √(3 − 1) ∙ 5,143 ∙ 1 ∙ = 2,619
3
SITUACIÓN 3. El estilo atributivo interno ante situaciones negativas hace referencia a la tendencia persistente
de algunas personas a atribuir a sus propias características personales internas (torpeza, incapacidad,
irresponsabilidad, etc) el origen causal de las diferentes situaciones negativas o fracasos que experimentan a lo
largo del tiempo (suspender un examen, amonestación, separación, etc.) lo que les hace más propensas a
experimentar síntomas depresivos, cuando tienen que enfrentarse a situaciones similares. En un trabajo
publicado en la Revista de Psicopatología y Psicología Clínica por Sanjuán, Pérez-García, Rueda y Ruiz (2008) se
señala que, en una muestra de mujeres universitarias, los síntomas depresivos pierden su asociación con el
estilo atribucional cuando se controla el efecto de los síntomas de ansiedad.
Imagine que usted dispone de una muestra de 62 varones que responden a tres cuestionarios para medir el
estilo atribucional (E), los síntomas de Ansiedad (A) y Depresión (D) ante situaciones negativas, siendo sus
desviaciones típicas 12,5, 3,2 y 3,5 respectivamente. También obtiene las siguientes correlaciones simples
entre las puntuaciones del cuestionario de Estilo atribucional (E) y los de Ansiedad (A) y Depresión (D):
𝑟𝐸𝐴 = 0,26, 𝑟𝐸𝐷 = 0,32, 𝑟𝐷𝐴 = 0,39.
19) ¿Qué porcentaje de la variabilidad de las puntuaciones en el cuestionario de estilo atribucional (E) se debe
a la depresión:
A) 10,24%
B) 67,6%
-4-
C) 1,02%
2
𝑟𝐸𝐷 = 0,322 = 0,1024 → 10,24%
20) Si queremos medir la relación entre el estilo atribucional (E), y la ansiedad, (A), eliminando de ambas
variables la influencia de la depresión (D), debemos calcular:
A) La correlación múltiple de E con A y D.
B) La correlación parcial entre E y A.
C) La correlación semiparcial entre A y E.
21) ¿Qué porcentaje de la variabilidad del estilo atribucional queda sin explicar por la depresión y la ansiedad?:
A) 64,8%
B) 12,4%
C) 87,6%
2 2
2
𝑟𝑦1 + 𝑟𝑦2 − 2𝑟𝑦1 𝑟𝑦2 𝑟12 0,262 + 0,322 − 2 ∙ 0,26 ∙ 0,32 ∙ 0,39
𝑅𝑦.12 = = = 0,124
1 − 𝑟212 1 − 0,392
22) En puntuaciones directas, los coeficientes de regresión para pronosticar las puntuaciones del estilo
atribucional en función de la depresión y la ansiedad son, respectivamente:
A) 0,26 y 0,16
B) 0,92 y 0,62
C) 0,15 y 0,39
24) Para determinar qué parte de la variabilidad del estilo atribucional (E) se debe exclusivamente a la
depresión (D) debemos calcular:
A) El coeficiente de determinación múltiple.
B) El cuadrado del coeficiente de correlación parcial.
C) El coeficiente de correlación semiparcial.
-6-
Modelo C. Septiembre de 2016. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir
texto
SITUACIÓN 1. En un estudio de Paredes y Moreno (2015) publicado en la Revista de Psicología Clínica con niños
y adolescentes, se analizan y comparan las competencias lingüísticas en los niveles morfológicos y pragmáticos
del lenguaje entre menores con trastornos específicos del lenguaje (TEL) y aquellos con sintomatología
hiperactiva-atencional (TDAH), encontrando diferencias significativas en los niveles de análisis morfológico y
pragmático, siendo el grupo con sintomatología hiperactiva-atencional el que presenta mayores dificultades a
nivel pragmático del lenguaje (su uso en distintas situaciones de comunicación e interacción social).
Imagine que dispone de una muestra de 42 niños de entre 6 y 11 años de los que 26 presentan trastorno
específico del lenguaje (TEL) y el resto sintomatología de trastorno por déficit de atención con hiperactividad
(TDAH). A todos ellos se les administra la Batería de Lenguaje Objetiva y Criterial, BLOC, cuyas puntuaciones se
distribuyen normalmente en la población, para evaluar las diferentes áreas básicas del lenguaje. En el nivel
pragmático del BLOC se obtuvieron los resultados que se muestran en la tabla (puntuaciones más bajas indican
competencias lingüísticas más bajas y mayor dificultad).
1) Con un nivel de confianza del 95%, el intervalo de confianza de la media poblacional de los niños con TDAH
en la batería BLOC, es un valor comprendido, aproximadamente, entre:
A) 20,7 y 31,4
B) 22,1 y 29,9
C) 20,1 y 31,9
𝑆𝑛−1 11 11
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 𝑡16−1;0,975 = 2,131 = 5,86
√𝑛 √16 √16
31,86
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 23 ± 5,86 → {
20,14
2) Con un nivel de confianza del 95%, el intervalo de confianza para la varianza poblacional de las puntuaciones
en la batería BLOC de los niños con trastornos específicos del lenguaje (TEL), es:
A) 157,5 y 487,8
B) 136,4 y 608,4
C) 13,12 y 40,6
2
(𝑛 − 1)𝑆𝑛−1 (26 − 1)162 2
(𝑛 − 1)𝑆𝑛−1 (26 − 1)162
𝑙𝑖 = 2 = = 157,455 𝑙𝑠 = 2 = = 487,816
𝜒𝑛−1;1−𝛼⁄ 40,6465 𝜒𝑛−1;𝛼⁄ 13,1197
2 2
3) En un contraste de hipótesis bilateral sobre una media poblacional, ¿puede utilizarse el intervalo de
confianza para contrastar dicha hipótesis?
-1-
A) Sí, y se rechaza 𝑯𝟎 cuando el valor formulado en la 𝑯𝟎 se encuentra fuera del intervalo de confianza.
B) Sí, y se rechaza 𝐻0 cuando el estadístico de contraste se encuentra fuera del intervalo de confianza.
C) El intervalo de confianza no aporta información para rechazar o no 𝐻0
4) Si quisiéramos comparar las competencias lingüísticas medias en los niveles morfológicos y pragmáticos de
los niños con TEL, aplicaríamos:
A) La prueba Z para dos muestras independientes.
B) La prueba Z para dos muestras relacionadas.
C) La prueba T para muestras relacionadas.
5) Si a partir de los datos de la muestra de niños con TDAH quisiéramos comprobar que la varianza poblacional
de las puntuaciones en la batería BLOC es mayor de 500 puntos, la hipótesis nula que formulamos es:
A) 𝜎 2 ≥ 500
B) 𝜎 2 = 0
C) 𝝈𝟐 ≤ 𝟓𝟎𝟎
Si quisiéramos corroborar los resultados obtenidos por Paredes y Moreno (2015) respecto a que el grupo con
sintomatología hiperactiva-atencional (TDAH) es el que presenta mayores dificultades (puntuaciones más bajas
en la batería BLOC) a nivel pragmático respecto a los niños con sintomatología TEL:
7) Para poner a prueba la hipótesis de la pregunta anterior, y asumiendo la homogeneidad de las varianzas
poblacionales, el valor absoluto del estadístico de contraste, y su nivel crítico p, valen aproximadamente:
A) 5,05 (p < 0,01)
B) 2,42 (0,01 < p < 0,05)
C) 3,27 (p > 0,01)
8) Con los resultados obtenidos en las preguntas anteriores, se concluye que entre los dos grupos de niños:
A) No existen diferencias significativas.
B) El grupo con TDAH presenta mayores dificultades a nivel pragmático del lenguaje para 𝑵𝑪 = 𝟗𝟗%
C) El grupo con TEL presenta mayores dificultades a nivel pragmático del lenguaje para 𝑁𝐶 = 95%
9) La probabilidad de rechazar una hipótesis nula que es verdadera, recibe el nombre de:
A) Potencia del contraste.
B) Error tipo II.
C) Nivel de significación.
Matriz AB
𝑎1 𝑎2 𝑎3
Con prácticas (𝑏1 ) 15 24 30
Sin prácticas (𝑏2 ) 6 9 21
FV SC g.l. MC F p F tabla
A 76,00 2 38,00 45,600 0,0000 3,885
B 60,50 1 60,50 72,600 0,0000 4,747
A×B 4,00 2 2,00 2,400 0,1328 3,885
Intra 10,00 12 0,83
Total 150,50 17 8,85
16) En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t de Student para
realizar comparaciones múltiples dos a dos?:
A) Sí, porque es la mejor opción.
B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa.
C) No porque se incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.
17) En un ANOVA de medidas repetidas de un factor, la variabilidad total observada en la variable dependiente
se descompone en tres componentes, los dos primeros corresponden a la variabilidad del factor que
estamos manipulando y la variabilidad de los sujetos. El tercer componente hace referencia a:
A) La variabilidad de la interacción entre el factor y los sujetos.
B) Las desviaciones de las puntuaciones de los sujetos respecto a la combinación de tratamientos.
C) Ninguna de las opciones anteriores es correcta.
SITUACIÓN 3. Se aplica un programa de tratamiento del hábito de fumar a un único sujeto durante siete
semanas (𝑛 = 7). Se desea pronosticar el número de cigarros fumados (Y) en función del número de semana
de tratamiento (X). A partir de los siguientes sumatorios: ∑ 𝑋 = 28; ∑ 𝑌 = 98; ∑ 𝑋𝑌 = 338; ∑ 𝑋 2 =
140; ∑ 𝑌 2 = 1484.
18) El coeficiente de correlación de Pearson entre X e Y vale, aproximadamente:
A) 0,930
B) – 0,93033
C) – 𝟎, 𝟗𝟔𝟒
𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 7 ∙ 338 − 28 ∙ 98
𝑟𝑥𝑦 = = = −0,964
√[𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 ][𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ] √(7 ∙ 140 − 282 )(7 ∙ 1484 − 982 )
-4-
19) El estadístico de contraste y el nivel crítico para comprobar si la relación entre X e Y es significativa valen,
aproximadamente:
A) 𝑇 = 8,14 (𝑝 > 0,01)
B) 𝑇 = −2,73 (𝑝 < 0,02)
C) 𝑻 = −𝟖, 𝟏𝟒 (𝒑 < 𝟎, 𝟎𝟏)
𝑟𝑥𝑦 √𝑛 − 2 −0,964√7 − 2
𝑇= = = −8,14
√1 − 2
𝑟𝑥𝑦 √1 − 0,9642
𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 7 ∙ 338 − 28 ∙ 98
𝐵= = = −1,93
𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 7 ∙ 140 − 282
21) Según la ecuación de regresión obtenida, por cada dos semanas de tratamiento, el número de cigarros
fumados disminuirá en, aproximadamente:
A) 4 cigarros
B) 2 cigarros
C) Dependerá de la semana en cuestión.
Por cada semana de tratamiento el número de cigarros fumados disminuye en 1,93, luego en dos
semanas: 1,93 ∙ 2 = 3,86 ≈ 4
22) Según la ecuación de regresión obtenida, el número de semanas necesario para que el sujeto deje de
fumar (𝑌 ′ = 0) es:
A) 8 semanas.
B) Entre 8 y 9 semanas.
C) Entre 11 y 12 semanas.
23) Para que sean válidas las inferencias que sobre la variable dependiente se hagan con la recta de regresión,
las varianzas de las distribuciones de los errores, condicionadas a los diferentes valores de la variable
independiente deben de cumplir el supuesto de:
A) Heterocedasticidad.
B) Homocedasticidad.
C) Uniformidad.
24) Para la regresión lineal simple se obtienen dos coeficientes, ordenada en el origen (𝐵0) y pendiente (𝐵).
Generalmente, estaremos más interesados en interpretar:
-5-
A) 𝐵0
B) 𝑩
C) Depende de la magnitud del coeficiente de correlación de Pearson.
25) Con dos variables independientes (𝑋1 ; 𝑋2) y una variable dependiente (𝑌), el coeficiente de correlación
parcial entre 𝑋1 e 𝑌, representa:
A) La relación entre 𝑌 y 𝑋1 eliminando el influjo de 𝑋2 sobre la variable dependiente.
B) La relación entre 𝒀 y 𝑿𝟏 eliminando el influjo de 𝑿𝟐 sobre la variable dependiente y sobre 𝑿𝟏 .
C) La relación entre 𝑌 y 𝑋2 eliminando el influjo de 𝑋1 sobre la variable dependiente y sobre 𝑋2.
-6-
Modelo A. Enero de 2017. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y calculadora en la que no se pueda introducir texto
SITUACIÓN 1.Aliri, Garaigordobil y Martínez-Valderrey (2013) publican un trabajo en el que se analizan las
diferencias en actitudes sexistas en función del tipo de colegio. Para ello utilizan una muestra de adolescentes de 11 a
17 años de la ESO escolarizados en distintos centros educativos de Guipúzcoa (Guipuzkoa) de los que el 40,3%
estudiaban en colegios privados religiosos y el resto en colegios no religiosos (públicos o privados). Sus resultados
indican que los chicos que estudian en colegios religiosos son más sexistas que los que estudian en colegios no
religiosos, mientras que en las chicas no aparecen estas diferencias.
Usted desea comprobar si estos resultados también se producen en su localidad, para lo que selecciona una
muestra de 300 adolescentes, de los que el 47% son chicos y de estos 61 estudian en colegios religiosos (CR). A todos
se les pasa el Inventario de Sexismo Ambivalente para adolescentes(ISA), en el que a mayor puntuación mayor
sexismo. Los chicos de colegios religiosos (CR) obtienen una media de 3,9 con una desviación típica insesgada de
0,75 mientras que los chicos de colegios no religiosos (CNR) tienen una media de 3,4 y desviación típica insesgada de
0,84.
1) Con los datos de su trabajo, el valor del estadístico de contraste sobre la igualdad de varianzas entre los chicos de
colegios no religiosos (CNR) y los chicos de colegios religiosos (CR) es, aproximadamente:
A) 1,25
B) 1,67
C) 0,68
Sobre la muestra de 300 adolescentes, el número de chicos es igual a: 𝑛𝑛º 𝑐𝑐ℎ𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 = 300 × 0,47 = 141
Dado que 61 chicos estudian en colegios religiosos, el número de chicos que estudian en colegios no religiosos es
iguala a: 141 − 61 = 80
Tenemos por lo tanto dos muestras independientes (para los chicos) con los siguientes datos:
El estadístico de contraste sobre igualdad de varianzas entre los chicos de colegios no religiosos y los chicos de
colegios religiosos es:
𝑆𝑆̂𝐶𝐶𝐶𝐶𝐶𝐶
2
0,842
𝐹𝐹 = = = 1,254
𝑆𝑆̂𝐶𝐶𝐶𝐶
2 0,752
2) El nivel crítico p, para tomar una decisión respecto a la hipótesis de igualdad de varianzas es:
A) 𝑝𝑝 < 0,10
B) 𝒑𝒑 > 0,10
C) 𝑝𝑝 < 0,05
-1-
Tenemos 79 y 60 g.l. siendo los más próximos en las tablas: 60 y 60 g.l. Observamos que en dichas tablas que:
𝑓𝑓60;60;0,90 = 1,395, y como el contraste es bilateral, multiplicamos por dos la probabilidad de las tablas, con lo que:
𝑝𝑝 > 0,20.
3) Si en el trabajo original de Aliri et al. (2013)utilizaron una muestra de 1.440 adolescentes para responder al ISA,
¿entre que valores se encontrará la proporción poblacional de adolescentes escolarizados en colegios no
religiosos, con un nivel de confianza del 95%?:
A) 36,9% - 41,4%
B) 57,2% - 62,2%
C) 37,8% - 42,8%
En la muestra del estudio de Aliri, el 40,3% estudian en colegios religiosos, por lo que la proporción de
adolescentes escolarizados en colegios no religiosos, es:
𝑝𝑝 = 1 − 0,403 = 0,597
Por lo que el intervalo de confianza, resulta: 𝑝𝑝 ± Emax : 0,597 ± 0,025 = ( 0,572 ; 0,622)
4) Si su hipótesis es que los chicos de colegios religiosos son más sexistas que los de colegios públicos, la hipótesis
nula a contrastar, es:
A) 𝜇𝜇𝐶𝐶𝐶𝐶 = 𝜇𝜇𝐶𝐶𝐶𝐶𝐶𝐶
B) 𝜇𝜇𝐶𝐶𝐶𝐶 ≥ 𝜇𝜇𝐶𝐶𝐶𝐶𝐶𝐶
C) 𝝁𝝁𝑪𝑪𝑪𝑪 ≤ 𝝁𝝁𝑪𝑪𝑪𝑪𝑪𝑪
Si su hipótesis es que los chicos de colegios religiosos son más sexistas, se está indicando la dirección de la
diferencia 𝜇𝜇𝐶𝐶𝐶𝐶 > 𝜇𝜇𝐶𝐶𝐶𝐶𝐶𝐶 . Esta sería la hipótesis alternativa. La hipótesis nula es la complementaria que siempre
incluye el signo "igual". Las hipótesis que se han de plantear son:
5) Para contrastar la hipótesis anterior, la analizaría bajo las condiciones de un diseño de:
-2-
A) Dos muestras independientes provenientes de poblaciones con la misma varianza.
B) Dos muestras relacionadas, porque son estudiantes, adolescentes y de la ESO.
C) Dos muestras independientes provenientes de poblaciones con varianzas distintas.
6) Con los resultados obtenidos en su trabajo, el valor absoluto del estadístico de contraste vale, aproximadamente:
A) 3,67
B) 2,6
C) 1,64
El estadístico de contraste para dos muestras independientes que provienen de poblaciones con varianzas
desconocidas pero iguales, es:
8) Si el valor del estadístico de Cohen, obtenido a partir de sus datos, fuera 0,65, ¿Cuál de las siguientes
afirmaciones es FALSA?:
A) El 65% de los chicos escolarizados en CR muestran unas actitudes sexistas superiores a la media de los chicos
escolarizados en CNR.
B) El 74,22% de los chicos escolarizados en CR muestran unas actitudes sexistas superiores a la media de los
chicos escolarizados en CNR.
C) El 74,22% de los chicos escolarizados en CNR muestran unas actitudes sexistas inferiores a la media de los
chicos escolarizados en CR.
A partir de la puntuación d=0,65 y consultando las tablas de la distribución normal, se observa que las
alternativas B y C, son ciertas y se representan en la siguiente figura:
B) C)
-3-
10) La potencia del contraste se puede expresar simbólicamente como:
A) 𝑃𝑃(𝐻𝐻0 = 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 | 𝐻𝐻0 = 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓)
B) 𝑃𝑃(𝐻𝐻0 = 𝑟𝑟𝑟𝑟𝑟𝑟ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 | 𝐻𝐻0 = 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐)
C) 𝑷𝑷(𝑯𝑯𝟎𝟎 = 𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓 | 𝑯𝑯𝟎𝟎 = 𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇)
La potencia del contraste es una decisión correcta que corresponde a la probabilidad de rechazar una Ho cuando es
FALSA:
SITUACIÓN 2.Aliri, Garaigordobil y Martínez-Valderrey (2013) publican un trabajo en el que se analizan las
diferencias en actitudes sexistas en función del tipo de colegio. Para ello utilizan una muestra de adolescentes de 11 a
17 años de la ESO escolarizados en distintos centros educativos de Guipúzcoa (Guipuzkoa) de los que el 40,3%
estudiaban en colegios privados religiosos y el resto en colegios no religiosos. Sus resultados indican que los chicos
que estudian en colegios religiosos son más sexistas que los que estudian en colegios no religiosos, mientras que en
las chicas no aparecen estas diferencias.
Existe interacción cuando los efectos de una VI son diferentes para cada uno de los niveles de la otra variable
independiente. Y esto es lo que se refleja al señalar que " Sus resultados indican que los chicos que estudian en
colegios religiosos son más sexistas que los que estudian en colegios no religiosos, mientras que en las chicas no
aparecen estas diferencias".
13) El análisis de los resultados de este trabajo se realiza desde la estrategia de un diseño:
A) Unifactorial de muestras independientes.
B) Factorial 2x2.
C) De regresión con dos variables independientes o predictoras.
Dos variables independientes (tipo de colegio y sexo) con dos niveles en cada una (religiosos vs no religiosos, y chico
vs chica)
Posteriormente usted desea comprobar si estos resultados también se producen en su localidad, para lo que
selecciona una muestra de 300 adolescentes, de los que el 53% son chicas y de estas 61 estudian en colegios
privados religiosos (PRR), 29 en colegios privados no religiosos (PRN) y el resto en colegios públicos no religiosos
(PUN). Todas ellas responden alInventario de Sexismo Ambivalente para adolescentes(ISA) obteniendo los siguientes
resultados en el análisis: 𝑆𝑆𝑆𝑆𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 = 672 y 𝑀𝑀𝑀𝑀𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼 = 14. Se cumplen los supuestos necesarios para comprobar si el
tipo de colegio influye en las actitudes sexistas de las chicas.
-4-
Se utiliza una muestra de 300 adolescentes de los que el 53% son chicas. Y de estas sabemos cuántas están
escolarizadas en colegios privados religiosos (PRR), privados no religiosos (PRN) y públicos no religiosos (PUN). Se
pide comprobar si el tipo de colegio influye en las actitudes sexistas de las chicas. Se trata, por tanto, de un ANOVA
de un factor con tres niveles (PRR, PRN y PUN) siendo el N referido a las chicas: 𝑁𝑁 = 0,53 ∙ 300 = 159. Los datos
aportados en el enunciado son:
FV SC gl MC F
Inter 𝑎𝑎 − 1 = 3 − 1 = 2 14
Intra
Total 672 𝑁𝑁 − 1 = 159 − 1 = 158
FV SC gl MC F
Inter 2 ∙ 14 = 28 2 14
644� 14
Intra 672 − 28 = 644 158 − 2 = 156 156 = 4,128 = 3,391
4,128
Total 672 158
Un factor que corresponde al tipo de colegio con tres niveles PRR, PRN y PUN.
Consultamos las tablas de F con 2 y 120 gl (el valor más aproximado a 158 gl) y figuran los siguientes:
F= 3,072 que deja a su izquierda una probabilidad
de 0,95 y a su derecha de 0,05
-5-
17) Si desea comprobar que la media de las chicas de colegios privados religiosos es igual que la media de las chicas
de los otros dos colegios, ¿cuál de las siguientes sería su hipótesis nula?:
A) μ𝑃𝑃𝑃𝑃𝑃𝑃 = μ𝑃𝑃𝑃𝑃𝑃𝑃 + μ𝑃𝑃𝑃𝑃𝑃𝑃
B) (2) μ𝑃𝑃𝑃𝑃𝑃𝑃 + (1) μ𝑃𝑃𝑃𝑃𝑃𝑃 + (1) μ𝑃𝑃𝑃𝑃𝑃𝑃 = 0
C) (𝟏𝟏)𝛍𝛍𝑷𝑷𝑷𝑷𝑷𝑷 + (𝟏𝟏)𝛍𝛍𝑷𝑷𝑷𝑷𝑷𝑷 + (−𝟐𝟐)𝛍𝛍𝑷𝑷𝑷𝑷𝑷𝑷 = 𝟎𝟎
La Ho es: "la media de las chicas de colegios privados religiosos es igual que la media de las chicas de los otros
dos colegios", es decir:
μPRN + μPUN
H0 : μ𝑃𝑃𝑃𝑃𝑃𝑃 = → (2)μ𝑃𝑃𝑃𝑃𝑃𝑃 = (1)μ𝑃𝑃𝑃𝑃𝑃𝑃 + (1)μ𝑃𝑃𝑃𝑃𝑃𝑃
2
que se puede expresar de varias formas, alterando el orden de los sumandos, como:
18) El valor crítico para rechazar o no la hipótesis nula formulada en la pregunta anterior, se obtiene.
A) En la tabla de la distribución t con 𝑁𝑁 − 1 g.l.
B) En la tabla de la distribución F con 𝑛𝑛1 − 1 y 𝑛𝑛2 − 1 g.l.
C) A partir del rango mínimo de Scheffé.
La pregunta anterior (la nº 17) hace referencia a lo que se conocen como contrastes "a posteriori", "post hoc",
comparaciones múltiples o no planificados y, como se indica en la página 176 del texto:
La alternativa A) hace referencia al modelo de efectos fijos mientras que la alternativa B) hace referencia al
modelo de efectos aleatorios que se describen en el tema 5 epígrafes 5.3 y 5.5. La alternativa C) es falsa.
SITUACIÓN 3. García, Alvarado y Jiménez (2000) estudian la capacidad de la regresión lineal para predecir el
rendimiento académico, utilizando una muestra de 175 universitarios de primero de psicología, encontrando que el
rendimiento previo (RP)y la participación (P) son buenos predictores del rendimiento académico (R), obteniendo un
coeficiente de determinación múltiple igual 0,42 y el siguiente modelo de regresión:
-6-
Imagine que usted dispone de una muestra de 25 estudiantes de psicología para los que obtiene un coeficiente de
correlación de Pearson entre R y RP igual a 0,45, y el siguiente modelo de estimación:
21) El modelo obtenido por García, Alvarado y Jiménez (2000) pronostica, para un sujeto cuya participación es nula y
cuyo rendimiento previo es igual a 7 puntos, una puntuación en rendimiento académico igual a:
A) 6,62
B) 5,80
C) 8,26
22) Para la muestra de 25 sujetos de la que usted dispone, se desea contrastar si la relación entre R y RP es
significativa. En este caso, se obtiene un estadístico de contraste aproximadamente igual a:
A) 2,42
B) 3,02
C) 1,48
𝐻𝐻0 : 𝜌𝜌𝑥𝑥𝑥𝑥 = 0
𝐻𝐻1 : 𝜌𝜌𝑥𝑥𝑥𝑥 ≠ 0
Y el estadístico de contraste:
𝑟𝑟𝑥𝑥𝑥𝑥 √𝑛𝑛 − 2 0,45√25 − 2
𝑇𝑇 = = = 2,417
�1 − 2
𝑟𝑟𝑥𝑥𝑥𝑥 �1 − 0,452
23) Para la muestra de 25 sujetos de la que usted dispone, la conclusión sobre el contraste de la pregunta anterior es:
A) La relación entre R y RP no es significativa para un nivel de confianza del 95% (0,10 < 𝑝𝑝 < 0,20).
B) La relación entre R y RP es significativa para un nivel de confianza del 99% (𝑝𝑝 < 0,01).
C) La relación entre R y RP es significativa para un nivel de confianza del 95% (𝟎𝟎, 𝟎𝟎𝟎𝟎 < 𝑝𝑝 < 0,05).
-7-
En la tabla de la distribución T con n-2= 25-2= 23 gl los valores
más aproximados al estadístico de contraste obtenido
(T=2,417) son 2,069 -que deja a su derecha una probabilidad
de 0,025- y 2,5 -que deja a su izquierda una probabilidad de
0,01. Por tanto, el estadístico de contraste, que se encuentra
entre los dos, deja una probabilidad mayor que 0,01 y menor
que 0,025.
24) Con la muestra de 25 sujetos de la que usted dispone, si un sujeto obtiene una puntuación en RP igual a la media
de dicha variable, su puntuación típica pronosticada en la variable R es igual a:
A) Cero.
B) Uno.
C) No disponemos de datos suficientes.
Si la puntuación X es igual a su media , entonces la puntuación típica Z es:
X−� X 0
𝑍𝑍 = = =0
Sx Sx
Y la puntuación típica pronosticada, es:
𝑍𝑍𝑌𝑌 = 𝑟𝑟𝑋𝑋𝑋𝑋 . 𝑍𝑍𝑋𝑋 = 𝑟𝑟𝑋𝑋𝑋𝑋 . 0 = 0
25) Los supuestos necesarios para realizar inferencias sobre correlación y regresión, incluyen:
A) Heterocedasticidad para las varianzas de las distribuciones condicionadas de los errores.
B) Independencia entre los valores estimados Y´ y los errores de estimación ε.
C) Independencia entre los valores de la variable independiente X y los valores estimados Y´.
Puede consultarse el epígrafe 8.3.3. sobre inferencias en la correlación y regresión para comprobar que la
alternativa correcta es la B).
-8-
Modelo C. Febrero de 2017. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y calculadora en la que no se pueda introducir texto
SITUACIÓN 1. García y García (2002) estudian variables biográficas, de aptitudes y de personalidad con el fin de
pronosticar la inserción laboral en el sector de la construcción. Utilizan una muestra de 86 alumnos que finalizan
cursos de formación profesional. La edad media de la muestra es de 23,4 años con una cuasidesviación típica de 5,6
y 75 sujetos han obtenido un nivel de estudios de graduado escolar.
Usted está interesado en estudiar la misma problemática del trabajo de García y García (2002), para lo que dispone
de una muestra de 100 sujetos cuya edad media es de 21,5 años con una cuasivarianza de 65. El 90% de la muestra
tiene un nivel de graduado escolar.
Por otro lado, usted sospecha que en los años transcurridos desde el trabajo de García y García han cambiado las
características de los sujetos que realizan cursos de formación profesional, de manera que en la actualidad dichos
sujetos presentan una edad media menor, mayor varianza en esta variable y una proporción superior de sujetos con
un nivel de estudios de graduado escolar.
1) Con los datos de los que usted dispone, con un nivel de confianza del 95% ¿entre qué valores se encontrará la
proporción poblacional de sujetos que tiene un nivel de estudios de graduado escolar? (realice los cálculos
tomando cuatro decimales).
A) (0,851; 0,949)
B) (0,841; 0,959)
C) (0,823; 0,977)
0,90 ∙ 0,10
𝐸𝑚𝑎𝑥 = 𝑧1−𝛼⁄2 𝜎𝑝 = 1,96 ∙ √ = 0,0588
100
0,9588
𝑝 ± 𝐸𝑚𝑎𝑥 → 0,90 ± 0,0588 → {
0,8412
Para comprobar si la proporción de sujetos con un nivel de estudios de graduado escolar es superior en los
datos de los que usted dispone (Grupo 1) respecto a la de los datos de García y García (Grupo 2)
-1-
2) La hipótesis nula es:
A) 𝜋1 − 𝜋2 = 0
B) 𝜋1 − 𝜋2 ≥ 0
C) 𝝅𝟏 − 𝝅𝟐 ≤ 𝟎
Solución:
Como se pude observar en el enunciado, el investigador plantea como hipótesis alternativa que 𝜋1 > 𝜋2 ,
entonces para la hipótesis nula tendremos que:
𝐻0 : 𝜋1 ≤ 𝜋2
𝐻0 : 𝜋1 − 𝜋2 ≤ 0
La opción correcta es la C.
Solución:
Es un contraste de dos proporciones de muestras independientes, asumiendo que D = 0, luego los cálculos son:
𝑛1 𝑝1 + 𝑛2 𝑝2 100 ∙ 0,9 + 86 ∙ 0,872
𝑃= = = 0,887
𝑛1 + 𝑛2 100 + 86
𝑝1 − 𝑝2 0,9 − 0,872
𝑍= = = 0,60
1 1
√𝑃(1 − 𝑃) ( + ) √0,887(1 − 0,887) ( 1 + 1 )
𝑛1 𝑛2 100 86
Opción correcta A.
Solución:
El contraste es unilateral izquierdo. Acudiendo a la
tabla de curva normal, observamos que la
probabilidad de encontrar una puntuación más
extrema (superior en este caso) a: 𝑍 = 0,60 es:
𝑝 = 1 − 0,7257 = 0,2743
-2-
Solución:
Dado que: 𝑝 > 0,05 concluimos que no existen diferencias significativas para un 𝑁𝐶 = 95%.
Para comprobar si en los datos que usted obtiene es superior la varianza y menor la media respecto de los
datos de García y García:
6) El estadístico de contraste y el nivel crítico para comprobar la hipótesis sobre las varianzas son,
aproximadamente:
A) 𝟐, 𝟎𝟕𝟑 (𝒑 < 𝟎, 𝟎𝟏)
B) 1,348 (𝑝 = 0,10)
C) 1,612 (𝑝 < 0,05)
7) El estadístico de contraste y el nivel crítico (los grados de libertad son mayores que 100) para comprobar la
hipótesis sobre las medias son, aproximadamente:
A) −3,17 (𝑝 = 0,0008)
B) −2,14 (𝑝 = 0,0162)
C) −𝟏, 𝟖𝟗 (𝒑 = 𝟎, 𝟎𝟐𝟗𝟒)
Solución:
Se trata de un contraste unilateral sobre las medias de dos grupos independientes habiendo verificado previamente
que las varianzas son diferentes (ejercicio 6).
Hemos utilizado la tabla de la curva normal ya que los g.l. son mayores que 100 como se puede comprobar:
-3-
8) Tras el análisis estadístico sobre las diferencias sobre varianzas y medias se concluye (𝑁𝐶 = 95%), que en los
datos de los que usted dispone:
A) La varianza es mayor y la media es menor que en los datos de García.
B) La varianza es menor y la media es menor que en los datos de García.
C) La varianza es menor y la media es mayor que en los datos de García.
Solución: en los apartados anteriores se ha podido verificar que se rechazó la hipótesis de varianzas iguales ( p <
0,01) así como la hipótesis de medias iguales (p < 0,05). Luego podemos afirmar que la varianza del grupo 1 es
mayor que la varianza del grupo 2 y que la media del grupo 1 es menor que la media del grupo 2. La opción
correcta es la A.
Preguntas teóricas
9) El tamaño del efecto:
A) Es mayor a medida que aumenta el tamaño de las muestras.
B) Es mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos experimental y control.
C) No depende del tamaño muestral.
Solución:
A diferencia de lo que sucede con los estadísticos de contraste, la magnitud del tamaño del efecto no depende
del tamaño muestral. La opción A contradice esta afirmación. La opción B es errónea porque, según la fórmula de
la d de Cohen, la diferencia de las medias entre el grupo experimental y control está en el numerador. Por tanto,
cuanto mayor sea esta diferencia, mayor será d; cuanto menor sea esta diferencia, menor será d.
SITUACIÓN 2. Un investigador desea conocer el efecto del aprendizaje musical sobre la memoria de trabajo (MT) en
distintas fases de la vida. Para ello escoge a 30 personas que, por su edad, las agrupa en tres categorías: 10 son
jóvenes, 10 maduros y 10 jubilados. De cada grupo, la mitad tienen competencias musicales y la otra mitad no. En
cada uno de ellos mide la memoria de trabajo (MT) mediante el número de aciertos en la tarea de bloques de Corsi.
En su informe indica que se obtienen resultados significativos, debidos tanto a la Edad como a la interacción Edad x
Competencia Musical (F = 8,22 y F = 6,54, respectivamente utilizando un 𝛼 = 0,05) pero no así para la Competencia
Musical (F = 2,44). Respecto a la edad no se encontraron diferencias significativas para MT en el grupo de jóvenes
debida a la Competencia Musical, pero sí se observan diferencias en los otros dos grupos de edad, y siempre a favor
de personas con competencia musical.
-4-
El diseño es de dos factores independientes. Edad con tres niveles: Jóvenes, Maduros y Jubilados (𝑎 = 3) y
Competencia Musical (CM) con dos niveles (𝑏 = 2). El número total de sujetos es 𝑁 = 30 y el número de personas
para cada combinación de tratamientos 𝑛 = 5.
FV SC gl MC F
Edad 𝑎 −1 = 2 8,22
CM 𝑏−1 = 1 2,44
Edad x CM (𝑎 − 1)(𝑏 − 1) = 2 6,54
Error 𝑎𝑏(𝑛 − 1) = 24
Total 𝑁 − 1 = 29
12) El valor de la F crítica que separa la región de aceptación de la región de rechazo para contrastar el efecto del
factor principal Competencia Musical vale aproximadamente:
A) 19,446
B) 4,351
C) 1,095
Solución:
El valor de las tablas F de Fisher para 𝛼 = 0,05 y con 1 y 20 grados de libertad (los más próximos a 1 y 24 grados
de libertad), es 4,351.
Solución:
Con el dato que aporta el enunciado de esta pregunta, completamos la tabla de ANOVA. Conociendo la
𝑀𝐶𝐸𝑟𝑟𝑜𝑟 comenzamos calculando el resto de las medias cuadráticas.
FV SC gl MC F
Edad 2 112,3 ∙ 8,22 = 923,106 8,22
Grupo 1 112,3 ∙ 2,44 = 274,012 2,44
Edad x Grupo 2 112,3 ∙ 6,54 = 734,442 6,54
Error 24 112,3
Total 29
-5-
FV SC gl MC F
Edad 923,106 ∙ 2 = 𝟏𝟖𝟒𝟔, 𝟐𝟏𝟐 2 923,106 8,22
CM 274,012 ∗ 1 = 274,012 1 274,012 2,44
Edad x CM 734,442 ∗ 2 = 1468,884 2 734,442 6,54
Error 112,3 ∙ 24 = 2695,2 24 112,3
Total 29
Solución:
Como se indica en el enunciado, “En su informe indica que se obtienen resultados significativos, debidos tanto a la
Edad como a la interacción Edad x Competencia Musical” siendo F=6,54.
Solución:
La única afirmación compatible con el enunciado es la A, ya que se refiere a una interacción. Las otras dos opciones
son factores principales, y por lo tanto no predican nada de la interacción.
Solución: un análisis de efectos simples consiste en evaluar las diferencias entre niveles de un factor para diferentes
niveles del otro. En este caso podríamos:
a) realizar un análisis para el factor “competencia musical” para los jóvenes, otro diferente para los maduros y otro
para los jubilados, o bien
b) realizar un análisis de la edad en el grupo de sujetos con competencia musical (primer nivel de la variable
“competencia musical”) y otro diferente para el grupo de sujetos sin competencia musical (segundo nivel de la
variable “competencia musical”).
Vemos que la opción B es la única que hace referencia a alguna de estas posibilidades. Las opciones A y C sólo hacen
referencia a comparaciones para analizar los efectos principales de la edad o la competencia musical.
-6-
Solución:
Las opciones B y C son falsas. La opción correcta es la A ya que el Anova nos permite detectar interacciones (v.g., una
interacción entre elementos activos de un fármaco puede ser dañina y su detección es importante).
18) Por lo que se indica en el enunciado, cuando se han realizado las comparaciones de la interacción por efectos
simples, no se ha encontrado como significativa la diferencia en el grupo de:
A) Jóvenes.
B) Maduros.
C) Jubilados.
Solución: en el enunciado se ha indicado claramente que en este análisis de la interacción, la diferencia entre sujetos
con y sin competencia musical no es significativa en MT para los jóvenes.
SITUACIÓN 3. En un trabajo de Schlaug sobre el efecto cerebral del entrenamiento musical (tocar un instrumento),
se midió en 20 adultos la edad (en años) en que iniciaron el entrenamiento musical y el tamaño cerebral medio (en
mm) del giro precentral (zona cerebral del córtex motor primario). Se realizó un análisis de regresión de los datos
utilizando el tamaño como variable dependiente y la edad de inicio como variable independiente, del que se dispone
de los siguientes datos:
21) Por cada año más tarde que se inicie el entrenamiento musical, se estima que en promedio el tamaño del giro
precentral medido en la edad adulta disminuirá, aproximadamente:
A) 5 mm
B) 2,52 mm
C) -1,06 mm
Solución:
Nos están preguntando por la pendiente de la recta de regresión. La hemos calculado en el apartado anterior y valía
-1,064 mm aproximadamente.
-7-
22) El estadístico de contraste para comprobar si es significativo el coeficiente de correlación de Pearson, vale,
aproximadamente:
A) -2,62
B) 1,05
C) -0,25
Solución:
𝑟𝑥𝑦 √𝑛 − 2 −0,526√20 − 2
𝑇= = = −2,62
2
√1 − 𝑟𝑥𝑦 √1 − (−0,526)2
Solución:
Para un contraste bilateral, los valores críticos de
la distribución T de Student con 18 g.l. y para unos
niveles de significación de 0,05 y 0,01 son,
respectivamente: -2,10 y -2,878. El estadístico de
contraste obtenido se encuentra entre ambos valores,
por lo que se rechaza la Ho con un nivel de confianza
de 0,95 pero no con un nivel de confianza de 0,99. Esto
indica que la correlación es significativa ( p < 0,05).
Solución: Nos piden la correlación semi-parcial entre X1 e Y habiendo eliminado el influjo del resto de variables
independientes (VI´s) sobre la X1. Como solamente tenemos como otra variable independiente X2, significa que
debemos eliminar el influjo de X2 sobre X1 (ver página 264, “… para saber qué parte de la VD explica cada VI al
margen de las otras VI´s, para así poder determinar el influjo único que esa VI tiene sobre la VD. Esta relación
entre cada VI y la VD habiendo eliminado el influjo del resto de las VI´s sobre cada VI es lo que se llama Coeficiente
de correlación semiparcial”).
-9-
Modelo A. Septiembre de 2017. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto
SITUACIÓN 1: En un trabajo de Bueheler y O'Brien publicado en el Journal of Family Psychology (2011) se analizó el
bienestar de la madre ante conflictos de conciliación entre trabajo y familia, señalando que las madres con trabajos a
tiempo parcial manifiestan tener mejor estado de salud en general y menos síntomas de depresión que las madres no
trabajadoras, mientras que entre las madres con trabajos a tiempo parcial y las que trabajaban la jornada completa no se
encontraron diferencias ni en salud ni en síntomas depresivos.
Imagine que usted dispone de una muestra de 110 madres, de las que 60 trabajan a tiempo competo (C) y el resto a tiempo
parcial (P). Todas ellas responden a la Escala de Bienestar Emocional (E) de Zigmond y Snaith (1983), en la que a mayor
puntuación mayor bienestar. La media y la varianza insesgada para las mujeres del grupo C son 35 y 121, respectivamente,
y para las mujeres del grupo P son 46 y 81, respectivamente. Por otra parte, de las 60 mujeres que trabajan a tiempo
completo, 45 obtienen bajas puntuaciones en la escala E frente a las 23 de las mujeres que trabajan a tiempo parcial.
Trabaje con un 𝛼 = 0,05.
1. Para comprobar si existen diferencias significativas respecto al bienestar emocional medio entre madres trabajadoras
a tiempo completo y a tiempo parcial, se apoyaría en un diseño de dos muestras independientes provenientes de
poblaciones con varianzas:
A) desconocidas pero supuestas iguales.
B) conocidas y supuestas iguales.
C) desconocidas pero supuestas distintas.
Las varianzas poblacionales son desconocidas. Podemos plantear un contraste de hipótesis sobre las varianzas
poblacionales para decidir si se consideran desconocidas pero iguales o desconocidas pero distintas.
𝐻0 : 𝜎𝐶2 = 𝜎𝑃2
𝑆̂𝐶2 121
𝐹= = = 1,49
𝐻1 : 𝜎𝐶2 ≠ 𝜎𝑃2 𝑆̂𝑃2 81
Mirando en la tabla F de Fisher para 60 y 60 g.l. (los más próximos a 59 y 49), comprobamos que el estadístico de
contraste no es significativo para un nivel de confianza del 95% (𝑓0,95;60;50 = 1,534), por lo que suponemos que las
varianzas poblacionales son iguales.
-1-
2. Si desea comprobar que la proporción de madres que manifiestan peor estado de bienestar emocional es mayor en
aquellas con trabajo a tiempo completo que en las que trabajan a tiempo parcial, la hipótesis nula que formularía, es:
A) 𝝅𝑪 ≤ 𝝅𝑷
B) 𝜋𝐶 = 𝜋𝑃
C) 𝜋𝐶 ≥ 𝜋𝑃
𝐻0 : 𝜋𝐶 ≤ 𝜋𝑃
Las hipótesis que se han de plantear son: {
𝐻1 : 𝜋𝐶 > 𝜋𝑃
3. El estadístico de contraste (en valor absoluto) para evaluar la hipótesis de la anterior pregunta vale aproximadamente:
A) 2,37
B) 1,83
C) 3,12
45 + 23 68
𝑃= = = 0,62
110 110
45 23
𝑍= 60 − 50 =
0,75 − 0,46
= 3,12 → 𝑝 = 0,0009
0,0929
√0,62 ∙ 0,38 ( 1 + 1 )
60 50
4. Si para el contraste de su hipótesis hubiese obtenido un estadístico de contraste de 2,82, entonces el nivel crítico 𝑝
valdría:
A) 0,9976
B) 0,0048
C) 0,0024
𝑇𝑎𝑏𝑙𝑎 𝑑𝑒 𝑐𝑢𝑟𝑣𝑎 𝑛𝑜𝑟𝑚𝑎𝑙
𝑍 = 2,82 → 𝑝 = 0,0024
5. La probabilidad de obtener unos resultados como los observados en la muestra o más extremos bajo el supuesto de
una hipótesis nula verdadera recibe el nombre de:
A) Nivel de significación
B) Nivel crítico p
C) Potencia del contraste
6. El estadístico de contraste en valor absoluto para analizar si la media del bienestar emocional de las madres con
jornada a tiempo parcial es significativamente mayor que la media de las que trabajan a jornada completa es,
aproximadamente:
A) 5,66
B) 7,59
C) 4,65
𝑌̅𝑃 − 𝑌̅𝐶 46 − 35 11
𝑇= = = = 5,66
1,942
(𝑛 ̂ 2 (𝑛 ̂2 √49 ∙ 81 + 59 ∙ 121 ( 1 + 1 )
√ 𝑃 − 1)𝑆1 + 𝐶 − 1)𝑆2 ( 1 + 1 ) 108 50 60
𝑛𝑃 + 𝑛𝐶 − 2 𝑛𝑃 𝑛𝐶
-2-
7. Si con los datos de su trabajo obtuviera un estadístico de Cohen que tomase el valor 𝑑 = 0,25, la conclusión global
resultante sería que:
A) La diferencia no es significativa ya que poco más de la mitad de las mujeres con jornada a tiempo completo tienen
valores por debajo de la media de las mujeres a tiempo parcial.
B) Existen diferencias significativas, pero poco importantes, ya que solo el 60% de las mujeres con jornada a tiempo
parcial superan la media del bienestar emocional de las mujeres con jornada completa.
C) Existen diferencias significativas muy importantes que indican que, aproximadamente, el 60% de las mujeres con
jornada a tiempo parcial superan la media del bienestar emocional de las mujeres con jornada completa.
8. Señale cuál de las siguientes es la variable independiente del trabajo de Buehler y O'Brien:
A) La situación laboral.
B) El trabajo y la familia.
C) La salud y los síntomas depresivos.
Situación 2: El director de una escuela de ajedrez está interesado en identificar la mejor estrategia de control de la
atención para entrenar a los alumnos de su centro. Se han estudiado tres estrategias: centrarse en estímulos internos
(condición A), centrarse en estímulos externos (condición B) y hacer una parada de pensamiento (condición C). El control
de la atención se ha operativizado mediante la variación de la conductividad eléctrica de la piel (medida en microSiemens
o 𝜇𝑆). Se seleccionó una muestra aleatoria compuesta por 45 jugadores de ajedrez que se asignaron al azar a cada una de
las tres condiciones experimentales. Se obtuvieron los siguientes resultados descriptivos:
Tras realizar todas las comprobaciones necesarias se concluyó que las observaciones eran independientes, las
distribuciones normales y las varianzas homogéneas.
Se trata de un diseño con un factor con tres grupos equilibrados (𝑎 = 3; 𝑛1 = 𝑛2 = 𝑛3 = 15) con muestras
independientes. Con los datos proporcionados en el enunciado tenemos:
FV SC gl MC F
Inter 2
Intra 42 125,2
Total 6.783,46 44
Fácilmente se completa la tabla de ANOVA, calculando en primer lugar suma de cuadrados de error.
FV SC gl MC F
Inter 2
Intra 𝟒𝟐 ∙ 𝟏𝟐𝟓, 𝟐 = 𝟓. 𝟐𝟓𝟖, 𝟒𝟎 42 125,2
Total 6.783,46 44
-3-
FV SC gl MC F
Inter 𝟔. 𝟕𝟖𝟑, 𝟒𝟔 − 𝟓. 𝟐𝟓𝟖, 𝟒𝟎 = 𝟏. 𝟓𝟐𝟓, 𝟎𝟔 2
Intra 5.258,40 42 125,2
Total 6.783,46 44
FV SC gl MC F
Inter 1.525,06 2 762,53
6,09
Intra 5.258,40 42 125,20
Total 6.783,46 44
11.- Teniendo en cuenta la técnica apropiada para resolver este diseño, ¿cuál sería el valor de los grados de libertad del
denominador del estadístico de contraste?
A) 42
B) 44
C) 28
12.- El tipo de análisis adecuado para probar la hipótesis del investigador es:
A) Anova de un factor con muestras independientes.
B) un Anova de dos factores.
C) un Anova de un factor de medidas repetidas.
El estadístico de contraste vale: 𝐹 = 6,09. Buscamos en la tabla F de Fisher con los grados de libertad más
próximos para alfa = 0,05: 𝐹0,95;2;42 ≈ 𝐹0,95;2;30 = 3,316. Dado que: 6,09 > 3,316 → 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0
-4-
15.- El valor crítico para rechazar H0 con un 𝛼 = 0,01 vale, aproximadamente:
A) 3,1
B) 5,4
C) 2,4
16.- Suponiendo que no se rechazara la H0, ¿entre qué grupos sería conveniente realizar comparaciones?
A) Entre ninguno.
B) Entre los grupos B y C que son los que presentan la máxima diferencia en sus resultados.
C) Entre los Grupos A, B y C.
Situación 3: En un estudio de Kenrick y Keefe (1992) sobre las diferencias de género en las estrategias reproductivas en
humanos, se midió la diferencia de edad existente en 1.511 matrimonios muestreados en la isla de Poro (Filipinas) desde
1913 a 1939 bajo la hipótesis de que los hombres prefieren esposas más jóvenes que ellos y que esta tendencia se
intensifica con la edad del hombre. Para cada edad del hombre se calculó una media de diferencias de edad con la mujer,
haciendo que el número de parejas de datos para realizar la regresión fuese de N = 6. El análisis de regresión realizado
generó los siguientes datos:
Ecuación de regresión:
𝑌’ = −1,523 – 0,280 𝑋
Bondad del ajuste:
𝐹(1, 4) = 11,896, 𝑀𝐶𝑟𝑒𝑠𝑖𝑑𝑢𝑜 = 11,533
Figura 1
17.- La hipótesis nula que se pone a prueba con esta elección de variables será:
A) 𝛽0 = 0
B) 𝜌 = 0
C) 𝜷 ≥ 𝟎
𝐻0 : 𝛽 ≥ 0
Las hipótesis que se han de plantear son: {
𝐻1 : 𝛽 < 0
18.- El número de parejas en este estudio (tamaño muestral para cada valor de Xi):
A) diferirá para cada uno de los seis grupos de edad del hombre por razones biológicas.
B) no parece suficientemente grande para hacer un estudio como este.
C) dependerá del error típico de la distribución muestral del estadístico, el cual está en proporción directa al tamaño de la
muestra.
-5-
19.- El punto de corte con la ordenada en este estudio:
A) Es una diferencia positiva de edades entre el hombre y la mujer.
B) No se puede calcular matemáticamente porque exige que el hombre tenga cero años (recién nacido).
C) No tiene sentido excepto si los indígenas de Poro emparejan a los niños al nacer.
20.- La Figura 1 muestra las medias de las diferencias de edades condicionada a la edad del hombre. Con los datos
proporcionados en la Figura:
A) no podemos saber si los datos son homocedásticos y normales.
B) no podemos saber si los datos están determinados o alienados.
C) podemos tener una idea aproximada del intervalo de confianza de Y para cada valor de Xi.
21.- El valor crítico al 95% de confianza para contrastar si existe relación lineal entre X e Y mediante el Anova vale
aproximadamente:
A) 𝟕, 𝟕𝟎𝟗
B) 11,896
C) −1,96
22.- En la tabla del Anova para contrastar si existe relación lineal entre X e Y, el valor de la MCregresión vale
aproximadamente:
A) 46,133
B) 183,33
C) 137,2
FV SC gl MC F
Regresión 1
11,896
Error 4 11,533
Total 5
FV SC gl MC F
Regresión 1 𝟏𝟏, 𝟓𝟑𝟑 ∙ 𝟏𝟏, 𝟖𝟗𝟔 = 𝟏𝟑𝟕, 𝟏𝟗𝟕
11,896
Error 𝟒 ∙ 𝟏𝟏, 𝟓𝟑𝟑 = 𝟒𝟔, 𝟏𝟑𝟐 4 11,533
Total 5
FV SC gl MC F
Regresión 137,197 1 137,197
11,896
Error 46,132 4 11,533
Total 183,329 5
23.- El análisis indica que el intervalo de confianza al 95% para B0 se encuentra entre -10,311 y 7,245 mientras que para B
se encuentra entre -0,505 y -0,055. Sabiendo esto podemos afirmar que:
A) Ni B0 ni B son significativos.
B) 𝑩𝟎 no es significativo mientras que 𝑩 sí lo es.
C) 𝐵 no es significativo mientras que 𝐵0 sí lo es.
-6-
24.- En esta situación, el coeficiente de correlación de Pearson entre X e Y:
A) será positivo ya que coincide en el signo con B.
B) será negativo.
C) no es adecuado calcularlo porque la Figura 1 muestra que los datos no son lineales.
25.- Si otro investigador re-analiza estos datos modificando el cálculo de la variable dependiente Y para que sea “Edad del
hombre – Edad de la mujer”, entonces:
A) cambiaría el valor de la correlación en valor absoluto entre X e Y.
B) cambiarán los valores de la Tabla del Anova que evalúa si existe relación lineal entre X e Y.
C) habría que modificar la hipótesis alternativa porque ahora la pendiente esperada sería positiva.
-7-
Modelo C. Septiembre de 2017. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto
Situación 1. Aunque la pérdida de la memoria es uno de los aspectos definitorios de la enfermedad de Alzheimer (EA),
algunos estudios sobre las emociones suscitadas por la música en pacientes con Alzheimer han mostrado que estos
pacientes parecen tener preservada la capacidad de reconocer la emoción (felicidad, tranquilidad, tristeza o miedo) que
transmite la música (v.g., Drapeau et al., 2009) y, por lo tanto, parecen tener preservada la memoria musical.
Imagine que usted también defiende teóricamente la idea de que la memoria musical se mantiene incluso en pacientes
con EA pero quiere responder empíricamente a los críticos de la misma que plantean que los estudios originales no
utilizaron ningún grupo de control. Para ello, ha realizado un estudio en el que ha medido el número de aciertos (sobre
100 estímulos) en el reconocimiento de la emoción musical (presentando estímulos de cada tipo de emoción básica) en
un grupo de sujetos con EA (𝑛 = 20; 𝑌̅𝐸𝐴 = 75, 𝑆̂𝐸𝐴 = 15 ) y en un grupo de personas mayores (𝑛 = 25; 𝑌̅𝐷𝐶𝐿 =
80, 𝑆̂𝐷𝐶𝐿 = 5 ) con Deterioro Cognitivo Leve (DCL). Asumimos que las varianzas poblaciones difieren entre EA y DCL, y
adoptamos un 𝛼 = 0.05.
Solución: la variable dependiente es el número de aciertos sobre 100 estímulos. Luego es una variable discreta que
puede adoptar los valores 0, 1, 2, …, 99, 100. Al admitir el valor 0 es una escala de razón.
Solución: Se ha utilizado de dos grupos, enfermos de Alzheimer y mayores con DCL. Luego es un contraste con dos grupos
independientes (o se padece EA o DCL, no ambos). Además, como en el enunciado refieren que interesa contrastar la
media de reconocimiento de la emoción en ambos grupos, no es un contraste de varianzas. Luego es un contrsete de dos
medias independientes.
Solución: La hipótesis nula es la que tiene el signo igual (el grupo de pacientes no afecta a los resultados). En este caso,
que la diferencia de medias en la variable dependiente es 0. Esto significa que el contraste es bilateral.
4.- El valor del estadístico de contraste vale para poner a prueba esta hipótesis vale aproximadamente:
A) −𝟏, 𝟒𝟑
B) −2,53
C) 0,32
Solución: Se trata de un contraste de dos medias independientes asumiendo varianzas poblacionales diferentes. Luego:
5.- El valor crítico, expresado como valor absoluto, vale aproximadamente:
A) 𝟐, 𝟎𝟕𝟒
B) 1,960
C) 1,061
Y ahora podemos buscar en la tabla de la t de Student con 22 grados de libertad y 1-(0.05/2) = 0.975. Las tablas nos
proporcionan el valor de 2.074.
Solución: El nivel crítico es el valor el valor de la probabilidad para nuestro estadístico de contraste (T = -1,428, bilateral).
Si observamos en la tabla de la distribución T de Student en la fila gl = 22, encontramos:
0.90 … 0.95
… … …
Gl = 22 1.321 … 1.717
Luego el valor de p para t = -1.428, se encuentra entre 0.10 y 0.05. Como es un contraste bilateral, multiplicamos ambos
valores por 2, obtenido que el nivel crítico de t = -1.428 se encuentra entre 2*0.10 = 0.20 y 2*0.05 = 0.10. Por lo que la
opción correcta es la C.
Solución: sabemos que el tamaño del efecto no depende del tamaño muestral (es su principal diferencia con respecto a
los estadísticos de contraste) y consiste en una diferencia de medias estandarizada. Luego las opciones B y C son
incorrectas. Por otro lado, Cohen proporcionó una clasificación general de los tamaños del efecto (según la d de Cohen)
en tres categorías, baja, media y alta, con unos puntos de referencia subjetivos. Luego la opción correcta es la A.
Solución: El valor de 1 − 𝛽 es la potencia de un contraste. La potencia es la probabilidad de rechazar una hipótesis nula
cuando es falsa. Luego, la opción correcta es la B.
9.- Una de las posibles razones por las que podría no haberse rechazado H0 es:
A) los DCL y los EA tienen en la población un nivel de memoria musical distinto.
B) el bajo tamaño muestral.
C) que el tamaño del efecto era muy elevado.
Solución: la opción A no hace referencia a los factores que impactan sobre el estadístico de contraste (sea cierta o falsa la
información). Solamente las opciones B y C tienen un papel relevante para el contraste estadístico realmente efectuado.
De estas opciones, la C es incorrecta porque si el tamaño del efecto es muy elevado, con pocos sujetos habría resultado
significativo. La única explicación válida sería que el tamaño muestral utilizado es bajo.
Situación 2. Cawson y cols. (1974) analizaron los niveles de cortisol en sangre en tres grupos de gestantes que nacieron
entre las 38 y las 42 semanas de gestación. El grupo 1 se estudió antes del inicio del parto, el grupo 2 fue estudiado
durante parto inducido y el grupo 3 se compuso de gestantes que nacieron espontáneamente y a los que se les midió el
cortisol después del parto. Los autores deseaban saber si estos datos proporcionaban evidencia que indicara una media
diferente en los niveles de cortisol entre las tres poblaciones representadas. En la Tabla 1 se presentan las puntuaciones
de cortisol en los tres grupos.
Grupo 1 262 307 211 323 454 339 304 154 287 356
Grupo 2 465 501 455 355 468 362
Grupo 3 343 772 207 1.048 838 687
Tabla 1
Solución: la variable que se ha medido antes del parto, durante o después del parto, ha sido la concentración de la
hormona cortisol en sangre.
Solución: Es una variable continua que puede medirse en términos de porcentajes. No es discreta porque entre dos
valores cualesquiera de concentración se pueden medir, teóricamente, valores intermedios. No admite categorías
nominales.
Solución: Tenemos tres grupos (G1, G2 y G3) independientes entre sí y el número de participantes es distinto en cada
grupo. Por lo tanto son tres grupos independientes no equilibrado. No podemos hablar de interacción porque no hay dos
factores.
13.- El tipo de análisis adecuado para probar la hipótesis del investigador es:
A) un Anova de un factor con muestras independientes.
B) un Anova de dos factores con interacción.
C) un Anova de medidas repetidas.
Solución: Al disponer de tres niveles de un factor nominal (Grupo) con una variable dependiente cuantitativa, la técnica
apropiada es un Anova. Solamente tenemos un factor (el Grupo) y las muestras son independientes.
14.- Teniendo en cuenta la técnica apropiada para resolver este diseño, ¿cuál sería el valor de los grados de libertad del
denominador del estadístico de contraste?
A) 19
B) 21
C) 41
Solución: Los grados de libertad de la razón F en un anova de muestras independientes es 𝑁 − 𝑎, siendo 𝑁 el total de
participantes y 𝑎 el número de niveles del factor. Sabemos que 𝑁 = 𝑛𝑎1 + 𝑛𝑎2 + 𝑛𝑎3 = 10 + 6 + 6 = 22 y que 𝑎 = 3.
Luego 𝑁 − 𝑎 = 22 − 3 = 19.
Solución: Tenemos que buscar en la tabla de la F con 𝑎 − 1 y 𝑁 − 𝑎 grados de libertad. Esto es 𝐹(2, 19) = 5.926 en la
tabla para 1 − 0.01 = 0.99.
16.- Sabiendo que la 𝑆𝐶 𝑇𝑜𝑡𝑎𝑙 = 458.032,097 y la 𝑀𝐶𝐸𝑟𝑟𝑜𝑟 = 13.462,225 ¿cuál es el valor más aproximado de la 𝑆𝐶𝐼𝑛𝑡𝑒𝑟 ?
A) 229.016,048
B) 𝟐𝟎𝟐. 𝟐𝟓𝟎, 𝟎𝟎𝟎
C) 1.036.814,364
Solución: Tenemos que completar la tabla del Anova con los datos proporcionados en el enunciado y los ya conocidos
(los grados de libertad). Estos son:
FV SC Gl MC F
Inter a-1 = 2
Intra N-a = 19 13.462,225
Total 458.032,097
Luego:
FV SC Gl MC F
Inter 202.250 a-1 = 2 101.125 7,51176
Intra 255.782 N-a = 19 13.462,225
Total 458.032,097
17.- Con los datos de la pregunta anterior ¿cuál es el valor más aproximado del estadístico de contraste?
A) 𝟕, 𝟓
B) 8,3
C) 0,79
Solución: En la tabla anterior vemos que el valor de la F empírica es 7,51176. Luego el valor más aproximado es 7,5.
Situación 3. Un estudio de Beltrán, Valor y Expósito (2015) de título "El perdón ante transgresiones en las relaciones
interpersonales" analiza, mediante un análisis de regresión, las variables que predicen el perdón en una relación de
pareja, tanto en hombres como en mujeres. Utilizando una muestra de estudiantes de la Universidad de Granada
señalan, entre sus conclusiones, que la baja capacidad imaginativa para ponerse en situaciones ficticias (empatía), en el
caso de los hombres, y la mayor dependencia emocional, en el caso de las mujeres, son las variables que predicen un
menor perdón y mayor motivación de venganza hacia la pareja.
Para el caso de las mujeres, usted desea verificar si estas conclusiones se mantienen también en su localidad. Para ello,
utiliza una muestra de 27 mujeres que habían sufrido algún tipo de transgresión en su relación de pareja y que responden
a dos cuestionarios, uno para medir la gravedad de la transgresión (T) y otro la dependencia emocional (D) obteniendo
los siguientes resultados: 𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 (𝑇, 𝐷) = 25; desviación típica (T): 𝑆𝑇 = 7; desviación típica (D): 𝑆𝐷 = 5; 𝑇̅ =
35; 𝐷̅ = 20.
18.- El porcentaje de varianza explicada en la variable "gravedad de la transgresión" (T) a partir de la dependencia
emocional (D) es aproximadamente:
A) 71,4%
B) 39,98%
C) 51,02%
Solución: el porcentaje de varianza explicada de una variable Y a partir de otra variable X en el análisis de regresión viene
dado por el cuadrado del coeficiente de correlación entre ambas:
2
𝑆𝑋𝑌 2 25 2
𝑟𝑋𝑌 =( ) =( ) = 0.5102
𝑆𝑋 𝑆𝑌 7∙5
luego en términos porcentuales es el 51,02%.
Solución: Nos están preguntando por la significatividad de la correlación entre T y D. La correlación vale 25 / (7 ∙ 5) =
5/7 = 0.71.
Las opciones de respuesta pivotan en relación a si es significativa o no. Para saberlo, debemos calcular el estadístico de
contraste y evaluar si es significativo al 0.01 y al 0.05:
𝑟𝑇𝐷 √𝑁 − 2 0.71√27 − 2
𝑇= = ≈ 5.041
√1 − 𝑟𝑇𝐷2 √1 − 0.712
El valor crítico con 25 grados de libertad vale (según tablas) vale
g.l. … 0.95 0.975
…. … … …
25 … 1.708 2.060
… … … …
Luego una T de 5.041 > 2.060 > 1.708 es altamente significativa (con un nivel crítico inferior a 0.01).
20.- ¿Cuál es, aproximadamente, el valor de la pendiente de la ecuación de regresión para predecir la gravedad de la
transgresión (T) a partir de la dependencia emocional (D)?:
A) 1
B) 0,02
C) 0,5
Solución:
𝑆𝑌 7
𝐵 = 𝑟𝑋𝑌 = 0.71 ≈ 0.994
𝑆𝑋 5
Que, aproximadamente, vale la unidad.
Solución: por definición, el error típico es la desviación típica de los errores de pronóstico. La opción A es incorrecta
porque define el error de pronóstico para un sujeto, mientras que la opción B hace referencia a Sx de la variable
dependiente pronosticada (T’) en este caso.
22.- En el análisis de regresión de la "gravedad de la transgresión" (T) en función de la “dependencia emocional” (D), el
coeficiente de alienación corresponde a:
A) La variabilidad de la trasgresión debida o explicada por la dependencia emocional.
B) La variabilidad de la dependencia emocional asociada a otras variables diferentes a la transgresión.
C) La variabilidad de la transgresión debida a otras variables distintas a la dependencia emocional.
Solución: El coeficiente de alienación, por definición, es el complemento del coeficiente de determinación, es decir
2
1 − 𝑟𝑇𝐷 , luego es la variabilidad de la transgresión (T) debida a otras variables distintas de la dependencia emocional (D),
ya que la variabilidad debida a D ya se ha visto explicada por la ecuación de regresión de T sobre D.
23.- ¿Cuál de las siguientes gráficas representa la condición de homocedasticidad que deben cumplir los datos para
realizar el análisis de regresión lineal?
A) B) C)
Solución: La única gráfica que mantiene la misma variabilidad en todos los valores de la variable predictora X es la C. En la
gráfica A la variabilidad es mayor en valore bajos de X mientras que en la variable B es superior en valores superiores de
X.
24.- Para una mujer que obtiene en el cuestionario de dependencia emocional (D), una puntuación de 4 puntos por
encima de la media, la puntuación pronosticada en "gravedad de la transgresión" (T), es de:
A) 39
B) 19
C) 4
Solución: Calculamos primero el punto de corte con la ordenada:
𝐵0 = 𝑇̅ − 0.994 𝐷
̅ = 35 − 0.994 ∙ 20 = 15.12
Ahora, como conocemos la pendiente, podemos calcular el valor para un sujeto que tenga como valor de D
𝐷𝑠𝑢𝑗𝑒𝑡𝑜 = 𝐷 ̅ + 4 = 24
SITUACIÓN 1.Profesionales de la American Psychological Association, que han estudiado la influencia de los
videojuegos de contenido violento en los jóvenes, señalan la aparición de un mayor número de comportamientos y
actitudes agresivas después de utilizar videojuegos interactivos de contenido violento.
Imagine que quiere corroborar esta afirmación, para lo que diseña una investigación en la que utiliza dos
muestras de niños varones de 7 a 12 años que responden a la Escala de Agresión Física Verbal (AFV) (Caprara y
Pastorelli, 1993). Esta escala proporciona puntuaciones en cuatro dimensiones: agresividad física, verbal, ira y
hostilidad, de forma que a mayor puntuación mayor intensidad en la dimensión evaluada. Un grupo de 41 de estos
jóvenes eran usuarios habituales de videojuegos en red con alto contenido hostil obteniendo, en la dimensión de
agresividad física, una media de 32,6 con una desviación típica insesgada de 7,8. Otro grupo de 61 jóvenes, no
usuarios de videojuegos violentos obtuvieron en la misma escala una media de 29,5 y desviación típica insesgada de
6,3.Con esta información, responda a las siguientes preguntas:
1 –Para el contraste de diferencias de medias en la dimensión de agresividad física entre jóvenes usuarios de
videojuegos con contenido violento respecto a los que no son usuarios de esta modalidad de videojuegos, aplicaría la
prueba:
A) T de diferencias de medias asumiendo varianzas iguales (𝑭𝑭 = 𝟏𝟏, 𝟓𝟓𝟓𝟓; 𝒑𝒑 > 0,05).
B) T de diferencias de medias asumiendo varianzas distintas (𝐹𝐹 = 0,63; 𝑝𝑝 < 0,05).
C) Z de diferencias de medias asumiendo varianzas iguales (𝐹𝐹 = 1,53; 𝑝𝑝 < 0,01).
Para decidir si se suponen varianzas poblacionales iguales o distintas, se plantean las hipótesis:
2 2
𝐻𝐻0 : 𝜎𝜎𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈 = 𝜎𝜎𝑁𝑁𝑁𝑁 𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢
2 2
𝐻𝐻1 : 𝜎𝜎𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈 ≠ 𝜎𝜎𝑁𝑁𝑁𝑁 𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢
El estadístico de contraste es:
𝑆𝑆̂𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈
2
7,82
𝐹𝐹 = = = 1,533
𝑆𝑆̂𝑁𝑁𝑁𝑁
2
𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢 6,32
Dado que: 1,533 < 1,744, se mantiene la hipótesis nula y se consideran varianzas poblacionales desconocidas
pero iguales.
2 –Los límites del intervalo de confianza para la desviación típica poblacional de las puntuaciones en la dimensión de
agresión física de los jóvenes usuarios de videojuegos violentos, valen, aproximadamente (𝑁𝑁𝑁𝑁 = 0,95):
A) 41y99,60
B) 6,04 y 10,84
C) 6,40 y9,98
(𝑛𝑛 − 1)𝑆𝑆𝑛𝑛−12 (𝑛𝑛 − 1)𝑆𝑆𝑛𝑛−12
2
< 𝜎𝜎 <
𝜒𝜒𝑛𝑛2−1;1−𝛼𝛼�2 𝜒𝜒𝑛𝑛2−1;𝛼𝛼�2
1
3–Para contrastar la influencia nociva del contenido de los videojuegos: Violento (V) vs No Violento (NV), sobre la
agresividad física, la hipótesis nula que formularía, es:
A) 𝐻𝐻0 : 𝜇𝜇𝑉𝑉 – 𝜇𝜇𝑁𝑁𝑁𝑁 ≥ 0
B) 𝑯𝑯𝟎𝟎 : 𝝁𝝁𝑽𝑽 – 𝝁𝝁𝑵𝑵𝑵𝑵 ≤ 𝟎𝟎
C) 𝐻𝐻0 : 𝜇𝜇𝑉𝑉 – 𝜇𝜇𝑁𝑁𝑁𝑁 = 0
Contrastar la hipótesis sobre la influencia nociva de los videojuegos de contenidos violentos sobre la
agresividad física, supone que la media en la escala AFV será mayor para los que utilizan videojuegos con
contenido violento respecto a los que contemplan videojuegos no violentos, es decir: 𝜇𝜇𝑉𝑉 > 𝜇𝜇𝑁𝑁𝑁𝑁 ; de otra
forma, que 𝜇𝜇𝑉𝑉 – 𝜇𝜇𝑁𝑁𝑁𝑁 > 0. La hipótesis complementaria a esta, dirá por tanto, que no existe tal influencia
nociva o, en otras palabras, que 𝜇𝜇𝑉𝑉 – 𝜇𝜇𝑁𝑁𝑁𝑁 ≤ 0 que corresponde a la hipótesis nula de esta situación.
4 –El valor del estadístico de contraste para la hipótesis de la pregunta anterior, es, aproximadamente:
A) 1,53
B) 2,21
C) 0,44
Consultando las tablas T de Student para: 𝑛𝑛1 + 𝑛𝑛2 − 2 = 100 𝑔𝑔. 𝑙𝑙., observamos que el estadístico de contraste se
encuentra entre las puntuaciones: 1,984 y 2,364, que dejan por encima unas proporciones respectivamente: 0,025
y 0,01, luego el nivel crítico: 0,01 < 𝑝𝑝 < 0,025.
6 – El tamaño del efecto de jugar a videojuegos violentos en relación a no jugar a los mismos, es aproximadamente
igual a:
A) 1,53
B) 2,21
C) 0,44
|𝑌𝑌�1 − 𝑌𝑌�2 | |32,6 − 29,5|
𝑑𝑑 = = 0,447
(𝑛𝑛 1 −1)𝑆𝑆̂12 +(𝑛𝑛 2 −1)𝑆𝑆̂22 40∙7,82 +60∙6,32
� �
𝑛𝑛 1 +𝑛𝑛 2 −2 41+61−2
Imagine que los 41 jóvenes usuarios de videojuegos con contenidos violentos asisten a un programa deapoyo para
el reconocimiento y control de estas emociones negativas y mejora de la empatía. Al finalizar el programa se observa
que, de los 25 que antes de comenzar las sesiones obtenían puntuaciones por encima de la mediana en la escala AFV,
ahora 15 puntuaban por debajo de la mediana al terminar las sesiones. Y que después de terminar las sesiones, eran
un total de 19 jóvenes los que puntuaban por encima de la mediana. Con estos datos y estableciendo un nivel de
confianza del 95%, responda a las siguientes preguntas:
2
Construimos la tabla de contingencia (en negrita los datos que se obtienen directamente del enunciado).
Después
> 𝑀𝑀𝑀𝑀 < 𝑀𝑀𝑀𝑀
> 𝑀𝑀𝑀𝑀 𝑎𝑎 = 10 𝒃𝒃 = 𝟏𝟏𝟏𝟏 25
Antes
< 𝑀𝑀𝑀𝑀 𝑐𝑐 = 9 𝑑𝑑 = 7 16
19 22 41
7– El valor absoluto del estadístico de contraste (Z) para comprobar si el programa de apoyo ha sido eficaz para
disminuir las manifestaciones de conductas agresivas, vale, aproximadamente:
A) 0,25
B) 1,22
C) 2,11
𝑏𝑏 − 𝑐𝑐 15 − 9
𝑍𝑍 = = = 1,22
√𝑏𝑏 + 𝑐𝑐 √15 + 9
8– El nivel crítico 𝑝𝑝 para tomar una decisión respecto a si el programa de apoyo tiene algún efecto sobre la aparición
de conductas agresivas, vale, aproximadamente:
A) 𝑝𝑝 < 0,05
B) 0,05 < 𝑝𝑝 < 0,01
C) 𝒑𝒑 = 𝟎𝟎, 𝟏𝟏𝟏𝟏
En la tabla de curva normal se calcula la probabilidad de obtener valores superiores a 𝑍𝑍 = 1,22, que es: 𝑝𝑝 = 0,1112.
SITUACIÓN 2: Algunos trabajos que analizan la influencia de los videojuegos y películas sobre el desarrollo de
conductas antisociales y violentas (citados en Tejeiro, Pelegrina del Rio, M y Gómez Vallecillo, 2009) coinciden en
señalar la aparición de un mayor número de comportamientos y actitudes agresivas después de utilizar videojuegos
interactivos de contenido violento. Otros autores coinciden en señalar que el efecto nocivo de estos videojuegos de
contenidos violentos no es superior al que pueden ejercer las películas violentas vistas por TV y que las chicas
muestran más manifestaciones agresivas que los chicos después de haber estado jugando con videojuegos de
contenido violento.
Imagine que usted está interesado en comprobar si la diferencia en conductas agresivas debidas al sexo
(Factor A) es la misma para diferentes grupos de actividades (Factor B), distinguiendo entre: películas de contenido
violento (b1); videojuegos interactivos sin contenido violento(b2) y videojuegos interactivos con contenido violento
(b3). Para cada una de las combinaciones de tratamientos (Grupo de actividad y género), selecciona una muestra de 10
participantes, obteniendo los siguientes datos: 𝑆𝑆𝑆𝑆𝐴𝐴 = 1,07;[𝑌𝑌] = 2704;[𝑇𝑇] = 2509,07; [𝐵𝐵] = 2584,3; [𝐴𝐴𝐴𝐴] =
2590.
Asumiendo que se cumplen los supuestos necesarios y estableciendo un nivel de significación de 0,05 responda a las
preguntas siguientes:
Se trata de un diseño con dos factores: Sexo (a = 2) y Tipo de actividad (b = 3) donde n = 10.
Las sumas de cuadrados son:
𝑆𝑆𝑆𝑆𝐴𝐴 = 1,07
3
La tabla de ANOVA:
Valor crítico
FV SC g.l. MC F (tabla)
A 1,07 1 1,070 0,507 4,001
B 75,23 2 37,615 17,818 3,150
AxB 4,63 2 2,315 1,097
Error 114 54 2,111
Total 194,93 59
FV SC g.l. MC F
A 1,07 1 1,070 0,505
B 75,23 2 37,615 17,756
Error 118,63 56 2,118
Total 194,93 59
13–Con un nivel de confianza de 0,95 el valor crítico más aproximado para tomar una decisión respecto a la hipótesis
de interacción, es:
A) 4,46
B) 3,15
C) 19,49
4
14–A partir de los resultados de su estudio las diferencias observadas para el factor “tipo de actividad”, son:
A) Es necesario realizar comparaciones múltiples.
B) Significativas para 0,01.
C) No significativas.
15–Considerando globalmente los resultados de su estudio, se podría concluir que:
A) Existen diferencias significativas en las conductas agresivas de chicos y chicas generadas por los distintos tipos
de actividad.
B) Existe alguna diferencia significativa en el factor “tipo de actividad” con independencia del sexo.
C) No existen diferencias significativas en las conductas agresivas de chicos y chicas ni entre los distintos tipos de
actividad.
SITUACIÓN 3.La falta de actividad física es un factor clave para explicar la prevalencia actual del sobrepeso y la
obesidad entre jóvenes y adultos. En este contexto, un estudio investigó la relación natural existente entre la actividad
física (AF) medida con un podómetro y el índice de masa corporal (IMC) entre estudiantes de secundaria. La actividad
física se contabilizó mediante el número de pasos por día (expresado en miles) que registró el podómetro para cada
alumno en su actividad cotidiana durante una semana. El IMC se midió en Kg/m2. Se realizó un análisis de regresión
para predecir el IMC a partir del AF en 100 participantes. Los resultados que los autores informaron fueron los
siguientes:
- La recta de regresión por mínimos cuadrados obtenida: 𝐼𝐼𝐼𝐼𝐼𝐼’ = 29,58 – 0,65 × 𝐴𝐴𝐴𝐴.
- El ajuste de la regresión proporcionó los siguientes resultados: 𝐹𝐹(1; 98) = 17,10; 𝑀𝑀𝑀𝑀𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 = 13,36; 𝑝𝑝 < 0,01
con una 𝑅𝑅 = 0,38 y un error típico de la pendiente igual a 0,16.
16– Un participante que no pueda dar ningún paso (v.g., porque esté en silla de ruedas) tendrá un IMC predicho de:
A) 29,58 Kg/m2
B) 0 ya que, efectivamente, no ha dado ningún paso.
C) 30 pasos aproximadamente.
17– Si observamos un valor de IMC de 22,8 Kg/m2 en un AF = 9,5 ¿Cuánto valdrá el residuo?
A) 0 ya que en el ajuste por mínimos cuadrados el sumatorio de los errores es cero.
B) 23,05 Kg/m2
C) -0,605 Kg/m2
El residuo es, en general: 𝑌𝑌 − 𝑌𝑌´. En este caso, para un sujeto con AF =22,8:
18– Dado que el modelo de regresión es significativo a un 𝛼𝛼 = 0,05, podemos afirmar que:
A) La actividad física depende causalmente del IMC con una 𝑝𝑝 < 0,01;
B) La manipulación de la actividad física realizada en el experimento permite predecir el resultado del IMC;
C) La medición de la actividad física, medida mediante el número de pasos, permite predecir el valor del IMC.
19– El estadístico de contraste para poner a prueba la significatividad del coeficiente de correlación entre el AF y el
IMC vale aproximadamente:
A) 4,07
B) 0,38
C) 0,14 que es la proporción de la varianza del IMC explicada por la varianza del AF.
5
20– El intervalo de confianza de la pendiente de la recta de regresión a un 𝛼𝛼 = 0,05 vale aproximadamente:
A) [-0,33; -0,97]
B) [-1,98; 1,98]
C) [-0,33; 0,22]
−0,33
−0,65 ± 1,984 ∙ 0,16 → �
−0,97
21– La Media Cuadrática del Anova que evalúa si existe relación lineal entre AF y IMC vale aproximadamente:
A) 1309,28
B) 228,46
C) 1537,74
Preguntas teóricas
23 – En un contraste de hipótesis sobre dos medias para muestras independientes y con independencia de los
resultados obtenidos, ¿cuál de las siguientes afirmaciones es cierta?:
A) Si utilizásemos muestras más grandes aumentaría el valor del estadístico de contraste y con ello la
probabilidad de rechazar la hipótesis nula, aunque no cambiaría el tamaño del efecto.
B) Si disminuimos el tamaño de la muestra disminuiría el valor del estadístico de contraste y la significación de la
diferencia, además del tamaño del efecto.
C) Aumentando el tamaño de la muestra se consigue un efecto mayor pero no afecta al estadístico de contraste
sobre la significación de las diferencias.
24 – Se denomina parámetro al índice calculado con los datos de la:
A) Muestra.
B) Población.
C) Distribución.
6
Modelo C. ENERO de 2018. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto
SITUACIÓN 1. Ofman, Pereyra-Girardi, Cófreces y Stefani (2014) estudiaron las diferencias de género en el
afrontamiento de la hipertensión arterial. Utilizaron para ello el Cuestionario sobre Modos de Afrontamiento (Ways of
CopingQuestionnaire). En dicho cuestionario, entre otras estrategias de afrontamiento,se mide la resolución
planificada de problemas (RPP), que consiste en desarrollar tácticas para enfrentarse al problema, intentando alterar la
situación desde una planificación analítica. Cuanto más elevadas son las puntuaciones en RPP mayor es el uso de esta
estrategia.Ofman et al. (2014) encontraron diferencias significativas en el uso de RPP en función del género,
puntuando los varones más alto que las mujeres.
Imagine que usted dispone de una muestra de 200 personas con una edad media de 57 años y desviación típica
de 8 años. La mitad de ellos son hombres, para los cuales la puntuación media en RPP es de 3,4 con una
cuasidesviación típica de 0,8. El grupo de mujeres presenta la misma variabilidad que los varones y una puntuación
media de 3,2. (𝛼𝛼 = 0,05).
1 – El intervalo de confianza para la media aritmética de la edad poblacional en la muestra total, se encuentra,
aproximadamente entre los valores:
A) 55,89 y 58,11
B) 55 y 60.
C) 54,81 y59,22
Solución:
Disponemos los datos proporcionados para facilitarnos la resolución del problema:
8 58,11
57 ± 1,96 ∙ → 57 ± 1,11 → �
√200 − 1 55,89
2 – Al contrastar si las varianzas poblacionales entre hombres y mujeres son iguales para la variable RPP, se obtienen
un estadístico de contraste y un nivel crítico, aproximadamente:
-1-
Solución:
Como nos han indicado que las cuasidesviaciones típicas son idénticas entre ambas muestras (hombres y mujeres),
el estadístico F sería igual a la unidad.
𝑆𝑆̂12 0,82
𝐹𝐹 = = =1
𝑆𝑆̂22 0,82
Para determinar qué nivel crítico es apropiado, debemos considerar que los grados de libertad son 99 y 99 (aunque
tendremos que aproximar a los g.l. más aproximados, en este caso, 120). Luego consultando en las tablas de la F
para diversos valores de P encontramos:
Observamos que una F = 1,265 deja por encima de sí una p = 0,10, luego una F = 1, al ser inferior a 1,265 deja por
encima de sí un valor superior a 0,10. Como en el caso del contraste de varianzas debemos utilizar un contraste
bilateral tenemos que multiplicarlo por 2 (0,10 x 2 = 0,20). La única opción correcta es, entonces, la B.
Solución:
tal y como se indica directamente en el enunciado y el resultado inferencial del estadístico F obtenido en la pregunta
anterior, la opción correcta es la B. La opción C es irrelevante ya que se refiere al tipo de distribución de la variable
RPP.
4 – Para contrastar si los resultados de su muestra replican los resultados de Ofman et al. (2014), la hipótesis nula que
se debe plantear es:
A) 𝐻𝐻0 : 𝜇𝜇𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 = 𝜇𝜇𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀
B) 𝐻𝐻0 : 𝜇𝜇𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 ≥ 𝜇𝜇𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀
C) 𝑯𝑯𝟎𝟎 : 𝝁𝝁𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯 ≤ 𝝁𝝁𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴
Solución:
Ofman et al. (2014) encontraron que los varones puntuaban más alto que las mujeres (𝜇𝜇𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 > 𝜇𝜇𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 ). Como
nuestro objetivo es replicar este resultado de Ofman, la hipótesis que tenemos que poner a prueba sin favorecer la
hipótesis en la que creemos (que los resultados que vamos a obtener en nuestra muestra van a replicar los obtenidos
por Ofman, esta es nuestra hipótesis) es aquella que plantea su complementaria: que la media de RPP en varones será
inferior o igual al de las mujeres.
-2-
Solución:
aplicamos un contraste de medias para grupos independientes asumiendo varianzas iguales y desconocidas:
6 – El nivel crítico asociado al estadístico de contraste de la pregunta anterior, se encuentra entre los valores:
A) 𝟎𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎 < 𝑝𝑝 < 0,05
B) 0,10 < 𝑝𝑝 < 0,15
C) 0,05 < 𝑝𝑝 < 0,10
Solución:
Acudimos a la tabla de curva normal dado que contamos con más de 100 g.l., donde observamos que para una z =
1,77, la p correspondiente es𝑝𝑝 = 1 − 0,9616 = 0,0384que es un valor que se encuentra entre 0,05 y 0,025.
Solución: debido a que hemos rechazado la hipótesis de que la media en hombres sea superior a la de las mujeres,
nuestros resultados van en la línea de Ofman et al. 82014) y calculando el tamaño del efecto se muestra que es
pequeño en la clasificación de Cohen.
La respuesta correcta es A. Los resultados replican los obtenidos por Ofman et al. (2014) el tamaño del efecto es
pequeño.
Solución:
Uno de los criterios para aplicar los tests paramétricos es que la VD sea cuantitativa. En el caso de la VI no hay nada
específico para la distinción entre paramétrico y no paramétrico. La opción correcta es la B.
SITUACIÓN 2. Un profesor está interesado en comparar la eficacia de tres métodos de enseñanza (M1, M2 y M3) sobre
el aprendizaje académico. Como sospecha que el Cociente Intelectual (CI) también afecta a este aprendizaje, también
manipula a los participantes en función del CI (Alto y Bajo). Dispone de una muestra de 9 sujetos con un CI “Alto” y 9
sujetos con CI “Bajo”. Para cada grupo de CI, asigna, aleatoriamente, a 3 sujetos a cada uno de los métodos de
enseñanza. Sabiendo que:[𝑌𝑌] = 811;[𝐴𝐴𝐴𝐴] = 801 y conociendo los valores de la matriz AB:
-3-
M1 M2 M3
Alto 15 24 30 69
Bajo 6 15 21 42
21 39 51 111
Solución:
La muestra está formada por 18 sujetos, 9 con CI alto y otros 9 con CI bajo. Cada uno de estos 9 sujetos se reparten
entre los tres métodos de enseñanza, con lo que n= 3. Por tanto, el diseño es de dos factores con muestras
independientes: Método de enseñanza (𝑎𝑎 = 3) y CI (𝑏𝑏 = 2), y cada una de las condiciones experimentales con 𝑛𝑛 = 3.
692 + 422
[𝐵𝐵] = = 725 𝑆𝑆𝑆𝑆𝐵𝐵 = [𝐵𝐵] − [𝑇𝑇] = 725 − 684,5 = 40,5
3∙3
[𝐴𝐴𝐴𝐴] = 801 𝑆𝑆𝑆𝑆𝐴𝐴𝐴𝐴 = [𝐴𝐴𝐴𝐴] − [𝐵𝐵] − [𝐴𝐴] + [𝑇𝑇] = 801 − 760,5 − 725 + 684,5 = 0
1112
[𝑇𝑇] = = 684,5 𝑆𝑆𝑆𝑆𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 = [𝑌𝑌] − [𝑇𝑇] = 811 − 684,5 = 126,50
18
A continuación, se construye la tabla de ANOVA con esta información, lo cual nos permitirá contestar casi
directamente las cuestiones posteriores.
FV SC g.l. MC F p F tabla
A 76,00 2 38,00 45,600 0,0000 3,885
B 40,50 1 40,50 48,600 0,0000 4,747
A×B 0,00 2 0,00 0,000 1,0000 3,885
Intra 10,00 12 0,83
Total 126,50 17 7,44
Dos factores: los tres métodos de enseñanza y el CI de dos niveles, alto y bajo.
-4-
11 – El estadístico de contraste para el factor “CI”, vale:
A) 48,60
B) 40,50
C) 4,747
Solución: para resolver esta cuestión hemos de ver en las tablas de 0,95, el valor correspondiente de F para 2 y 12
grados de libertad. Este valor resulta valer 3,885.
15 – Lo más apropiado en este caso, teniendo en cuenta el resultado obtenido para la interacción, es buscar en las
tablas el valor crítico para el factor “Método de enseñanza” con los siguientes grados de libertad:
A) 2 y 12
B) 2 y 14
C) 1 y 12
Solución: como la interacción no ha resultado significativa, lo que haremos será incluir la interacción en el término de
error, incrementando de esta forma los grados de libertad del término “intra” en 2 unidades. Lo cual hace que los
niveles de libertad sean 2 y 14.
Matriz de correlaciones
X1 X2 Y Varianzas
X1 - 0,658 0,361 X1 2,917
X2 - 0,028 X2 1,930
Y - Y 3,090
Solución: En esta situación no disponemos de los datos directos, pero sí disponemos de los valores de correlación y
desviaciones típicas. Por consiguiente, calculamos la pendiente mediante:
𝑆𝑆𝑦𝑦 √3,090
𝐵𝐵 = 𝑟𝑟𝑥𝑥𝑥𝑥 = 0,361 ∙ = 0,37
𝑆𝑆𝑥𝑥 √2,917
Solución:
18 – El nivel crítico asociado al estadístico de contraste de la pregunta anterior se encuentra, aproximadamente, entre
los valores:
A) 𝟎𝟎, 𝟏𝟏𝟏𝟏 < 𝑝𝑝 < 0,20
B) 0,20 < 𝑝𝑝 < 0,30
C) 0,05 < 𝑝𝑝 < 0,10
Solución:
Buscamos en las tablas de la T con 18-2 = 16 grados de libertad. Encontramos que el valor T = 1,55 se encuentra entre
los valores 1,337 y 1,746, los cuales dejan por encima de sí 1-0,900 y 1-0,95 respectivamente (es decir, 0,10 y 0,05).
Como el contraste de la correlación debe considerarse bilateral, estos valores debemos multiplicarlos por dos. Esto nos
deja que la p de T = 1,5 se encuentra entre 0,20 y 0,10.
Solución: al 0,05 el valor de % = 1,55 no resulta significativo. Por consiguiente, tampoco lo es para 0,01.
20 –La proporción de varianza del rendimiento en Diseños de Investigación explicada por el rendimiento en
Introducción al Análisis de Datos y la participación en los foros conjuntamente, vale, aproximadamente:
A) 0,13
B) 0,21
C) 0,46
Solución: Nos están preguntando por el coeficiente de determinación múltiple de X1 y X2 para predecir Y.
Aplicamos la fórmula:
2 2
2
𝑟𝑟𝑦𝑦1 + 𝑟𝑟𝑦𝑦2 − 2𝑟𝑟𝑦𝑦1 𝑟𝑟𝑦𝑦2 𝑟𝑟12 0,3612 + 0,0282 − 2 ∙ 0,361 ∙ 0,028 ∙ 0,658
𝑅𝑅𝑦𝑦.12 = = = 0,208
1 − 𝑟𝑟212 1 − 0,6582
-6-
21 – El coeficiente de correlación entre las variables X2 e Y eliminando de ambas el influjo de X1 vale,
aproximadamente:
A) 0,028
B) - 0,30
C) 0,30
Solución: Nos están preguntando por el coeficiente de correlación parcial (eliminamos el influjo de X1 tanto de X2
como de Y, luego es parcial):
𝑟𝑟𝑦𝑦2 − 𝑟𝑟𝑦𝑦1 𝑟𝑟12 0,028 − 0,361 ∙ 0,658
𝑝𝑝𝑝𝑝2 = = = −0,30
��1 2
− 𝑟𝑟𝑦𝑦1 2)
�(1 − 𝑟𝑟12 �(1 − 0,3612 )(1 − 0,6582 )
Preguntas teóricas
Solución:
La varianza muestral no es un estadístico insesgado de la varianza poblacional mientras que la media aritmética y la
proporción sí lo son.
24 – Cuando al realizar un ANOVA un investigador no está interesado en comprobar las diferencias entre todas las
medias y sabe de antemano que comparaciones le interesan, se denomina a las comparaciones múltiples que ha de
realizar:
A) “a priori”.
B) “a posteriori”.
C) “post hoc”.
Solución: las comparaciones a posteriori se utilizan cuando el investigador no establece a priori las comparaciones a
realizar y solo lo hace después de ejecutado el experimento. Por el contrario, cuando sí conoce estos contrastes antes
de realizar el estudio, se denominan “a priori”.
-7-
Solución: el supuesto de homocedasticidad hace referencia a la igualdad de varianzas en las distribuciones de los
errores condicionadas a cada valor de X (no a la normalidad ni a la independencia entre valores de Y).
-8-
Modelo A. Septiembre de 2018. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se
pueda introducir texto.
SITUACIÓN 1.Un estudio reciente de Vizoso, Vegay Fernández (2018) analiza las actitudes negativas
hacia las personas con sobrepeso y su relación con otras variables como el género, el nivel de
estudios y la edad encontrando que en una muestra de estudiantes con edades comprendidas
entre 12 y 24 años, las estudiantes presentaban menor antipatía hacia la obesidad, pero más miedo
a engordar que los estudiantes y que los estudiantes de mayor edad y mayor nivel educativo
mostraron una actitud menos negativa hacia la obesidad que ellas.
Imagine que está usted interesado en continuar con el estudio de la tolerancia hacia la obesidad
utilizando una muestra de 300 personas de la población general de entre 20 y 65 años de edad que
responden al cuestionario de Antifat Attitudes Scale, adaptado al español por Magallares y Morales
(2014). Los ítems del cuestionario proporcionan puntuaciones en tres dimensiones: Antipatía hacia
las personas obesas (A), Miedo a la gordura (M) y Voluntad para controlar el peso (V). En la escala A
se obtienen los siguientes valores para las medias y desviaciones típicas de los hombres y mujeres,
así como el tamaño de la muestra (n) de hombres y mujeres.
Hombres Mujeres
Media 2,1 1,8
Cuasi-desviación típica 0,85 0,87
n 180 120
2- La distribución muestral del estadístico para contrastar si las varianzas poblacionales de las
puntuaciones en la escala A de hombres y mujeres son iguales se distribuye según la:
A) Normal;
B) T de Student con (180+120-2) grados de libertad;
C) F de Snedecor.
El contraste de hipótesis sobre igualdad de varianzas poblacionales en los diseños de dos muestras
independientes, se realiza con el estadístico F que tiene una distribución F (Tema 3, epígrafe 3.5,
pág 108).
3- Con un nivel de confianza del 95%, el intervalo de confianza de la media poblacional de los
hombres en la escala de “Antipatía hacia las personas obesas” es, aproximadamente:
A) 1,97 y 2,224;
B) 1,93 y 2,27;
C) 2,01 y 2,18.
𝑆𝑛−1 0,85
𝐼𝐶 = 𝑌̅ ± 𝑍1−𝛼⁄ = 2,1 ± 1,96 = 2,1 ± 0,124 → (1,97; 2,224)
2 √𝑛 √180
𝑆𝑛−1 0,87
𝐸𝑚𝑎𝑥 = 𝑍1−𝛼⁄ → 0,206 = 𝑍1−𝛼⁄ = 𝑍1−𝛼⁄ 0,0797 →
2 √𝑛 2 √120 2
0,206
𝑍1−𝛼⁄ = = 2,58
2 0,0797
5- Si, como concluye el estudio original de Vizoso y cols. (2018), quiere comprobar que las
estudiantes (simbolizadas como M), presentaban menor antipatía hacia la obesidad que los
estudiantes (simbolizados como H), ¿cuál de las siguientes hipótesis estaría correctamente
formulada?
A) 𝐻1 : 𝜇𝑀 > 𝜇𝐻 ;
B) 𝐻0 : 𝜇𝑀 ≤ 𝜇𝐻 ;
C) 𝑯𝟏 : 𝝁𝑴 < 𝝁𝑯
En este caso, la hipótesis nula (de no diferencia o diferencia nula) diría que "las estudiantes
(simbolizadas como M), presentaban igual antipatía o mayor hacia la obesidad que los estudiantes (H)" por
lo que su hipótesis alternativa es la que corresponde a la opción C).
6- El estadístico de contraste para comprobar la hipótesis de que las estudiantes presentan menor
Antipatía (A) hacia la obesidad que los estudiantes es, en valor absoluto:
A) 2,75;
B) 2,96;
C) 0,32.
El estadístico de contraste, es:
8- A partir de la interpretación del estadístico d del tamaño del efecto, ¿cuál de las siguientes
afirmaciones es la CORRECTA?:
A) Casi el 64% de las mujeres obtienen puntuaciones por encima de la media de los hombres en la
escala A de antipatía hacia la obesidad;
B) El 36,32% de los hombres obtienen puntuaciones en la escala A de antipatía hacia la obesidad
que no alcanza la media de las mujeres;
C) El 34,96% de las mujeres obtienen puntuaciones que superan la media de los hombres en la
escala A de antipatía hacia la obesidad.
|𝑌̅𝑀 − 𝑌̅𝐻 |
𝐷= =
(𝑛1 −1)𝑆̂12 +(𝑛2 −1)𝑆̂22
√
𝑛1 +𝑛2 −2
1,8 − 2,1
= 0,3496
119×0,872 +179×0,852
√
120+180−2
9- Cuando la hipótesis alternativa marca el sentido de una diferencia, nos encontramos ante:
A) un contraste unilateral;
B) un contraste bilateral;
C) situaciones que requieren necesariamente utilizar dos o más muestras.
𝑇2 1812
[𝑇] = = = 1724,26
𝑁 6+8+5
FV SC GL MC F
Inter 0,04 3-1 = 2 0,02 0,0367
Intra 8,7 19-3 = 16 0,544
Total 8,74 19-1 = 18
14- Para un nivel de confianza del 99%, el valor crítico vale, aproximadamente:
A) 0,034
B) 3,4
C) 6,23
El valor de la distribución F con 2 y 16 grados de libertado, y con una probabilidad de 0,99, es 6,23.
15- Los resultados obtenidos:
A) Son significativos para un nivel de confianza del 99%.
B) Son significativos para NC = 95% pero no para NC = 99%
C) No son significativos.
17- Si quisiéramos comparar la media del examen presencial con la combinación de las medias de
las dos PECS, los coeficientes del contraste serían:
A) 2; -1; -1
B) 1; -1; 2
C) 2;1; 1
La hipótesis nula es:
𝝁𝒑𝟏 + 𝝁𝒑𝟐
𝑯𝟎 : 𝝁𝒆𝒙 = → 𝟐 𝝁𝒆𝒙 = 𝝁𝒑𝟏 + 𝝁𝒑𝟐𝟑 → 𝟐 𝝁𝒆𝒙 − (𝟏)𝝁𝒑𝟏 − (𝟏)𝝁𝒑𝟐𝟑 = 𝟎
𝟐
SITUACIÓN 3:Las costumbres y modas de la sociedad actual, divulgados también por los medios de
comunicación, promueven el rechazo ante algunas características físicas como la obesidad que, a su
vez, constituye uno de los principales motivos de acoso escolar (bullying) entre los jóvenes. En un
reciente estudio realizado en la Universidad de León por Vizoso, Vega y Fernández (2018), se aplicó
el cuestionario de Antifat Attitudes Scale, adaptada al español por Magallares y Morales (2014), a
una muestra de estudiantes con edades comprendidas entre los 12 y los 24 años, de los que 180
eran chicos y 129 chicas. Este cuestionario proporciona puntuaciones en tres subescalas: Antipatía
hacia las personas obesas (A), Miedo a la Gordura (M) y Voluntad para controlar el peso (V) que,
junto con la edad (E) obtuvieron los coeficientes de correlación que se muestran en la siguiente
tabla, junto con las desviaciones típicas:
A M V E
A 0,26 0,38 -0,21
M O,16 -0,05
V 0,20
Desv. típica 0,9 1,68 1,34 2,6
18. El estadístico de contraste para analizar la significación de la correlación entre la edad (E), y la
voluntad para controlar el peso (V), es en valor absoluto aproximadamente:
A) 2,72;
B) 3,58;
C) 2,3.
19. El porcentaje de la variabilidad explicado por las puntuaciones en la escala de Antipatía (A)
hacia las personas obesas a partir de la edad (E), es:
A) del 21%;
B) del 4,41%;
C) No se puede determinar por tratarse de una correlación negativa.
2
𝑟𝐴𝐸 = −0,21 → 𝑟𝐴𝐸 = −0,212 = 0,0441 → 4,41%
20. La correlación entre el miedo a la gordura (M) y la voluntad para controlar el peso (V):
A) es tan pequeña que no puede ser significativa;
B) es significativa con un 𝛼 = 0.05 pero no con un 𝛼 = 0.01;
C) es significativa con 𝜶 = 𝟎. 𝟎𝟏.
24. La correlación entre la Antipatía ante la obesidad (A) y la Voluntad para controlar el peso (V)
eliminando de esta última la influencia de la edad (E), vale aproximadamente:
A) 0,34;
B) -0,29;
C) 0,43.
SITUACIÓN 1: Santiago, Lupiáñez, Pérez y Funes (2007) diseñaron un experimento para analizar si el tiempo se
organiza sobre la dimensión espacial izquierda-derecha. Para ello, presentaron verbos en la pantalla del ordenador a
los participantes, quienes debían juzgar rápidamente si estaban en pasado o en futuro. Un grupo de participantes
(Grupo A) debían responder “pasado” apretando la tecla de la izquierda y “futuro” apretando la tecla de la derecha y
el otro (Grupo B) se les asignaba las teclas de respuesta a la inversa: “pasado” con la tecla derecha y “futuro” con la
tecla izquierda.
Imagine que en este trabajo participaron 100 personas que fueron distribuidos al azar y a partes iguales entre las dos
condiciones experimentales, obteniendo que la media y desviación típica del tiempo de reacción (TR) de los sujetos
del grupo A fueron 250 mseg y 30 mseg y en el grupo B de 262 mseg y 35 mseg, respectivamente. Con esta
información responda a las siguientes preguntas:
2.- Considerando exclusivamente a los participantes del grupo A, el intervalo de confianza del tiempo medio de
reacción, con un nivel de confianza de 0,95, es aproximadamente:
A) [228,77; 271,23]
B) [252,05; 268,70]
C) [241,39; 258,61]
𝑆𝑛 30
𝑡𝑛−1;1−𝛼⁄2 = 𝑡49;0,975 ≈ 𝑡50;0,975 = 2,009 𝜎𝑌̅ = = = 4,286
√𝑛 − 1 √50 − 1
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 𝜎𝑌̅ = 2,009 ∙ 4,286 = 8,611 𝐼𝐶 = 𝑌̅ ± 𝐸𝑚𝑎𝑥 → 250 ± 8,611 → [241,39; 258,61]
3.- Si el objetivo del trabajo es medir los TR para comprobar que la percepción del tiempo se organiza sobre la
dimensión espacial izquierda-derecha, ¿cuál de las siguientes formulaciones de la hipótesis alternativa H1 refleja
mejor este objetivo?:
A) 𝜇𝐺𝑟𝑢𝑝𝑜 𝐴 − 𝜇𝐺𝑟𝑢𝑝𝑜 𝐵 ≠ 0
B) 𝝁𝑮𝒓𝒖𝒑𝒐 𝑨 < 𝝁𝑮𝒓𝒖𝒑𝒐 𝑩
C) 𝜇𝐺𝑟𝑢𝑝𝑜 𝐵 < 𝜇𝐺𝑟𝑢𝑝𝑜 𝐴
4.- El estadístico de contraste de la hipótesis de igualdad de varianzas en los TR de los dos grupos de participantes y
su nivel crítico aproximadamente valen:
A) 𝑭 = 𝟏, 𝟑𝟔; 𝒑 > 𝟎, 𝟎𝟓
B) 𝐹 = 1,36; 𝑝 < 0,05
C) 𝐹 = 0,73; 𝑝 < 0,05
302 ∙ 50 352 ∙ 50
𝑆̂12 = = 918,367 𝑆̂22 = = 1250
49 49
Acudiendo a la tabla F de Fisher con 50 y 60 grados de libertad (los más próximos a 49 y 49), observamos que la
puntuación 1,413 deja por encima de sí una proporción igual a 0,10, Dado que el estadístico de contraste
(𝐹 = 1,36) es menor que dicha puntuación, el nivel crítico es superior a 0,10 (𝑝 > 0,10), por lo que no es
significativo.
5.- Considerando la situación 1, la distribución muestral del estadístico de contraste que debe aplicar para contrastar
si el tiempo medio se organiza sobre la dimensión espacial izquierda-derecha, es:
A) F de Fisher.
B) T de Student.
C) Chi-cuadrado asumiendo varianzas iguales.
6.- El estadístico para el contraste de la hipótesis de que el tiempo medio se organiza sobre la dimensión espacial
izquierda-derecha, vale aproximadamente:
A) -1,82
B) 2,13
C) 1,09
Acudiendo a la tabla T de Student para 100 grados de libertad (los más próximos a 98), observamos que la
puntuación 1,82 se encuentra comprendida entre 1,66 y 1,984, que dejan por encima de si, respetivamente, las
probabilidades: 0,05 y 0,025, luego la respuesta correcta es C.
8.- Siendo la 𝐻0 falsa, la probabilidad de no tener evidencias suficientes para rechazarla corresponde al:
A) Error tipo I con una probabilidad “alfa”.
B) Error tipo II con una probabilidad “beta”.
C) nivel de significación p.
9.- Si el estadístico d de Cohen hubiera sido 𝑑 = 0,55 ¿Cuál de las siguientes afirmaciones es VERDADERA?
A) El 70,88% de participantes del grupo B reaccionan con más rapidez que los del grupo A.
B) El 55% de participantes del grupo B tienen un TR más rápido que los del grupo A
C) El 70,88% de participantes del grupo B tienen un TR más lento que los del grupo A.
Acudiendo a la tabla de curva normal, para 𝑍 = 0,55, obtenemos una probabilidad igual a 0,7088 y las siguientes
posibles interpretaciones:
El 70,88% de participantes del grupo A tienen un TR más rápido que los del grupo B.
El 29,12% de participantes del grupo A tienen un TR más lento que los del grupo B.
Y sus complementarias
El 70,88% de participantes del grupo B tienen un TR más lento que los del grupo A.
El 29,12% de participantes del grupo B tienen un TR mas rápido que los del grupo B.
SITUACIÓN 2: La tabla 2 muestra datos hipotéticos sobre la evaluación subjetiva del grado de efectividad de tres
métodos para tratar las migrañas, siendo el primero un grupo placebo. La eficacia de cada método ha sido evaluada
por una muestra diferente de individuos que padecían jaqueca (a mayor valor, mayor efectividad subjetiva del
método). En el apartado de resultados, el experimentador ha proporcionado la siguiente tabla:
FV SC gl MC F
Inter 8,729
Intra 20 2,129
Total
También sabemos que: 𝑛1 = 10; 𝑛2 = 8; 𝑛3 = 5 → 𝑁 = 23, por lo que podemos calcular los grados de libertad
para la media cuadrática intergrupo y total y completar fácilmente los datos que nos faltan de la tabla de ANOVA:
FV SC gl MC F
Inter 37,168 2 18,584 8,729
Intra 42,580 20 2,129
Total 79,748 22
13.- Sabiendo que las barras verticales son los intervalos de confianza, la gráfica que representa apropiadamente
estos datos es:
A) B) C)
Acudiendo a la tabla F de Fisher comprobamos que el nivel crítico es menor que 0,01.
17.- Si queremos realizar la comparación múltiple a posteriori entre el grupo de control y los métodos 2 y 3
considerados como un único grupo, los coeficientes a utilizar para realizar este contraste serán:
A) 𝑐1 = 2, 𝑐2 = −2, 𝑐3 = −2
B) 𝑐1 = −, 𝑐2 = 2, 𝑐3 = 2
C) 𝒄𝟏 = 𝟐, 𝒄𝟐 = −𝟏, 𝒄𝟑 = −𝟏
𝜇2 +𝜇3
La hipótesis sería: 𝜇1 = 2
Y de aquí, la siguiente expresión:
𝑐2 22 −12 −12
∑ ( 𝑖 ⁄𝑛𝑖 ) = + + = 0,725
10 8 5
𝑐2
𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 = √(𝑎 − 1) ∙ 𝐹(1−𝛼),(𝑎−1),(𝑁−𝑎) √𝑀𝐶𝐼𝑛𝑡𝑟𝑎 [∑ ( 𝑖 ⁄𝑛𝑖 )] = √2 ∙ 5,849 ∙ 2,129 ∙ 0,725 = 4,249
19.- En un diseño 2x2, ¿cuál de las siguientes gráficas no muestra una interacción?
A) B) C)
SITUACION 3: Un estudio de Beltrán, Valor y Expósito (2015) sobre "El perdón ante transgresiones en las relaciones
interpersonales" analiza, mediante un análisis de regresión, las variables que predicen el perdón tanto en hombres
como en mujeres. En el caso de las mujeres encuentran que el coeficiente de la pendiente de regresión entre la
dependencia emocional, como variable predictora, X1, sobre el sentimiento de venganza, Y, es de 0,245 (t = 2,42; p =
0,017).
Imagine que realiza un estudio similar con una muestra de 52 varones que contemplan un cortometraje de un
escenario de infidelidad protagonizado por una mujer. Posteriormente, responden a un cuestionario que
proporciona puntuaciones sobre tres escalas, en las que la dependencia, (D) y el malestar personal, (M), actúan
como variables predictoras del sentimiento de venganza, (V). En la siguiente tabla se muestran correlaciones y
desviaciones típicas de las tres variables:
20.- ¿Qué porcentaje de la variabilidad del sentimiento de venganza, V, se debe o puede explicarse por el malestar
personal, M?
A) 11,56%
B) 7,84%
C) 34%
2
𝑟𝑉𝑀 = 0,342 = 0,1156 → 11,56%
21.- El estadístico de contraste para poner a prueba la hipótesis de que la correlación entre el sentimiento de
venganza, V, y la dependencia, D, es significativamente distinta de cero, vale:
A) 2,06.
B) 2,55.
C) 0,78.
𝑟𝑥𝑦 √𝑛 − 2 0,28√50
𝑇= = = 2,06
√1 − 2
𝑟𝑥𝑦 √1 − 0,282
22.- La pendiente de la ecuación de regresión en puntuaciones directas para estimar el sentimiento de venganza, Y, a
partir del malestar personal, X2, es:
A) 0,2428.
B) 0,2167.
C) 0,2939.
𝑆𝑦 1,5
𝐵 = 𝑟𝑥𝑦 = 0,34 = 0,2428
𝑆𝑥 2,1
2
𝑆𝑦 1 − 𝑟𝑥𝑦 1,5 1 − 0,342
𝐸𝑚𝑎𝑥 = 𝑡𝑛−2;1−𝛼⁄2 𝜎𝐵 = 𝑡𝑛−2;1−𝛼⁄2 √ = 2,009 ∙ √ = 0,19085
𝑆𝑥 𝑛 − 2 2,1 50
25.- A partir de los resultados obtenidos por Beltrán et al. (2015) con la muestra de mujeres, y estableciendo un nivel
de confianza del 95%, podemos concluir que:
A) Cuanto mayor es la dependencia emocional menor es el sentimiento de venganza.
B) Cuanto menor es la dependencia emocional menor es el sentimiento de venganza.
C) La dependencia emocional no es un predictor del sentimiento de venganza.
Modelo C. ENERO de 2019. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto
SITUACIÓN 1. Ortega, Ramírez y Chamorro (2015) aplican un programa basado en la Psicología Positiva para
aumentar el bienestar de personas mayores, concluyendo que dicho programa permite mejorar la calidad de vida en
los ancianos. Imagine que usted dispone de una muestra de 30 personas institucionalizadas con una edad media de
85 años y una cuasidesviación típica de 5 años a las que aplica el programa propuesto por Ortega et al. (2015),
midiendo la felicidad subjetiva antes y después del tratamiento mediante la Escala de Felicidad Subjetiva (EFS) de
Lyubomisky y Lepper (1999). El objetivo del tratamiento consiste en incrementar la felicidad subjetiva. La media en la
variable dependiente (felicidad subjetiva) antes del tratamiento fue igual a 4 y después del tratamiento igual a 5,
siendo la cuasivarianza de las diferencias igual a 2.
1- Tomando 𝛼 = 0,05, los límites del intervalo de confianza para la media poblacional de la edad valen,
aproximadamente:
A) 81,8 y 88,2
B) 83,13 y 86,87
C) 79,64 y 90,36
𝑆𝑛−1 5
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 𝜎𝑌̅ = 𝑡𝑛−1;1−𝛼⁄2 = 2,045 ∙ = 1,867
√𝑛 √30
2- Tomando 𝛼 = 0,05, los límites del intervalo de confianza para la varianza poblacional de la edad valen,
aproximadamente:
A) 15,857 y 45,180
B) 3,98 y 6,72
C) 20,21 y 30,42
2
(𝑛 − 1)𝑆𝑛−1 29 ∙ 25
𝑙𝑖 = 2 = = 15,857
𝜒𝑛−1;1−𝛼⁄2 45,7223
2
(𝑛 − 1)𝑆𝑛−1 29 ∙ 25
𝑙𝑠 = 2 = = 45,180
𝜒𝑛−1;𝛼⁄2 16,0471
3- Para comprobar si el tratamiento ha sido eficaz, la hipótesis alternativa que se ha de plantear es:
A) 𝐻1 : 𝜇𝐴𝑛𝑡𝑒𝑠 − 𝜇𝐷𝑒𝑠𝑝𝑢é𝑠 > 0
B) 𝐻1 : 𝜇𝐴𝑛𝑡𝑒𝑠 − 𝜇𝐷𝑒𝑠𝑝𝑢é𝑠 ≠ 0
C) 𝑯𝟏 : 𝝁𝑨𝒏𝒕𝒆𝒔 − 𝝁𝑫𝒆𝒔𝒑𝒖é𝒔 < 𝟎
-1-
5- El nivel crítico asociado al estadístico de contraste de la pregunta anterior vale, aproximadamente:
A) 𝒑 < 𝟎, 𝟎𝟎𝟓
B) 𝑝 = 0,005
C) 𝑝 > 0,005
Acudiendo a la tabla T de Student para 29 grados de libertad, vemos que la puntuación 2,756 deja por encima de
si una probabilidad igual a 0,005. Dado que el estadístico de contraste es más extremo que dicha puntuación, la
respuesta correta es A.
7- La conclusión que se puede extraer sobre el programa basado en la Psicología Cognitiva, en este experimento,
es:
A) No incrementa la felicidad subjetiva en las personas mayores institucionalizadas.
B) Los resultados no son concluyentes dado que el estadístico de contraste es mayor que el valor crítico.
C) Incrementa la felicidad subjetiva en las personas mayores institucionalizadas.
SITUACIÓN 2. Vizoso, Vega y Fernández (2018) estudian las actitudes negativas hacia la obesidad en jóvenes
españoles. Utilizando la Antifat Attitudes Scale (AFA, Crandall, 1997; adaptada al español por Magallares y Morales,
2014), encuentran que las estudiantes presentaban menor antipatía hacia la obesidad y que los estudiantes de mayor
edad y con mayor nivel educativo, mostraron una actitud menos negativa hacia la obesidad.
Imagine, que usted está interesado en estudiar si existen diferencias en cuanto a las actitudes negativas hacia la
obesidad en personas mayores en función del género y el nivel educativo. Dispone de una muestra de 48 personas
con una edad media de 50 años, 24 de ellos con un nivel educativo “bajo” y 24 con un nivel educativo “alto”. En cada
uno de los grupos en función del nivel educativo, 12 personas son hombres y 12 mujeres. Conociendo los valores de la
matriz AB:
a1 (bajo) a2 (alto)
b1 (hombres) 42 37
b2 (mujeres) 39 23
Y sabiendo que: [A] = 423,38; [B] = 420,21; [Y] = 527; [AB] = 431,92:
Calculando las sumas marginales del la matriz AB, se puede calcular la razón básica [T], que es la única no
proporcionada en el enunciado:
a1 (bajo) a2 (alto)
b1 (hombres) 42 37 79
b2 (mujeres) 39 23 62
81 60 141
1412
[𝑇] = = 44,1875
48
-2-
A continuación elaboramos la tablas de ANOVA:
FV SC gl MC F Ftabla
A 9,1925 1 9,1925 4,2540 4,0617
B 6,0225 1 6,0225 2,7870 4,0617
AxB 2,5175 1 2,5175 1,1650 4,0617
Error 95,08 44 2,1609
Total 112,8125 47
8- Se trata de un diseño:
A) De un factor con muestras independientes.
B) De un factor con muestras relacionadas.
C) De dos factores con muestras independientes.
13- Sobre los grados de libertad de los estadísticos de contraste de esta situación:
A) Son iguales para el factor A, el factor B y la interacción.
B) Son iguales para el factor A y el factor B porque tienen el mismo número de niveles y distintos para la
interacción
C) La suma de los grados de libertad de A, B y la interacción es igual al número total de sujetos menos uno.
14- Para un nivel de confianza del 95% y tomando el valor más próximo que podemos consultar en las tablas, se
encuentran diferencias significativas para:
A) Solo para la interacción.
B) Solo para el factor A (nivel educativo).
C) Solo para el factor B (género).
SITUACIÓN 3. Un estudio citado en Wilcox (2009) investigó si los niveles de radiación solar (NRS medidos en calorías
por día) pueden predecir las tasas de cáncer de pecho (TCP) medidas en 24 ciudades de los Estados Unidos. Los
-3-
autores proporcionaron los siguientes índices estadísticos: 𝑟𝑇𝐶𝑃,𝑁𝑅𝑆 = −0’801, 𝐹(1, 22) = 39’40, 𝑀𝐶𝑒 = 5’362,
𝑇𝐶𝑃’ = 39’99 – 0,036 × 𝑁𝑅𝑆.
16- La proporción de la variabilidad de la tasa de cáncer de pecho que puede imputarse a la variabilidad de la
radiación solar vale:
A) 0’392
B) 0’642
C) 0,005
17- Si el nivel de radiación solar existente en una ciudad fuese de cero (hipotéticamente, una ciudad que estuviese
siempre a oscuras), la tasa de cáncer de pecho pronosticada valdría aproximadamente:
A) 39’99
B) 2’289
C) -0’80
Utilizando la ecuación de regresión el valor de la TSP para NRS=0 es 𝑇𝐶𝑃’ = 39’99 – 0,036 × 0 = 39,99
18- Sabiendo que STCP = 3’783 y SNRS = 85’01, el valor del estadístico de contraste para poner a prueba la significación
de la pendiente de regresión vale aproximadamente:
A) 𝐹 = 39’40
B) 𝑻 = − 𝟔, 𝟑
C) 𝑇 = 3’02
𝐵−0 −0,036
𝑇= = = −6,3
2 3,783 √1 − 0,6416
𝑆𝑦 √1 − 𝑟𝑥𝑦
𝑆𝑥 𝑛 − 2 85,01 24 − 2
19- Dos índices de bondad de ajuste apropiados para esta situación son:
A) El Error Típico (𝑆̂𝐸𝑟𝑟𝑜𝑟 ) y el coeficiente de alienación ajustado (𝑅 2).
B) 𝑹𝟐 y el Error Típico (𝑺 ̂𝑬𝒓𝒓𝒐𝒓).
C) 𝑟 𝑇𝐶𝑃′ ,𝜖 y el coeficiente de alienación (1 − 𝑅 2).
-4-
Preguntas teóricas:
23- En todo contraste de hipótesis, para que podamos rechazar 𝐻0 el nivel crítico p tiene que:
A) Ser mayor que el nivel de significación α.
B) Ser menor que el nivel de significación α.
C) Ser mayor o menor que α dependiendo de si el contraste es unilateral derecho o izquierdo.
-5-
Modelo A. SEPTIEMBRE de 2019. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir
texto
SITUACIÓN 1: El craving se refiere al deseo intenso por el consumo de un tipo de droga que ya se ha consumido
previamente y constituye un factor esencial en el éxito terapéutico para el tratamiento de las adicciones. Esta
temática fue abordada en un Trabajo Fin de Grado (TFG) presentado por un estudiante en la convocatoria de junio
de 2019. En su proyecto propone seleccionar una muestra de 60 adictos a la cocaína que cumpliesen determinados
criterios de inclusión para participar en el trabajo con los que forma dos grupos de igual tamaño que asigna a dos
tipos de tratamiento: Terapia Cognitivo Conductual (TCC) e Intervención Basada en Mindfulness, (IBM). Una vez
terminado el tratamiento, todos los sujetos responderían a la versión abreviada en español del Cocaine Craving
Questionnaire-Now (CCQ-N10) de Tejero, Trujols y Siñol (2003) para obtener una medida global de la intensidad del
craving a la cocaína, en el que a mayor puntuación mayor intensidad. Transcurridos tres meses se registraron el
número de sujetos que tuvieron alguna recaída en cada uno de los grupos. Imagine que se obtienen los resultados
que se muestran en la siguiente tabla:
TCC IBM
𝑌̅ 52,15 53,85
𝑆𝑛−1 6,3 6,9
Recaídas 8 12
1.- ¿Cómo es la distribución muestral de la proporción de recaídas obtenidas en todas las posibles muestras del
mismo tipo y tamaño extraídas de una determinada población de adictos a la cocaína?.
A) Binomial, pero se aproxima a la normal si las muestras son grandes;
B) Siempre normal;
C) T de Student, pero se aproxima a la normal si las muestras son grandes.
La distribución muestral de la proporción es una distribución normal que se aproxima a la normal a medida que
aumenta el tamaño de la muestra. (Tema 1, página 11 del texto)
2. Con un nivel de confianza del 95%, ¿cuál debería ser el tamaño necesario, aproximadamente, de la muestra para
estimar la proporción poblacional de los sujetos que tienen recaídas y sometidos a terapia contra el craving con un
error máximo que no supere el 5%?:
A) 95;
B) 369;
C) 341.
De los 60 sujetos, 20 (8+12) tuvieron alguna recaída durante los tres meses siguientes. Esto supone una proporción
del 33,33%. Por tanto, el tamaño de la muestra necesario para estimar la proporción poblacional de los sujetos que
tienen con un error máximo que no supere el 5%, es:
𝑍2 1,962
𝑛 = 𝑝 (1 − 𝑝) = 0,333 ∗ (1 − 0,333) ∗ = 341,47
𝐸2 0,052
4.- Si el psicólogo quiere comprobar que la proporción de recaídas tras la Intervención Basada en Mindfulness es
significativamente inferior al 50%, la hipótesis nula que formula es:
A) 𝑃𝐼𝐵𝑀 ≤ 0,50
B) 𝝅𝑰𝑩𝑴 ≥ 𝟎, 𝟓𝟎 Se trata de un contraste unilateral sobre la proporción poblacional y las hipótesis nulas y
C) 𝜋𝐼𝐵𝑀 = 0,50 alternativa son, respectivamente:
𝐻𝑜 : Π ≥ 0,50
𝐻1 ; Π < 0,50
5.- Si el psicólogo quiere comprobar que la proporción de recaídas tras la Intervención Basada en Mindfulness es
significativamente inferior a 0,5, el estadístico de contraste y su nivel crítico p, valen:
A) 1,1; p= 0,2733; Siendo la proporción de recaídas tras la intervención basada en IBM, del 40%
B) -1,1; p= 0,2733; (12/30), el estadístico de contraste es:
C) -1,1; p= 0,1357.
𝑝−Π 0,40 − 0,50
𝑍= = = −1,09
𝜎𝑝 0,50 𝑥 0,50
√
30
Buscamos en la tabla de la distribución normal el valor crítico p que corresponde a P(Z<= -1,1) = 0,1357
6.- El análisis de datos que el psicólogo aplicaría para comprobar que la intensidad al craving es menor después de la
Terapia Cognitivo Conductual que con la Intervención Basada en Mindfulness es:
A) Un contraste de hipótesis unilateral de diferencia de medias para muestras independientes;
B) Un contraste de hipótesis de diferencia de proporciones para muestras independientes;
C) Un contraste de hipótesis bilateral de diferencia de medias para muestras independientes.
Antes de aplicar el estadístico de contraste para dos muestras independientes hay que saber si estas provienen de
poblaciones con la misma varianza, aplicando la prueba F:
𝑆̂12 6,92
𝐹= = = 1,19 𝑝 > 0,05
𝑆̂22 6,32
Buscamos en la tabla t con 58 gl (30+30-2), el valor más próximo a t= 1, que son o 0,848 o 1,045.
El valor t=1 se encuentra entre estos dos valores, los cuales dejan a su izquierda una probabilidad de 0.800 y 0,85,
respectivamente, por lo que a su derecha dejarán una probabilidad de 0,20 y 0,15. Como la distribución t es
simétrica, para la puntuación t=-1 el nivel crítico p corresponde a la probabilidad correspondiente a su izquierda que
es un valor comprendido entre 0,15 y 0,20. En consecuencia, el nivel crítico p asociado al estadístico t= -1, es p >
0,05. Como el nivel crítico p es mayor que cualquiera de los niveles de significación habitualmente utilizados (0,05 o
0,01) no tenemos evidencias suficientes para rechazar la Ho, lo que indica que no existen diferencias significativas
entre estas dos terapias para el tratamiento del craving.
Como consecuencia de la pregunta anterior, la conclusión es que la diferencia no es significativa (t= -1; p >0,05). Por
otro lado, la puntuación d=0,26 cuantifica la distancia tipificada entre las medias de los dos tratamientos. En la
distribución normal una puntuación 0,26 deja a su izquierda una probabilidad de 0,6026 (60,26%) lo que significa
que hay un 60,26% de sujetos tratados con TCC que quedan por debajo de la media de los sujetos tratados con IBM.
Pero observando la gráfica, también se puede decir que:
El 39,74% de los tratados con TCC están por encima de la media de los tratados con IBM
El 60,26% de los tratados con IBM están por encima de la media de los tratados con TCC
El 39,74% de los tratados con IBM están por debajo de la media de los tratados con TCC, que corresponde a la
alternativa C).
SITUACION 2. Un TFG presentado por una estudiante en la convocatoria de junio 2019 de este curso académico
planteaba el análisis de la influencia del estilo de liderazgo (Transformacional frente al Autocrático) y el género del
líder sobre determinadas variables de los empleados, como la satisfacción laboral (SL), rendimiento (RE) y sentido de
pertenencia o compromiso de los empleados con su trabajo (SP). Para el registro de estas variables se proponían
varios cuestionarios, como el Utrecht Work Engagement (UWES) desarrollado por Schaufeli & Bakker (2003) que
valora un estado mental positivo asociado con la satisfacción laboral -donde a mayor puntuación mayor satisfacción-
y al que responden todos y cada uno de los 15 empleados pertenecientes a cada condición, obteniendo los
siguientes datos: SC(Estilo liderazgo)= 10; SC(Género)= 38; SC(Intra)= 45; SC(Total)= 314. Asumiendo que se cumplen
los supuestos necesarios para el contraste de hipótesis, responda a las siguientes preguntas:
En el estudio se consideran dos variables independientes (el estilo de liderazgo y el género) y cada una de ellas tiene
dos niveles: transformacional y autocrático, para el estilo de liderazgo y hombres y mujeres, para el género.
12.- Si desea dar respuesta a la pregunta: ¿El estilo de liderazgo influye en la satisfacción laboral de los empleados?,
la hipótesis nula que formularía es:
A) 𝜇 𝑇𝑅𝐴≥ 𝜇𝐴𝑈𝑇
̅ ̅𝑇𝑅𝐴
B) 𝑌𝐴𝑈𝑇 = 𝑌
Al no indicarse en qué sentido (favorable o desfavorable; positivo o negativo, etc)
puede actuar esta influencia, se formula un contraste bilateral.
C) 𝝁𝑻𝑹𝑨 = 𝝁𝑨𝑼𝑻
13.- El estadístico de contraste que se obtiene para el análisis de la influencia del género del líder sobre la
satisfacción laboral de los empleados es, aproximadamente:
A) 47,3;
B) 27,5; Con los datos del enunciado, señalados en rojo, completamos la tabla para obtener los
C) 12,5. estadísticos de contraste para las tres hipótesis, siendo la debida a la influencia del género
la de la alternativa A).
FV SC GL MC F
LIDER 10 1 10,00 12,44
GENERO 38 1 38,00 47,29
INTERACCION 221 1 221,00 275,02
INTRA 45 56 0,80
TOTAL 314 59 5,32
14.-A partir de los resultados obtenidos ¿existen diferencias significativas en la satisfacción de los empleados con un
líder autocrático o transformacional en función del género del líder?:
A) Sí porque el estadístico es, aproximadamente: 𝑭 = 𝟐𝟕𝟓, 𝟎𝟐; 𝒑 < 𝟎, 𝟎𝟏;
B) No porque el estadístico de contraste es, aproximadamente: 𝐹 = 12,5; 𝑝 > 0,05;
C) Sí porque el nivel crítico p para el factor género es mayor que el nivel de significación.
Buscamos en la tabla de F, los valores que corresponden a los grados de libertad del numerador y denominador del
estadístico F:
𝑀𝐶(𝑙𝑖𝑑𝑒𝑟𝑎𝑧𝑔𝑜)
𝐹=
𝑀𝐶(𝐼𝑛𝑡𝑟𝑎)
Estos g.l son 1 y 56, respectivamente.
En la tabla de F con 1 y 60 gl (el más próximo a los 56) el valor más alto de F que encontramos es 8,495 que deja a su
izquierda una probabilidad de 0,995 siendo entonces el nivel crítico para este valor de p=0,005. Como el estadístico
de contraste obtenido (F=12,44) es mayor que el de la tabla (8,495) el nivel crítico p para F=12,44 es p< 0,005, que es
también menor que 0,01.
15.- El nivel crítico p para tomar una decisión sobre la hipótesis de que el estilo de liderazgo afecta a la satisfacción
laboral del empleado de forma diferencial cuando el líder es hombre o mujer, es:
A) 𝒑 < 𝟎, 𝟎𝟏
B) 𝑝 > 0,05 Siguiendo el mismo razonamiento que en la pregunta anterior, el nivel crítico p
C) 0,01 < 𝑝 < 0,05 se busca en la tabla de la distribución F.
Los contraste a posteriori solo tienen sentido cuando el factor tiene tres o más niveles, en cuyo caso, para encontrar
diferencias significativas hay que realizar todas las comparaciones dos a dos para determinar entre cuáles de estos
niveles del factor existen diferencias.
17.- Con independencia de los resultados cuantitativos obtenidos, ¿cuál de las siguientes gráficas indicaría que no
sería significativa la interacción entre el género y el estilo de liderazgo?:
A) B) C)
En las gráficas A) y B) la influencia del estilo de liderazgo tiene un efecto diferencial en los hombres respecto a las
mujeres, lo que indica la existencia de interacción.
En la gráfica A) hay poca influencia del estilo de liderazgo en los hombres y sin embargo tiene más influencia en las
mujeres.
En la gráfica B) hay menor influencia de los dos estilos de liderazgo en las mujeres y un efecto mucho mayor en los
hombres.
En la gráfica C) no parece que exista interacción ya que el estilo de liderazgo afecta de igual manera a hombres y
mujeres, y ambos grupos obtienen puntuaciones más altas bajo un líder autocrático que transformacional.
SITUACIÓN 3: El craving se refiere al deseo intenso por el consumo de un tipo de droga que ya se ha consumido
previamente y constituye un factor esencial en el éxito terapéutico para el tratamiento de las adicciones. Esta
temática fue abordada en un Trabajo Fin de Grado (TFG) presentado por un estudiante en la convocatoria de junio
de 2019. En su proyecto propone seleccionar una muestra de 10 adictos a la cocaína que cumpliesen determinados
criterios de inclusión para participar en el trabajo y a los que aplica una Intervención Basada en Mindfulness. Una vez
terminado el tratamiento, todos los sujetos responderían a la versión abreviada en español del Cocaine Craving
Questionnaire-Now (CCQ-N10) de Tejero, Trujols y Siñol (2003) para obtener una medida global de la intensidad del
craving a la cocaína (Y) junto con otros cuestionarios para el registro de conflictos interpersonales, (X1) y autocontrol,
(X2). Se conocen las desviaciones típicas de las tres variables, que figuran en la siguiente tabla, siendo la correlación
entre el craving y el autocontrol de -0,65.
19.- El estadístico de contraste, y su nivel crítico p, para comprobar la significación de la relación entre el craving y el
autocontrol valen aproximadamente:
A) 2,55; 𝑝 < 0,01
B) −𝟐, 𝟒𝟐; 𝒑 < 𝟎, 𝟎𝟓 Las hipótesis y el estadístico de contraste para la hipótesis de significación de un
C) −1,87; 𝑝 < 0,05 coeficiente de correlación, son:
𝐻𝑜 : ρ𝑋𝑌 = 0
𝐻1 ; ρ𝑋𝑌 ≠ 0
Y el estadístico de contraste:
En la distribución t con 8 gl (10-2), la probabilidad de obtener valores tan extremos como -2,42 o más, es p < 0,025:
20.- Sabiendo que los conflictos interpersonales explican el 30% de la varianza de las respuestas en el Cocaine
Craving Questionnaire-Now, el coeficiente de correlación entre estas dos variables, sin tener en cuenta el signo, es
aproximadamente:
A) 0,450; Si el coeficiente de determinación (r2) es 0,30, el coeficiente de correlación entre ambas
B) 0,485; variables es:
C) 0,548. 2
𝑟𝑋𝑌 = √𝑟𝑋𝑌 = √0,30 = 0,5477
21.- La pendiente de la ecuación de regresión para pronosticar la intensidad del craving exclusivamente a partir de
las puntuaciones de autocontrol como variable predictora, es aproximadamente:
A) 0,36;
B) -0,38; Si representamos el craving por Y y el autocontrol por X, sabemos por el enunciado que
C) -1,11. rxy=-0,65 y la pendiente para pronosticar Y a partir de X, es:
𝑆𝑦 1,1
𝑏 = 𝑟𝑋𝑌 = −0,65 = −0,38
𝑆𝑥 1,88
22.- Para una persona que obtiene 9 puntos en el cuestionario de autocontrol, cuya media es de 7 puntos, ¿cuál
sería, aproximadamente, su puntuación diferencial pronosticada para la intensidad del craving?:
A) − 0,44
B) − 𝟎, 𝟕𝟔 La ecuación de regresión en puntuaciones diferenciales es:
C) + 0,70
𝑌 ′ = 𝐵𝑥𝑖 = 𝐵 (𝑋 − 𝑋̅) = −0,38 (9 − 7) = −0,76
24.- ¿Qué supuestos básicos deben cumplir las puntuaciones del Análisis de regresión y el ANOVA para que sus
inferencias sean válidas?:
A) Independencia, normalidad y homocedasticidad;
B) Sólo normalidad y homocedasticidad;
C) Ninguna, salvo que la variable dependiente sea de naturaleza cuantitativa.
25.- En el análisis de regresión múltiple aplicado a esta situación, el coeficiente de determinación nos informaría de:
A) El porcentaje de cumplimiento de los supuestos básicos para la validez de los pronósticos;
B) La aportación del autocontrol sobre los conflictos interpersonales para pronosticar el craving;
C) La proporción de varianza de la intensidad del craving que se explica por el autocontrol y los conflictos
personales de los sujetos de la muestra.
1. Se aplica una terapia para eliminar una determinada fobia a una muestra de 100 personas,
siendo efectiva en 60 casos. El estadístico de contraste para comprobar que la proporción de
personas que supera la fobia es mas de la mitad, es igual a:
A. 1,96
B. 2
C. 2,33
6. Se aplica una terapia para eliminar una determinada fobia a una muestra de 100 personas,
siendo efectiva en 60 casos. Para comprobar que se recuperan mas de la mitad, la hipótesis
alternativa que se ha de plantear es:
A. πRecuperados > 0,5
B. πRecuperados < 0,5
C. πRecuperados ≠ 0,5
7. El máximo error que el investigador esta dispuesto a admitir para rechazar una hipótesis
nula que es verdadera, se llama:
A. Nivel critico
B. Nivel de confianza
C. Nivel de significación
8. En un experimento unifactorial inter-sujetos con 4 niveles y 5 sujetos en cada grupo, hemos
realizado el contraste de la CRScheffé entre el primer grupo y los tres restantes mediante los
coeficientes {-3, 1,1,1}. Las medias de los 4 niveles valen respectivamente 5,2; 3,3; 6,0 y
10,1. ¿Cuál será el valor de la diferencia encontrada en nuestros datos para poner a prueba
ese contraste?
A. 0,52
B. -1,5
C. 3,8
9. ¿Qué modelo de ANOVA incluye, en los supuestos necesarios para poder aplicarlo, la
igualdad de covarianzas entre todos los niveles de un factor?
A. ANOVA de un factor para muestras independientes
B. ANOVA de dos factores para muestras independientes
C. ANOVA de un factor para muestras relacionadas
12. En un diseño de un factor con 4 niveles y 5 sujetos por grupo, tenemos una SCtotal=22,09 y
una SCintra=10,55, ¿aproximadamente cuando vale la F del factor?
A. 2,21
B. 5,83
C. 3,09
13. Hemos realizado un mismo estudio de un único factor con 3 niveles, pero en un caso de
diseño intrasujeto y en otro intersujeto. Nos han informado de que las medias cuadráticas
del error son diferentes (3,45 y 6,98) pero no nos han indicado cual pertenece al diseño intra
o al diseño inter.
A. Las medias cuadráticas del error, aunque diferentes por variar el diseño, no deben diferir
estadísticamente entre sí (p>0,5), ya que se corresponden con un mismo factor
B. No es posible realizar un estudio manipulando el mismo factor pero con diseños intra e
inter-sujetos.
C. Lo mas probable es que MCe=3,45 pertenezca al diseño intrasujeto y MCe=6,98 al
intersujeto ya que los primeros tienen MCe inferiores
16. Conforme rxy se aproxima al valor rxy=-1, la cantidad de error en un análisis de regresión:
A. Se mantiene constante
B. Se incrementa
C. Disminuye
17. Un estudio realizado con 122 profesionales de la salud publica analiza la relación de la
calidad de la vida laboral (L) con la remuneración (R), encontrando que la suma de
cuadrados de las puntuaciones en la variable dependiente calidad de vida es de 700 puntos y
la media cuadrática residual de 5,6 puntos. El estadístico de contraste para la significación
de la regresión simple es aproximadamente:
A. 5
B. 4,2
C. 6,85
20. Un estudio realizado con una muestra representativa de 30 profesionales de la salud publica
encuentra que la remuneración explica el 24% de la varianza de la calidad de vida laboral. El
valor absoluto estadístico del estadístico de contraste para (esta pregunta no la he
encontrado entera)
A. 3,63
B. 1,31
C. 2,97