Todo Análisis de Datos II Menos Libro

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 756

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

TEMA Nº 1 ! ESTIMACIÓN DE PARÁMETROS Y CONTRASTE DE HIPÓTESIS

1.- INFERENCIA ESTADÍSTICA

Estudio de las muestras para conocer la población a la que representan. La inferencia siempre se hace
en términos probabilísticos (afirmamos con una cierta probabilidad de éxito). El error muestral es la
diferencia entre el resultado obtenido en la muestra y el que habríamos obtenido si se hubiese trabajado
con la población.
Para cada característica de la muestra que evaluemos se obtiene lo que se conoce como estadístico:
índices descriptivos de centralidad (Media), variabilidad (Varianza), etc. A partir de los estadísticos
obtenidos en la muestra (lo concreto), se realizan afirmaciones sobre los parámetros de la población (lo
general)

DISTRIBUCIONES DE PROBABILIDAD !

Distribución Poblacional: (Distribución de frecuencias que presenta la variable en la población sobre la


que se quiere generalizar). Las medidas en la población se denominan parámetros poblacionales y se
designan con letras griegas ! (Parámetros: Media de la población = µ , Varianza de la población = σ2,
Proporción de la población = π)

Distribución de la Muestra: (Distribución de frecuencias que presenta la variable en la en la muestra


con la que se trabaja). Las medidas realizadas en la muestra se denominan estadísticos y se designan
con letras latinas mayúsculas ! (Estadísticos: Media de la muestra = Y, Varianza de la muestra = S2,
Proporción de la muestra = P)

Distribución Muestral de un estadístico: (Distribución de frecuencias que presenta el estadístico que


vamos a utilizar como base del proceso de inferencia para estimar los parámetros). Resulta de obtener
todas las muestras posibles (de un determinado tamaño) de una población y medir en ellas una
determinada característica. Las distribuciones muestrales que más vamos a utilizar son: la media, la
varianza y la proporción.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA !

Teorema Central del límite: Si una población tiene una media µ y una varianza σ2 finitas, la
distribución de las medias muestrales de tamaño “n” extraídas de manera aleatoria e independiente,
se aproxima a la forma de una distribución normal con varianza σ2/n y media µ conforme el
tamaño de n se va incrementando. __
N ( µ , σ / √ n)

La Distribución muestral de la media (media de


todas las medias posibles): Se trata de una
distribución de probabilidad conocida que viene
recogida en las tablas. Es Normal N (0, 1) cuando
lo es la distribución de la variable estudiada (al
margen del tamaño de la muestra) y tiende a la
normal a medida que n va aumentando (al
margen de la distribución de la variable).
La distribución muestral de la media se ajusta a
la distribución t de Student (con n-1 grados de
libertad), si ignoramos la forma de la distribución
de la variable y/o el tamaño de la muestra es
pequeño.

R. MEDRANO (TUTOR) Página 1


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

DISTRIBUCIÓN MUESTRAL DE LA VARIANZA !

La varianza es un índice de dispersión que permite


determinar la homogeneidad de la variable de estudio. La
distribución muestral de la varianza se ajusta a la
distribución Chi-cuadrado (con n-1 grados de libertad).La
cuasi varianza muestral (S2n- 1) es la mejor estimación de la
varianza poblacional (σ2). Tiende a la normal a medida que
aumenta el tamaño de la muestra (mayor de 100 sujetos)

DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN !

Se trata de variables dicotómicas o dicotomizadas;


normalmente éxito o fracaso. La distribución de la
proporción poblacional se ajusta al modelo binomial
con parámetros n y π. La distribución binomial se
aproxima a la normal a medida que el tamaño de la
muestra va aumentado (Teorema Central del Límite), con
parámetros ! N (π, σp)

D. Muestral (Media) D muestral (Varianza) D. Muestral (Proporción)


_
Media E (X) = µ E (S2n- 1) = σ2 µp = π
_ ________ __________
Desviación Típica σx = σ / √n σS2n-1 = σ2 · √ 2 / n – 1) σp = √ π (1- π) / n
Error Típico Media Error Típico Cuasi Varianza Error Típico Proporción
_ _
X-µ X-µ (n-1) S2n-1 P-π
2
Tipificación Z = --------- y T = ----------- X n-1 = --------------------- Z = -------------------
σ / √n Sn-1 / √n σ2 √ π (1- π) / n
D. Normal D. T Student 2
Distribución X n-1 gl Distribución Normal

PROBLEMAS EJEMPLO

El CI de los alumnos de un centro de E. Especial se distribuye normalmente con µ = 80 y σ =10. Si de


esta población extraemos una muestra aleatoria de 25 alumnos. ¿Cuál es la probabilidad de obtener
una media mayor de 75 puntos?
_ 75 - 80
P (X ≥ 75) ! Z = ------------ ! Z = (- 2´50) se corresponde con p = 0´0062 ! 1 - 0´0062 = 0´9938
10 / √25

Los tiempos requeridos por un cierto autobús para alcanzar uno de sus destinos en una ciudad
grande forman una distribución normal con una desviación típica σ =1 minuto. Si se elige al azar una
muestra de 17 tiempos, encuentre la probabilidad de que la cuasi varianza muestral sea mayor que 2.
Se busca el valor de ji-cuadrado correspondiente a S2n-1=2
(n-1) S2n-1 16 · 2
X2n-1 = --------------------- ! X2n-1 = ------------ = 32
σ2 12
El valor de 32 se busca en la tabla Chi Cuadrado con 16 grados de
libertad. A este valor le corresponde una probabilidad de 0,99. En
consecuencia, 1-0´99 = 0´01! P(S2n-1 >2)

R. MEDRANO (TUTOR) Página 2


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

Un partido político cree que el 60% del electorado está a favor de su programa. Como su líder
encuentra que esta predicción es demasiado optimista decide hacer un sondeo con una muestra de
90 personas. ¿Cuál es la probabilidad de que como máximo 60 personas estén a favor de su partido?

0´67 – 0´60
P (60/90 = 0´67)! Z = --------------------- ! Z = (1´35) se corresponde con p = 0´9115
√ 0´6 · 0´4 / 90

2.- ESTIMACIÓN DE PARÁMETROS

Generalmente se desconocen los parámetros de la población por lo que se hace necesario estimarlos a
partir de los valores muestrales. Un estimador es un estadístico que utilizamos para estimar
parámetros. Se pueden considerar dos formas de estimar los parámetros poblacionales: estimación
puntual (Conocida como método de los momentos de Pearson, se extrapola el estadístico de la
muestra directamente a la población) y estimación por intervalos (establece un rango de valores
dentro del cual estaría el valor del parámetro, con una determinada probabilidad)

Para que el estimador represente correctamente al parámetro !r cuatro propiedades básicas:

1.- Carencia de sesgo: un estimador es insesgado o centrado cuando el valor del estadístico (en las
infinitas muestras de tamaño “n” extraídas de una población) coincide con el valor del parámetro que
queremos estimar ! U es un estimador insesgado de θ, si ! E (U) = θ
La media, la proporción y la cuasi varianza de la muestra son estimadores insesgados de sus valores
poblacionales
2.- Eficiencia (Precisión): Se considera la inversa de la varianza de su distribución muestral. Cuanto
mayor es el cociente, mayor es la eficiencia. Eficiencia ! θ = 1 / σ20 (A mayor varianza, menor
eficiencia). La Media Aritmética es más eficiente que la Mediana. La Varianza es más eficiente que la
Cuasi varianza. Cuando tenemos distintos estimadores y queremos determinar el más eficiente, se
comparan sus eficiencias. Ejemplo: La varianza de la distribución muestral de dos estimadores es 2 y
1,5. Para un mismo tamaño muestral, la eficiencia relativa sería 1,5 / 2 = 0,75. Si el cociente fuera 1
serían iguales.
3.- Suficiencia: el estimador utiliza toda la información de la muestra para estimar el parámetro
(Ejemplo: La media muestral sería suficiente para estimar la media poblacional. No lo sería la amplitud
intercuartílica para estimar la varianza poblacional)
4.- Consistencia: El requisito mínimo que se le exige a un estimador es que sea consistente. Un
estimador es consistente si, a medida que se dispone de más información (que aumenta el tamaño de
la muestra), aumenta la probabilidad de que la estimación coincida con el parámetro. La media, la
proporción y la varianza insesgada son consistentes porque son estimadores insesgados de los
parámetros correspondientes y en sus límites valen cero (su sesgo y su varianza tienden a 0 a media
que aumenta n)

Cuando el valor del parámetro (población) coincide con el valor del estadístico (muestra), se considera
que la estimación (inferencia sobre la población a partir de la muestra) es insesgada. Siempre que
operemos se debe procurar que nuestros estimadores sean insesgados y tengan una varianza pequeña;
estas dos características se denominan acuracidad.

Resumen de las propiedades de los principales estadísticos


Carencia de sesgo Eficiencia Suficiencia Consistencia
Media Aritmética SI > Mediana SI SI
Mediana NO < Media NO SI
Proporción SI ----- SI SI
2
Varianza NO > S n-1 SI SI
2
Cuasi varianza SI <S SI SI

R. MEDRANO (TUTOR) Página 3


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

ESTIMACIÓN POR INTERVALOS

Una estimación por intervalos expresa el grado de confianza con el que se espera que esté el valor
del parámetro dentro del intervalo, por lo que se suele llamar intervalo de confianza. La amplitud del
intervalo nos indicará su precisión. A menor amplitud, más precisión, más informativo es, más útil.
Una estimación por intervalos depende de cuatro parámetros: una estimación puntual del
parámetro; una medida de variabilidad; una probabilidad (nivel de confianza) y un supuesto acerca de
la distribución en la población.

INTERVALO DE CONFIANZA PARA LA MEDIA

N(0,1) t n-1 gl
Distribución Normal (Conocida σ2) Desconocida la σ2 (Muestras pequeñas)

_ _ _ _ _ _
X + (Z α/2) · (σX) < µ < X + (Z1- α/2) · (σX) X + (t α/2) · (Sn- 1/√ n) < µ < X + (t1- α/2) · (Sn- 1/√ n)

Problemas ejemplo: Se midieron los niveles de depresión en una muestra de 100 personas.
Asumiendo un nivel de medida de intervalo y que la variable se distribuye normalmente en la
población, se calculó la media de las puntuaciones y se obtuvo un valor de (Media = 8) y una cuasi
desviación típica = 2. Hallar los límites del intervalo de confianza para la media de la población
con un nivel de confianza del 99%.
_
Datos ! X = 8 Distribución normal de la VD α = 0,01 Sn- 1 = 2

Desconocida la varianza poblacional ! n = 100 (muestra grande: Distribución normal)


_
Intervalo de confianza ! X ± (Z α · σ Y) = Límite superior y Límite inferior

α / 2 = 0,01/2 = 0,005 1 - (α / 2) = 0,995 |Z α| = 2,58


__
Error Típico ! σX = Sn- 1 / √ n ! σX = 2 / 10 ! 0,20

Error máximo de estimación ! |Z α| · σX = (2,58 · 0,20) = 0,516

Límites del intervalo de confianza ! 8 ± (2,58 · 0,20) = [7,484 y 8,516]

Hallar los límites del intervalo de confianza suponiendo que la muestra está compuesta por 25
personas, a un nivel de confianza del 95%.
_
Datos ! X = 8 Distribución normal de la VD α = 0,05 Sn- 1 = 2

R. MEDRANO (TUTOR) Página 4


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

Desconocida la varianza poblacional ! n = 25 (muestra pequeña: Distribución t de Student)

_ _
Intervalo de confianza ! X ± (t α · Sn- 1 / √ n) = Límite superior y Límite inferior

α / 2 = 0,05/2 = 0,025 1 - ( α / 2) = 0,975 |t α| = 2,06 (Tablas t de Student)


__
Error Típico ! Sn- 1 / √ n ! 2 / 5 ! 0,4
__
Error máximo de estimación ! |t α| · Sn- 1 / √ n = (2,06 · 0,4) = 0,824

Límites del intervalo de confianza ! 8 ± (2,06 · 0,4) = [7,176 y 8,824]

INTERVALO DE CONFIANZA PARA LA VARIANZA


.

(n-1) S2n- 1 (n-1) S2n- 1


Li = ----------------- y Ls = ---------------
X2 (n-1)(1-α/2) X2 (n-1)α/2

P (Li < σ2 < Ls) = 1 - α

Los valores de X2 se obtienen en la tabla X2n-1


(Chi-Cuadrado con n-1 grados de libertad)

Distribución X2n-1 (Chi Cuadrado con n-1 gl)

Problemas Ejemplo: En una muestra aleatoria de 20 sujetos, extraída de una población normal, se ha
obtenido una media de 24 puntos y una cuasi desviación típica de 10,8 puntos. Averiguar los límites del
intervalo de confianza para la varianza de la población, suponiendo α = 0,05.

Estimamos la varianza de la población a partir de la varianza de la muestra (estimación por intervalo):

(n – 1) · S2n- 1 / (χ2 α / 2) < σ2 < (n – 1) · S2n- 1 / (χ2 1- α / 2)

Según las tablas χ2n-1 (χ219) ! para (α / 2 = 0,025) ! 8,91 y para (1 - α / 2 = 0,975) ! 32,9

(19 · 10,82) / 32,9 < σ2 < (19 · 10,82) / 8,91 ! Límites del intervalo de confianza ! [67,36 y 248,7]

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

P + (Z α / 2 ) · (SP ) < π < P + (Z1- α / 2 ) · (SP )


___________
Donde : SP = √ P (1 – P) / n

P (Li < π < Ls) = 1 – α P = (Li + Ls) / 2

Z α/2 · Sp = Error máximo de estimación

Sp = Error Típico (distribución muestral de la Proporción)

R. MEDRANO (TUTOR) Página 5


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

Problema Ejemplo: Para comprobar la eficacia en la aplicación de un tratamiento, se someten al mismo


64 pacientes. Finalizado el periodo de aplicación, se observó que remitió la enfermedad en 50 casos.
Con un nivel de significación del 92% (α = 0,08), estime por intervalo el porcentaje de efectividad del
tratamiento objeto de estudio.

Datos: Para (α / 2 = 0,04) ! Z = (- 1,75) y Para (1 - α / 2 = 0,96) ! Z = (+ 1,75)

Proporción muestral ! (50 / 64) = 0,781

Intervalo de confianza ! P ± |Z α / 2| · (SP) = Límites Superior e Inferior


___________ ___________________
SP = √ P (1 – P) / n ! SP = √ 0,781 · (1 – 0,781) / 64 = 0,0517

P ± |Z α / 2| · (SP) ! 0, 781 ± (1,75 · 0,0517) = [0,87 y 0,69]

Con un margen de error del 8% el tratamiento será efectivo entre el 69% y el 87% de los casos.

AMPLITUD DEL INTERVALO DE CONFIANZA Y RELACIÓN CON EL TAMAÑO MUUESTRAL

La amplitud del intervalo de confianza depende de dos factores: el nivel de confianza y el error típico de
la distribución muestral del estadístico (La suma de ambos E = Error máximo de estimación). Cuanto
mayor es el tamaño de la muestra mayor es la precisión del intervalo y mayor la precisión de la
estimación. Cuanto menor es el error típico, menor es el intervalo de confianza y, por tanto, más preciso
(para reducirlo se aumenta el tamaño muestral)

ESTADÍSTICO SUPUESTOS FÓRMULA


2 2 2
MEDIA Var. Poblacional conocida n = (σ · Z α / 2) /E
Var. Poblacional desconocida
2 2 2
y muestra grande n = (S n-1 · Z α / 2) /E
Var. Poblacional desconocida
2 · 2 2
y muestra pequeña n = (S n-1 α / 2 t n-1) /E
4 2 2
VARIANZA Error Típico (muestras grandes) n = (2S n-1 · Z α / 2) /E
2 2
PROPORCIÓN Error Típico ( muestras grandes) n = P · (1 – P) · Z α/2 /E

Problemas Ejemplo: Por experiencias anteriores se sabe que las estaturas de los soldados tienen una
varianza de 64 cm. ¿Qué tamaño debe tener la muestra para que la media estimada no se aleje más de
± 1, 5 puntos de la media poblacional?: considere (α = 0,02).

Para (α / 2 = 0,01) ! Z Tablas = ± 2,33 Varianza poblacional conocida σ2 = 64

n = (σ2 · Z2 α / 2) / E2 máximo de estimación ! n = (64 · 2,332) / 1,52 = 154, 42 ≈ 154 soldados

Con un margen de error del 2% debemos tomar una muestra de 154 soldados.

" Un estudio sobre la proporción de fumadores entre el personal de un hospital estableció que sólo
fumaban el 35%. Si el análisis se efectuó con un nivel de confianza del 95%, ¿Qué tamaño debió
tener la muestra para que la proporción estimada no se aleje más de ± 0,15 puntos de la proporción
poblacional?: considere (α = 0,05).

Para (α / 2 = 0,025) ! Z Tablas = ± 1,96

n = P · (1 – P) · Z2 α / 2 / E2 máximo de estimación ! n = 0,35 · 0,65 · 1,962 / 0,152 = 38,84 ≈ 39

Con un margen de error del 5% debemos tomar una muestra de 39 personas.

R. MEDRANO (TUTOR) Página 6


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

3.- CONTRASTE DE HIPÓTESIS

Hipótesis estadística: proposición (afirmación) sobre algún aspecto de la distribución de una población
(parámetro, forma, etc.) que puede someterse a prueba a través de una muestra aleatoria de esa
población. No tiene por qué suponerse interés científico.

Contraste de hipótesis: Procedimiento por el cual decidimos si una propuesta sobre la población
puede aceptarse o no. Su finalidad es generalizar un resultado muestral a la población de la que procede
la muestra. Siempre se formulan dos hipótesis (exhaustivas y mutuamente excluyentes); de tal modo,
que el rechazo de una implica la aceptación de la otra.
H0 (hipótesis nula): se acepta provisionalmente como verdadera y se somete a contraste.
H1 (hipótesis alternativa): se acepta al rechazar la hipótesis nula.

Dependiendo de cómo se formule la hipótesis hablamos de dirección del contraste.

BILATERAL O BIDIRECCIONAL UNILATERAL IZQUIERDO UNILATERAL DERECHO

" La media (µ) es algún valor " La media (µ) es algún valor " La media (µ) es algún valor
Igual o distinto a (X) No inferior a (X). No superior a (X).
Ho : µ = X Ho : µ ≥ X Ho : µ ≤ X
H1 : µ ≠ X H1 : µ < X H1 : µ > X

La decisión de utilizar contrastes unilaterales o bilaterales depende de la información o la idea del


investigador sobre la tendencia de la variable en la población. Esta decisión influye en el nivel de
significación (α) y en la interpretación de los resultados. El tipo de contraste es similar para la media
(µ), la proporción (π) y la varianza (σ2). En los tres tipos de contraste, el signo igual está en la H0.
Las hipótesis siempre se hacen sobre los parámetros poblacionales.
Estadístico de Contraste (medida de discrepancia): Instrumento para tomar decisiones sobre la
hipótesis nula, con una cierta probabilidad. La elección de un estadístico de contraste depende de las
características de la variable en la población (forma, parámetros,...), de los datos muestrales (forma de
obtenerlos, nivel de medida,...) y de la hipótesis estadística que se quiere contrastar (generada a partir
de la hipótesis de investigación y los supuestos).
Estadístico de Contraste (Discrepancia)

Estadístico de Contraste Valor del estadístico en la muestra – Valor del parámetro en la H0


Discrepancia = -----------------------------------------------------------------------------------------------------
Error típico de estimación

Se trata de averiguar la discrepancia entre los datos empíricos observados en la muestra y los datos
teóricos que planteamos en la H0.

Regla de decisión: Tomando en consideración el valor o los valores críticos (máxima diferencia
que cabe esperar por simple azar entre los datos empíricos y los teóricos) y a partir del nivel de
significación. Acumulado en los contrastes unilaterales (α) y dividido por dos en los bilaterales (α/2)

CONTRASTE BILATERAL Valores α / 1- α / Z más frecuentes


Valor crítico (Z α/2) Valor crítico (Z α/2)

α 0´05 0´01 0´001


1-α 0´95 ´99 0´999
Z α/2 - 1´96 - 2´58 - 3´29
Z 1-α/2 1´96 2´58 3´29
α ! Nivel de significación
1 – α ! Nivel de confianza
Z α/2 ! Z (Tabla III negativa)
Z 1-α/2 ! Z (Tabla IV positiva)

R. MEDRANO (TUTOR) Página 7


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

CONTRASTE UNILATERAL IZQUIERDO CONTRASTE UNILATERAL DERECHO

Zona Zona Aceptación Zona Aceptación Zona


Rechazo H0 H0 (1 – α) H0 (1 – α) Rechazo H0
|------------|---------------------------------------| |-----------------------------------|-------------|
α VALOR VALOR α
CRÍTICO CRÍTICO

Nivel crítico (p) ! Calcular la probabilidad de obtener unos resultados como los observados en la
muestra bajo el supuesto de que la H0 es cierta.

Zona de rechazo (depende de que el contraste sea bilateral o unilateral). Teniendo en cuenta el riesgo
adoptado se determinan los valores del estadístico y se decide si la hipótesis nula es verdadera o falsa.
Nunca puede afirmarse categóricamente que la hipótesis es cierta o falsa, se afirma con un determinado
nivel de probabilidad. Así, ¿Cómo decidir sobre la hipótesis nula? ! Dos métodos equivalentes:

# A través del nivel crítico ! si p es ≤ α, rechazaremos H0, y si p > α, no la rechazaremos.


# A través del valor o los valores críticos. El criterio alfa divide la distribución de probabilidad del
estadístico de contraste en dos zonas: la zona de aceptación de H0 y la zona de rechazo de H0
(región crítica). Si el valor muestral del estadístico de contraste cae en la zona de aceptación no lo
rechazaremos, y sí lo haremos cuando cae en la zona de rechazo.
# A través del intervalo de confianza que delimita dos valores entre los cuales se encuentra o no el valor de
la hipótesis. Si está entre ellos se acepta la hipótesis nula, si no es así, se rechaza.

Ho (Cierta) ! (p) es mayor que (α) ! El valor se encuentra en el intervalo de confianza. El valor del
estadístico está entre los valores críticos.
Ho (Falsa) ! (p) es menor o igual que (α) ! El valor está fuera del intervalo de confianza. El valor del
estadístico supera o es inferior a los valores críticos.

El nivel de significación (α) se fija de antemano, mientras que el nivel crítico p es consecuencia
del resultado obtenido al aplicar el estadístico de contraste.
El contraste bilateral es más conservador que el contraste unilateral (es más difícil rechazar la H0)

Conclusión e interpretación: Contrastada la H0, considerada de forma provisional como verdadera,


y calculado el estadístico de contraste, se concluye rechazando o no la H0. Después se interpreta el
resultado en el contexto de la investigación.

R. MEDRANO (TUTOR) Página 8


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

3.1.- RESUMEN DEL PROCEDIMIENTO (CONTRASTE DE HIPÓTESIS)

1.- Supuestos (descripción de las características de la variable en la población, y de los datos de


la muestra): Nº de muestras con el que trabajamos; son independientes o relacionadas;
seleccionadas de forma aleatoria o no; cómo son las escalas de medida utilizadas para las variables,
la distribución de la que provienen los datos es conocida o desconocida, etc.

2.- Formulación de las Hipótesis Estadísticas (exhaustivas y mutuamente excluyentes) de acuerdo


con la hipótesis científica y las características anteriores.

3.- Elección del estadístico de contraste apropiado.

4.- Fijar α (regla de decisión). La zona de rechazo de la H0 estará formada por todos los valores del
estadístico cuya probabilidad de ser obtenidos es muy pequeña bajo el supuesto de que la H0 es
cierta.

5.- Cálculo del estadístico de contraste con los datos obtenidos en la muestra.

6.- Decisión sobre el rechazo o no de la H0.


Mediante el nivel crítico (p) ------------------- Mediante el ó los valores críticos (α)

7.- Conclusión e interpretación de los resultados en el contexto de la investigación.

PROBLEMA EJEMPLO ! CONTRASTE DE HIPÓTESIS

Queremos contrastar la hipótesis que supone que la media poblacional en un test de atención de los
estudiantes de la ESO es de 35 puntos. La distribución de la variable en la población es normal con
varianza = 225. Extraemos una muestra aleatoria de 144 alumnos y obtenemos: una media = 32 puntos.
Fijamos un nivel de significación α = 0,05.

Supuestos ! La variable (atención) está medida a nivel de razón. Se distribuye normalmente en la


población. Se trata de una muestra de observaciones aleatorias e independientes.

Hipótesis Estadísticas ! H0: µ = 35 H1: µ ≠ 35 (Contraste Bilateral)


_ __
Estadístico de Contraste ! Z = (Y – µ) / (σ / √ n (varianza poblacional conocida)

Regla de decisión: Nivel de Significación ! (α = 0,05) / Zona de rechazo de la H0 (Contraste


bilateral) ! Todos los valores iguales o menores que Z α/2 = (- 1,96) y todos los valores iguales o
mayores que Z1 – α/2 = (+ 1,96), según la distribución normal.
____
Cálculo del Estadístico de Contraste (datos de la muestra) ! Z = (32 – 35) / (15 / √ 144 = (- 2,4)

Toma de decisión sobre la H0:

# Nivel crítico: Como p = 2 · [Z ≥ |- 2,4 |] = 2 · (0,0082) = 0,0164 es menor que α = 0,05,


rechazamos la hipótesis nula. Por tanto ! 0,0164 cae en la zona de rechazo de la H0.
# Valores críticos: Como (-2,4) < (-1,96) rechazamos hipótesis nula.
# Intervalo de confianza: 32 ± (1,96) · (1,25) = 29,55 < µ < 34,45. Como 35 no está en el intervalo
de confianza se rechaza la H0.

Interpretación de resultados ! Para un nivel de significación α = 0,05, podemos rechazar la


hipótesis nula (la media en atención de los estudiantes de la ESO no es de 35 puntos).

R. MEDRANO (TUTOR) Página 9


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

ERRORES EN LA TOMA DE DECISIONES

Los contrastes de hipótesis están basados en estadísticos (medidas de discrepancia) y tienen una
distribución de probabilidad conocida; así, todas las decisiones llevan aparejadas una probabilidad de
ocurrencia. Al tomar una decisión sobre una H0 pueden darse cuatro situaciones (dos de ellas son
decisiones acertadas y dos erróneas). Siempre debemos proponernos que (1 - α) y (1 - β) sean altos
y que α y β sean bajos.

Decisión Ho (cierta) H1 (cierta)

Acepto H1 ERROR TIPO I DECISIÓN CORRECTA


Probabilidad ! α Probabilidad ! 1 – β
Acepto Ho
DECISIÓN CORRECTA ERROR TIPO II
Probabilidad ! 1 – α Probabilidad ! β

Siempre se cumple ! α + (1 - α) = 1 y β + (1 - β) = 1

Error tipo I (α) ! Bajo la distribución de H0


representa la probabilidad de rechazar una
H0 verdadera = la probabilidad de aceptar
una H1 falsa / (α = probabilidad de cometer
error de tipo I = nivel de significación)

Nivel de confianza (1–α) ! Representa la


probabilidad de aceptar una H0 verdadera =
la probabilidad de rechazar una H1 falsa.

Error tipo II (β) ! Bajo la distribución de H1 cuando aceptamos erróneamente la H0 siendo falsa (β =
probabilidad de cometer error de tipo II)
Potencia de contraste (1–β) ! Representa la probabilidad de rechazar la H0 siendo falsa = la
probabilidad de aceptar una H1 verdadera (probabilidad de obtener un resultado estadísticamente
significativo) 1 – β = Probabilidad de no cometer Error tipo II.

Tamaño del efecto: Expresa la magnitud de la diferencia observada entre la H0 (el valor teórico) y la
H1 (el valor observado)

R. MEDRANO (TUTOR) Página 10


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

TEMA Nº 2 ! CONTRASTE DE HIPÓTESIS EN LOS DISEÑOS DE UNA MUESTRA

1.- TIPOS DE CONTRASTE:

Contrastes paramétricos: Son aquellos que se relacionan con el estudio de un parámetro


poblacional (media, varianza, proporción, correlación, etc.) y la variable de estudio proviene de una
población con una función de densidad de probabilidad conocida. Ejemplo: Determinar si un
parámetro poblacional puede tomar un valor concreto / Determinar si las variables medidas en la
muestra son independientes en la población. Según Amón (1986):

" Las hipótesis recaen sobre los parámetros de la distribución de la variable.


" El nivel de medida es, al menos, de intervalo.
" Los supuestos sobre la forma de la distribución (normalidad) y/o sobre sus parámetros (varianza
conocida, desconocida, etc.) son restrictivos

En general, el contraste paramétrico es más potente que su equivalente no paramétrico.

Contrastes no paramétricos: Son aquellos que no se relacionan con parámetros poblacionales o


se refieren a datos que provienen de una población con una función de densidad de probabilidad
desconocida. Ejemplo: Determinar la forma de distribución de una variable en la población /
Determinar si los datos observados en la muestra son independientes entre sí. Según Amón (1986):

" Nivel de medida inferior al intervalo.


" Solo se establecen supuestos generales sobre la distribución (continuidad, simetría, etc.)

En general, la utilización de contrastes no paramétricos disminuye la potencia de contraste


(probabilidad de aceptar la H1 cuando esta es cierta)

2.- PASOS DE CONTRASTE DE HIPÓTESIS !

Un contraste de hipótesis es un procedimiento para decidir si una hipótesis se acepta como válida
o se rechaza. Los principales pasos para tomar la decisión son:

1. Establecer los supuestos.


2. Formular las hipótesis estadísticas
3. Elección del estadístico de contraste apropiado (discrepancia entre los datos del estadístico de la
muestra y el parámetro planteado en la hipótesis poblacional),
4. Regla de decisión (la distribución muestral del estadístico nos permite fijar los valores críticos que
determinan la zona de rechazo de la H0). El cálculo del estadístico de contraste nos permite
también la determinación del nivel crítico p (probabilidad de que, siendo cierta la H0, obtengamos
unos datos como los observados en la muestra)
5. Conclusión (rechazamos o no la H0 a partir del nivel crítico p, o del valor o los valores críticos)
6. Interpretación (en el contexto de la investigación)

3.- CONTRASTE SOBRE LA TENDENCIA CENTRAL DE LOS DATOS !

MEDIA POBLACIONAL
2
PARAMÉTRICOS CONOCIDA σ
2
DESCONOCIDA σ

NO PARAMÉTRICOS PRUEBA DE LOS SIGNOS


PRIUEBA DE WILCOXON

R. MEDRANO (TUTOR) Página 1


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

CONTRASTES PARAMÉTRICOS SOBRE LA MEDIA POBLACIONAL

Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente sigue una distribución normal
en la población y está medida, al menos, a nivel de intervalo. Podemos conocer o no el valor de la
varianza poblacional (también aplicable a cualquier otro tipo de distribución, con varianza
desconocida, si n ≥ 30, según el Teorema Central del Límite)

Hipótesis Estadísticas: µ0 es el valor concreto de la media poblacional acerca del cual queremos
comprobar si µ es diferente, menor o mayor // Se aconseja formular primero H1

Contraste Bilateral: H0: µ = µo


H1: µ ≠ µo
Contraste Unilateral Izquierdo H0: µ ≥ µo
H1: µ < µo
Contraste Unilateral Derecho H0: µ ≤ µo
H1: µ > µo

Estadístico de contraste:
_ __
Conocida la varianza de la población ! Z = (Y - µ0) / σ / √ n
_ _
Y es la media muestral // σ / √n es el error típico de la media
µ0 es el valor propuesto para la media poblacional por H0
El Estadístico de Contraste sigue la distribución N (0,1)
_ __
Desconocida la varianza de la población ! T = (Y - µ0) / S n-1 / √ n
_
S2n-1 = (Y – Y)2 / n – 1 es la cuasi varianza muestal (estimador insesgado de varianza poblacional)
El Estadístico de Contraste sigue la distribución T de Student con n – 1 gl. (Cuando gl > 30 la
distribución T de Student se aproxima a la normal).
n S2
Relación entre la varianza y la cuasi varianza muestral ! (n-1) S n-1 = n S // Luego S n-1 = ---------
2 2 2

n-1
Intervalo de confianza: _ _
Y + Z α/2 · σ / √n = LS y LI (conocida σ2 poblacional)
_ ______
Y + T n-1; α/2 · Sn-1 / √n = LS y LI (desconocida σ2 poblacional)

CONTRASTES NO PARAMÉTRICOS SOBRE LA MEDIANA POBLACIONAL

PRUEBA DE LOS SIGNOS: Considera que el valor de la mediana bajo la H0 es correcto; por tanto,
en la población, existirán similares valores por encima y por debajo (mismo número de signos
positivos y negativos al calcular la diferencia entre cada valor y la mediana propuesta en la H0)

Supuestos (Razones que justifican su elección): muestra aleatoria de “n” observaciones aleatorias
e independientes de una población con mediana desconocida. Contraste sobre el Promedio
Poblacional. Desconocemos el cumplimiento de los supuestos paramétricos. Asumimos que la
distribución de la variable es continua por lo que no debemos encontrar diferencias nulas, si
aparecen, se descartan). Datos directos, sin agrupar, medidos, al menos, en una escala ordinal.

Hipótesis Estadísticas:
Contraste Bilateral: H0: η = η0
H1: η ≠ η0
Contraste Unilateral Izquierdo H0: η ≥ η0
H1: η < η0
Contraste Unilateral Derecho H0: η ≤ η0
H1: η > η0

η0 es el valor concreto de la mediana poblacional // Se aconseja formular primero la H1

R. MEDRANO (TUTOR) Página 2


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

Estadístico de contraste: (S+ ó S-) se obtienen al restar cada una de las observaciones del valor
de la mediana propuesto por la H0. Si alguna diferencia es nula, se elimina, reduciéndose el tamaño
de la muestra. ____
Cuando la muestra es grande se aproxima a la normal mediante [S+ (ó S-) – n/2] / √ n/4

Distribución muestral del estadístico: modelo binomial con parámetros n = S+ + S- y π = 0’50.

PRUEBA DE WILCOXON: Conocida como “prueba de rangos y signos”, gana en precisión con
respecto a la prueba de los Signos, ya que aprovecha mejor la información disponible; tiene en
cuenta, a la vez, el signo de las diferencias y la magnitud de las mismas. Wilcoxon es una prueba
más precisa.

Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. Se trata de un contraste sobre el Promedio Poblacional.
Desconocemos el cumplimiento de los supuestos paramétricos. La distribución de la variable en la
población ha de ser simétrica y continua. Datos directos, sin agrupar. Nivel de medida de los
datos, al menos, de intervalo.

Hipótesis Estadísticas: similares a la prueba de signos

Cálculo del Estadístico de Contraste: (∑R+ ó ∑R-) suma de rangos positivos y negativos.
Conocemos los datos obtenidos en la muestra // Calculamos las diferencias entre cada observación
y la mediana propuesta por la H0. Se eliminan las diferencias nulas, reduciendo el tamaño muestral
“n” // Estas diferencias, en valor absoluto, se ordenan de menor a mayor, y se sustituye cada una de
ellas por el rango que le corresponde // Si hay empates, se adopta el “criterio del rango medio”; es
decir, se le atribuye a cada una el rango promedio de los rangos que les hubieran correspondido de
ser diferentes // A cada rango se le añade el signo + o – de la puntuación de diferencia
correspondiente y se suman, obteniendo R+ y R-

Distribución muestral del estadístico: distribución de valores de Wilcoxon. Para utilizar la tabla W
de Wilcoxon se selecciona el sumatorio más pequeño y se toma la decisión mediante los valores
críticos.

R. MEDRANO (TUTOR) Página 3


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

PROBLEMAS EJEMPLO
CONTRASTE SOBRE LA MEDIA (VARIANZA POBLACIONAL CONOCIDA)

Supongamos que pertenecemos al consejo regulador de la denominación de origen de los vinos de


Ribera de Duero. Sabemos que los vinos jóvenes de años anteriores tienen un grado alcohólico
medio de 12.5 grados y una varianza de 0´52 y que los datos en la población se ajustan a una
distribución normal N (12´5, 0´5). Para el año actual, el consejo regulador, de acuerdo con todos sus
miembros, ha decidido cambiar algunos de los pasos del proceso de fabricación. El primer problema
que se plantea es: ¿Se ha modificado el grado alcohólico al modificar el proceso de fabricación? La
definición del problema a estudiar nos permite determinar la población que queremos estudiar, los
vinos jóvenes de ribera de Duero en el año actual; la variable que queremos medir, el grado
alcohólico de los mismos, y la hipótesis de trabajo inicial ¿Se ha modificado el grado alcohólico?
Para realizar el contraste de hipótesis, extraemos una muestra aleatoria de 14 observaciones que
aportan una media de 12´529 grados y una cuasi varianza de 0´3382 establecemos un nivel de
confianza del 95%.

Estadístico de contraste: Discrepancia entre


el estimador (muestra) y el parámetro de la H0.

Valores críticos: con α = 0´05 y un contraste


bilateral ! ± 1´96 (región de aceptación)
Decisión estadística: El valor del estadístico
de contraste (0´217) se sitúa en la región de
aceptación (entre los valores críticos); por tanto
aceptamos H0. El nivel crítico (p) asociado al E.
Contraste (0´217) es 2·0´4129 = 0´8258 (1-
0´5871 = 0´4129) que resulta mayor que el
Supuestos: Se trata de una muestra aleatoria nivel de significación fijado (α = 0´05); por
con datos medidos, al menos, en una escala de tanto, aceptamos H0. A partir del intervalo de
intervalo. Asumimos que la variable se confianza, aceptamos H0 (12´5 está incluido)
distribuye normalmente en la población con ___
varianza conocida. 12´529 ± (1´96 · 0´5 / √14 )! (12´27 y 12´79)

Hipótesis: Contraste bilateral H0: µ = 12´5 Conclusión: El cambio en el proceso de


H1: µ ≠ 12´5 fabricación no ha modificado significativamente
Se trata de determinar si los datos de la el grado alcohólico.
muestra arrojan evidencia a favor o en contra Interpretación: Con la información de la que
de la H0. disponemos no hemos encontrado evidencia
suficiente de que la media sea distinta de 12.5

Vamos a plantear otro supuesto que modificaría la definición de las hipótesis ! Sospechamos,
antes de realizar el experimento, que la modificación en el proceso de fabricación aumenta el
grado alcohólico.
Supuestos: Similares; Hipótesis (Contraste unilateral derecho): H0: µ = 12´5 y H1: µ > 12´5
Estadístico de contraste: Similar
Valores críticos: con α = 0´05 y un contraste unilateral derecho ! 1´65
Decisión estadística: El valor del estadístico de contraste (0´217) se sitúa en la región de
aceptación (por debajo del valor crítico 1´65); por tanto aceptamos H0.
El nivel crítico (p): asociado al estadístico de contraste (0´217) es 0´4129 (1-0´5871) que resulta
mayor que el nivel de significación fijado (α = 0´05); por tanto, aceptamos H0
Conclusión: El cambio en la fabricación no ha modificado significativamente el grado alcohólico.
Interpretación: Con la información de la que disponemos no hemos encontrado evidencia
suficiente de que la media no sea igual a 12.5

R. MEDRANO (TUTOR) Página 4


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

CONTRASTE SOBRE LA MEDIA (VARIANZA POBLACIONAL DESCONOCIDA)

Siguiendo con el ejemplo del grado alcohólico de los vinos de la denominación de origen de
Ribera de Duero, los resultados del contraste bilateral desconocida la varianza de la población
(suponiendo que no nos hubieran facilitado este parámetro), serían:

Estadístico de contraste: Discrepancia entre el


estimador (muestra) y el parámetro de la H0.

Valores críticos: con α = 0´05 y un contraste


bilateral ! t18 gl = ± 2´101 (región aceptación)

Decisión estadística: El valor del estadístico de


contraste (0´316) se sitúa en la región de
Supuestos: Se trata de una muestra aceptación (entre los valores críticos); por tanto
aleatoria con datos medidos, al menos, en aceptamos H0. El nivel crítico (p) asociado al E.
una escala de intervalo. Asumimos que la Contraste (0´316) es aproximadamente (1-0´65 =
variable se distribuye normalmente en la 0´35) ! 0´35 · 2 = 0´7 > 0´05 (Aceptamos H0). A
población con varianza desconocida. partir del intervalo de confianza, aceptamos H0
(12´5 está incluido)
___
Hipótesis: Contraste bilateral H0: µ = 12´5 12´529 ± (1´96 · 0´338 / √14 )! (12´35 y 12´705)
H1: µ ≠ 12´5
Conclusión: El cambio en el proceso de
Se trata de determinar si los datos de la fabricación no ha modificado significativamente el
muestra arrojan evidencia a favor o en contra grado alcohólico.
de la H0. Interpretación: Con la información de la que
disponemos no hemos encontrado evidencia
suficiente de que la media sea distinta de 12.5

CONTRASTES NO PARAMÉTRICOS (PRUEBA DE LOS SIGNOS Y PRUEBA DE WILCOXON)

En la figura se muestra como para distribuciones


asimétricas es mucho más intuitiva la comparación de
las medianas que la comparación de las medias, ya que
estas están afectadas por los valores muy extremos de
la distribución.

Problema ejemplo: Una determinada empresa utiliza, desde hace muchos años, un test de aptitudes
para seleccionar a sus empleados. Para dicho test tiene establecido que la mediana está en 180. El
psicólogo de la empresa quiere probar que efectivamente la mediana sigue siendo correcta (probar la
H0 de que la mediana en la población es igual a 180). Para ello obtiene una muestra de 15
trabajadores y les aplica el test obteniendo los siguientes resultados:

189 233 195 160 212 176 231 202 193 174 166 248 199 213 185

Suponemos que la variable en la población es simétrica y continua (medida en una escala de


intervalo) y que no sabemos nada acerca de la forma de la población. Con estos datos y
únicamente con fines pedagógicos aplicaremos las pruebas de los Signos y la de Wilcoxon (sería
directamente aplicable Wilcoxon).

R. MEDRANO (TUTOR) Página 5


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

Supuestos # Muestra aleatoria de n = 15 observaciones. Distribución de la variable en la población


(simétrica y continua). Nivel de medida de los datos, al menos, escala de intervalo.

Hipótesis (C. Bilateral) # H0: η = 180 y H1: η ≠ 180 // α = 0,05

Estadísticos de Contraste: #
Signos: Previamente ordenamos las puntuaciones (la mediana es un índice de posición). Restando
180 a cada una de las 15 puntuaciones obtenidas por los sujetos, obtenemos 11 (S+) y 4 (S-)

160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
- - - - + + + + + + + + + + + SIGNOS

Probabilidad binomial con n = 15 (participantes) y p = 0´5 (probabilidad de éxito si la H0 es cierta)

Wilcoxon: Más precisa. Después de ordenar las puntuaciones de menor a mayor y ordenar las
diferencias con la mediana en valor absoluto, obtenemos:

160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
-4 5 -6 9 13 -14 15 19 -20 22 32 33 51 53 68 ORDEN
- + - + + - + + - + + + + + + SIGNOS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 RANGOS

Sumando los rangos cuyas diferencias tienen valor positivo y negativo:


R+ (2+4+5+7+8+10+ 11+12+13+14+15 = 101) y R- (1+3+6+9 = 19)
Utilizaremos como estadístico W ! R- (1+3+6+9 = 19) dado que es el más pequeño ! W = 19

Decisión estadística:
Signos: Función de distribución Binomial (Tabla II); para n = 15 y probabilidad = 0,50, encontramos el
valor 0,0592 ! P (S- ≤ 4) = 0,0592. Para averiguar el nivel crítico p, multiplicamos por 2 la
probabilidad asociada al estadístico de contraste (0´0592 · 2 = 0´1184) dado que es bilateral.
Wilcoxon: Tablas ! para un contraste bilateral con α/2 = 0,025 y n = 15; el valor crítico es ! 26

Conclusión:
Signos: Como p (0´1184) es mayor que α (0,05) Mantenemos H0. También tabla (Test de signos dos
direcciones) para n =15 y α = 0,05, y un contraste bilateral, el valor crítico es igual a 3 ! como S- = 4 >
3 (Mantenemos H0)
Wilcoxon (más precisa): Como 19 (se toma la suma menor) < 26 ! Rechazamos la H0
Interpretación:
Signos: Teniendo en cuenta los resultados, es posible seguir manteniendo que la Mediana de la
población de referencia es 180, con un α = 0,05.
Wilcoxon: Teniendo en cuenta los resultados, no es posible seguir manteniendo que la Mediana de la
población de referencia es 180, con un α = 0,05.

R. MEDRANO (TUTOR) Página 6


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

4.- CONTRASTE SOBRE LA VARIANZA POBLACIONAL !

Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente sigue una distribución normal y
está medida, al menos, a nivel de intervalo.

Hipótesis Estadísticas:
2 2
Contraste Bilateral: H0: σ = σ 0
2 2
H1: σ ≠ σ 0
2 2
Contraste Unilateral Izquierdo H0: σ ≥ σ 0
2 2
H1: σ < σ 0
2 2
Contraste Unilateral Derecho H0: σ ≤ σ 0
2 2
H1: σ > σ 0

σ20 es el valor concreto de la varianza poblacional acerca del cual queremos comprobar si la
varianza poblacional es diferente, menor o mayor // Se aconseja formular primero H1.

Estadístico de contraste ! X2 = (n-1) S2n-1 / σ20

σ2o es el valor propuesto para la varianza poblacional por H0 y S2n-1 = la cuasi varianza muestral. El
Estadístico de Contraste sigue una distribución Chi-Cuadrado con (n-1) gl.

(n-1) S2e (n-1) S2e


Intervalo de confianza ! 2
---------------- < σ < -----------------
X2 (n-1) (1-α/2) X2 (n-1) α/2

Si el contraste se hace a partir de la varianza poblacional, se sustituye (n-1) por n.

5.- CONTRASTE SOBRE LA PROPORCIÓN POBLACIONAL !

Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente es dicotómica.La proporción es
el cociente entre el número de veces que aparece la observación dividido entre el número total de
observaciones)

Hipótesis Estadísticas:
Contraste Bilateral: H0: π = π0
H1: π ≠ π0
Contraste Unilateral Izquierdo Ho: π ≥ π0
H1: π < π0
Contraste Unilateral Derecho H0: π ≤ π0
H1: π > π0

π0 es el valor concreto de la proporción poblacional acerca del cual queremos comprobar si la


proporción poblacional es diferente, menor o mayor // Se aconseja formular primero H1
____________
Estadístico de contraste: Z = (P - π0) / √ (π0 (1 - π0) / n

P es la proporción muestral de la característica que interesa.


π0 es el valor propuesto para la proporción poblacional por la H0.
σ0 es el error típico de la distribución muestral de la proporción.

El Estadístico de Contraste sigue la distribución N (0,1) cuando “n” es suficientemente grande, lo


que significa que “n · p” > 5 ó n = 25. Cuando no se cumple esta condición (muestras pequeñas), se
utiliza la distribución binomial.
____________
Intervalo de Confianza ! P ± |Zα/2| √ (π0 (1 - π0) / n

R. MEDRANO (TUTOR) Página 7


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

PROBLEMAS EJEMPLO

Contraste de hipótesis sobre la varianza: Los resultados de un reciente estudio indican que 81
estudiantes de primero de Psicología de la UNED, elegidos mediante muestreo aleatorio simple,
estudian una media de 6 horas a la semana, con una cuasi desviación típica de 3. La población
universitaria europea estudia, también, una media de 6 horas a la semana, pero con una desviación
típica de 2. Queremos saber si la variabilidad encontrada en nuestra muestra es estadísticamente
diferente de la de la población de estudiantes europeos. Trabajaremos a un nivel de confianza del
95 %.
_
Supuestos: Muestra aleatoria de 81 estudiantes de la UNED (X = 6 y SX = 3). Datos de la población
de estudiantes europea (µ = 6 y σ = 2) para α = 0,05. La variable dependiente está medida, al
menos, a nivel de intervalo. Se plantea un CH sobre la varianza.

Hipótesis: Contraste bilateral (resultado estadísticamente diferente). Las hipótesis siempre se


plantean sobre la población (la población universitaria europea tiene una σ = 2; luego la varianza de
la población a contrastar será ! σ2 = 4. Luego ! H0: σ2 = 4; H1: σ2 ≠ 4

Estadístico de contraste: χ2 = (n – 1) S2n-1 / σ20 ! χ2 = 80 · 9 / 4 = 180

Decisión estadística:
$ A partir de los valores críticos (80 gl; α/2 = 0,025 y 1-α/2 = 0,975) ! 57´15 y 106´63.
Rechazamos la H0 porque el valor muestral del estadístico de contraste (180) > el valor
crítico superior (χ2 = 106´63)
$ Si tenemos en cuenta el nivel crítico p (χ2 = 180 con 80 gl ! encontramos que p es < 0´005)
y dado que p < α (0´05) ! Rechazamos H0.
$ Considerando el intervalo de confianza: Rechazamos H0 (σ2 = 4 no está en el intervalo)
80 · 9 80 · 9
Intervalo de confianza ! ---------------- < σ2 < ----------------- (6´75 y 12´61)
106´63 57´11

Conclusión e interpretación: Dado que hemos rechazado la H0 con α = 0,05 ! La variabilidad en


el tiempo de estudio que emplean los estudiantes de Psicología de 1º de la UNED no es igual que la
variabilidad en el tiempo de estudio semanal de la población universitaria europea.

Contraste de hipótesis sobre la proporción (Febrero 2008): Se quiere conocer la postura de la


población española frente a la inmigración ilegal. Se fija α = 0´04, se extraen aleatoria e
independientemente 750 españoles y se les pide que manifiesten si están a favor o en contra. De los
750 españoles, 435 se manifiestan en contra y 315 a favor. Se desea estudiar si son compatibles
estos resultados con la hipótesis que establece que las 3/5 partes de la población española están en
contra de la inmigración ilegal.

Supuestos: Variable dependiente ! postura de la población española frente a la inmigración ilegal


(a favor o en contra). Se trata de una variable cualitativa dicotómica.
P = (435/750 = 0´58); se cumple (n·p > 5)! (750 · 0´58 = 435) Muestra grande (aproximación a la
normal ! CH Proporción

Hipótesis: Contraste bilateral (no se especifica ninguna dirección a favor o en contra). Sabemos
que π = 3/5 = 0,6 y la hipótesis nula se centra si nuestros datos son compatibles con este resultado
(teóricamente poblacional). Luego ! H0: π = 0´6; H1: π ≠ 0´6

Estadístico de contraste: Nuestra proporción es ! 435/750 = 0´58. Con estos datos aplicamos la
fórmula del estadístico de contraste ! Z = (0´58 – 0´6) / (√ 0´6·0´4 / 750) = - 0´02 / 0´0179 = - 1´12.

Valores críticos: Al tratarse de un contraste bilateral deben ser dos valores. Buscando en las tablas
de la curva normal con α = 0´04 (bilateral α/2 = 0´02 y 1-α/2 = 0´98) encontramos las puntuaciones
típicas (- 2´05 y 2´05)

R. MEDRANO (TUTOR) Página 8


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

Decisión estadística:
$ Teniendo en cuenta los anteriores valores críticos (- 2´05 y 2´05), Aceptamos la H0 porque el
valor muestral del estadístico de contraste (- 1´12) > el valor crítico inferior (- 2´05)
$ Si tenemos en cuenta el nivel crítico p (Z (-1´12) = 0´1314; luego 2 · 0´1314 = 0´2628). Como p
(0´2628) > que α (0´04) ! Aceptamos H0.
$ Considerando el intervalo de confianza: Aceptamos H0 (0´6 está en el intervalo)
____________ __________________
P ± |Zα/2| √ (π0 (1 - π0) / n ! 0´58 ± 2´05 √ (0´58 (1 – 0´58) / 750 = (0´543 y 0´617)

Conclusión e interpretación: Dado que hemos aceptado la hipótesis nula (π = 0´6) podemos
afirmar que el 60% de la población española están en contra de la inmigración ilegal; por tanto, el
40% estará a favor.

6.- CÁLCULO DE LA POTENCIA DE CONTRASTE !

Potencia de contraste (1–β): Representa la probabilidad de rechazar la H0 siendo falsa = la


probabilidad de aceptar una H1 verdadera (probabilidad de obtener un resultado estadísticamente
significativo). 1 –β = Probabilidad de no cometer Error tipo II. La disminución de (α = Error de tipo I
provoca un aumento automático de β = Error tipo II)

Problema ejemplo: La aplicación de un test entre docentes tiene, por experiencias anteriores, una
media de 55 y una varianza de 121, N (55, 121). Un psicólogo educativo considera que en la actualidad
el promedio se ha incrementado, pasando a ser de 60 puntos. Para contrastar esta hipótesis somete al
test a 50 individuos extraídos aleatoriamente de la población y obtiene una media de 58. Fijando un
nivel de significación α = 0,01. ¿Puede aceptarse la hipótesis del psicólogo?

Hipótesis estadísticas (contraste unilateral derecho): H0: µ0 = 55 y H1: µ1 > 55 (µ1 = 60)

Descripción de la variable y de los datos muestrales: Variable medida a nivel de intervalo, distribución
normal, con varianza conocida N (55, 121) y observaciones aleatorias e independientes.

Estadístico de contraste y cálculo: Bajo la H0: µ0 = 55, tipificamos la media muestral = 58.
_ ___
Z = (Y – µ0) / σY ! Z = (58 - 55) / (11 / √ 50) = 1,93
Decisión estadística:
$ A partir del valor crítico (para α = 0,01. Se trata de un contraste unilateral, acumula α en una
sola cola ! Z = 2,33). Como 1´93 (valor del estadístico de contraste) < 2´33 (valor crítico) ! Se
acepta la H0.
$ A partir del nivel crítico p (al valor del estadístico de contraste 1´93 le corresponde en las tablas
una probabilidad de p (Z < 1,93) = 0,9732 ! 1-0´9732 = 0´0268). Al tratarse de un contraste
unilateral p = 0´0268 > α = 0´01; Por tanto, Se acepta la H0

R. MEDRANO (TUTOR) Página 9


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

Interpretación de los resultados: Para un nivel de significación α = 0,01, no podemos afirmar que la
media poblacional se ha incrementado en la actualidad.

¿Cuál es la probabilidad de cometer error tipo II? (Rechazar la H1 siendo cierta)

Bajo la Hipótesis nula (H0: µ0 = 55) se determina el límite entre la región de aceptación y rechazo
(Contraste unilateral derecho)
_ -----------------------------------|-----
Z = (Yc – µ0) / σY ! Z = 2,33 Z = (Yc - 55) / (11 / √50); Yc = 58,62

Se busca la (Z) que corresponde al valor 58,62 en la distribución de la H1 ! (H1: µ1 = 60)

_ ------------------|------------------------------
Z = (Yc – µ1) / σY Z = (58,62 - 60) / (11 / √50); Z = (- 0,89)

Probabilidad de obtener una Z ≤ (- 0,89) ! Z (-0,89) = 0,1867 ! β = 0,1867 (error tipo II)
Potencia de Contraste ! (1 – β) = 0,8133

R. MEDRANO (TUTOR) Página 10


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

TEMA Nº 3 ! ANÁLISIS DE DATOS PARAMÉTRICOS PARA DISEÑOS DE DOS GRUPOS

TIPOS DE MUESTRAS

Muestras independientes: n1 y n2 muestras de sujetos diferentes, extraídos aleatoriamente de sus


respectivas poblaciones.
Muestras relacionadas: se trata de los mismos n sujetos observados en condiciones experimentales
diferentes, o n pares de sujetos semejantes entre sí (gemelos, hermanos,...)

CONTRASTES DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES

Poblaciones normales N (0, 1)

Medias distintas y varianzas iguales Medias iguales y varianzas distintas

CONTRASTE DE HIPÓTESIS

VARIANZAS POBLACIONALES CONOCIDAS


SOBRE DOS MEDIAS VARIANZAS POBLACIONALES DESCONOCIDAS
(PARAMÉTRICOS) Y SUPUESTAMENTE IGUALES
VARIANZAS POBLACIONALES DESCONOCIDAS
Y SUPUESTAS DISTINTAS

SOBRE DOS MEDIANAS TEST DE MANN-WHITNEY-WILCOXON


(NO PARAMÉTRICOS)

SOBRE DOS VARIANZAS DIFERENCIA DE VARIANZAS

DIFERENCIA PROPORCIONES VALOR IGUAL A CERO


SOBRE DOS
PROPORCIONES DIFERENCIA PROPORCIONES VALOR DISTINTO DE CERO

Pasos para realizar el contraste de hipótesis:

1. Establecer los supuestos.


2. Formular las hipótesis estadísticas
3. Elección del estadístico de contraste apropiado
4. Regla de decisión (la distribución muestral del
estadístico nos permite fijar los valores críticos que
determinan la zona de rechazo de la H0). El cálculo del
estadístico de contraste nos permite también la
determinación del nivel crítico p (probabilidad de que,
siendo cierta la H0, obtengamos unos datos como los
observados en la muestra). También podemos utilizar el
intervalo de confianza.
5. Conclusión (rechazamos o no la H0 a partir del nivel
crítico p, o del valor o los valores críticos)
6. Interpretación (en el contexto de la investigación)

R. MEDRANO (TUTOR) Página 1


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

CONTRASTES DE HIPÓTESIS PARA DOS MEDIAS

" Observaciones independientes


Supuestos " Nivel de medida de intervalo o razón
" Distribuciones normales en la población ó (n1 ≥ 30 y n2 ≥ 30)

Varianzas población Desconocidas Desconocidas


conocidas Supuestamente iguales Supuestamente distintas
Hipótesis (homocedasticidad)
(Iguales en
los C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo
Tres casos) H0 : µ1-µ2 = 0 H0 : µ1-µ2 ≤ 0 H0 : µ1-µ2 ≥ 0
H1 : µ1-µ2 ≠ 0 H1 : µ1-µ2 > 0 H1 : µ1-µ2 < 0

Estadístico
de
Contraste

Distribución Normal Tipificada “t” de Student


Muestral N (0, 1) gl = n1 + n2 - 2

Conocida (Z) o desconocida (t) la varianza de la población (valor o valores críticos)

Regla (C. Bilateral) ! t ≤ t α / 2; n-2 y t ≥ t1 - α / 2; n-2 // Z ≤ Z α / 2 y Z ≥ Z 1 - α / 2


decisión (C. Unilateral Izquierdo) t ≤ t α; n-2 // Z ≤ Z α
(C. Unilateral Derecho) t ≥ t 1 – α; n-2 // Z ≥ Z 1 – α

Nivel crítico p ! Se rechaza H0 si p < α y se acepta si p > α

PROBLEMAS EJEMPLO (CH diferencia de Medias)

Dos centros de Educación Especial vienen utilizando, desde hace dos años, métodos diferentes
para estimular las funciones superiores de los niños con retraso mental. El director de uno de los
centros sostiene que su método (Método A) logra mejores resultados que el del otro centro (Método
B). Para estudiar esta cuestión, fijamos α = 0,03, extraemos aleatoria e independientemente dos
muestras de niños, una en cada centro (nA = 120 y nB = 50) y les medimos el cociente intelectual (CI)
en una escala de intervalo. Los niños de ambos centros iniciaron el programa de estimulación con
un CI medio igual a 70 y los CI medios tras el programa fueron 79 para los niños estimulados con el
método A y 74 para los estimulados con el método B. La distribución de los CI es normal en las
poblaciones con σA = 18 y σB = 12 y todas las observaciones son independientes entre sí.

Supuestos: Se trata de contrastar las medias de dos muestras independientes (varianzas


poblacionales conocidas); Distribución Normal de los CI en ambas poblaciones; Variable
dependiente medida a nivel de intervalo.

Hipótesis: Planteamos un contraste unilateral derecho (queremos probar si el método A es más eficaz)

H0: µA - µB ≤ 0 H1: µA - µB > 0 También ! H0: µA ≤ µB H1: µA > µB

Estadístico de contraste: Conocidas las varianzas poblacionales.


_ _ ________________ ___________________
Z = (Y1 – Y2) / √ (σ21 / n1) + (σ22 / n2) ! Z = (79 – 74) / √ (324 / 120) + (144 / 50) = 2,12

R. MEDRANO (TUTOR) Página 2


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

Sigue una distribución Normal tipificada N (0, 1)

Regla de decisión:

Valores críticos (para un nivel de confianza del 97% y un contraste unilateral, el valor crítico es !
Z0´97 = (1´88)
Nivel crítico p (el estadístico de contraste 2´12 se asocia a una probabilidad p = P (Z ≥ 2,12)
! 1 – 0,983 = 0,017

Conclusión: Se rechaza H0 [el estadístico de contraste 2´12 > 1´88 (valor crítico) y también p =
0,017 (nivel crítico) < α = 0,03 (nivel de significación)].

Interpretación: El programa de estimulación del CI ha sido eficaz con un nivel de confianza del
97% (mejor el método A que el método B)

Intervalo de confianza: Para realizarlo suponemos que se trata de un contraste bilateral; por tanto,
habría que reformular las hipótesis:
_ _
(Y1 – Y2) ± | Z α/2 | · Error típico ! Límite superior y Límite inferior

(79 – 74) ± (0,03/2 = Z (-2´17) · 2,36 (denominador e. contraste) = 5 ± 5´12 ! (- 0´12 y 10´12)

Decisión: Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la
diferencia de medias en la población puede tomar ese valor

En una investigación psicopedagógica se pasó la misma prueba de nivel de lectura a dos grupos de
niños: los participantes habían sido elegidos de forma aleatoria de entre los alumnos de EGB de dos
provincias españolas. Los datos se muestran en la tabla. La variable se midió en una escala de
intervalo y se supone que σ2A = σ2B

TAMAÑO MEDIA VAR. INSESGADA


PROVINCIA A 121 40 7
PROVINCIA B 61 38 6

Supuestos: Disponemos de dos muestras independientes (dos grupos de niños) que se someten a
una prueba de lectura. La variable dependiente medida a nivel de intervalo. Varianzas
poblacionales desconocidas y supuestamente iguales (σ2A = σ2B). Muestras grandes (121 y 61).

Contraste las hipótesis para las medias (muestras independientes)

Hipótesis: Planteamos un contraste bilateral para ver si las diferencias se deben al azar.

(H0: µA – µB = 0 y H1: µA – µB ≠ 0) // También ! H0: µA = µB y H1: µA ≠ µB)

Estadístico de contraste: Aplicamos el E. de Contraste para la diferencia de medias. Desconocidas


las varianzas de la población (supuestamente iguales) :
_ _
T = (Y1 – Y2) / Error típico ! T = (40 – 38) / 0,408 = 4,90

_________________________________________________
Error típico = √[( n1 – 1) S21 + (n2 – 1) S22 / (n1 + n2 – 2)] · (1 / n1 ) + (1 / n2 )
______
Error típico = √0´1665 = 0,408

Sigue una distribución t de Student con n1 + n2 – 2 grados de libertad.

R. MEDRANO (TUTOR) Página 3


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

Regla de decisión:

Valores críticos (tabla t de Student con 121 + 61 – 2 = 180 grados de libertad y α = 0,05). Se trata
de un contraste bilateral y son muestras grandes; por tanto, utilizamos Z0´025 (- 1´96) y Z0´975 = (1´96)
Nivel crítico p (el estadístico de contraste 4´90 se asocia a una probabilidad < 0´0005 que es más
pequeña que α)

Conclusión: Rechazamos H0 (el estadístico de contraste 4´90 no está entre los valores críticos ±
1´96 y de igual forma, considerando el nivel p crítico, p < α)

Interpretación: El rendimiento medio en la prueba de lectura no es igual en los dos grupos con un
nivel de significación α = 0,05.

Intervalo de confianza:
_ _
(Y1 – Y2 ) ± | tα (n1 + n2 – 2) | · Error típico = (Límites inferior y superior)

(40 – 38) ± 1´96 · 0´408 = 2 ± 0´8 = (1´2 y 2´08) ! Rechazamos H0 (el intervalo de confianza no
contiene el valor 0, luego asumimos que la diferencia de medias en la población no puede tomar
ese valor)

Distintos estudios muestran que la relajación es eficaz para reducir la ansiedad precompetitiva.
Siguiendo esta línea de investigación y habiendo hipotetizado una reducción de la ansiedad en las
escaladoras tratadas con relajación, extraemos aleatoria e independientemente 12 escaladoras y
les asignamos aleatoriamente a las dos condiciones del experimento: la mitad de las escaladoras se
somete a un programa de relajación durante seis meses y la otra mitad no realiza ningún tipo de
relajación (suponemos que las poblaciones se distribuyen normalmente con distinta varianza). Al
finalizar el programa de relajación, medimos la ansiedad precompetitiva de todas las escaladoras,
obteniendo una ansiedad media de 8 y una varianza insesgada de 150 en el grupo “sin relajación” y
una ansiedad media de 6´5 y una varianza sesgada de 100 en el grupo “con relajación”. El nivel de
significación alfa se fijó en 0,05, la variable dependiente está medida a nivel de intervalo y a mayor
puntuación mayor ansiedad. ¿Podemos afirmar que realmente la ansiedad precompetitiva de las
escaladoras se reduce utilizando técnicas de relajación?

Supuestos: 12 escaladoras en un experimento con dos condiciones: 6 escaladoras “sin relajación”


y 6 “con relajación”. Variable dependiente (ansiedad) medida a nivel de intervalo. Poblaciones con
distribución normal ! Contraste de hipótesis para dos muestras Independientes (desconocidas
las varianzas poblacionales y supuestas distintas)

Hipótesis: Siguiendo a los investigadores planteamos un contraste unilateral derecho.

H0 : µ1 - µ2 ≤ 0 H1 : µ1 - µ2 > 0 // // También ! H0: µ1 ≤ µ2 y H1: µ1 > µ2)

Estadístico de contraste: Contraste de medias, desconocidas las varianzas (supuestas distintas)


_ _
T = (Y1 – Y2) / Error típico ! (8 - 6´5) / 6´23 = 0´24
_______________
Donde ! Error típico = √ Ŝ21 / n1 + Ŝ22 / n2

Cálculos adicionales (Medias y Varianzas insesgadas) !


_ _
YSR = 8 Ŝ2 SR = 150 (insesgada) YR = 6,5 Ŝ2 R = 83 (insesgada)

Donde ! S2 R = 100 (sesgada) = (5 / 6) · 100 ! 83


_____________ __________
Error Típico de la diferencia ! √150 / 6 + 83 / 6 ! √25 + 13´83 = 6´23

R. MEDRANO (TUTOR) Página 4


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

(150 / 6 + 83 / 6)2
gl = ----------------------------------------------------- =
[(150 / 6)2 / (6 – 1) + (83 / 6)2 / (6 – 1)

gl = 1507´77 / 163´27 = 9´23 ≈ 9 (valor < t = n1 + n2 – 2)

Regla de decisión:
Valor crítico para α = 0,05 ! Según la tabla t de Student (contraste unilateral derecho), con 9 gl
encontramos el valor ! t9; 0´05 = 1´833
Nivel crítico p ! el valor del E. Contraste T = 0´24, con 9 gl se encuentra entre 0´55 < p < 0´60

Conclusión e interpretación: Se acepta H0 para un nivel de confianza del 95%. Según el valor
crítico (contraste unilateral derecho) T (0´24) < 1´833 ! Aceptamos H0.
Según el nivel p crítico (0´55 < p < 0´60) > que el valor de α = 0,05. La ansiedad precompetitiva de
las escaladoras no disminuye utilizando técnicas de relajación.

CONTRASTES DE HIPÓTESIS DOS MEDIANAS (TEST DE MANN-WHITNEY-WILCOXON)

Supuestos " Variable dependiente con un nivel de medida ordinal o superior


" Dos poblaciones con distribuciones similares (misma forma) en la población

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hipótesis H0 : µ1-µ2 = 0 H0 : µ1-µ2 ≤ 0 H0 : µ1-µ2 ≥ 0
H1 : µ1-µ2 ≠ 0 H1 : µ1-µ2 > 0 H1 : µ1-µ2 < 0

1.- Asignamos rangos a todas las puntuaciones (muestra 1 y muestra 2) como si


formaran un único grupo.
2.- Calculamos las sumas de rangos para las puntuaciones procedentes de cada
Estadístico una de las muestras (S1 para la primera muestra y S2 para la segunda muestra)
Contraste 3.- Calculamos los siguientes valores:

U1 = S1 - ½ n 1 (n1 + 1) // U2 = S2 - ½ n 2 (n2 + 1)

El estadístico de contraste “U” es el menor de U1 ó U2

Distribución
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon

Conocida (Z) o desconocida (t) la varianza de la población (valor o valores críticos)

Regla (C. Bilateral) ! U > un1, n2; α/2


decisión (C. Unilateral Izquierdo) ! U < un1, n2; α
(C. Unilateral Derecho) ! U > un1, n2; α

Nivel crítico p ! Se rechaza H0 si p < α y se acepta si p > α

Aproximación (Ui) – [(n1 · n2) / 2]


A la Normal Z = -------------------------------
√ n1 n2 (n1 + n2 + 1) / 12

R. MEDRANO (TUTOR) Página 5


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

PROBLEMA EJEMPLO

En una investigación de Psicología Social sobre valores, se han extraído dos muestras aleatorias de
personas. Una muestra se extrajo de una región del interior de la Península (n=5) y la otra de la
costa (n=6). Los participantes cumplimentaron un cuestionario de xenofobia, que ofrece
puntuaciones en una escala ordinal, obteniendo los resultados que se presentan en la Tabla 1 (a
mayor puntuación mayor xenofobia). Se desea saber si la tendencia central de los habitantes de la
costa es más baja que la de los del interior. Se asume que las distribuciones de la variable en las
dos poblaciones tienen la misma forma (si difieren sólo lo hacen en su tendencia central)

Interior 6 14 10 18 20
Costa 16 12 4 8 2 22

Supuestos: Se trata de dos muestras independientes (personas de la península y personas de la


costa). Puntuaciones del cuestionario en escala ordinal. Las distribuciones de la VD en las
poblaciones tienen la misma forma y, si difieren, lo hacen sólo en su tendencia central.

Hipótesis: La hipótesis nula siempre es aquella que afirma lo contrario de lo que el investigador
desea probar. Desea probar que la tendencia central (contraste no paramétrico, mediana) en
habitantes de la costa es menor que en habitantes del interior. Contraste unilateral izquierdo

Hipótesis de la que parte el investigador ! H1: η C < η P


Hipótesis nula (negación de la anterior) ! H0: η C ≥ η P

Estadístico de contraste:

1º.- Ordenamos el total de las puntuaciones de menor a mayor (puntuaciones de interior en negrita)

2 4 6 8 10 12 14 16 18 20 22

2º.- Asignamos rangos (vemos que no hay empates):

2 4 6 8 10 12 14 16 18 20 22
1 2 3 4 5 6 7 8 9 10 11

3º.- Sumamos los rangos de cada grupo: Rangos de interior (negrita) S1 = 3+ 5+ 7+ 9 +10 = 34
Rangos de costa S2 = 1+2+4+6+8+11 = 32

4º.- Aplicamos las fórmulas del estadístico de contraste (U):


U1 = S1 - ½ n 1 (n1 + 1) ! U1 = 34 – (2´5 · 6) = 19
U2 = S2 - ½ n 2 (n2 + 1) ! U2 = 32 – (3 · 7) = 11

Elegimos como estadístico de contraste el valor inferior de U (U2 = 11)

Regla de decisión:

Si consideramos como estadístico de contraste la suma de rangos, el estadístico de contraste es W


= 34 (se elige la muestra 1 porque es la que tiene menor número de sujetos. El nivel crítico p del
estadístico W de MWW se encuentra en la Tabla A.7 ! buscamos n1 = 5 y n2 = 6. El nivel crítico es
el valor de probabilidad que tiene nuestro estadístico muestral. Como W = 34, vemos que p = 0.268

Conclusión: Dado que el nivel crítico p (0´268) es mayor que α (0´05) ! Aceptamos H0

Interpretación: Las distribuciones del interior y las de la costa no difieren en cuanto a las medianas
en sus apreciaciones sobre la xenofobia.

R. MEDRANO (TUTOR) Página 6


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

CONTRASTES DE HIPÓTESIS DOS PROPORCIONES

Supuestos " Observaciones independientes


" Variable dependiente dicotómica o dicotomizada
" n ≥ 30

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hipótesis H0 : π1- π2 = D H0 : π1- π2 ≤ D H0 : π1- π2 ≥ D
H1 : π1- π2 ≠ D H1 : π1- π2 > D H1 : π1- π2 < D

D=0 D≠0
_____________________
Z = (P1 – P2 ) - 0 / √ P (1 - P ) · (1 / n1 ) + (1 / n2 ) ___________________________
Estadístico Z = (P1 – P2) - λ. / √ P1 (1 – P1 ) / n1 + P2 (1 – P2 ) / n2
Contraste Donde P = (n1 · P1 ) + (n2 · P2 ) / (n1 + n2 )

Distribución
Muestral Normal tipificada N (0, 1)

Conocida (Z) o desconocida (t) la varianza de la población (valor o valores críticos)

Regla (C. Bilateral) ! Z ≤ Z α/2 y Z ≥ Z 1-α/2


decisión (C. Unilateral Izquierdo) ! Z ≤ Z α
(C. Unilateral Derecho) ! Z ≥ Z 1 – α

Nivel crítico p ! Se rechaza H0 si p < α y se acepta si p > α

Intervalo (P1 – P2 ) ± | Zα | · Error típico = (Límites inferior y superior)


confianza

PROBLEMAS EJEMPLO

El grado de dificultad de las preguntas de un test se suele medir por el número de los sujetos que
los aciertan, o más exactamente, por la proporción de aciertos. Para averiguar si dos preguntas de
un determinado test de aptitud general difieren en dificultad, hemos seleccionado una muestra
aleatoria simple de 200 sujetos y los hemos repartido aleatoriamente en dos grupos de 100. Un
grupo de sujetos ha respondido a la pregunta 1 y el otro a la pregunta 2. La pregunta 1 la han
acertado 70 sujetos y la 2 la han acertado 60. El nivel de significación α se fijó en 0,05.

Supuestos: Tenemos una muestra aleatoria de n = 200 sujetos, repartidos en dos grupos
independientes de 100 (cada uno responde a una pregunta y se considera el acierto o el error !
variable dicotómica). Se fija α = 0,05. Se dan los supuestos para realizar un Contraste de
Proporciones al comparar el grado de dificultad de las dos preguntas del test.

Hipótesis: Planteamos un contraste bilateral para ver si las preguntas difieren en dificultad.

H0: π1 = π2 // H1: π1 ≠ π2

Estadístico de contraste: La hipótesis se establece sobre una diferencia nula D = 0)


________________________
Z = (P1 – P2 ) / √ P (1 - P ) · (1 / n1 ) + (1 / n2 ) // Donde P = (n1 · P1) + (n2 · P2) / (n1 + n2)

R. MEDRANO (TUTOR) Página 7


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

Cálculos previos: Aciertos ! G1 = 70 / 100 = 0,7 / G2 = 60 / 100 = 0,6

P = (n1 · G1) + (n2 · G2) / (n1 + n2) ! (100 · 0,7) + (100 · 0,6) / (100 + 100) = 0,65
_______________________________
Z = (0,7 – 0,6) / √ 0,65 (1 – 0,65) · (1 / 100) + (1 / 100) = 1,48

Sigue una distribución Normal tipificada N (0, 1)

Regla de decisión:

Valores críticos (para un nivel de confianza del 95% y un contraste bilateral, los valores críticos
son ! ± 1´96 ! Z0´025 (- 1´96) y Z0´975 = (1´96)
Nivel crítico p [el estadístico de contraste (Z = 1,48) en la tabla de la curva normal deja por debajo
0,9306] ! Probabilidad (Z ≥ 1,48) = 1 - 0,9306 = 0,0694; al ser bilateral ! 2 · 0,069 = 0,1388.

Conclusión: Aceptamos H0 (el estadístico de contraste 1´48 está entre los valores críticos ± 1´96 y
de igual forma, considerando el nivel p crítico, p (0´1388) > α (0´05)

Interpretación: Para un nivel de confianza del 95%, aceptamos la hipótesis nula (las preguntas no
difieren en dificultad)

Intervalo de confianza: (P1 – P2 ) ± | Zα | · Error típico = (Límites inferior y superior)

(0,7 – 0,6) ± 1´96 · 0´067 = (- 0´03 y 0´23)

Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la diferencia de
medias en la población puede tomar ese valor)

CONTRASTES DE HIPÓTESIS DOS VARIANZAS

Supuestos " Variable dependiente con un nivel de medida de intervalo o razón


" Dos poblaciones con variables distribuidas normalmente ó n1 ≥ 30 y n2 ≥ 30

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


2 2 2 2 2 2
Hipótesis H0 : σ 1 / σ 2 = 1 H0 : σ 1 / σ 2 ≤ 1 H0 : σ 1 / σ 2 ≥ 1
2 2 2 2
H1 : σ 1 / σ 2 ≠ 1 2 2
H1 : σ 1 / σ 2 > 1 H1 : σ 1 / σ 2 < 1

2 2 2 2
Estadístico F =S 1 / S 2 Donde S 1 ≥S 2 (varianzas insesgadas)
Contraste

Distribución Distribución Muestral F de Fisher


Muestral
con gl numerador = (n1 – 1) gl y gl denominador = ( n2 – 1)

Regla F ≤ f α/2 y F ≥ f 1-α/2 (C. Bilateral)


decisión F ≥ f 1–α (C. Unilateral Derecho)
F≤ fα (C. Unilateral Izquierdo)

Intervalo
2 2 2 2 2 2
confianza (f α / 2 ; n1 – 1 y n2 – 1) ·Ŝ 1 / Ŝ 2 < σ 1 / σ 2 < (f 1 – α / 2 ; n1 – 1 y n2 – 1) ·Ŝ1 / Ŝ 2

R. MEDRANO (TUTOR) Página 8


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

PROBLEMAS EJEMPLO

Deseamos contrastar si las pacientes anoréxicas (PA) son más variables, en cuanto a su nivel de
estrés, que las pacientes bulímicas (PB). Para ello, extraemos dos muestras aleatorias de dichas
pacientes y se obtienen los siguientes datos sobre su nivel de estrés (donde a mayor puntuación
mayor estrés), considere α = 0,05:

PA 4 6 8 12 16
PB 3 5 7 9 14

Sabemos que la variable “nivel de estrés” está medida a nivel de intervalo y distribuida normalmente en
ambas poblaciones.

Supuestos: Disponemos de dos muestras independientes, la variable dependiente medida a nivel de


intervalo y dos poblaciones con variables normalmente distribuidas! Se trata de un contraste de
varianzas para dos muestras independientes.

Hipótesis: H0: σ2PA / σ2PB ≤ 1 y H1: σ2PA / σ2PB > 1. Contraste Unilateral Derecho.

También ! H0: σ2PA ≤ σ2PB y H1: σ2PA > σ2PB

Estadístico de contraste: F = Ŝ21 / Ŝ22 ! Donde Ŝ21 ≥ Ŝ22 (varianzas insesgadas)

Distribución Muestral F de Fisher con (n1 – 1) gl y (n2 – 1) gl


2 2
PA PB PA PB
4 3 16 9
2 2
6 5 36 25 F =Ŝ 1 / Ŝ2
8 7 64 49
12 9 144 81 F = 23,2 / 17,8 = 1,3
16 14 256 196
Σ = 46 Σ = 38 Σ = 516 Σ = 360

Media PA = 46 / 5 = 9,2 Ŝ21 = (516 / 5) – 9,22 · (5 / 4) = 23,2


Media PB = 38 / 5 = 7,6 Ŝ22 = (360 / 5) – 7,62 · (5 / 4) = 17,8

Regla de decisión: Valor crítico ! f0, 05; 4 y 4 gl = 6,39

Conclusión e interpretación: No se rechaza H0 porque 1,3 (estadístico de contraste) < 6,39 (valor
crítico). Por tanto, las pacientes anoréxicas (PA) no son más variables que las bulímicas (PB) en
cuanto a su nivel de estrés considerando un nivel de confianza del 95%.

Intervalo de confianza (para poder realizarlo suponemos contraste bilateral):

(f α / 2 ; n1 – 1 y n2 – 1) · Ŝ21 / Ŝ22 < σ21 / σ22 < (f 1 – α / 2 ; n1 – 1 y n2 – 1) · Ŝ21 / Ŝ22

0,10) · (23,2 / 17,8) = 0,13 < σ21 / σ22 < (9,60) · (23,2 / 17,8) = 12,48

Siendo los valores críticos: f 0,025; 4 y 4 gl = 9,60 y f 0,975; 4 y 4 gl = 1 / 9,60 ! 0,10 (propiedad recíproca).

Decisión: Como la H0 debe plantear que las varianzas son iguales (σ21 / σ22 = 1) y apreciamos que
uno está dentro del intervalo de confianza (0,13 y 12,48). Se aceptaría la H0 (las varianzas de
ambas poblaciones son iguales)

R. MEDRANO (TUTOR) Página 9


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

TAMAÑO (MAGNITUD) DEL EFECTO

La magnitud o tamaño del efecto alude al índice que mide el efecto que tiene un tratamiento. Deben
estar implicados al menos dos grupos (el experimental y el control). Es independiente del tamaño
muestral.
|YTRATAMIENTO – YCONTROL |
Índice d = -------------------------------------------------------
√[( n1 – 1) Ŝ21 + (n2 – 1) Ŝ22 / (n1 + n2 – 2)]

Según Cohen (1988) ! Magnitud del efecto [pequeño (d = 0´2); mediano (d = 0´5) y grande (d =
0´8 o superior)

Problema ejemplo: En un equipo de baloncesto se desea contrastar la eficacia del entrenamiento


psicológico en los tiros libres, por lo que se seleccionaron aleatoriamente 5 jugadores, a los que se
entrenó técnica y psicológicamente, que fueron comparados con los otros 5, a los que sólo se
entrenó técnicamente. El porcentaje de mejora a lo largo de la temporada aparece en la siguiente
tabla:

ENTRENAMIENTO PSICOLÓGICO 37 14 38 43 35
ENTRENAMIENTO TÉCNICO 29 36 11 17 13

Supuestos: Disponemos de dos muestras independientes con n = 5 para contrastar la eficacia de


un tipo de entrenamiento (el psicológico). Datos en porcentaje de mejora ! Comprobar la
magnitud del efecto.

PSICOLÓGICO TÉCNICO DATOS INSESGADOS


2 2
X X Y Y
37 1369 29 841 MEDIA PSICOLÓGICO = 167 / 5 = 33,4
14 196 36 1296 MEDIA TÉCNICO = 106 / 5 = 21,2
38 1444 11 121 2
43 1849 17 289 VARIANZA PSIC = (6083 / 5) – 33,4 = 101,04 · (5/4) = 126,3
2
35 1225 13 169 VARIANZA TÉCN = (2716 / 5) – 21,2 = 93,76 · (5/4) = 117,2

T = MEDIA PSIC - MEDIA TÉCN = (33,4 – 21,2) = 12,2


____________________________
Error Típico = √ (4 · 126,3) + (4 · 117,2) / (5+5-2) = 9
Σ = 167 Σ = 6083 Σ = 106 Σ = 2716
d = 12,2 / 9 = 1,35 ! (0´9115)

La d = 1´35 es la distancia estandarizada entre las medias de los dos grupos y su probabilidad
asociada (0´9115) ! El 91´15% de los sujetos con entrenamiento psicológico mejoran respecto a
los que únicamente reciben entrenamiento técnico.

R. MEDRANO (TUTOR) Página 10


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

TEMA Nº 4 ! ANÁLISIS DE DATOS PARAMÉTRICOS PARA DISEÑOS DE DOS GRUPOS


(MUESTRAS RELACIONADAS)

CONTRASTES DE HIPÓTESIS PARA DOS MUESTRAS RELACIONADAS

Muestras independientes: n1 y n2 muestras de sujetos diferentes, extraídos aleatoriamente de sus


respectivas poblaciones.
Muestras relacionadas: se trata de los mismos n sujetos observados en condiciones experimentales
diferentes, o n pares de sujetos semejantes entre sí (gemelos, hermanos,...)

Las muestras relacionadas nos ayudan a reducir la varianza de error. Así, cuanto mayor sea la
relación entre ambas muestras, menor será la varianza de la distribución muestral de las diferencias
y, por tanto, mayor el estadístico de contraste.

CONTRASTES DE HIPÓTESIS:

PARA DOS MEDIAS CONOCIDA LA VARIANZA POBLACIONAL DE LAS DIFERENCIAS


(PARAMÉTRICOS) DESCONOCIDA LA VARIANZA POBLACIONAL DE LAS DIFERENCIAS

PARA DOS MEDIANAS (NO PARAMÉTRICOS) ! TEST DE WILCOXON

PARA DOS PROPORCIONES

CONTRASTES DE HIPÓTESIS PARA DOS MEDIAS (MUESTRAS RELACIONADAS)

" Observaciones independientes


Supuestos " Nivel de medida de intervalo o razón
" Distribuciones normales en la población de diferencias ó bien (n ≥ 30)

VARIANZA POBLACIONAL VARIANZA POBLACIONAL DE LAS


DE LAS DIFERENCIAS CONOCIDA DIFERENCIAS DESCONOCIDA
Hipótesis
(similares) C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo
H0 : µ1-µ2 = 0 H0 : µ1-µ2 ≤ 0 H0 : µ1-µ2 ≥ 0
H1 : µ1-µ2 ≠ 0 H1 : µ1-µ2 > 0 H1 : µ1-µ2 < 0

_ __ _ __
2
Estadístico Z = (D – µd) / (σd / √ n ) T = (D – µd) / (Ŝ d / √ n )
Contraste
Distribución
Muestral Normal Tipificada: (0, 1) “t” de Student: gl = n-1

Conocida (Z) o desconocida (t) la varianza de la población (valor o valores críticos)

Regla (C. Bilateral) ! t ≤ t α / 2; n-2 y t ≥ t1 - α / 2; n-2 // Z ≤ Z α / 2 y Z ≥ Z 1 - α / 2


decisión (C. Unilateral Izquierdo) t ≤ t α; n-2 // Z ≤ Z α
(C. Unilateral Derecho) t ≥ t 1 – α; n-2 // Z ≥ Z 1 – α

Nivel crítico p ! Se rechaza H0 si p < α y se acepta si p > α

_ __ _ __
Intervalo D ± | Z α/2 | · σD / √ n = (Lím. infer y sup) D ± | t α/2; n– 1 | · SD / √ n = (Lím. infer y sup)
confianza Distribución Muestral Z con N (0,1) Distribución Muestral T con (n – 1) gl

R. MEDRANO (TUTOR) Página 1


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

PROBLEMAS EJEMPLO (CH diferencia de Medias Relacionadas)

Se desea estudiar si los alumnos de la ESO son más variables en cuanto a su nivel de
concentración antes y después de haberles sometido a una terapia. Sobre una muestra aleatoria de
7 alumnos se toman medidas del nivel de concentración previo y posterior a la aplicación de la
terapia, obteniéndose los siguientes resultados (a mayor puntuación, mayor concentración):

MEDIDA PREVIA 12 9 11 10 9 6 7
MEDIDA POSTERIOR 7 5 6 6 5 6 7

Sabiendo que para aplicar el estadístico de contraste se resta la medida posterior de la previa, que
la concentración es una variable medida a nivel de intervalo y que se distribuye normalmente en
ambas poblaciones, tómese un nivel de significación α = 0,05 y compruebe si los alumnos se
concentran más al finalizar la terapia.

Supuestos: Siete alumnos de la ESO (antes y después de la terapia) ! Muestras relacionadas, (α


= 0,05), variable medida a nivel de intervalo y se distribuye normalmente en ambas poblaciones.
Varianza poblacional desconocida ! Diferencia de medias (muestras relacionadas)

Hipótesis: La hipótesis alternativa es la hipótesis del investigador. Del planteamiento del problema
se deduce de que se trata de un contraste unilateral izquierdo donde:

H0: µ después ≥ µ antes ! H1: µ después < µ antes


Estadístico de contraste:

2
Medida Medida Diferencia D - DMedia (D - DMedia)
Previa Posterior Posterior - Previa
12 7 -5 - 1,86 3,4596
9 5 -4 - 0,86 0,7396
11 6 -5 - 1,86 3,4596
10 6 -4 - 0,86 0,7396
9 5 -4 - 0,86 0,7396
6 6 0 3,14 9,86
7 7 0 3,14 9,86
Σ = 64 Σ = 42 Σ = (- 22) Σ = 28,86

_
Averiguamos la media (D) y la varianza insesgada (Ŝ2d) de las puntuaciones diferencia:
_ __ __
Desconocida la varianza de la población: T = (D – 0) / (Ŝ2d) / √ n) ! T = (- 3,14) / (4,81 / √ 7) = - 1,7
__________________ _ _ _
Donde: Ŝ2d = √ Σ (Di – DMedia)2 / (n – 1) y D = Y1 – Y2 = Σ Di / n
________ _
Ŝ2d = √ 28,86 / 6 = 4,81 y D = (- 22) / 7 = (- 3,14)

Regla de decisión:

Valor crítico (contraste unilateral izquierdo) ! - 1,943 (valor crítico T0, 05 y 6 gl)
Nivel crítico p sólo puede obtenerse el valor aproximado, porque 1,7 no figura en la tabla T de
Student para n–1 = 6 gl. El valor 1,7 está entre 0,10 (1,4) y 0,05 (1,9).

Conclusión e interpretación: Teniendo en cuenta que se trata de un contraste unilateral izquierdo


se acepta H0 ! El estadístico de contraste (-1,7) < (-1,943) (valor crítico T0, 05 y 6 gl) // El nivel p crítico
(0´05 < p < 0´10) > α = 0,05 por lo que se acepta H0. No disponemos de evidencia suficiente para
afirmar que los alumnos se concentran más al finalizar la terapia.

R. MEDRANO (TUTOR) Página 2


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

Intervalo de confianza: Suponemos un contraste bilateral para realizar el intervalo.


_ __
D ± | t α/2; n– 1 | · Ŝ2d / √ n = (Límite inferior y superior) // Distribución Muestral T con (n – 1) gl

(-3´14) ± 1´943 · 4´81 / 2´64 ! (- 3´14) ± 3´54 ! (0´4 y 6´68) ! No contiene el 0, Rechazamos H0

Unos psicólogos hipotetizan que los hombres (H) con más de 20 años son más afectuosos hacia su
pareja que las mujeres (M). Extrae una muestra aleatoria de 8 parejas casadas y les mide el grado
de afectividad hacia la pareja, obteniendo los datos que aparecen a continuación (a mayor
puntuación mayor afectividad hacia la pareja). Se sabe que la puntuación en afectividad es una
variable medida a nivel de intervalo que se distribuye normalmente y que las observaciones entre
las muestras no son independientes. Se fija alfa en 0´01. Suponemos conocida la varianza de las
diferencias (σ2d = 5).

PAREJAS 1 2 3 4 5 6 7 8
HOMBRES 13 5 6 9 10 7 11 8
MUJERES 1 9 8 6 5 8 3 5

Supuestos: Se sabe que la puntuación en afectividad es una variable medida a nivel de intervalo,
que se distribuye normalmente en ambas poblaciones y que conocemos la varianza de las
diferencias (σ2d = 25). Se fija α en 0,04. Según el enunciado ! Diferencia de medias (muestras
relacionadas)

Hipótesis: Se plantea un contraste unilateral derecho ! H0: µH ≤ µM. y H1: µH > µM

Estadístico de contraste:
H M D
13 1 12
5 9 -4
6 8 -2
9 6 3
10 5 5
7 8 -1
11 3 8
8 5 3
Media = 8,7 Media = 5,7 Σ = 24
_ _ _ _
D = H – M = Σ Di / n ! D = 24 / 8 = 3 // σ2d = 5
_ __ _
Z = (D – 0) / (σ2d / √ n) ! T = 3 / (5 / √8) = 3 / 1´77 = 1,69

Regla de decisión:
El nivel crítico p (probabilidad de obtener un valor del estadístico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadístico de contraste (1,69) que buscando en la
tabla de la curva normal ! p = 1 – P (T ≤ 1´69) ! 1-0`9545 = 0´0455.
El valor crítico para un contraste unilateral derecho y un alfa = 0´01 es ! 2´33

Conclusión e interpretación: Al nivel de confianza del 99% no existen diferencias significativas.


No aceptamos la hipótesis de psicólogo (H1); por tanto, aceptamos H0 (los hombres no son más
afectuosos que las mujeres)

Intervalo de confianza: Suponemos un contraste bilateral para realizar el intervalo.


_ __
D ± |Z α/2| · σ2d / √ n = (Límite inferior y superior) // Distribución Muestral Z con N (0, 1)

3 ± 2´58 · 5 / 2´83 ! 3 ± 4´57 ! (- 1´57 y 7´57) ! Como contiene 0 aceptamos H0

R. MEDRANO (TUTOR) Página 3


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

CH DOS MEDIANAS (MUESTRAS RELACIONADAS) PRUEBA DE WILCOXON

Supuestos " Variable dependiente con un nivel de medida al menos ordinal


" La distribución de la diferencia de los rangos es simétrica

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hipótesis H0 : M1 = M2 H0 : M1 ≤ M2 H0 : M1 ≥ M2
H1 : M1 ≠ M2 H1 : M1 > M2 H1 : M1 < M2

1.- Calculamos las diferencias entre las puntuaciones originales.


2.- Asignamos rangos a los valores absolutos de las diferencias.
Estadístico 3.- Sumamos los rangos que proceden de diferencias positivas y los rangos que
Contraste proceden de diferencias negativas, obteniendo: ∑ R - y ∑ R +

El estadístico de contraste “W” es el menor de ∑ R - y ∑ R +

Distribución
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon

Conocida (Z) o desconocida (t) la varianza de la población (valor o valores críticos)

Regla (C. Bilateral) ! W > wn1, n2; α/2


decisión (C. Unilateral Izquierdo) ! W < wn1, n2; α
(C. Unilateral Derecho) ! W > wn1, n2; α

Aproximación (T) – [n (n +1) / 4]


A la Normal Z = -------------------------------
n ≥ 30 √ n (n+1)(2n+1) / 24

PROBLEMA EJEMPLO
Un investigador desea comparar el grado de hiperactividad en obesos cuando están en un
programa para bajar de peso (dieta) y sin programa para bajar de peso. Dispone de 10 sujetos a los
que somete a las dos condiciones experimentales (con dieta y sin dieta). Las puntuaciones se
reflejan en la tabla. Sabiendo que la distribución de las diferencias es simétrica, con un nivel de
confianza del 95%, ¿se puede afirmar que hay diferencias en hiperactividad en obesos cuando
están o no en un programa de dieta?

Supuestos: Disponemos de dos muestras relacionadas (tamaño pequeño). Sabemos que la


distribución de las diferencias en la población es simétrica. Datos medidos, al menos, a un nivel
ordinal.

Hipótesis: Planteamos un contraste bilateral ! H0 : M1 = M2 y H1 : M1 ≠ M2

Estadístico de contraste:

R. MEDRANO (TUTOR) Página 4


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

∑ R+ = (1´5 + 7´5 + 9´5 + 4´5 + 7´5 + 4´5 + 4´5) = 39´5 y ∑ R- = (1´5 + 9´5 + 4´5) = 15´5
Se toma el valor del más pequeño de los sumatorios ! W = 15´5 (Estadístico de Contraste)

Regla de decisión: Con α/2 = 0´05 (contraste bilateral) y n = 10, acudimos a la tabla de Wilcoxon y
obtenemos un valor crítico = W0´025; 10 = 9

Conclusión e interpretación: Dado que el estadístico de contraste (W = 15´5) > el valor crítico (W = 9)
no podemos rechazar la H0 con un nivel de confianza del 95%. Las diferencias en el incremento o
disminución de la hiperactividad en personas obesas con dieta o sin dieta, no son significativas.
Estadísticamente resultan iguales, en razón de que pueden ser diferencias dadas al azar.

CONTRASTES DE HIPÓTESIS DOS PROPORCIONES


Típico problema sobre cambios de opinión (pretest-postest), cuando la variable está dicotomizada.

Supuestos " Variable dependiente dicotómica o dicotomizada que medimos en la misma


muestra en dos ocasiones.
" Muestra con [b + c] Observaciones independientes, donde [b + c] > 25
(b+c) representan a los sujetos cuya puntuación es distinta en las dos ocasiones.

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hipótesis H0 : πb = πc H0 : πb ≤ πc H0 : πb ≥ πc
H1 : πb ≠ πc H1 : πb > πc H1 : πb < πc

_______
2 2
Z = (b - c) / √ (b + c) χ = (b – c) / (b + c)
Estadístico
Contraste b ! (sujetos que puntúan 1 en la primera medida y 2 en la segunda).
c ! (sujetos que puntúan 2 en la primera medida y 1 en la segunda)
Distribución
Muestral Normal tipificada N (0, 1) Chi Cuadrado con 1 grado de libertad
2 2
Regla (C. Bilateral) ! Z ≤ Z α / 2 y Z ≥ Z 1 - α / 2 χ < χ 1; 1-α → Mantener H0
decisión (C. Unilateral Izquierdo) ! Z ≤ Z α
2 2
(C. Unilateral Derecho) ! Z ≥ Z 1 – α χ > χ 1; 1-α → Rechazar H0

_______
Intervalo (P1 – P2 ) ± | Z α/2 | · √ (b + c) = (Límites inferior y superior)
confianza

PROBLEMA EJEMPLO

Una psicóloga desea estudiar si la proyección de imágenes de accidentes de tráfico influye en la


forma de conducir. Extrae una muestra aleatoria de 102 sujetos con elevado historial de infracciones
de tráfico y observa si cometen o no infracción en una determinada situación que propicia el hacerlo
(saltarse un semáforo que acaba de cambiar a rojo). Encuentra que 54 no se lo saltan. Tras
proyectarles imágenes de accidentes de tráfico, vuelve a observar si los sujetos se saltan o no se
saltan el semáforo en las mismas condiciones. Encuentra que 34 de los que no se lo saltaban antes
de proyectarles las imágenes se lo saltan después y 5 que se lo saltaban antes, también se lo saltan
después. Se desea saber si ha habido un cambio significativo en cuanto a infracciones tras la
proyección de imágenes. Utilice alfa = 0,01

Supuestos: Muestra grande de 102 sujetos sometidos a dos medidas de la misma variable
(cometer o no cometer infracción)! Variable dependiente dicotómica. [b + c] > 25 Se trata de
contrastar las proporciones en dos muestras de observaciones relacionadas.

Hipótesis: Planteamos un contraste bilateral ! H0 : πb = πc y H1 : πb ≠ πc

R. MEDRANO (TUTOR) Página 5


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

Estadístico de contraste:

Primera medida (Antes)


Si saltan (SI = 1) No saltan (NO = 2) TOTALES
Si saltan a=5 b = 34 39
Segunda (SI = 1)
Medida No saltan c = 63-20 = 43 d = 54-34 = 20 102 – 39 = 63
(Después) (NO = 2)
48 54 102
TOTALES
______ ________
Z = (b - c) / √ (b + c) ! (34 – 43) / √ (34 + 43) = ± 1`02 // Distribución normal N (0,1)

Regla de decisión:

Los valores críticos, contraste bilateral, con α/2 = 0,005 y 1- α/2 = 0,995 ! ± 2´58.
El nivel crítico p (probabilidad de obtener un valor del estadístico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadístico de contraste (± 1´02) que buscando en
la tabla de la curva normal ! 2 [P (Z ≥ 1´02) = 2 · (1 – 0,8461) = 2 · 0,1539 ! 0,3078.

Conclusión e interpretación:

Como p (0,3078) > α (0,01) ! Aceptamos H0. También como 1´02 (valor muestral del estadístico de
contraste) < 2´58 (el mayor de los valores críticos). También 1´02 está entre los valores críticos (-
2´58 y 2´58).
Para α = 0´01, podemos afirmar que la proporción poblacional de los sujetos que se saltan el
semáforo es la misma antes de la proyección de imágenes que después.

También con el test de McNemar: χ2 = (b – c)2 / (b + c) ! χ2 = (34 – 43)2 / (34 + 43) = 1´05

Para χ2con un grado de libertad, el valor 1´05 se encuentra entre (0´10 < p < 0´90) por lo que el nivel p
crítico > que α (0,01) ! Aceptamos H0

R. MEDRANO (TUTOR) Página 6


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

TEMA Nº 5 ! DISEÑOS CON MÁS DE DOS GRUPOS INDEPENDIENTES

FUNDAMENTOS DEL ANÁLISIS DE VARIANZA (ANOVA)

Análisis de Varianza (ANOVA ó ANVAR) ! es una técnica paramétrica de análisis estadístico que
se utiliza para comparar las medias de más de dos grupos.
El diseño de más de dos grupos tiene por objeto estudiar la influencia de más de dos valores de la
variable independiente sobre la variable dependiente y, por tanto, tiene más posibilidades de establecer
la relación precisa entre ellas. Una de las características más importantes del diseño de experimentos
es la aleatoriedad: elección de un grupo (muestra) y su distribución en tres o más grupos de forma
aleatoria.
Al comparar distintos grupos para realizar un estudio tenemos en cuenta la variabilidad que aparezca
entre los sujetos en la variable dependiente que se considera formada por dos componentes: la que se
debe al factor estudiado (atribuible a los distintos tratamientos experimentales; variable independiente) y
la que se debe a factores extraños y no controlados (Error Experimental)
El Análisis de Varianza se fundamenta en el estudio de estas variabilidades. La varianza general o
común se divide en: varianza intergrupos (atribuible a los distintos niveles del factor estudiado) y
varianza intragrupos (atribuible al error experimental). Al comparar ambas varianzas obtenemos la
aceptación o rechazo de la hipótesis nula (que consiste en afirmar que no existe diferencia entre las
medias de los distintos grupos)
Lógica del método: Los sujetos se distribuyen aleatoriamente en los mencionados grupos (para
minimizar la influencia de las variables extrañas); por tanto, son semejantes en cuanto a la variable
estudiada dentro de cada grupo y entre los distintos grupos. Si después de aplicar el tratamiento
experimental existen diferencias, se puede pensar que son debidas a los procedimientos aplicados.

TERMINOLOGÍA:

Factores = Var. Independientes que se estudian. Niveles = categorías en que dividimos los factores.
Efectos Fijos = sólo nos interesan unos niveles concretos, los establecidos. Los resultados sólo afectan
a estos niveles. Efectos Aleatorios = los niveles actúan como una muestra y las conclusiones se pueden
generalizar en el sentido de los datos de la muestra.
Modelo Equilibrado = igual número de sujetos en los grupos. Modelo no Equilibrado = distinto número
de sujetos en los grupos.

PASOS PARA REALIZAR EL ANOVA !

1.- Probar los supuestos (independencia de las observaciones, normalidad de las distribuciones y
homogeneidad de las varianzas)para asegurarnos que se puede aplicar el ANOVA
2.- Enunciar las hipótesis estadísticas
3.- Decidir el estadístico de contraste que vamos a utilizar para probar la H0
4.- Con qué nivel de confianza vamos a trabajar (establecer la región crítica de rechazo de la H0
5.- Calcular el estadístico de contraste (Tabla del ANOVA)
6.- Tomar la decisión sobre la H0 (comparar el valor F obtenido con el valor crítico)
7.- Interpretación en el contexto de la investigación

SUPUESTOS DEL ANOVA

1.- Escala de medida de la VD, al menos, de intervalo.


2.- Normalidad de las distribuciones: Las muestras o grupos a comparar proceden de poblaciones que
se distribuyen normalmente ! Pruebas de Bondad de Ajuste (Lilliefors, Kolmogorov-Smirnov, X2 de
Pearson) // No es necesario desarrollarlas.
3.- Independencia de las observaciones: Las muestras o grupos han sido obtenidos de forma aleatoria
(las muestras y las observaciones deben ser independientes) ! Test de rachas.
4.- Homogeneidad de las varianzas (homocedasticidad): Los grupos a comparar deben proceder de
poblaciones cuyas varianzas no difieran de forma significativa ! Test de Cochran (modelos equilibrados
y Test de Bartlett (modelos no equilibrados)

R. MEDRANO (TUTOR) Página 1


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

INDEPENDENCIA DE LAS OBSERVACIONES (TEST DE RACHAS) !

Hipótesis estadísticas:
H0: Las observaciones y las muestras son independientes
H1: Las observaciones y las muestras no son independientes

Estadístico de Contraste: (r = nº de rachas // n1 = nº de signos + // n2 = nº de signos –)


Si n1 y n2 ≤ 20, entonces Estadístico r ! (nº de rachas = nº de grupos de signos iguales seguidos)
Si n1 y/o n2 > 20, entonces Estadístico T ! Distribución ! Curva Normal N (0, 1)
r – [(2n1n2 / n1 + n2) + 1]
T = -----------------------------------------------------------
√ 2n1n2 (2n1n2 – n1 n2) / (n1 + n2)2 (n1 + n2 – 1)

Distribución Muestral: Estadístico r ! Tabla (Test de Rachas) // Estadístico T ! Tabla N (0,1)

Cálculo del Estadístico de Contraste: Para poder aplicar el Test hemos de dicotomizar la variable
observada. Para ello: A partir de la Mediana (Md) de todas las puntuaciones tomadas conjuntamente
(si una puntuación es mayor que la Md se sustituye por un signo + y si es menor por un signo –)

Valores Críticos: Si el estadístico es r ! Uα/2 y U1-α/2 (en la tabla de valores críticos del Test de
Rachas, buscamos los valores de n1 y n2) // Si el estadístico es T ! Zα/2 y Z1-α/2

Zona de Aceptación: Zona de Rechazo:


Estadístico r ! Uα/2 < r < U1-α/2 Estadístico r ! r ≤ Uα/2 y r ≥ U1-α/2
Estadístico T ! Zα/2 < T < Z1-α/2 Estadístico T ! T ≤ Zα/2 y T ≥ Z1-α/2

Decisión: Estadístico r ! Decisión: Estadístico T !


Si Uα/2 < r < U1-α/2 ! Aceptamos Ho Si Zα/2 < T < Z1-α/2 ! Aceptamos Ho
Si r ≤ Uα/2 ó r ≥ U1-α/2 ! Rechazamos Ho Si T ≤ Zα/2 o T ≥ Z1-α/2 ! Rechazamos Ho.

PROBLEMA EJEMPLO

Un seleccionador de baloncesto desea averiguar como incide la hora del día a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de mañana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:

TURNOS NÚMERO DE CANASTAS ENCESTADAS POR LOS 18 SUJETOS


MAÑANA 15 12 14 10 11 16
TARDE 7 9 12 17 10 12
NOCHE 13 15 20 17 16 18

Comprobar si las observaciones son independientes (sabemos que la Mediana = 13´5):


Hipótesis ! H: Las muestras son aleatorias y H1: Las muestras no son aleatorias

Para contrastar la independencia (Test Rachas) ! las observaciones pueden dicotomizarse, utilizando la
mediana (asignando un + cuando la puntuación sea mayor y un - cuando la puntuación sea menor)

Canastas 15 12 14 10 11 16 7 9 12 17 10 12 13 15 20 17 16 18
Signo + - + - - + - - - + - - - + + + + +
Rachas 1 2 3 4 5 6 7 8 9
r ! (nº de rachas) = 9 // n + = 9 (signos positivos) // n - = 9 (signos negativos)

Con un nivel de significación α = 0,05, buscamos los valores críticos en la tabla del test de Rachas
n - = 9; n + = 9; α / 2 = 0,025 y 1 - α / 2 = 0´975 (bilateral)
T (0,025) = 5 y T (0,975) = 14 ! Como (rachas = 9) está dentro del intervalo (entre 5 y 14), se acepta H0. Las
observaciones son independientes.

R. MEDRANO (TUTOR) Página 2


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

HOMOGENEIDAD DE LAS VARIANZAS (TEST DE COCHRAN) !

Este supuesto es el que más va a distorsionar los resultados, en caso de no cumplirse, porque si al
final hay diferencias entre los grupos, no podremos saber si se deben a la variable independiente o a
que ya existían con anterioridad. Supuestos (Modelo equilibrado)

Hipótesis estadísticas:
H0: σ21 = σ22 = σ23 =…… (Las varianzas poblacionales son iguales)
H1: σ21 ≠ σ22 ≠ σ23 ≠……. (Para alguna σ2i)

Estadístico de Contraste ! R = (Varianza Muestral Mayor / ∑ Varianzas Muestrales)

El estadístico de contraste (distribución de valores críticos según la tabla de Cochran)

Valor Crítico: R r,n,α


(r = nº de grupos y n = nº de sujetos por grupo) Zona de Aceptación: R < R r,n,α

Decisión:
Zona de Rechazo: R ≥ R r,n,α Si R < R r,n,α ! Aceptamos Ho
Si R ≥ R r,n,α ! Rechazamos Ho

PROBLEMA EJEMPLO

Con el enunciado del problema utilizado para el test de rachas (Modelo equilibrado):

TURNOS NÚMERO DE CANASTAS ENCESTADAS POR LOS 18 SUJETOS


MAÑANA 15 12 14 10 11 16
TARDE 7 9 12 17 10 12
NOCHE 13 5 20 17 16 18

Sabiendo que se cumple el supuesto de normalidad de las distribuciones, comprobar si las varianzas
son homogéneas ! H0: Las varianzas son iguales // H1: No todas las varianzas son iguales
Para contrastar la homocedasticidad (Test de Cochran) ! R = máx Ŝ2I / Σ Ŝ2I

Ŝ2MAÑANA = (1042 / 6) - 132 = 4,67 Ŝ2TARDE = (807 / 6) – 11,172 = 9,73

Ŝ2NOCHE = (1663 / 6) – 16,52 = 4,92 R = 9,73 / (4,67 + 9,73 + 4,92) = 0,504

Con un nivel de significación α = 0,05, buscamos los valores críticos de las tablas de Cochran ! n = 6
// r (grupos) = 3 // R = 0,7071

Decisión ! Como 0,504 < 0,7071, se acepta H0 (Las varianzas no difieren significativamente)

HOMOGENEIDAD DE LAS VARIANZAS (TEST DE BARTLETT) !

Hipótesis estadísticas ! Similares a las enunciadas en el test de Cochran.

Supuestos ! El test de Bartlett se usa para modelos no equilibrados.

Estadístico de Contraste ! Sigue la distribución Chi-Cuadrado con (r-1) gl (r = nº de grupos)


2 2 2
Valor Crítico: X (r-1)(1-α) Zona de Aceptación: X < X (r-1)(1-α)

Decisión:
2 2 2 2
Zona de Rechazo: X ≥ X (r-1)(1-α) Si X < X (r-1)(1-α) ! Aceptamos Ho
2 2
Si X ≥ X (r-1)(1-α) ! Rechazamos Ho

R. MEDRANO (TUTOR) Página 3


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

PROBLEMA EJEMPLO

Sean tres muestras para probar la homogeneidad de varianzas:

Niños Niñas Adultos


6 9 8 Medias ! 4,67 (Niños) // 7,625 Niñas // 7,33 Adultos
5 8 10
6 8 8 Varianzas Insesgadas !
4 5 3
3 10 7 Ŝ2 NIÑOS = 1 Ŝ2 NIÑAS = 2,55 Ŝ2ADULTOS = 4
5 7 6
4 6 7
4 8 9 Varianza insesgada ponderada ! Σgi Ŝ2 i / g
5 8
2 2 2
Σ = 42 Σ = 61 Σ = 66 (n1 – 1) · Ŝ N + (n2 – 1) · Ŝ N + (n3 – 1) · Ŝ A
2
Σ2 = 204 Σ2 = 483 Σ2 = 516 Ŝ = -----------------------------------------------------------------
n1 = 9 n2 = 8 n3 = 9 (n1 – 1) + (n2 –1) + (n3 – 1)

ESTADÍSTICO DE CONTRASTE !

Con logaritmos decimales (r = grupos)! χ2 R-1 = 2,3026 / C {g log Ŝ2 - Σ gi log Ŝ2 i}

Siendo C = 1 + {1 / 3 (r - 1)} · {(Σ 1 / gi) – 1 / g}


gi = denominador de cada varianza insesgada i (n – 1)
g = suma de todas las gi (Σ gi)

Averiguamos la Varianza Ponderada ! Ŝ2 = Σgi Ŝ2 i / g = 2,515

Ŝ2 = {(9 – 1) · 1 + (8 – 1) · 2,55 + (9 – 1) · 4} / (9 – 1) + (8 – 1) + (9 – 1) = 2,515

Averiguamos C ! 1 + {1 / 3 (3 - 1)} · {(1 / 8 + 1 / 7 + 1 / 8) – 1 / 23} = 1,0291

Aplicamos el estadístico de Contraste !

χ2 r-1 = 2,3026 / {1,0291 · [23 log 2,515 – (8 log 1 + 7 log 2,55 + 8 log 4)]} = 3,45

CONCLUSIÓN ! Distribución χ2 con (r –1= 2) gl y α = 0,05 ! 5,99

DECISIÓN ! Como 5,99 > 3,45 Aceptamos hipótesis nula de homocedasticidad.

R. MEDRANO (TUTOR) Página 4


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

ANOVA (UN FACTOR) !


______________________
ANOVA UNIFACTORIAL ! Influencia de un único factor (variable) en distintos niveles (categorías).
Se utiliza el mismo esquema operativo para el efecto fijo y aleatorio, para el modelo equilibrado y el no
equilibrado.

MODELO "Yij = µ + αij + εij // Cualquier puntuación (Y) tiene tres componentes: (µ) que es la media de
la población. (α) el nivel en que se encuentra, común a todos los componentes adscritos a ese nivel.
(ε) el error experimental o factores no controlados en el experimento (se asume que es una variable
aleatoria distribuida según N (0, σ). Ejemplo ! Y17 = puntuación del sujeto 7º del grupo 1º.

HIPÓTESIS " Efectos fijos (sobre las medias poblacionales) // Efectos aleatorios (sobre las
varianzas ! cuando son = 0, las medias son iguales).

EFECTOS FIJOS ! EFECTOS ALEATORIOS !


2
H0: µ1 = µ2 = µ3 =… = µi H0: σ B = 0
2
H1 : µ1 ≠ µ2 ≠ µ3 ≠ … ≠ µi H1: σ B ≠ 0
al menos para una µi
Cálculo similar

TABLA ANOVA UNIFACTORIAL


FUENTE DE S MAS GRADOS DE MEDIAS ESTADÍSTICO
VARIACIÓN CUADRÁTICAS LIB RTAD CUA RÁTICAS DE CONTRASTE
ENTRE SC INTER I–1 MC INTER
NIVELES Nº de grupos o (SC INTER) / (I – 1) MC INTER
niveles menos 1 F = ---------------
DENTRO DE SC INTRA N–I MC INTRA MC INTRA
LOS NIVELES Nº de sujetos (SC INTRA) / (N – I)
menos Nº de
grupos
TOTAL SC TOTAL N–1 F se distribuye ! F con (I –1) y (N – I)
Nº de sujetos grados de libertad.
menos 1

CÁLCULOS " Se cumple [SC TOTAL = SC INTER + SC INTRA] y G. Libertad: [N – 1 = (I – 1) + (N – I)]

SC TOTAL = Σ Σ Y2 – {(Σ Σ Y)2 / N}


SC INTRA = SC TOTAL - SC INTER
SC INTER = Σ (Σ Y)2 / n – {(Σ Σ Y)2 / N}

DECISIÓN " Rechazamos H0 (igualdad de medias en los distintos niveles) si el valor de la F


experimental (estadístico de contraste) es mayor que el valor F obtenido en las tablas, para un nivel de
significación (α) predeterminado.

El Numerador del estadístico de contraste contiene la Varianza de error + Efecto real de la VI. El
Denominador contiene la Varianza de error. Por tanto, cuanto menor es el efecto real de la VI más se
acerca el cociente a uno.

Valor Crítico: F (I-1) (N-I) (1-α) Zona de Aceptación: F < F ((I-1) (N-I) (1-α)

Decisión:
Zona de Rechazo: F ≥ F (I-1) (N-I) (1-α) Si F < F crítico ! Aceptamos H0
Si F ≥ F crítico ! Rechazamos H0

R. MEDRANO (TUTOR) Página 5


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

Cálculos abreviados (Utilizamos el sistema de notación propuesto por Keppel): El cálculo de las
Sumas de cuadrados se realiza sumando y restando las razones básicas: [Y] (relacionada con las
puntuaciones individuales); [A] con los totales de los niveles y [T] con la suma total.

Estructura de cálculo del numerador ! Se elevan al cuadrado las cantidades implicadas y


posteriormente se suman.
Estructura de cálculo del denominador ! Cualquiera que sea el término se divide por el número de
puntuaciones que contribuyen a su cálculo.

Fórmulas para las razones básicas Sumas Cuadrados a partir de razones básicas

[T] = T2 / (a)(n) ! Diseño equilibrado SCTOTAL = [Y] – [T] ! SCTOTAL


[T] = T2 / N ! Diseño no equilibrado _
SCT = ∑∑ (Y –YTOTAL)2
[A] = ∑A2 / n ! Diseño equilibrado
SCA = [A] – [T] ! SCINTERGRUPO
[A] = (∑A21 / n1) + (∑A22 / n2) + … _ _
(Diseño no equilibrado) SCA = ∑n (YA –YTOTAL)2

[Y] = ∑Y2 SCS | A = [Y] – [A] ! SCINTRAGRUPO

SCS | A = ∑∑ (Y –YA)2

N = Número total de observaciones // n = Observaciones por nivel

PROBLEMA EJEMPLO

Un seleccionador de baloncesto desea averiguar cómo incide la hora del día a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de mañana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:

TURNOS NÚMERO DE CANASTAS ENCESTADAS POR LOS 18 SUJETOS


MAÑANA 15 12 14 10 11 16
TARDE 7 9 12 17 10 12
NOCHE 13 15 20 17 16 18

2
SUMATORIOS (Σ) Σ Nº DE CASOS MEDIAS
MAÑANA 78 1042 6 13
TARDE 67 807 6 11,17
NOCHE 99 1663 6 16,5
TOTAL 244 3512 18 13,55

Cálculo de las Sumas Cuadráticas:

SC TOTAL = Σ Σ Y2 – {(Σ Σ Y)2 / N} ! 3512 - (244)2 / 18 = 204,45 ! Abreviado: [Y] – [T]

Σ Σ Y2 = según tabla 3512


(Σ Σ Y)2 / N = según tabla 2442 / 18 = 3307,55

SC INTER = Σ (Σ Y)2 / n – {(Σ Σ Y)2 / N} ! 3395,67 - (244)2 / 18 = 88,11 ! Abreviado: [A] – [T]

Σ (Σ Y)2 / n = (782/6) + (672/6) + (992/6) = 3395,67


(Σ Σ Y)2 / N = según tabla 2442 / 18 = 3307,55

SC INTRA = SC TOTAL - SC INTER ! 204,45 - 88,11 = 116,3

R. MEDRANO (TUTOR) Página 6


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

TABLA ANOVA UNIFACTORIAL


FUENTE DE SUMAS GRADOS DE MEDIAS ESTADÍSTICO DE
VARIACIÓN CUADRÁTICAS LIBERTAD CUADRÁTICAS CONTRASTE
ENTRE SC INTER I–1 MC INTER
NIVELES 88,11 3–1=2 88,11 / 2 = 44,05 F = 44,05 / 7,75 =
DENTRO DE SC INTRA N–I MC INTRA 5,68
LOS NIVELES 116,3 18 – 3 = 15 116,3 / 15 = 7,75
TOTAL SC TOTAL N–1 F de Snedecor con (2 y 15) g l. y α = 0,05
204,45 18 – 1 =17 F (Tablas) = 3,68

Decisión ! Comparando los resultados F (tablas) = 3,68 < F (experimental) = 5,68, por tanto
rechazamos la hipótesis nula. Existen diferencias significativas entre el rendimiento de los jugadores
dependiendo de la hora del día a la que entrenan a un nivel de confianza del 95%.

COMPARACIONES MÚLTIPLES (previo rechazo de la H0) "

Permiten obtener información sobre las diferencias entre los distintos tratamientos considerados uno a
uno. El objetivo de las comparaciones múltiples es reducir la cantidad de Error Tipo I (α) que
cometeríamos si se compararan sin más, dos a dos, todas las muestras posibles. Dos tipos:
! Comparaciones planificadas o a priori (no interesan todas las comparaciones, sólo algunas)
! Comparaciones no planificadas, a posteriori o post hoc.
Las que vamos a utilizar se denominan no planificadas, a posteriori o post hoc (se llevan a cabo
cuando se ha realizado el Análisis de Varianza y la F ha sido significativa / hemos rechazado la H0). Las
más importantes ! TUKEY // SECHEFFÉ.

___________
PRUEBA TUKEY (HSD) ! HDS TUKEY = q α, gl, K √ MC error / n

q ! valor crítico en la tabla de rango studentizado. Se averigua considerando el nivel de confianza fijado
(α), los grados de libertad de la MC error y el número de grupos o tratamientos a comparar en el ANOVA.
MC ERROR ! media cuadrática error del Anova (MCINTRA / MCS | A)
n ! tamaño de cada grupo (los modelos han de ser equilibrados). Cuando el modelo no es equilibrado,
se sustituye n por n´ ! n´ = k / (1 / n1) + (1 / n2)...
_ _
Rechazamos H0 cuando (| Yi – Yj | ≥ HDS TUKEY

PRUEBA SCHEFFÉ (CR) ! Permite, además, realizar comparaciones complejas (una media con otras
dos consideradas en conjunto). Los coeficientes c (pesos) ! (2), (- 1) y (-1). Cuando se utiliza en lugar
de Tukey, para comparaciones dos a dos, es menos potente y más conservadora que Tukey, lo que
significa que, en igualdad de condiciones, el valor crítico de Scheffé es ligeramente superior al de
Tukey, por lo que resulta más difícil rechazar la hipótesis nula de la igualdad de medias.
_________________ ___________________
CR SCHEFFÉ = √ (k - 1) F (k - 1), gl ERROR √ MC ERROR [Σ (c2j / nj)]

k ! Número de grupos
ni = número de sujetos de cada grupo.
F (k - 1), gl ERROR ! F experimental del ANOVA.
MC ERROR ! Media cuadrática error.
c2j ! Coeficiente de las combinaciones lineales (en cada combinación la suma de coeficientes = 0)
_ _ _
φ1 = 2 ·Y1 – (Y2 + Y3) ! Entonces: c1 = 2, c2 = (-1), c3 = (-1) ! Dado que (∑cj = 0)

Para hallar los cj, se debe tener en cuenta que siempre deben sumar 0. Es más fácil calcular primero
los cj de los que se combinan conjuntamente, que siempre serán negativos, y luego el del que se
compara frente a todos, que será la suma de los otros, pero con signo positivo.
Decisión:
Si φ1 ≥ CR ! Existen diferencias significativas entre el nivel y los otros tomados conjuntamente.
Si φ1 < CR ! No existen diferencias significativas entre el nivel y los otros tomados conjuntamente

R. MEDRANO (TUTOR) Página 7


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

PROBLEMAS EJEMPLO !

Siguiendo con nuestro planteamiento anterior:


_________
Prueba Tukey (HSD) ! HDS TUKEY = q α, gl, K √ MC error / n
_ _ _
n = 6 // k = 3 // XMAÑANA = 13 // XTARDE = 11,17 // XNOCHE = 16,5

Valor q para α = 0,05; 15 grados de libertad y tres grupos ! 3,67 MCINTRA ! 7,75
_______
HDS TUKEY = 3,67 √ 7,75 / 6 = 4,17 (modelo equilibrado)

| 13 - 11,17 | = 1,83 < 4,17 Diferencia no significativa.


| 13 - 16,5 | = 3,5 < 4,17 Diferencia no significativa.
| 11,17 - 16,5 | = 5,33 > 4,17 Diferencia significativa.

Decisión ! Existen diferencias significativas entre entrenar por la tarde y por la noche, siendo el mejor
rendimiento por la noche (media más alta)

Prueba Scheffé (CR) ! Comparación entre la media del turno de noche con las de mañana y tarde
consideradas conjuntamente.
__________________ __________________
CR SCHEFFÉ = √ (k - 1) F (k - 1), gl ERROR √ MC ERRROR [Σ (c2j / nj)

Valor F para α = 0,05 // 2 y 15 grados de libertad ! 3,68 MCINTRA ! 7,75


__________ ________________________
CR SCHEFFÉ = √ (3-1) · 3,68 √ (7,75) · (22 / 6 + 12 / 6 + 12 /6) = 6,15

Coeficientes c (pesos) ! (2), (- 1) y (-1) ψ ! | (2 · 16,5) + (- 1 · 11,17) + (- 1 · 13) | = 8,83

Decisión ! Como 8,83 > 6,15 ! Rechazamos H0 (existen diferencias significativas entre el turno de
noche y los de mañana y tarde considerados conjuntamente.

MODELOS NO PARAMÉTRICOS PARA MUESTRAS INDEPENDIENTES:


Se utilizan como alternativa al ANOVA cuando no se cumplen los supuestos ya indicados. Tienen
menos restricciones y también una potencia menor.
TEST DE KRUSKAL - WALLIS " Es una ampliación del test de Mann-Whitney.
Supuestos: VD es una variable continua que se transforma en una escala ordinal (que disminuye el
impacto de los valores extremos); la distribución poblacional puede ser de cualquier tipo (las varianzas
deben ser homogéneas); se trata de k muestras aleatorias e independientes que queremos comparar.

HIPÓTESIS ! H0: ŋ1 = ŋ2 =… = ŋK
H1: ŋ1 ≠ ŋ2 ≠… ≠ ŋK Al menos para una ŋ

ESTADÍSTICO DE CONTRASTE ! H = {12 / N (N + 1)} · {Σ (R2 / n} – 3 (N + 1)


N = número total de observaciones; n = número de observaciones de cada muestra
R2 = suma de rangos de cada muestra, previa ordenación única.
El estadístico de contraste sigue la distribución X2 con (k-1) gl

Cálculo: Se ordenan todas las puntuaciones en una sola serie, (es decir, tomándolas todas en cuenta),
asignamos rangos de 1 a n, dando a la puntuación menor el rango 1. En caso de empate ! (rango
medio); es decir, asignándoles la media aritmética de los rangos que les hubieran correspondido de ser
distintas.

Decisión: Cuando se rechaza la H0, se procede a realizar comparaciones múltiples (tratamientos entre
los que se producen las diferencias)

R. MEDRANO (TUTOR) Página 8


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

_________________
Diferencia mínima crítica ! MVKV = Z adj √ N(N+1) /12 · (∑1/ai)

Siendo Z adj el percentil 1 – (α / 2c) de la distribución normal tipificada. (c) es el nº de comparaciones a


realizar en un contraste bilateral [en uno unilateral ! Z adj = 1 – (α / c)]
_ _
Para comparar las diferencias de rangos ! │Ri - Rj│ > MVKW

PROBLEMA EJEMPLO

En un estudio sobre antojo por el chocolate varios autores querían determinar si la distribución
poblacional del consumo de chocolate en una semana era igual en una muestra de niños (N), que en una
muestra de mujeres adultas (MA) y que en una de hombres adultos (HA). Para ello se seleccionaron
aleatoriamente 5 sujetos de cada grupo y se midió su consumo de chocolate contabilizando (según se
recoge en la tabla) el número de alimentos con chocolate consumidos en una semana (C):

NIÑOS MUJERES ADULTAS HOMBRES ADULTOS


N RANGO N RANGO N RANGO
6 1 31 13,5 13 7
11 4,5 7 2 32 15
12 6 9 3 31 13,5
20 9 11 4,5 30 12
24 10 16 8 28 11

= 30,5 / 5 = 6´1
Rango Medio Rango Medio =
31 / 5 = 6´2 Rango Medio =
58,5 / 5 = 11´7
2 2 2
Σ RANGOS = 930,25 Σ RANGOS = 961 Σ RANGOS = 3422,25
2 2 2
Σ R / 5 = 186,05 Σ R / 5 = 192,20 Σ R / 5 = 684,45

Asumiendo que la distribución de consumo es continua y α = 0,10. Se trata de tres muestras


independientes y los datos están medidos en una escala de razón.

Hipótesis !
H0: No existen diferencias poblacionales en el consumo semanal de chocolate entre N, MA y HA.
H1: Existen diferencias poblacionales en el consumo semanal de chocolate entre, al menos dos grupos.

Estadístico de Contraste ! Kruskal – Wallis H = {12 / N (N + 1)} · {Σ (R2 / n} – 3 (N + 1)

H = {12 / 15 (15 + 1)} · {186,05 + 192,20 + 684,5} – 3 (15 + 1) = 5,135

El estadístico de contraste sigue la distribución X2 con (3-1) gl y α = 0,10 ! X22; 090 = 4´61

Decisión ! Como 5,135 > 4,61 Se Rechaza la Hipótesis Nula (Comparaciones múltiples ! Las tres
muestras son equilibradas)
_________________ _______________
MVKV = Z adj √ N(N+1) /12 · (∑1/ni) ! MVKV = 2´13 √ 15(16) /12 · (1/5) ! MVKV = 4´26

Donde Z adj ! [1 – (α / 2c)] ! [1 – (0´10/ 6)] = 0´9834 (Z = 2´13) (c = 3 comparaciones)


_ _
| RMA – RN | = | 6´2 – 6´1 | = 0,1 < 4´26 Diferencia no significativa
_ _
| RMA – RHA | = | 6´2 – 11´7 | = 5´5 > 4´26 Diferencia significativa
_ _
| RN – RHA | = | 6´1 – 11´7 | = 5´6 > 4´26 Diferencia significativa

Interpretación del resultado en el contexto de la investigación ! Existen diferencias significativas en


el consumo semanal de chocolate entre N, MA y HA a un nivel de confianza del 90 % considerado
globalmente. Analizando los resultados, las diferencias se dan entre N y MA con HA.

R. MEDRANO (TUTOR) Página 9


DI
SEÑOSDEI
NVESTI
GACI
ÓNYANÁLI
SISDEDATOS

I
NTRODUCCI
ÓN.CONSEJOSBÁSI
COSDEESTUDI
O

I.
-Elexamenconst
adet r
essi
tuaci
ones,cadaunadelascual
escompr
ende
unmíni
mode7preguntasyunmáximode10, par
auntot
alde25:

-Laprimer acompr endelost emas1- 4:Teor í


adel ai nf
erenciaest adí
sti
ca,
cálculodei nter
valosdeconf ianza,contr astedehi pótesis,valoryni velcrí
ti
co
sobr elamedi a,l
apr oporci
ónyl avarianza.Elt ema1eselmásl ar
goyesel
fundament al
,expr esa los f
undament os t eóricos de t oda la asignatura.Los
demássondesar roll
os,enlost emas1- 2par adi señosconunamuest raylos
temas3y4, paradiseñoscondosmuest ras.
-Lasegunda,lost emas5-7:Compr endel osanál isisdev ari
anza( ANOVA)con
variasmuest r
as.El t
ema5esel equiv
alent eal tema1.
-Later
cera,sóloel t
ema8: Análi
sisder egresiónlinealymúl ti
ple.

Enconsecuencial ológicoesdedicarlamay orpar t


edelt iempoaest udiary
asi
mi l
arbienl osconceptosdel ostemas1y5( fundament ost eór
icosdel a
asi
gnaturayl osANOVA)yelt ema8( anál
isisder egresión).LosANOVAson
cál
culosmuycompl ejos;enelexamendanl osdat osintermediosyset r
atade
completarlosquefal
tan,par al
ocualhayquet enerencuent alasrelaci
onesentre
sumasymedi ascuadráti
casyl osgradosdel i
ber t
adpar acompar arelval
ordeF
conlosv al
oresdelastablasalhacerelcontr
astedehi pótesis.Yparalosdiseños
máscompl ejoslaspreguntassuelenserdeteoría.

II.
-Apr oximadament eent r
e2/ 5ylami taddel aspreguntassondet eorí
a.Es
fundament aldomi narl
a,por quesisecont estanbi enlaspr eguntasdet eoría,
supone2/ 3delapr obadoysisecont estanmal ,esimposibl
eapr obaraunquese
haganbi enl ospr oblemas.Ademássudomi nioper mit
epl antearyr esolv
erlos
correctament e.Esmuyi mpor t
antefij
arsebi enenl oquepidenyl osdat osque
nosof recenpar aident i
fi
carelpr obl
ema:“ Distintoodi f
erent
e”,implicacontraste
bil
ateral(doscol as);“may oromenorque” ,unil
at er
al(unacola).Cuandosehabl a
deunpar ámet r
ogenér i
co, seestánrefi
ri
endoal amedia;porcentaj
eesl omi smo
quepr oporciónyv ariabi
li
dadesv ari
anzaodesv i
acióntí
pica.

Latécni
caopr
ocedi
mient
opar
aelcont
rast
edehi
pót
esi
sessi
empr
ela
mi
sma:

1.-Det er
minaci
ón delossupuest osdelproblema(ti
posdedi seño yde
contr
aste).
2.-Formulaci
óndelashipót
esisest
adíst
icas(
nulayal
ter
nati
va).
3.-Elecci
ónycálculodelestadí
sti
codecontraste(
EC),el
i
giendolafór
mula
corr
ecta.
1
4.
-Deci si
ónsobreelrechazoonodel ahi
pótesi
snul
aplanteadaparaelnivel
designifi
caciónαdeseadooquenosden,medi ant
elacompar aci
ónentreel(o
l
os)v alor
(es)crí
ti
co(
s),cálculodelni
velpcr
ít
ico,t
amañodelef ect
oyav eces,
pot
enci adelcontr
ast
e.
6.
-Concl usión e i
nter
pr et
aci
ón de l
os r
esult
ados en elcontext
o de la
i
nvestigaci
ón.

TEMA1:
ESTI
MACI
ÓNDEPARÁMETROSYCONTRASTEDEHI
PÓTESI
S

1.
-Concept
osbási
cos.

Lainfer enci
aestadísticaesl apartedel acienci
aest adísticaqueestudi
alos
procedimi entosat r
avésdel oscualessepuede:
Esti
marconunel ev adogr adodepr obabi
li
daddet erminadaspr opi
edadeso
parámet ros de una pobl ación,parti
endo de l os estadísticos di
sponibl
es o
calculadosenunamuest r
adel ami smaobt eni
dadef ormaal eator
ia.
Al ai nversa,estudiarsidet erminados v al
ores muest ral
es se apart
an
si
gni f
icati
v ament edelospar ámet r
ospobl aci
onales.

Enest aasi gnaturalosest adí


sti
cossobr el osquesev aat r
abajarsonl a
media,lapr oporci
ón,lav ar
ianza( osuraízcuadr ada,ladesviacióntípica)ylos
coefi
cientes de regresi
ón,cor rel
aci
ón ydet erminaci
ón,aunque l ai nferenci
a
pueder eali
zarsesobr ecualquierotr
oest adísti
co( mediana,moda,r ango,et c.
),
exi
sti
endounpr ocedimientoof órmul
adiferentepar acadaestadísti
co.

-Eler
rormuestralesladi
fer
enci
aentreelresul
tadoobteni
doenlamuest
ray
el
quehabr í
amosobt eni
dosisehubi
esetrabaj
adocont odalapobl
aci
ón.
-Eler
rortí
picoesladesvi
aci
óntí
picadelestadí
sti
co.

Si obt enemos disti


ntas muest
ras al
eatori
as de una pobl ación, l
os
est
adísticosdecadaunadeel l
ast
omaránvalor
esdiferentes.Ladist
ribuciónde
l
osest adísti
cosmuestral
essecompor t
acomounav ariablealeat
ori
a,conocida
comodi str
ibuci
ónmuest r
al.Esmuyi mpor
tantedisti
nguirynoconf undirl
os
si
guientesconceptos:

a)Dist
ribuciónde( oen)l amuest ra:Sonl osdat osov al
ores(dist
ribuciónde
fr
ecuenci as)quet omal avariableenunamuest r
aconcr eta.Lamedi a,
medi ana,proporción, desvi
aci
ónt í
pica,correl
ación,
etc.delamuest ra,son
l
osest adísticos.
b)Dist
ribución pobl acional:Son l os dat os o v al
ores (distr
ibución de
fr
ecuenci as)quet omaunav ariableenelconj untodel apobl ación.Su
medi a,medi ana,pr oporci
ón,desv i
aciónt í
picas,et
c.sonl ospar ámet ros
poblacionales.
c)Dist
ribución muest ralde un est adíst
ico:Son l os datos o v alores
2
(di
stri
bucióndef r
ecuenci
as)quet omaunav ari
abl
eoest adísti
coenel
conjuntodet odaslasinf
init
asmuest r
asquepuedenobt ener sedeuna
población.Comoent odadist
ri
buci
ón,tambiéndeladist
ri
buci ónmuest ral
,
podemos obt enersu medi a ysu desvi
ación t
ípi
ca o errort í
pico del
estadísti
co.

Cuandolosestadíst
icos(muestrales)seref
ier
enaunamuest raconcreta,se
desi
gnanconl et
raslati
nasmayúscul as(Mediadelamuest r
a=Y,Varianzadel a
muest a=S2,
r Proporci
óndel amuest ra=P).Losmi smosparámet
rosrefer
idosa
l
apobl aci
ón,
seindicanconloscaracteresgri
egosequival
ent
esenminúsculas( µ,
2
π,σ) .

3
2.Di
str
ibuci
ónmuest
ral
del
aMEDI
A.

Hayquedi
sti
ngui
rtr
essupuest
os:

1.-Siladistr
ibuci
ónpoblacionaldel av ariabl
edeest udioesnor malcon
mediaµ yv ar
ianzao desvi
aciónt í
pica σ conocidas,coni ndependenciadel
tamañodel amuest r
a,ladi
stri
buciónmuest raldelestadíst
icomedi aest ambi
én
normal,siendo su media y desviaci
ón típica (o err
ort ípi
co de l a media),
respect
ivamenteµY yσ/n( fórmula1,pág.9delf ormulario).Sitipif
icamoslas
medidas,seráN(0,1)
.

2.-Sisedesconocel avari
anza(olaformadeladistr
ibuci
ónpobl
acional
),el
estadísti
co mediasedi st
ri
buyecomo unaT deSt udent,conn-1gradosde
l
ibertadyusar emosladesvi
aci
ónt í
picai
nsesgadaocuasidesvi
aci
óntí
picadela
muest ra(fór
mula2,pági
na9del f
ormular
io,oj
osiempren-1envezden).

3.-Enelsupuest o2,sil amuestraesl osufici


entementegr ande( n>30o
n>100,segúnlosautores),aunqueelest
adíst
icomedi aseguirádi
st r
ibuyéndose
según la T de Student,porelTeor ema CentraldelLí mitetender á a una
dist
ri
buciónnormalypodr emosusarlaprimerafórmuladelcuader ni
llosiempre
queseut il
i
cenladesv i
aciónt í
picai
nsesgadaocuasi desv
iaci
ónt ípicadel a
muestraconn- 1env ezden,sin.Sino,saldrámal( pr
oblema1delexamende
septi
embr e-
2016)
.

3.Di
str
ibuci
ónmuest
ral
del
aPROPORCI
ÓN.

Enlasv ari
ablesdi cotómicasodi cotomi zadas(lasquesól opuedent omar
dos valores),la propor ci
ón es elpor centaje de elementos que t i
enen una
deter
minada pr opi
edad ( éxi
to)en r el
ación con elt otal
.Las probabi l
idades
asoci
adasacadav alorconcr etosedi st
ribuyensegúnl adist
ri
buciónbi nomi al
conparámet rosnyπ.Conmuest r
asgrandesl abinomi alti
endeaapr oximar sea
l
anor malN( π,σp),(f
ór mula3, pági
na9delcuader ni
ll
o).Enestaasignaturapar a
resol
verlospr oblemassól oseusal adistr
ibuciónnormal .

4.Di
str
ibuci
ónmuest
ral
del
aVARI
ANZA.

Ladistri
buci
ónmuestr
aldelavari
anzaseaj aaunaχ2(
ust chi
-cuadr
ado),con
2
n-
1gr adosdel i
ber
tad.Cuandolamuestraesmay orde100,laχ t i
endeal a
2
nor
mal ,aunquel
avari
anzasi
guedist
ri
buyéndosesegúnlaχ.

Esmuyimport
anter
etenerquecadaestadí
sti
cosedist
ribuy
econsupr opi
a
funci
óndedist
ri
buci
ónquenocambi aconelt amañodel amuest r
a;cuesti
ón
dif
erent
eesqueporelTCLcuantomay orsealamuest
ra,taldi
str
ibuci
ón(Tde
4
Student
,binomi
alochi
-cuadrado)seapr
oxi
memásal anormal,
perodebeusarse
si
empr elaf ór
mula delest adí
sti
co que cor
responda,aunque l
uego dicho
estadí
sti
coseuseenlatablanormal.

5.
-ESTI
MACI
ÓNDEPARÁMETROS:
PUNTUALYPORI
NTERVALOS.

Unest imadoresunest adí


sti
cocalcul
adoenl amuest raqueseut il
izapara
esti
maroel abor
arhipótesisacercadelval
ordelpar ámetr
ocorrespondienteenla
población.Parat odopar ámetroexistendiversosestimadores,condi ferent
es
propiedades.Porejempl o,paralamedi apoblaci
onalpodríanuti
li
zarselamedi a
ari
tmét i
caol amedi ageomét ri
cadelamuest ra.Elusodeunodeot r
odepender á
delpar ámetroquepr etendaest imar
seydel abondadenelcumpl i
mi entode
determinadaspropiedades.

Laspr
opi
edadespr
inci
pal
esdel
osest
imador
esson:

a)Sesgo:Unest imadoresi nsesgadocuandosuv al


oresper ado,esdeci r,la
medi adeladi stri
buciónmuest ral
,coincideconel parámetroest i
mado.
b)Efi
ciencia o pr eci
sión:Esl ainversa de lav ari
anza.Un est i
madores
efi
ciente cuando t i
ene poca v ar i
abil
i
dad. Ent re dos est i
madores
i
nsesgadosesmásef ici
enteelquet i
enemenordesv iaci
ónt ípicaoer ror

picodemedi dayport anto,menorv ari
anza.
c)Consistencia.Unest imadoresconsi st
entecuandoalaument arelt amaño
del amuest ra,lavarianzadelest i
madordi sminuy e,t
endiendoenell ímite
a0.
d)Sufici
encia.Unest imadoressuf i
cientesiparaest imarelpar ámet rodel a
poblaci
ónut il
izat odosl oselement osoi nf
ormaci óndi sponiblesenl a
muest r
a.

La propi
edad de l
os est
imador
es i
nsesgados yef
ici
ent
es (
con v
ari
anza
pequeña)sell
amaacuraci
dad.

Losest adí
sti
cosmedi a,pr oporciónycoef i
cientedecor rel
aciónmuest r
ales
son est imadores insesgados,ef icient
es,consi stent
es ysuf icientes de los
parámetros media,pr oporción y coef i
cient
e de cor rel
ación pobl aci
onal.La
medianaesef ici
enteyconsi st enteper onoesi nsesgada;nitampocosuf ici
ente
alusarsólolosvalor
escent ralesdel amuest r
a.

La v ari
anza muestralno es un est imador insesgado de l av ari
anza
poblacional
,aunquesícumpleconlasotrastrespropiedades.Porelcontrar
io,l
a
cuasivari
anzamuest r
al( ovar
ianzainsesgada,calculadasobren- 1)síesun
esti
madori nsesgadodel av
ari
anzapoblacional,per
oesmenosef i
cient
equel a
vari
anzamuest ral
.

5
Resumendel
aspr
opi
edadesdeest
adí
sti
cos

Car
enci
adesesgo Ef
ici
enci
a Suf
ici
enci
a Consi
stenci
a
Medi
aAr
it
mét
ica SI >Medi
ana SI SI
Medi
ana NO <Medi
a NO SI
Pr
opor
ción SI -
--
-- SI SI
Var
ianza NO >S2n-1 SI SI
2
Cuasi
var
ianza SI <S SI SI
Laesti
macióndepar ámet rosapar ti
rdel osest adí
sticosmuest ralespuede
serpuntualoporinter
valos.Enl aesti
maciónpunt ualseut i
li
zadi r
ectament eel
valordelest adí
sti
co calculado en una muest ra aleatori
a concret a como
verdaderoval
ordelpar ámetropobl acional.Sinembar go,comoesmuypoco
probablequeasíocurr
a,espr efer
ibl
edef i
niruni nt
ervalodev al
oresent r
ecuy os
l
ími tes i
nfer
ior y super i
or se encont r ar
á, con una al ta pr obabil
idad
predeter
minada,elver
dader ov al
ordelpar ámet r
o.A est epr ocedi
mient osel e
conoceconel nombredeest i
maci ónporinter v
alosdeconf ianza.

Lapr obabil
idadsobrelaquesecalcul
aelinterv
alodeconfianza,sel l
ama
ni
veldeconf i
anza(1-α)ysedefinecomol apr
obabil
idaddequeelpar ámetro
poblacionalestéconteni
do ent
relosextremosdeli nt
erv
alo.Lapr obabil
idad
compl ementari
a delnivelde confi
anza (α)r
ecibe elnombr e de nivelde
si
gnifi
cación.

Par auntamañodemuest r
adado, cuantomay orsealaamplituddeli nter
valo,
may orseráelni veldeconfianza(pr
obabi l
idaddequeelv al
orpobl aci
onalest é
dentrodelmi smo),peromenorl apr eci
sión( puestoqueeli nt er
valoesmás
ampl i
o).Cuant omay orsealadisper
siónmuest ral(var
ianzaodesv iaciónt í
pica,
sesgadaoi nsesgada),menorser áelni veldeconf i
anza.Sóloalaument arel
tamañodel amuest ra,seincrementanl apr ecisi
ónyelni veldeconf ianza.En
consecuencia,par aunni veldeconf ianzadado,l aampl i
tuddeli nt
er v
alo de
confianzatendráqueserporf uer
zamay orcuant omenorseaelt amañomuest ral
ocuant omay orsealadispersi
ónmuest r
al.

Losint
erval
osdeconf i
anzasecal cul
ansegúnl asfórmulascorrespondient
es
acadaestadíst
icoenlacolumna2ªdel apági na9delformular
io.Par alamedia
seuti
li
zaladelafil
a1ªsi l
avari
anzapobl acionalesconoci
da(normal )olasdela
2ªsiesdesconoci da(TdeSt udent,aproximadaporl anor mal,sin>100per o
usandolamismaf órmul
adelestadísti
co).Paralaproporci
ón,l
afila3ª( nor
mal)y
2
paralavar
ianza,l
a4ª( χ,aproxi
madaporl anormalsin>100,fi
la5ª ).Entodos
l
oscasos,unami taddelniveldesignifi
caciónα/ 2quedaporenci madell ímit
e
superi
orylaotr
a,pordebajodell
ímiteinf
eriordeli.
c.

Cuandol
afunci
óndedi
str
ibuci
óndelest
adí
sti
coessi
mét
ri
ca(
nor
maloTde
6
Student
),bastaráconcal cularelvalorcorrespondientea1- α/
2,calculareler ror
máximoysumar l
oyr estar
lodelv al
ordel amedi aopr oporci
ónmuest r
al,que
ocuparáelv alorcentral(mediaopr oporci
ónmuest ral+/ -Emax).Sinembar go,
cuandonol oes( varanza,χ2,chi
i -cuadrado),hayquebuscarenl at ablalosdos
valor
escorrespondi entesaα/ 2ya1- α/2par acal cularlosl ímit
esi nferiory
superi
ordeli nterval
odeconf i
anza,estandoelv alorinferi
ordeli nterval
omás
próxi
moal av arianzamuestralqueel superi
or.

Eltamañomí nimodel amuest rapar aesti


marl amedi aol apropor ci
ón
pobl aci
onalconundet er
mi nadopor centajedeerrorsecalcul
aconl osv alor
es
correspondientesacadaf i
laenl acolumna3del apágina9delf or
mul ari
o.La
preguntairár ef
eri
daaunni veldesignif
icaciónodeer r
ordif
erent
ealαi nici
alde
tr
abaj oparauner rorexpresadoenunpor cent
aje(2o3%,porej emplo)oenun
valorabsoluto,sobreelquecal cul
arl
o.
I
NTERVALODECONFI
ANZAPARALAMEDI
A

N(
0,1) t
n-1gl
2 2
Dist
ri
buci
ónNor
mal
(Conoci
daσ) Desconoci
dal
aσ (
Muest
ras
pequeñas)

̅ ̅ ̅
X-(
Zα/2)·(
σX/ n)<µ<X +(
Z1-α/2)·(
σX/ n) X-( Sn-1/n)<µ<X +(
tα/2)·( t 2)
1-α/ ·(
Sn-
1/n)

7
6.
-CONTRASTE(
opr
ueba)DEHI
PÓTESI
S.

Una hipótesi
s estadísti
ca es una conjet
ura que se for
mula sobre una
pobl
aciónyquepuedesomet erseapruebaocont rast
aci
ónempír
icaaparti
rde
unamuest rarepresentat
ivadeesapobl aci
ón.Unav ezquelahi
pótesi
sseha
contr
astado se pueden t omardeci si
ones sobrel a mi
sma.Elcont r
aste de
hi
pótesisesunapar t
eesenci aldelmétodoci
entíf
ico.

Lamet odologíadelcont rasteesf rutodelost rabajosdeFi sher,Neymany


Pearson.Sul ógicarecuerdaal adeunj uicioenunest adodederecho: Elacusado
(l
ahipót esi
snul a)esinocent e(verdadera)hast
aquel aspruebas( contr
aste)no
demuest renlocont r
ario.Silosdatos( EC)aportanresul t
adossignifi
cati
vamente
dif
erentesdel ospl anteadosenl ahipótesisnula(VC) ,éstaesr echazadayse
acepta l a hipótesis alter
nat i
va. En caso cont rar
io, se mant iene como
provi
sionalment everdaderahast aqueseencuent rennuev asevi
dencias.

Paraelcont
rast
edehi
pót
esi
ssedebenf or
marunahi
pót
esi
snulaH0 yot
ra
al
ternat
ivaH1.Enlahi
pót
esi
snula,f
orzosament
edebeest
arelsi
gnoigualy
8
ademáspuedenestarelmayorqueoelmenorque,per
onoambosalav ez.Enl
a
H1nuncaest
áelsignoigual
,conl
asexcepci
onesquesever
ánencadacaso.

Engener al,l
ahi pótesisnulaaf i
rmaquenoexi stedif
erenci
aent r
eelv alordel
estadí sti
co obt enido en l a muest ra yelque f or
mul amos como par ámet ro
pobl acional,esdeci r,
quel adiferenciaobser vadaentreestosdosv al
oresesnul a.
Sin embar go,como elv al
ordelest adísti
co muest raly eldelpar ámet ro
pobl acionalr aravezcoi ncidi
rán,loqueseaf i
rmaesquel adifer
enciaobser vada
entreambospuedeexpl i
carsecomo r esult
ado delazar .Esto es,quesise
repitiesel ai nvesti
gaciónunnúmer osuf ici
ent edev ecesconot r
asmuest ras
aleator i
as delmi smo t ipo yt amaño ext raídas de l
a poblaci
ón,l a mediao
esper anza mat emát i
ca de l as diferencias observadas entr
el os valores del
estadí sti
coyelpar ámet ropobl acionalformul adoenlahi pót
esisnulatenderíaa
desapar ecer( v
alorcero).

Paracadahipótesisnulaseplanteaunahipótesi
salter
nat
iva,r
epresentada
porH1,queeslanegaci óndel ahi
pótesi
snula,detalformaquesilahi pótesi
s
nul
aesf al
sal ahipótesisalt
ernat
ivati
enequeserf or
zosamenteverdader ay
vi
cever
sa.Por tanto,est as dos hipótesi
st i
enen que ser exhaustivas y
mutuamenteexcl
uyentes.

Dependiendodecómoest éformul
adalahi pótesisnulasemarcaladi recci
ón
delcontr
aste.Sil
ahipót
esisnulaH0estáplanteadacomoi gual
daddev aloresyla
al
ternati
vaessunegación,esuncont r
astebilateralporquelaH1 admitequel a
dif
erenci
apuedaserposi t
ivaonegat iv
a.Si,porelcont rari
o,conocemosquel a
dir
ección en quelaH0 puedeserf alsasólo puedeserposi ti
vao negat i
va,
entoncestendremosuncont r
asteunil
ater
al.Ser áuncont r
ast
eunilat
eralderecho
siestamosbuscandounv al
orsuper i
oralpost ul
adoporl aH0 ei zquierdosi
estamosbuscandounv alorinferi
orparaelpar ámetropoblaci
onal(θ)dequese
tr
ate:

Cont
rast
ebi
l
ater
al Uni
l
ater
alder
echo Uni
l
ater
ali
zqui
erdo

H0:θ=θ0 θ≤θ0
H0: θ≥θ0
H0:
H1:θ≠θ0 θ>θ0
H1: θ<θ0
H1:

Elcontr
astebilat
eralsi
empreesmásconservador
,enelsent
idodequehace
másdi
fíci
lrechazarl
ahipótesi
snul
apar
aunmi smoniveldeconf
ianza.

El
procedi
mient
opar
ael
cont
rast
edehi
pót
esi
sesel
sigui
ent
e:

9
a.
-Condici
onesde l ainvesti
gaci
ón ysupuest
osque cumplen l
osdatos
obser
vados.Lavar
iabledebesercuanti
tati
vaymedir
seconunaescal
aderazón
odeinter
val
o(nosirv
epar avar
iabl
esordinal
esonominal
es)
.

b.-For mul acióndel ahi pótesisnul aydel aalt


ernat iv
a.Conf ormealcont exto
del ai nv estigaciónsef ormul anl ashi pótesisnul ayal ternativ
a.Engener alla
hipót esi
sci ent í
fi
ca, diri
gidaaencont rarresultadossi gnif
icativosesl aal ternativa,
que sól o se acept ará como v erdadera sielr esul t
ado delcont rast e apor t
a
evidenci ascont r
al ahipót esisnulaquesepr etender echazar .
Par anoconf undi rnos,esmej orformul arprimerol ahi pótesisalter nati
va,que
esl oquepr et endemoscont r
astar( silamedi adel apobl aciónesmay orque; sila
varianzaesmenorque,et c.).Unav ezf i
jada,lahipót esi
scont rari
aexcl uyent ey
exhaust iva,quef orzosament eincl ui
rási empr eelsi gnoi gual ,serál ahi pótesis
nula.Alf i
jarl ahipót esi
sal ternativasepl antearátambi énelcar ácteruni lateralo
bil
at eraldel contrast e.

c.
-El
ecci
ónycál
cul
odel
est
adí
sti
codecont
rast
e.

Elestadí
sti
co de contr
aster epr
esenta una medida est
andari
zada de la
discrepanci
a entr
elai nf
ormación proporcionada porlos datos empír
icos
recogidosenlamuestr
ayl aproposici
ónteóricaplant
eadaenlahipót
esisnul
a.

ElEC es una v ari


able al
eat
ori
a con una deter
minada di
stri
buci
ón de
pr
obabil
idad que depender
á delestadí
sti
co de que se t
rat
e y delti
po de
ex
perimento.

Elest
adí
sti
codecont
rast
eomedi dadediscrepanci
anodependedel
as
uni
dadesenqueest
émedi
dalavar
iabl
eysuf
ormulaciónhabi
tual
es:

d.
-Regl
adedeci
sión,
deacuer
doconel
niv
eldesi
gni
fi
caci
ónα.

Cal culadoelvalordelest adísti


codecont r
ast
eodi screpanciaent r
elosdat os
empí ri
cosobser vadosenl amuest raylosdat osteór
icosquepl anteamosenl a
hi
pót esis nula se t oma una deci si
ón respecto alr echazo o no de H0,
estableciendopreviamenteelni veldesigni
ficaci
ónque, segúnFi sher,r
epresenta
elmáxi mo riesgo de rechazaruna hi pótesisnulav erdadera.En pur i
dad,l a
hi
pót esisnulanoseacept a,sinoquenoser echaza(def ormapr ovisi
onal)
,porno
haberev idenciaempíricasuficientedesuf al
sedad.
10
Dicho de otro modo,además de def inirla discrepanci
a( estadíst
ico de
contrast
e)espr ecisoconsi derarcuant adiscr epanciaconsideramosadmi si
ble
paranoserat r
ibuiblealazar.Esdeci r,debemosdet erminar,aprior
i,cuálserála
di
ferenci
amáxi maent reelestimadoryelpar ámetroqueest amosdi spuestosa
consider
arcompat i
bleconl aH0.Est adeci sióndepender ádel adistri
buciónde
probabil
i
daddel amedi dadedi screpancia,del adirecci
óndelcont r
asteydel
ri
esgodeer r
orqueest emosdi spuestosaasumi r
.

Cual quieraqueseal aformadel af uncióndedi st


ribuci
óndelest adísti
code
contr
ast e,sielcont rasteesbilateraltendremost reszonasdel imit
adasporl os
dosv alorescr ít
icosquesesi t
úanenelej ehor i
zontaldel adistr
ibuciónmuest r
al.
Siladistribuciónessi métri
calapr eguntahabi t
ualparal oscontrastesbi lat
eral
es
es“ v
alorcr ít
icoenv alorabsoluto”.Sielcont rast
eesuni later
alizqui erdosolo
tendr
emosdoszonas, siendolaregiónder echazolasi t
uadaenl apar t
ei zquier
da
deladi stribuciónysielcont r
asteesuni l
ateralder
echo,l aregiónder echazose
sit
uaráenl apar t
ederechadel adi str
ibuciónmuest ralcomoser epresentanen
l
ossi guient esgráfi
cosesquemát i
cos:

CONTRASTEUNI
LATERALI
ZQUI
ERDO CONTRASTEUNI
LATERALDERECHO

Zona ZonaAcept
aci
ón ZonaAcept
aci
ón Zona
RechazoH0 H0(
1–α) H0 (
1–α) RechazoH0
|
--
--
--
--
-|
--
--
--
--
--
--
--
---
--
---
--
----
--
--
--
--
--
--
--
-| |
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
|-
--
--
--
-|
α / VALOR CRÍ
TICO VALORCRÍ
TICO / 1-α

CONTRASTEBI
LATERAL Val
oresα/1-α/Zmásf
recuent
es

11
Val
orcr
ít
ico(
Zα/2) Val
orcr
ít
ico(
Zα/2) α 0´
05 0´
01 0´
001

1-α 0´
95 ´
99 0´
999
Z -1´
96 - -
α/
2 2´
58 3´
29
Z1-α/2 1´
96 2´
58 3´
29
α Ni
vel
desi
gni
fi
caci
ón

1–α Ni
vel
deconf
ianza
Zα/2 Z(
Tabl
aII
Inegat
iva)
Z1-α/2 Z(
Tabl
aIVposi
ti
va)

Lasgr
áfi
cassei
nter
pret
andel
asi
gui
ent
emaner
a:

-En elej ei nferi


orhor izontal( abscisas)se r epresentan l
os v alor
es del
estadísti
co.En l a nor maly T de St udentv an de menos a más i nfini
to,
2
coincidi
endoel0conelpi codel acur va.Enl aχ yl aFdeFi scher
-Snedecor,de0
ainf i
nit
o.
-La cur var epresental a di st
ri
buci ón o f r
ecuencia para cada v al
ordel
estadísti
co.
-Eláreacompr endidaent r
elacur va,elejedeabsci sasyelej eper pendicul
ar
correspondi enteal val
ordel estadísti
cor epresentalaprobabi l
i
daddequesedéel
val
order eferencia,entre0y1.
-Last ablasdanl apr obabili
daddequeelest adíst
icotomeunv alori
gualo
i
nfer i
oralder eferencia,esdeci r,eláreacompr endidaent r
el acurvayelej ede
abscisassi tuadoal aizquierdadelv alordel av ari
able(loponeenelgr áfi
coque
hayenci madel ast ablas)

Elnivelde signifi
cación que suele ut i
li
zarse en l a mayor í
a de las
i
nvest
igaci
onesesdel0, 05,aunqueeninvestigacionesmásr i
gur
osasset r
abaj
a
conunniveldesi
gnif
icaciónde0,01yauni nferi
or.Ser echazarál
ahipótesisnul
a
si
emprequel apr
obabili
daddeexpl i
carlosresultadosobt eni
dosenr el
aciónala
H0seamenorqueel niv
el designi
fi
caci
ón.

Unav ezfi
jadoelni
v eldesignif
icación,seobtienenelval
oroval
orescr í
ti
cos
deladi st
ri
buciónmuestralquemar caránl oslí
mitesdel azonadeaceptaci
óno
rechazodel aH0 oseal amáxi madi ferenci
aquepodemosadmi ti
r,porsimple
azar,entr
eelvalort
eór
icoplanteadoenH0yel valorobteni
doenlamuestra.

Lazonader echazodelaH0dependedelniveldesigni
fi
caciónαyeselár ea
deladistr
ibuci
ónmuest r
alquecorrespondeaunv al
ordel adiscr
epanci
at an
al
ejadodeH0quel aprobabi
li
daddeobtenerl
o,si
endoH0v erdader
a,esi
nfer
ioral
12
valordesi gni
fi
cación.Lar egi
óndenor echazodeaH0,compl ementari
aal a
anteri
or,dependedelni veldeconfianza,1- αyeselár eadel adistr
ibuci
ón
muest r
alquecor respondeav al
oresdel adi scr
epanci
atanpocoalejadosdel
formuladoenlaH0quel aprobabi
li
daddeobt ener
lossi
endoH0v
erdaderaesmuy
elevada,noexi
sti
endoev idenci
apararechazar l
a.

Port anto,sielestadísti
codecont rast
esesi t
úaenl azonadeNOr echazo, l
a
diferenciaobser vadanoessi gnif
icati
vaysedebeaer roresal
eat or
iosporl oque
nopodemosr echazarlahipótesisnulaconundet er
minadoni veldeconf ianza.En
caso de si tuarse en la zona de r echazo,diremos que elv alordelEC es
si
gni fi
cat i
vo par a un determinado ni velde signifi
cación y se r echazarál a
hipótesisnul a.Endef i
niti
va,sielv alorabsolutodelECesmay orqueelv al
or
críti
co( elcorrespondientealniveldesi gni
fi
cación),
ser echazalahipót esisnulay
noser echazar áencasocont r
ari
o.

Ladecisiónpuedetomarsetambiénmedi
anteelcálcul
odelnivelpcr í
ti
co,
queesl apr obabil
i
daddeobt enerunosr
esul
tadoscomol osobser
v adosenla
muest r
abaj oelsupuest
odequel aH0esci
ert
a.Laregl
adedecisi
ónat r
avésdel
nivelcrí
ti
coesj ustolainv
ersa:Sipes≤α,rechazar
emosH0,ysip>α,nol a
rechazaremos.Estoes:

Ho( Cierta) (
p)esmay orque( α) Elvalorseencuent raenelinter
val
ode
conf
ianza.Elv al
ordelestadí
sti
coest áentrelosvalorescr
ít
icos.
Ho( Falsa)(p)esmenoroi gualque( α)Elv alorest
áf uer
adelinter
val
ode
conf
ianza.Elv al
orabsolutodelestadíst
icoesmay orquelosv al
orescrí
ti
cos.

e.
-Conclusi
ón.Formulada l
a hipótesi
s nula,provisi
onalmenteverdadera,
someti
daacont r
asteempí
ri
coyunav ezcal
culadoelestadíst
icodecontr
aste,se
concl
uyerechazándol
aomant eniéndolasegúnseai ncompatibl
eonoconl a
evi
denci
amuest r
al.

f
.-Inter
pret
aci
ón.Laconclusi
ónsi
mpleyl l
anaentérminosderechazoonode
l
ahipót esi
snul
ati
enesucorrespondi
ent
ei nt
erpr
etaci
óndentrodelcontext
odel
a
i
nvestigaci
ónydel ahipótesisyobjet
ivosqueeli nvesti
gadorformulaensu
t
rabajo.

RESUMENDELPROCEDI MIENTODELCONTRASTEDEHI PÓTESIS)


1.
-Det erminaci
óndelossupuest osdelproblema( car
acter
íst
icasdel a
var
iabl
eenl apoblaci
ónydat
osdel amuestr
a):Tamañoynúmer odemuest r
as,
sison i ndependient
es o r
elaci
onadas,sila distr
ibuci
ón de la pobl
aci
ón
conocida,etc.

13
2.-For mulacióndel ashi pótesi sestadíst
icas( exhaust
ivasymut uamente
excluy entes)deacuer doconl ahi pótesi
sci ent
ífica(H1yH0).
3.-Elecciónycál cul
odelest adísti
codecont r
asteapropiadoalpr oblema
planteadoycál culoconl osdatosmuest rales.
4.-Fijarα( r
egladedeci sión).Lazonader echazodel aH0est ar
áf or
mada
port odosl osvaloresdelest adísticotanext r
emosquel aprobabili
daddeser
obteni dosesmuypequeñabaj oelsupuest odequel aH0esciert
a.
5.-Deci si
ónsobr eelr echazoonodel aH0 medi anteelnivelcrí
ti
co( p)o
medi ant eelolosv alorescrí
ti
cos( α).
6.-Concl usión ei nter
pretación del osresul t
adosen elcont exto dela
i
nv estigación.

7.
-ERRORESENLADECI
SIÓNENUNCONTRASTEDEHI
PÓTESI
S.

Aldecidirentrelahipótesisnulaosual ternat
ivapodemoscomet erdost i
pos
deerrores:
-Er r
ortipoI(α):Eslapr obabili
dadder echazarunahipótesisnulaverdadera.
Coincideconelni veldesi gnif
icaciónα,fij
adoapr i
oriporeli nvest
igador.Su
compl ement ar
io,probabil
i
dad de acept aruna H0 v erdadera es elni velde
confi
anza.
ErrortipoI I(
β):Esl apr obabil
idaddeacept arunahi pótesisnulafalsa.Su
compl ement ar
io1-β,probabili
dadder echazarunaH0 f alsaesl apotenciadel
contraste.

Deci
sión Nat
ural
ezadeH0
VERDADERA FALSA

Deci
sióncor
rect
a. Deci
sióner
rónea
Nose
Ni
vel
deconf
ianza Er
rort
ipoI
I
r
echaza
1-
α β

Deci
sióner
rónea Deci
sióncor
rect
a
Ser
echaza Er
rort
ipoI Potenciadel
Ni
vel
desi
gni
fi
caci
ónα contrast
e
1-
β

14
Paraigualtamañomuest rall
adi sminucióndelerrort
ipoIaumentaelerror
ti
poII.Laopci ónporunouot rodepender ádelt i
podeexperi
ment oydesus
consecuenci
as;en un t ratamient
o médi co elerrorde ti
po IIes peor( no
benefi
ciar
sedeunt rat
ami entomásef i
caz,frent
ealcostedeinversi
ónenuno
quenol oes).Sinembargo, enunjuicioelerrordetipoIesmásgrave(condenar
auninocente,frent
eadejarlibreauncul pabl
e).

Laf uerzadeunfenómenosemi demedi anteelt


amañodelef ecto,coefi
ciente
que expr esa l
a magnitud de l
a dif
er enci
a observ
ada entr
e elv alorteórico
plant eadoporlahipótesisnul
ayelv alorobservadoparal
ahi pótesisalter
nativa
expr esadoenunamét ri
cacomún( estadísti
co“d”deCohen).Oscilaent r
e0e∞.
Seconsi deraelef
ectofuert
esies0,8omay or
,moderadosiestáent r
e0,5y0, 7y
débil siesmenorde0, 5.

15
TEMA2.
-CONTRASTEDEHI
PÓTESI
SENLOSDI
SEÑOSDEUNAMUESTRA.

1.
-INTRODUCCI
ÓN.(
Fór
mul
asdel
apági
na9del
for
mul
ari
o(UNAMUESTRA)
.

Cuandosetratadeinfer
irl
ascaracterí
sti
casdel apobl
aci
ónapar t
irdel
os
datosrecogi
dosdeunamuest r
a,l
ahi pótesi
sacont r
astarespreci
sament
euna
deter
minadacaract
erí
sti
cadeaquell
a.Loscont rast
esbasadosenunamuestra
puedenser:

-Par
amét r
icos,cuandoser efi
erenalestudiodeunparámet
ropobl
aci
onal
(medi
a,var
ianza,propor
ción,cor
rel
ación,et
c.)enunapobl
aci
ónconunaf
unción
dedensi
daddepr obabil
i
dadconocida.

-Noparamétr
icos,cuandonoser elaci
onanconpar
ámetr
ospoblaci
onaleso
seencuent
ranref
eri
dasadat osquepr ovi
enendeunapobl
aci
ónconunaf unci
ón
de densi
dad de probabil
idad desconoci
da.Son menos pot
entes que los
ant
eri
oresynoseest udi
anaquí.

Ademásdepar aesti
marparámetr
ospoblaci
onal
es,eli
nter
val
odeconfi
anza
puedetambiénaplicar
separaelcontrast
edehipót
esi
s.Sinembargo,esmucho
másf r
ecuenteobtenerelest
adí
sti
codecont r
ast
ecomounamedi damásexacta
deladi scr
epanci
aent r
eelv al
orplanteadoenlaH0 yelv al
orobteni
doenla
muestra.

Est
a medi da de la discrepanciat i
ene una di str
ibuci
ón de pr obabil
idad
conocidapar acadapar ámet r
oyv aacompañadadeunapr obabil
idad,ll
amada
niv
el crí
ti
cop, queeslaprobabi l
i
daddeobt enerunr esultadocomoel obteni
doen
l
a muest r
a,o más ext remo,baj o elsupuest o de que l a hipót
esis nula es
verdadera.Noesl apr obabil
idaddequel aH0 seaci ert
asinounapr obabil
idad
condicionada:SiH0fueraciert
a( condici
ón)elnivelpcr í
ti
coindicalaprobabil
idad
deobt enerunv al
ordelest adísti
codecont rastei gualomásext remoqueel
obtenidoefectiv
amenteenl amuest r
a( P(Y≥y i|H0)=p) .

2.
-CONTRASTESSOBRELAMEDI
APOBLACI
ONAL.

a)Cont
rast
esobr
elamedi
apobl
aci
onal
conoci
dal
avar
ianzapobl
aci
onal
.

Elest adí
sti
codecont rast
eeseldel afór
muladelafil
a1yl acolumna1del a
página9delf ormulari
o,quesedi st
ri
buyecomonormalN( 0,1),
siendoYl amedia
obtenidaenl amuest r
a,µo elv al
ordelamedi apoblaci
onalf ormuladoenl a
hi
pót esisnul
a,σY eler
rortípi
codel amediaodesvi
aci
ónt í
picadel adistri
buci
ón
muest raldel amedi a( denominador
),σ ladesvi
aci
ón típicapoblacionalque
suponemosconoci daynelt amañodel amuestr
aqueest amosut il
izandopara

16
cont
rast
arl
ahi
pót
esi
s.

Elestadí
sti
coZcuanti
fi
caladist
anci
adelamedi adelamuest
raalamedia
poblaci
onalenunidadesdelerr
ortípi
co(desv
iaci
óntípi
ca)deladi
str
ibuci
ón
muest r
al.

b)Cont
rast
esobr
elamedi
apobl
aci
onal
desconoci
dal
avar
ianzapobl
aci
onal
.

-Elestadísti
codecontrasteeselcor respondientealafi
la2del acolumna1
delapágina9del f
ormul
ario.
-Sedistri
buyeconarregloalaTdeSt udent,conn-1gradosdel i
ber
tad.
-Elerrortípi
codelamedi aodesv iacióntípicadeladist
ri
buciónmuestralde
l
a media se cal cul
a uti
l
izando la cuasidesviación t
ípi
ca o desvi
aci
ón típi
ca
i
nsesgadadel amuestr
a(denomi nador).

3.
-CONTRASTESOBRELAPROPORCI
ÓNPOBLACI
ONAL.

-Elestadí
sticoecont r
asteeselcorrespondient
ealafi
la3delacolumna1de
l
apági
na9del formul
ario.
-Sedistri
buy enor
mal menteconarregloalanormalN(0,1).
-Elerr
ort í
picodelamedi aodesv i
aci óntí
picadeladist
ri
buci
ónmuest ralde
l
amediasecal culaut
il
izandoladesvi
aciónt í
picadelamuestr
a(denominador).

4.
-CONTRASTEDEHI
PÓTESI
SSOBRELAVARI
ANZAPOBLACI
ONAL.

-Elestadísticodecont r
asteeselcor respondi entealafil
a4del acolumna1
delapágina9del f
ormul ar
io(usandolavar ianzamuest rali
nsesgada, conn-1).
2
-Sedi str
ibuy econar r
egloalaχ ( chi-cuadr ado)conn-1gr adosdel ibertad,
queadi f
erenciadel aN yl aT,noessi mét rica,aunquesít i
enel apropiedad
recí
procaoi nv ersa,demodoque,porej empl o,elv al
ordel adist r
ibuci
ónpar a
0,95esigualal 1/valorpara0,05.
-Paraelcál culodel osinter
valosdeconf i
anzaoer r
ormáximo, cuandon>100
sepuedeut i
l
izarl anormal ,per
oconl afórmul adel af i
la5yl av ari
anzanor mal
(noinsesgada).

5.
-CÁLCULODELAPOTENCI
ADELCONTRASTE.

Lapot enci
adelcont rasteesl aprobabil
idadder echazarunahipót esi
snula
queenr eali
dadesf alsa( i
gualal aprobabil
i
daddeacept arunaH1 verdadera)y
portantoesel compl ement ar
iodel er
rorti
poII(1−β)
, queeslaprobabil
idaddeno
rechazaruna hi pótesis nula que es fal
sa.Elcál culo de l
a potencia de un
contrast
epueder ef
erirseacual qui
erparámetro,per
oaquísól oseexponepar ala
mediayl aproporciónpobl aci
onales.

17
Par apodercal cularlapotenciadeuncont rastelashipótesisnulayal t
ernativ
a
debensersi mpl es,compar ándoseencadaunadeel lasunúni copar ámet r
o
pobl acional,env ezdeunr angodev alores(porej emplomedi a=7f renteamedi a
=9) .Port ant o,porexcepci ón,sepl anteandoshi pótesi
senl asquef i
guraelsigno
i
gualt antoenl ahi pótesisnulacomoenl aalternati
va.Lapot enciadelcont rast
e
variaráenf uncióndel tamañomuest ral yladistanciaentreelvalordel ahipótesis
nulayl ahipót esisalternati
va.
Par a un mi smo v al
ordeler rort ipo Iydi sti
ntos valores de H1,di chas
variacionesser epresent anmedi antel ascur vasdepot encia,quer epresentanla
potenci adeuncont rast
esegúnl osdi st
int
osv alor
esquepuedat omarH1 yel
tamañodel amuest r
a.
Par a calcularl a pot encia delcont r
aste,una v ezest ableci
do elni v
elde
signifi
cación:

a)Sedeterminaelv al
orcríti
codelestadísti
coquecor respondealni velde
si
gnifi
caci
ónelegido,segúnlafuncióndedistr
ibuci
ónapl i
cable.
b)A continuación,se calculala puntuación tí
pica correspondient
eal a
dif
erenci
aent
redi chov al
orobtenidoyeldelahipótesi
salternativa.
c)Laprobabili
dadasoci adaal apuntuacióntípi
cadedi chadiferenci
aesel
err
ortipoI
Io(β),siendolapotenciadelcontr
astelaprobabili
dadcompl ementari
a
será1−β.

Lodeseableenuncont rast
edehipótesi
sesquel asprobabi
li
dadesdeambos
ti
posdeer r
orfuer
anl omenorposi bl
e.Sinembar go,parauntamañodemuest r
a
prefi
j
ado, di
sminuirlaprobabil
i
daddelerrordetipoI ,
α,conduceaincrementarl
a
probabili
daddelerrordetipoII
,β.Elúni
cor ecur
sopar aaumentarlapotenci
adel
contrasteydisminuirlaprobabil
i
daddeer rordet ipoII
,esaument areltamaño
muest ral
.

6.
-NI
VELCRÍ
TICOpYERRORESENLOSCONTRASTES.

Dependi endodelni v eldesi gni


ficaciónαqueseadopt eapr i
ori,ladecisi
ón
queset omer espectodel aH0puedev ari
ar.Porejempl o,queunahi pótesi
snula
puedar echazarseconunni veldesi gnifi
caciónde0. 05per onode0. 01.Para
evit
arest osinconvenient es,seuti
li
zaeldenomi nadoni velcrí
ticop,quesedef i
ne
comoelni veldesignificaciónmáspequeñoalqueunahi pót
esi snulapuedeser
rechazadaconl amedi dadedi screpanciaobt enida.Esdeci r,elnivelcrí
ti
cop
cuanti
fical apr obabil
idad deobt enerunosdat oscomo l osobt enidosen la
muest r
abaj oel supuest odequel ahi pótesi
snulaesv erdadera.

Aluti
lizarcomocr i
teri
oelnivelcrít
icopnohayqueest abl
ecerpreviament
e
unniv
eldesi gni
fi
caci
ón, y
aquel adecisiónset
omaenf unci
óndel v
alordep.Sip
espequeñoser echazar
áH0, siesgr andeseacept
aráH0ysiestáent ornoaese
val
or,
sev uelveatomarnuev aevidenciamuestr
alyserepi
teelcontr
aste.Elni
vel
18
cr
ít
icopcomocr
it
eri
odedeci
siónt
ambi
éndependedelt
amañodel
amuest
ra
ut
il
izada.

Elni velpcr í
ti
coes“ elniveldesignifi
cacióndelEC” ,esdeci r,l
apr obabili
dad
asoci adaal a(s)cola(s)paraelvalordelEC.Enelcont rasteuni l
ater
alder echo, es
l
apr obabi l
idadquehayal aderechadelEC( coladerecha) .Comol atablanosda
elv alordepr obabil
i
dadquehayal aizquierda,elni velcrít
ico psecal cula
restandode1di chov alor
.Eneluni later
alizqui
erdo,esl apr obabil
i
dadsi t
uadaa
l
ai zqui erdadelEC( colaizqui
erda)yport anto,eselv alorquenosdal at abla.En
l
osbi laterales,comol asdoscol astienenelmi smov alor
,semul t
ipl
icapor2el
valordel acol aderecha.

Comoelni velpcr í
ti
coi nf
ormadel apr obabil
idadasociadaalv al
ormuest r al
obtenido,proporci
onai nf
ormaciónmáspr ecisaqueelECporsísól oyper mite
mat i
zarlasconcl usionesdelest udi
o.Porej empl o,sip=0.
011,nopodr í
amos
rechazarlaH0 paraunni veldesignif
icacióndel0. 01,perosiseprescindieradel
establ
ecimientodeunni veldesi gni
ficaciónpr edet er
minadopodríar echazarse
coneseni velpcrít
ico.
Recapitulaci
ón:Disti
nciónconceptual entrevalorcrít
icoyniv
elcrít
ico.

1º .
-Elv al
orcrít
icoeselv al
ordelestadí
sti
coparaunni veldeconf i
anza
2
determinado.¿Cómosecal cul
a?Sebuscadi r
ect
amenteenl at
ablaZ,T,χ oF
para0.95o0. 99,siescontr
ast
eunil
ater
alo0.975o0.995siesbil
ater
al.Elval
or
crí
ticodeZyTosci l
aentremásymenosi nf
ini
to,
eldechi
-cuadr
adoyFent re0e
i
nfinit
o.


.-Elni
velpcrí
ti
coeselniv
eldesigni
fi
caci
óndelestadí
sti
codecont r
aste,
esdeci
r,l
aprobabi
l
idaddequeelval
ordelavari
ableseaeldelamuestraomás
ext
remo.¿Cómopuedenpregunt
arl
oycómosecal cul
a?Vari
asposi
bil
idades:

a)Sinospidenelv alorpcrítcopar
i aundet erminadovalordel
av ar
iable,hay
quecalcul
arelestadí
sticocorrespondienteybuscarl aprobabil
i
dadasociadaal a
tabl
a.Sielcont
rasteesuni l
ateralderecho,elniv
el pcrí
ti
coes1menosel valorde
l
at abl
a.Siesbi l
ateraleser esultado semul t
ipli
capor2.Y siesuni l
ateral
i
zquier
do,elval
ordel atablaesel nivelpcrít
ico.

b)Sil
opidenpar
aunval
ordelest
adí
sti
codecont
rast
eseaelcal
cul
adou
otr
ohipot
éti
coquenosden,sebuscadi
rect
ament
eenl atabl
ayseprocede
comoena).

c)Sinocoi
nci
deexactamenteelval
ordelECconeldelat abl
a,sebuscanl os
val
oresdelest
adí
sti
comáspr óxi
mosporexcesoypordef ectoyl aprobabil
i
dad
asoci
adaal osmismoscalcul
adaconformea)ob) ,ent
rel oscualesest ar
áel
niv
elpcrít
ico(
nosofr
ecer
áncomor espuest
asvari
asdesi
gualdades).
19

.-Cont
rast
edehi
pót
esi
sconel
val
orcr
ít
icoyel
niv
elpcr
ít
ico.

Cuant
omásext r
emoeselv al
ordelest
adísti
codecontr
aste,menoressu
ni
velpcrí
ti
co.Port
anto,
lar
egl
adedecisi
ónexpresadaent
érminosequi
val
ent
es
es:

-Si
elECesmásext
remoqueelVC,
ser
echazal
aH0yseacept
aH1.

-Sielnivelp crí
ti
co cor
respondi
ente alEC es menorque elni
velde
si
gnif
icaci
ónα,ser
echazal
aH0yseacept aH1.

20
TEMA3.ANÁLISI
SDEDATOSPARADISEÑOSDEDOSGRUPOS.MUESTRAS
I
NDEPENDIENTES.(
Fór
mul
aspági
na10delcuader
nil
l
o)

1.
-INTRODUCCI
ÓN.

Paramej orarlosr esultadosdel ai nf


erenciaest adí
sticaoelcont r
astede
hipótesi
s,se pr ecisa trabajarcon dos o más muest ras.Las muest ras son
i
ndependi entescuandonoexi st
er el
aciónent r
el ossujetosdeunaydeot ra,l
o
quesegar antizasi l
ossuj etossonasignadosal eatori
ament eacadaunadeel l
as.
Lasmuest r
asest ánr elaci
onadascuando l osmi smossuj et
os( o par
ejasde
sujetosequi paradasenci ertasvari
ablesestudiadas,comogemel os)pasanpor
l
asdi ferent escondi cionesexper i
ment al
es.Sienambasmuest r
ashayelmi smo
númer odesuj etos,eldiseñoesequi l
ibrado.Sihaydi sti
ntonúmer odesujetos,el
diseñoesnoequi l
ibr
ado.Losdi señosconmuest rasrelacionadassólopueden
serequilibrados.

2.
-CONTRASTES DE HI
PÓTESI
S SOBRE DOS MEDI
AS EN MUESTRAS
I
NDEPENDI
ENTES.

a)Var
ianzaspobl
aci
onal
esconoci
das.

Lascondi cionesysupuest osson:Var i


abledependient
econ un nivelde
medi dadei nterval
oor azón,dospobl aci
onesquesedistr
ibuyennormalmente,o
ensudef ecto,muest rasgr andes( n1 ≥30y n2 ≥30)yenamboscasos,con
var
ianzaspobl aci
onalesconoci das.Lasfórmul
asparaelestadíst
icodecont
raste
yeli nter
valodeconf ianzaenest ecasosonl asquef i
guranenl afil
a1del a
página10del formulari
o( di
stri
buciónnormal).

b)Vari
anzas poblaci
onal
es desconoci
das supuest
as i
gual
es
(homocedast
icidad).

Lascondi cionesysupuest ossonlosmi smos,peronoseconocennil af orma


de lasdi stri
buci onespobl acional
esnisusv ari
anzas,per o ést
asúlti
masse
suponeni guales.Lasf órmulasparaelestadíst
icodecont rast
eyeli nt
ervalode
confianza son l as que f i
guran en l
af i
la 2 de la página 10 delformulari
o
(di
stribuciónTdeSt udent,conn1+n2-
2gradosdel i
bert
ad),enl aqueseut i
li
zan
l
osv aloresde l ascuasiv ar
ianzaso vari
anzasi nsesgadasmuest ral
es).Este
contrastedehi pótesi
sseconocecomopr uebaT.

c)Var
ianzaspobl
aci
onal
esdesconoci
dasysupuest
asdi
sti
ntas.

Lascondi
cionesysupuestosson:Var i
abl
edependi
ent
emedidaaniv
elde
i
nterval
ooderazón,dospobl
acionessupuest
ament
edist
ri
bui
dasnor
mal
menteo
21
ensudef ectomuest rasgrandes( n1 ≥30y n2 ≥30) .Lasfórmul
aspar ael
estadíst
icodecontrasteyl
osgr adosdel i
bert
adsonlasquef i
gur
anenlafi
la4de
l
apági na10( Welch,1938)(di
stribuci
ónTdeSt udent,conl osgr
adosdeli
bertad
quer esult
andelaf ór
mula),
enl aqueseut il
i
zanlosvaloresdelascuasi
var
ianzas
ovarianzasinsesgadasmuest r
ales.
3.-CONTRASTE DE HI PÓTESI S SOBRE DOS VARI ANZAS EN MUESTRAS
INDEPENDI ENTES.

Las condiciones ysupuest os son vari


able dependiente con un niv
elde
medida de interval
oor azón ydospobl acionescon v ari
ablesnor malmente
di
stri
buidas,obienn1≥30yn2≥30.Elest adísti
codecont rastesecalculasegún
l
asf ór
mul asdel afil
a5del apágina10delf ormulari
o( dist
ri
buciónFdeFi sher
conn1-1gr adosdel i
bertadenelnumer adoryn2- 1gr adosdel i
bertadenel
denominador).Sihayquecal cul
aral
gúnv al
orquenoapar eceenl atabladeberá
apl
icar
sel apropiedadinv
er sadeladist
ri
bución.

4.
-CONTRASTEDEHI
PÓTESI
SSOBREDOSPROPORCI
ONESENMUESTRAS
I
NDEPENDI
ENTES.

Condicionesysupuest os:Variabledicotómicaodi cotomizada( sólopuede


tomardosv al
ores),dosmuest raspr ocedentesdeobser vaci
onesal eatori
aso
i
ndependi entesymuest r
asgr andes( n1 ≥30y n2 ≥30) .Lasf ór
mul aspar ael
estadí
sti
codecont rast eyeli nterval
odeconf i
anzadedospr oporcionesen
muestrasi ndependient essonl asquef iguranenl afila6del apági na10del
for
mul ar
iosil adiferenciaentrelasdospr oporci
onesesi guala0( propor ci
ones
supuestasi gual
es)yl adel afil
a7siesdi sti
ntade0( distr
ibuciónN( 0,1)),
siendo
l
apr i
mer aunaapl i
caci óndel asegundacuandol asproporcionessoni guales.

5.
-TAMAÑODELEFECTO(
índi
ce“
d”,
est
adí
sti
codeCohen)
.

Lamagni tudot amañodelef ectoesuní ndice( ofami l


i
adeí ndices)quese
apli
cacuandohayi mpli
cadosalmenosdosgr upos, unodet rat
ami entoyot r
ode
controlyadi fer
enciadel oscont rastesclásicosesi ndependientedelt amaño
muest r
al.Lafórmulaqueseut i
li
zaesl adel af i
lanúmer o3del apági na10del
formulari
o(seutil
izanlascuasivarianzasov ariacionestípi
casi nsesgadascomo
esti
mador es)ycomoelnumer adorv aenv alorabsol uto,si
empr et endráunv al
or
posit
ivo(entre0ei nf
ini
to).SegúnCohensidesi gualomay ora0, 8,elefect
oes
grande,siesmenora0, 2,pequeñoymedi anosi r
ondael 0,5.

22
TEMA4.ANÁLI
SISDEDATOSPARADISEÑOSDEDOSGRUPOS.MUESTRAS
RELACI
ONADAS.(
Fór
mulaspági
na11delcuader
nil
l
o)

1.
-CONTRASTES DE HI PÓTESIS SOBRE DOS MEDIAS EN MUESTRAS
RELACIONADAS.(Todos l
os sujet
os pasan por l
as mismas condi
ciones
exper
iment
ales)

a)Var
ianzadel
asdi
fer
enci
asconoci
da.

Lascondi cionesysupuest osson:Var i


abl
edependi ent
econ un nivelde
medi da de int erv
aloor azón,población de dif
erenci
as que se di
stribuye
normal mente,oensudef ecto,muestr
asgr andes(n1 ≥30y n2 ≥30)yvarianza
poblacionaldel asdifer
enciasconocida.Lasf ór
mul asparaelestadí
sti
code
contrasteyeli nterval
odeconf i
anzasonl asquefi
gur anenlafi
la1delapági na
11del formulario(dist
ri
buci
ónnor mal
).

b)Var
ianzadel
asdi
fer
enci
asdesconoci
da.

Lascondi cionesysupuestosson:Var iabl


edependi entecon un nivelde
medida de i nterval
oor azón,población de di fer
encias que se dist
ribuye
normalmente, oensudefecto,muestr
asgr andes( n1≥30yn2≥30)yenambos
casos,conv arianzapobl
aci
onaldel asdi f
erenciasdesconocida.Lasfórmul as
paraelestadí
st i
codecontr
asteyelinterv
alodeconf i
anzasonlasquefiguranen
l
af i
la2del apági na11delfor
mulari
o( di
stri
buciónTdeSt udentconn-1grados
deli
bertad).

3.
-CONTRASTEDEHI
PÓTESI
SSOBREDOSPROPORCI
ONESENMUESTRAS
RELACIONADAS.

Condi cionesysupuest os:Variabledi cotómicaodi cotomizada(sól opuede


tomardos v al
ores),dos muest ras r el
acionadas con b y c obser v aciones
i
ndependi entesdondeb+c>25.Lasf ór mulasparaelest adí
sti
codecont rast eyel
i
ntervalo deconf i
anzasonl asquef iguranenl afi
la3del apágina11del
for
mul ari
o.Ambasf órmulassólot ienenencuent aloscambi osodi f
er encias
entr
eunayot r
acondi ciónexperi
ment al
.Lasegundaseconocecomot estde
McNemarysól osepuedeempl earsi seutil
izauncontrastedehipótesisbi lateral
,
yaquealest arelevadoalcuadradonoi nformadel adi
reccióndel asdifer encias.
2
Porot r
apar t
e,sielvalordeχ esmuypequeño,t ampocot i
enesent i
dor echazar
l
ahipót esisnula.

Resumendet
rucost
emas1-
4:

-Si
pregunt
anporpor
cent
aje,
esuncontr
ast
edepr opor
ciones.
-Si
pregunt
anporundat
oengeneral
,esuncont
rastedemedi as,
sal
voquese
23
i
ndi queotr
acosa.
-Sinosdaneldatodecuasi
vari
anzaovar
ianzainsesgada,hacer
efer
enci
aa
valoresmuestral
es,nodel
apoblaci
ón.Sal
voquesedi gaotracosaosehagal a
prueba F,sepr esumequel asvari
anzaspoblaci
onalesson desconoci
dasy
supuestasdif
erentes.

TEMA5DI
SEÑOSCONMÁSDEDOSGRUPOSI
NDEPENDI
ENTES.

1.
-INTRODUCCI
ÓN.

ElAnálisisdeVar ianza( Analy


sisofVarianceoANOVA oANVAR)esuna
técni
ca par amétr
ica de análisi
sestadí
sti
co que se ut i
li
za par
a compar arl
a
vari
abil
idaddel asmedi asdemásdedosgr uposestudiandolainf
luenciademás
dedosv aloresdel aVIsobr elaVD,conmásposi bil
i
dadesdeest abl
ecerl
a
rel
aciónprecisaentr
eel las.

2.
-CONCEPTOSBÁSI
COSDELANOVA.

Enelmodel omássimple,deunsol
of act
orounifact
ori
al,l
avar
iabi
l
idado
vari
anzagener
alocomúnqueseobser vaentr
elaspuntuaci
onesdel
osgr upos
despuésdehaberint
roduci
docambiosenlaVI,est
áformadapordospar t
eso
componentes:

a)Laquesedebeal osdistintosnivelesdelf act


orestudiadoovar
iabl
e
i
ndependi
ent
e,conoci
dacomov arianzaintergrupos.
b)Laquesedebeal osfactor esextr
añosynocont r
olados,quer
eci
beel
nombredeer
rorexper
imentalovarianzaintr
agr upos.

ElcometidodelANOVA esdiscerni
rquév ari
abil
idadcor respondeacada
parte.En l
at er
minol
ogí
a delANOVA,l as v
ar i
ables independientes que se
estudi
anreci
benelnombredefactoresylascategoríasenquesedi videnlos
factor
es,
eldenivel
es.

Losdiseñosenl osquel osni velesact


úancomounamuest radel osposi
bles
nivelesdelfactorycuyasconcl usionessepuedengeneral
izarparatodosell
os,se
conocecomodeef ectosaleatoriosomodel oal
eator
io.Silasconcl
usionesestán
restri
ngidasal osnivelesestablecidosprevi
amenteeneldi seño,set r
atadeun
diseñodeef ectosomodel osf i
jos.Silosgruposomuest rasti
enenelmi smo
númer odeel ementos, est
aremosant eunmodeloequili
brado;enotrocaso,ante
unmodel onoequi l
i
brado.

3.
-FUNDAMENTOSDELANÁLI
SISDEVARI
ANZA.

Sipar
ahacercompar
aci
onesent
remásdedosmuest
rasut
il
izár
amosl
as
24
pruebasT( temas3y4),ademásdel acompleji
daddeloscál
culosport enerque
analizarl
asdedosendosent odaslascomplicaci
onesposi
bles,tendr
íamosdos
problemas:
a)Sepasar í
aporaltolainter
acci
ónent relasvari
abl
esi ndependient
eso
factores.
b)Aument arí
alapr
obabil
i
daddecomet erelerr
ordeti
poI.

Par
aev i
tarestosproblemasseut il
izaelAnál isi
sdeVar i
anza(ANOVA o
ANVAR)cont rast
andoladifer
enci
ademedi asentrev ar
iasmuest
ras.
Lahipótesisnul
ageneralesquenoexi st
ediferenci
aalgunaentr
elasmedi
as
(enlav
ariabledependi
ente)delosdi
sti
ntosgruposomuest r
as.

Parami ni
mizarl ainfl
uenci adelasv ari
ablesextrañas,conoci
dasonoyev i
tar
sesgossi stemáticosenl osr esult
adosqueseconf undenconl osef ect
osque
pudierandeber seal av ariableindependientesepr ocedeal aal
eatori
zacióndel
muest reot antoenl ael eccióndel ossuj etoscomoenelor dendeasi gnacióna
l
ascondi cionesexper i
ment al
esoni v
eles( contr
abalanceo).Estoreduceaunque
noel i
mi nal aposi bi
li
daddequel asdi f
erenciasobser vadasentrelosnivelesno
seanf rutodelef ectoconj untodel av ar
iableindependienteydef actor
esdeazar
yport anto,per mitesuponerquel oserroresexper i
ment al
essoni ndependient
es
delosef ect osdel osdisti
nt osnivel
esdel osf act
ores.

4.
-ANÁLI
SISDEVARI
ANZADEUNFACTOR(
ANOVAUNI
FACTORI
AL)

Enelmodel omássi mple, deunsól ofactor,l


avariabil
idadsedescomponeen
l
av ari
anzaat r
ibuibleal osdi stintosnivelesdelfactorov arianzai nter
gruposyl a
vari
anzaat ri
buibleal errorov ar i
anzai ntr
agrupos.Elpunt oesenci alesdetermi nar
silav ar
ianza intergrupos ( debi da alf actormani pulado)es si gni
fi
cativa en
rel
aciónconl av ari
anzai ntragrupos( debidaalazar).Elest adíst
icodecont raste
eselcoci enteent reambasv arianzasysedi st
ri
buyeconar regloal aFdeFi sher-
Snedecor.Elcont rasteesuni lateralderecho,porquesól ov al
oresgr andesdeF
permitenat r
ibuirsignif
icaciónest adísti
caal avari
abil
idadobser v
ada, si
endomuy
i
mpr obablequesuv alorseai nferiora1( impli
carí
aquel avar i
anzadeler rorono
expl
icadaesmay orquel aobser v
adaent regrupos).

Lospasospar areali
zarelANOVAson:
1.
-Pr obarl ossupuest osqueper mit
enapl i
carelANOVA:VD cuant itati
va
medida a escal a de inter
valoor azón (no sir
ve sies or di
nalo nomi nal),
i
ndependenci a de l as observaci
ones (testde r achas),normali
dad de l as
di
stri
buciones( pruebasdel abondaddeaj uste,Li
ll
iefor
s,Kolmogorov-
Smir nov,
2
X dePear son),yhomogenei daddel asv ar
ianzas( homocedast
ici
dad,testde
Cochran par a model os equili
brados y testde Bar t
let
tpar a modelos no
equi
li
brados).
2.
-Enunci arlashipótesi
sestadísti
cas.
25
3.
-Deci di
rel estadíst
icodecont rastequevamosaut i
li
zarparaprobarl
aH0.
4.
-Est abl
ecerel niveldeconf i
anzaol aregi
óncrí
ti
cader echazodelaH0
5.
-Cal cul
arel valordelestadíst
icodecont r
aste(
TabladelANOVA)
6.
-Tomarl adeci si
ónsobr elaH0( comparandoelval
orFobt eni
doconelval
or
cr
ít
ico,contrasteuni l
ater
alderecho) .
7.
-Interpret
aciónenel contextodel ai
nvesti
gaci
ón.

Elmodel oser epresentamedi ant


el aexpr esi
ónYij=µ+αi+εij,enelque
act
úansobr elaVDY, def ormali
neal t
rescomponent es, si
endo:
-Yijescadapunt uacióndel av ar
iabledependientepar acadasujetoycada
ni
vel.
-µesl amedi adelapoblaci
ón( constante).
-αieselnivelcomúnat odoslosel ement ossomet i
dosaeseni vel
delfact
or.
-εijesel
er r
orexperi
ment al
paracadasuj etoycadani v
el.
Lossubí ndicesirepresent
anl osIni v el
esdelf actoryl ossubíndi
cesj,el
númer o ndeel ementososuj etosmedi dosencadani vel
.Elesquemaesel
si
guiente:

26
HIPÓTESI
S Efectosf
ij
os(sobr
elasmediaspobl
aci
onal
es)/
/Ef
ect
osal
eat
ori
os(
sobr
elasv
ari
anzas
cuandoson=0,lasmedi
assonigual
es)
.

EFECTOSFI
JOS EFECTOSALEATORI
OS
H0:
µ1=µ2=µ3=…=µi σ2B=0
H0:
H1:
µ1≠µ2≠µ3≠…≠µial σ2B≠0
H1:
menospar
aunaµi
Cál
cul
osi
mil
ar

TABLAANOVAUNI
FACTORI
AL(
Últ
imocuadr
opági
na12f
ormul
ari
o)

FUENTEDE SUMAS GRADOSDE MEDIAS ESTADÍSTI


CODE
VARIACI
ÓN CUADRÁTI
CAS LI
BERTAD CUADRÁTI
CAS CONTRASTE
ENTRENI
VELES SCINTER I–1 MCINTER
Nºdegr uposo (
SCINTER)/(
I–1) MCINTER
ni
vel
esmenos1 F= -
--
--
--
---
--
-
DENTRODELOS SCINTRA N–I MCINTRA MCINTRA
NI
VELES Nºde (
SCINTRA)/(
N–I)
suj
etos
menosNº
degrupos
TOTAL SCTOTAL N–1 Sedist
ri
buyeFdeFisher
-Snedecorcon
Nºdesujet
os (I–1)y(N–I)gr
adosdeli
bertad.
menos1

CÁLCULOS:
Secumpl
e[SCTOTAL=SCINTER+SCINTRA]yG.l
i
ber
tad:
[N–1=(
I–1)+(
N–I
)]

SCTOTAL=ΣΣY2–{ 2
(ΣΣY)/N}
SCINTRA=SCTOTAL-SCINTER
2 2
SCINTER=Σ(
ΣY) /n–{ (ΣΣY) /N}

DECISIÓN:RechazamosH0 ( i
gualdad demediasenl osdisti
ntosni
vel
es)sielvalordelaF
experi
ment al(
estadíst
icodecont
raste)esmay orqueelv
alorFobteni
doenlastabl
as,
par
aunnivelde
si
gnifi
cación(α)predeter
minado.

ElNumer
adordelestadísti
codecontr
ast
e( MCINTER)conti
enelaVarianzadeer
ror+Efector
ealdela
VI
.ElDenomi
nador(
MCINTRA)c ont
ienel
aVari
anzadeer ror.Port
anto,cuantomenoreselefect
orealde
l
aVImásseacercaelcocienteauno.

Val
orCr
ít
ico:F(I-1)(N-I)(1-α) ZonadeAcept
aci
ón:F<F((I-1)(N-I)(1-α)

Deci
sión:
ZonadeRechazo:F≥F(I-1)(N-I)(1-α) SiF<Fcrítico AceptamosH0
SiF≥Fcrítico RechazamosH0

27
Cálcul
osabreviados(Util
izamoselsist
emadenot aci
ónpropuestoporKeppel
):ElcálculodelasSumas
de cuadrados se r eal
iza sumando y restando l
as r
azones básicas:[Y]( r
elacionada con l
as
puntuaci
onesindivi
duales);[
A]conlostot
alesdelosni
vel
esy[ T]conl
asumat otal
.

Estr
uctur
adecálculodelnumerador
:Seelevanalcuadr
adol
ascanti
dadesi
mpl
i
cadasypost
eri
orment
e
sesuman.
Estr
uctur
adecál cul
odeldenomi nador:Cual
quier
aqueseaelt ér
minosedivi
deporelnúmerode
puntuaci
onesquecontr
ibuyenasucálcul
o.

Fór
mul
aspar
alasr
azonesbási
cas SumasCuadr
adosapar
ti
rder
azonesbási
cas

[T]=T2/(a)(
n) Di
señoequi
l
ibr
ado SCTOTAL=[
Y]–[
T]
2
[T]=T /N Di
señono
2
equi
li
brado SCT=∑∑(
Y–YTOTAL)

A]=∑A2/n
[ Di
señoequi
l
ibr
ado SCA=[
A]–[
T] SCINTERGRUPO
2
SCA=∑n(
YA–YTOTAL)
[
A]=(∑A21/n1)+(
∑A22/n2)+…
(
Diseñono
equi
l
ibrado) SCS|A=[
Y]–[
A] SCINTRAGRUPO

Y]=∑Y2
[ SCS|A=∑∑(–
Y YA)
2

N=Númer
otot
aldeobser
vaci
ones/
/n=Obser
vaci
onesporni
vel

Recapi
tul
ando,enelANOVA uni
fact
ori
al,l
ashi
pót
esi
squesesomet
ena
contr
asteson:

-Enelmodel odeef ectosfijos,lahi pótesi


snul apost ul
al aigualdadde
mediasentr
et odosl osnivelesdelf actormani puladoyl aal t
ernati
va,queal
menosunaesdi fer
ente.
-En elmodel o de efectos aleatori
os,la hipótesi
s nula es que no hay
var
iabi
li
dad(vari
anza)ent
relasmedi as(soniguales)ylaalt
ernati
va,quesílahay
(I
nci
so,l
av ar
ianzasól
opuedeserposi t
iva,
porserunv aloralcuadrado).

Elestadí
stico de contr
aste es elcociente entr
el a medi
a cuadrát
ica
i
ntergr
uposylamedi acuadráti
caintr
agrupos,quesedistri
buy
esegúnunaFde
Fi
sher-
Snedecor,con( I-1)y( N -I)gradosdel iber
tad,enelnumeradory
denominador
,respect
ivamente(pági
na12del for
mulari
o).

En elexamen se suel
en f
aci
l
itarl
osdat
osde l
asmedi
aso l
assumas
28
cuadráti
casnecesar
iospar
acalcul
arlosr
estantesylomási mpor t
ant
eessaber
rel
aci
onar l
asambasmedi ant
elasf ór
mulascor r
espondi
entes(estátodoenel
formular
io,enelexamenhayquet enerpacienci
apar abuscarlosdatosenla
tabl
aquecor r
esponda):

SCtotal=SCInter.+SCintra(SC=sumacuadr áti
ca),midelavari
abili
dadt otalyes
i
gualal asumadet odasl aspuntuacionesmenosl amediatotalalcuadrado.
SCIntermi delav ar
iabilidadentr
elosnivelesov ari
abi
li
daddebidaalef ectodel
fact
oryesi gualal asumadel amediadecadani velmenoslamedi adelf actoral
cuadrado.
SCintra midelav ari
abilidaddentrodecadani velov ar
iabi
l
idaddebi daaler ror
experi
ment alyesl asumadecadapunt uaci
ónmenosl amedi adesuni velal
cuadrado.

Las medias cuadrát


icas se obt
ienen di
vi
diendo l
as respect
ivas sumas
cuadrát
icasporl
osrespecti
vosgradosdeli
bert
ad( MC=SC/g.
l.
).

Par aresolv
erelSudoku,convi
eneempezarporelfi
nal
:Losgradosdeliber
tad
tot
alesdelANOVAesN- 1yapar ti
rdeahísev acomplet
ando.Comoseexpl ica
enelr ecuadro,sinosdanlasrazonesbási
cas(comoensept i
embre) asA2son
,l
l
oscuadr adostotal
esdelassumasdel asA,nol assumasdel asAelevadasal
cuadradoyl asn,elnúmerodesujetosdecadamuestraoniv
el.

5.
-COMPARACI
ONESMÚLTI
PLES(
prev
ior
echazodeH0)
.

ElANOVA, mediantelaobt enci


óndeunar azónFsigni
fi
cati
va,permiteafir
mar
quealmenosent redosmedi ashaydiferenciasquenosondebi dasalazar ,pero
nodicedóndeest áesadi ferenciasignifi
cati
va.Lascompar aci
onesmúl ti
ples
permit
enestablecerunai nf
or maciónmásexact asobrelaimportanciadecada
unodel osni
velesdel avari
abl ei
ndependiente.ComopartedelANOVA, elobjeto
delascompar acionesmúl ti
pl eses,aplicandopruebasespecí f
icas,reducirla
canti
dad deerrorTi po I(α)quecomet erí
amossicompar ásemost odasl as
muestrasdosadosmedi antel apr
uebaT.

Parti
endodelrechazodel ahi
pótesi
snulasisóloint
eresacompararal
gunos
ni
v eles delf act
or el egi
dos de antemano,habl ar
emos de compar aci
ones
plani f
icadasoapr i
ori.Enestoscasos,l
osresul
tadosobtenidosdeFnisiquier
a
suel encitar
se.Perosii nt
eresahacer
lassobretodoslosnivelesdelANOVA,se
tr
at arádecompar acionesnoplani
fi
cadas,apost
erioroposthoc.
i

Una delaspruebasmásut i
li
zadasen est esegundo caso esl
a del as
compar aci
onesmúlt
ipl
esdeScheff
é,queademásdecompar arl
asmedi
asdel os
nivelesdelANOVAdosadosper mitereal
izarcomparacionesmáscompl ej
as
(porejemplolamediadeunni
velconunconj unt
odemedi asdeotr
osni
veles,un
29
conj
unt
odemedi
asdedi
sti
ntosni
vel
esconot
roconj
unt
odemedi
asdeot
ros
ni
vel
es,et
c.)
.

Est
apruebafi
jalatasadeerrordeti
poIenelαalqueest emost rabaj
andoy
obti
eneunv al
orll
amadodi fer
enciamínima,r
angoov al
orcr í
ti
coCR ( Cri
ti
cal
Range)deSchef
féporencimadelcualseconsi
der
aquehaydi ferenci
asentrelas
mediasogruposdemedi asqueest emoscomparando.Lafórmulaest áalfi
nal
delapági
na12del f
ormular
io:

__
___
___
____ __ ____ _ __
___
______
___
__ _
_
2
CRSCHEFFÉ=√(
k-1)F(k-1),glERROR ·√MCERROR[
Σ(cj/nj)
]

Siendo, k=Númer odegr upos;ni=númer odesujetosdecadagr upo;F(k-1),gl


ERROR =Fe xper
imentaldelANOVA;MC ERROR =Medi acuadráticaerroryc2j=
Coef i
ci ente de l as combi naci
ones lineales. Los coeficientes son l as
combi naci oneslineal
esquepodemosest ablecerentr
elasdi stint
asmedi asa
compar ar;elrestodev aloressepuedeobt enerdel atabl
adelANOVA.Encada
combi naci óndecoef icientesci,lasumadel osmi smosesi gualacer o.Un
coef i
cient e ci iguala 0 si gni
fi
ca que ese gr upo queda el iminado de l a
compar ación.Vamosav erunosejemplosdecómosecal culanl oscoefici
entes,
con 5 gr
upos:

Comosev e,lasumadel oscj,


siemprees0.Pr i
merosecal culanloscjdelos
quesecombi nanconj untamenteysel esponeun1consi gnonegat i
vo(enalgún
examensal i
óconcoef i
cient
escomo½) ,conlaponderacióncorrespondi
ente.Es
decirsicompar amosunamedi acontrados,est
asdosúl ti
masdebendi vi
dir
se
por2, ol
oqueesl omismo, laquev asoladebemulti
pli
carsepor2.Enelej emplo
3,lasmedias1y5semul ti
pli
canpor3yl asrest
antes,por2.Comoseel evanal
cuadrado,daigualelsigno+o–quesepongaacadacoef ici
ent
e.

30
Regl
adedeci
sión:

Sielval
orabsol
utodeladiferenciadel asmedi asdel osgruposcomparados
es may or que elCR,existen di ferencias signi
fi
cati
v as ent
rel os ni
vel
es
consi
deradosynoencasocont r
ario.Elr esul
tadoindicar
áaquégr upoogrupos
corr
espondelavari
abi
li
dadsi
gnificati
v adetectada.

31
TEMA6.ANÁLI
SISDEDATOSENDI
SEÑOSI
NTRASUJETOS.

Un di seño intrasuj et
os,ANOVA uni factorialint
rasuj etos o de medi das
dependi entes or epet i
dasesaquelenelquesesomet eal osmi smosoalúni co
sujetoex periment alat odosl osni veles( estudiados)delf actor
.Par ami nimizar
(nuncael iminarporcompl eto)elprincipalriesgodeer ror( aprendizaje,
paut asno
detect adas,f ati
ga,et c.),l
asecuenci auor denenquesepr esentanoapl i
canl as
condi cionesal ossuj etosdeber eali
zarsecont r
abalanceando.Si nembar go,est o
sólo es est rict
ament e necesar i
o siut i
l
izamos un di seño en que t odos l os
estímul osdelmi smot iposepr esentanagr upadosenundet erminadoor deno, si
esenor denal eatori
o, sequi er
edescar t
arquehay apat
ronesdepr esentaciónque
hanpasadodesaper cibidos.Fór mulaspági nas12yss.delf ormulari
o,siendol os
valoresdel ossumat or i
osr epresentadosent r
ecor chet
esl asr azonesbási cas.

Condici
onesysupuest os:Lossupuestosquedebencumpl i
rsepar apoder
apli
carcor r
ectamente elANOVA son l os mi smos v i
stos par a elANOVA
i
ntersuj
etos,est
oes,VDmedi da,aunniveldeintervalooder azón, puntuaciones
de la VD en cada ni v
eldelf act
orindependi entes entre síy di stri
buidas
normalmenteyademás,doscondi ci
onespar t
icul
arespar areducireler r
orporl a
i
nteracci
ón:Lasv ari
anzasdel aspuntuacionespar al
osdi st
intosniv el
esdel
fact
ordebenseri gualesentresíylascovarianzasent retodosl osni vel
esdel
fact
ordebenserigualesentr
esí.

Supuestaslahomocedastici
dad (i
gual
dad dev arianzas)yl aigualdad de
correl
aciónent
recadapardet r
atami
entos,lamat r
izdev ari
anzas-
covari
anzas
tendrálapropi
edaddelasimet r
íacompuesta,condi
ciónsuf ici
entepar
ausarel
model operononecesar
ia,si
endo pococomúnenl aprácticayexcesi
v amente
restri
cti
va.

Metodologí
a: Lav ari
abil
idadtotalSCT=SCA+SCS+SCAxS, si
endo:
-SCA,lavar
iabil
idad( var
ianza)delfact
ormani pul σ2A)
ado( .
-SCS,lavar
iabil
idad( var
ianza)delossujetos( σ2S).
-SCAxS,l
avariabil
idad( v
arianza)delainteracciónentr
eelf act
oryl
ossuj
etos
2
(
σAxS,error)
.

Enelmodel oseconsideraquelaf uent


edeler
roreslainter
acci
ónent reel
factoryelsujetoporlai
nconsist
enci
aconquelossujet
ossecompor tanbajolos
diferent
estratamient
os[ (
AxS)->MCSXA oMCe]
.Parareducirsuv ar
ianzayl os
gradosdel i
bertadsedescomponeenuncomponent easociadoalaposi ci
óndel
tratamient
o( SCP),queser educeconelcont r
abal
anceo yunr estor esi
dual
,
desconocidoei rr
educi
ble:

(
SCAXS)=(
SCp)+(
SCresidual)si
endo(
g.l
.AxS)=(
g.l
.p)+(
g.l
.r
esi )
dual

32
El
est
adí
sti
codecont
rast
eesF=(
MCA/MCSxA)(
Fisher
-Snedecor
).

Lafor
madecálcul
oesmuysimil
araladelt
emaanteri
or,perouti
li
zandol as
fór
mulasdelapági
na13delf
ormul
ari
o(v
arí
anlosg.l
.yportanto,l
asrelaciones
entr
eMCySC) .
TEMA7.DISEÑOSCONMÁSDEDOSGRUPOSI NDEPENDI ENTES.ANÁLI SIS
DE VARIANZA CON DOS FACTORES COMPLETAMENTE ALEATORI ZADOS
(ANOVABIFACTORI
AL).

Enlosdi señosfactori
alessequi er
eestudiarelefectoquesobr eunav ari
abl
e
dependiente ejercen dos f actores o v ari
ables independientes A y B
completament ealeatori
zados,todosel l
osconi gualnúmer odecat egoríasde
modot odosl osnivelesdeunosecombi nanconl osdelot ro.Undiseñofactori
al
consi
steenunconj untodedi señossimplesdeunf actorenelcuall ami sma
var
iabl
ei ndependienteesmani puladaencombi naciónconunasegundav ari
abl
e
i
ndependi ent
e.

Conundi
señof
act
ori
alsepuedenanal
i
zar
:

1)Losef ectospr i
nci esdecadaunadel
pal asVI(factores)sobrel
aVD.Se
consi
derantantosef ectospri
nci
palescomof actoreshayimpl i
cadoseneldiseño
yseanal i
zanmedi anteunANOVA decadaf actorsi
nconsi derarelotr
o.Los
efect
ospr i
ncipalesdeunav ar
iableindependienteo factorser ef
ier
enal os
efect
ospromedi otot al
esdeunav ari
ableyseobt i
enecombi nandoelconjunto
complet
odecomponent esexper
imentalespresentesenesef actor
.

2)Elef ect
oi nt
eracci
ónent r
el osf act es.Exi
or steinter
accióncuandoelefecto
producidoporl osnivel
esdecadaunodel osfactoresdependedel osnivel
esde
otrofactor.Enelmodel oANOVA,l asVIseconsi deranindependi
entesentresí
perolosv alor
esdeunosf act
oresi nf
luy ensobrenlosdeot ros.Portanto,
además
de lai nfl
uencia que cada factorej erce porsepar ado en la VD,existe una
i
nfluencia debida a l a combinación de ambos.Se consi der
a que existe
i
nteracciónencual qui
eradelossi guient escasos:

-Cuandolosef ectossobr elaVDdeunf actorcambiaantediferentesnivel


es
deotro.
-Cuandol ospat ronesdedi ferenci
asasociadosconunf actorcambi ancon
l
osdi f
erent
esnivelesdeot ro.
-Cuandol osef ectossimplesdeunf actornosonl osmismosent odoslos
ni
velesdeotro.
-Cuandol osef ectosprinci
palesdeunf actornosonr epresentati
vosdel os
ef
ectossimplesdeesemi smof actor.
-Cuandol asdi fer
enciasent r
el asmediasdel asceldasquer epresentanel
ef
ecto de un f actoren al gún ni veldelotrof act
orno son i guales a las
33
cor
respondi
entesdif
erenci
asenotr
oniveldeest
efactor.
-Cuandolosefectosdeunfact
orestáncondi
cional
menterel
acionadosalos
ni
velesdeotr
o.
-Cuandounfactornoti
eneunefect
oconstant
eent odosl
osnivelesdeot
ro.

3)Losefect
ossi
mples,omásf zadosdecadaf
ocal
i actorconcadani
veldel
ot
rofactor
.Sepuedenconsider
artant
osefect
ossimplescomol asumade
ni
vel
esdecadafact
or.

Procedimiento:Apar t
irdelatabladelANOVAf actori
alsereali
zal aprueba
ómnibus( efectosprinci
palesyefectointeracción).Sielefectointeracci
ónes
si
gnifi
cati
voseconcl uyequeelef ectoproduci doporl osnivel
esdeunf actor
dependedel osni v
elesdeot r
ofactoryrechazar emosH0. SiFnoessi gnifi
cati
va,
seacept aH0,seconsi deraquenoexi st
eef ect
oi nt
eracci
ónyelmodel ose
convi
erteenf actori
aladit
ivo(nor
mal )
,demodoqueenelcuadr odelANOVAl a
fi
ladelainteracci
ónsesumaal er
roryser ecalculaF.

Sielef
ect ointeracciónessi gni
fi
cati
vo,sereali
zalapr uebadelosef
ect
os
simplesycompar aci ónporpar esydespuésl adel osef ect
ospri
nci
pal
esen
funci
óndel osefectossi mples.Sinoessignif
icat
ivo,sereali
zalapr
uebadel
os
efect
osprincipal
esysial gunoessi gni
fi
cati
vo,sepr ocedealestudi
odelas
comparaci
onesmúl t
iples.

Model
oest
adí
sti
codeANOVAconi
nter
acci
ón:
Y=µ+α+β+(
αβ)+ε.

Cualquierpunt
uaci
ónYt i
ene5component es:Lamediatotaldelapoblación,
l
osni v
elesdel osdosfactor
es,comúnat odosloscomponentesadscrit
osaesos
ni
veles(promediosdel osefect
osdeltr
atamientoenlosniv
elesdel osfact
ores),
elef
ectointeracci
ónentreambosyel er
rorexperi
mentalnocontrol
able.

Model
oest
adí
sti
codeANOVAsi
nint
eracci
ón:
Y=µ+α+β+ε.

Cualqui
er punt
uaci
ón Y t
iene l
os mi
smos component
es,except
o l
a
i
nteracci
ón.

Alconsiderarlaint
eracción,l
aSCintra dismi
nuy
eenl acuantí
aquer ecogela
SCAxB delainteracci
ón,asícomol osgr adosdelibertad,demodoquel aF
resul
tant
eser ámay orporladi sminuci
óndel aMCerrory
,enconsecuencia,más
preci
soelcontrastedehipótesis.

Lashi
pót
esi
sest
adí
sti
cassepuedenexpr
esardel
asi
gui
ent
efor
ma:

Ef
ect
ospr
inci
pal
esf
act
orA:H0:
Todosl
osαi=0;
H1:
Not
odosl
osαi=0.
Ef
ect
ospr
inci
pal
esf
act
orB:
H0:Todosl
osβi=0;
H1:
Not
odosl
osβi=0.
34
Ef
ect
oint
eracci
ónAxB:
H0:
Todosl
osαβij=0;
H1:
Not
odosl
osαβij=0.

Losestadísti
cosdecont
rast
esonl asrazonesentr
elasmediascuadr
áti
cas
cor
respondientesyl
amediacuadrát
icai
ntr
agr upos,
quesedi
str
ibuy
esegúnF.

Lasf órmul aspar aloscálculosdelANOVAest ánenl aspáginas14y15del


formulario,consi derando sólo diseñosequi li
brados.Elpat r
ón deanál i
sises
análogoal osdel osot rosmodel os, incl
uy endodosf actor
es, l
aint
eracciónentre
ambosyaj ustandol osgradosdel ibertad.LaSCintra sedivideasuv ezent res
component es:
-Ent retratami entosdelfactorA( SCA),quer ef
lej
al osefectosprinci
palesdel
factorA.
-Ent ret r
atami entosdelfactorB( SCB),quer ef
lej
al osefectosprinci
palesdel
factorB.
-Lai nteracci
ónent reAyB( SCAxB).
Acont inuaciónsepr esentaunej empl odelmodel ocon2f actores,zonay
duración,asícomol asecuenciadeanál i
sisf actori
al:

35
Fi
gur
a7.
5Secuenci
adeanál
i
sisenundi
señof
act
ori
al

36
TEMA8.
-ANÁLI
SISDEREGRESI
ÓNLI
NEALSI
MPLEYMÚLTI
PLE.

1.
-INTRODUCCI
ÓN.

Elanálisisder egr esiónesundi seño expostf acto quepuedeserusado


siempr equeunav ari
abl ecuant i
tati
vapuedaserest udiadacomounaf unciónde
una( ARS,anál i
sisder egresiónsi mple)ov ar
iasvariabl
es( ARM,análisi sde
regresiónmúl ti
ple)
.Lasr el
acionesent relaVDyl aVIpuedensermuydi v ersas:
l
ineal,exponenci al
,logar í
tmica,etc.Enest etemasóloseest udialaregr esi
ón
l
ineal.Elanál i
sisder egr esióntambi énsepuedeapl i
carasi tuaci
onesenl asque
se mani pulen condi ciones exper imentales,de modo que “ casicual quier
i
nf ormaciónquet engai nt
eréspar aelest udi
odel aVD puedeserobj etode
i
ncor poraciónenest et ipodeanál i
si
s”.

Unabaj a corr
elaciónent r
ev ari
abl
esimplicaquenohayr el
aci
ónl i
nealentr
e
ell
as, per
onodescar t
aquepudi erahaberl
adeot rot
ipo(exponenci
al,l
ogarí
tmica,
etc.).Unaal t
acor relaciónl i
nealoi mpli
canecesar i
amentequehay arelaci
ón
causalent reellas,puespodr íaocurri
rqueambasf ueranafect
adasporuna
vari
abl eajenaalmodel o,porejemplo,C.I
.yal t
urat
ienenaltacorr
elaci
ónenl os
niñosper oambasest ánr el
aci
onadasconl aedad.

2.
-ANÁLI
SISDEREGRESI
ÓN(
LINEAL)SI
MPLE.

Cuando una v ar
iable,independi
ente(VI)
,aport
ai nformaci
ón sobre ot
ra,
dependient
e( VD),decimosqueambasest áncor
rel
acionadas.Elobjet
odel a
corr
elaciónesanal i
zarelgr adodeasoci aci
ónentrelasv ari
abl
esyeldel a
regr
esión,efect
uarpr edicci
onesacercadel osval
oresdel aVD paravalor
es
dadosdel aVI.LaVIser epresentaporX,l
aVDporYyl osv al
oresest
imadospor
Y’.

I
maginemosqueenunagr áfi
caserepr esentanlospunt os(nubedepuntos)
queindi
canl osv alor
esdeX eY.Lar egresi
ónl i
nealser eal
izamedianteel
métododel osmí nimoscuadr adosajustandoadi chosdat osunalí
nearect
aque
mini
micel oscuadr adosdel asdifer
enciasent r
el osv al
oresreal
esdeYpar aun
val
orcualquieradeXyl osv al
oresesti
madosdeY( Y’)queresul
tar
íandeapli
car
l
aecuaciónder egresiónresult
ante.
Ej
empl osderegr esi
ónlinealyexponencial:

37
El
model
oser
epr
esent
a:

a)Par
apunt
uaci
onesdi
rect
as:
Y’=BX+B0,
siendo:

-Y’elval
orest i
madodeY,
-B l a pendiente de lar ecta de regr
esi
ón (coefi
ciente de r egresi
ón)y
representaelaument odev al
orqueexper i
mentaYcuandoXaument aenuna
unidad;
-B0,eli
nterceptoov alordelaordenadaenelorigen(v alorpronosticadodeY
cuandoX es0) .Eli nter
cepto,ali gualquelosdemásv al
oresdeY’quese
encuent r
enf ueradelr angodev al
oresdel aVI,noesobj etodei nterpret
aci
ón,
salvoqueel valor0seencuent redent r
odel r
angodev al
oresdel aVI .

b)Par a puntuaciones di
fer
enci
ales (dif
erenci
as entr
elas punt
uaci
ones
di
rectasyl amedi a):Y’=B(
X-)
X.Laor denadaenelor igenpar
apuntuaci
ones
di
ferenci
alesval
e0.

c)Par
apunt
uaci
onest
ípi
cas:
Z’=rZ.Y XY X

Lasdiferenci
asent
relosval
oresdel avar
iabl
eobservadosylosesti
mados
sonloser r
oresdeesti
maciónopredicci
ón.Lasumadel amediadelosv al
ores
pronost
icadosesigual
alasumadel amediadelosval
oresobser
vados.

Enconsecuenciaelmodel oderegresi
ónlinealesY’=BX+B0+ε endoεel
,si
errordeest i
maciónolosr esiduosunav ezesti
madoelv alordelaVD.Par aque
sean v áli
das l
as inf
erencias sobrela VD se deben cumpl irlas sigui
entes
condicionesysupuest osbási cos(sucompr obaciónrequier
equehay av ar
ias
muest rasqueper mit
anest udiarl
adistri
buci
óndel osdisti
ntosv al
oresdeY
predichosparacadavalordeX) :

-Independenci
adel asobservaci
ones(muestraselecci
onadaal
eatori
amente)
.
- Homocedasti
cidad,var
ianzasdelasdi
str
ibucionesdeloserr
oresigual
es.
38
- Nor
mal i
daddelasdi
str
ibuci
onescondi
cionadas.
-Independenci
aentrelosv al
oresesti
madosyl oser
ror
esdeest
imaci
ón.
Expr
esadoent ér
minosdecoef
ici
ent
edecorr
elaci
óndePear
son,r’
ε=0,est
o Y

es,l
oserr
oressedist
ri
buy
endemaneraal
eat
ori
a,si
ncor
rel
aci
ónconlaVD.

3.
-BONDADDEAJUSTEDELARECTADEREGRESI
ÓN.

Laexpr esi ónbondaddeaj ust


e,serefi
ereacómode“ expli
cat
iva”eslar ect
a
respect odel osdat ossobr el
osquesehaaj ustado.LavarianzadelaVD( tant
o
paraARScomopar aARM)sepuededescomponerenl asumadedosv ar
ianzas:
2 2 2
l
adel ospr onóst i
cosyl adel oserror
esor esiduos:SY =SY’+Sε,esdeci r
SCtotal=SCregresión+SCresidual.

Elgradodeasoci aciónent r
el asvariabl
esseexpr esamedi anteelcoefi
cient
e
de cor r
elación de Pear son,cuy ov alorest á si
empr e compr endi
do entr
e- 1
(relaciónlinealnegativ
a)y1( r
elaci
ónl i
nealpositiv
a),indicandoel0quenohay
relaciónl i
nealentrelasv ar
iabl
es( podríahaber l
adeot r
ot ipo,noobst ant
e).Su
fórmul a(pági na15)es:
Rxy=Sxy
SxSy
2 2
Elcuadrado delcoefi
cient
edecor r
elaci
ónr xy o R e selcoeficientede
determinaci
ón( v
alorcomprendi
doentre0y1)yexpr esalaproporcióndel a
vari
anzadel aVDexpl i
cadaporlavari
anzadel aVIyl apr opor
ciónenquese
reduceelerrordelaVDcuandoempleamosl arectader egresi
ónparaest i
mar l
a.
Elvalorabsolut
odelcoefi
cient
ededet erminaciónesmenorqueelcor relaci
ón,
salvocuandores0o+/ -1,quecoi
nci
den.
2
Elcompl ementari
odelcoef i
cient
ededet erminaci
ón1-r xy eselcoefi
ciente
dealienaci
ónyesl apar
teresidualdelav ar
iabi
li
daddelaVD,at ri
bui
bleaot ros
fact
oresnor el
aci
onadosl i
nealmenteconl aVD,esdeci r
,lapr oporci
óndel a
vari
anzadel aVDnoexpl icadaporl avar
ianzadel aVIoloqueesl omismo,l a
vari
anzadeler r
or.

Ot
roindicadordelajust
eeselerr
ortí
pico,queesunest
imadorinsesgadode
l
a desvi
ación tí
pica delerror
.Su f
órmula esla úl
ti
ma dela página 15 del
f
ormular
io.

4.
-INFERENCI
ASSOBRECORRELACI
ÓNYREGRESI
ÓN.

Normalment
el oscoef
ici
entesdecorr
elaci
ónyregresi
óndelapoblaci
ónson
desconoci
dos. Los supuestos bási
cos y condici
ones par
a poder hacer
i
nferenci
asdelosdatosmuest ral
esalosdelconj
untodel apobl
aciónsonlos
39
vi
stosant es(independencia de l
asobservaci
ones,homocedast
ici
dad de l
as
var
ianzas,normalidaddel asdistr
ibuci
oneseindependenci
aentrelosval
ores
est
imadosyl oserroresdeestimaci
ón).

-Contr
ast esobreelcoef i
cientedecorrelaci
óndePearson.Lahipótesi
snula
esquenohayr elaci
ónentreVIyVD( coef
icientedecor
rel
aciónpoblaci
onaligual
acero),mientrasquel ahipótesisal
ter
nati
v apostul
aquelar el
aci
ónl i
nealentr
e
ambasessi gnif
icat
iva:H0:ρ=0.H1:ρ<>0( ρeslalet
ragr i
egaro).Haydos
for
masder eal
izarl
o:

-Conelest adíst
icodelaf
il
a1col
umna1delatabl
a1delapági
na16del
f
ormular
io,quesedi st
ri
buy
ecomounaTdeSt
udentconn-
2gr
adosdeli
ber
tad
(
cont
rastebil
ater
al).

-Medi ant
eelANOVAdel ar
egresi
ón, conlar azónF=MCregresión/
MCresiduos,que
sedistri
buyesegúnunaFdeSnedecorcon1yn- 2gradosdel iber tad(cont r
aste
unil
ater
alderecho)
,for
mulari
o,tabl
a2, página16, gradosdeli
ber tadtot
al esdel a
regr
esión n-1.Se usa cuando nos dan l os datos de l
as sumas o medi as
cuadráti
cas.

-Hayunar
el ónT2=F,
aci vieneenel
for
mul
ari
o.

-Cont r
astepar aloscoefi
cientesder egr esiónByB0 ( ANOVA).Lahipótesi
s
nulayl aalternati
vasonH0:B=0;H1:B≠0sielcont r
asteesbi l
ater
al.Sies
unil
ateral
,l
aH0ser áB≤oB≥queelv alorfor muladopar alaH0.Losest adí
sti
cos
seincluyenenl asfi
las2y3del aprimerat abl adelapági na16delformular
io(T
deStudentconn- 2gr adosdel
ibertad),
cont rastebilater
al.
Hayquet enercuidadoconl asfórmulas“ ocult
as”delf or
mulari
o,porsienel
examenpusi eranunat abl
adedat osparalar egresión(pocof r
ecuent
e,peropor
siacaso):

S2Y.Enl
-SCtotal=n· acal culador aCasi o, enmodor egr esión,hayqueut ilzarσ2y.
i
Estafórmul anov ieneenni ngunapar t
eyhancaí dopr obl
emasenex ámenes
2
anti
guosenl osquedabanl av ar ianzat otaldeY( SY)per onol aSCtotal.
-SCtotal=SCregresión+SCresidual.Sededucedel cuadrodel ANOVAdel aregresi
ón
enlapági na16delf or mular io.Apar ecedef ormaexpl íci
taysepar adaenel
cuadrodel aARM.Despej ando, SCresidual=SCtotal-SCregresión
2 2
-r=SCregresión/ SCtotal.Despej ando, SCregresión=r ·SCtotal.

Lacal cul
adoraCasiopr opor
cionaB( b),B0 (a)yr,sinosdier
anlat abl
ade
datos.Sidanl ossumat ori
os,hayqueut i
lizarlasfórmulasdelapágina15del
for
mul ar
io,conelcui dadodequel abet asenl asqueseusanpunt uaci
ones

picasnohacenr ef
erencianoalosv al
oresdel osparámetrospobl
aci
onales

40
5.
-ANÁLI
SISDEREGRESI
ÓNMÚLTI
PLE.(
Fór
mul
as,
pági
na17del
for
mul
ari
o).

a)Regr
esi
óncondosv
ari
abl
esi
ndependi
ent
es.

Mi ent
rasqueelARSpr oducelalínearect
aquer elaci
onal aVD(Y)conlaVI
(X)
,elARM condosv ar
iablesi
ndependient
esproduceunpl anoderegresi
ónque
rel
acionalaVD( Y)conl osval
oresdel asdosVI( X1 yX2)(paramásdedosVI
serí
aunhi per
plano)
.

El
model
odeest
imaci
ónl
i
neal
múl
ti
plees:
Y’=B1X1+B2X2+B0+ε

Donde B1 y B2 son los coefi


cientes de r
egr esi
ón parcialde X1 y X2,
respectivament
e,B0,eselinter
ceptoov al
ordel aor denadaenelor igen(val
or
pronost i
cadodeYcuandoX1 yX2 v alen0,quenosei nterpr
etacuandoel0no
estáenel r
angodelosvalor
esdelaVD)yε, eler
rordeest imaciónoresiduosuna
vezest i
madal aVD.Lo señalado par aARS esv áli
do paraelARM,conl as
diferenci
asqueseseñal anacont i
nuación.Lasf órmulasest ánenl apr i
mera
tabladel apági
na17del f
ormulari
o.

b)Aj
ust
edel
model
o.Medi
dasdeasoci
aci
ón.

Elcoefici
ent
edecor r
elaci
ónmúltipl
eReselcoef i
cient equecor r
elacionala
VD conunacombi naci ónópt i
madedosomásv ar
iablesi ndependientes.Su
2
cuadr adoeselcoef icientededet erminaciónR,queexpl icaelpor centajede
variabil
idaddelaVIat r
ibuiblealaacciónconjunt
adel asVD.Comoocur reconla
2 2
varianzamuest r
alR noesunest i
madori nsesgadodeρ,por quecuant omás
pequeñaseal amuest ra,may orser
ál acontri
bucióndel av ari
acióndel aVIal a
2
del aVD.Elest imadori nsesgado deρ eselcoef i
cient ededet ermi naci
ón
ajustado, (
2ªfór
muladel a2ªtablapág.17del f
ormulari
o).

c)Cor
rel
aci
ónbi
var
iadaycor
rel
aci
ónsemi
par
cial
.

Sicalculamospar acadaVIsucor relaciónconl aVDsegúnl ast écni


casdel
ARS, obt endremosl oscorr
espondientescoef i
cientesdecor r
elación,quese
l
lamancor relacionesdosados,bi v
ar i
adasodeor dencer o.Conl acalcul
adora
Casio,sidi
erant ablasdeval
ores,
sepuedehacermet iendoenl atablalosval
ores
deYyl osvaloresdeX1,calcul
arB1yr 1yl uegosustit
uirlosdeX1porl osdeX2y
cal
cularB2yX2.

Sinembargo,estascorrel
acionessól
oof r
ecenunai ndi
caciónaparent
edel
i
nfl
ujodecadaVIenlaVDynosonpur aspuesnorefl
ejanlaverdader
ainfl
uenci
a
decadaVIai sl
adamenteconsi der
adasenl aV,alno t enerencuent anila
i
nfl
uenci
aentrelasdist
int
asVI ,nisuinf
luenci
aconjunt
aenl aVD.Poresol a
41
sumadel oscoef
ici
ent
esdecorrel
aci
ónbi
var
iadosser
ási
empr
emay
orqueel
coef
ici
ent
edecorrel
aci
ónmúl
ti
ple.

Par asaberquépar tedel aVDesexpl icadaexcl usiv


ament eporunaVI ,es
necesar i
oel i
minareli nf
luj
oquesobr ecadaVIt i
enenelr estodel asVI ’
s.La
correlaci
ónsemi parcialmidelasrelacionesent r
eunaVIyl aVDalmar gendel
i
nflujoquel asdemásVIdelmodel opuedant enersobredi chaVI.Sitenemosdos
vari
abl es i
ndependientes o predi
ctoras,en la correlaci
ón semi parci
alsr 1 se
eli
mi nalainfl
uenciadeX2 enX1;anál ogament eensr 2s eeliminalainfl
uenciade
X1enX2.

Elcálculodeloscoeficientesdecorrel
aci
ónsemiparcial (
sr1ys r
2)ser eal
i
zaa
partirdel oscoefici
entesdecor r
elaci
óndeor dencero(fórmul as,penúl
t i
maf il
a
de l a página 17 delcuader ni
ll
o).Los cuadrados correspondientes son los
coef i
cientes de determinación semiparci
al,que expresan l a proporción de
varianzadel aVIatri
buibleacadaVD,el i
minandoelinflujodel asdemásVIen
dichaVI .

Par
aent
ender
lomej
or,
veamosundi
agramadeVenn:
Y

a c
b

X1 X2

Eldiagramar epresent al av ari


abil
idadt otaldeY,l adeX1 yl adeX2.La
2
var
iabi
li
dadconj unta( R)deY at r
ibuibl
eaX1 yX2 esa+b+c.Lav ari
abil
i
dad
atr
ibui
bleaX1yX2( coeficientesdedet er
mi naciónbiv ar
iadosoaparentes)serían
a+b yb+c,r espectivament e.La v ari
abil
idad r esi
dualesd.Como v emos,si
sumamossi nmásl asv ariabil
i
dadesdecadaVI ,sumamosdosv ecesb.La
var
iabi
li
dadat r
ibui
bledef ormaexcl usivaaX1yX2( coefici
entesdedeterminación
2 2
semiparci
alsr1 ys r
2 )e sayc,r espectivament e,siendobl aproporciónde
var
ianzaconjunta.Comov emos,lasumadel oscoef i
cient
esdedet erminación
2
semiparci
alesesinferioral av ari
abil
idadconj untaR, yaquedejafueralacomún
42
deambasv
ari
abl
esi
ndependi
ent
es(
b).

La asi gnación de una par t


e de (b)a cada VI ,est o es,l a cont r
ibución
especí fi
cadecadav ari
ableenlav ari
abil
i
dadconj untadepender ádesuor dende
entrada.Par adet erminaresteordenhayv ari
osmét odos:Forwar d( haciaadelante)
yBackwar d(hacia atrás).Elmás usado es uno de l os pr imer os l
lamado
(stepwi seost epbyst ep)enelque,par ti
endodel ascor r
elacionessemi parcial
es
entrel as di st
intas vari
ables,se seleccionan poror den de may ora menor
correlación,secal cul
alaecuaciónder egresiónysev anintroduciendol asdemás
variables una poruna hast a que elaument o en elpor cent aje de varianza
propor cionadoporl aVIcor r
espondienteenlaVDnoseasi gnificativo.

Loscontr
astesconest
oscoefici
ent
esconsist
enencomprobarsilavari
aci
ón
expl
icadaporlavari
abl
eov ar
iabl
esintr
oduci
dasessigni
fi
cati
varespectodela
vari
anzaal
eator
iaoresi
dual
.Lasfórmul
asestánenlapági
na17del f
ormulari
o.

d)Cor
rel
aci
ónpar
cial
.

Ent odomodeloder egresi


ónexisteunapar t
edev ar
ianzadel aVD(cri
teri
o)
quenopuedeserexpl icadaporl asVI( predict
ores).Lacor r
el aci
ónsemiparci
al
permi t
e est
udiarla contri
bución de las disti
ntas VIa l a VD,el i
minando la
i
nfluenciaquesobrecadaVIej ercenlasdemásVI .Lacorrelaciónparci
alvaun
pasomásal l
á,el
iminandoademásl ai nf
luenciadecual quierv ari
abl
eespúreao
extrañaalmodelosobret odaslasvari
ables,tantolaVDcomol asVI.

Medi ant
eelestudiodel acor
rel
aci
ónentr
elosr esi
duos,esdeci
r,lav ar
ianza
noexpl i
cadaporlacorrel
aciónentr
eYyX2porunl adoyporl acorr
elaciónentre
X1 yX2 porotro,lacor r
elaci
ónparci
alseeli
mi naelefectodecual quierotra
var
iable,conocida o no,entrela VIconsi
derada yl a VD.En definiti
va,la
corr
elaciónpar
cialmidelacorrel
aci
ónpuradedosv ari
abl
eselimi
nandoeli nfl
ujo
decualquierot
ratantoenlaVIcomoenl aVD.
2 2
Elcuadradodeloscoef i
cientesdecorrel
aciónpar alpr
ci 1 ypr2 (coefici
ent
es
dedeterminaciónparci
al)sei nt
erpr
etacomol apropor
cióndel av arianzadela
VD no asoci ada a X2 que síest á asoci ada a X1 (yv i
cev ersa) y l
os
2
complement ar
ios1-
pr ,r
epresentanloscoefi
cientesdeal
ienaciónpar cial
.

Lasf
órmul
asestánenl
aspági
nas17y18del
cuader
nil
l
o.Vol
vi
endoal
di
agramadeVenn:

43
d

a c
b

X1 X2
2 2
pr
1 =a/(a+d)ypr
2 =c/(c+d)

Enconclusión,mientr
asl acorr
elaciónsemi par
cialsesi t
úaenelcont exto
excl
usi
v odelARM, tr
atandodeexpli
carl acontri
buci
óni ndependientedecadaVI
alaVD,l acorr
elaci
ónparcialponeelacent oenlaeli
mi naci
óndel osef
ectosde
cual
quiervari
ableextr
añaydel ascorrelaci
onesespúreaspr oducidasportales
vari
abl
esextrañasalmodelo.

RESUMENDETEORÍ
ADEARSYARM:

-Elanál i
sisdel osdiseñosexpostf actotrat
adedet erminarcómo un
conj
unto dev ariabl
es,quellamamosf act
ores,i
ndependient
es,pr edi
ctor
aso
expl
icati
vas,puedenexpli
carelcomport
amientodelavari
ableobjetodeestudi
o,
quellamamosdependi ent
eocr i
ter
io.

-Elmodel
oder egresi
ónli
nealest
imaelvalordel
aVD, mediant
eunafunci
ón
l
inealdeunaov ar
iasVI( Regr
esi
ónLinealSi
mpl eyMúlt
ipl
e,r
especti
vament
e).El
coefi
cient
edecor relaci
óndePear son(múlt
iple)mi
deelgr adodeasociaci
ón
entr
elaVDyla(s)VIyosci l
aentr
e-1y1.

-Elcoef icientededet ermi nacióneselest adísti


coquecuant if
icalabondad
delajusteeselcuadr adodelcoef icientedecor rel
acióndePear son( múlti
ple)
.Su
val
orosci l
aent re0y1ei nfor madel aproporciónenquel av ariacióndel aolas
VI’
sexpl i
canl adel aVDydel apropor ci
ónenqueser educeeler r
oralest i
marla
VD.Lapar tenoexpl icadaporelmodel oder egresión(error)esaquel laqueno
estár el
acionadal inealment econl aVDyesel coefici
entedeal ienaci ón.
-Elcont rast edel asignificacióndelcoef icient
ededet erminaci ónR2,sehace
medi anteelcoci enteent rel amedi ascuadr áti
casdel ar egresiónydeler r
or,
tomadodel at abladelANOVA( Fcont rast
euni later
alder echo)omedi anteel
estadísti
coT( contrastebil
at eral).
44
-Rexpr
esal
acor
rel
aci
ónent
rel
aVD(
Y)yl
amej
orf
unci
ónl
i
nealdel
asVI

s
(
Xi’
s).

-R2,eslapr
oporci
óndevar
ianzadeVDasoci adaalacombinaci
ónli
nealde
l
asVI ’
syt ambiénexpr
esal
areducciónproporci
onaldeler
rori
nici
aldelaVD
cuandoseajust
aunmodelodeesti
maciónconlasVI’
s.

-sr
i,
coef
ici
ent
edecor
rel
aci
ónsemi
par
cial
,expr
esal
acorr
elaci
ónent
reYyXi,
cuandodeestaúl
ti
masehaextraí
dol
aquemant i
eneconelr
estodelasVIdel
modelo.
2
-sri,coefi
cient
ededet er
minaciónsemipar
cialexpresal
apropor
ciónde
v
ar i
anzadeYasoci adaúni
camentelavari
anzadeXi,asícomoeli
ncr
ementoen
2
R cuandol
av ari
ableXient
raenelmodelo.

-pr,coef
i i
cient
edecorrel
aciónparcialexpr
esalacorr
elaci
ón“
pura”entr
eYy
Xi,el
i
mi nandolainfl
uenci
adecual quierotravar
iabl
e,estéonoenelmodel o.
Tambiénexpr esalarel
aci
ónent r
el apar t
edeYyl apartedeXiquenoest án
asoci
adasl i
nealment
econelrestodepr edi
ctor
as(var
iabi
li
dadent
rer
esiduos).
2
-pri,coef
ici
ent
ededeter
minaciónparci
alexpr
esal
apr
opor
cióndevar
ianza
deYnoasoci adaalr
est
odev ar
iabl
es,esténonoenelmodelo,quesíestá
asoci
adaconXi.

45
ADENDA:
PERLI
TASQUEHAYQUETENERENCUENTAPARANOFALLAREN
TONTERÍ
AS:

1.-Hayquel eerei nter pr etarbi enl osenunci ados.Sipi dencont rast essobr e
varianzas o sobr e pr opor ciones l o di r
án expr esament e o en elcaso de
propor ci ones,habl ando de por cent ajes o en elcaso de l as v ar i
anzas,de
variabilidades.Ent odosl osdemáscasos,si empr eesuncont r astedemedi as
(i
ncl usosihabl andepr opor ciónmedi aof recuenci adeaci ertos,elcont r ast ees
demedi as, sal voqueser ef i
er aapor cent aje, frecuenci aopr opor cióndesuj etos) .
Hayque f ij
ar se bi en siesbi later al( H0 esque no haydi fer enci as,H1,hay
diferenci as)ouni later al( der echo,H0 menoroi gual ,H1,may orque;i zquier do,HO
may oroi gual ,H1,menorque) .Cui dadoconf ij
arbi enn,cui dadocuandoden
muchosdat ospor queav ecesnospr egunt ansól osobr eunapar te.Cui dadocon
cadapr egunt a,not odassonsobr el omi smo.Enl asituaci ón1onor malesque
pregunt en pormedi as,pr opor ci ones yv arianzas.Sihaydos muest ras con
diferent enúmer odesuj et os,soni ndependi ent es.Sól osonr elaci onadassil os
mi smossuj et os( or elacionadosporpar es,i .
e.gemel os)sonsomet idosat odos
l
osdi stint osni velesdel fact or .
Sino sabemossegur al ar espuest a de pr imer ase i ncluso en t alcaso,
conv ienedescar tarl asqueseani mposi bles.Elv alorcr íticosebuscaenl at abla
par a1- αo1- α/ 2.
Par a ev itarer ror eso det ect arlos,conv ieneescr i
bi rdepuño yl et ra,con
claridad,t odosl osdat os,enl ugarsepar adoydest acadodedondehacemosl as
oper aciones.Par al acal cul ador a,conv i
eneescr ibirlasf órmul ast alv i
enenenel
formul ar io,si n si mpl ifi
caci ones que nos puedan i nduci ra er ror,con l os
par éntesi sensusi tio( est oesv i
t al).
2.-Pr uebapr ev iadelcont rast edei gual dad dev arianzas.Sedi videnl as
cuasi var i
anzaso v arianzasmuest ral esi nsesgadas,poni endo l amay orenel
numer ador( arriba) .Elcont rast eesbi l
at eral, port ant ohayqueacudi ral ast abl as
de l a F buscando 1- α/ 2;t i
ene que haber mucha di f
er enci a ent r
el as
cuasi var i
anzaspar aqueseconsi der el adi f
er enci adev ar ianzaspobl aci onal es
significat i
v a.SielEC >VC,ser echazal ahi pót esisdequel asv arianzasson
i
gual es.Si esmenor , seacept a.
3.-Ni velpcr íti
co:Eselni veldesi gni fi
caci óndelest adí st i
codecont rast e,es
deci r,lapr obabi l
idad,si endoH0 ci erta,deobt enerunv alori gualomásext r
emo
queeldelECquehemoscal culado.Lat abl anosdasi empr el apr obabi lidadque
hayal ai zqui er da, poreso:
-Sielcont rast eesuni lat eralder echo, elni velpcr í
ticoes1–pr obabi li
dadde
l
at abla.Buscamoselv alordel apr obabi l
idadquehayenl acol ader echadelECy
l
at abl anosdal aquehayal ai zqui erda, poresor estamosde1el v alordel at abl a.
-Sielcont rast eesuni l
at er alizqui erdo, elni velpcr í
ticoeselv al
ordel at abl a,
yaquebuscamosel valorquehayenl acol ai zqui erdayesel quenosdal at abla
-Si esbi lat eral,(1–pr obabi l
idaddel at abl a)semul tipl i
capor2.
Cuandonocoi nci de,ent oncesseest abl ecer áelni v elpcr í
ticocomomay oro
46
menorqueeldel at abla, dependi endodesielECesmásgr andeomáspequeño
queel VC.
¡Hazt eelesquemadel agr áf icayr ay al aszonasdeacept aci ónyr echazo!En
elej ehor i
zont alest ánl osv al oresdelest adí st i
coyelár eadelej econl acur v aes
l
apr obabi l
i
dad.Regl ai nf ali
ble:Cuant oMÁSGRANDEeselv al orabsol utodelEC
(est ámásal ejadodel cent ro), MENOResel ni velpcr í
ticoyv icev ersa.Port ant oel
rechazodeH0espor que| EC| >|VC| ol oqueesl omi smo, porquep<α.
4. -ANOVAS.Hayquer el l
enarelSudoku.Sinosei dent i
f icabi enelt ipode
ANOVA que es ( unifact orialcon muest ras i ndependi ent es o r elaci onadas;
bifact orialídem) ,ay udar áempezarporelmássenci l
loysisobr andat os,ser áel
otro.Sepuedehaceralr evés:Sif al tandat os,l onor malesqueseaelmásf áci
l
.
Par al osgr adosdel i
ber tadempi ezaporelf i
nal,puesesf áci li dentificarN- 1.A
par ti
rdeahí ,seponenl osgr adosdel iber taddecadaf actor ,al ai nteracci ónyl a
diferenci aaler roroMCi nter .Luegosev ancal culandol oquef alte,t eni endoen
cuent aqueMC=SC/ g.l.yquel asumat otaldeg. l
.esN- 1, salv oenr egr esi ón, que
esN- 2.Nor mal ment el osgr adosdel iber taddeler rorol aSCINTER ser ánmucho
may or esquel osdel aSCINTRA.Fór mul aquef al t
a:SC=n· S2(númer odeel ement os
porl av ari
anza) .
5. -Model odeef ect osf ij
os- aleat or i
os.Ef ectosf ij
os:Sól oi nteresanl osdat os
par al osni velesdel osf act oresmanej ados.Ef ectosal eator ios,i nter esanpar a
cual esqui erani velesdel osf act or es.Encasodeduda, nocont est ar.
6. -Cont rastes en r egr esi ón l ineal :Son bi laterales ( sal v o elANOVA de
regr esión)yport antohayquef unci onarcon1- α/2.Elgr adodel iber taddel a
regr esiónsi mpl ees1yel t
ot al del osg. l
.,n- 2.
7. -Di sti
nci ónent r
ecor r
el aci ónsemi par cialypar cial.Enl asemi par ci alse
eli
mi nadeli nfl
ujodeunaVIenl aVD,eli nf l
ujodet odasl asdemásVI .Enl a
par cialse el imi na además eli nflujo de cual esqui era ot ras v ariabl es no
consi der adas( incluidaseneler ror ).Lascor r
elacionescal cul adassi nmás,es
deci rsi nel iminareli nflujodeot rasv ariabl esest énonoenelmodel o,noson
pur asysel l
amanbi variadasodeor dencer o.
8. -Elcoef iciente de cor relaci ón mi de elgr ado de asoci ación ent rel as
variabl es.Sucuadr adoescoef i
ci ent ededet erminaciónymi deelpor cent aj ede
variabi li
daddel aVDat r
ibuibl eal aVI .Sucompl ement arioeselcoef icient ede
ali
enaci ón y mi de elpor cent aje de v ar iabil
idad at ri
bui bleav ariabl es no
consi der adas( error).

Enelexamen,cr
eoqueesmejorempezarporlaspregunt
asdet eorí
ano
asoci
adasdir
ect
amenteal
ospr
obl
emas(ser
ánentr
e7-10)yluegoirr
esolv
iendo
l
assituaci
onesenqueest
emosmásseguros,dej
andoparaelf i
nall
oqueno
sal
ga.

Par
aaprobarsenecesi
tancomomí ni
mo13aci er
tosy1error(cont
est
ando
14)yapar
tirdeaquí14/3(
17) ,
15/5(20),
16/7(23)
.Hayquecontarconfri
aldad
l
asqueestánbien(l
asdepr oblemaslassabr
emossegurascasial100%)ei ra
47
asegurar
.Sisabemosocr eemosquet enemosbien16,hayquecont est
ar23,
porquecontest
ando24o25necesitar
íamos17par aapr obarycont
est
ando21o
22,también16.Encasodedudasenal gunaspregunt
as,hayqueelegiraquel
las
enlasquepodamosdescartarunar
espuest a,
esdeci
r,sólodudemosentre2.

48
Diseños de Investigación y Análisis de Datos. 2018/19 -

1. En un contraste de hipótesis sobre dos medias para muestras independientes y con independencia de los resultados
obtenidos, ¿cuál de las siguientes afirmaciones es cierta?:

A) Si utilizásemos muestras más grandes aumentaría el valor del estadístico de contraste y con ello la
probabilidad de rechazar la hipótesis nula, aunque no cambiaría el tamaño del efecto.

B) Si disminuimos el tamaño de la muestra disminuiría el valor del estadístico de contraste y la significación de la


diferencia, además del tamaño del efecto.

C) Aumentando el tamaño de la muestra se consigue un efecto mayor pero no afecta al estadístico de contraste sobre la
significación de las diferencias.

2. Se denomina parámetro al índice calculado con los datos de la:

A) Muestra. B) Población. C) Distribución.

3. La evaluación de los supuestos de un modelo de regresión:

A) Debería realizarse como paso previo y como requisito al proceso inferencial.

B) Es innecesaria ya que el ajuste es muy bueno y, por consiguiente, el modelo debe ser lineal.

C) Permite identificar si la relación entre PA y IMC es, o no, lineal.

4. Para aplicar un contraste paramétrico a los datos de su muestra:

A) Tanto la variable dependiente como la independiente han de ser cuantitativas (de intervalo o razón).

B) La variable dependiente ha de ser cuantitativa (de intervalo o razón).

C) La variable independiente ha de ser cuantitativa (de intervalo o razón).

5. Cuál de los siguientes estimadores de su correspondiente parámetro poblacional NO es insesgado:

A) La media aritmética.

B) La varianza.

C) La proporción.

Solución: La varianza muestral no es un estadístico insesgado de la varianza poblacional mientras que la media
aritmética y la proporción sí lo son.

6. La probabilidad de mantener una hipótesis nula falsa se denomina:

A) 𝛼𝛼

B) 𝜷𝜷

C) 1 − 𝛽𝛽
Diseños de Investigación y Análisis de Datos. 2018/19 -

Solución: Nos están preguntado por el error tipo II que es Beta.

7. Cuando al realizar un ANOVA un investigador no está interesado en comprobar las diferencias entre todas las medias
y sabe de antemano que comparaciones le interesan, se denomina a las comparaciones múltiples que ha de realizar:

A) “a priori”.

B) “a posteriori”.

C) “post hoc”.

Solución: las comparaciones a posteriori se utilizan cuando el investigador no establece a priori las comparaciones a
realizar y solo lo hace después de ejecutado el experimento. Por el contrario, cuando sí conoce estos contrastes antes
de realizar el estudio, se denominan “a priori”.

8. Al realizar inferencias sobre correlación y regresión, el supuesto de homocedasticidad se refiere a:

A) La normalidad de las distribuciones condicionadas en Y para cada valor de X.

B) La independencia en Y de los valores estimados condicionados para cada valor de X.

C) La igualdad de varianzas de las distribuciones de los errores condicionadas a cada valor de X.

Solución: el supuesto de homocedasticidad hace referencia a la igualdad de varianzas en las distribuciones de los
errores condicionadas a cada valor de X (no a la normalidad ni a la independencia entre valores de Y).

9. Los supuestos necesarios para realizar inferencias sobre correlación y regresión, incluyen:

A) Heterocedasticidad para las varianzas de las distribuciones condicionadas de los errores.

B) Independencia entre los valores estimados Y´ y los errores de estimación ε.

C) Independencia entre los valores de la variable independiente X y los valores estimados Y´.

10. En un modelo de ANOVA de efectos aleatorios:

A) El investigador establece como niveles del factor sólo aquellos en los que está interesado en estudiar.

B) Se considera que los “i” niveles del factor son una muestra aleatoria de todos los posibles niveles.

C) Todos los modelos de ANOVA son de efectos aleatorios.

11. La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es:

A) Insesgada. B) Un parámetro. C) Una variable aleatoria.

12. Una condición para contrastar los coeficientes de regresión es:

A) Que 𝛽 = 0.

B) Que las puntuaciones de la variable independiente sean normales.

C) Que las puntuaciones de la variable dependiente condicionadas a cada valor de la variable independiente
sean normales.
Diseños de Investigación y Análisis de Datos. 2018/19 -

13. En una situación de correlación múltiple, la correlación semi-parcial entre X1 e Y:

A) Ha eliminado el influjo que X1 tiene sobre X2

B) Ha eliminado el influjo que X2 tiene sobre X1

C) Ha eliminado el influjo que X2 tiene sobre Y.

Solución: Nos piden la correlación semi-parcial entre X1 e Y habiendo eliminado el influjo del resto de variables
independientes (VI´s) sobre la X1. Como solamente tenemos como otra variable independiente X2, significa que debemos
eliminar el influjo de X2 sobre X1 (ver página 264, “… para saber qué parte de la VD explica cada VI al margen de las
otras VI´s, para así poder determinar el influjo único que esa VI tiene sobre la VD. Esta relación entre cada VI y la VD
habiendo eliminado el influjo del resto de las VI´s sobre cada VI es lo que se llama Coeficiente de correlación
semiparcial”).

14. En los Anovas el contraste es unilateral derecho porque:

A) La distribución F no tiene valores inferiores a 0.

B) Establecemos hipótesis sobre las varianzas poblacionales y estas son siempre positivas.

C) Dada la lógica del Anova, la posibilidad de encontrar valores de F inferiores a la unidad es poco probable.

15. La posibilidad de analizar interacciones es:

A) Una de las razones por las que se recomienda el Anova frente a las comparaciones dos a dos de muestras
(dependientes o independientes).

B) Es problemática porque incrementa el error Tipo I.

C) Es difícil porque no se conoce la distribución muestral de las F´s en esta situación.

16. El tamaño del efecto:

A) Es mayor a medida que aumenta el tamaño de las muestras.

B) Es mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos experimental y control.

C) No depende del tamaño muestral.

Solución: A diferencia de lo que sucede con los estadísticos de contraste, la magnitud del tamaño del efecto no depende
del tamaño muestral. La opción A contradice esta afirmación. La opción B es errónea porque, según la fórmula de la d
de Cohen, la diferencia de las medias entre el grupo experimental y control está en el numerador. Por tanto, cuanto mayor
sea esta diferencia, mayor será d; cuanto menor sea esta diferencia, menor será d.

17. La distribución muestral de la proporción sigue el modelo de probabilidad:

A) Binomial. B) T de Student. C) Chi cuadrado.

18. El tamaño del efecto:

A) se puede clasificar en tres categorías según Cohen.

B) depende del tamaño muestral.

C) es una diferencia de medias no estandarizada.


Diseños de Investigación y Análisis de Datos. 2018/19 -

19. En el análisis de la regresión, el error típico es:

A) La diferencia entre la puntuación observada en un sujeto y la puntuación pronosticada.

B) La desviación típica de las puntuaciones pronosticadas.

C) La desviación típica de los errores de pronóstico.

Solución: por definición, el error típico es la desviación típica de los errores de pronóstico. La opción A es incorrecta porque define
el error de pronóstico para un sujeto, mientras que la opción B hace referencia a Sx de la variable dependiente pronosticada (T’) en
este caso.

20. Los coeficientes de correlación parcial y semiparcial son semejantes en que:

A) No son medidas de asociación.

B) No son correlaciones de orden cero.

C) No eliminan el influjo de otras variables independientes.

21. Uno de los supuestos básicos del análisis de regresión simple es:

A) Los pronósticos y los errores son independientes.

B) Las distribuciones condicionadas de los errores deben de tener una distribución uniforme.

C) No deben estar relacionadas las variables predictoras y la variable dependiente o criterio.

22. En los diseños intra-sujetos se considera que la varianza de error viene dada por:

A) El factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.

23. Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el tamaño de la muestra:

A) Aumenta el error máximo. B) Disminuye el error típico. C) Aumenta la cuasivarianza muestral.

24. El valor complementario de la probabilidad de cometer un error de tipo II se denomina:

A) Nivel de confianza. B) Potencia del contraste. C) Nivel crítico.

25. Cuál de los siguientes estimadores para la media poblacional de una distribución es suficiente:

A) La mediana. B) La media aritmética. C) La moda.

26. Se llama error típico de un estadístico a la desviación típica de:

A) El parámetro poblacional. B) La distribución muestral del estadístico. C) La distribución de la muestra.

27. Con dos variables independientes (𝑋1; 𝑋2) y una variable dependiente (𝑌), el coeficiente de correlación parcial entre
𝑋1 e 𝑌, representa:

A) La relación entre 𝑌 y 𝑋1 eliminando el influjo de 𝑋2 sobre la variable dependiente.

B) La relación entre 𝒀 y 𝑿𝟏 eliminando el influjo de 𝑿𝟐 sobre la variable dependiente y sobre 𝑿𝟏.

C) La relación entre 𝑌 y 𝑋2 eliminando el influjo de 𝑋1 sobre la variable dependiente y sobre 𝑋2.


Diseños de Investigación y Análisis de Datos. 2018/19 -

28. Para la regresión lineal simple se obtienen dos coeficientes, ordenada en el origen (𝐵0) y pendiente (𝐵).
Generalmente, estaremos más interesados en interpretar:

A) 𝐵0

B) 𝑩

C) Depende de la magnitud del coeficiente de correlación de Pearson.

29. Para que sean válidas las inferencias que sobre la variable dependiente se hagan con la recta de regresión, las
varianzas de las distribuciones de los errores, condicionadas a los diferentes valores de la variable independiente deben
de cumplir el supuesto de:

A) Heterocedasticidad. B) Homocedasticidad. C) Uniformidad.

30. En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t de Student para realizar
comparaciones múltiples dos a dos?:

A) Sí, porque es la mejor opción.

B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa.

C) No porque se incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.

31. El nivel crítico p, representa la probabilidad:

A) De rechazar la hipótesis nula cuando es cierta.

B) De rechazar la hipótesis alternativa si es cierta.

C) De obtener unos datos como los observados o más extremos siendo cierta la hipótesis nula.

32. Uno de los supuestos básicos del análisis de regresión simple es:

A) Los pronósticos y los errores son independientes.

B) Las distribuciones condicionadas de los errores deben de tener una distribución uniforme.

C) No deben estar relacionadas las variables predictoras y la variable dependiente o criterio.

33. En el caso de la regresión lineal simple, el signo del coeficiente de correlación y de la pendiente de la recta de
regresión:

A) Son opuestos B) Son independientes C) Son iguales.

34. Suponiendo que existieran dos estadísticos insesgados, consistentes y suficientes para estimar la misma
característica poblacional, la mejor elección es utilizar el estadístico:

A) Con la desviación típica más pequeña.

B) Con la desviación típica más grande.

C) Cualquiera de ellos, dado que ambos gozan de las mismas propiedades.


Diseños de Investigación y Análisis de Datos. 2018/19 -

35. El intervalo de confianza es más estrecho a medida que:

A) Aumenta el tamaño de la muestra B) Aumenta el nivel de confianza C) Aumenta el error típico del estadístico.

36. En el análisis de varianza, cada nivel del factor es:

A) Una categoría de las variables dependientes.

B) Cada una de las variables independiente.

C) Una categoría de las variables independientes.

37. A medida que aumenta el tamaño de la muestra, aumenta también:

A) La potencia del contraste; B) La amplitud del intervalo de confianza; C) El error tipo II.

38. El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula que es verdadera,
recibe el nombre de:

A) Potencia del contraste; B) Error tipo II; C) Nivel de significación.

39. El error típico de la media representa:

A) la máxima diferencia que cabe esperar por simple azar entre la media obtenida en la muestra y la media de la población
formulada en la 𝐻0;

B) la desviación típica de la distribución muestral de la media;

C) el error que se comete al estimar la media poblacional a partir de la media de la muestra.


1- Las curvas de potencia, permiten localizar la potencia de un contraste en función de: A) el
valor de 𝑯𝟏 y el tamaño de la muestra B) los valores de 𝐻0 y 𝐻1 C) el nivel de significación y
la potencia del contraste

2- El intervalo de confianza es más estrecho a medida que: A) aumenta el tamaño de la


muestra B) aumenta el nivel de confianza C) aumenta el error típico del estadístico

3- Suponiendo que existieran dos estadísticos insesgados, consistentes y suficientes para


estimar la misma característica poblacional, la mejor elección es utilizar el estadístico: A) con la
desviación típica más pequeña B) con la desviación típica más grande C) cualquiera de ellos,
dado que ambos gozan de las mismas propiedades.

4- El término “error típico” se refiere a: A) la desviación típica de la distribución muestral del


estadístico B) el error máximo que estamos dispuestos a admitir en un contraste de hipótesis
C) el estimador insesgado de la desviación típica poblacional

5- En un contraste de hipótesis se plantea la siguiente hipótesis nula: 𝐻0: 𝜇 = 10. Si queremos


calcular la potencia del contraste para una media poblacional igual a 12, la hipótesis alternativa
ha de ser: A) 𝐻1: 𝜇 > 12 B) 𝐻1: 𝜇 < 12 C) 𝑯𝟏: 𝝁 = 𝟏2

6- Al aumentar el tamaño de la muestra: A) disminuye la probabilidad de rechazar 𝐻0 cierta B)


disminuye la probabilidad de rechazar 𝐻1 cierta C) disminuyen el error de tipo I y tipo II, por
lo que las opciones A y B son correctas

7- El estadístico d de Cohen: A) Se aplica para contrastes no paramétricos de diferencia de


proporciones B) Analiza la relevancia de la diferencia de medias entre dos muestras
independientes C) Su valor depende del tamaño de las muestras

8- El valor complementario de la probabilidad de cometer un error de tipo II se denomina: A)


Nivel de confianza. B) Potencia del contraste. C) Nivel crítico

9- Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el
tamaño de la muestra: A) Aumenta el error máximo. B) Disminuye el error típico. C) Aumenta
la cuasivarianza muestral

10- En los diseños intra-sujetos se considera que la varianza de error viene dada por: A) El
factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.

11- Se llama error típico de un estadístico a la desviación típica de : A) El parámetro


poblacional. B) La distribución muestral del estadístico. C) La distribución de la muestra

12- Cuál de los siguientes estimadores para la media poblacional de una distribución es
suficiente: A) La mediana. B) La media aritmética. C) La moda.

13- En un contraste de hipótesis sobre dos medias en el que el tamaño del efecto es
moderado: A) El estadístico de contraste puede ser significativo o no, dependiendo del
tamaño de la muestra. B) El estadístico de contraste siempre será significativo para 𝛼 = 0,05 C)
El estadístico de contraste siempre será significativo para 𝛼 = 0,01

14- A la probabilidad de rechazar una hipótesis nula falsa se le denomina: A) Nivel de


confianza. B) Potencia del contraste. C) Beta
15- En un ANOVA de dos factores, cuando la interacción no es significativa: A) Es preciso
rehacer el análisis focalizándolo sólo sobre los efectos principales. B) Disminuye la suma de
cuadrados de error. C) Las opciones A y B son ciertas.

16- El nivel crítico p, representa la probabilidad: A) De rechazar la hipótesis nula cuando es


cierta. B) De rechazar la hipótesis alternativa si es cierta. C) De obtener unos datos como los
observados o más extremos siendo cierta la hipótesis nula.

17- La probabilidad de rechazar una hipótesis nula que es verdadera, recibe el nombre de: A)
Potencia del contraste. B) Error tipo II. C) Nivel de significación.

18- En un contraste de hipótesis bilateral sobre una media poblacional, ¿puede utilizarse el
intervalo de confianza para contrastar dicha hipótesis? A) Sí, y se rechaza 𝑯𝟎 cuando el valor
formulado en la 𝑯𝟎 se encuentra fuera del intervalo de confianza. B) Sí, y se rechaza 𝐻0
cuando el estadístico de contraste se encuentra fuera del intervalo de confianza. C) El intervalo
de confianza no aporta información para rechazar o no 𝐻0

19- En un ANOVA de medidas repetidas de un factor, la variabilidad total observada en la


variable dependiente se descompone en tres componentes, los dos primeros corresponden a
la variabilidad del factor que estamos manipulando y la variabilidad de los sujetos. El tercer
componente hace referencia a: A) La variabilidad de la interacción entre el factor y los
sujetos. B) Las desviaciones de las puntuaciones de los sujetos respecto a la combinación de
tratamientos. C) Ninguna de las opciones anteriores es correcta

20- En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t
de Student para realizar comparaciones múltiples dos a dos?: A) Sí, porque es la mejor opción.
B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa. C) No porque se
incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.

21- La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es: A)
Insesgada. B) Un parámetro. C) Una variable aleatoria.

22- La potencia del contraste se puede expresar simbólicamente como: A) 𝑃(𝐻0 = aceptar | 𝐻0
= falsa) B) 𝑃(𝐻0 = rechazar | 𝐻0 = cierta) C) 𝑷(𝑯𝟎 = rechazar | 𝑯𝟎 =falsa)

23- En un modelo de ANOVA de efectos aleatorios: A) El investigador establece como niveles


del factor sólo aquellos en los que está interesado en estudiar. B) Se considera que los “i”
niveles del factor son una muestra aleatoria de todos los posibles niveles. C) Todos los
modelos de ANOVA son de efectos aleatorios.

24- El tamaño del efecto: A) Es mayor a medida que aumenta el tamaño de las muestras. B) Es
mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos
experimental y control. C) No depende del tamaño muestral.

25- La distribución muestral de la proporción sigue el modelo de probabilidad: A) Binomial. B)


T de Student. C) Chi cuadrado

26- La posibilidad de analizar interacciones es: A) Una de las razones por las que se
recomienda el Anova frente a las comparaciones dos a dos de muestras (dependientes o
independientes). B) Es problemática porque incrementa el error Tipo I. C) Es difícil porque no
se conoce la distribución muestral de las F´s en esta situación.
27- En los Anovas el contraste es unilateral derecho porque: A) La distribución F no tiene
valores inferiores a 0. B) Establecemos hipótesis sobre las varianzas poblacionales y estas son
siempre positivas. C) Dada la lógica del Anova, la posibilidad de encontrar valores de F
inferiores a la unidad es poco probable.

28- El tamaño del efecto: A) se puede clasificar en tres categorías según Cohen. B) depende
del tamaño muestral. C) es una diferencia de medias no estandarizad

29- El investigador informó que, en su estudio, 1 − 𝛽 = 0,6. Esto significa que: A) la probabilidad
de no rechazar H0 siendo falsa vale 0,6. B) la probabilidad de rechazar H0 siendo falsa vale
0,6. C) la probabilidad de no rechazar H0 siendo verdadera vale 0,4

30- Al aumentar el tamaño de la muestra, el intervalo de confianza: A) permanece inalterado;


B) es más ancho; C) es más estrecho.

31- Si optase por utilizar muestras más grandes y suponiendo que se mantienen los mismos
estadísticos obtenidos en estas muestras, ¿cuál de las siguientes consecuencias se
producirían?: A) aumentaría el tamaño del efecto; B) aumentaría la probabilidad de rechazar
la hipótesis nula C) disminuiría la potencia del contraste.

32- El error típico de la media representa: A) la máxima diferencia que cabe esperar por simple
azar entre la media obtenida en la muestra y la media de la población formulada en la 𝐻0; B) la
desviación típica de la distribución muestral de la media C) el error que se comete al estimar
la media poblacional a partir de la media de la muestra

33- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis
nula que es verdadera, recibe el nombre de: A) Potencia del contraste; B) Error tipo II; C) Nivel
de significación

34- A medida que aumenta el tamaño de la muestra, aumenta también: A) La potencia del
contraste B) La amplitud del intervalo de confianza; C) El error tipo II

33- Cuál de las siguientes distribuciones de probabilidad NO es simétrica en torno a cero: A) la


normal tipificada; B) Chi cuadrado C) T de Student.

34- El error típico de la media es: A) el error que sumamos y restamos a la media aritmética
para calcular el intervalo de confianza; B) la desviación típica de la distribución muestral de la
media C) el error que cometemos si rechazamos una hipótesis nula verdadera.

33- Cuál de los siguientes estimadores sobre la tendencia central de una distribución es
suficiente: A) la mediana; B) la media aritmética C) la moda

34- El valor crítico para tomar una decisión respecto a la hipótesis nula depende: A) del nivel
de confianza que se establezca B) de los grados de libertad de la distribución muestral de la
diferencia de proporciones; C) de si se conoce o no la varianza poblacional de las diferencias.

35- En un contraste de hipótesis sobre la media aritmética, el valor absoluto del valor crítico:
A) es el mismo en un contraste unilateral izquierdo y un contraste unilateral derecho B) es el
mismo en un contraste bilateral y unilateral derecho; C) es el mismo en un contraste bilateral y
unilateral izquierdo.

36- La potencia de un contraste de hipótesis será mayor: A) a medida que aumenta el tamaño
de la muestra B) a medida que disminuye el tamaño de la muestra; C) siempre es la misma
suponiendo que H1 es verdadera.
37- Las curvas de potencia permiten localizar la potencia de un contraste en función de: A) el
tamaño de la población y de la muestra; B) el valor de H1 y el tamaño de la muestra C) el
tamaño de la población y el valor de H1

38- En un contraste de hipótesis sobre una media, si es cierta la hipótesis alternativa pero no
se detecta en el contraste estadístico, se comete un error: A) de tipo II B) de tipo I; C) igual al
nivel crítico.

39- La potencia del contraste es igual a: A) probabilidad de aceptar la hipótesis nula siendo
cierta; B) probabilidad de rechazar la hipótesis nula siendo falsa C) probabilidad de rechazar
la hipótesis alternativa siendo verdadera.

40- Las pruebas no paramétricas se utilizan en diseños en los que se trabaja con: A) Muestras
no representativas de la población objetivo del estudio; B) Muestras pequeñas o variables que
no alcanzan el nivel de medida de intervalo o razón C) Variables medidas con escala de
intervalo que provienen de poblaciones con distribución poblacional desconocida.

41- Si a medida que aumenta el tamaño de la muestra tanto la varianza de la distribución de


probabilidad de un estimador como su sesgo tiende a cero, decimos que el estimador es: A)
suficiente; B) consistente C) sesgado

42- A la probabilidad de rechazar H0 cuando es falsa se la denomina: A) error tipo I; B) nivel de


confianza; C) potencia del contraste.

43- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en
muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas C) ninguna de las anteriores es correcta.

44- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1 C) El nivel de confianza más nivel significación es igual a 1.

45- El nivel de significación representa: A) el máximo error que el investigador está dispuesto
a admitir para rechazar una hipótesis nula que es verdadera B) el máximo error que el
investigador está dispuesto a admitir para rechazar una hipótesis nula que es falsa; C) la
probabilidad de rechazar una hipótesis nula que es falsa.

46- En un contraste de hipótesis, el valor crítico representa: A) la probabilidad de rechazar la


hipótesis nula siendo verdadera; B) la máxima diferencia que cabe esperar entre el valor
teórico formulado en la hipótesis nula y el valor que encontramos en nuestros datos para
esa hipótesis C) la probabilidad de que siendo cierta la hipótesis nula encontremos unos
resultados como los observados en la muestra o más extremos.

47- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume
como provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los
datos obtenidos en la muestra.

48- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria ordinaria.
49- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede
adoptar valores negativos porque: A) los valores de la ordenada (eje vertical) son todos
positivos; B) toda distribución de densidad de probabilidad se estandariza para que tenga un
área igual a la unidad; C) es el cociente entre dos varianzas y estas son siempre positivas

50- El contrabalanceo de las condiciones experimentales es necesario realizarlo: A) en diseños


intra-sujetos B) cuando no existen efectos de práctica o fatiga; C) para aleatorizar los efectos
de las condiciones manipuladas

51- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el
tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.

52- A medida que aumenta el tamaño de la muestra, la distribución muestral de la proporción


se aproxima a una distribución: A) Normal; B) Binomial; C) con grados de libertad.

53- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A)
cuya distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.

54- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

55- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un
nivel de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación;
B) aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.

56- El nivel de confianza se refiere a: A) La probabilidad de que el parámetro se encuentre


dentro de un intervalo de confianza; B) El valor inverso del error típico; C) La probabilidad de
que el estadístico se encuentre dentro de la distribución muestral del parámetro

57- A la probabilidad de rechazar la hipótesis nula cuando es falsa se le denomina: A) nivel de


confianza; B) potencia del contraste; C) nivel p-crítico.

58- Para comprobar si la diferencia entre dos medias es significativa, calculamos: A) el


estadístico de contraste; B) el tamaño del efecto; C) las dos opciones anteriores son
verdaderas

59- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a
comparar deben de cumplir el supuesto de: A) complementariedad y exhaustividad; B)
homocedasticidad; C) independencia.
Susana R.

RCP respuesta única ( teoría) (si hay alguna pregunta que no os suena puede ser del libro
anterior y no es materia de estudio )
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS.
Tema 1

1. Si un estimador, no coincide, en promedio, con el parámetro que intenta estimar y además


su distribución tiene poca variabilidad: Decimos que es un estimador eficiente

2. La varianza muestral es: Un estimador consistente de la varianza poblacional y Un


estimador sesgado de la varianza poblacional.

3. La eficiencia relativa: Es un valor entre O y 1 y Es un cociente entre dos varianzas

4. La varianza insesgada es: b) La varianza muestral multiplicada por n y dividida por n-1.

5. La desviación típica de la distribución muestral de un estadístico es: Una medida de


variabilidad y El error típico de ese estadístico.

6. Si la varianza muestral (sesgada) vale 100, el estimador insesgado de la varianza


poblacional: a) Es mayor que 100

7. Si la esperanza de un estimador no es igual al parámetro: a) El sesgo no es nulo

8. La eficiencia de un estimador es una medida de variabilidad: a) De ese estimador.

9. La distribución de frecuencias de una característica en la población viene definida por


su media y su: c) Varianza.

10. Un estimador es insesgado: a) Si la media de la distribución muestral del estimador es


igual al parámetro y b) Si la esperanza del estimador es igual al parámetro.

11. ¿Cuál de estos estimadores es suficiente para m? b) 1/n (Y1+.......+Yn)

12. El error típico de la varianza es: a) La desviación típica de la distribución muestral de


la varianza.
13. E(P) = p por lo que la proporción de la muestra P: a) Es un estimador insesgado de la
proporción poblacional

14. Cuando la distribución muestral de un estimador Ô1 es menos variable que la de otro


estimador Ô2, diremos que: b) Ô1 es más eficiente que Ô2

15. Un estimador es suficiente: a) Si utiliza toda la información de la muestra para estimar


el parámetro.

16. El sesgo del estimador es: c) La diferencia entre la media de la distribución muestral
del estimador y el parámetro.

17. El error típico de la media es: a) La raíz cuadrada de la varianza de la distribución


muestral de la media
18. Si la eficiencia relativa de un estimador, Ô1 respecto a otro estimador, Ô2 es del 85%,
para un mismo tamaño muestral: c) El cociente entre las varianzas de las distribuciones
muestrales de los respectivos estimadores es 0,85

19. En la estimación puntual: b) Se toma un valor muestral concreto como estimación del
parámetro.

20. Un estimador es más eficiente: a) Cuanto mayor sea la varianza de la distribución


muestral del estimador. y b) Cuanto menos varíe el valor del estimador de una muestra a
otra

21. ¿Cuál es la varianza de la distribución muestral del estimador 1 si sabemos que la


eficiencia relativa de él y otro estimador 2 es de 0,89 y la varianza de 2 35?: c) 31,5

22. El intervalo de confianza: b) Es más pequeño cuanto mayor es el nivel de confianza,


para los mismos datos.

23. Cuando se rechaza Ho mediante el nivel crítico p: a) Necesariamente se rechazará con


el valor crítico.

24. El estadístico de contraste Z para una media vale -2,15, siendo alfa igual a 0,05, n= 145
y el contraste bilateral. b) Se rechaza Ho

25. El rechazo de H1 implica necesariamente que: c) El valor muestral del estadístico de


contraste cae en la zona de aceptación de Ho

26. A la zona de rechazo de la hipótesis nula se suele llamar: b) Región crítica

27. Cuando ponemos a prueba una hipótesis, el método que se utiliza para tomar una
decisiónentre la hipótesis nula (Ho) y la hipótesis alternativa (H1) es: c) El contraste de
hipótesis.

28. El nivel crítico p: b) Para su cálculo se tiene en cuenta la dirección del contraste
(unilateral/bilateral)

29. Elija la alternativa correcta: b) El nivel crítico p es un valor entre 0 y 1

30. Los intervalos de confianza: a) Formalmente son un método de estimación de


parámetros

31. En los contrastes de hipótesis. c) Si el valor obtenido al aplicar el estadístico de


contraste cae dentro de la región de aceptación, podemos rechazar la hipótesis alternativa.

32. La hipótesis nula: c) Ambas alternativas son incorrectas.

33. La desviación típica de la distribución muestral de un estadístico se llama: Error típico

34. Sobre el nivel de significación alfa de un contraste estadístico: a) Se fija antes de


analizar los datos

35. El nivel crítico p y el nivel de significación alfa: a) Son probabilidades


Y b) Su comparación permite decidir si se rechaza o no la hipótesis nula
36. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la
muestra: c) Mayor es la amplitud del intervalo.

37. Cuando construimos un intervalo de confianza para la media, manteniendo constantes


los demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n.c.) del 95% en lugar
del 99%. b) Aumenta la probabilidad de cometer error tipo I.

38. Una estimación por intervalos: c) Establece un rango de valores dentro del cual se
estima esté el valor del parámetro.

39. Beta de un contraste estadístico: b) Es una probabilidad.

40. La hipótesis nula: “la varianza del grupo 1 es mayor o igual que la varianza del grupo
2”, se refiere a un contraste: c) Unilateral izquierdo.

41. Con n = 50, la probabilidad del error tipo II es igual a 0,30. Con un n = 40 y
manteniendo constantes los demás factores: b) Beta será superior a 0,30

42. El valor crítico : b) Es función de alfa

43. El nivel crítico p: b) Su valor depende del valor muestral del estadístico

44. La probabilidad de error tipo II representa: c) La probabilidad de aceptar la hipótesis


nula siendo falsa.

45. Cuanto mayor es la probabilidad del error tipo II, manteniendo constantes los demás
factores: a) Menor es el nivel de significación

46. La probabilidad de error tipo I representa: a) La probabilidad de rechazar la hipótesis


nula siendo verdadera

47. El contraste de hipótesis tiene como finalidad:


a) Obtener información sobre algún aspecto de la población de la que se extrajo la
muestra.

48. Que dos hipótesis sean mutuamente excluyentes significa que: c) El rechazo de una de
ellas implica necesariamente la aceptación de la otra

49. La idea general del contraste de hipótesis es hallar: a) La probabilidad asociada al valor
muestral del estadístico.

50. Una hipótesis alternativa del tipo μ<μ0 plantea un contraste: a) Unilateral izquierdo

51. El nivel de significación (α): b) Se fija de forma arbitraria en la planificación de la


investigación

52. Sobre el nivel crítico p: b) Puede ser menor que uno

53. Cuando construimos un intervalo de confianza para la media, manteniendo constantes


los demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n. c.) del 99% en lugar
del 95%?: a) Con un n.c. del 99% la probabilidad de α será menor y menor la probabilidad
de cometer error tipo I.
54. Si obtenemos un nivel crítico p mayor que el alfa adoptado quiere decir que: c) Los
resultados no son estadísticamente significativos.

55. Sobre alfa y el nivel crítico p: b) Si sus valores son iguales se rechaza la hipótesis nula
56. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la
muestra: a) Mayor es la precisión del intervalo

57. La distribución muestral de la media es normal: a) Cuando es normal la distribución de


la variable estudiada o cuando tiende a la normalidad a medida que aumenta el tamaño de
la muestra

58. El error típico de la distribución muestral del estadístico varianza es: a) La desviación
típica de la distribución muestral de la varianza

59. Sabemos que la variable rendimiento académico se distribuye normalmente en la


población de estudiantes de Bachillerato en España, pero no conocemos el valor de la
varianza de tal variable. Un investigador quiere saber entre qué límites se encuentra la
media del rendimiento académico en la población. Toma una muestra aleatoria e
independiente de 400 estudiantes y obtiene una media de 20 siendo la varianza insesgada
de 4. ¿Cuál de las siguientes alternativas expresa el valor aproximado, del límite inferior
del intervalo de confianza para α = 0,05? c) 16,08

60. Hemos extraído una muestra aleatoria de 49 sujetos y le hemos medido el pulso en
reposo, obteniendo una media igual a 60 pulsaciones por minuto. Sabemos que las
pulsaciones forman una escala de intervalo y se distribuyen normalmente con varianza
poblacional igual a 16. Tomamos un n.c. del 99%. ¿cuál será el error máximo (Emáx)
aproximado en el cálculo del intervalo de confianza para μ? b) 1,47

61. Se considera que hemos obtenido un resultado estadísticamente significativo cuando:


a) Cuando se acepta H1
62. En el contraste de hipótesis para la varianza tratamos de:
a) Probar si nuestros datos concretos han podido ser obtenidos de una población con esa
varianza.

63. En el contraste de hipótesis, la elección de: b) μ0, μ1, α, β es arbitraria mientras que la σ2
y n no lo son.

64. La distribución muestral de un estadístico permite inferir:a) Un parámetro

65. Cuando calculamos el intervalo de confianza para la proporción, en el caso de una


muestra, nuestro objetivo es determinar: a) Los valores que limitan el valor del parámetro
proporción que cumplen la característica

66. Hemos extraído una muestra aleatoria de 36 sujetos y les hemos medido el tiempo de
reacción a un estímulo visual, obteniendo una media igual a 50 milisegundos. La varianza
poblacional de la distribución de los tiempos de reacción es igual a 9. Sabiendo esto, cuál
será el intervalo de confianza del 95% en torno a la media poblacional:
a) 49,02 < μ < 50,98

67. Hemos aplicado un cuestionario de ansiedad a una muestra de 16 deportistas antes de


una competición y obtuvimos una puntuación media en ansiedad iguala 5. Las
puntuaciones en el cuestionario de ansiedad forman una escala de intervalo y se
distribuyen normalmente con varianza igual a 4. ¿Entre qué valores esperamos se
encuentre la media poblacional de la ansiedad precompetitiva, a un nivel de confianza del
95%?.: b) 4,02 < μ < 5,98

68. Atendiendo a los datos del problema anterior, entre qué valores esperamos se
encuentre la media poblacional de la ansiedad precompetitiva, a un nivel de confianza del
99%: a) 3,71 < μ < 6,29

69. Hemos estimado en una muestra de 16 españoles, la media del grado de acuerdo sobre
la legalización del aborto obteniendo Ȳ = 8. El grado de acuerdo sobre la legalización del
aborto es una variable medida a nivel de intervalo que se distribuye normalmente en la
población con σ2 = 36. Asumiendo un nivel de confianza del 95%, qué tamaño debe tener
la muestra para que la media no se aleje más de ± 1 punto de la media poblacional: 139

70. Con los datos del problema anterior, sin tener en cuenta que conocemos la varianza
poblacional, sino que conocemos desviación típica y la media del grado de acuerdo sobre
la legalización del aborto, Ȳ = 8 y S = 5. Queremos saber, a un nivel de confianza del 99%
qué tamaño debe tener la muestra para que la media estimada no se aleje más de ± 3
puntos de la media poblacional: b) 26

71. En una investigación sobre ansiedad, contrastamos la hipótesis nula de que la media
poblacional e igual o mayor que 10. i sabemos que el valor muestral del estad stico de
contraste z = 2,88 y el nivel crítico, p= 0,002, ¿qué significa esta p?:
a) Que la probabilidad de obtener un estadístico de contraste igual o menor que el hallado
es 0,002.

72. Teniendo en cuenta los datos del problema anterior y adoptando un α= 0,01:
a) Se rechaza H0, puesto que p < α

TEMA 2: CONTRASTE DE HIPÓTESIS EN LOS CONTRASTES DE UNA MUESTRA.

La potencia: b) Es deseable que no sea inferior a 0,80

2. Con n = 40, la potencia es igual a 0,70. Con un n = 60 y manteniendo constantes los


demás factores: b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor
que 0,70

3. El estadístico de contraste Z para una media vale 3, siendo alfa igual a 0,05, n = 120, y el
contraste bilateral: c) Se rechaza H0

4. En los contrastes de hipótesis referidos a una muestra, cuando el interés del


investigador se centra en el parámetro media, lo que se prueba es: a) Si nuestros datos
concretos han sido obtenidos de una población con esa media

5. Con n = 30, la potencia es igual a 0,60. Con un n = 40 y manteniendo constantes los


demás factores: b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor
que 0,60

6. En la potencia del contraste de hipótesis, la relación de α y n: a) Es inversa con β

7. Para realizar el contraste de hipótesis sobre la proporción, utilizamos el estadístico P


que se calcula con:a) Datos dicotómicos.

8. En el contraste de hipótesis para la varianza, la variable aleatoria cuyo parámetro σ2


0 pretendemos contrastar, sigue un función de densidad de probabilidad: c) Normal.
9. Un contraste de varianza permite comprobar si los datos de la muestra proceden de una
población con varianza igual a la estipulada en H0: b) Sí
10. Un contraste de una media permite comprobar si los datos de la muestra proceden de
una población con media igual a la estipulada en la hipótesis nula: a) Sí

11. Cuál de las siguientes afirmaciones es correcta: b) En el caso de una sola muestra y si
se conoce la varianza de la población el estadístico de contraste para la varianza es Z.
12. Las condiciones para poder aplicar el estadístico de contraste Z en el caso de la
proporción (una sola muestra) incluyen: a) Muestra aleatoria de n observaciones y
población dicotómica.

13. Tenemos una población normal con varianza conocida. Se toma de ella una muestra de
tamaño n = 15. Para estimar el valor del parámetro media poblacional μ, utilizaremos un
estadístico de contraste cuya distribución es: a) Normal (N(0,1))

14. La distribución muestral de un estadístico de contraste es la distribución T de Student


con n – 1 g. L. Y el contraste es unilateral derecho. Para un valor muestral igual a 1,33 y 17
grados de libertad, el nivel crítico p es: a) 0,10

15. La prueba de Wilcoxon para una muestra: b) También conocida como prueba de
rangos y signos.

16. La prueba de Wilcoxon frente a la de signos: a) Gana en precisión ya que aprovecha


mejor la información disponible.

17. Aplicamos el estadístico de contraste W de Wilcoxon (para una muestra) y obtenemos


t+ =101 y t- =19, siendo α = 0,05, n= 15 y el contraste bilateral:
b) Se rechaza H0
18. Cuando en el cálculo del estadístico de contraste de Mann-Whitney-Wilcoxon se
observan empates: a) En la ordenación conjunta de las puntuaciones, a los valores
empatados se les asigna la media de sus órdenes.

19. Las condiciones para poder aplicar el estadístico de contraste S (signos) en el caso de
una sola muestra: c) Muestra aleatoria de n observaciones y cualquier tipo de distribución
20. El estadístico S se aproxima a una distribución normal: c) Siempre.

21. El estadístico S normalmente sigue una distribución: a) Normal

22. Para probar hipótesis relativas a la mediana, cuando se cumple la aleatoriedad de las
observaciones, la distribución de la variable es simétrica en la población y el nivel de
medida de intervalos, aplicaremos la prueba de: a) Wilcoxon antes que la de signos porque
aporta más información.

23. Para contrastar hipótesis sobre la mediana, si queremos utilizar la prueba de Wilcoxon,
es necesario que el nivel de medida de los datos sea, al menos: c) De intervalo

24. La depresión es una variable medida a nivel de intervalo que se distribuye


normalmente en la población con varianza conocida. Para una muestra n = 16, ¿qué valor
toma la probabilidad del error tipo II si al contrastar H0: μ = 5 frente a H1: μ = 7, vale 0,70
la probabilidad de rechazar la hipótesis nula siendo falsa?: a) 0,30
25. Sabemos por trabajos anteriores que un antidepresivo tiene una tolerancia media,
sobre los pacientes que lo toman, de 1,5 según algún índice de tolerancia (cuanto mayor es
el índice mayor es la tolerancia) y una varianza igual a 1. Pensamos que modificando la
fórmula química del antidepresivo podríamos incrementar la tolerancia a este
medicamento sin que se modifique su propiedad antidepresiva. El grado de tolerancia al
antidepresivo es una variable medida a nivel de razón que se distribuye normalmente en
la población. Para un n = 25, ¿cuál es la probabilidad de obtener un resultado significativo,
si hipotetizamos una diferencia de + 0,5 entre la media bajo la hipótesis alternativa y
aquélla bajo la hipótesis nula (μ1 – μ0 =0,5) teniendo en cuenta un α = 0,01?: c) 0,56

26. En algunas investigaciones sobre conformismo social, los madrileños fueron


calificados de conformistas. Un investigador basándose en sus propios estudios, opina que
los madrileños no son conformistas, hipotetizando un puntuación inferior a 5 en una
escala de conformismo social que va de 0 a 10, lo cual indicaría inconformismo. Sabiendo
que las puntuaciones en conformismo social forman una escala de intervalo y se
distribuyen normalmente en la población con varianza igual a 1, ¿cuál será la potencia del
contraste para H1 : μ = 4, manteniendo constantes los demás factores?: α = 0,05 y n = 25
c)0,9996

27. En una distribución muestral normal (del estadístico media), con una media de 30 y
una desviación típica de 16, ¿qué probabilidad hay de obtener al azar una media
comprendida entre 14 y 26?: b) 0,6826

28. En una muestra aleatoria de 101 sujetos, procedentes de una población normal e
infinita, se ha obtenido una media igual a 40 y una desviación típica igual a 15. ¿Qué
porcentaje de medias hay comprendido entre los valores t picos = 2,4 y = 1,5 de la
distribución muestral de la media?: a) 92,5%

29. Se ha realizado la distribución muestral de la media con 225 muestras, de 90 sujetos


cada una, y se ha comprobado que es normal. En la población, el valor de la media es de 45
(μ = 45) y el de la desviación típica de 15 (σ = 15). Cuál será el valor típico (puntuación
típica) que, llevado a ambos lados de la media, comprende el 90% de los casos de esa
distribución muestral?: b) ± 1,65

30. Teniendo en cuenta los datos del problema anterior, qué media de esa distribución
muestral dejará por debajo de sí el 90% de los casos: a) 47,02

31. A una muestra aleatoria de 17 estudiantes de secundaria se les aplicó una prueba cuya
finalidad era medir sus conocimientos sobre conceptos científicos básicos. En la variable
analizada, los estudiantes se distribuyen normalmente con una media igual a 78. Los
resultados del estudio en la muestra fueron: media igual a 84,984 y desviación típica igual
a 16. El intervalo de confianza de la distribución muestral será: α = 0,05 ± 2,12

32. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste será:
b) t = 1,746

33. con los datos de los dos problemas anteriores, el criterio de decisión será:
c) Para un n. c. del 0,95 no podemos aceptar la H1.

34. Una muestra aleatoria de 30 personas presenta una desviación típica, en la variable
“tiempo de ejecución” de una tarea de reconocimiento de palabras, igual a 120 segundos.
Queremos saber si es compatible este resultado, a un nivel de confianza de 99% con el
supuesto de que la desviación típica en la población (para esta variable), con una
distribución normal, es de 150 segundos. Teniendo esto en cuenta, el planteamiento de las
hipótesis sería: b) H0 : σ2 = 1502 y H1 : σ2≠ 1502

35. Con los datos del problema anterior, el estadístico de contraste será:
a) χ2 = 19,2
36. Teniendo en cuenta los datos de los dos problemas anteriores, el intervalo confidencial
será: c) 13,1 < χ2 < 52,3

37. La decisión tomada sobre los resultados será la siguiente: c) Como nuestro estadístico
de contraste se encuentra en el intervalo confidencial al 99% de n. c., no podemos rechazar
la hipótesis nula.

38. Con muestras aleatorias de 121 sujetos, la distribución muestral de la media (de una
variable que se distribuye normalmente en la población) tiene una media de 25 y como
desviacióntípica de 10. La formulación de las hipótesis será: n.c. : 95% a) H0 : μ = 25 y H1 : μ
≠ 2539. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste
para comprobar que una muestra del mismo tamaño con media = 28 y desviación típica =
30 pertenece a la misma población será: a) Z = 0,3

40. atendiendo a los resultados anteriores, el criterio de decisión será:


b) Podemos afirmar que la media obtenida por nosotros en la investigación, es
compatible, a un nivel de confianza del 95%, con la hipótesis de que la media de la
población sea de 25.

41. En una muestra aleatoria de 200 sujetos, procedentes de una población normal e
infinita, se ha obtenido una media igual a 60 y una desviación típica igual a 20. Cuál será el
error típico de la media: c) 1,42

42. Un educador piensa que sólo un 15% de los alumnos de cuarto de primaria, del colegio
en el que trabaja, son capaces de manejar con rapidez el diccionario. Para comprobar lo
que piensa, selecciona al azar una muestra de 150 alumnos de ese curso y les realiza una
prueba de manejo del diccionario. Teniendo en cuenta estos datos, la formulación de las
hipótesis estadísticas será: α = 0,05 a) H0: π = 0,15 y H1: π ≠ 0,15

43. Teniendo en cuenta los datos del problema anterior, el contraste será:
c) Bilateral

44. El estadístico de contraste para los datos de los dos problemas anteriores será:

b) Z = 1,715

45. Atendiendo a los datos de los problemas anteriores, la interpretación de los resultados
será: b) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador
está justificada, es decir, que sólo un 15% de los alumnos maneja con rapidez el
diccionario.

46. El equipo docente de la asignatura Diseños de Investigación y Análisis de Datos


considera que el 50% de los alumnos que se presentan a examen, obtienen una nota de 7 o
más. Tras realizar el examen de febrero, comprueban que en una muestra aleatoria de 200
exámenes, 70 obtienen la calificación de Notable, 20 son calificados con Sobresaliente, 80
obtienen la calificación de Aprobado y 30 la de Suspenso. Sabiendo que: Suspenso < 5; 7 >
Aprobado ≥ 5; 9 > Notable ≥ 7; Sobresaliente ≥ 9 ¿Qué planteamiento dará el equipo
docente a las hipótesis estadísticas?: (n. c., 95%) a) H0 : η = 7 y H1 : η ≠ 7
47. Según los datos del problema anterior, el estadístico de contraste será:
c) = 1,41

48. Atendiendo a los resultados obtenidos, la conclusión a la que se puede llegar es la


siguiente: a) Es posible seguir manteniendo que la mediana de la población de referencia
está en la puntuación 7, es decir, que el 50% de los alumnos que se presentan a examen
obtienen una nota de 7 o más, con un nivel de confianza del 95%.

TEMA 3

1. Los diseños de investigación intersujetos determinan analizar los datos con estadísticos
de contraste para: b) Muestras independientes

2. Si tras establecer el intervalo de confianza respecto a una diferencia entre proporciones


independientes, encontramos que el valor cero no se encuentra en el intervalo:
c) Debemos rechazar la hipótesis nula de igualdad entre proporciones poblacionales.

3. Cuando establecemos el intervalo de confianza para la diferencia entre pares de medias


correspondientes a muestras independientes, se mantendrá la H0 si:
a) El valor del parámetro estipulado en H0 cae dentro del intervalo.

4. ¿Cuál de las alternativas es correcta?: (LAS DOS)


a) Dos muestras son independientes cuando las observaciones o medidas son
independientes entre las muestras, pero no dentro de ellas.
b) Cuando se mide una variable en los dos miembros de n pares de sujetos siendo los
miembros de cada par muy similares en alguna característica relevante, estamos ante
un diseño de medida independientes.

5. En el cálculo del estadístico de contraste T para el caso de dos muestras independientes


es necesario conocer: a) La varianza insesgada de cada muestra

6. Para aplicar un contraste de medias en dos muestras independientes, se debe cumplir


que: b) La variable dependiente debe estar medida, al menos, a nivel de intervalo

7. Queremos contrastar que H0: π21 = π12. Hemos estimado que la diferencia entre las dos
proporciones poblacionales estará entre los valores 0,047 y 0,470 con una probabilidad
igual a 0,99. Se podría interpretar que: a) Ambas proporciones son distintas

8. En el contraste estadístico de dos medias independientes:


a) Lo más habitual es desconocer el valor de las varianzas poblacionales
9. Hemos seleccionado aleatoriamente un grupo de 10 imágenes y las procesamos con dos
programas de ordenador (cinco a cada programa asignadas aleatoriamente) para ver si
existen diferencias entre los tiempos medios de procesamiento de las imágenes, ¿cómo
son lasmuestras? a) Independientes

10. Para la aplicación del estadístico W de Wilcoxon (LAS DOS)


a) No importa la forma de la distribución de la variable
b) La distribución de la variable debe ser normal

11. En algunas investigaciones sobre percepción de olores, se encontró que la diferencia


entre la proporción de mujeres que detectan la presencia de moléculas de androsterona y
la de los varones es 0,10. Para contrastar este resultado, extraemos una muestra aleatoria
de 800 mujeres (M) y otra de 400 hombres (H), y encontramos que 640 mujeres y 200
varones detectan la presencia de dichas moléculas. Cuál sería la formulación de las
hipótesis estadísticas: (N.c. 99%) a) H0: πM πH = D = 0,10 y H1: πM πH ≠ D ≠ 0,10

12. El estadístico de contraste en el caso de los datos del problema anterior sería:
b) Z = 6,9
13. La conclusión obtenida en nuestro análisis sería: a) Para un n. c., igual a 0,99, la
diferencia entre la proporción poblacional de mujeres que detectan la presencia de
moléculas de androsterona y la de los varones es distinta de 0,10.

14. Un psicólogo deportivo desea estudiar el efecto de la relajación sobre la amplitud de


apertura de piernas (AP). Extrae aleatoria e independientemente 9 gimnastas con una AP
similar y las asigna también aleatoriamente a dos grupos. A los del primer grupo (grupo
experimental),les somete a un programa de estiramiento de 14 semanas de duración en el
que se introducen ejercicios de relajación y a los del segundo grupo (grupo control) les
somete al mismo programa de estiramiento pero sin ejercicios de relajación. Finalizado el
programa de estiramiento, mide la amplitud de la apertura de piernas a los 9 gimnastas.
Las medidas obtenidas en los grupos experimental (E) y control (C) son las siguientes:
E: 130 127 142 145 135
C: 110 125 120 115
La amplitud de movimiento es una variable medida en grados que se distribuye
normalmente
en ambas poblaciones con varianzas desconocidas pero supuestas iguales. N. c. 95%
Según estos datos, ¿cuál sería la formulación de la hipótesis nula?: (LAS DOS)
a) H0: μE = μC y H1: μE ≠ μC
b) H0: μE μC = 0 y H1: μE μC ≠ 0

15. Atendiendo a los datos del problema anterior, la zona de rechazo de la hipótesis nula
está formada por: b) Todos los valores iguales y menores que t7, 0,025 = 2,36 e iguales y
mayores que t7, 0,975 = 2,36

16. Continuando con el problema anterior, el valor del estadístico de contraste será:
a) t = 3,52

17. Según los datos de los problemas anteriores (14, 15 y 16), podemos afirmar:
a) Que los resultados llevan al rechazo de H0, a un nivel de significación igual a 0,05, de
que las muestras proceden de dos poblaciones con medias iguales.

18. Queremos comparar el método tradicional (T) de la UNED con un método nuevo, en
concreto, un método multimedia (M), para la enseñanza a distancia de la estadística.
Nuestra hipótesis es que los alumnos que estudien con el método tradicional obtendrán
unas notas inferiores a las de los alumnos que estudien con el método multimedia.
Extraemos aleatoria e independientemente 7 alumnos del segundo curso de psicología de
la UNED y les asignamos también aleatoriamente a los dos métodos de enseñanza. Los
datos que aparecen a continuación representan las notas obtenidas en un examen de
estadística en ambas muestras de alumnos:
Método Tradicional (MT): 4 5 6 2
Método Multimedia (MM): 9 8 10
La nota en estadística es una variable medida a nivel de intervalo que se distribuye
normalmente en ambas poblaciones con varianzas: σ2T = 4 y σ2 M = 2. N. c. 95%. Teniendo
en cuenta estos datos, ¿cuál será la formulación de las hipótesis estadísticas?:
b) H0: μT ≥ μM y H1: μT < Μm
19. Atendiendo a los datos del problema anterior, el valor del estadístico de contraste será:
c) Z = 3,68

20. Continuando con los datos de los problemas anteriores, podemos afirmar que: b) A
nivel poblacional, los alumnos que estudiaron con el método tradicional tienen una
nota media en estadística inferior a los que estudiaron con el método multimedia,
asumiendo un nivel de significación igual a 0,05.

21. Algunas variables ejercen su influencia sobre las conductas haciendo éstas más o
menos variables. Un investigador quiere investigar esta cuestión en la conducta afectiva de
los niños. Su hipótesis es que la conducta afectiva de los niños es menos variable que la de
las niñas. Extrae una muestra aleatoria de 41 niñas y otra de 31 niños y les mide la
afectividad mediante un cuestionario obteniendo una varianza insesgada igual a 9 en la
muestra de niños y una de 36 en la muestra de niñas. La variable puntuación en el
cuestionario de afectividad está medidaa nivel de intervalo. ¿cuál será el planteamiento
de la hipótesis estadísticas? (N. c. 99%)
c) H0: σ2A ≤ σ2 O ó H0: σ2A / σ2 O ≤ 1 y H1: σ2A > σ2 O ó H1: σ2 A / σ2 O > 1
22. El estadístico de contraste, atendiendo a los datos del problema anterior será:
c) f = 4

23. La zona de rechazo de la hipótesis nula estará formada por todos los valores:
a) Todos los valores iguales y mayores que f0,99; 40, 30 = 2,30

24. Los resultados llevan a las siguientes conclusiones:


b) Los resultados llevan al rechazo de H0 con un nivel de significación igual a 0,01, de que
la varianza de las puntuaciones en el cuestionario de afectividad en la población de
niñas, es igual o menor que en la de niños.

25. Se quiere comprobar el efecto de un método novedoso de aprendizaje en dos grupos


de niños, uno de 4 alumnos y otro de 3. Sabemos que el análisis estadístico ha aportado
diferencias significativas del efecto del nuevo método con respecto al tradicional. Sabemos
que el grupo de n=4 al que se le aplicó el método nuevo, obtuvo una media igual a 6 y una
desviación típica insesgada de 4, y que el grupo de n=3 al que se le aplicó el método
tradicional obtuvo una media de 5 y una desviación típica insesgada de 2. ¿Cuál será la
magnitud del efecto del método novedoso sobre el tradicional? c) 0,29

26. Tras realizar análisis estadístico sobre dos muestras de 7 y 8 sujetos, los resultados
apoyan la hipótesis del investigador de que la relajación influye positivamente sobre la
elasticidad en los deportistas. Los resultados obtenidos son los siguientes:
Grupo 1: n=7 ȲR = 125,8 σ2 R = 68,7 (Grupo con relajación) Grupo 2: n=8 ȲNR=119,5 σ2
NR =61,67 (Grupo sin relajación) ¿Cuál será la magnitud de la mejoría de la elasticidad tras
aplicar la relación?: a) 0,78

27. Un psicofísico hipotetiza que los hombres y las mujeres no son igualmente variables en
sensibilidad olfativa. Extrae una muestra aleatoria de 13 hombres (H) y otra de 25 mujeres
(M) y les mide la sensibilidad olfativa, obteniendo una varianza insesgada igual a 10 en la
muestra de hombres y de 17 en la de mujeres. La sensibilidad olfativa es una variable
medida a nivel de intervalo que se distribuye normalmente en ambas poblaciones. N. c.
90%. ¿Cuál será la formulación de la hipótesis estadística?:
b) H0: σ2M = σ2 H ó H0: σ2M / σ2H = 1 y H1: σ2 M ≠ σ2 H ó H1: σ2M / σ2H ≠ 1
28. La zona de aceptación de la hipótesis nula, teniendo en cuenta los datos del problema
anterior, está formada por todos los valores : a)f0,05; 24, 12 = 0,46 < H0 < f0,95; 24, 12 = 2,51
29. El estadístico de contraste, atendiendo a los datos de los dos problemas anteriores
será: c) f = 1,70
30. atendiendo a los datos de los problemas anteriores, (27, 28, 29), ¿se rechaza la
hipótesis nula?: b) No, ya que el valor del estadístico de contraste cae dentro de la zona de
aceptación de la hipótesis nula

31. Siguiendo con los problemas anteriores, ¿apoyan los resultados la hipótesis del
investigador?: a) No, ya que se acepta la hipótesis nula.

32. En una investigación en el área de la psicología deportiva, extraemos aleatoria e


independientemente 200 nadadores y les asignamos también aleatoriamente a las dos
condiciones de un experimento, obteniendo dos muestras de 100 nadadores (grupo
experimental y grupo control). Durante un mes, los nadadores del grupo experimental (E),
además de un entrenamiento intenso, son sometidos a una terapia de relajación, mientras
que los del grupo control (C) realizan el mismo entrenamiento intenso pero sin terapia de
relajación. Las respuestas afirmativas dadas por ambos grupos, al finalizar el período de
entrenamiento, a la pregunta “¿se siente muy cansado?”, fueron 60 en el grupo
experimental y 70 en el grupo control. Queremos saber si la terapia de relajación influye
en la proporción de respuestas afirmativas. Teniendo en cuenta un n. c. del 99%, cuál será
el planteamiento de las hipótesis estadísticas: a) H0: πE πC = 0 y H1: πE πC ≠ 0
33. El estadístico de contraste, teniendo en cuenta los datos del problema anterior, será:
c) z = 1,47

34. El nivel crítico p asociado a nuestro estadístico, será: c) 0,1416

35. Teniendo en cuenta los datos del problema anterior, se rechazará la hipótesis nula?:
a) No, porque p = 0,1416 > α = 0,01

36. Según los resultados de los problemas anteriores, a qué conclusiones llegaremos:
b) La relajación no ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.

37. Un investigador quiere estudiar el efecto de la privación de agua sobre el tiempo que
tardan las ratas en recorrer un laberinto. Extrae aleatoria e independientemente 60 ratas y
les asigna también aleatoriamente a las dos condiciones del experimento: 12 y 24 horas de
privación de agua. Las 30 ratas sometidas a 12 horas de privación de agua (muestra A)
tardaron un tiempo medio de 5,9 minutos en recorrer un laberinto y las 30 ratas
sometidas a 24 horas de privación (muestra B) tardaron 6,40 minutos en recorrer el
mismo laberinto, siendo las desviaciones típicas isesgadas 0,29 y 0,30 respectivamente.
Sabiendo que el n. c. fijado por el investigador es del 95%, cuál será el planteamiento de
las hipótesis estadísticas: a) H0: μA = μB ó μA μB = 0 y H1: μA ≠ μB ó μA μB ≠ 0

38. El estadístico de contraste atendiendo a los datos del problema anterior, será:
c) t = 6,58

39. ¿Cuál será el intervalo de confianza?:


b) 0,35 < μA μB < 0,65

40. ¿Se rechazaría la hipótesis nula?: b) Sí, porque la probabilidad asociada al estadístico
de contraste obtenido es menor que el nivel de significación acordado en nuestra
investigación.

TEMA 4
1. Un ejemplo de muestras relacionadas son las obtenidas:
a) Con un diseño clásico antes y después de un tratamiento.
2. Cuando hallamos los valores críticos del estadísticos T, para dos muestras relacionadas,
con más de 30 grados de libertad, acudimos a la tabla de distribución: c) Normal.

3. El estadístico Z aplicado para el contraste de medias en muestras relacionadas, se


distribuye normalmente: a) Con media 0 y varianza 1

4. Cuando hallamos los valores críticos del estadístico T, para dos muestras relacionadas,
con más de 30 grados de libertad, acudimos a la tabla de distribución:
a) Normal

5. En los contrastes para dos muestras dependientes:


c) Un ejemplo típico es el diseño en el que se toman medidas pre y post tratamiento.

6. Cuando se mida una variable en los dos miembros de n pares de sujetos siendo los
miembros de cada par muy similares en variables relevantes del estudio, asumiremos que
las observaciones de ambas muestras: a) Están relacionadas pero ello no implica que las
diferencias entre cada par de observaciones lo estén.

7. Se desea estudiar si una terapia de relajación reduce el nivel de ansiedad. Se obtiene una
muestra aleatoria de 8 sujetos y se les toman medidas en ansiedad antes y después de
aplicarles la terapia. Sabemos que la variable está medida a nivel de intervalo y que la
distribución poblacional de las diferencias entre cada par de puntuaciones es simétrica en
torno a la medida de tendencia central. ¿Qué estadístico de contraste aplicaría?:
W de Wilcoxon

8. La prueba de Wilcoxon: b) Presenta restricciones en cuanto a la distribución de la


variable en la población y en el nivel de medida de los datos.

9. Cuando utilizamos el estadístico de contraste de Mann-Witney-Wilcoxon, hay que tener


en cuenta que las dos poblaciones, si difieren, lo hacen: a) Sólo en tendencia central

TEMA 5: Diseños con más de dos grupos independientes.


1.El análisis de varianza se ocupa: c) De averiguar qué variabilidad corresponde al factor
estudiado y cuál al error experimental.

2. En el análisis de varianza: a) A las variables independientes se las denomina factores y a


las categorías en que se dividen, niveles.

3. Un modelo experimental se considera equilibrado: b) Cuando el número de elementos


es el mismo en todas sus muestras.

4. En un análisis de varianza, si la variabilidad intergrupo es mayor que la variabilidad


intragrupo: c) Significa que existe diferencia entre los grupos en cuanto a la varianza.

5. Dentro de una muestra en el análisis de varianza: b) Se llama variabilidad intra a la que


se produce dentro de las muestras e inter a la que se produce entre las muestras.

6. Se dice que la MCinter es un estimador sesgado de la varianza poblacional:


c) Porque su esperanza es igual a la varianza poblacional más un sumando.

7. Decimos que un modelo es de efectos fijos:


a) Cuando el investigador establece como niveles del factor sólo aquellos que está
interesado en estudiar.

8. En un modelo de efectos variables: b) Las hipótesis se establecen sobre las varianzas


poblacionales de los efectos del factor.

9. La importancia de las comparaciones planificadas radica c) En su naturaleza “ a priori “

10. Los supuestos de análisis de varianza son: b) Normalidad, homocedasticidad e


independencia.

11. El cometido del Análisis de Varianza es: c) Discernir qué variabilidad corresponde al
factor estudiado y cuál al error experimental.

12. El que un modelo sea o no equilibrado cuando aplicamos el análisis de varianza,


depende de: b) El número de elementos de las muestras

13. Con el ANOVA contrastamos, la diferencia de: b) Medias entre varias muestras

14. La varianza intragrupos es la varianza atribuible: a) El error experimental

15. El estadístico de contraste en el análisis de varianza se distribuye según la


distribución: a) F de Snedecor
16. En el razonamiento del análisis de varianza se supone que dentro de un mismo nivel,
las puntaciones deberían ser: a) Semejantes

17. Queremos comprobar si el ambiente en el que se desarrolla un niño influye en los


valores/puntuaciones obtenidas en un test de inteligencia. Para ello, extraemos de la
población dos grupos de 10 niños cada uno. Uno de ellos de una zona deprimida (grupo D)
y otro de otra zona con un nivel socieconómico elevado (grupo E). Se aplica a ambos
grupos un test de inteligencia y se obtienen los siguientes datos:
SCtotal = 2250,8 SCintra= 1379,6 ¿Cuál será el estadístico más adecuado a utilizar?
a) Estadístico F

18. Cuál será el resultado de nuestro estadístico atendiendo a los datos del problema 24?.
c) F= 11,36

19. Cuál será nuestro valor crítico, atendiendo a los datos del problema 24? b) 4,414

20. A un n.c. del 95% aceptaríamos la Hipótesis alternativa?: (datos del problema 24)
a) Sí porque el valor del estadístico es mayor que nuestro valor crítico.

21. Teniendo en cuenta los resultados obtenidos en los ejercicios anteriores (24 al 27), la
conclusión a la que hemos llegado es la siguiente: c) Al haber obtenido una diferencia
significativa en nuestro estudio, se deduce que el ambiente en el que se desarrolle un niño
influye en las puntuaciones obtenidas en un test de inteligencia.

TEMA 6: ANÁLISIS DE DATOS EN DISEÑOS INTRASUJETOS

1. La diferencia entre dos observaciones del mismo sujeto: (las dos)


a) Depende de la diferencia debida a los efectos del tratamiento
b) Depende de la varianza residual o error (efectos incontrolados)
2. Se pretende estudiar el efecto de un tratamiento, con 5 niveles o dosis diferentes, sobre
10 sujetos. El estadístico de contraste toma un valor F = 29,42 . Para un nivel de confianza
del 0,99. Deseamos saber si el tratamiento ha hecho algún efecto sobre los sujetos.
c) Sí, el tratamiento ha hecho efecto, por eso rechazamos la Ho
3. Según el problema anterior, ahora empleamos 3 niveles de tratamiento y 5 sujetos. El
estadístico obtenido es F = 18,12 El n. c. ahora es del 0,95. Según los datos: c) Rechazamos
la Ho puesto que el estadístico de contraste arroja diferencias significativas.
4. De una muestra de imágenes con el mismo número de puntos (es decir, del mismo
tamaño), se han escogido al azar ocho imágenes diferentes (tomadas en distintas escenas)
y se las ha procesado mediante cuatro algoritmos de emparejamiento (A, B, C, D), con el
objeto de ver el número de emparejamientos incorrectos (EI) que se producía con cada
uno y así determinar la eficacia relativa de los mismos. Teniendo en cuenta un n. c. del
99% y sabiendo que la suma de cuadrados del tratamiento es 248,5, la suma de cuadrados
error es 22 y la suma de cuadrados total es 341,5, cuál será el valor del estadístico de
contraste: c) 64,78

5. El valor crítico obtenido, atendiendo a los datos del problema anterior, será:
a) 4,87

6. Con un nivel de confianza del 99% podemos afirmar (según los datos de los problemas 4
y 5):
c) Que existen diferencias significativas entre al menos dos de los algoritmos en número
de emparejamientos incorrectos.

7. Se lleva a cabo una investigación para estudiar si las Técnicas de Inoculación de Estrés
(TIE) tienen efecto sobre la ansiedad precompetitiva de los corredores de velocidad. Para
ello, se seleccionaron aleatoriamente 12 atletas de entre todos aquéllos que puntuaron
alto en una batería de tests de ansiedad y se les enseñaron la TIE. Para estudiar el efecto
de las TIE se tomaron cuatro medidas de ansiedad precompetitiva mediante un
cuestionario específico en cuatro ocasiones: la 1ª fue tomada en una situación de
laboratorio antes de enseñarles las TIE (LA), la 2ª en una situación previa a la competición
antes de la TIE (CA), la 3ª en una situación de laboratorio después de las TIE (LD) y la 4ª
en una situación previa a la competición después de las TIE (CD). Teniendo en cuenta un
n.c. del 99% y que la suma de cuadrados del tratamiento vale 26,25, la suma de cuadrados
error vale 52,25 y la suma de cuadrados total vale 297,25, ¿cuál será el valor del
estadístico de contraste?: c) 5,526

8. El valor crítico, según los datos del problema anterior es: b) 4,51

9. Atendiendo a los datos de los dos problemas anteriores, podemos concluir que:
a) Existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 7


1. El laboratorio de aprendizaje animal dispone de doce ratas de una cierta raza, con las
que realiza un experimento. Posteriormente adquieren otro grupo de doce ratas (de otra
raza) y, tras la realización del mismo experimento, en las mismas condiciones, sospechan
que los resultados son diferentes según con qué grupo de ratas se realice la experiencia.
La prueba consistía en tomar los tiempos que tardaban en travesar un corredor con
recompensa final, después de 1, 2 ó 3 días de privación de comida.
La variable dependiente (tiempos) se distribuye normalmente, además, las observaciones
son independientes y las varianzas homogéneas. (n. c. 95%) Teniendo en cuenta estos
datos, cuál sería el valor crítico para el factor A (tipo de rata):
a) 4,41
2. Cuál sería el valor crítico para el factor B (tiempo de privación de comida): b) 3,55

3. Cuál sería el valor crítico para la interacción de ambos factores (AB): c) 3,55
4. Continuando con el problema 1, hemos obtenido las siguientes sumas de cuadrados:
SCA = 73,5 SCB = 312,33 SCAB = 7 SCS/AB = 47 A la luz de los resultados podemos concluir, con
respecto al factor A (ratas): b) Existen diferencias significativas entre los dos grupos de
ratas

5. Teniendo en cuenta las sumas de cuadrados anteriores, podemos concluir en cuanto al


factor B (tiempo de privación): c) Estar privadas de comida 1, 2 ó 3 días influye de forma
distinta.
6. Continuando con los datos de los ejercicios anteriores y refiriéndonos al efecto de la
interacción, podemos concluir que: a) No se da ningún efecto significativo cuando se
combinan los dos factores.

7. A 12 ratas procedentes de dos camadas (C y D) se las entrena en la ejecución de un


determinado problema en un laberinto. Se las deja durante cierto tiempo alejadas del
mismo y ejecutando otras tareas, y nuevamente se las lleva al laberinto. El investigador
quiere probar el recuerdo del aprendizaje y toma los tiempos de las ratas en esta segunda
ejecución del laberinto. Dado que no tomó los tiempos de esas mismas ratas antes del
entrenamiento, toma un grupo control de otras 12 ratas de las mismas camadas, y les mide
los tiempos. Los resultados fueron, tras calcular las sumas de cuadrados: SCA = 2,67 SCB =
16,67 SCAB = 20,16 SCS/AB = 101 Se dan los supuestos de homogeneidad de las varianzas y
normalidad. Nc. 95% Teniendo en cuenta estos datos, el valor del estadístico de contraste
para el factor A (ratas) es: c) 0,53
8. Siguiendo con el ejercicio anterior, es estadístico de contraste para el factor B
(adiestramiento) es: a) 3,30
9. Por otro lado, el valor del estadístico de contraste para la interacción sería:
a) 3,99

10. Tras realizar el cálculo de los estadísticos, podemos concluir, refiriéndonos al factor A:
b) No existen diferencias significativas entre las ratas

11. Del mismo modo, podemos concluir acerca del factor B (adiestramiento):
b) No existen diferencias significativas entre los adiestramientos.

12. En cuanto a la interacción, podemos concluir:


c) No se dan efectos significativos cuando se combinan los dos factores.
1- Las curvas de potencia, permiten localizar la potencia de un contraste en función de: A) el
valor de 𝑯𝟏 y el tamaño de la muestra B) los valores de 𝐻0 y 𝐻1 C) el nivel de significación y
la potencia del contraste

2- El intervalo de confianza es más estrecho a medida que: A) aumenta el tamaño de la


muestra B) aumenta el nivel de confianza C) aumenta el error típico del estadístico

3- Suponiendo que existieran dos estadísticos insesgados, consistentes y suficientes para


estimar la misma característica poblacional, la mejor elección es utilizar el estadístico: A) con la
desviación típica más pequeña B) con la desviación típica más grande C) cualquiera de ellos,
dado que ambos gozan de las mismas propiedades.

4- El término “error típico” se refiere a: A) la desviación típica de la distribución muestral del


estadístico B) el error máximo que estamos dispuestos a admitir en un contraste de hipótesis
C) el estimador insesgado de la desviación típica poblacional

5- En un contraste de hipótesis se plantea la siguiente hipótesis nula: 𝐻0: 𝜇 = 10. Si queremos


calcular la potencia del contraste para una media poblacional igual a 12, la hipótesis alternativa
ha de ser: A) 𝐻1: 𝜇 > 12 B) 𝐻1: 𝜇 < 12 C) 𝑯𝟏: 𝝁 = 𝟏2

6- Al aumentar el tamaño de la muestra: A) disminuye la probabilidad de rechazar 𝐻0 cierta B)


disminuye la probabilidad de rechazar 𝐻1 cierta C) disminuyen el error de tipo I y tipo II, por
lo que las opciones A y B son correctas

7- El estadístico d de Cohen: A) Se aplica para contrastes no paramétricos de diferencia de


proporciones B) Analiza la relevancia de la diferencia de medias entre dos muestras
independientes C) Su valor depende del tamaño de las muestras

8- El valor complementario de la probabilidad de cometer un error de tipo II se denomina: A)


Nivel de confianza. B) Potencia del contraste. C) Nivel crítico

9- Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el
tamaño de la muestra: A) Aumenta el error máximo. B) Disminuye el error típico. C) Aumenta
la cuasivarianza muestral

10- En los diseños intra-sujetos se considera que la varianza de error viene dada por: A) El
factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.

11- Se llama error típico de un estadístico a la desviación típica de : A) El parámetro


poblacional. B) La distribución muestral del estadístico. C) La distribución de la muestra

12- Cuál de los siguientes estimadores para la media poblacional de una distribución es
suficiente: A) La mediana. B) La media aritmética. C) La moda.

13- En un contraste de hipótesis sobre dos medias en el que el tamaño del efecto es
moderado: A) El estadístico de contraste puede ser significativo o no, dependiendo del
tamaño de la muestra. B) El estadístico de contraste siempre será significativo para 𝛼 = 0,05 C)
El estadístico de contraste siempre será significativo para 𝛼 = 0,01

14- A la probabilidad de rechazar una hipótesis nula falsa se le denomina: A) Nivel de


confianza. B) Potencia del contraste. C) Beta
15- En un ANOVA de dos factores, cuando la interacción no es significativa: A) Es preciso
rehacer el análisis focalizándolo sólo sobre los efectos principales. B) Disminuye la suma de
cuadrados de error. C) Las opciones A y B son ciertas.

16- El nivel crítico p, representa la probabilidad: A) De rechazar la hipótesis nula cuando es


cierta. B) De rechazar la hipótesis alternativa si es cierta. C) De obtener unos datos como los
observados o más extremos siendo cierta la hipótesis nula.

17- La probabilidad de rechazar una hipótesis nula que es verdadera, recibe el nombre de: A)
Potencia del contraste. B) Error tipo II. C) Nivel de significación.

18- En un contraste de hipótesis bilateral sobre una media poblacional, ¿puede utilizarse el
intervalo de confianza para contrastar dicha hipótesis? A) Sí, y se rechaza 𝑯𝟎 cuando el valor
formulado en la 𝑯𝟎 se encuentra fuera del intervalo de confianza. B) Sí, y se rechaza 𝐻0
cuando el estadístico de contraste se encuentra fuera del intervalo de confianza. C) El intervalo
de confianza no aporta información para rechazar o no 𝐻0

19- En un ANOVA de medidas repetidas de un factor, la variabilidad total observada en la


variable dependiente se descompone en tres componentes, los dos primeros corresponden a
la variabilidad del factor que estamos manipulando y la variabilidad de los sujetos. El tercer
componente hace referencia a: A) La variabilidad de la interacción entre el factor y los
sujetos. B) Las desviaciones de las puntuaciones de los sujetos respecto a la combinación de
tratamientos. C) Ninguna de las opciones anteriores es correcta

20- En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t
de Student para realizar comparaciones múltiples dos a dos?: A) Sí, porque es la mejor opción.
B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa. C) No porque se
incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.

21- La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es: A)
Insesgada. B) Un parámetro. C) Una variable aleatoria.

22- La potencia del contraste se puede expresar simbólicamente como: A) 𝑃(𝐻0 = aceptar | 𝐻0
= falsa) B) 𝑃(𝐻0 = rechazar | 𝐻0 = cierta) C) 𝑷(𝑯𝟎 = rechazar | 𝑯𝟎 =falsa)

23- En un modelo de ANOVA de efectos aleatorios: A) El investigador establece como niveles


del factor sólo aquellos en los que está interesado en estudiar. B) Se considera que los “i”
niveles del factor son una muestra aleatoria de todos los posibles niveles. C) Todos los
modelos de ANOVA son de efectos aleatorios.

24- El tamaño del efecto: A) Es mayor a medida que aumenta el tamaño de las muestras. B) Es
mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos
experimental y control. C) No depende del tamaño muestral.

25- La distribución muestral de la proporción sigue el modelo de probabilidad: A) Binomial. B)


T de Student. C) Chi cuadrado

26- La posibilidad de analizar interacciones es: A) Una de las razones por las que se
recomienda el Anova frente a las comparaciones dos a dos de muestras (dependientes o
independientes). B) Es problemática porque incrementa el error Tipo I. C) Es difícil porque no
se conoce la distribución muestral de las F´s en esta situación.
27- En los Anovas el contraste es unilateral derecho porque: A) La distribución F no tiene
valores inferiores a 0. B) Establecemos hipótesis sobre las varianzas poblacionales y estas son
siempre positivas. C) Dada la lógica del Anova, la posibilidad de encontrar valores de F
inferiores a la unidad es poco probable.

28- El tamaño del efecto: A) se puede clasificar en tres categorías según Cohen. B) depende
del tamaño muestral. C) es una diferencia de medias no estandarizad

29- El investigador informó que, en su estudio, 1 − 𝛽 = 0,6. Esto significa que: A) la probabilidad
de no rechazar H0 siendo falsa vale 0,6. B) la probabilidad de rechazar H0 siendo falsa vale
0,6. C) la probabilidad de no rechazar H0 siendo verdadera vale 0,4

30- Al aumentar el tamaño de la muestra, el intervalo de confianza: A) permanece inalterado;


B) es más ancho; C) es más estrecho.

31- Si optase por utilizar muestras más grandes y suponiendo que se mantienen los mismos
estadísticos obtenidos en estas muestras, ¿cuál de las siguientes consecuencias se
producirían?: A) aumentaría el tamaño del efecto; B) aumentaría la probabilidad de rechazar
la hipótesis nula C) disminuiría la potencia del contraste.

32- El error típico de la media representa: A) la máxima diferencia que cabe esperar por simple
azar entre la media obtenida en la muestra y la media de la población formulada en la 𝐻0; B) la
desviación típica de la distribución muestral de la media C) el error que se comete al estimar
la media poblacional a partir de la media de la muestra

33- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis
nula que es verdadera, recibe el nombre de: A) Potencia del contraste; B) Error tipo II; C) Nivel
de significación

34- A medida que aumenta el tamaño de la muestra, aumenta también: A) La potencia del
contraste B) La amplitud del intervalo de confianza; C) El error tipo II

33- Cuál de las siguientes distribuciones de probabilidad NO es simétrica en torno a cero: A) la


normal tipificada; B) Chi cuadrado C) T de Student.

34- El error típico de la media es: A) el error que sumamos y restamos a la media aritmética
para calcular el intervalo de confianza; B) la desviación típica de la distribución muestral de la
media C) el error que cometemos si rechazamos una hipótesis nula verdadera.

33- Cuál de los siguientes estimadores sobre la tendencia central de una distribución es
suficiente: A) la mediana; B) la media aritmética C) la moda

34- El valor crítico para tomar una decisión respecto a la hipótesis nula depende: A) del nivel
de confianza que se establezca B) de los grados de libertad de la distribución muestral de la
diferencia de proporciones; C) de si se conoce o no la varianza poblacional de las diferencias.

35- En un contraste de hipótesis sobre la media aritmética, el valor absoluto del valor crítico:
A) es el mismo en un contraste unilateral izquierdo y un contraste unilateral derecho B) es el
mismo en un contraste bilateral y unilateral derecho; C) es el mismo en un contraste bilateral y
unilateral izquierdo.

36- La potencia de un contraste de hipótesis será mayor: A) a medida que aumenta el tamaño
de la muestra B) a medida que disminuye el tamaño de la muestra; C) siempre es la misma
suponiendo que H1 es verdadera.
37- Las curvas de potencia permiten localizar la potencia de un contraste en función de: A) el
tamaño de la población y de la muestra; B) el valor de H1 y el tamaño de la muestra C) el
tamaño de la población y el valor de H1

38- En un contraste de hipótesis sobre una media, si es cierta la hipótesis alternativa pero no
se detecta en el contraste estadístico, se comete un error: A) de tipo II B) de tipo I; C) igual al
nivel crítico.

39- La potencia del contraste es igual a: A) probabilidad de aceptar la hipótesis nula siendo
cierta; B) probabilidad de rechazar la hipótesis nula siendo falsa C) probabilidad de rechazar
la hipótesis alternativa siendo verdadera.

40- Las pruebas no paramétricas se utilizan en diseños en los que se trabaja con: A) Muestras
no representativas de la población objetivo del estudio; B) Muestras pequeñas o variables que
no alcanzan el nivel de medida de intervalo o razón C) Variables medidas con escala de
intervalo que provienen de poblaciones con distribución poblacional desconocida.

41- Si a medida que aumenta el tamaño de la muestra tanto la varianza de la distribución de


probabilidad de un estimador como su sesgo tiende a cero, decimos que el estimador es: A)
suficiente; B) consistente C) sesgado

42- A la probabilidad de rechazar H0 cuando es falsa se la denomina: A) error tipo I; B) nivel de


confianza; C) potencia del contraste.

43- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en
muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas C) ninguna de las anteriores es correcta.

44- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1 C) El nivel de confianza más nivel significación es igual a 1.

45- El nivel de significación representa: A) el máximo error que el investigador está dispuesto
a admitir para rechazar una hipótesis nula que es verdadera B) el máximo error que el
investigador está dispuesto a admitir para rechazar una hipótesis nula que es falsa; C) la
probabilidad de rechazar una hipótesis nula que es falsa.

46- En un contraste de hipótesis, el valor crítico representa: A) la probabilidad de rechazar la


hipótesis nula siendo verdadera; B) la máxima diferencia que cabe esperar entre el valor
teórico formulado en la hipótesis nula y el valor que encontramos en nuestros datos para
esa hipótesis C) la probabilidad de que siendo cierta la hipótesis nula encontremos unos
resultados como los observados en la muestra o más extremos.

47- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume
como provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los
datos obtenidos en la muestra.

48- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria ordinaria.
49- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede
adoptar valores negativos porque: A) los valores de la ordenada (eje vertical) son todos
positivos; B) toda distribución de densidad de probabilidad se estandariza para que tenga un
área igual a la unidad; C) es el cociente entre dos varianzas y estas son siempre positivas

50- El contrabalanceo de las condiciones experimentales es necesario realizarlo: A) en diseños


intra-sujetos B) cuando no existen efectos de práctica o fatiga; C) para aleatorizar los efectos
de las condiciones manipuladas

51- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el
tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.

52- A medida que aumenta el tamaño de la muestra, la distribución muestral de la proporción


se aproxima a una distribución: A) Normal; B) Binomial; C) con grados de libertad.

53- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A)
cuya distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.

54- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

55- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un
nivel de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación;
B) aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.

56- El nivel de confianza se refiere a: A) La probabilidad de que el parámetro se encuentre


dentro de un intervalo de confianza; B) El valor inverso del error típico; C) La probabilidad de
que el estadístico se encuentre dentro de la distribución muestral del parámetro

57- A la probabilidad de rechazar la hipótesis nula cuando es falsa se le denomina: A) nivel de


confianza; B) potencia del contraste; C) nivel p-crítico.

58- Para comprobar si la diferencia entre dos medias es significativa, calculamos: A) el


estadístico de contraste; B) el tamaño del efecto; C) las dos opciones anteriores son
verdaderas

59- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a
comparar deben de cumplir el supuesto de: A) complementariedad y exhaustividad; B)
homocedasticidad; C) independencia.
1- Las curvas de potencia, permiten localizar la potencia de un contraste en función de: A) el
valor de 𝑯𝟏 y el tamaño de la muestra B) los valores de 𝐻0 y 𝐻1 C) el nivel de significación y
la potencia del contraste

2- El intervalo de confianza es más estrecho a medida que: A) aumenta el tamaño de la


muestra B) aumenta el nivel de confianza C) aumenta el error típico del estadístico

3- Suponiendo que existieran dos estadísticos insesgados, consistentes y suficientes para


estimar la misma característica poblacional, la mejor elección es utilizar el estadístico: A) con la
desviación típica más pequeña B) con la desviación típica más grande C) cualquiera de ellos,
dado que ambos gozan de las mismas propiedades.

4- El término “error típico” se refiere a: A) la desviación típica de la distribución muestral del


estadístico B) el error máximo que estamos dispuestos a admitir en un contraste de hipótesis
C) el estimador insesgado de la desviación típica poblacional

5- En un contraste de hipótesis se plantea la siguiente hipótesis nula: 𝐻0: 𝜇 = 10. Si queremos


calcular la potencia del contraste para una media poblacional igual a 12, la hipótesis alternativa
ha de ser: A) 𝐻1: 𝜇 > 12 B) 𝐻1: 𝜇 < 12 C) 𝑯𝟏: 𝝁 = 𝟏2

6- Al aumentar el tamaño de la muestra: A) disminuye la probabilidad de rechazar 𝐻0 cierta B)


disminuye la probabilidad de rechazar 𝐻1 cierta C) disminuyen el error de tipo I y tipo II, por
lo que las opciones A y B son correctas

7- El estadístico d de Cohen: A) Se aplica para contrastes no paramétricos de diferencia de


proporciones B) Analiza la relevancia de la diferencia de medias entre dos muestras
independientes C) Su valor depende del tamaño de las muestras

8- El valor complementario de la probabilidad de cometer un error de tipo II se denomina: A)


Nivel de confianza. B) Potencia del contraste. C) Nivel crítico

9- Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el
tamaño de la muestra: A) Aumenta el error máximo. B) Disminuye el error típico. C) Aumenta
la cuasivarianza muestral

10- En los diseños intra-sujetos se considera que la varianza de error viene dada por: A) El
factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.

11- Se llama error típico de un estadístico a la desviación típica de : A) El parámetro


poblacional. B) La distribución muestral del estadístico. C) La distribución de la muestra

12- Cuál de los siguientes estimadores para la media poblacional de una distribución es
suficiente: A) La mediana. B) La media aritmética. C) La moda.

13- En un contraste de hipótesis sobre dos medias en el que el tamaño del efecto es
moderado: A) El estadístico de contraste puede ser significativo o no, dependiendo del
tamaño de la muestra. B) El estadístico de contraste siempre será significativo para 𝛼 = 0,05 C)
El estadístico de contraste siempre será significativo para 𝛼 = 0,01

14- A la probabilidad de rechazar una hipótesis nula falsa se le denomina: A) Nivel de


confianza. B) Potencia del contraste. C) Beta
15- En un ANOVA de dos factores, cuando la interacción no es significativa: A) Es preciso
rehacer el análisis focalizándolo sólo sobre los efectos principales. B) Disminuye la suma de
cuadrados de error. C) Las opciones A y B son ciertas.

16- El nivel crítico p, representa la probabilidad: A) De rechazar la hipótesis nula cuando es


cierta. B) De rechazar la hipótesis alternativa si es cierta. C) De obtener unos datos como los
observados o más extremos siendo cierta la hipótesis nula.

17- La probabilidad de rechazar una hipótesis nula que es verdadera, recibe el nombre de: A)
Potencia del contraste. B) Error tipo II. C) Nivel de significación.

18- En un contraste de hipótesis bilateral sobre una media poblacional, ¿puede utilizarse el
intervalo de confianza para contrastar dicha hipótesis? A) Sí, y se rechaza 𝑯𝟎 cuando el valor
formulado en la 𝑯𝟎 se encuentra fuera del intervalo de confianza. B) Sí, y se rechaza 𝐻0
cuando el estadístico de contraste se encuentra fuera del intervalo de confianza. C) El intervalo
de confianza no aporta información para rechazar o no 𝐻0

19- En un ANOVA de medidas repetidas de un factor, la variabilidad total observada en la


variable dependiente se descompone en tres componentes, los dos primeros corresponden a
la variabilidad del factor que estamos manipulando y la variabilidad de los sujetos. El tercer
componente hace referencia a: A) La variabilidad de la interacción entre el factor y los
sujetos. B) Las desviaciones de las puntuaciones de los sujetos respecto a la combinación de
tratamientos. C) Ninguna de las opciones anteriores es correcta

20- En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t
de Student para realizar comparaciones múltiples dos a dos?: A) Sí, porque es la mejor opción.
B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa. C) No porque se
incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.

21- La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es: A)
Insesgada. B) Un parámetro. C) Una variable aleatoria.

22- La potencia del contraste se puede expresar simbólicamente como: A) 𝑃(𝐻0 = aceptar | 𝐻0
= falsa) B) 𝑃(𝐻0 = rechazar | 𝐻0 = cierta) C) 𝑷(𝑯𝟎 = rechazar | 𝑯𝟎 =falsa)

23- En un modelo de ANOVA de efectos aleatorios: A) El investigador establece como niveles


del factor sólo aquellos en los que está interesado en estudiar. B) Se considera que los “i”
niveles del factor son una muestra aleatoria de todos los posibles niveles. C) Todos los
modelos de ANOVA son de efectos aleatorios.

24- El tamaño del efecto: A) Es mayor a medida que aumenta el tamaño de las muestras. B) Es
mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos
experimental y control. C) No depende del tamaño muestral.

25- La distribución muestral de la proporción sigue el modelo de probabilidad: A) Binomial. B)


T de Student. C) Chi cuadrado

26- La posibilidad de analizar interacciones es: A) Una de las razones por las que se
recomienda el Anova frente a las comparaciones dos a dos de muestras (dependientes o
independientes). B) Es problemática porque incrementa el error Tipo I. C) Es difícil porque no
se conoce la distribución muestral de las F´s en esta situación.
27- En los Anovas el contraste es unilateral derecho porque: A) La distribución F no tiene
valores inferiores a 0. B) Establecemos hipótesis sobre las varianzas poblacionales y estas son
siempre positivas. C) Dada la lógica del Anova, la posibilidad de encontrar valores de F
inferiores a la unidad es poco probable.

28- El tamaño del efecto: A) se puede clasificar en tres categorías según Cohen. B) depende
del tamaño muestral. C) es una diferencia de medias no estandarizad

29- El investigador informó que, en su estudio, 1 − 𝛽 = 0,6. Esto significa que: A) la probabilidad
de no rechazar H0 siendo falsa vale 0,6. B) la probabilidad de rechazar H0 siendo falsa vale
0,6. C) la probabilidad de no rechazar H0 siendo verdadera vale 0,4

30- Al aumentar el tamaño de la muestra, el intervalo de confianza: A) permanece inalterado;


B) es más ancho; C) es más estrecho.

31- Si optase por utilizar muestras más grandes y suponiendo que se mantienen los mismos
estadísticos obtenidos en estas muestras, ¿cuál de las siguientes consecuencias se
producirían?: A) aumentaría el tamaño del efecto; B) aumentaría la probabilidad de rechazar
la hipótesis nula C) disminuiría la potencia del contraste.

32- El error típico de la media representa: A) la máxima diferencia que cabe esperar por simple
azar entre la media obtenida en la muestra y la media de la población formulada en la 𝐻0; B) la
desviación típica de la distribución muestral de la media C) el error que se comete al estimar
la media poblacional a partir de la media de la muestra

33- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis
nula que es verdadera, recibe el nombre de: A) Potencia del contraste; B) Error tipo II; C) Nivel
de significación

34- A medida que aumenta el tamaño de la muestra, aumenta también: A) La potencia del
contraste B) La amplitud del intervalo de confianza; C) El error tipo II

33- Cuál de las siguientes distribuciones de probabilidad NO es simétrica en torno a cero: A) la


normal tipificada; B) Chi cuadrado C) T de Student.

34- El error típico de la media es: A) el error que sumamos y restamos a la media aritmética
para calcular el intervalo de confianza; B) la desviación típica de la distribución muestral de la
media C) el error que cometemos si rechazamos una hipótesis nula verdadera.

33- Cuál de los siguientes estimadores sobre la tendencia central de una distribución es
suficiente: A) la mediana; B) la media aritmética C) la moda

34- El valor crítico para tomar una decisión respecto a la hipótesis nula depende: A) del nivel
de confianza que se establezca B) de los grados de libertad de la distribución muestral de la
diferencia de proporciones; C) de si se conoce o no la varianza poblacional de las diferencias.

35- En un contraste de hipótesis sobre la media aritmética, el valor absoluto del valor crítico:
A) es el mismo en un contraste unilateral izquierdo y un contraste unilateral derecho B) es el
mismo en un contraste bilateral y unilateral derecho; C) es el mismo en un contraste bilateral y
unilateral izquierdo.

36- La potencia de un contraste de hipótesis será mayor: A) a medida que aumenta el tamaño
de la muestra B) a medida que disminuye el tamaño de la muestra; C) siempre es la misma
suponiendo que H1 es verdadera.
37- Las curvas de potencia permiten localizar la potencia de un contraste en función de: A) el
tamaño de la población y de la muestra; B) el valor de H1 y el tamaño de la muestra C) el
tamaño de la población y el valor de H1

38- En un contraste de hipótesis sobre una media, si es cierta la hipótesis alternativa pero no
se detecta en el contraste estadístico, se comete un error: A) de tipo II B) de tipo I; C) igual al
nivel crítico.

39- La potencia del contraste es igual a: A) probabilidad de aceptar la hipótesis nula siendo
cierta; B) probabilidad de rechazar la hipótesis nula siendo falsa C) probabilidad de rechazar
la hipótesis alternativa siendo verdadera.

40- Las pruebas no paramétricas se utilizan en diseños en los que se trabaja con: A) Muestras
no representativas de la población objetivo del estudio; B) Muestras pequeñas o variables que
no alcanzan el nivel de medida de intervalo o razón C) Variables medidas con escala de
intervalo que provienen de poblaciones con distribución poblacional desconocida.

41- Si a medida que aumenta el tamaño de la muestra tanto la varianza de la distribución de


probabilidad de un estimador como su sesgo tiende a cero, decimos que el estimador es: A)
suficiente; B) consistente C) sesgado

42- A la probabilidad de rechazar H0 cuando es falsa se la denomina: A) error tipo I; B) nivel de


confianza; C) potencia del contraste.

43- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en
muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas C) ninguna de las anteriores es correcta.

44- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1 C) El nivel de confianza más nivel significación es igual a 1.

45- El nivel de significación representa: A) el máximo error que el investigador está dispuesto
a admitir para rechazar una hipótesis nula que es verdadera B) el máximo error que el
investigador está dispuesto a admitir para rechazar una hipótesis nula que es falsa; C) la
probabilidad de rechazar una hipótesis nula que es falsa.

46- En un contraste de hipótesis, el valor crítico representa: A) la probabilidad de rechazar la


hipótesis nula siendo verdadera; B) la máxima diferencia que cabe esperar entre el valor
teórico formulado en la hipótesis nula y el valor que encontramos en nuestros datos para
esa hipótesis C) la probabilidad de que siendo cierta la hipótesis nula encontremos unos
resultados como los observados en la muestra o más extremos.

47- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume
como provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los
datos obtenidos en la muestra.

48- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria ordinaria.
49- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede
adoptar valores negativos porque: A) los valores de la ordenada (eje vertical) son todos
positivos; B) toda distribución de densidad de probabilidad se estandariza para que tenga un
área igual a la unidad; C) es el cociente entre dos varianzas y estas son siempre positivas

50- El contrabalanceo de las condiciones experimentales es necesario realizarlo: A) en diseños


intra-sujetos B) cuando no existen efectos de práctica o fatiga; C) para aleatorizar los efectos
de las condiciones manipuladas

51- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el
tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.

52- A medida que aumenta el tamaño de la muestra, la distribución muestral de la proporción


se aproxima a una distribución: A) Normal; B) Binomial; C) con grados de libertad.

53- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A)
cuya distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.

54- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

55- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un
nivel de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación;
B) aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.

56- El nivel de confianza se refiere a: A) La probabilidad de que el parámetro se encuentre


dentro de un intervalo de confianza; B) El valor inverso del error típico; C) La probabilidad de
que el estadístico se encuentre dentro de la distribución muestral del parámetro

57- A la probabilidad de rechazar la hipótesis nula cuando es falsa se le denomina: A) nivel de


confianza; B) potencia del contraste; C) nivel p-crítico.

58- Para comprobar si la diferencia entre dos medias es significativa, calculamos: A) el


estadístico de contraste; B) el tamaño del efecto; C) las dos opciones anteriores son
verdaderas

59- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a
comparar deben de cumplir el supuesto de: A) complementariedad y exhaustividad; B)
homocedasticidad; C) independencia.
Diseños de Investigación y Análisis de Datos. 2018/19 -

1. En un contraste de hipótesis sobre dos medias para muestras independientes y con independencia de los resultados
obtenidos, ¿cuál de las siguientes afirmaciones es cierta?:

A) Si utilizásemos muestras más grandes aumentaría el valor del estadístico de contraste y con ello la
probabilidad de rechazar la hipótesis nula, aunque no cambiaría el tamaño del efecto.

B) Si disminuimos el tamaño de la muestra disminuiría el valor del estadístico de contraste y la significación de la


diferencia, además del tamaño del efecto.

C) Aumentando el tamaño de la muestra se consigue un efecto mayor pero no afecta al estadístico de contraste sobre la
significación de las diferencias.

2. Se denomina parámetro al índice calculado con los datos de la:

A) Muestra. B) Población. C) Distribución.

3. La evaluación de los supuestos de un modelo de regresión:

A) Debería realizarse como paso previo y como requisito al proceso inferencial.

B) Es innecesaria ya que el ajuste es muy bueno y, por consiguiente, el modelo debe ser lineal.

C) Permite identificar si la relación entre PA y IMC es, o no, lineal.

4. Para aplicar un contraste paramétrico a los datos de su muestra:

A) Tanto la variable dependiente como la independiente han de ser cuantitativas (de intervalo o razón).

B) La variable dependiente ha de ser cuantitativa (de intervalo o razón).

C) La variable independiente ha de ser cuantitativa (de intervalo o razón).

5. Cuál de los siguientes estimadores de su correspondiente parámetro poblacional NO es insesgado:

A) La media aritmética.

B) La varianza.

C) La proporción.

Solución: La varianza muestral no es un estadístico insesgado de la varianza poblacional mientras que la media
aritmética y la proporción sí lo son.

6. La probabilidad de mantener una hipótesis nula falsa se denomina:

A) 𝛼𝛼

B) 𝜷𝜷

C) 1 − 𝛽𝛽
Diseños de Investigación y Análisis de Datos. 2018/19 -

Solución: Nos están preguntado por el error tipo II que es Beta.

7. Cuando al realizar un ANOVA un investigador no está interesado en comprobar las diferencias entre todas las medias
y sabe de antemano que comparaciones le interesan, se denomina a las comparaciones múltiples que ha de realizar:

A) “a priori”.

B) “a posteriori”.

C) “post hoc”.

Solución: las comparaciones a posteriori se utilizan cuando el investigador no establece a priori las comparaciones a
realizar y solo lo hace después de ejecutado el experimento. Por el contrario, cuando sí conoce estos contrastes antes
de realizar el estudio, se denominan “a priori”.

8. Al realizar inferencias sobre correlación y regresión, el supuesto de homocedasticidad se refiere a:

A) La normalidad de las distribuciones condicionadas en Y para cada valor de X.

B) La independencia en Y de los valores estimados condicionados para cada valor de X.

C) La igualdad de varianzas de las distribuciones de los errores condicionadas a cada valor de X.

Solución: el supuesto de homocedasticidad hace referencia a la igualdad de varianzas en las distribuciones de los
errores condicionadas a cada valor de X (no a la normalidad ni a la independencia entre valores de Y).

9. Los supuestos necesarios para realizar inferencias sobre correlación y regresión, incluyen:

A) Heterocedasticidad para las varianzas de las distribuciones condicionadas de los errores.

B) Independencia entre los valores estimados Y´ y los errores de estimación ε.

C) Independencia entre los valores de la variable independiente X y los valores estimados Y´.

10. En un modelo de ANOVA de efectos aleatorios:

A) El investigador establece como niveles del factor sólo aquellos en los que está interesado en estudiar.

B) Se considera que los “i” niveles del factor son una muestra aleatoria de todos los posibles niveles.

C) Todos los modelos de ANOVA son de efectos aleatorios.

11. La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es:

A) Insesgada. B) Un parámetro. C) Una variable aleatoria.

12. Una condición para contrastar los coeficientes de regresión es:

A) Que 𝛽 = 0.

B) Que las puntuaciones de la variable independiente sean normales.

C) Que las puntuaciones de la variable dependiente condicionadas a cada valor de la variable independiente
sean normales.
Diseños de Investigación y Análisis de Datos. 2018/19 -

13. En una situación de correlación múltiple, la correlación semi-parcial entre X1 e Y:

A) Ha eliminado el influjo que X1 tiene sobre X2

B) Ha eliminado el influjo que X2 tiene sobre X1

C) Ha eliminado el influjo que X2 tiene sobre Y.

Solución: Nos piden la correlación semi-parcial entre X1 e Y habiendo eliminado el influjo del resto de variables
independientes (VI´s) sobre la X1. Como solamente tenemos como otra variable independiente X2, significa que debemos
eliminar el influjo de X2 sobre X1 (ver página 264, “… para saber qué parte de la VD explica cada VI al margen de las
otras VI´s, para así poder determinar el influjo único que esa VI tiene sobre la VD. Esta relación entre cada VI y la VD
habiendo eliminado el influjo del resto de las VI´s sobre cada VI es lo que se llama Coeficiente de correlación
semiparcial”).

14. En los Anovas el contraste es unilateral derecho porque:

A) La distribución F no tiene valores inferiores a 0.

B) Establecemos hipótesis sobre las varianzas poblacionales y estas son siempre positivas.

C) Dada la lógica del Anova, la posibilidad de encontrar valores de F inferiores a la unidad es poco probable.

15. La posibilidad de analizar interacciones es:

A) Una de las razones por las que se recomienda el Anova frente a las comparaciones dos a dos de muestras
(dependientes o independientes).

B) Es problemática porque incrementa el error Tipo I.

C) Es difícil porque no se conoce la distribución muestral de las F´s en esta situación.

16. El tamaño del efecto:

A) Es mayor a medida que aumenta el tamaño de las muestras.

B) Es mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos experimental y control.

C) No depende del tamaño muestral.

Solución: A diferencia de lo que sucede con los estadísticos de contraste, la magnitud del tamaño del efecto no depende
del tamaño muestral. La opción A contradice esta afirmación. La opción B es errónea porque, según la fórmula de la d
de Cohen, la diferencia de las medias entre el grupo experimental y control está en el numerador. Por tanto, cuanto mayor
sea esta diferencia, mayor será d; cuanto menor sea esta diferencia, menor será d.

17. La distribución muestral de la proporción sigue el modelo de probabilidad:

A) Binomial. B) T de Student. C) Chi cuadrado.

18. El tamaño del efecto:

A) se puede clasificar en tres categorías según Cohen.

B) depende del tamaño muestral.

C) es una diferencia de medias no estandarizada.


Diseños de Investigación y Análisis de Datos. 2018/19 -

19. En el análisis de la regresión, el error típico es:

A) La diferencia entre la puntuación observada en un sujeto y la puntuación pronosticada.

B) La desviación típica de las puntuaciones pronosticadas.

C) La desviación típica de los errores de pronóstico.

Solución: por definición, el error típico es la desviación típica de los errores de pronóstico. La opción A es incorrecta porque define
el error de pronóstico para un sujeto, mientras que la opción B hace referencia a Sx de la variable dependiente pronosticada (T’) en
este caso.

20. Los coeficientes de correlación parcial y semiparcial son semejantes en que:

A) No son medidas de asociación.

B) No son correlaciones de orden cero.

C) No eliminan el influjo de otras variables independientes.

21. Uno de los supuestos básicos del análisis de regresión simple es:

A) Los pronósticos y los errores son independientes.

B) Las distribuciones condicionadas de los errores deben de tener una distribución uniforme.

C) No deben estar relacionadas las variables predictoras y la variable dependiente o criterio.

22. En los diseños intra-sujetos se considera que la varianza de error viene dada por:

A) El factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.

23. Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el tamaño de la muestra:

A) Aumenta el error máximo. B) Disminuye el error típico. C) Aumenta la cuasivarianza muestral.

24. El valor complementario de la probabilidad de cometer un error de tipo II se denomina:

A) Nivel de confianza. B) Potencia del contraste. C) Nivel crítico.

25. Cuál de los siguientes estimadores para la media poblacional de una distribución es suficiente:

A) La mediana. B) La media aritmética. C) La moda.

26. Se llama error típico de un estadístico a la desviación típica de:

A) El parámetro poblacional. B) La distribución muestral del estadístico. C) La distribución de la muestra.

27. Con dos variables independientes (𝑋1; 𝑋2) y una variable dependiente (𝑌), el coeficiente de correlación parcial entre
𝑋1 e 𝑌, representa:

A) La relación entre 𝑌 y 𝑋1 eliminando el influjo de 𝑋2 sobre la variable dependiente.

B) La relación entre 𝒀 y 𝑿𝟏 eliminando el influjo de 𝑿𝟐 sobre la variable dependiente y sobre 𝑿𝟏.

C) La relación entre 𝑌 y 𝑋2 eliminando el influjo de 𝑋1 sobre la variable dependiente y sobre 𝑋2.


Diseños de Investigación y Análisis de Datos. 2018/19 -

28. Para la regresión lineal simple se obtienen dos coeficientes, ordenada en el origen (𝐵0) y pendiente (𝐵).
Generalmente, estaremos más interesados en interpretar:

A) 𝐵0

B) 𝑩

C) Depende de la magnitud del coeficiente de correlación de Pearson.

29. Para que sean válidas las inferencias que sobre la variable dependiente se hagan con la recta de regresión, las
varianzas de las distribuciones de los errores, condicionadas a los diferentes valores de la variable independiente deben
de cumplir el supuesto de:

A) Heterocedasticidad. B) Homocedasticidad. C) Uniformidad.

30. En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t de Student para realizar
comparaciones múltiples dos a dos?:

A) Sí, porque es la mejor opción.

B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa.

C) No porque se incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.

31. El nivel crítico p, representa la probabilidad:

A) De rechazar la hipótesis nula cuando es cierta.

B) De rechazar la hipótesis alternativa si es cierta.

C) De obtener unos datos como los observados o más extremos siendo cierta la hipótesis nula.

32. Uno de los supuestos básicos del análisis de regresión simple es:

A) Los pronósticos y los errores son independientes.

B) Las distribuciones condicionadas de los errores deben de tener una distribución uniforme.

C) No deben estar relacionadas las variables predictoras y la variable dependiente o criterio.

33. En el caso de la regresión lineal simple, el signo del coeficiente de correlación y de la pendiente de la recta de
regresión:

A) Son opuestos B) Son independientes C) Son iguales.

34. Suponiendo que existieran dos estadísticos insesgados, consistentes y suficientes para estimar la misma
característica poblacional, la mejor elección es utilizar el estadístico:

A) Con la desviación típica más pequeña.

B) Con la desviación típica más grande.

C) Cualquiera de ellos, dado que ambos gozan de las mismas propiedades.


Diseños de Investigación y Análisis de Datos. 2018/19 -

35. El intervalo de confianza es más estrecho a medida que:

A) Aumenta el tamaño de la muestra B) Aumenta el nivel de confianza C) Aumenta el error típico del estadístico.

36. En el análisis de varianza, cada nivel del factor es:

A) Una categoría de las variables dependientes.

B) Cada una de las variables independiente.

C) Una categoría de las variables independientes.

37. A medida que aumenta el tamaño de la muestra, aumenta también:

A) La potencia del contraste; B) La amplitud del intervalo de confianza; C) El error tipo II.

38. El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula que es verdadera,
recibe el nombre de:

A) Potencia del contraste; B) Error tipo II; C) Nivel de significación.

39. El error típico de la media representa:

A) la máxima diferencia que cabe esperar por simple azar entre la media obtenida en la muestra y la media de la población
formulada en la 𝐻0;

B) la desviación típica de la distribución muestral de la media;

C) el error que se comete al estimar la media poblacional a partir de la media de la muestra.


1- Las curvas de potencia, permiten localizar la potencia de un contraste en función de: A) el
valor de 𝑯𝟏 y el tamaño de la muestra B) los valores de 𝐻0 y 𝐻1 C) el nivel de significación y
la potencia del contraste

2- El intervalo de confianza es más estrecho a medida que: A) aumenta el tamaño de la


muestra B) aumenta el nivel de confianza C) aumenta el error típico del estadístico

3- Suponiendo que existieran dos estadísticos insesgados, consistentes y suficientes para


estimar la misma característica poblacional, la mejor elección es utilizar el estadístico: A) con la
desviación típica más pequeña B) con la desviación típica más grande C) cualquiera de ellos,
dado que ambos gozan de las mismas propiedades.

4- El término “error típico” se refiere a: A) la desviación típica de la distribución muestral del


estadístico B) el error máximo que estamos dispuestos a admitir en un contraste de hipótesis
C) el estimador insesgado de la desviación típica poblacional

5- En un contraste de hipótesis se plantea la siguiente hipótesis nula: 𝐻0: 𝜇 = 10. Si queremos


calcular la potencia del contraste para una media poblacional igual a 12, la hipótesis alternativa
ha de ser: A) 𝐻1: 𝜇 > 12 B) 𝐻1: 𝜇 < 12 C) 𝑯𝟏: 𝝁 = 𝟏2

6- Al aumentar el tamaño de la muestra: A) disminuye la probabilidad de rechazar 𝐻0 cierta B)


disminuye la probabilidad de rechazar 𝐻1 cierta C) disminuyen el error de tipo I y tipo II, por
lo que las opciones A y B son correctas

7- El estadístico d de Cohen: A) Se aplica para contrastes no paramétricos de diferencia de


proporciones B) Analiza la relevancia de la diferencia de medias entre dos muestras
independientes C) Su valor depende del tamaño de las muestras

8- El valor complementario de la probabilidad de cometer un error de tipo II se denomina: A)


Nivel de confianza. B) Potencia del contraste. C) Nivel crítico

9- Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el
tamaño de la muestra: A) Aumenta el error máximo. B) Disminuye el error típico. C) Aumenta
la cuasivarianza muestral

10- En los diseños intra-sujetos se considera que la varianza de error viene dada por: A) El
factor manipulado. B) Los sujetos. C) La interacción entre el factor manipulado y los sujetos.

11- Se llama error típico de un estadístico a la desviación típica de : A) El parámetro


poblacional. B) La distribución muestral del estadístico. C) La distribución de la muestra

12- Cuál de los siguientes estimadores para la media poblacional de una distribución es
suficiente: A) La mediana. B) La media aritmética. C) La moda.

13- En un contraste de hipótesis sobre dos medias en el que el tamaño del efecto es
moderado: A) El estadístico de contraste puede ser significativo o no, dependiendo del
tamaño de la muestra. B) El estadístico de contraste siempre será significativo para 𝛼 = 0,05 C)
El estadístico de contraste siempre será significativo para 𝛼 = 0,01

14- A la probabilidad de rechazar una hipótesis nula falsa se le denomina: A) Nivel de


confianza. B) Potencia del contraste. C) Beta
15- En un ANOVA de dos factores, cuando la interacción no es significativa: A) Es preciso
rehacer el análisis focalizándolo sólo sobre los efectos principales. B) Disminuye la suma de
cuadrados de error. C) Las opciones A y B son ciertas.

16- El nivel crítico p, representa la probabilidad: A) De rechazar la hipótesis nula cuando es


cierta. B) De rechazar la hipótesis alternativa si es cierta. C) De obtener unos datos como los
observados o más extremos siendo cierta la hipótesis nula.

17- La probabilidad de rechazar una hipótesis nula que es verdadera, recibe el nombre de: A)
Potencia del contraste. B) Error tipo II. C) Nivel de significación.

18- En un contraste de hipótesis bilateral sobre una media poblacional, ¿puede utilizarse el
intervalo de confianza para contrastar dicha hipótesis? A) Sí, y se rechaza 𝑯𝟎 cuando el valor
formulado en la 𝑯𝟎 se encuentra fuera del intervalo de confianza. B) Sí, y se rechaza 𝐻0
cuando el estadístico de contraste se encuentra fuera del intervalo de confianza. C) El intervalo
de confianza no aporta información para rechazar o no 𝐻0

19- En un ANOVA de medidas repetidas de un factor, la variabilidad total observada en la


variable dependiente se descompone en tres componentes, los dos primeros corresponden a
la variabilidad del factor que estamos manipulando y la variabilidad de los sujetos. El tercer
componente hace referencia a: A) La variabilidad de la interacción entre el factor y los
sujetos. B) Las desviaciones de las puntuaciones de los sujetos respecto a la combinación de
tratamientos. C) Ninguna de las opciones anteriores es correcta

20- En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t
de Student para realizar comparaciones múltiples dos a dos?: A) Sí, porque es la mejor opción.
B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa. C) No porque se
incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.

21- La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es: A)
Insesgada. B) Un parámetro. C) Una variable aleatoria.

22- La potencia del contraste se puede expresar simbólicamente como: A) 𝑃(𝐻0 = aceptar | 𝐻0
= falsa) B) 𝑃(𝐻0 = rechazar | 𝐻0 = cierta) C) 𝑷(𝑯𝟎 = rechazar | 𝑯𝟎 =falsa)

23- En un modelo de ANOVA de efectos aleatorios: A) El investigador establece como niveles


del factor sólo aquellos en los que está interesado en estudiar. B) Se considera que los “i”
niveles del factor son una muestra aleatoria de todos los posibles niveles. C) Todos los
modelos de ANOVA son de efectos aleatorios.

24- El tamaño del efecto: A) Es mayor a medida que aumenta el tamaño de las muestras. B) Es
mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos
experimental y control. C) No depende del tamaño muestral.

25- La distribución muestral de la proporción sigue el modelo de probabilidad: A) Binomial. B)


T de Student. C) Chi cuadrado

26- La posibilidad de analizar interacciones es: A) Una de las razones por las que se
recomienda el Anova frente a las comparaciones dos a dos de muestras (dependientes o
independientes). B) Es problemática porque incrementa el error Tipo I. C) Es difícil porque no
se conoce la distribución muestral de las F´s en esta situación.
27- En los Anovas el contraste es unilateral derecho porque: A) La distribución F no tiene
valores inferiores a 0. B) Establecemos hipótesis sobre las varianzas poblacionales y estas son
siempre positivas. C) Dada la lógica del Anova, la posibilidad de encontrar valores de F
inferiores a la unidad es poco probable.

28- El tamaño del efecto: A) se puede clasificar en tres categorías según Cohen. B) depende
del tamaño muestral. C) es una diferencia de medias no estandarizad

29- El investigador informó que, en su estudio, 1 − 𝛽 = 0,6. Esto significa que: A) la probabilidad
de no rechazar H0 siendo falsa vale 0,6. B) la probabilidad de rechazar H0 siendo falsa vale
0,6. C) la probabilidad de no rechazar H0 siendo verdadera vale 0,4

30- Al aumentar el tamaño de la muestra, el intervalo de confianza: A) permanece inalterado;


B) es más ancho; C) es más estrecho.

31- Si optase por utilizar muestras más grandes y suponiendo que se mantienen los mismos
estadísticos obtenidos en estas muestras, ¿cuál de las siguientes consecuencias se
producirían?: A) aumentaría el tamaño del efecto; B) aumentaría la probabilidad de rechazar
la hipótesis nula C) disminuiría la potencia del contraste.

32- El error típico de la media representa: A) la máxima diferencia que cabe esperar por simple
azar entre la media obtenida en la muestra y la media de la población formulada en la 𝐻0; B) la
desviación típica de la distribución muestral de la media C) el error que se comete al estimar
la media poblacional a partir de la media de la muestra

33- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis
nula que es verdadera, recibe el nombre de: A) Potencia del contraste; B) Error tipo II; C) Nivel
de significación

34- A medida que aumenta el tamaño de la muestra, aumenta también: A) La potencia del
contraste B) La amplitud del intervalo de confianza; C) El error tipo II

33- Cuál de las siguientes distribuciones de probabilidad NO es simétrica en torno a cero: A) la


normal tipificada; B) Chi cuadrado C) T de Student.

34- El error típico de la media es: A) el error que sumamos y restamos a la media aritmética
para calcular el intervalo de confianza; B) la desviación típica de la distribución muestral de la
media C) el error que cometemos si rechazamos una hipótesis nula verdadera.

33- Cuál de los siguientes estimadores sobre la tendencia central de una distribución es
suficiente: A) la mediana; B) la media aritmética C) la moda

34- El valor crítico para tomar una decisión respecto a la hipótesis nula depende: A) del nivel
de confianza que se establezca B) de los grados de libertad de la distribución muestral de la
diferencia de proporciones; C) de si se conoce o no la varianza poblacional de las diferencias.

35- En un contraste de hipótesis sobre la media aritmética, el valor absoluto del valor crítico:
A) es el mismo en un contraste unilateral izquierdo y un contraste unilateral derecho B) es el
mismo en un contraste bilateral y unilateral derecho; C) es el mismo en un contraste bilateral y
unilateral izquierdo.

36- La potencia de un contraste de hipótesis será mayor: A) a medida que aumenta el tamaño
de la muestra B) a medida que disminuye el tamaño de la muestra; C) siempre es la misma
suponiendo que H1 es verdadera.
37- Las curvas de potencia permiten localizar la potencia de un contraste en función de: A) el
tamaño de la población y de la muestra; B) el valor de H1 y el tamaño de la muestra C) el
tamaño de la población y el valor de H1

38- En un contraste de hipótesis sobre una media, si es cierta la hipótesis alternativa pero no
se detecta en el contraste estadístico, se comete un error: A) de tipo II B) de tipo I; C) igual al
nivel crítico.

39- La potencia del contraste es igual a: A) probabilidad de aceptar la hipótesis nula siendo
cierta; B) probabilidad de rechazar la hipótesis nula siendo falsa C) probabilidad de rechazar
la hipótesis alternativa siendo verdadera.

40- Las pruebas no paramétricas se utilizan en diseños en los que se trabaja con: A) Muestras
no representativas de la población objetivo del estudio; B) Muestras pequeñas o variables que
no alcanzan el nivel de medida de intervalo o razón C) Variables medidas con escala de
intervalo que provienen de poblaciones con distribución poblacional desconocida.

41- Si a medida que aumenta el tamaño de la muestra tanto la varianza de la distribución de


probabilidad de un estimador como su sesgo tiende a cero, decimos que el estimador es: A)
suficiente; B) consistente C) sesgado

42- A la probabilidad de rechazar H0 cuando es falsa se la denomina: A) error tipo I; B) nivel de


confianza; C) potencia del contraste.

43- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en
muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas C) ninguna de las anteriores es correcta.

44- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1 C) El nivel de confianza más nivel significación es igual a 1.

45- El nivel de significación representa: A) el máximo error que el investigador está dispuesto
a admitir para rechazar una hipótesis nula que es verdadera B) el máximo error que el
investigador está dispuesto a admitir para rechazar una hipótesis nula que es falsa; C) la
probabilidad de rechazar una hipótesis nula que es falsa.

46- En un contraste de hipótesis, el valor crítico representa: A) la probabilidad de rechazar la


hipótesis nula siendo verdadera; B) la máxima diferencia que cabe esperar entre el valor
teórico formulado en la hipótesis nula y el valor que encontramos en nuestros datos para
esa hipótesis C) la probabilidad de que siendo cierta la hipótesis nula encontremos unos
resultados como los observados en la muestra o más extremos.

47- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume
como provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los
datos obtenidos en la muestra.

48- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria ordinaria.
49- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede
adoptar valores negativos porque: A) los valores de la ordenada (eje vertical) son todos
positivos; B) toda distribución de densidad de probabilidad se estandariza para que tenga un
área igual a la unidad; C) es el cociente entre dos varianzas y estas son siempre positivas

50- El contrabalanceo de las condiciones experimentales es necesario realizarlo: A) en diseños


intra-sujetos B) cuando no existen efectos de práctica o fatiga; C) para aleatorizar los efectos
de las condiciones manipuladas

51- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el
tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.

52- A medida que aumenta el tamaño de la muestra, la distribución muestral de la proporción


se aproxima a una distribución: A) Normal; B) Binomial; C) con grados de libertad.

53- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A)
cuya distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.

54- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

55- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un
nivel de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación;
B) aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.

56- El nivel de confianza se refiere a: A) La probabilidad de que el parámetro se encuentre


dentro de un intervalo de confianza; B) El valor inverso del error típico; C) La probabilidad de
que el estadístico se encuentre dentro de la distribución muestral del parámetro

57- A la probabilidad de rechazar la hipótesis nula cuando es falsa se le denomina: A) nivel de


confianza; B) potencia del contraste; C) nivel p-crítico.

58- Para comprobar si la diferencia entre dos medias es significativa, calculamos: A) el


estadístico de contraste; B) el tamaño del efecto; C) las dos opciones anteriores son
verdaderas

59- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a
comparar deben de cumplir el supuesto de: A) complementariedad y exhaustividad; B)
homocedasticidad; C) independencia.
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

TEMA 1: INTRODUCCIÓN AL ANÁLISIS INFERENCIAL Y AL CONTRASTE DE HIPÓTESIS EN LOS


DISEÑOS DE INVESTIGACIÓN.

1. Si un estimador, no coincide, en promedio, con el parámetro que intenta estimar y además su


distribución tiene poca variabilidad:
a) Decimos que es un estimador eficiente
b) Decimos que es un estimador suficiente
c) Decimos que es un estimador insesgado.

2. La varianza muestral es:


a) Un estimador consistente de la varianza poblacional.
b) Un estimador sesgado de la varianza poblacional.
c) Ambas respuestas son correctas.

3. La eficiencia relativa:
a) Es un valor entre O y 1.
b) Es un cociente entre dos varianzas
c) Ambas respuestas son correctas.

4. La varianza insesgada es:


a) Un estimador insesgado de la varianza muestral.
b) La varianza muestral multiplicada por n y dividida por n-1.
c) La varianza muestral multiplicada por n-1 y dividida por n

5. La desviación típica de la distribución muestral de un estadístico es:


a) Una medida de variabilidad.
b) El error típico de ese estadístico.
c) Ambas alternativas son correctas.

6. Si la varianza muestral (sesgada) vale 100, el estimador insesgado de la varianza poblacional:


a) Es mayor que 100
b) Es menor que 100
c) Es igual a 100.

7. Si la esperanza de un estimador no es igual al parámetro:


a) El sesgo no es nulo
b) El sesgo es nulo
c) El estimador es insesgado.

8. La eficiencia de un estimador es una medida de variabilidad:


a) De ese estimador.
b) Del parámetro.
c) Que puede ser negativa.

9. La distribución de frecuencias de una característica en la población viene definida por su media


y su:
a) Forma
b) Error muestral
c) Varianza.

1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

10. Un estimador es insesgado:


a) Si la media de la distribución muestral del estimador es igual al parámetro.
b) Si la esperanza del estimador es igual al parámetro.
c) Ambas respuestas son correctas.

11. ¿Cuál de estos estimadores es suficiente para m?


a) 1/(n-2) (Y1+.....+Yn)
b) 1/n (Y1+.......+Yn)
c) 1/(n-1) (Y1+......+Yn)

12. El error típico de la varianza es:


a) La desviación típica de la distribución muestral de la varianza.
b) La varianza de la distribución muestral de la desviación típica.
c) La varianza de la distribución muestral de la varianza.

13. E(P) = p por lo que la proporción de la muestra P:


a) Es un estimador insesgado de la proporción poblacional
b) Es un estimador sesgado de la proporción poblacional
c) No es un buen estimador de la proporción poblacional

14. Cuando la distribución muestral de un estimador Ô1 es menos variable que la de otro


estimador Ô2, diremos que:
a) Ô1 es más consistente que Ô2
b) Ô1 es más eficiente que Ô2
c) Ô1 es menos eficiente que Ô2

15. Un estimador es suficiente:


a) Si utiliza toda la información de la muestra para estimar el parámetro.
b) Si a medida que se dispone de más información, aumenta la probabilidad de que la
estimación coincida con el parámetro.
c) Cuando no sobre ni subestima al parámetro correspondiente.

16. El sesgo del estimador es:


a) El error típico de la media
b) El error máximo del intervalo de confianza
c) La diferencia entre la media de la distribución muestral del estimador y el parámetro.
17. El error típico de la media es:
a) La raíz cuadrada de la varianza de la distribución muestral de la media
b) La raíz cuadrada de la varianza de la población
c) Puede ser negativo.

18. Si la eficiencia relativa de un estimador, Ô1 respecto a otro estimador, Ô2 es del 85%, para un
mismo tamaño muestral:
a) El cociente entre sus respectivas varianzas poblacionales es 0,85
b) El cociente entre sus medias es 0,85
c) El cociente entre las varianzas de las distribuciones muestrales de los respectivos
estimadores es 0,85
19. En la estimación puntual:
a) Se establece un rango de valores dentro del cual estaría el valor del parámetro
b) Se toma un valor muestral concreto como estimación del parámetro
c) Se establece un intervalo confidencial.
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

20. Un estimador es más eficiente:


a) Cuanto mayor sea la varianza de la distribución muestral del estimador.
b) Cuanto menos varíe el valor del estimador de una muestra a otra
c) Ambas alternativas son incorrectas
21. ¿Cuál es la varianza de la distribución muestral del estimador 1 si sabemos que la eficiencia
relativa de él y otro estimador 2 es de 0,89 y la varianza de 2 35?:
a) 30
b) 21,5
c) 31,5

22. El intervalo de confianza:


a) Es más pequeño cuanto menor es el nivel de confianza, para los mismos datos.
b) Es más pequeño cuanto mayor es el nivel de confianza, para los mismos datos.
c) No tiene nada que ver con el nivel de confianza.

23. Cuando se rechaza Ho mediante el nivel crítico p:


a) Necesariamente se rechazará con el valor crítico.
b) No se rechazará necesariamente con el valor crítico.
c) Implica que p>a

24. El estadístico de contraste Z para una media vale -2,15, siendo alfa igual a 0,05, n= 145 y el
contraste bilateral.
a) Los valores críticos son -1,64 y 1,64
b) Se rechaza Ho
c) Se acepta Ho

25. El rechazo de H1 implica necesariamente que:


a) p < a
b) p < a
c) El valor muestral del estadístico de contraste cae en la zona de aceptación de Ho

26. A la zona de rechazo de la hipótesis nula se suele llamar:


a) Región m
b) Región crítica
c) Región b

27. Cuando ponemos a prueba una hipótesis, el método que se utiliza para tomar una decisión
entre la hipótesis nula (Ho) y la hipótesis alternativa (H1) es:
a) La prueba de significación.
b) El intervalo de confianza para una media
c) El contraste de hipótesis.
28. El nivel crítico p:
a) Es siempre un valor muy pequeño
b) Para su cálculo se tiene en cuenta la dirección del contraste (unilateral/bilateral)
c) Se fija en la planificación del estudio.

29. Elija la alternativa correcta:


a) La potencia puede valer más que 1
b) El nivel crítico p es un valor entre 0 y 1

3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

c) El nivel de significación puede ser negativo


30. Los intervalos de confianza:
a) Formalmente son un método de estimación de parámetros
b) No pueden utilizarse para contrastar hipótesis.
c) Se calculan de la misma manera que la región de aceptación de un contraste de
hipótesis.

31. En los contrastes de hipótesis.


a) Si el valor obtenido al aplicar el estadístico de contraste cae dentro de la región de
rechazo es posible aceptar la Ho
b) La región crítica es la región de rechazo de H1
c) Si el valor obtenido al aplicar el estadístico de contraste cae dentro de la región de
aceptación, podemos rechazar la hipótesis alternativa.

32. La hipótesis nula:


a) Es una hipótesis estadística
b) Puede ser igual a la hipótesis alternativa
c) Ambas alternativas son incorrectas.

33. La desviación típica de la distribución muestral de un estadístico se llama:


a) Error típico
b) Valor crítico
c) Nivel crítico.

34. Sobre el nivel de significación alfa de un contraste estadístico:


a) Se fija antes de analizar los datos
b) Si es menor que el nivel crítico p, el resultado del contraste es estadísticamente
significativo.
c) No es una probabilidad.

35. El nivel crítico p y el nivel de significación alfa:


a) Son probabilidades
b) Su comparación permite decidir si se rechaza o no la hipótesis nula
c) Ambas alternativas son correctas.

36. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la muestra:
a) Mayor es la precisión del intervalo
b) Menor es la precisión de nuestra estimación
c) Mayor es la amplitud del intervalo.

37. Cuando construimos un intervalo de confianza para la media, manteniendo constantes los
demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n.c.) del 95% en lugar del
99%.
a) Ganamos en precisión porque el intervalo es más preciso
b) Aumenta la probabilidad de cometer error tipo I.
c) Perdemos en precisión porque el intervalo es más grande.

38. Una estimación por intervalos:


a) Toma un valor muestral concreto como estimación del parámetro.
b) Depende de cuatro parámetros: una estimación puntual del parámetro, una medida de
variabilidad, una probabilidad y un supuesto distribucional de la muestra.
c) Establece un rango de valores dentro del cual se estima esté el valor del parámetro.
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

39. Beta de un contraste estadístico:


a) Es igual a la potencia.
b) Es una probabilidad.
c) Es deseable que sea un valor alto.

40. La hipótesis nula: “la varianza del grupo 1 es mayor o igual que la varianza del grupo 2”,
se refiere a un contraste:
a) Bilateral.
b) Unilateral derecho
c) Unilateral izquierdo.

41. Con n = 50, la probabilidad del error tipo II es igual a 0,30. Con un n = 40 y manteniendo
constantes los demás factores:
a) 1-beta será 0,70
b) Beta será superior a 0,30
c) Beta será inferior a 0,30

42. El valor crítico :


a) Cambia según el valor muestral del estadístico.
b) Es función de alfa
c) Se obtiene a partir del nivel crítico p.

43. El nivel crítico p:


a) Representa la probabilidad de obtener un resultado significativo
b) Su valor depende del valor muestral del estadístico
c) Su valor es función directa de la potencia del contraste.

44. La probabilidad de error tipo II representa:


a) La probabilidad de rechazar la hipótesis nula siendo verdadera
b) La probabilidad de aceptar la hipótesis nula siendo verdadera
c) La probabilidad de aceptar la hipótesis nula siendo falsa.

45. Cuanto mayor es la probabilidad del error tipo II, manteniendo constantes los demás factores:
a) Menor es el nivel de significación
b) Mayor es la potencia estadística
c) Mayor es la probabilidad de error tipo I

46. La probabilidad de error tipo I representa:


a) La probabilidad de rechazar la hipótesis nula siendo verdadera
b) La probabilidad de aceptar la hipótesis nula siendo verdadera
c) La probabilidad de aceptar la hipótesis nula siendo falsa.

47. El contraste de hipótesis tiene como finalidad:


a) Obtener información sobre algún aspecto de la población de la que se extrajo la
muestra
b) Comprobar si la muestra es lo suficientemente adecuada para investigar.
c) Decidir si en la población se representa adecuadamente la variable de interés.

48. Que dos hipótesis sean mutuamente excluyentes significa que:


a) Son contradictorias
b) El rechazo de una de ellas supone el rechazo de la otra
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

c) El rechazo de una de ellas implica necesariamente la aceptación de la otra


49. La idea general del contraste de hipótesis es hallar:
a) La probabilidad asociada al valor muestral del estadístico.
b) La probabilidad asociada al parámetro
c) El valor del parámetro.

50. Una hipótesis alternativa del tipo µ<µ0 plantea un contraste:


a) Unilateral izquierdo
b) Bilateral
c) Unilateral derecho

51. El nivel de significación (α):


a) Equivale a la probabilidad del error tipo II
b) Se fija de forma arbitraria en la planificación de la investigación
c) Es consecuencia del resultado muestral

52. Sobre el nivel crítico p:


a) Para su cálculo se necesita conocer el valor que toma el nivel de significación alfa
b) Puede ser menor que uno
c) Puede ser mayor que uno

53. Cuando construimos un intervalo de confianza para la media, manteniendo constantes los
demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n. c.) del 99% en lugar del
95%?:
a) Con un n.c. del 99% la probabilidad de α será menor y menor la probabilidad de
cometer error tipo I.
b) Con un n.c. del 99% aumentaría la probabilidad asociada a dicho intervalo
c) Con un n.c. del 99% perderíamos en precisión

54. Si obtenemos un nivel crítico p mayor que el alfa adoptado quiere decir que:
a) Los resultados son improbables bajo el supuesto de que H0 sea cierta
b) Los resultados son estadísticamente significativos
c) Los resultados no son estadísticamente significativos.
55. Sobre alfa y el nivel crítico p:
a) Ambos tienen valores constantes
b) Si sus valores son iguales se rechaza la hipótesis nula
c) Ambos se fijan antes de obtener los datos de la muestra.
56. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la muestra:
a) Mayor es la precisión del intervalo
b) Menor es la precisión de nuestra estimación
c) Ambas respuestas son incorrectas.
57. La distribución muestral de la media es normal:
a) Cuando es normal la distribución de la variable estudiada o cuando tiende a la
normalidad a medida que aumenta el tamaño de la muestra
b) Sólo cuando es normal la distribución de la variable estudiada.
c) Sólo cuando el tamaño de la muestra es el adecuado.

58. El error típico de la distribución muestral del estadístico varianza es:


a) La desviación típica de la distribución muestral de la varianza
b) La varianza de la distribución muestral de la desviación típica.

6
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

c) La varianza de la distribución muestral de la varianza.


59. Sabemos que la variable rendimiento académico se distribuye normalmente en la población
de estudiantes de Bachillerato en España, pero no conocemos el valor de la varianza de tal
variable. Un investigador quiere saber entre qué límites se encuentra la media del
rendimiento académico en la población. Toma una muestra aleatoria e independiente de 400
estudiantes y obtiene una media de 20 siendo la varianza insesgada de 4. ¿Cuál de las
siguientes alternativas expresa el valor aproximado, del límite inferior del intervalo de
confianza para α = 0,05?
a) 19,8
b) 18,2
c) 16,08

60. Hemos extraído una muestra aleatoria de 49 sujetos y le hemos medido el pulso en reposo,
obteniendo una media igual a 60 pulsaciones por minuto. Sabemos que las pulsaciones forman
una escala de intervalo y se distribuyen normalmente con varianza poblacional igual a 16.
Tomamos un n.c. del 99%. ¿cuál será el error máximo (Emáx) aproximado en el cálculo del
intervalo de confianza para µ?
a) 1,33
b) 1,47
c) 1,12

61. Se considera que hemos obtenido un resultado estadísticamente significativo cuando:


a) Cuando se acepta H1
b) Sólo cuando se acepta H0
c) Cuando la probabilidad asociada al estadístico de contraste (p) es mayor que el nivel de
significación (α)
62. En el contraste de hipótesis para la varianza tratamos de:
a) Probar si nuestros datos concretos han podido ser obtenidos de una población con esa
varianza.
b) Saber el valor de la varianza para nuestros datos concretos
c) Hallar el valor exacto de la varianza poblacional.
63. En el contraste de hipótesis, la elección de:
a) µ0, µ1, α, β, σ2 y n son arbitrarias.
b) µ0, µ1, α, β es arbitraria mientras que la σ2 y n no lo son.
c) µ0, µ1, α, β, σ2 y n no son arbitrarias.
64. La distribución muestral de un estadístico permite inferir:
a) Un parámetro
b) Un estadístico
c) Ambos

65. Cuando calculamos el intervalo de confianza para la proporción, en el caso de una muestra,
nuestro objetivo es determinar:
a) Los valores que limitan el valor del parámetro proporción que cumplen la característica
en estudio, a un nivel de confianza determinado.
b) Si la variable, antes de ser dicotomizada, se distribuía según la distribución normal.
7
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

c) El valor exacto del parámetro, con un nivel de significación determinado.


66. Hemos extraído una muestra aleatoria de 36 sujetos y les hemos medido el tiempo de reacción
a un estímulo visual, obteniendo una media igual a 50 milisegundos. La varianza poblacional
de la distribución de los tiempos de reacción es igual a 9. Sabiendo esto, cuál será el intervalo
de confianza del 95% en torno a la media poblacional:
a) 49,02 < μ < 50,98
b) 32,03 < μ < 40,54
c) 60,02 < μ < 70,33

67. Hemos aplicado un cuestionario de ansiedad a una muestra de 16 deportistas antes de una
competición y obtuvimos una puntuación media en ansiedad iguala 5. Las puntuaciones en el
cuestionario de ansiedad forman una escala de intervalo y se distribuyen normalmente con
varianza igual a 4. ¿Entre qué valores esperamos se encuentre la media poblacional de la
ansiedad precompetitiva, a un nivel de confianza del 95%?.:
a) 3,71 < μ < 6,29
b) 4,02 < μ < 5,98
c) 6,51 < μ < 7,63

68. Atendiendo a los datos del problema anterior, entre qué valores esperamos se encuentre la
media poblacional de la ansiedad precompetitiva, a un nivel de confianza del 99%:
a) 3,71 < μ < 6,29
b) 4,02 < μ < 5,98
c) 6,51 < μ < 7,63

69. Hemos estimado en una muestra de 16 españoles, la media del grado de acuerdo sobre la
legalización del aborto obteniendo Ȳ = 8. El grado de acuerdo sobre la legalización del aborto
es una variable medida a nivel de intervalo que se distribuye normalmente en la población
con σ2 = 36. Asumiendo un nivel de confianza del 95%, qué tamaño debe tener la muestra
para que la media no se aleje más de ± 1 punto de la media poblacional:
a) 139
b) 147
c) 154

70. Con los datos del problema anterior, sin tener en cuenta que conocemos la varianza
poblacional, sino que conocemos desviación típica y la media del grado de acuerdo sobre la
legalización del aborto, Ȳ = 8 y S = 5. Queremos saber, a un nivel de confianza del 99% qué
tamaño debe tener la muestra para que la media estimada no se aleje más de ± 3 puntos de la
media poblacional:
a) 23
b) 26
c) 20
8
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

71. En una investigación sobre ansiedad, contrastamos la hipótesis nula de que la media
poblacional e igual o mayor que 10. i sabemos que el valor muestral del estad stico de
contraste z = 2,88 y el nivel crítico, p= 0,002, ¿qué significa esta p?:
a) Que la probabilidad de obtener un estadístico de contraste igual o menor que el hallado
es 0,002.
b) Que la probabilidad de aceptar H0 siendo falsa es 0,002
c) Es el error tipo II.

72. Teniendo en cuenta los datos del problema anterior y adoptando un α= 0,01:
a) Se rechaza H0, puesto que p < α
b) Se acepta H0 , puesto que p < α
c) Ninguna de las dos opciones es válida.

9
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

TEMA 2: CONTRASTE DE HIPÓTESIS EN LOS CONTRASTES DE UNA MUESTRA.

1. La potencia:
a) Es igual a β
b) Es deseable que no sea inferior a 0,80
c) Es deseable que sea muy baja

2. Con n = 40, la potencia es igual a 0,70. Con un n = 60 y manteniendo constantes los demás
factores:
a) La probabilidad del error tipo II será 0,30
b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor que 0,70
c) La potencia será inferior a 0,70

3. El estadístico de contraste Z para una media vale 3, siendo alfa igual a 0,05, n = 120, y el
contraste bilateral:
a) Los valores críticos son -2,33 y 2,33
b) Se acepta H0
c) Se rechaza H0

4. En los contrastes de hipótesis referidos a una muestra, cuando el interés del investigador se
centra en el parámetro media, lo que se prueba es:
a) Si nuestros datos concretos han sido obtenidos de una población con esa media
b) Si la media obtenida para la muestra presenta un valor determinado
c) Si la media obtenida para la muestra es un estimador correcto dado el tamaño de la
muestra utilizada.

5. Con n = 30, la potencia es igual a 0,60. Con un n = 40 y manteniendo constantes los demás
factores:
a) La probabilidad del error tipo II será mayor que 0,60
b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor que 0,60
c) La potencia será inferior a 0,60

6. En la potencia del contraste de hipótesis, la relación de α y n:


a) Es inversa con β
b) Es directa con la media poblacional
c) Es directa con β

7. Para realizar el contraste de hipótesis sobre la proporción, utilizamos el estadístico P que se


calcula con:
a) Datos dicotómicos.
b) Variables continuas.
c) Variables a un nivel de medida de razón.

8. En el contraste de hipótesis para la varianza, la variable aleatoria cuyo parámetro σ20


pretendemos contrastar, sigue un función de densidad de probabilidad:
a) T
b) Binomial
c) Normal.

1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

9. Un contraste de varianza permite comprobar si los datos de la muestra proceden de una


población con varianza igual a la estipulada en H0:
a) No
b) Sí
c) Sólo si g.l. > 100

10. Un contraste de una media permite comprobar si los datos de la muestra proceden de una
población con media igual a la estipulada en la hipótesis nula:
a) Sí
b) No
c) Sólo si n es pequeño

11. Cuál de las siguientes afirmaciones es correcta:


a) En el caso de un contraste de hipótesis para la varianza (una sola muestra), no tiene
sentido considerar la situación de la varianza conocida.
b) En el caso de una sola muestra y si se conoce la varianza de la población el estadístico
de contraste para la varianza es Z.
c) En el caso de una sola muestra y tanto si se conoce la varianza de la población como si
se desconoce este dato, el estadístico de contraste para la varianza es X2

12. Las condiciones para poder aplicar el estadístico de contraste Z en el caso de la proporción
(una sola muestra) incluyen:
a) Muestra aleatoria de n observaciones y población dicotómica.
b) Variable dependiente medida a nivel ordinal, al menos y se trata de muestras
independientes
c) Variable dependiente dicotómica (o dicotomizada) y se trata de muestras
independientes.

13. Tenemos una población normal con varianza conocida. Se toma de ella una muestra de
tamaño n = 15. Para estimar el valor del parámetro media poblacional µ, utilizaremos un
estadístico de contraste cuya distribución es:
a) Normal (N(0,1))
b) T de Student
c) F de Snedecor
14. La distribución muestral de un estadístico de contraste es la distribución T de Student con n –
1 g. L. Y el contraste es unilateral derecho. Para un valor muestral igual a 1,33 y 17 grados de
libertad, el nivel crítico p es:
a) 0,10
b) 0,90
c) Ambas respuestas son incorrectas.

15. La prueba de Wilcoxon para una muestra:


a) Sólo tiene en cuenta si nuestros valores están por encima o por debajo del valor de la
mediana que queremos contrastar en la Ho
b) También conocida como prueba de rangos y signos.
c) Establece supuestos menos exigentes que el test de signos.
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

16. La prueba de Wilcoxon frente a la de signos:


a) Gana en precisión ya que aprovecha mejor la información disponible.
b) Establece algunos supuestos menos exigentes.
c) No tiene en cuenta en su aplicación si las diferencias entre cada valor y la mediana
propuesta bajo Ho son más grandes o más pequeñas.

17. Aplicamos el estadístico de contraste W de Wilcoxon (para una muestra) y obtenemos t+ =


101 y t- =19, siendo α = 0,05, n= 15 y el contraste bilateral:
a) Los valores críticos son - 1,96 y 1,96
b) Se rechaza H0
c) Se acepta H0

18. Cuando en el cálculo del estadístico de contraste de Mann-Whitney-Wilcoxon se observan


empates:
a) En la ordenación conjunta de las puntuaciones, a los valores empatados se les asigna la
media de sus órdenes.
b) No puede aplicarse este estadístico de contraste.
c) En la ordenación conjunta de las puntuaciones, a los valores empatados se les asigna
los límites inferior y superior del intervalo de confianza.

19. Las condiciones para poder aplicar el estadístico de contraste S (signos) en el caso de una sola
muestra:
a) Muestra aleatoria de n observaciones y distribución normal.
b) Muestra aleatoria de n observaciones y distribución binomial.
c) Muestra aleatoria de n observaciones y cualquier tipo de distribución.

20. El estadístico S se aproxima a una distribución normal:


a) Cuando tenemos un n mayor o igual que 20
b) Cuando tenemos un n mayor o igual que 10
c) Siempre.

21. El estadístico S normalmente sigue una distribución:


a) Normal
b) Poisson
c) Binomial.

22. Para probar hipótesis relativas a la mediana, cuando se cumple la aleatoriedad de las
observaciones, la distribución de la variable es simétrica en la población y el nivel de medida
de intervalos, aplicaremos la prueba de:
a) Wilcoxon antes que la de signos porque aporta más información.
b) Signos antes que la de Wilcoxon ya que aporta la misma información y la segunda es
más restrictiva.
c) Wilcoxon o la de signos indistintamente ya que arroja resultados iguales.

23. Para contrastar hipótesis sobre la mediana, si queremos utilizar la prueba de Wilcoxon, es
necesario que el nivel de medida de los datos sea, al menos:
a) Nominal
b) Ordinal
c) De intervalo

3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

24. La depresión es una variable medida a nivel de intervalo que se distribuye normalmente en la
población con varianza conocida. Para una muestra n = 16, ¿qué valor toma la probabilidad del
error tipo II si al contrastar H0: μ = 5 frente a H1: μ = 7, vale 0,70 la probabilidad de
rechazar la hipótesis nula siendo falsa?:
a) 0,30
b) 0,40
c) 0,70

25. Sabemos por trabajos anteriores que un antidepresivo tiene una tolerancia media, sobre los
pacientes que lo toman, de 1,5 según algún índice de tolerancia (cuanto mayor es el índice
mayor es la tolerancia) y una varianza igual a 1. Pensamos que modificando la fórmula
química del antidepresivo podríamos incrementar la tolerancia a este medicamento sin que se
modifique su propiedad antidepresiva. El grado de tolerancia al antidepresivo es una variable
medida a nivel de razón que se distribuye normalmente en la población. Para un n = 25, ¿cuál
es la probabilidad de obtener un resultado significativo, si hipotetizamos una diferencia de +
0,5 entre la media bajo la hipótesis alternativa y aquélla bajo la hipótesis nula (μ1 – μ0 =
0,5) teniendo en cuenta un α = 0,01?:
a) 0,63
b) 0,48
c) 0,56

26. En algunas investigaciones sobre conformismo social, los madrileños fueron calificados de
conformistas. Un investigador basándose en sus propios estudios, opina que los madrileños no
son conformistas, hipotetizando un puntuación inferior a 5 en una escala de conformismo
social que va de 0 a 10, lo cual indicaría inconformismo. Sabiendo que las puntuaciones en
conformismo social forman una escala de intervalo y se distribuyen normalmente en la
población con varianza igual a 1, ¿cuál será la potencia del contraste para H1 : μ = 4,
manteniendo constantes los demás factores?: α = 0,05 y n = 25
a) 0,8763
b) 0,9213
c) 0,9996

27. En una distribución muestral normal (del estadístico media), con una media de 30 y una
desviación típica de 16, ¿qué probabilidad hay de obtener al azar una media comprendida
entre 14 y 26?:
a) 0,7836
b) 0,6826
c) 0,5763

28. En una muestra aleatoria de 101 sujetos, procedentes de una población normal e infinita, se ha
obtenido una media igual a 40 y una desviación típica igual a 15. ¿Qué porcentaje de medias
hay comprendido entre los valores t picos = 2,4 y = 1,5 de la distribución muestral de
la media?:
a) 92,5%
b) 95,3%
c) 91,4%
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

29. Se ha realizado la distribución muestral de la media con 225 muestras, de 90 sujetos cada una,
y se ha comprobado que es normal. En la población, el valor de la media es de 45 (μ = 45) y el
de la desviación típica de 15 (σ = 15). Cuál será el valor típico (puntuación típica) que, llevado a
ambos lados de la media, comprende el 90% de los casos de esa distribución muestral?:
a) ± 1,54
b) ± 1,65
c) ± 1,78

30. Teniendo en cuenta los datos del problema anterior, qué media de esa distribución muestral
dejará por debajo de sí el 90% de los casos:
a) 47,02
b) 53,01
c) 42,37

31. A una muestra aleatoria de 17 estudiantes de secundaria se les aplicó una prueba cuya
finalidad era medir sus conocimientos sobre conceptos científicos básicos. En la variable
analizada, los estudiantes se distribuyen normalmente con una media igual a 78. Los
resultados del estudio en la muestra fueron: media igual a 84,984 y desviación típica igual
a 16. El intervalo de confianza de la distribución muestral será: α = 0,05
a) ± 2,12
b) ± 1,98
c) ± 2,72

32. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste será:
a) Z = 1,893
b) t = 1,746
c) χ2 = 1,572

33. con los datos de los dos problemas anteriores, el criterio de decisión será:
a) A ese nivel de confianza no podemos aceptar la hipótesis nula.
b) Como el valor del estadístico de contraste no se encuentra en el intervalo confidencial,
rechazamos H0.
c) Para un n. c. del 0,95 no podemos aceptar la H1.

34. Una muestra aleatoria de 30 personas presenta una desviación típica, en la variable “tiempo de
ejecución” de una tarea de reconocimiento de palabras, igual a 120 segundos. Queremos saber
si es compatible este resultado, a un nivel de confianza de 99% con el supuesto de que la
desviación típica en la población (para esta variable), con una distribución normal, es de 150
segundos. Teniendo esto en cuenta, el planteamiento de las hipótesis sería:
a) H0 : μ = 150 y H1 : μ ≠ 150
b) H0 : σ2 = 1502 y H1 : σ2≠ 1502
c) H0 : μ < 1502 y H1 : μ > 1502

35. Con los datos del problema anterior, el estadístico de contraste será:
a) χ2 = 19,2
b) Z = 17,3
c) t = 18,4

36. Teniendo en cuenta los datos de los dos problemas anteriores, el intervalo confidencial será:
a) 13,6 < χ2 < 16,3
b) 43,1 < χ2 < 54,2
c) 13,1 < χ2 < 52,3
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

37. La decisión tomada sobre los resultados será la siguiente:


a) Como nuestro estadístico de contraste no cae dentro del intervalo confidencial,
aceptamos la hipótesis nula.
b) La desviación típica de la población no es de 150 a ese nivel de confianza
c) Como nuestro estadístico de contraste se encuentra en el intervalo confidencial al 99%
de n. c., no podemos rechazar la hipótesis nula.

38. Con muestras aleatorias de 121 sujetos, la distribución muestral de la media (de una variable
que se distribuye normalmente en la población) tiene una media de 25 y como desviación
típica de 10. La formulación de las hipótesis será: n.c. : 95%
a) H0 : μ = 25 y H1 : μ ≠ 25
b) H0 : σ2 = 25 y H1 : σ2≠ 25
c) H0 : μ < 25 y H1 : μ > 25

39. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste para
comprobar que una muestra del mismo tamaño con media = 28 y desviación típica = 30
pertenece a la misma población será:
a) Z = 0,3
b) t = 3,7
c) χ2 = 4,2

40. atendiendo a los resultados anteriores, el criterio de decisión será:


a) No podemos aceptar que una muestra (del mismo tamaño) con media igual a 28
pertenezca a la misma población
b) Podemos afirmar que la media obtenida por nosotros en la investigación, es
compatible, a un nivel de confianza del 95%, con la hipótesis de que la media de la
población sea de 25.
c) Rechazamos la hipótesis nula puesto que la probabilidad asociada a nuestro estadístico
de contraste (p), es menor que α.

41. En una muestra aleatoria de 200 sujetos, procedentes de una población normal e infinita, se ha
obtenido una media igual a 60 y una desviación típica igual a 20. Cuál será el error típico de la
media:
a) 1,87
b) 1,63
c) 1,42

42. Un educador piensa que sólo un 15% de los alumnos de cuarto de primaria, del colegio en el
que trabaja, son capaces de manejar con rapidez el diccionario. Para comprobar lo que piensa,
selecciona al azar una muestra de 150 alumnos de ese curso y les realiza una prueba de manejo
del diccionario. Teniendo en cuenta estos datos, la formulación de las hipótesis estadísticas
será: α = 0,05
a) H0: π = 0,15 y H1: π ≠ 0,15
b) H0 : μ = 15 y H1 : μ ≠ 15
c) H0 : μ < 15 y H1 : μ > 15

43. Teniendo en cuenta los datos del problema anterior, el contraste será:
a) Unilateral izquierdo
b) Unilateral derecho
c) Bilateral

6
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

44. El estadístico de contraste para los datos de los dos problemas anteriores será:
a) t = 3,825
b) Z = 1,715
c) χ2 = 4,247
45. Atendiendo a los datos de los problemas anteriores, la interpretación de los resultados será:
a) Con un nivel de confianza del 95% no podemos afirmar que sólo ese porcentaje de
alumnos sea capaz de manejar el diccionario.
b) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador está
justificada, es decir, que sólo un 15% de los alumnos maneja con rapidez el diccionario.
c) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador está
justificada, es decir, que más del 15% de los alumnos maneja con rapidez el diccionario.

46. El equipo docente de la asignatura Diseños de Investigación y Análisis de Datos considera que
el 50% de los alumnos que se presentan a examen, obtienen una nota de 7 o más. Tras realizar
el examen de febrero, comprueban que en una muestra aleatoria de 200 exámenes, 70
obtienen la calificación de Notable, 20 son calificados con Sobresaliente, 80 obtienen la
calificación de Aprobado y 30 la de Suspenso.
Sabiendo que: Suspenso < 5; 7 > Aprobado ≥ 5; 9 > Notable ≥ 7; Sobresaliente ≥ 9
¿Qué planteamiento dará el equipo docente a las hipótesis estadísticas?: (n. c., 95%)
a) H0 : η = 7 y H1 : η ≠ 7
b) H0 : μ = 7 y H1 : μ ≠ 7
c) H0 : μ < 7 y H1 : μ > 7

47. Según los datos del problema anterior, el estadístico de contraste será:
a) t = 5,825
b) χ2 = 4,227
c) = 1,41

48. Atendiendo a los resultados obtenidos, la conclusión a la que se puede llegar es la siguiente:
a) Es posible seguir manteniendo que la mediana de la población de referencia está en la
puntuación 7, es decir, que el 50% de los alumnos que se presentan a examen obtienen
una nota de 7 o más, con un nivel de confianza del 95%.
b) Es posible seguir manteniendo que la media de la población de referencia está en la
puntuación 7 a un nivel de confianza del 95%.
c) No es posible seguir manteniendo el planteamiento de la investigación, es decir,
debemos afirmar que el 50% de los alumnos que se presentan a examen no obtienen
una nota de 7 o más a un nivel de confianza del 95%.

7
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

TEMA 3: ANÁLISIS DE DATOS PARAMÉTRICOS PARA DISEÑOS DE DOS GRUPOS.

1. Los diseños de investigación intersujetos determinan analizar los datos con estadísticos de
contraste para:
a) Muestras relacionadas
b) Muestras independientes
c) Bondad de ajuste.

2. Si tras establecer el intervalo de confianza respecto a una diferencia entre proporciones


independientes, encontramos que el valor cero no se encuentra en el intervalo:
a) No podemos tomar ninguna decisión respecto a la hipótesis nula de igualdad de
proporciones.
b) No podemos rechazar la hipótesis nula de igualdad de proporciones poblacionales.
c) Debemos rechazar la hipótesis nula de igualdad entre proporciones poblacionales.

3. Cuando establecemos el intervalo de confianza para la diferencia entre pares de medias


correspondientes a muestras independientes, se mantendrá la H0 si:
a) El valor del parámetro estipulado en H0 cae dentro del intervalo.
b) El valor muestral del estadístico cae dentro del intervalo.
c) El valor del parámetro estipulado en H0 cae fuera del intervalo.

4. ¿Cuál de las alternativas es correcta?:


a) Dos muestras son independientes cuando las observaciones o medidas son
independientes entre las muestras, pero no dentro de ellas.
b) Cuando se mide una variable en los dos miembros de n pares de sujetos siendo los
miembros de cada par muy similares en alguna característica relevante, estamos ante
un diseño de medida independientes.
c) Ambas alternativas son incorrectas.

5. En el cálculo del estadístico de contraste T para el caso de dos muestras independientes es


necesario conocer:
a) La varianza insesgada de cada muestra
b) La varianza insesgada de cada población.
c) La varianza de cada población.

6. Para aplicar un contraste de medias en dos muestras independientes, se debe cumplir que:
a) La variable dependiente debe estar medida, al menos a nivel de razón
b) La variable dependiente debe estar medida, al menos, a nivel de intervalo
c) La variable dependiente debe estar medida, al menos, a nivel ordinal.

7. Queremos contrastar que H0: π21 = π12. Hemos estimado que la diferencia entre las dos
proporciones poblacionales estará entre los valores 0,047 y 0,470 con una probabilidad igual
a 0,99. Se podría interpretar que:
a) Ambas proporciones son distintas
b) Ambas proporciones son iguales
c) No se puede contestar porque faltan datos en el enunciado.
8. En el contraste estadístico de dos medias independientes:
a) Lo más habitual es desconocer el valor de las varianzas poblacionales
b) Lo más habitual es utilizar el estadístico de contraste Z
c) Debe utilizarse el estadístico de contraste X2

1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

9. Hemos seleccionado aleatoriamente un grupo de 10 imágenes y las procesamos con dos


programas de ordenador (cinco a cada programa asignadas aleatoriamente) para ver si
existen diferencias entre los tiempos medios de procesamiento de las imágenes, ¿cómo son las
muestras?
a) Independientes
b) Relacionadas
c) Coherentes

10. Para la aplicación del estadístico W de Wilcoxon:


a) No importa la forma de la distribución de la variable
b) La distribución de la variable debe ser normal
c) Ambas respuestas son incorrectas
11. En algunas investigaciones sobre percepción de olores, se encontró que la diferencia entre la
proporción de mujeres que detectan la presencia de moléculas de androsterona y la de los
varones es 0,10. Para contrastar este resultado, extraemos una muestra aleatoria de 800
mujeres (M) y otra de 400 hombres (H), y encontramos que 640 mujeres y 200 varones
detectan la presencia de dichas moléculas. Cuál sería la formulación de las hipótesis
estadísticas: (N.c. 99%)
a) H0: πM πH = D = 0,10 y H1: πM πH ≠ D ≠ 0,10
b) H0: μM μH = 0,10 y H1: μM μH ≠ 0,10
c) H0: ηM ηH = 0,10 y H1: ηM ηH ≠ 0,10

12. El estadístico de contraste en el caso de los datos del problema anterior sería:
a) F = 3,6
b) Z = 6,9
c) T = 5,4

13. La conclusión obtenida en nuestro análisis sería:


a) Para un n. c., igual a 0,99, la diferencia entre la proporción poblacional de mujeres que
detectan la presencia de moléculas de androsterona y la de los varones es distinta de
0,10.
b) Para un n. c., igual a 0,99, la diferencia entre la proporción poblacional de mujeres que
detectan la presencia de moléculas de androsterona y la de los varones es igual a 0,10.
c) Para un n. c., igual a 0,99 y atendiendo a los resultados, se acepta la hipótesis nula.
14. Un psicólogo deportivo desea estudiar el efecto de la relajación sobre la amplitud de apertura
de piernas (AP). Extrae aleatoria e independientemente 9 gimnastas con una AP similar y las
asigna también aleatoriamente a dos grupos. A los del primer grupo (grupo experimental),les
somete a un programa de estiramiento de 14 semanas de duración en el que se introducen
ejercicios de relajación y a los del segundo grupo (grupo control) les somete al mismo
programa de estiramiento pero sin ejercicios de relajación. Finalizado el programa de
estiramiento, mide la amplitud de la apertura de piernas a los 9 gimnastas. Las medidas
obtenidas en los grupos experimental (E) y control (C) son las siguientes:
E: 130 127 142 145 135
C: 110 125 120 115
La amplitud de movimiento es una variable medida en grados que se distribuye normalmente
en ambas poblaciones con varianzas desconocidas pero supuestas iguales. N. c. 95%
Según estos datos, ¿cuál sería la formulación de la hipótesis nula?:
a) H0: μE = μC y H1: μE ≠ μC
b) H0: μE μC = 0 y H1: μE μC ≠ 0
c) Ambas opciones son correctas.

2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

15. Atendiendo a los datos del problema anterior, la zona de rechazo de la hipótesis nula está
formada por:
a) Todos los valores iguales y menores que t7, 0,025 = 2,36
b) Todos los valores iguales y menores que t7, 0,025 = 2,36 e iguales y mayores
que t7, 0,975 = 2,36
c) Todos los valores iguales y mayores que t7, 0,975 = 2,36

16. Continuando con el problema anterior, el valor del estadístico de contraste será:
a) t = 3,52
b) Z = 4,20
c) Z = 3,80

17. Según los datos de los problemas anteriores (14, 15 y 16), podemos afirmar:
a) Que los resultados llevan al rechazo de H0, a un nivel de significación igual a 0,05, de
que las muestras proceden de dos poblaciones con medias iguales.
b) Que el resultado del contraste no apoya la hipótesis del investigador de que la amplitud
de apertura de piernas es distinta cuando en el programa de estiramiento se
introducen ejercicios de relajación que cuando no se introducen.
c) Que el grupo experimental obtuvo una amplitud media de apertura de piernas menor
que el grupo control, lo que indica, a nivel descriptivo, que la relajación no aumenta la
amplitud de apertura de piernas.
18. Queremos comparar el método tradicional (T) de la UNED con un método nuevo, en concreto,
un método multimedia (M), para la enseñanza a distancia de la estadística. Nuestra hipótesis es
que los alumnos que estudien con el método tradicional obtendrán unas notas inferiores a las
de los alumnos que estudien con el método multimedia. Extraemos aleatoria e
independientemente 7 alumnos del segundo curso de psicología de la UNED y les asignamos
también aleatoriamente a los dos métodos de enseñanza. Los datos que aparecen a
continuación representan las notas obtenidas en un examen de estadística en ambas muestras
de alumnos:
Método Tradicional (MT): 4 5 6 2
Método Multimedia (MM): 9 8 10
La nota en estadística es una variable medida a nivel de intervalo que se distribuye
normalmente en ambas poblaciones con varianzas: σ2T = 4 y σ2M = 2. N. c. 95%. Teniendo
en cuenta estos datos, ¿cuál será la formulación de las hipótesis estadísticas?:
a) H0: μT μM = 0 y H1: μT μM ≠ 0
b) H0: μT ≥ μM y H1: μT < μM
c) H0: μT = μM y H1: μT ≠ μM
19. Atendiendo a los datos del problema anterior, el valor del estadístico de contraste será:
a) Z = 2,28
b) t = 3,80
c) Z = 3,68

20. Continuando con los datos de los problemas anteriores, podemos afirmar que:
a) La probabilidad de obtener un valor del estadístico tal como el hallado, o uno menor, no
es nula, por lo tanto rechazamos H0.
b) A nivel poblacional, los alumnos que estudiaron con el método tradicional tienen una
nota media en estadística inferior a los que estudiaron con el método multimedia,
asumiendo un nivel de significación igual a 0,05.
c) Este resultado sugiere que el método multimedia es peor método de enseñanza que el
método tradicional.

3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

21. Algunas variables ejercen su influencia sobre las conductas haciendo éstas más o menos
variables. Un investigador quiere investigar esta cuestión en la conducta afectiva de los niños.
Su hipótesis es que la conducta afectiva de los niños es menos variable que la de las niñas.
Extrae una muestra aleatoria de 41 niñas y otra de 31 niños y les mide la afectividad mediante
un cuestionario obteniendo una varianza insesgada igual a 9 en la muestra de niños y una de
36 en la muestra de niñas. La variable puntuación en el cuestionario de afectividad está medida
a nivel de intervalo. ¿cuál será el planteamiento de la hipótesis estadísticas? (N. c. 99%)
a) H0: μA ≥ μO y H1: μA < μO
b) H0: σ2A = σ2O y H1: σ2A ≠ σ2O
c) H0: σ2A ≤ σ2O ó H0: σ2A / σ2O ≤ 1 y H1: σ2A > σ2O ó H1: σ2A / σ2O > 1

22. El estadístico de contraste, atendiendo a los datos del problema anterior será:
a) Z = 5,28
b) t = 2,80
c) f = 4

23. La zona de rechazo de la hipótesis nula estará formada por todos los valores:
a) Todos los valores iguales y mayores que f0,99; 40, 30 = 2,30
b) Todos los valores iguales y menores que f0,99; 40, 30 = 2,30
c) Todos los valores iguales y mayores que f0,99; 41, 31 = 3,50

24. Los resultados llevan a las siguientes conclusiones:


a) Los resultados llevan al rechazo de H0 con un nivel de significación igual a 0,99, de que
la varianza de las puntuaciones en el cuestionario de afectividad en la población de
niñas, es igual o mayor que en la de niños.
b) Los resultados llevan al rechazo de H0 con un nivel de significación igual a 0,01, de que
la varianza de las puntuaciones en el cuestionario de afectividad en la población de
niñas, es igual o menor que en la de niños.
c) Los resultados no apoyan la hipótesis del investigador de que los niños son menos
variables que las niñas en cuanto a conducta afectiva.

25. Se quiere comprobar el efecto de un método novedoso de aprendizaje en dos grupos de niños,
uno de 4 alumnos y otro de 3. Sabemos que el análisis estadístico ha aportado diferencias
significativas del efecto del nuevo método con respecto al tradicional. Sabemos que el grupo
de n=4 al que se le aplicó el método nuevo, obtuvo una media igual a 6 y una desviación típica
insesgada de 4, y que el grupo de n=3 al que se le aplicó el método tradicional obtuvo una
media de 5 y una desviación típica insesgada de 2. ¿Cuál será la magnitud del efecto del método
novedoso sobre el tradicional?
a) 0,78
b) 0,30
c) 0,29

26. Tras realizar análisis estadístico sobre dos muestras de 7 y 8 sujetos, los resultados apoyan la
hipótesis del investigador de que la relajación influye positivamente sobre la elasticidad en los
deportistas. Los resultados obtenidos son los siguientes:
Grupo 1: n=7 ȲR = 125,8 σ2R = 68,7 (Grupo con relajación)
Grupo 2: n=8 ȲNR=119,5 σ2NR =61,67 (Grupo sin relajación)
¿Cuál será la magnitud de la mejoría de la elasticidad tras aplicar la relación?:
a) 0,78
b) 0,27
c) 0,35
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

27. Un psicofísico hipotetiza que los hombres y las mujeres no son igualmente variables en
sensibilidad olfativa. Extrae una muestra aleatoria de 13 hombres (H) y otra de 25 mujeres (M)
y les mide la sensibilidad olfativa, obteniendo una varianza insesgada igual a 10 en la muestra
de hombres y de 17 en la de mujeres. La sensibilidad olfativa es una variable medida a nivel de
intervalo que se distribuye normalmente en ambas poblaciones. N. c. 90%. ¿Cuál será la
formulación de la hipótesis estadística?:
a) H0: μM ≥ μH y H1: μM < μH
b) H0: σ2M = σ2H ó H0: σ2M / σ2H = 1 y H1: σ2M ≠ σ2H ó H1: σ2M / σ2H ≠ 1
c) H0: σ2M ≤ σ2H ó H0: σ2M / σ2H ≤ 1 y H1: σ2M > σ2H ó H1: σ2M / σ2H > 1

28. La zona de aceptación de la hipótesis nula, teniendo en cuenta los datos del problema anterior,
está formada por todos los valores :
a) f0,05; 24, 12 = 0,46 < H0 < f0,95; 24, 12 = 2,51
b) f0,95; 24, 12 = 0,46 < H0 < f0,05; 24, 12 = 2,51
c) f0,05; 25, 13 = 0,46 < H0 < f0,95; 25, 13 = 2,51

29. El estadístico de contraste, atendiendo a los datos de los dos problemas anteriores será:
a) f = 2,58
b) t = 1,28
c) f = 1,70

30. atendiendo a los datos de los problemas anteriores, (27, 28, 29), ¿se rechaza la hipótesis nula?:
a) Sí, ya que el valor de nuestro estadístico de contraste no está dentro de la zona de
aceptación de H0.
b) No, ya que el valor del estadístico de contraste cae dentro de la zona de aceptación de la
hipótesis nula
c) No, ya que el valor del estadístico de contraste cae en la zona de aceptación de la
hipótesis alternativa.

31. Siguiendo con los problemas anteriores, ¿apoyan los resultados la hipótesis del investigador?:
a) No, ya que se acepta la hipótesis nula.
b) No, ya que no se acepta la hipótesis nula.
c) Sí, ya que se rechaza la hipótesis nula.

32. En una investigación en el área de la psicología deportiva, extraemos aleatoria e


independientemente 200 nadadores y les asignamos también aleatoriamente a las dos
condiciones de un experimento, obteniendo dos muestras de 100 nadadores (grupo
experimental y grupo control). Durante un mes, los nadadores del grupo experimental (E),
además de un entrenamiento intenso, son sometidos a una terapia de relajación, mientras que
los del grupo control (C) realizan el mismo entrenamiento intenso pero sin terapia de
relajación. Las respuestas afirmativas dadas por ambos grupos, al finalizar el período de
entrenamiento, a la pregunta “¿se siente muy cansado?”, fueron 60 en el grupo experimental y
70 en el grupo control. Queremos saber si la terapia de relajación influye en la proporción de
respuestas afirmativas. Teniendo en cuenta un n. c. del 99%, cuál será el planteamiento de las
hipótesis estadísticas:
a) H0: πE πC = 0 y H1: πE πC ≠ 0
b) H0: πE πC ≥ 0 y H1: πE πC < 0
c) H0: πE πC < 0 y H1: πE πC ≥ 0

33. El estadístico de contraste, teniendo en cuenta los datos del problema anterior, será:
a) t = 2,48
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

b) f = 1,98
c) z = 1,47

34. El nivel crítico p asociado a nuestro estadístico, será:


a) 0,3214
b) 0,0002
c) 0,1416

35. Teniendo en cuenta los datos del problema anterior, se rechazará la hipótesis nula?:
a) No, porque p = 0,1416 > α = 0,01
b) Sí , porque p = 0,0002 < α = 0,01
d) No, porque p = 0,3214 < α = 0,01

36. Según los resultados de los problemas anteriores, a qué conclusiones llegaremos:
a) Con un α = 0,01, la proporción de nadadores que dicen sentirse muy cansados tras el
periodo de entrenamiento intenso no es la misma en la población experimental que en
la de control.
b) La relajación no ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.
c) La relajación ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.

37. Un investigador quiere estudiar el efecto de la privación de agua sobre el tiempo que tardan las
ratas en recorrer un laberinto. Extrae aleatoria e independientemente 60 ratas y les asigna
también aleatoriamente a las dos condiciones del experimento: 12 y 24 horas de privación de
agua. Las 30 ratas sometidas a 12 horas de privación de agua (muestra A) tardaron un tiempo
medio de 5,9 minutos en recorrer un laberinto y las 30 ratas sometidas a 24 horas de privación
(muestra B) tardaron 6,40 minutos en recorrer el mismo laberinto, siendo las desviaciones
típicas isesgadas 0,29 y 0,30 respectivamente. Sabiendo que el n. c. fijado por el investigador es
del 95%, cuál será el planteamiento de las hipótesis estadísticas:
a) H0: μA = μB ó μA μB = 0 y H1: μA ≠ μB ó μA μB ≠ 0
b) H0: μA < μB ó μA μB < 0 y H1: μA > μB ó μA μB >0
c) H0: μA ≥ μB ó μA μB ≥ 0 y H1: μA < μB ó μA μB <0

38. El estadístico de contraste atendiendo a los datos del problema anterior, será:
a) t = 5,32
b) t = 4,28
c) t = 6,58

39. ¿Cuál será el intervalo de confianza?:


a) 0,57 < μA μB < 0,84
b) 0,35 < μA μB < 0,65
c) 0,44 < μA μB < 0,78

40. ¿Se rechazaría la hipótesis nula?:


a) No, porque el valor del estadístico de contraste cae en la zona de rechazo de H1
b) Sí, porque la probabilidad asociada al estadístico de contraste obtenido es menor que
el nivel de significación acordado en nuestra investigación.
c) Sí, porque p > α
6
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4

TEMA 4: ANÁLISIS DE DATOS PARAMÉTRICOS PARA DISEÑOS DE DOS GRUPOS. MUESTRAS


RELACIONADAS.

1. Un ejemplo de muestras relacionadas son las obtenidas:


a) Con un diseño clásico antes y después de un tratamiento.
b) Independientemente, mediante un muestreo aleatorio simple
c) Independientemente, mediante muestreo probabilístico.

2. Cuando hallamos los valores críticos del estadísticos T, para dos muestras relacionadas, con
más de 30 grados de libertad, acudimos a la tabla de distribución:
a) T de Student
b) X2 de Pearson
c) Normal.

3. El estadístico Z aplicado para el contraste de medias en muestras relacionadas, se distribuye


normalmente:
a) Con media 0 y varianza 1
b) Con media 1 y varianza 0
c) Con media 0 y varianza desconocida.

4. Cuando hallamos los valores críticos del estadístico T, para dos muestras relacionadas, con
más de 30 grados de libertad, acudimos a la tabla de distribución:
a) Normal
b) T de Student
c) X2

5. En los contrastes para dos muestras dependientes:


a) Tenemos una muestra de diferencias que podemos suponer relacionadas
b) Las dos observaciones o puntuaciones de un mismo sujeto (o de los dos sujetos de un
mismo par), no pueden estar relacionados.
c) Un ejemplo típico es el diseño en el que se toman medidas pre y post tratamiento.

6. Cuando se mida una variable en los dos miembros de n pares de sujetos siendo los miembros
de cada par muy similares en variables relevantes del estudio, asumiremos que las
observaciones de ambas muestras:
a) Están relacionadas pero ello no implica que las diferencias entre cada par de
observaciones lo estén.
b) Son independientes.
c) Están relacionadas, lo cual implica que las diferencias entre cada par de observaciones
también lo están.

7. Se desea estudiar si una terapia de relajación reduce el nivel de ansiedad. Se obtiene una
muestra aleatoria de 8 sujetos y se les toman medidas en ansiedad antes y después de
aplicarles la terapia. Sabemos que la variable está medida a nivel de intervalo y que la
distribución poblacional de las diferencias entre cada par de puntuaciones es simétrica en
torno a la medida de tendencia central. ¿Qué estadístico de contraste aplicaría?:
a) W de Wilcoxon
b) S de signos
c) T para dos muestras relacionadas.
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4

8. La prueba de Wilcoxon:
a) Tiene las mismas restricciones que la prueba de signos.
b) Presenta restricciones en cuanto a la distribución de la variable en la población y en el
nivel de medida de los datos.
c) No tiene restricciones.

9. Cuando utilizamos el estadístico de contraste de Mann-Witney-Wilcoxon, hay que tener en


cuenta que las dos poblaciones, si difieren, lo hacen:
a) Sólo en tendencia central
b) Sólo en variabilidad
c) Tanto en tendencia central como en variabilidad.

10. Un investigador desea estudiar si un vídeo preelectoral aumenta el número de votos a favor de
cierto partido político en la población española. Extrae una muestra aleatoria de 250 españoles
que vieron el vídeo en televisión. Las respuestas (a favor o en contra) de los 250 españoles
antes y después de ver el vídeo aparecen a continuación: (N. c. 95%)
Antes ¿Cuál será el planteamiento de las
hipótesis estadísticas?:
A favor En Contra a) H0: πc ≤ πb y H1: πc > πb
b) H0: πc ≥ πb y H1: πc < πb
Después A favor 100 60
c) H0: πc = πb y H1: πc ≠ πb
En Contra 35 55

11. La zona de aceptación de la hipótesis nula está formada por:


a) Todos los valores mayores que z0,95 = 1,64
b) Todos los valores menores que z0,95 = 1,64
c) Todos los valores menores que z0,95 = 1,98

12. Atendiendo a los datos de los problemas anteriores, el valor del estadístico de contraste
empleado será:
a) t = 3,28
b) z = 2,56
c) z = 3,28

13. Atendiendo a los datos de los problemas anteriores, se aceptará la hipótesis alternativa?:
a) No, porque el valor del estadístico de contraste cae fuera de la zona de aceptación de la
hipótesis nula.
b) Sí, porque el valor del estadístico de contraste cae fuera de la zona de aceptación de la
hipótesis nula.
c) No, porque p > 0,005
14. La probabilidad asociada a nuestro estadístico de contraste será:
a) 0,0052
b) 0,052
c) 0,002
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4

15. Un investigador desea estudiar si una campaña informativa sobre los beneficios de la práctica
deportivo aumenta dicha práctica. Extrae una muestra aleatoria de 100 españoles. Las
respuestas de los 8 españoles antes y después de la campaña informativa a la pregunta “ ¿
practica algún tipo de deporte?”, aparecen a continuación:
Antes Si tenemos en cuenta un n. c. del 95%, ¿cuál será el planteamiento
de las hipótesis?:
Sí No a) H0: πc = πb y H1: πc ≠ πb
b) H0: πc ≥ πb y H1: πc < πb
Después Sí 44 37
c) H0: πc ≤ πb y H1: πc > πb
No 9 10

16. El estadístico de contraste sería:


a) Z = 4,129
b) Z = 1,538
c) Z = 3,278
17. ¿Cuál será la probabilidad asociada al estadístico de contraste?
a) 0,9772
b) 0,0028
c) 0,0002

18. Atendiendo a los datos del problema anterior, ¿Se aceptará la hipótesis nula?:
a) No, ya que el valor del estadístico de contraste es mayor que p
b) No, ya que p < α
c) Sí, ya que p < α

19. Teniendo en cuenta los resultados, ¿a qué conclusiones llegaremos?:


a) A un nivel de significación del 5%, los datos permiten rechazar la hipótesis nula de que
la proporción poblacional de españoles que practican deporte después de la campaña
informativa y no antes, es mayor que la proporción poblacional de españoles que
practican deporte antes de la campaña informativa y no después.
b) A un nivel de significación del 5%, los datos no permiten rechazar la hipótesis nula de
que la proporción poblacional de españoles que practican deporte después de la
campaña informativa y no antes, no es mayor que la proporción poblacional de
españoles que practican deporte antes de la campaña informativa y no después.
c) Este resultado no apoya la hipótesis del investigador de que una campaña informativa
sobre los beneficios de la práctica deportiva aumenta dicha práctica.

20. Un investigador quiere estudiar la influencia de una terapia cognitiva sobre la agresividad.
Extrae una muestra aleatoria de 36 sujetos violentos y les mide la agresividad mediante un
cuestionario (medida pretest). Posteriormente, les trata durante 3 meses con la terapia
cognitiva, y vuelve a pasarles el cuestionario de agresividad (medida postest). En el pretest,
obtuvo una media igual a 38 y una varianza igual a 35. En el postest obtuvo una media de 30 y
una varianza igual a 35. La varianza muestral de las diferencias entre las medidas pre y postest
es igual a 18,56. La puntuación en el cuestionario de agresividad es una variable medida a nivel
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4

de intervalo y el n. c. 99%. Teniendo en cuenta lo anterior, cuál será el planteamiento de las


hipótesis estadísticas:
a) H0: μd = 0 y H1: μd ≠ 0
b) H0: μd <0 y H1: μd > 0
c) H0: μd > 0 y H1: μd < 0

21. El valor del estadístico de contraste será:


a) 5,34
b) 7,28
c) 10,96

22. La zona de rechazo de la hipótesis nula será:


a) ± 1,98
b) ± 3,52
c) ±2,58

23. Se aceptará la hipótesis alternativa?:


a) No, ya que el valor del estadístico de contraste cae en la zona de aceptación de la
hipótesis nula.
b) Sí, ya que el valor del estadístico de contraste cae en la zona de aceptación de la
hipótesis alternativa.
c) Sí, ya que p < α
24. Las conclusiones obtenidas a partir de los resultados son:
a) A nivel descriptivo, la terapia cognitiva no es efectiva para el control de la agresividad.
b) Para un nivel de significación igual a 0,01 los resultados indican que la terapia no es
efectiva.
c) A nivel descriptivo, la terapia cognitiva es efectiva para el control de la agresividad, es
decir, disminuye la ansiedad.
25. Un psicofísico desea comparar los umbrales sensoriales en dos sesiones distintas. Su hipótesis
es que la magnitud de los umbrales no es la misma en ambas sesiones. Extrae una muestra
aleatoria de 7 sujetos y les mide el umbral sensorial a un estímulo olfativo (primera sesión).
Una semana más tarde el investigador presenta de nuevo el estímulo olfativo a los mismos
sujetos, manteniendo constantes todas las condiciones del experimento, y obtiene nuevos
umbrales sensoriales (segunda sesión). Los umbrales sensoriales (a mayor puntuación mayor
es el umbral sensorial y menor es la sensibilidad del sujeto) obtenidos en ambas sesiones
aparecen a continuación:
1ª sesión 2ª sesión

21 15

28 13

40 25

13 11

20 20

26 22

10 19

4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4

El umbral sensorial a un estímulo olfativo es una variable medida a nivel de intervalo y la


distribución poblacional de las diferencias en sensibilidad entre ambas sesiones es simétrica
en torno a la mediana. Teniendo en cuenta estos datos y sabiendo que tenemos un n. c. del
95%, cuál será la formulación de las hipótesis estadísticas:
a) H0: μd = 0 y H1: μd ≠ 0
b) H0: η2 = η1 y η2 ≠ η1
c) H0: μd <0 y H1: μd > 0

26. ¿cuál será la probabilidad asociada al estadístico de contraste?:


a) 0,20
b) 0,52
c) 0,002

27. ¿Se rechazaría en este caso la hipótesis nula?:


a) Si, porque el estadístico de contraste está en la zona de rechazo de la hipótesis nula
b) Sí, porque p > α
c) No, porque p > α

28. Las conclusiones a las que llegaremos a través de los resultados obtenidos serán:
a) A un nivel de confianza del 95%, los datos no permiten rechazar la hipótesis nula de
que las medianas poblacionales son iguales.
b) En promedio, el umbral sensorial medido en la primera sesión es distinto de aquél
medido en la segunda sesión.
c) Los resultados apoyan la hipótesis del investigador.

5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5

TEMA 5: Diseños con más de dos grupos independientes.

1. El análisis de varianza se ocupa:


a) De averiguar qué factor varía más.
b) De Estudiar los tipos de varianzas que se dan en las muestras.
c) De averiguar qué variabilidad corresponde al factor estudiado y cuál al error
experimental.

2. En el análisis de varianza:
a) A las variables independientes se las denomina factores y a las categorías en que se
dividen, niveles.
b) A las variables dependientes se las denomina niveles y a sus efectos, factores.
c) A las variables extrañas se las denomina factores y a sus categorías o dosis de
tratamiento, niveles.

3. Un modelo experimental se considera equilibrado:


a) Cuando existe equilibrio entre sus factores y niveles.
b) Cuando el número de elementos es el mismo en todas sus muestras.
c) Cuando sus varianzas son iguales.

4. En un análisis de varianza, si la variabilidad intergrupo es mayor que la variabilidad


intragrupo:
a) Significa que existe acuerdo entre grupos en cuanto a la varianza.
b) Significa que existe acuerdo entre parte de los grupos en cuanto a la varianza.
c) Significa que existe diferencia entre los grupos en cuanto a la varianza.

5. Dentro de una muestra en el análisis de varianza:


a) Se llama variabilidad intragrupo a la que se produce entre dos muestras e
intergrupo a la que se produce dentro de las muestras.
b) Se llama variabilidad intra a la que se produce dentro de las muestras e inter a la
que se produce entre las muestras.
c) Se llama variabilidad intra a la intrapoblacional e inter a la que se da en
poblaciones de igual varianza.

6. Se dice que la MCinter es un estimador sesgado de la varianza poblacional:


a) Porque no representa a la varianza poblacional.
b) MCinter no es un estimador sesgado.
c) Porque su esperanza es igual a la varianza poblacional más un sumando.

7. Decimos que un modelo es de efectos fijos:


a) Cuando el investigador establece como niveles del factor sólo aquellos que está
interesado en estudiar.
b) Cuando se establecen como “i” niveles del factor, una muestra aleatoria de todos
los niveles posibles del factor.
c) Cuando el investigador establece de forma aleatoria los niveles que desea estudiar.

8. En un modelo de efectos variables:


a) Las hipótesis se establecen sobre las medias poblacionales de los efectos del factor.
b) Las hipótesis se establecen sobre las varianzas poblacionales de los efectos del
factor.
c) Las hipótesis no se establecen sobre las varianzas poblacionales de los efectos del
factor.

1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5

9. La importancia de las comparaciones planificadas radica:


a) En su independencia.
b) En su dependencia.
c) En su naturaleza “ a priori “

10. Los supuestos de análisis de varianza son:


a) Independencia, conservación y aleatoriedad.
b) Normalidad, homocedasticidad e independencia.
c) Homocedasticidad, independencia y aleatoriedad.

11. El cometido del Análisis de Varianza es:


a) Minimizar el error experimental
b) Maximizar los efectos del factor estudiado
c) Discernir qué variabilidad corresponde al factor estudiado y cuál al error
experimental.

12. El que un modelo sea o no equilibrado cuando aplicamos el análisis de varianza, depende
de:
a) Que el muestreo sea aleatorio.
b) El número de elementos de las muestras
c) El número de variables independientes.

13. Con el ANOVA contrastamos, la diferencia de:


a) Porcentaje entre dos o más muestras.
b) Medias entre varias muestras
c) Proporción entre dos o más muestras.

14. La varianza intragrupos es la varianza atribuible:


a) El error experimental
b) Tanto al error experimental como a los distintos niveles del factor estudiado
c) A los distintos niveles del factor estudiado.

15. El estadístico de contraste en el análisis de varianza se distribuye según la distribución:


a) F de Snedecor
b) Chi cuadrado
c) Normal.

16. En el razonamiento del análisis de varianza se supone que dentro de un mismo nivel, las
puntaciones deberían ser:
a) Semejantes
b) Correlacionadas
c) Diferentes.

17. Queremos comprobar si el ambiente en el que se desarrolla un niño influye en los


valores/puntuaciones obtenidas en un test de inteligencia. Para ello, extraemos de la
población dos grupos de 10 niños cada uno. Uno de ellos de una zona deprimida (grupo D)
y otro de otra zona con un nivel socieconómico elevado (grupo E). Se aplica a ambos
grupos un test de inteligencia y se obtienen los siguientes datos:
SCtotal = 2250,8 SCintra= 1379,6

¿Cuál será el estadístico más adecuado a utilizar?


a) Estadístico F
b) Estadístico T
c) Estadístico Z

2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5

18. Cuál será el resultado de nuestro estadístico atendiendo a los datos del problema 24?.
a) T= 11,36
b) F = 3,37
c) F= 11,36

19. Cuál será nuestro valor crítico, atendiendo a los datos del problema 24?
a) 3,007
b) 4,414
c) 5,978

20. A un n.c. del 95% aceptaríamos la Hipótesis alternativa?: (datos del problema 24)
a) Sí porque el valor del estadístico es mayor que nuestro valor crítico.
b) No porque el valor del estadístico es menor que nuestro valor crítico.
c) Sí porque el valor del estadístico es mayor que nuestro valor crítico.

21. Teniendo en cuenta los resultados obtenidos en los ejercicios anteriores (24 al 27), la
conclusión a la que hemos llegado es la siguiente:
a) Al no haber obtenido una diferencia significativa en nuestro estudio, se deduce que
el ambiente en el que se desarrolle un niño no influye en las puntuaciones
obtenidas en un test de inteligencia.
b) Al haber obtenido una diferencia significativa en nuestro estudio, se deduce que el
ambiente en el que se desarrolle un niño no influye en las puntuaciones obtenidas
en un test de inteligencia.
c) Al haber obtenido una diferencia significativa en nuestro estudio, se deduce que el
ambiente en el que se desarrolle un niño influye en las puntuaciones obtenidas en
un test de inteligencia.

22. Se quiere estudiar la incidencia del número de hijos en la intensidad del lazo afectivo de las
madres hacia sus hijos. Tras realizar el muestreo aleatorio apropiado, se obtuvieron tres
grupos de 5 unidades familiares compuestas de madre e hijos, donde el Grupo 1 estaba
compuesto por familias con un hijo, el Grupo 2 por familias con 2 hijos el Grupo 3 por
familias con 3 hijos. Se procuró que las relaciones existentes en las unidades familiares no
fueran patológicas. A continuación, se midió la intensidad del lazo afectivo delas madres
hacia sus hijos en una escala de intervalo, obteniendo las siguientes puntuaciones (a mayor
puntuación, mayor intensidad afectiva):
Grupo 1 Grupo 2 Grupo 3
10 4 9
9 5 10
7 6 8
8 7 7
10 4 6

Sabemos que todas las observaciones son independientes, varianzas homogéneas y las
distribuciones poblacionales normales. Tómese un α=0,05 .
Según los datos y conociendo SCtotal = 59,33 y SCinter = 35,73, el valor muestral del
estadístico de contraste es aproximadamente:
a) 13,21
b) 14,38
c) 9,07

23. El valor crítico atendiendo a los datos del problema 29 es:


a) 3,27
b) 3,88
c) 4,12

3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5

24. ¿Se rechaza H0?:


a) Sí, porque el valor muestral del estadístico de contraste es mayor que 4,12
b) Sí, porque el valor crítico es menor que el valor muestral del estadístico de
contraste
c) Ambas respuestas son correctas.

25. Sabiendo que, Ȳ1= 8,8, Ȳ2= 5,2 y Ȳ3= 8, indique la alternativa correcta a un n.c. del 95%
(según los datos del problema 29):
a) Podemos decir que existen diferencias significativas entre las medias de todas las
poblaciones
b) Podemos decir que existen diferencias significativas entre las medias de las
poblaciones 1 y 2.
c) Podemos decir que existen diferencias significativas entre las medias de las
poblaciones 1 y 2 y entre las medias de las poblaciones 2 y 3.

26. En un análisis de varianza, se acepta la hipótesis alternativa de desigualdad de más de dos


medias si la probabilidad p asociada al estadístico F es:
a) Mayor que α
b) Menor o igual que α
c) Ambas alternativas son incorrectas.

27. Las comparaciones múltiples a posteriori son aquellas que se realizan después de un
análisis de varianza:
a) Si F es significativa.
b) Si F no es significativa.
c) Si p > α

28. Las puntuaciones obtenidas en un test por dos grupos de 10 alumnos cada grupo. Calcule el
estadístico F del análisis de varianza entre los dos grupos, sabiendo que:
SCintra = 1379,6 y g.l. = 18 SCT = 2250,8
a) 11,36
b) 14,57
c) 12,87

29. Una muestra aleatoria de 30 alumnos de un colegio se han repartido, también


aleatoriamente, en grupos iguales para estudiar la influencia de tres situaciones diferentes
de aprendizaje. Sabemos que la suma de los cuadrados de las puntuaciones diferenciales de
todos los alumnos de la muestra es igual a 700. Que la media del primer grupo es 30, la del
segundo grupo 20 y la del tercero 50. Y, sabemos también, que la suma de cuadrados total
supone el 150% de la suma de cuadrados intergrupo.
El resultado del estadístico de contraste del análisis de varianza será (n. c. del 95%):
a) 42,003
b) 27,006
c) 31,005

30. Cuál será el valor crítico atendiendo a los datos del problema anterior?:
a) 4,25
b) 2,18
c) 3,35
31. La interpretación de los resultados es la siguiente:
a) A un nivel de confianza del 95% debemos considerar que los tratamientos
suministrados influyen de forma distinta.
b) A un nivel de confianza del 95% debemos considerar que los tratamientos
suministrados influyen de igual forma.
c) A un nivel de confianza del 95% aceptamos la hipótesis nula.
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5

32. Disponemos de tres grupos de sujetos, uno de niños, otro de niñas y un tercero de adultos.
Se les aplica un test que mide dependencia de campo y los resultados fueron:
Niños Niñas Adult.
6 9 8
5 8 10
6 8 8
4 5 3
3 10 7
5 7 6
4 6 7
4 8 9
5 8 8

Se desea saber si los tres grupos difieren en la variable estudiada y, en caso de que fuese así, si hay
diferencias debidas al género. Para ello, se aportan los siguientes datos:
SCinter = 46,625 y SCT = 104,5 n.c. del 95%.
Teniendo en cuenta estos datos, el valor del estadístico de contraste será:
a) 9,67
b) 8,795
c) 10,152

33. El valor crítico será:


a) 2,57
b) 4,25
c) 3,42

34. La conclusión obtenida a partir de los resultados será:


a) Se acepta la hipótesis nula
b) Con un nivel de confianza del 95%, se ha podido comprobar que hay diferencia
entre los grupos.
c) Se rechaza la hipótesis alternativa.

35. Ahora queremos calcular a qué es debida tal diferencia. Para el cálculo de las
comparaciones múltiples, aplicando la prueba de Scheffé, obtenemos un valor del C.R. de:
a) 0,452
b) 0,2585
c) 2,1748

36. Teniendo en cuenta este resultado, al comparar las medias, podemos concluir:
a) No existe diferencia significativa debida al género
b) Existe diferencia significativa debida al género.
c) No es posible realizar las comparaciones múltiples.

5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 6

TEMA 6: ANÁLISIS DE DATOS EN DISEÑOS INTRASUJETOS

1. La diferencia entre dos observaciones del mismo sujeto:


a) Depende de la diferencia debida a los efectos del tratamiento
b) Depende de la varianza residual o error (efectos incontrolados)
c) “a” y “b” son ciertas.

2. Se pretende estudiar el efecto de un tratamiento, con 5 niveles o dosis diferentes, sobre 10


sujetos. El estadístico de contraste toma un valor F = 29,42 . Para un nivel de confianza del
0,99. Deseamos saber si el tratamiento ha hecho algún efecto sobre los sujetos.
a) Sí, el tratamiento ha hecho efecto, por eso aceptamos la Ho
b) No, el tratamiento no ha hecho efecto, por eso aceptamos la Ho
c) Sí, el tratamiento ha hecho efecto, por eso rechazamos la Ho

3. Según el problema anterior, ahora empleamos 3 niveles de tratamiento y 5 sujetos. El


estadístico obtenido es F = 18,12 El n. c. ahora es del 0,95. Según los datos:
a) Sí, aceptamos la Ho puesto que nuestro estadístico de contraste no arroja diferencias
significativas.
b) Rechazamos la Ho puesto que el tratamiento no ha hecho efecto
c) Rechazamos la Ho puesto que el estadístico de contraste arroja diferencias
significativas.

4. De una muestra de imágenes con el mismo número de puntos (es decir, del mismo tamaño), se
han escogido al azar ocho imágenes diferentes (tomadas en distintas escenas) y se las ha
procesado mediante cuatro algoritmos de emparejamiento (A, B, C, D), con el objeto de ver el
número de emparejamientos incorrectos (EI) que se producía con cada uno y así determinar la
eficacia relativa de los mismos. Teniendo en cuenta un n. c. del 99% y sabiendo que la suma de
cuadrados del tratamiento es 248,5, la suma de cuadrados error es 22 y la suma de cuadrados
total es 341,5, cuál será el valor del estadístico de contraste:
a) 82,833
b) 79,04
c) 64,78

5. El valor crítico obtenido, atendiendo a los datos del problema anterior, será:
a) 4,87
b) 5,54
c) 3,25

6. Con un nivel de confianza del 99% podemos afirmar (según los datos de los problemas 4 y 5):
a) Que todas las medias son iguales
b) Que no existen diferencias significativas entre al menos dos de los algoritmos en
número de emparejamientos incorrectos.
c) Que existen diferencias significativas entre al menos dos de los algoritmos en número
de emparejamientos incorrectos.

7. Se lleva a cabo una investigación para estudiar si las Técnicas de Inoculación de Estrés (TIE)
tienen efecto sobre la ansiedad precompetitiva de los corredores de velocidad. Para ello, se
seleccionaron aleatoriamente 12 atletas de entre todos aquéllos que puntuaron alto en una
batería de tests de ansiedad y se les enseñaron la TIE. Para estudiar el efecto de las TIE se
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 6

tomaron cuatro medidas de ansiedad precompetitiva mediante un cuestionario específico en


cuatro ocasiones: la 1ª fue tomada en una situación de laboratorio antes de enseñarles las TIE
(LA), la 2ª en una situación previa a la competición antes de la TIE (CA), la 3ª en una situación
de laboratorio después de las TIE (LD) y la 4ª en una situación previa a la competición
después de las TIE (CD). Teniendo en cuenta un n.c. del 99% y que la suma de cuadrados del
tratamiento vale 26,25, la suma de cuadrados error vale 52,25 y la suma de cuadrados total
vale 297,25, ¿cuál será el valor del estadístico de contraste?:
a) 4,253
b) 6,147
c) 5,526

8. El valor crítico, según los datos del problema anterior es:


a) 5,53
b) 4,51
c) 3,25

9. Atendiendo a los datos de los dos problemas anteriores, podemos concluir que:
a) Existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.
b) No existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.
c) Se acepta H0

2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 7

TEMA 7 : Diseños con más de dos grupos independientes. Análisis de la varianza con dos
factores completamente aleatorizados

1. El laboratorio de aprendizaje animal dispone de doce ratas de una cierta raza, con las que
realiza un experimento. Posteriormente adquieren otro grupo de doce ratas (de otra raza) y,
tras la realización del mismo experimento, en las mismas condiciones, sospechan que los
resultados son diferentes según con qué grupo de ratas se realice la experiencia.
La prueba consistía en tomar los tiempos que tardaban en travesar un corredor con
recompensa final, después de 1, 2 ó 3 días de privación de comida.
La variable dependiente (tiempos) se distribuye normalmente, además, las observaciones son
independientes y las varianzas homogéneas. (n. c. 95%)
Teniendo en cuenta estos datos, cuál sería el valor crítico para el factor A (tipo de rata):
a) 4,41
b) 3,49
c) 3,55

2. Cuál sería el valor crítico para el factor B (tiempo de privación de comida):


a) 4,35
b) 3,55
c) 3,85

3. Cuál sería el valor crítico para la interacción de ambos factores (AB):


a) 4,35
b) 3,49
c) 3,55

4. Continuando con el problema 1, hemos obtenido las siguientes sumas de cuadrados:


SCA = 73,5 SCB = 312,33 SCAB = 7 SCS/AB = 47
A la luz de los resultados podemos concluir, con respecto al factor A (ratas):
a) No existen diferencias significativas entre los dos grupos de ratas
b) Existen diferencias significativas entre los dos grupos de ratas
c) No se puede calcular porque faltan datos.

5. Teniendo en cuenta las sumas de cuadrados anteriores, podemos concluir en cuanto al factor B
(tiempo de privación):
a) Es necesario realizar las comparaciones múltiples entre 1 y 3 días de privación
b) Se acepta la hipótesis nula, es decir, el estar privadas de alimento tiene efectos sobre el
resultado de las pruebas.
c) Estar privadas de comida 1, 2 ó 3 días influye de forma distinta.

6. Continuando con los datos de los ejercicios anteriores y refiriéndonos al efecto de la


interacción, podemos concluir que:
a) No se da ningún efecto significativo cuando se combinan los dos factores.
b) Se rechaza la hipótesis nula sobre la interacción.
c) No podemos averiguar los efectos, ya que faltan datos.

7. A 12 ratas procedentes de dos camadas (C y D) se las entrena en la ejecución de un


determinado problema en un laberinto. Se las deja durante cierto tiempo alejadas del mismo y
ejecutando otras tareas, y nuevamente se las lleva al laberinto. El investigador quiere probar el
recuerdo del aprendizaje y toma los tiempos de las ratas en esta segunda ejecución del
laberinto. Dado que no tomó los tiempos de esas mismas ratas antes del entrenamiento, toma
un grupo control de otras 12 ratas de las mismas camadas, y les mide los tiempos. Los
resultados fueron, tras calcular las sumas de cuadrados:
SCA = 2,67 SCB = 16,67 SCAB = 20,16 SCS/AB = 101
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 7

Se dan los supuestos de homogeneidad de las varianzas y normalidad. Nc. 95%


Teniendo en cuenta estos datos, el valor del estadístico de contraste para el factor A (ratas) es:
a) 3,30
b) 0,46
c) 0,53

8. Siguiendo con el ejercicio anterior, es estadístico de contraste para el factor B (adiestramiento)


es:
a) 3,30
b) 3,54
c) 0,53

9. Por otro lado, el valor del estadístico de contraste para la interacción sería:
a) 3,99
b) 5,40
c) 1,98

10. Tras realizar el cálculo de los estadísticos, podemos concluir, refiriéndonos al factor A:
a) Existen diferencias significativas entre las ratas.
b) No existen diferencias significativas entre las ratas
c) Aceptamos la hipótesis alternativa.

11. Del mismo modo, podemos concluir acerca del factor B (adiestramiento):
a) Existen diferencias significativas entre los adiestramientos
b) No existen diferencias significativas entre los adiestramientos.
c) Rechazamos la hipótesis nula.

12. En cuanto a la interacción, podemos concluir:


a) Se dan efectos significativos cuando se combinan los dos factores
b) Se rechaza la hipótesis nula de la interacción
c) No se dan efectos significativos cuando se combinan los dos factores.

2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS

GRADO

SOLUCIONES de los TEMAS 1 AL 9

Nº TM-1 TM-2 TM-3 TM-4 TM-5 TM-6 TM-7 TM-8 TM-9 TM-2 TM-1 Nº
1 A B B A C C A C A 47
2 C B C C A C B A C 48
3 C C A A B C C A 49
4 B A C A C B B A 50
5 C B A C B A C B 51
6 A A B A C C A B 52
7 A A A A A C C A 53
8 A C A B B B A C 54
9 C B A A C A A B 55
10 C A C B B B A 56
11 B B A B C B A 57
12 A A B B B C A 58
13 A A A B B C 59
14 B A C A A B 60
15 A B B B A A 61
16 C A A A A A 62
17 A B A C A B 63
18 C A B B C A 64
19 B C C A B A 65
20 C A B A A A 66
21 C A C C C B 67
22 B A C C C A 68
23 A C A B B A 69
24 B A B C B B 70
25 C C C B C A 71
26 B C A A B A 72
27 C B B C A 73
28 B A A A A 74
29 B B C B
30 A A B C
31 C A A A
32 C B A A
33 A C C C
34 A B C B
35 C A A A
36 C C B B
37 B C A
38 C A C
39 B A B
40 C B B
41 B C
42 B A
43 B C
44 C B
45 A B
46 A A
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2

1- Si a medida que aumenta el tamaño de la muestra tanto la varianza de la distribución de


probabilidad de un estimador como su sesgo tiende a cero, decimos que el estimador es: A)
suficiente; B) consistente; C) sesgado.

2- A la probabilidad de rechazar H0 cuando es falsa se la denomina: A) error tipo I; B) nivel de


confianza; C) potencia del contraste.

3- A medida que aumenta el tamaño de la muestra, la distribución muestral de la proporción se


aproxima a una distribución: A) Normal; B) Binomial; C) con grados de libertad.

4- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el


tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.

5- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A) cuya
distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más estrecho
alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza toda la
Información muestral relacionada con el parámetro.

6- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un nivel
de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación; B)
aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.

7- Sean “X” e “Y” dos estimadores de un mismo parámetro, si la distribución de probabilidad de


“X” tiene menor variabilidad que “Y”: A) el estimador “Y” es más eficiente; B) el estimador “X”
es más eficiente; C) el estimador “X” es más suficiente.

8- El nivel de confianza se refiere a: A) La probabilidad de que el parámetro se encuentre dentro


de un intervalo de confianza; B) El valor inverso del error típico; C) La probabilidad de que el
estadístico se encuentre dentro de la distribución muestral del parámetro.

9- En un contraste de hipótesis, la máxima diferencia que cabe esperar por simple azar entre el
valor teórico formulado en la hipótesis nula y el valor empírico obtenido a partir de los datos
de la muestra, recibe el nombre de: A) estadístico de contraste; B) valor crítico; C) nivel crítico.

10- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1; C) El nivel de confianza más nivel significación es igual a 1.

11- ¿Cuál de las siguientes afirmaciones es VERDADERA?: A) Potencia más nivel de confianza es
mayor o igual que uno; B) Error tipo I más error tipo II es igual a 1; C) Nivel de confianza más
nivel crítico p es igual a 1.

12- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula
que es verdadera, se llama: A) nivel crítico p; B) nivel de confianza; C) nivel de significación.

-1-
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2

13- En un contraste de hipótesis, el valor crítico representa: A) la probabilidad de rechazar la


hipótesis nula siendo verdadera; B) la máxima diferencia que cabe esperar entre el valor
teórico formulado en la hipótesis nula y el valor que encontramos en nuestros datos para esa
hipótesis; C) la probabilidad de que siendo cierta la hipótesis nula encontremos unos
resultados como los observados en la muestra o más extremos.

14- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume como
provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los datos
obtenidos en la muestra.

15- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones;
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria
ordinaria.

16- ¿Cuál de las siguientes afirmaciones es VERDADERA? La distribución muestral de un


estadístico: A) proporciona información sobre las características de la muestra siempre que
esta sea representativa de la población; B) proporciona todos los valores que puede asumir
un estadístico junto con la probabilidad de obtener ese valor; C) es normal o tiende a la
normal con independencia del tamaño de la muestra.

17- ¿Cuál de las siguientes afirmaciones es VERDADERA? Desde un punto de vista conceptual, la
potencia de un contraste: A) es el complementario del nivel de confianza; B) disminuye
cuando aumenta el nivel de significación; C) es la sensibilidad de un experimento para
detectar una diferencia significativa cuando la hipótesis nula es falsa.

18- A partir de una población con media 80 y desviación típica 8 ¿Cuánto vale la media y la
desviación típica, respectivamente, de la distribución muestral de la media generada a partir
de muestras de tamaño n = 16?: A) 10 y 2; B) 80 y 2; C) 10 y 8.

19- Si la variable dependiente está medida a nivel ordinal; A) debemos utilizar un contraste no
paramétrico; B) debemos utilizar un contraste paramétrico; C) ninguna de las opciones
anteriores es correcta.

20- El nivel crítico p: A) depende del nivel de confianza; B) es una probabilidad asociada al
estadístico de contraste; C) lo multiplicamos por dos cuando el contraste es unilateral.

21- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

22- Si trabajamos con dos grupos, siendo los tamaños de las muestras: ,
sabemos que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C)
las muestras son independientes.

-2-
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2

23- Partiendo de una población con varianza desconocida, la distribución muestral de la media es
una distribución: A) T de Student con grados de libertad; B) normal; C) Ji-cuadrado con
grados de libertad.

24- El objetivo del análisis inferencial de los datos es: A) realizar un análisis descriptivo de los
datos de la investigación; B) inferir los estadísticos muestrales a partir de lo observado; C)
inferir los parámetros de la población a partir de la información proporcionada por la
muestra.

25- Bajo qué condiciones podemos asumir que la distribución muestral de la proporción es
normal: A) cuando la muestra es grande; B) cuando la variable es cuantitativa continua; C)
sólo cuando es normal la distribución de la variable en la población.

26- Se llama error típico de un estadístico a la desviación típica de: A) el parámetro poblacional; B)
la distribución muestral de este estadístico; C) los datos recogidos en la muestra.

-3-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2

1- Si a medida que aumenta el tamaño de la muestra tanto la varianza de la distribución de


probabilidad de un estimador como su sesgo tiende a cero, decimos que el estimador es: A)
suficiente; B) consistente; C) sesgado.

2- A la probabilidad de rechazar H0 cuando es falsa se la denomina: A) error tipo I; B) nivel de


confianza; C) potencia del contraste.

3- A medida que aumenta el tamaño de la muestra, la distribución muestral de la proporción se


aproxima a una distribución: A) Normal; B) Binomial; C) con grados de libertad.

4- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el


tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.

5- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A) cuya
distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.

6- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un nivel
de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación; B)
aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.

7- Sean “X” e “Y” dos estimadores de un mismo parámetro, si la distribución de probabilidad de


“X” tiene menor variabilidad que “Y”: A) el estimador “Y” es más eficiente; B) el estimador “X”
es más eficiente; C) el estimador “X” es más suficiente.

8- El nivel de confianza se refiere a: A) La probabilidad de que el parámetro se encuentre dentro


de un intervalo de confianza; B) El valor inverso del error típico; C) La probabilidad de que el
estadístico se encuentre dentro de la distribución muestral del parámetro.

9- En un contraste de hipótesis, la máxima diferencia que cabe esperar por simple azar entre el
valor teórico formulado en la hipótesis nula y el valor empírico obtenido a partir de los datos
de la muestra, recibe el nombre de: A) estadístico de contraste; B) valor crítico; C) nivel crítico.

10- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II
es siempre igual a 1; C) El nivel de confianza más nivel significación es igual a 1.

11- ¿Cuál de las siguientes afirmaciones es VERDADERA?: A) Potencia más nivel de confianza es
mayor o igual que uno; B) Error tipo I más error tipo II es igual a 1; C) Nivel de confianza más
nivel crítico p es igual a 1.

12- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula
que es verdadera, se llama: A) nivel crítico p; B) nivel de confianza; C) nivel de significación.

-1-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2

13- En un contraste de hipótesis, el valor crítico representa: A) la probabilidad de rechazar la


hipótesis nula siendo verdadera; B) la máxima diferencia que cabe esperar entre el valor
teórico formulado en la hipótesis nula y el valor que encontramos en nuestros datos para
esa hipótesis; C) la probabilidad de que siendo cierta la hipótesis nula encontremos unos
resultados como los observados en la muestra o más extremos.

14- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume como
provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los datos
obtenidos en la muestra.

15- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones;
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria
ordinaria.

16- ¿Cuál de las siguientes afirmaciones es VERDADERA? La distribución muestral de un


estadístico: A) proporciona información sobre las características de la muestra siempre que
esta sea representativa de la población; B) proporciona todos los valores que puede asumir
un estadístico junto con la probabilidad de obtener ese valor; C) es normal o tiende a la
normal con independencia del tamaño de la muestra.

17- ¿Cuál de las siguientes afirmaciones es VERDADERA? Desde un punto de vista conceptual, la
potencia de un contraste: A) es el complementario del nivel de confianza; B) disminuye
cuando aumenta el nivel de significación; C) es la sensibilidad de un experimento para
detectar una diferencia significativa cuando la hipótesis nula es falsa.

18- A partir de una población con media 80 y desviación típica 8 ¿Cuánto vale la media y la
desviación típica, respectivamente, de la distribución muestral de la media generada a partir
de muestras de tamaño n = 16?: A) 10 y 2; B) 80 y 2; C) 10 y 8.

19- Si la variable dependiente está medida a nivel ordinal; A) debemos utilizar un contraste no
paramétrico; B) debemos utilizar un contraste paramétrico; C) ninguna de las opciones
anteriores es correcta.

20- El nivel crítico p: A) depende del nivel de confianza; B) es una probabilidad asociada al
estadístico de contraste; C) lo multiplicamos por dos cuando el contraste es unilateral.

21- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

22- Si trabajamos con dos grupos, siendo los tamaños de las muestras: ,
sabemos que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C)
las muestras son independientes.

-2-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2

23- Partiendo de una población con varianza desconocida, la distribución muestral de la media es
una distribución: A) T de Student con grados de libertad; B) normal; C) Ji-cuadrado con
grados de libertad.

24- El objetivo del análisis inferencial de los datos es: A) realizar un análisis descriptivo de los
datos de la investigación; B) inferir los estadísticos muestrales a partir de lo observado; C)
inferir los parámetros de la población a partir de la información proporcionada por la
muestra.

25- Bajo qué condiciones podemos asumir que la distribución muestral de la proporción es
normal: A) cuando la muestra es grande; B) cuando la variable es cuantitativa continua; C)
sólo cuando es normal la distribución de la variable en la población.

26- Se llama error típico de un estadístico a la desviación típica de: A) el parámetro poblacional;
B) la distribución muestral de este estadístico; C) los datos recogidos en la muestra.

-3-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

SITUACIÓN 1. Para contrastar la hipótesis de si la edad media de inicio en el consumo de alcohol de los
jóvenes de una determinada comunidad es más tardía que la media de la población general establecida
en 13 años, un investigador utiliza una muestra de 25 jóvenes encontrando que la edad media en su
comunidad es de 14 años con una desviación típica insesgada de 2,8. Asumimos que la variable edad de
inicio en el consumo de alcohol se distribuye normalmente en la población.

1. A partir de la información de la muestra utilizada el intervalo de confianza más aproximado para la


varianza poblacional con un nivel de confianza del 95% es: A) 5,70; 14,41; B) 4,77; 15,17; C) 5,23;
15,13.
2. La hipótesis nula para contrastar la hipótesis sobre la edad media en el consumo de alcohol es:
A) ; B) ; C) .
3. Con los datos de la situación 1, el estadístico de contraste para poner a prueba la media es: A) 2,102;
B) 1,78; C) 1,59.
4. Conforme a los objetivos del investigador y un “alfa”= 0’05, la máxima diferencia que puede
producirse por simple azar, si H0 es cierta, entre la media observada en la muestra y la media
planteada en la hipótesis nula, expresado en unidades de desviación típica es: A) 2,064; B) 1,711; C)
2,79.
5. La interpretación de los resultados obtenidos es que la edad media de inicio en el consumo de
alcohol de los jóvenes de la comunidad: A) es más tardía que la media general con un nivel de
confianza del 95%; B) es más tardía que la media general con un nivel de confianza del 99%; C) no es
más tardía que la media general con un nivel de confianza del 95%.

SITUACIÓN 2. La empresa SND's de sondeos electorales ha pronosticado que el nivel de apoyo que
recibirá el partido X en las próximas elecciones será del 40%. Desde el propio partido X se promueve un
nuevo sondeo con el fin de contrastar la veracidad de esta afirmación. Se elige al azar una muestra
aleatoria de 400 personas, con derecho a voto, de los cuales 128 manifiestan su intención de votar al
partido X.

1. Con un nivel de confianza del 95%, el Intervalo de confianza aproximado de la proporción de


personas que votarán al partido X, es: A) 0,2743; 0,3657; B) 0,352; 0,424; C) 0,318; 0,322.
2. La hipótesis alternativa es; A) ; B) ; C) .
3. El estadístico de contraste es: A) -3,43; B) -3,266; C) -6,67.
4. Con un nivel de confianza del 99%, si los dirigentes del partido X considerasen que Ia proporción de
apoyos no alcanza el valor pronosticado por la empresa SND's, el valor crítico para rechazar la
hipótesis nula, es: A) -2,58; B) 1,64; C) -2,33.
5. Para un contraste bilateral con un nivel de significación de 0,01, la conclusión es: A) Rechazar la
hipótesis nula con un nivel de significación del 0,01; B) No hay evidencias para rechazar la hipótesis
nula con un nivel de significación 0,05; C) No hay evidencias para rechazar la hipótesis nula con un
nivel de significación 0,01.

-1-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

SITUACIÓN 3. “La formación alcanzada por la población adulta española ha mejorado, de forma
continua, en los últimos 10 años. Desde 1998 el porcentaje de españoles de 25 a 64 años que poseen
estudios superiores a los obligatorios ha pasado de 33% al 51% en 2008. En la misma proporción ha
disminuido, por tanto, el porcentaje de españoles que sólo poseen estudios obligatorios, que ha pasado
del 67% en 1998 al 49% en 2008” (Panorama de la Educación. Informe OCDE 2010). Suponga que usted
quiere estudiar si estos datos son los que realmente existen en su Comunidad, para lo que utiliza una
muestra aleatoria de 900 adultos con edades comprendidas entre 25 y 64 años, encontrando que 378
de ellos tienen solo los estudios obligatorios.

1. Si decide trabajar con un nivel de confianza del 95% y se establece el error máximo de estimación en
el 3%, ¿cuál debe ser el tamaño de la muestra?: A) 1040; B) 544; C) 789.

2. Trabajando con un nivel de confianza del 95%, el intervalo de confianza de la proporción de adultos
de su Comunidad que solo tienen estudios obligatorios, se encuentra entre: A) 0,378 y 0,462; B)
0,388 y 0,452; C) 0,376 y 0,461.

3. Si el investigador quiere confirmar que la proporción de adultos de su Comunidad que solo tienen los
estudios obligatorios es significativamente inferior que el indicador de España en 2008, la hipótesis
alternativa es: A) H1: π< 0,49; B) H1: π> 0,49; C) H1: π≤ 0,42.

4. Si el investigador cree que la proporción de adultos que solo tienen los estudios obligatorios es
inferior que el indicador de España en 2008, el estadístico de contraste y el nivel p-crítico para
analizar si la diferencia es estadísticamente significativa es: A) 3,34 (p=0,0008); B) -4,2 (p<0,0002); C)
-2,33 (p=0,0198).

5. Respecto a la hipótesis del investigador analizada en las preguntas anteriores, el investigador


concluye que la proporción de adultos que solo tienen estudios obligatorios en su Comunidad, es: A)
inferior a la del resto de España con un nivel de significación de 0,01; B) la misma que la del resto de
España con un nivel de significación de 0,05; C) superior a la del resto de España con un nivel de
significación de 0,01.

SITUACIÓN 4. “En Educación Primaria, la media de alumnos por clase en los centros públicos de España
(19,7) es más baja que en la OCDE (21,6) y que en la Unión Europea (20,3). En los centros privados
ocurre lo contrario, pues la media en España es de 24,4 frente a 20,8 de media de la OCDE y 19,1 de la
UE”. (Panorama de la Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos
difieren significativamente de los que existen en su Comunidad. Asumiendo que la variable número de
alumnos por clase se distribuye normalmente, selecciona una muestra aleatoria de 100 aulas de
educación primaria en centros públicos, encontrando que la media de alumnos por clase es de 20,9 con
una desviación típica poblacional de 5,8.

1. Trabajando con un nivel de confianza del 95%, el intervalo de confianza para la media de alumnos
por clase en los centros públicos de su Comunidad es: A) 19,98; 21,8; B) 19,4; 22,39; C) 19,76; 22,04.
2. El procedimiento que aplicaría para contrastar si la media de los datos de su Comunidad es
significativamente menor que de la media de la OCDE es: A) la prueba t con n-1 grados de libertad; B)
la prueba z; C) la prueba de chi-cuadrado con n grados de libertad.

-2-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

3. Si se decide trabajar con un nivel de confianza del 95% y se establece un error máximo de estimación
en 1 punto, ¿Cuál debe ser el tamaño de la muestra? A) 129; B) 12923; C) 378.
4. El estadístico de contraste para analizar si la media de alumnos en los centros públicos de su
Comunidad es significativamente mayor que la media de España, toma el valor: A) 1,056; B) 1,261; C)
2,069.
5. Si sospecha que la media de los centros públicos de su Comunidad es significativamente mayor que
la media de España, el nivel p-crítico es: A) p=0,1446; B) p< 0,05; C) p=0,0192.
6. Teniendo en cuenta el estadístico de contraste obtenido ¿cuál de las siguientes sentencias es
verdadera?: A) no hay evidencia suficiente para rechazar que la media de alumnos por clase en los
colegios públicos de la Comunidad es igual a la media de España; B) La media de alumnos por clase
en los colegios públicos de la Comunidad es mayor que la media de España (NC= 95%); C)
rechazamos la hipótesis nula con un nivel de confianza del 99%.
7. Trabajando con un nivel de confianza del 95%, la interpretación del intervalo de confianza para la
media de alumnos por clase en los centros públicos de su Comunidad, le permite afirmar que la
media de su comunidad es: A) significativamente distinta que la de España pero igual que la de la UE;
B) significativamente distinta a la de la OCDE pero igual que la de España; C) significativamente
distinta que la de la UE pero igual que la de la OCDE.

SITUACIÓN 5. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en
estudiantes de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7%
éxtasis. Además, el inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más
tempranas. Así, mientras que en el año 2004 la edad media de inicio para la cocaína era de 15,9 años en
los hombres y 15,7 en las mujeres, en el año 2008 disminuyó a 15,3 años y 15,2, respectivamente
(ENCUESTA ESTATAL SOBRE USO DE DROGAS EN ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los
datos disponibles por un equipo de atención primaria que cubre a un determinado sector de su
municipio indican que en la muestra de 37 jóvenes varones y 41 mujeres atendidos el pasado año, el 8%
habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el consumo de cocaína de
15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 para los
hombres y 1,1 en las mujeres.

1. Bajo el supuesto de que la edad media de los hombres que han consumido cocaína al menos una vez,
es de 15,9 años, el error típico de la distribución muestral de la media es: A) 0,453; B) 0,2166; C)
0,334.
2. Si la hipótesis del investigador es que la edad media de inicio en el consumo de cocaína en los
hombres de su municipio ha disminuido significativamente respecto a los datos del 2004, el
estadístico de contraste es: A) -2,43; B) -2,7; C) -2,3.
3. A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95% ¿cuál es el
tamaño de la muestra necesario para estimar la proporción poblacional de jóvenes de su municipio
que han consumido cocaína al menos una vez con un error máximo de estimación del 2%?: A) 707; B)
1536; C) 978.
4. A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95%, ¿entre qué
valores se encontrará la proporción poblacional de jóvenes de su municipio que han consumido
cocaína al menos una vez?: A) 0,71; 0,88; B) 0,02; 0,14; C) 0,04; 0,12.
5. Con un nivel de confianza del 95%, el intervalo de confianza de la varianza poblacional de la edad de
las mujeres de su municipio que han consumido al menos una vez cocaína es: A) 0,83; 2,03; B) 0,89;
1,87; C) 0,95; 1,23.

-3-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

6. Si desea contrastar la hipótesis de que la varianza poblacional de la edad de las mujeres de su


municipio es mayor que 1, el nivel crítico p que obtiene para tomar una decisión respecto a la H0, es:
A) p > 0,10; B) p < 0,05; C) p > 0,01.

SITUACIÓN 6. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en
estudiantes de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7%
éxtasis. Además, el inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más
tempranas. Así, mientras que en el año 2004 la edad media de inicio para la cocaína era de 15,9 años en
los hombres y 15,7 en las mujeres, en el año 2008 disminuyó a 15,3 años y 15,2, respectivamente
(ENCUESTA ESTATAL SOBRE EL USO DE DROGAS EN ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los
datos disponibles por un equipo de atención primaria que cubre un determinado sector de su municipio
indican que con 41 jóvenes varones y 51 mujeres atendidos el pasado año, el 8% habían consumido
cocaína, al menos un vez, siendo la edad media de inicio en el consumo de cocaína de 15,4 años en los
hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 años y 1,1 años,
respectivamente.
1. Bajo el supuesto de que el 8% de los jóvenes ha consumido cocaína al menos una vez, el error típico
de la distribución muestral de la proporción es: A) 0,901; B) 0,0282; C) 0,0417.
2. Para comprobar si la edad media del inicio en el consumo de cocaína ha disminuido respecto a los
datos del 2004, el estadístico de contraste que aplicaría, es: A) Z porque utilizamos una muestra
grande proveniente de una variable que se distribuye normalmente en la población; B) T porque
desconocemos la varianza y la forma de la distribución poblacional; C) El intervalo de confianza
porque proporciona más información sobre la seguridad al tomar una decisión.
3. Si fijamos un nivel de confianza del 95%, ¿entre qué valores se encontrará la edad media del
consumo de cocaína en las mujeres de su municipio?: A) 14,887; 15,512; B) 14,941; 15,962; C)
14,682; 15,621.
4. Si su hipótesis es que la edad media del inicio en el consumo de cocaína en los hombres de su
municipio ha disminuido respecto a los datos de 2004, el valor del estadístico de contraste que
obtiene es: A) 2,34; B) -3,11; C) -2,43.
5. Si desea contrastar la hipótesis de que la varianza poblacional en la edad de inicio del consumo de
cocaína en los hombres de su municipio es significativamente mayor que 1,1 el nivel crítico p que
obtiene para tomar una decisión respecto a la Ho, es: A) p> 0,10; B) p< 0,025; C) p< 0,01.

SITUACIÓN 7. El Centro de Investigaciones Sociológicas (CIS) realiza constantes estudios sobre la


ideología e intención de voto de los españoles. Uno de los ítems que incluye en sus cuestionarios es el
de la “identificación ideológica”, para lo que se le pide al entrevistado que se ubique ideológicamente en
una escala de 1 a 10 (donde 1 significa extrema izquierda y 10 extrema derecha). En su última encuesta
a la población española la media aritmética obtenida para la variable identificación ideológica fue de un
4,86. Un psicólogo social interesado en estudiar esta temática en su localidad selecciona una muestra
aleatoria formada por 31 sujetos a los que aplica el ítem de identificación ideológica, obteniendo una
media de 5,40 y una cuasi-desviación típica de 1,2. Con esta información, responda a las siguientes
preguntas:

-4-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

1. Con un nivel de confianza del 95%, el tamaño de la muestra necesario para que el error de
estimación de la media en la escala de Identificación ideológica no supere 0,2 puntos, es: a) 150; b)
102; c) 138.
2. Con un nivel de confianza del 95%, el intervalo de confianza aproximado para la media en la escala
de identificación ideológica de los residentes en su localidad es: A) 4,98; 5,82; B) 5,03; 5,76; C) 4,952;
5,847.
3. De acuerdo a los objetivos del psicólogo, la hipótesis nula es: A) ; B) ; C)

4. El procedimiento que aplicaría para probar la hipótesis del psicólogo, es: A) la Prueba Z; B) la prueba t
con n-1 grados de libertad; C) la prueba Chi cuadrado con n-1 grados de libertad.
5. El estadístico de contraste para la hipótesis del psicólogo es: A) 2,352; B) 1,697; C) 2,5.
Si el psicólogo fija un nivel de significación de 0,05 el valor crítico para tomar una decisión respecto a
la hipótesis nula es: A) 1, 697; B) 1,96; C) 2,042.
6. Bajo el supuesto de que la H0 es verdadera, la probabilidad de obtener una muestra con una media
tan alejada o más de 5,39 es: A) p > 0,10; B) p < 0,001; C) p < 0,02.
7. Con los datos originales obtenidos en nuestra muestra, la decisión que toma respecto a la hipótesis
nula es: A) Rechazarla porque, bajo el supuesto de que fuera cierta, la probabilidad de obtener una
muestra con una media de 5,40 o superior es muy pequeña; B) Mantenerla porque el valor absoluto
del estadístico de contraste es menor que el valor absoluto del valor crítico; C) No se puede rechazar
la hipótesis nula.

SITUACIÓN 8. El “Síndrome Jubilación” es la situación que experimentan ciertas personas ante esta
nueva etapa vital con manifestaciones somáticas, psíquicas y sociales negativas que afectan la calidad de
vida del jubilado. Un estudio publicado por el GIE (Grupo de Investigación del Envejecimiento) mediante
una encuesta realizada en el 2006 utilizando una muestra de jubilados con edad media de 77,6 años y
desviación típica de 8,79 años encuentra que las manifestaciones psíquicas más frecuentes eran la
ansiedad (82%), el pesimismo (13,3%) y la depresión (4,7%) y que para el 32% de los expertos
consultados el apoyo psicológico constituye la estrategia de intervención más adecuada para superar
estos estados. Suponga que usted quiere estudiar la situación de los jubilados de su localidad respecto a
este "síndrome", para lo que utiliza una muestra aleatoria de 362 jubilados, con una edad media de 71,2
años y una desviación típica de 12,5 y de los cuales, el 59,8% presenta signos de ansiedad, el 35%
pesimismo y el 5,2% depresión.

1. Utilizando los datos del GIE y con un nivel de confianza del 95%: si le dicen que el intervalo de
confianza de la proporción de jubilados con manifestaciones de depresión, es un valor comprendido
entre 0,0387 (3,87%) y 0,0553 (5,53%), ¿Cuál es el tamaño más aproximado de la muestra que se ha
utilizado?: A) 1348; B) 2500; C) 3481.
2. Utilizando los datos de su estudio y con un nivel de confianza del 95%, la edad media de los jubilados
de su localidad es un valor comprendido, aproximadamente, entre: A) 69,9 y 72,5 años; B) 69,5 y 72,9
años; C) 70,2 y 73,1 años.
3. Con los datos de su estudio y un nivel de confianza del 99%, el intervalo de confianza para la
proporción de jubilados con manifestaciones psíquicas de ansiedad, es: A) 0,557 y 0,639; B) 0,547 y
0,648; C) 0,531 y 0,664.

-5-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

4. Si desea comprobar que la proporción de jubilados de su localidad con manifestaciones psíquicas de


pesimismo es significativamente mayor que el valor 0,133 facilitado por el GIE en el 2006, ¿cuál es,
aproximadamente, el valor del estadístico de contraste que obtendría?: A) 8,77; B) 10,3; C) 12,18.
5. Utilizando la información de su trabajo, si desea comprobar que la proporción de jubilados de su
localidad con manifestaciones psíquicas de pesimismo es significativamente mayor que el valor 0,133
facilitado por el GIE en el 2006, el nivel crítico que obtienes: A) es menor que 0,0002; B) es mayor
que 0,001; C) depende del nivel de confianza.

SITUACIÓN 9. El barómetro del CIS de marzo de 2012 realizado en 240 municipios de 48 provincias
señalaba que el 23,4% estaba en situación de paro y de éstos, a la pregunta ¿Y cree Ud. que es muy
probable, bastante, poco o nada probable que durante los próximos doce meses encuentre Ud. trabajo?,
el 22,6% manifestaba que “bastante probable”, frente al 43,1% que creía que “poco probable” y el
19,2% que “nada probable” y el resto “NS/NC”. Suponga que quiere estudiar si estos resultados se
reproducen actualmente en su localidad, para lo que realiza una encuesta sobre una muestra de 100
personas en situación de paro con una edad media de 39 años y desviación típica de 8,6 años de los
cuales 25 le responden que “bastante probable”, 35 responden que “poco probable” y 20 que “nada
probable” mientras que el resto “no saben o no contestan”.
1. Trabajando con un nivel de confianza del 95% y apoyándose en la distribución chi-cuadrado, el
intervalo de confianza de la varianza de la edad de las personas en situación de paro de su localidad
es un valor comprendido entre: A) 57,08 y 99,65; B) 6,64 y 11,59; C) 59,48 y 100,01.

Con los datos de su encuesta desea comprobar que la proporción de personas en paro que
consideran “poco probable” encontrar trabajo en los próximos doce meses en su localidad es
significativamente menor que el valor 43,1% proporcionados en el estudio del CIS:

2. ¿Cuál sería la hipótesis nula?: A) B) C) .


3. ¿Cuál sería el estadístico de contraste que utilizaría?: A) Z para dos muestras independientes con
varianzas poblacionales conocidas; B) Z como aproximación de la distribución binomial; C) t por
tratarse de una muestra grande con varianza poblacional desconocida.
4. ¿Cuál es el valor aproximado del estadístico de contraste de su hipótesis?: A) -1,70; B) -1,873;
C) -1,63.
5. ¿Cuál es el valor aproximado del nivel crítico?: A) 0,0516; B) 0,0734; C) 0,0307.
6. Su decisión respecto a la hipótesis formulada, es: A) rechazar la H0 con un nivel de confianza del 99%;
B) rechazar la H0 con un nivel de confianza del 95%; C) no se puede rechazar la H0 nula con un nivel
de confianza del 95%.
7. Con los datos de su encuesta y con un nivel de confianza del 95%, el intervalo de confianza para la
proporción de personas en situación de paro que considera “poco o nada probable” encontrar
trabajo en los próximos doce meses, es un valor comprendido entre: A) 0,256 y 0,443; B) 0,122 y
0,278; C) 0,452 y 0,647.
8. Si desea contrastar la hipótesis nula de que la edad media de los parados de su localidad es menor de
40 años, el estadístico de contraste que utilizaría es: A) Z por tratarse de una variable cuantitativa
con distribución normal; B) t por tratarse de una variable normalmente distribuida; C) t por tratarse
de una variable cuantitativa con varianza desconocida en la población.

-6-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

SITUACIÓN 10. Un psicólogo que investiga la percepción del tiempo, considera que dicha
habilidad se encuentra deteriorada en los fumadores durante la retirada de nicotina, para lo
que toma una muestra aleatoria de 41 fumadores a los que somete a una abstinencia de
tabaco con una duración de 24 horas, pidiéndoles que estimen el tiempo transcurrido (en
segundos) en un periodo que, objetivamente, fue de 45 segundos. La media aritmética de la
muestra fue igual a 51 segundos con una cuasivarianza igual a 164. El psicólogo desea
determinar si la abstinencia tiene un impacto negativo sobre la percepción temporal,
provocando que el tiempo se sobre-estime. Nivel de confianza 95%.

1- La hipótesis nula que ha de plantear el psicólogo es: A) ; B) ; C)


.
2- El estadístico de contraste es igual a: A) 1; B) 2; C) 3.
3- El valor crítico es igual a: A) 1,303; B) 1,684; C) 2,2021.
4- Con los datos recogidos, ¿se rechaza la hipótesis nula?: A) Sí, porque el estadístico de
contraste es superior al valor crítico; B) Sí, porque el nivel de significación es menor que el
nivel crítico; C) No, porque el estadístico de contraste es menor que el valor crítico.
5- ¿Es significativo el estadístico de contraste?: A) No; B) Si para un nivel de confianza del 95%,
pero no para un nivel de confianza del 99%; C) Es significativo a un nivel de confianza del 99%.
6- ¿Cuál es el valor del nivel crítico p?: A) 0,005; B) menor que 0,005; C) 0,005 < p < 0,01.
7- Si hemos realizado un estudio donde el nivel crítico ha sido superior a α. A) Mantenemos la
hipótesis nula; B) Rechazamos la hipótesis nula; C) No tenemos información para mantener o
rechazar la hipótesis nula.
8- La probabilidad de mantener H0 falsa se denomina: A) nivel de significación; B) error de tipo II;
C) potencia del contraste.
9- Un estadístico cuyo valor medio es igual al valor de esta característica en la población, se dice
que es; A) eficiente; B) suficiente; C) insesgado.
10- Dados varios estadísticos insesgados para estimar la misma característica poblacional, la mejor
elección es utilizar el estadístico: A) con la desviación típica mas grande; B) con la desviación
típica más pequeña; C) con la media mas grande.

-7-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

SITUACIÓN 1. Para contrastar la hipótesis de si la edad media de inicio en el consumo de alcohol de los jóvenes
de una determinada comunidad es más tardía que la media de la población general establecida en 13 años, un
investigador utiliza una muestra de 25 jóvenes encontrando que la edad media en su comunidad es de 14 años
con una desviación típica insesgada de 2,8. Asumimos que la variable edad de inicio en el consumo de alcohol
se distribuye normalmente en la población.

1. A partir de la información de la muestra utilizada el intervalo de confianza más aproximado para la varianza
poblacional con un nivel de confianza del 95% es: A) 5,70; 14,41; B) 4,77; 15,17; C) 5,23; 15,13.

El intervalo de confianza para la varianza poblacional viene dado por la siguiente expresión:

2
(𝑛 − 1)𝑆𝑛−1 2
(𝑛 − 1)𝑆𝑛−1
2 < 𝜎2 <
𝜒1− 𝛼⁄ 𝜒𝛼2⁄
2 2

Para un nivel de confianza del 95%

2
(𝑛 − 1)𝑆𝑛−1 2
(𝑛 − 1)𝑆𝑛−1
2
2 < 𝜎 < 2
𝜒0,975 𝜒0,025

Buscando en la tabla y sustituyendo:

24 ∙ 2,82 2
24 ∙ 2,82
<𝜎 < → (4,77 < 𝜎 2 < 15,17)
39,3641 12,4012

2. La hipótesis nula para contrastar la hipótesis sobre la edad media en el consumo de alcohol es: A)
𝑯𝟎 : 𝝁 ≤ 𝟏𝟑; B) 𝐻0 : 𝜇 = 13; C) 𝐻0 : 𝜇 ≥ 13

3. Con los datos de la situación 1, el estadístico de contraste para poner a prueba la media es: A) 2,102; B) 1,78;
C) 1,59.
𝑌̅ − 𝜇0 14 − 13
𝑇= = = 1,786
𝑆𝑛−1 2,8
⁄ ⁄
√𝑛 √25

4. Conforme a los objetivos del investigador y un “alfa”= 0’05, la máxima diferencia que puede producirse por
simple azar, si 𝐻0 es cierta, entre la media observada en la muestra y la media planteada en la hipótesis nula,
expresado en unidades de desviación típica es: A) 2,064; B) 1,711; C) 2,79.

Nos piden el valor crítico. El contraste de hipótesis es unilateral derecho, luego tenemos que buscar en la
tabla “t” de Student para 24 grados de libertad (𝑛 − 1), la puntuación que supera una proporción igual a
0’95. La respuesta correcta es “B”.

5. La interpretación de los resultados obtenidos es que la edad media de inicio en el consumo de alcohol de los
jóvenes de la comunidad: A) es más tardía que la media general con un nivel de confianza del 95%; B) es
más tardía que la media general con un nivel de confianza del 99%; C) no es más tardía que la media general
con un nivel de confianza del 95%.

El estadístico de contraste es significativo a un nivel de confianza del 95% (1’786>1’711), pero no es


significativo al nivel de confianza del 99% (1’786<2’492).

-1-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

SITUACIÓN 2: La empresa SND's de sondeos electorales ha pronosticado que el nivel de apoyo que recibirá el
partido X en las próximas elecciones será del 40%. Desde el propio partido X se promueve un nuevo sondeo con
el fin de contrastar la veracidad de esta afirmación. Se elige al azar una muestra aleatoria de 400 personas, con
derecho a voto, de los cuales 128 manifiestan su intención de votar al partido X.

1- Con un nivel de confianza del 95%, el Intervalo de confianza aproximado de la proporción de personas que
votarán al partido X, es: A) 0,2743; 0,3657; B) 0,352; 0,424; C) 0,318; 0,322.

128
La proporción en la muestra es: 𝑝 = 400 = 0,32
Al nivel de confianza del 95%, las puntuaciones típicas son: ±1,96

𝑝(1 − 𝑝)
𝑝 ± 𝑍𝛼⁄2 √
𝑛

0,32(1 − 0,32)
0,32 ± 1,96√ → (0,2743; 0,3657)
400

2- La hipótesis alternativa es; A) 𝐻1 : 𝜋 < 0,40 ; B) 𝑯𝟏 : 𝝅 ≠ 𝟎, 𝟒𝟎; C) 𝐻1 : 𝜋 > 0,40.

El contraste es bilateral porque el enunciado no especifica si el partido X espera unos resultados inferiores o
superiores a los obtenidos por la empresas SND’s. Simplemente, el partido X pretende contrastar la veracidad
de los datos pronosticados por SND’s.

3- El estadístico de contraste es: A) -3,43; B) -3,266; C) -6,67.

𝑝 − 𝜋0 0,32 − 0,40
𝑍= = = −3,266
√𝜋0 (1 − 𝜋0 ) √0,40 ∙ 0,60
𝑛 400

4- Con un nivel de confianza del 99%, si los dirigentes del partido X considerasen que Ia proporción de apoyos
no alcanza el valor pronosticado por la empresa SND's, el valor crítico para rechazar la hipótesis nula, es: A)
-2,58; B) 1,64; C) -2,33.

Marcamos como correctas las opciones A y C, porque esta pregunta puede plantear problemas de
interpretación.

Si nos ceñimos al enunciado planteado para esta situación, el contraste es bilateral. Es decir, inicialmente el
partido X no sabe si el nivel de apoyo que recibirá será superior o inferior al pronosticado por la empresa
SND’s, pero “después” de realizar el estudio, observa que la proporción es inferior a 0,40. En este caso el
valor crítico es -2,58.

Por otro lado, podríamos interpretar que “antes” de realizar el estudio, el partido X considera que la
proporción de apoyos será inferior a la proporción pronosticada por SND’s, por lo que el contraste sería
unilateral y por lo tanto la respuesta correcta sería C.

-2-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

5- Para un contraste bilateral con un nivel de significación de 0,01, la conclusión es: A) Rechazar la hipótesis
nula con un nivel de significación del 0,01; B) No hay evidencias para rechazar la hipótesis nula con un nivel
de significación 0,05; C) No hay evidencias para rechazar la hipótesis nula con un nivel de significación 0,01.

Rechazamos la hipótesis nula al nivel de confianza del 99% porque el estadístico de contraste es menor que el
valor crítico (−3,266 < −2,58), luego la opción A es correcta, siendo las opciones B y C claramente
incorrectas.

SITUACIÓN 3: “La formación alcanzada por la población adulta española ha mejorado, de forma continua, en los
últimos 10 años. Desde 1998 el porcentaje de españoles de 25 a 64 años que poseen estudios superiores a los
obligatorios ha pasado de 33% al 51% en 2008. En la misma proporción ha disminuido, por tanto, el porcentaje
de españoles que sólo poseen estudios obligatorios, que ha pasado del 67% en 1998 al 49% en 2008”
(Panorama de la Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos son los que
realmente existen en su Comunidad, para lo que utiliza una muestra aleatoria de 900 adultos con edades
comprendidas entre 25 y 64 años, encontrando que 378 de ellos tienen solo los estudios obligatorios.

Los datos son:

Estudios Estudios Muestra:


superiores obligatorios 𝑛 = 900 378
1998 33% 67% }→𝑝= = 0,42
378 𝑐𝑜𝑛 𝑒𝑠𝑡𝑢𝑑𝑖𝑜𝑠 𝑜𝑏𝑙𝑖𝑔𝑎𝑡𝑜𝑟𝑖𝑜𝑠 900
2008 51% 49%

1- Si decide trabajar con un nivel de confianza del 95% y se establece el error máximo de estimación en el 3%,
¿cuál debe ser el tamaño de la muestra?: A) 1040; B) 544; C) 789.
2
𝑍1− 𝛼⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) = 0,42 ∙ 0,58 ∙ = 1039,79 ≈ 1040
𝐸2 0,032

2- Trabajando con un nivel de confianza del 95%, el intervalo de confianza de la proporción de adultos de su
Comunidad que solo tienen estudios obligatorios, se encuentra entre: A) 0,378 y 0,462; B) 0,388 y 0,452; C)
0,376 y 0,461.

𝑝(1 − 𝑝) 0,42 ∙ 0,58 0,388


𝑝 ± 𝑍1−𝛼⁄ √ → 0,42 ± 1,96√ →{
2 𝑛 900
0,452

3- Si el investigador quiere confirmar que la proporción de adultos de su Comunidad que solo tienen los
estudios obligatorios es significativamente inferior que el indicador de España en 2008, la hipótesis
alternativa es: A) 𝑯𝟏 : 𝝅 < 𝟎, 𝟒𝟗; B) 𝐻1 : 𝜋 > 0,49; C) 𝐻1 : 𝜋 ≤ 0,42.

La respuesta correcta es “A”, puesto que las hipótesis que debemos plantear son:

𝐻0 : 𝜋 ≥ 0,49
𝐻1 : 𝜋 < 0,49

-3-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

4- Si el investigador cree que la proporción de adultos que solo tienen los estudios obligatorios es inferior que
el indicador de España en 2008, el estadístico de contraste y el nivel crítico p para analizar si la diferencia es
estadísticamente significativa es: A) 3,34 (p=0,0008); B) -4,2 (p<0,0002); C) -2,33 (p=0,0198);

0,42 − 0,49 𝑇𝑎𝑏𝑙𝑎 𝑐𝑢𝑟𝑣𝑎 𝑛𝑜𝑟𝑚𝑎𝑙


𝑍= = −4,20 → 𝑝 < 0,0002
√0,49 ∙ 0,51
900

5- Respecto a la hipótesis del investigador analizada en las preguntas anteriores, el investigador concluye que
la proporción de adultos que solo tienen estudios obligatorios en su Comunidad, es: A) inferior a la del
resto de España con un nivel de significación de 0,01; B) la misma que la del resto de España con un nivel
de significación de 0,05; C) superior a la del resto de España con un nivel de significación de 0,01.

SITUACIÓN 4. “En Educación Primaria, la media de alumnos por clase en los centros públicos de España (19,7)
es más baja que en la OCDE (21,6) y que en la Unión Europea (20,3). En los centros privados ocurre lo contrario,
pues la media en España es de 24,4 frente a 20,8 de media de la OCDE y 19,1 de la UE”. (Panorama de la
Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos difieren significativamente
de los que existen en su Comunidad. Asumiendo que la variable número de alumnos por clase se distribuye
normalmente, selecciona una muestra aleatoria de 100 aulas de educación primaria en centros públicos,
encontrando que la media de alumnos por clase es de 20,9 con una desviación típica poblacional de 5,8.

Los datos del enunciado son:

Media de alumnos por clase


España OCDE UE
Públicos 19,7 21,6 20,3
Privados 24,4 20,8 19,1

Datos de la muestra: 𝑛 = 100, 𝑌̅ = 20,9, 𝜎 = 5,8

1- Trabajando con un nivel de confianza del 95%, el intervalo de confianza para la media de alumnos por clase
en los centros públicos de su Comunidad es: A) 19,98; 21,8; B) 19,4; 22,39; C) 19,76; 22,04.

5,8
20,9 ± 1,96 → (19,76; 22,04)
√100
2- El procedimiento que aplicaría para contrastar si la media de los datos de su Comunidad es
significativamente menor que de la media de la OCDE es: A) la prueba t con n-1 grados de libertad; B) la
prueba z; C) la prueba de chi-cuadrado con n grados de libertad.

La distribución en la población es normal, el nivel de medida de la variable dependiente es de razón y


conocemos la varianza de la población, luego la respuesta correcta es B.

3- Si se decide trabajar con un nivel de confianza del 95% y se establece un error máximo de estimación en 1
punto, ¿Cuál debe ser el tamaño de la muestra? A) 129; B) 12923; C) 378.
2
(𝑍1−𝛼⁄2 ) 1,962
𝑛 = 𝜎2 = 5,82 = 129,23 ≈ 129
𝐸2 12

-4-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

4- El estadístico de contraste para analizar si la media de alumnos en los centros públicos de su Comunidad es
significativamente mayor que la media de España, toma el valor: A) 1,056; B) 1,261; C) 2,069.

𝑌̅ − 𝜇0 20,9 − 19,7
𝑍= 𝜎 = = 2,069 ≈ 2,07
⁄ 𝑛 5,8⁄
√ 10
5- Si sospecha que la media de los centros públicos de su Comunidad es significativamente mayor que la media
de España, el nivel crítico p es: A) p=0,1446; B) p< 0,05; C) p=0,0192.

Acudiendo a la tabla de curva normal, deducimos que la probabilidad de obtener valores iguales o más
extremos que el estadístico de contraste (2,07) es 0,0192, luego la respuesta correcta es C.

6- Teniendo en cuenta el estadístico de contraste obtenido ¿cuál de las siguientes sentencias es verdadera?: A)
no hay evidencia suficiente para rechazar que la media de alumnos por clase en los colegios públicos de la
Comunidad es igual a la media de España; B) La media de alumnos por clase en los colegios públicos de la
Comunidad es mayor que la media de España (NC= 95%); C) rechazamos la hipótesis nula con un nivel de
confianza del 99%.

Los resultados obtenidos son significativos a un nivel de confianza del 95% (2,069 > 1,64), pero no a un nivel
de confianza del 99% (2,069 < 2,33) luego la respuesta correcta es B.

7- Trabajando con un nivel de confianza del 95%, la interpretación del intervalo de confianza para la media de
alumnos por clase en los centros públicos de su Comunidad, le permite afirmar que la media de su
comunidad es: A) significativamente distinta que la de España pero igual que la de la UE; B)
significativamente distinta a la de la OCDE pero igual que la de España; C) significativamente distinta que la
de la UE pero igual que la de la OCDE.

El intervalo de confianza (19,76; 22,04) incluye a la media de la OCDE (21,6) y la media de la UE (20,3), pero
no incluye la media de España (19,7). Luego la respuesta correcta es A.

SITUACIÓN 5. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en estudiantes
de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7% éxtasis. Además, el
inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más tempranas. Así, mientras que en el
año 2004 la edad media de inicio para la cocaína era de 15,9 años en los hombres y 15,7 en las mujeres, en el
año 2008 disminuyó a 15,3 años y 15,2, respectivamente (ENCUESTA ESTATAL SOBRE USO DE DROGAS EN
ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los datos disponibles por un equipo de atención primaria que
cubre a un determinado sector de su municipio indican que en la muestra de 37 jóvenes varones y 41 mujeres
atendidos el pasado año, el 8% habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el
consumo de cocaína de 15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3
para los hombres y 1,1 en las mujeres.

Datos de encuestas estatales: Datos de la muestra:

2009 5,1% Cocaína 2,7% Éxtasis


Edad media consumo de cocaína 𝑛 𝑌̅ 𝑆𝑛
Hombres Mujeres Hombres 37 15,4 1,3 8%
2004 15,9 15,7 Mujeres 41 15,2 1,1 Cocaína
2008 15,3 15,2

-5-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

1- Bajo el supuesto de que la edad media de los hombres que han consumido cocaína al menos una vez, es de
15,9 años, el error típico de la distribución muestral de la media es: A) 0,453; B) 0,2166; C) 0,334.

En el caso de los hombres, el error típico de la distribución cuando no conocemos la varianza poblacional
viene dado por:
𝑆𝑛 1,3
= = 0,2167
√𝑛 − 1 √37 − 1

2- Si la hipótesis del investigador es que la edad media de inicio en el consumo de cocaína en los hombres de
su municipio ha disminuido significativamente respecto a los datos del 2004, el estadístico de contraste es:
A) -2,43; B) -2,7; C) -2,3.

Contraste unilateral de medias para una muestra (varones) varianza poblacional desconocida:
𝑌̅ − 𝜇0 15,4 − 15,9
𝑇= = = −2,31
𝑆𝑛 1,3
√𝑛 − 1 √37 − 1

3- A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95% ¿cuál es el tamaño de
la muestra necesario para estimar la proporción poblacional de jóvenes de su municipio que han consumido
cocaína al menos una vez con un error máximo de estimación del 2%?: A) 707; B) 1536; C) 978.

2
𝑧1− 𝛼⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) 2 = 0,08 ∙ (1 − 0,08) = 706,85 ≈ 707
𝐸𝑚𝑎𝑥 0,022

4- A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95%, ¿entre qué valores se
encontrará la proporción poblacional de jóvenes de su municipio que han consumido cocaína al menos una
vez?: A) 0,71; 0,88; B) 0,02; 0,14; C) 0,04; 0,12.

𝑝(1 − 𝑝) 0,08(1 − 0,08)


𝐸𝑚𝑎𝑥 = 𝑧1−𝛼⁄2 √ = 1,96√ = 0,06
𝑛 37 + 41
0,14
𝑝 ± 𝐸𝑚𝑎𝑥 → 0,08 ± 0,06 {
0,02

5- Con un nivel de confianza del 95%, el intervalo de confianza de la varianza poblacional de la edad de las
mujeres de su municipio que han consumido al menos una vez cocaína es: A) 0,83; 2,03; B) 0,89; 1,87; C)
0,95; 1,23.

𝑛𝑆𝑛2 41 ∙ 1,12 𝑛𝑆𝑛2 41 ∙ 1,12


𝑙𝑖 = 2 = = 0,836 𝑙𝑠 = 2 = = 2,03
𝜒𝑛−1;1−𝛼⁄ 59,3417 𝜒𝑛−1;𝛼⁄ 24,4330
2 2

-6-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

6- Si desea contrastar la hipótesis de que la varianza poblacional de la edad de las mujeres de su municipio es
mayor que 1, el nivel crítico p que obtiene para tomar una decisión respecto a la 𝐻0 , es: A) p > 0,10; B) p <
0,05; C) p > 0,01.
𝑛𝑆𝑛2 41 ∙ 1,12
𝜒2 = 2 = = 49,61
𝜎0 1

Buscando en la Tabla de Chi-cuadrado observamos que para 40 grados de libertad, el valor 49,61 se
encuentra entre las puntuaciones:
29,05 que deja por encima de sí el 0,90 de la distribución
51,80 que deja por encima de sí el 0,10 de la distribución.
Luego sabemos que 49,61 deja por encima una proporción superior a 0,10.

SITUACIÓN 6. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en estudiantes
de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7% éxtasis. Además, el
inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más tempranas. Así, mientras que en el
año 2004 la edad media de inicio para la cocaína era de 15,9 años en los hombres y 15,7 en las mujeres, en el
año 2008 disminuyó a 15,3 años y 15,2, respectivamente (ENCUESTA ESTATAL SOBRE EL USO DE DROGAS EN
ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los datos disponibles por un equipo de atención primaria que
cubre un determinado sector de su municipio indican que con 41 jóvenes varones y 51 mujeres atendidos el
pasado año, el 8% habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el consumo de
cocaína de 15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 años y 1,1
años, respectivamente.

Datos de encuestas estatales: Datos de la muestra:

2009 5,1% Cocaína 2,7% Éxtasis


𝑛 𝑌̅ 𝑆𝑛
Edad media consumo de cocaína
Hombres 41 15,4 1,3 8%
Hombres Mujeres
Mujeres 51 15,2 1,1 Cocaína
2004 15,9 15,7
2008 15,3 15,2

1. Bajo el supuesto de que el 8% de los jóvenes ha consumido cocaína al menos una vez, el error típico de la
distribución muestral de la proporción es: A) 0,901; B) 0,0282; C) 0,0417.

𝑝(1 − 𝑝) 0,08(1 − 0,08)


√ =√ = 0,02828
𝑛 41 + 51

2. Para comprobar si la edad media del inicio en el consumo de cocaína ha disminuido respecto a los datos del
2004, el estadístico de contraste que aplicaría, es: A) Z porque utilizamos una muestra grande proveniente
de una variable que se distribuye normalmente en la población; B) T porque desconocemos la varianza y la
forma de la distribución poblacional; C) El intervalo de confianza porque proporciona más información
sobre la seguridad al tomar una decisión.

-7-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

3. Si fijamos un nivel de confianza del 95%, ¿entre qué valores se encontrará la edad media del consumo de
cocaína en las mujeres de su municipio?: A) 14,887; 15,512; B) 14,941; 15,962; C) 14,682; 15,621.

Nos están pidiendo el intervalo de confianza (con 𝛼 = 0,05) para la edad media del consumo de cocaína en
las mujeres. Este viene dada por las fórmulas:

𝑆𝑛−1 1,1
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 2,009 = 0,3125
√𝑛 √51 − 1

15,5125
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 15,2 ± 0,3125 → {
14,8875

4. Si su hipótesis es que la edad media del inicio en el consumo de cocaína en los hombres de su municipio ha
disminuido respecto a los datos de 2004, el valor del estadístico de contraste que obtiene es: A) 2,34; B) -
3,11; C) -2,43.

Para el grupo de hombres el estadístico de contraste es:

𝑌̅ − 𝜇0 15,4 − 15,9
𝑇= = = −2,4325
𝑆𝑛 1,3
√𝑛 − 1 √41 − 1

5. Si desea contrastar la hipótesis de que la varianza poblacional en la edad de inicio del consumo de cocaína
en los hombres de su municipio es significativamente mayor que 1,1 el nivel crítico p que obtiene para tomar
una decisión respecto a la 𝐻0 , es: A) p> 0,10; B) p< 0,025; C) p< 0,01.

𝑛𝑆𝑛2 4,1 ∙ 1,32


𝜒2 = = = 62,99
𝜎02 1,1

En las tablas (𝑔. 𝑙. = 𝑛 − 1 = 40) no podemos encontrar el valor exacto, pero observamos que el estadístico
de contraste (62,99) se encuentra entre las puntuaciones 59,3417 y 63,6907 que dejan por encima de sí,
respectivamente unas probabilidades iguales a 0,025 y 0,01, luego la opción correcta es B.

SITUACIÓN 7. El Centro de Investigaciones Sociológicas (CIS) realiza constantes estudios sobre la ideología e
intención de voto de los españoles. Uno de los ítems que incluye en sus cuestionarios es el de la “identificación
ideológica”, para lo que se le pide al entrevistado que se ubique ideológicamente en una escala de 1 a 10
(donde 1 significa extrema izquierda y 10 extrema derecha). En su última encuesta a la población española la
media aritmética obtenida para la variable identificación ideológica fue de un 4,86. Un psicólogo social
interesado en estudiar esta temática en su localidad selecciona una muestra aleatoria formada por 31 sujetos a
los que aplica el ítem de identificación ideológica, obteniendo una media de 5,40 y una cuasi-desviación típica
de 1,2. Con esta información, responda a las siguientes preguntas:

-8-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

1- Con un nivel de confianza del 95%, el tamaño de la muestra necesario para que el error de estimación de la
media en la escala de Identificación ideológica no supere 0,2 puntos, es: A) 150; B) 102; C) 138.

2
𝑡𝑛−1;1− 𝛼⁄ 2,0422
2 2
𝑛= 𝑆𝑛−1 2 = 1,22 = 150,11 ≈ 150
𝐸𝑚𝑎𝑥 0,22

2- Con un nivel de confianza del 95%, el intervalo de confianza aproximado para la media en la escala de
identificación ideológica de los residentes en su localidad es: A) 4,98; 5,82; B) 5,03; 5,76; C) 4,952; 5,847.

𝑆𝑛−1 1,2
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 2,042 = 0,44
√𝑛 √31

5,84
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 5,40 ± 0,44 → {
4,96

3- De acuerdo a los objetivos del psicólogo, la hipótesis nula es: A) 𝑯𝟎 : 𝝁 = 𝟒, 𝟖𝟔; B) 𝐻0 : 𝜇 ≥ 4,86; C)
𝐻0 : 𝜇 ≤ 4,86

El contraste es bilateral, porque el psicólogo no parte de una hipótesis previa sobre los resultados de la
muestra.

4- El procedimiento que aplicaría para probar la hipótesis del psicólogo, es: A) la Prueba Z; B) la prueba t con
𝒏 − 𝟏 grados de libertad; C) la prueba Chi cuadrado con 𝑛 − 1 grados de libertad.

Tenemos un contraste sobre una media con una muestra de 31 sujetos y de la población no conocemos la
varianza.

5- El estadístico de contraste para la hipótesis del psicólogo es: A) 2,352; B) 1,697; C) 2,5.

𝑌̅ − 𝜇0 5,40 − 4,86
𝑇= = = 2,51
𝑆𝑛−1 1,2
√𝑛 √31

6- Si el psicólogo fija un nivel de significación de 0,05 el valor crítico para tomar una decisión respecto a la
hipótesis nula es: A) 1, 697; B) 1,96; C) 2,042.

Buscando en las tablas para un contraste bilateral: 𝑔. 𝑙. = 𝑛 − 1 = 30 y 𝛼⁄2 = 0,025

7- Bajo el supuesto de que la 𝐻0 es verdadera, la probabilidad de obtener una muestra con una media tan
alejada o más de 5,39 es: A) p > 0,10; B) p < 0,001; C) p < 0,02.

El valor en las tablas más próximo al estadístico de contraste (𝑇 = 2,51) corresponde a la puntuación 2,457,
que deja por debajo de sí una proporción igual a 0,990 (1 − 0,990 = 0,01 por encima). Como el contraste
es bilateral, se multiplica por dos la probabilidad obtenida en la tabla.

-9-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

8- Con los datos originales obtenidos en nuestra muestra, la decisión que toma respecto a la hipótesis nula es:
A) Rechazarla porque, bajo el supuesto de que fuera cierta, la probabilidad de obtener una muestra con
una media de 5,40 o superior es muy pequeña; B) Mantenerla porque el valor absoluto del estadístico de
contraste es menor que el valor absoluto del valor crítico; C) No se puede rechazar la hipótesis nula.

SITUACIÓN 8: El “Síndrome Jubilación” es la situación que experimentan ciertas personas ante esta nueva etapa
vital con manifestaciones somáticas, psíquicas y sociales negativas que afectan la calidad de vida del jubilado.
Un estudio publicado por el GIE (Grupo de Investigación del Envejecimiento) mediante una encuesta realizada
en el 2006 utilizando una muestra de jubilados con edad media de 77,6 años y desviación típica de 8,79 años
encuentra que las manifestaciones psíquicas más frecuentes eran la ansiedad (82%), el pesimismo (13,3%) y la
depresión (4,7%) y que para el 32% de los expertos consultados el apoyo psicológico constituye la estrategia de
intervención más adecuada para superar estos estados. Suponga que usted quiere estudiar la situación de los
jubilados de su localidad respecto a este "síndrome", para lo que utiliza una muestra aleatoria de 362 jubilados,
con una edad media de 71,2 años y una desviación típica de 12,5 y de los cuales, el 59,8% presenta signos de
ansiedad, el 35% pesimismo y el 5,2% depresión.

Datos del enunciado:


Proporción de:
Apoyo psicológico
Edad Ansiedad Pesimismo Depresión como
Mejor estrategia
GIE 𝑌̅ = 77,6 𝑆𝑛 = 8,79 0,82 0,133 0,047 0,32
𝑌̅ = 71,2 𝑆𝑛 = 12,5
Muestra 0,598 0,35 0,052 -
𝑛 = 362

1- Utilizando los datos del GIE y con un nivel de confianza del 95%: si le dicen que el intervalo de confianza de
la proporción de jubilados con manifestaciones de depresión, es un valor comprendido entre 0,0387 (3,87%)
y 0,0553 (5,53%), ¿Cuál es el tamaño más aproximado de la muestra que se ha utilizado?: A) 1348; B) 2500;
C) 3481.
Conociendo los límites superior e inferior del intervalo de confianza, deducimos fácilmente el error máximo:
𝑙𝑖 = 𝑝 − 𝐸 𝑙𝑠 − 𝑙𝑖 0,0553 − 0,0387
}→𝐸= = = 0,0083
𝑙𝑠 = 𝑝 + 𝐸 2 2
El tamaño de la muestra será igual a:

𝑧𝛼2⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) = 0,047(1 − 0,047) = 2497,73 ≈ 2500
𝐸2 0,00832

2- Utilizando los datos de su estudio y con un nivel de confianza del 95%, la edad media de los jubilados de su
localidad es un valor comprendido, aproximadamente, entre: A) 69,9 y 72,5 años; B) 69,5 y 72,9 años; C)
70,2 y 73,1 años.

12,5
71,2 ± 1,96 → 71,2 ± 1,29 → (69,91; 72,49)
√362 − 1

-10-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

3- Con los datos de su estudio y un nivel de confianza del 99%, el intervalo de confianza para la proporción de
jubilados con manifestaciones psíquicas de ansiedad, es: A) 0,557 y 0,639; B) 0,547 y 0,648; C) 0,531 y 0,664.

0,598(1 − 0,598)
0,598 ± 2,58√ → (0,5315; 0,6645)
362

4- Si desea comprobar que la proporción de jubilados de su localidad con manifestaciones psíquicas de


pesimismo es significativamente mayor que el valor 0,133 facilitado por el GIE en el 2006, ¿cuál es,
aproximadamente, el valor del estadístico de contraste que obtendría?: A) 8,77; B) 10,3; C) 12,18.

𝑝 − 𝜋0 0,35 − 0,133
𝐻0 : 𝜋 ≤ 0,133 𝑧= = = 12,158
𝐻1 : 𝜋 > 0,133 √𝜋0 (1 − 𝜋0 ) √0,133(1 − 0,133)
𝑛 362

5- Utilizando la información de su trabajo, si desea comprobar que la proporción de jubilados de su localidad


con manifestaciones psíquicas de pesimismo es significativamente mayor que el valor 0,133 facilitado por el
GIE en el 2006, el nivel crítico que se obtiene: A) es menor que 0,0002; B) es mayor que 0,001; C) depende
del nivel de confianza.

El estadístico de contraste es un valor muy extremo (z = 12,158). El valor máximo que podemos consultar en
las tablas de curva normal es z = 3,59, que deja por encima de sí una proporción: p = 0,0002

SITUACIÓN 9: El barómetro del CIS de marzo de 2012 realizado en 240 municipios de 48 provincias señalaba
que el 23,4% estaba en situación de paro y de éstos, a la pregunta ¿Y cree Ud. que es muy probable, bastante,
poco o nada probable que durante los próximos doce meses encuentre Ud. trabajo?, el 22,6% manifestaba que
“bastante probable”, frente al 43,1% que creía que “poco probable” y el 19,2% que “nada probable” y el resto
“NS/NC”. Suponga que quiere estudiar si estos resultados se reproducen actualmente en su localidad, para lo
que realiza una encuesta sobre una muestra de 100 personas en situación de paro con una edad media de 39
años y desviación típica de 8,6 años de los cuales 25 le responden que “bastante probable”, 35 responden que
“poco probable” y 20 que “nada probable” mientras que el resto “no saben o no contestan”.

Pregunta: ¿probabilidad de encontrar


Datos de la Situación 1
trabajo en los próximos doce meses?

Bastante Poco Nada NS/NC

CIS 0,234 en paro 0,226 0,431 0,192 0,151

Encuesta investigador 𝑌̅ = 39; 𝑆𝑛 = 8,6; 𝑛 = 100 0,25 0,35 0,20 0,20

-11-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

1- Trabajando con un nivel de confianza del 95% y apoyándose en la distribución chi-cuadrado, el intervalo de
confianza de la varianza de la edad de las personas en situación de paro de su localidad es un valor
comprendido entre: A) 57,08 y 99,65; B) 6,64 y 11,59; C) 59,48 y 100,01.

𝑛𝑆𝑛2 𝑛𝑆𝑛2 100 ∙ 8,62 100 ∙ 8,62


2 < 𝜎2 < → < 𝜎2 < → 57,085 < 𝜎 2 < 99,65
𝜒1− 𝛼⁄ 𝜒𝛼2⁄ 129,5612 74,2219
2 ,𝑛−1 2 ,𝑛−1

Con los datos de su encuesta desea comprobar que la proporción de personas en paro que consideran “poco
probable” encontrar trabajo en los próximos doce meses en su localidad es significativamente menor que el valor
43,1% proporcionados en el estudio del CIS:

2- ¿Cuál sería la hipótesis nula?: A) 𝐻𝑜 : 𝜋 ≤ 0,431; B) 𝑯𝒐 : 𝝅 ≥ 𝟎, 𝟒𝟑𝟏; C) 𝐻𝑜 : 𝜋 = 0,431.


3- ¿Cuál sería el estadístico de contraste que utilizaría?: A) Z para dos muestras independientes con varianzas
poblacionales conocidas; B) Z como aproximación de la distribución binomial; C) t por tratarse de una
muestra grande con varianza poblacional desconocida.
4- ¿Cuál es el valor aproximado del estadístico de contraste de su hipótesis?: A) -1,70; B) -1,873; C) -1,63
𝑝 − 𝜋0 0,35 − 0,431
𝑧= = = −1,636
√𝜋0 (1 − 𝜋0 ) √0,431(1 − 0,431)
𝑛 100
5- ¿Cuál es el valor aproximado del nivel crítico?: A) 0,0516; B) 0,0734; C) 0,0307.
Buscando en las tablas de curva normal la probabilidad de encontrar valores inferiores a: z = -1,63,
comprobamos que la respuesta correcta es A.
6- Su decisión respecto a la hipótesis formulada, es: A) rechazar la 𝐻0 con un nivel de confianza del 99%; B)
rechazar la 𝐻0 con un nivel de confianza del 95%; C) no se puede rechazar la 𝑯𝟎 nula con un nivel de
confianza del 95%.
Los valores críticos para los niveles de confianza del 95 y 99% son, respectivamente: z = -1,64 y z = -2,33, por
lo que no podemos rechazar la hipótesis nula.
7- Con los datos de su encuesta y con un nivel de confianza del 95%, el intervalo de confianza para la
proporción de personas en situación de paro que considera “poco o nada probable” encontrar trabajo en los
próximos doce meses, es un valor comprendido entre: A) 0,256 y 0,443; B) 0,122 y 0,278; C) 0,452 y 0,647.
La proporción de personas que consideran “poco o nada probable” encontrar trabajo es: p = 0,35 + 0,20 =
0,55

0,55(1 − 0,55)
0,55 ± 1,96√ → (0,4525; 0,6475)
100

8- Si desea contrastar la hipótesis nula de que la edad media de los parados de su localidad es menor de 40
años, el estadístico de contraste que utilizaría es: A) Z por tratarse de una variable cuantitativa con
distribución normal; B) t por tratarse de una variable normalmente distribuida; C) t por tratarse de una
variable cuantitativa con varianza desconocida en la población.

-12-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

SITUACIÓN 10. Un psicólogo que investiga la percepción del tiempo, considera que dicha habilidad se
encuentra deteriorada en los fumadores durante la retirada de nicotina, para lo que toma una muestra
aleatoria de 41 fumadores a los que somete a una abstinencia de tabaco con una duración de 24 horas,
pidiéndoles que estimen el tiempo había transcurrido (en segundos) en un periodo que, objetivamente, fue
de 45 segundos. La media aritmética de la muestra fue igual a 51 segundos con una cuasivarianza igual a
164. El psicólogo desea determinar si la abstinencia tiene un impacto negativo sobre la percepción temporal,
provocando que el tiempo se sobre-estime. Nivel de confianza 95%.

1- La hipótesis nula que ha de plantear el psicólogo es: A) 𝑯𝟎 : 𝝁 ≤ 𝟒𝟓; B) 𝐻0 : 𝜇 = 45; C) 𝐻0 : 𝜇 ≥ 45.

Dado que el psicólogo desea comprobar si el tiempo se sobre-estima, hemos de plantear un contraste
unilateral derecho, cuyas hipótesis son:
𝐻0 : 𝜇 ≤ 45
𝐻1 : 𝜇 > 45

2- El estadístico de contraste es igual a: A) 1; B) 2; C) 3.

𝑌̅ − 𝜇0 51 − 45
𝑇= = =3
𝑆𝑛−1 164

√𝑛 41

3- El valor crítico es igual a: A) 1,303; B) 1,684; C) 2,2021.

4- Con los datos recogidos, se rechaza la hipótesis nula: A) Sí, porque el estadístico de contraste es superior al
valor crítico; B) Sí, porque el nivel de significación es menor que el nivel crítico; C) No, porque el estadístico
de contraste es menor que el valor crítico.

5- ¿Es significativo el estadístico de contraste?: A) No; B) Si para un nivel de confianza del 95%, pero no a un
nivel de confianza del 99%; C) Es significativo a un nivel de confianza del 99%.

El estadístico de contraste (𝑇 = 3) supera un nivel de confianza del 95% (3 > 1,684), pero también supera
un nivel de confianza del 99% (3 > 2,423), luego la respuesta correcta es C.

6- ¿Cuál es el valor del nivel crítico p?: A) 0,005; B) menor que 0,005; C) 0,005 < p < 0,01.

El valor más extremo que podemos consultar en las tablas t de Student, para 40 grados de libertad, es 2,704,
que deja por encima de sí una probabilidad igual a: 0,005, luego el estadístico de contraste (𝑇 = 3) que es
todavía más extremo, dejará por encima de sí una probabilidad menor que 0,005

7- Si hemos realizado un estudio donde el nivel crítico ha sido superior a α. A) Mantenemos la hipótesis nula;
B) Rechazamos la hipótesis nula; C) No tenemos información para mantener o rechazar la hipótesis nula.

8- La probabilidad de mantener 𝐻0 falsa se denomina: A) nivel de significación; B) error de tipo II; C) potencia
del contraste.

La probabilidad pedida es el error de tipo II, que también podemos definir como la probabilidad de rechazar
𝐻1 verdadera.

9- Un estadístico cuyo valor medio es igual al valor de esta característica en la población, se dice que es; A)
eficiente; B) suficiente; C) insesgado.

-13-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

10- Dados varios estadísticos insesgados para estimar la misma característica poblacional, la mejor elección es
utilizar el estadístico: A) con la desviación típica mas grande; B) con la desviación típica más pequeña; C) con
la media mas grande.

La respuesta correcta es B, puesto que el estimador con la desviación típica más pequeña es el más eficiente.

-14-
Diseños de experimentos y análisis de datos. Enunciados de preguntas teóricas temas 3 y 4

1- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en


muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas; C) ninguna de las anteriores es correcta.

2- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

3- Si trabajamos con dos grupos siendo los tamaños de las muestras: n1 = 30 y n2 =35, sabemos
que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C) las
muestras son independientes.

4- Para comprobar si la diferencia entre dos medias es significativa, calculamos: A) el estadístico


de contraste; B) el tamaño del efecto; C) las dos opciones anteriores son verdaderas.

5- Si en un contraste unilateral sobre dos medias con varianzas desconocidas obtenemos un


estadístico de contraste “T” igual a cero, podemos deducir que el nivel crítico es: A) 0,5; B) 1;
C) No podemos saber cuál es el valor exacto.

6- Si en un contraste unilateral sobre dos medias con varianzas desconocidas obtenemos un


estadístico de contraste “T” igual a cero, podemos deducir que el nivel crítico es: A) 0,5; B) 1;
C) No podemos saber cuál es el valor exacto.

7- En un contraste sobre dos proporciones con muestras relacionadas, cuál de los siguientes
estadísticos es insensible a la dirección del cambio producido: A) Chi cuadrado de la prueba de
McNemar; B) el estadístico Z; C) no es correcta ninguna de las opciones anteriores.

8- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

9- En el caso de que la variable dependiente estuviese medida en una escala ordinal: A)


habríamos tenido que transformarla a escala de intervalo utilizando puntuaciones Z; B)
tendríamos que haber utilizado un contraste no paramétrico; C) habríamos tenido que utilizar
un ANOVA para el análisis de estos datos.

-1-
Diseños de experimentos y análisis de datos. Preguntas teóricas temas 3 y 4

1- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en


muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas; C) ninguna de las anteriores es correcta.

2- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

3- Si trabajamos con dos grupos siendo los tamaños de las muestras: n1 = 30 y n2 =35, sabemos
que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C) las
muestras son independientes.

4- Para comprobar si la diferencia entre dos medias es significativa, calculamos: A) el estadístico


de contraste; B) el tamaño del efecto; C) las dos opciones anteriores son verdaderas.

5- Si en un contraste unilateral sobre dos medias con varianzas desconocidas obtenemos un


estadístico de contraste “T” igual a cero, podemos deducir que el nivel crítico es: A) 0,5; B) 1;
C) No podemos saber cuál es el valor exacto.

6- Si en un contraste unilateral sobre dos medias con varianzas desconocidas obtenemos un


estadístico de contraste “T” igual a cero, podemos deducir que el nivel crítico es: A) 0,5; B) 1;
C) No podemos saber cuál es el valor exacto.

7- En un contraste sobre dos proporciones con muestras relacionadas, cuál de los siguientes
estadísticos es insensible a la dirección del cambio producido: A) Chi cuadrado de la prueba de
McNemar; B) el estadístico Z; C) no es correcta ninguna de las opciones anteriores.

8- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

9- En el caso de que la variable dependiente estuviese medida en una escala ordinal: A)


habríamos tenido que transformarla a escala de intervalo utilizando puntuaciones Z; B)
tendríamos que haber utilizado un contraste no paramétrico; C) habríamos tenido que utilizar
un ANOVA para el análisis de estos datos.

-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

SITUACIÓN 1. Se pretende comprobar si los profesionales que llevan menos de cinco años en una empresa
(Grupo 1) poseen mayores aspiraciones que las personas que llevan cinco o más años (Grupo 2). Para ello se
entrevista a 32 personas que llevan menos de cinco años y a otras 32 personas que llevan cinco o más años,
todas ellas elegidas al azar. Los resultados mostraron que dentro del primer grupo se identificó a 18 personas
con altas aspiraciones, mientras que en el segundo grupo se identificaron a 14 personas con altas aspiraciones.
Nivel de confianza 95%.

1- La hipótesis alternativa es: A) 𝜋1 − 𝜋2 ≠ 0; B) 𝜋1 − 𝜋2 < 0; C) 𝜋1 − 𝜋2 > 0

2- El valor del estadístico de contraste es: A) 0,5; B) 1; C) 2.

3- El valor crítico es igual a: A) 1,64; B) 1,96; C) 2,33.

4- El nivel crítico p es igual a: A) 0,1587; B) 0’3174; C) 0’8413.

5- La decisión correcta es: A) Rechazar la hipótesis nula porque el nivel crítico p es menor que el nivel de
significación; B) Mantener la hipótesis nula porque el estadístico de contraste es menor que el valor crítico;
C) ninguna de las anteriores es correcta.

6- A un nivel de confianza del 95% concluimos que: A) los profesionales que llevan menos de cinco años
trabajando poseen mayores aspiraciones que el grupo que lleva trabajando 5 o más años; B) los
profesionales que llevan 5 o más años trabajando poseen mayores aspiraciones que el grupo que lleva
menos de 5 años; C) no existen diferencias en cuanto a las aspiraciones profesionales entre los dos grupos.

SITUACIÓN 2. En un estudio cuyo objeto es evaluar el efecto de la música clásica sobre la capacidad de
concentración disponemos de 62 sujetos con los que formamos de manera aleatoria dos grupos de 31 sujetos
cada uno. Al primero de ellos (Grupo 1) se le sometió a una prueba de concentración escuchando música clásica
y al segundo (Grupo 2) se le sometió a la misma prueba en condiciones normales de silencio. La puntuación
media para el Grupo 1 fue de 86 puntos con una cuasivarianza igual a 150. El Grupo 2 obtuvo una media
aritmética igual a 80 puntos y una cuasivarianza igual a 129. Sabiendo que la variable dependiente está medida
en una escala de intervalo, asumiendo varianzas poblacionales iguales y con un nivel de confianza del 9S%
¿podemos afirmar que la media en concentración es superior para el grupo que escuchó música clásica?

1- La hipótesis nula es: A) 𝐻0 : 𝜇1 − 𝜇2 ≤ 0; B) 𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝐻0 : 𝜇1 − 𝜇2 ≥ 0.

2- El valor del estadístico de contraste es, aproximadamente: A) 1,671; B) 2; C) 0,508.

3- El tamaño del efecto es Igual a: A) 1,671; B) 2; C) 0,508.

4- El valor crítico es igual a: A) 1,671; B) 2; C) 0,508.

5- El nivel crítico p es igual a: A) entre 0,05 y 0,10; B) entre 0,05 y 0,95; C) 0,025.

6- Rechazamos la hipótesis nula porque: A) el nivel de significación es menor que el nivel crítico p; B) el
estadístico de contraste es mayor que el valor crítico; C) no rechazamos la hipótesis nula.

-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

SITUACIÓN 3: En una tarea sobre decisión léxica con estímulos visuales en la que se miden tiempos de reacción,
un investigador dispone de una muestra aleatoria de 26 sujetos. Utiliza dos grupos de palabras y parte de la
hipótesis de que los tiempos de reacción serán más cortos ante palabras de alta frecuencia léxica (aquellas que
utilizamos más frecuentemente en el lenguaje, Grupo 1) que ante palabras de baja frecuencia léxica (Grupo 2).
Tras realizar el experimento observa que el tiempo de reacción medio para el Grupo 1 fue igual a 612,04 ms,
mientras que para el Grupo 2 fue igual a 645 ms, siendo la cuasivarianza de las diferencias igual a 6656 ms 2.
Asumiendo que se cumplen los supuestos para realizar un contraste paramétrico, conteste a las siguientes
cuestiones:

1- El nivel de medida de la variable dependiente es: A) ordinal; B) de intervalo; C) de razón.

2- La hipótesis nula es: A) 𝐻0 : 𝜇1 − 𝜇2 ≥ 0; B) 𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝐻0 : 𝜇1 − 𝜇2 ≤ 0.

3- La hipótesis alternativa es: A) 𝐻1 : 𝜇1 − 𝜇2 ≥ 0; B) 𝐻1 : 𝜇1 − 𝜇2 < 0; C) 𝐻1 : 𝜇1 − 𝜇2 > 0.

4- El valor absoluto del estadístico de contraste es: A) 1,708; B) 2,06; C) 2,485.

5- Para un nivel de confianza del 95%, el valor absoluto del valor crítico es: A) 1,708; B) 2,06; C) 2,485.

6- El valor del nivel crítico p es: A) 0,05; B) 0,025; C) 0,01.

7- El resultado del experimento: A) no es significativo; B) es significativo al nivel de confianza del 95%; C) es


significativo al 95% y al 99%.

SITUACIÓN 4: Para comparar la eficacia de dos terapias (“A” y “B”) utilizadas para tratar el trastorno de
personalidad “X”, se toma una muestra aleatoria de 400 personas que sufren el trastorno “X”, formándose dos
grupos al azar de 200 personas cada uno. Al primer grupo se le aplica la terapia “A”, siendo 172 personas las
que se recuperan, mientras que al aplicar la terapia “B” se recuperan 148 personas. Con un nivel de confianza
del 95%, ¿son las dos terapias igualmente eficaces?

1- La hipótesis nula es: A) 𝐻0 : 𝜋𝐴 − 𝜋𝐵 ≤ 0; B) 𝐻0 : 𝜋𝐴 − 𝜋𝐵 = 0; C) 𝐻0 : 𝜋𝐴 − 𝜋𝐵 ≥ 0

2- El valor absoluto del estadístico de contraste es: A) 1,96; B) 2,58; C) 3.

3- El valor absoluto del valor crítico es: A) 1,96; B) 2,58; C) 3.

4- El nivel crítico p es igual a: A) 0,0013; B) 0,0026; C) 0,9987.

5- Rechazamos la hipótesis nula porque: A) El valor absoluto del estadístico de contraste es superior al valor
absoluto del valor crítico; B) el nivel de significación es menor que el nivel de confianza; C) el nivel crítico p es
menor que el nivel de confianza.

6- ¿Se desprende de los resultados obtenidos que las dos terapias son igualmente eficaces? A) Si, porque
hemos aceptado la hipótesis alternativa; B) No, porque los resultados no son significativos; C) No, porque el
valor del estadístico de contraste es estadísticamente significativo.

7- Indique para qué niveles de confianza obtendremos resultados significativos: A) 95% y 99%; B) 99% y 99,9%;
C) para cualquier nivel de confianza.

-2-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

SITUACIÓN 5: En una tarea de reconocimiento de palabras, un investigador mantiene la hipótesis de que los
estudiantes de carreras de “letras” tardarán menos que los estudiantes de “ciencias” en reconocer los estímulos
presentados. Tras seleccionar dos muestras aleatorias de 31 observaciones cada una, y registrar el tiempo de
reacción, obtiene una media aritmética igual a 653,2 ms para el grupo de estudiantes de ciencias (Grupo 1) y de
600 ms para el grupo de estudiantes de letras (Grupo 2), siendo la cuasivarianza igual en ambas muestras, con
un valor de 6200 ms2. Con un nivel de confianza del 95%, conteste a las siguientes cuestiones:

1- Si queremos comprobar si las varianzas de ambas poblaciones son iguales o diferentes, observaremos que el
valor del estadístico de contraste: A) no es significativo; B) es significativo; C) es significativo al nivel de
confianza del 95%, pero no al 99%.

2- Para comprobar la hipótesis del investigador, la hipótesis nula planteada es: A) 𝐻0 : 𝜇1 − 𝜇2 ≥ 0; B)


𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝐻0 : 𝜇1 − 𝜇2 ≤ 0.

3- El valor del estadístico de contraste es: A) 0,6756; B) 1,671; C) 2,66.

4- El valor crítico es igual a: A) 0,6756; B) 1,671; C) 2,66.

5- El tamaño del efecto es igual a: A) 0,6756; B) 1,671; C) 2,66.

6- El nivel crítico p es igual a: A) 0’05; B) 0’01; C) 0’005.

7- Aceptamos la hipótesis alternativa porque: A) el valor del estadístico de contraste es menor que el nivel
crítico p; B) el nivel crítico p es menor que el nivel de significación; C) el nivel crítico p es mayor que el valor
crítico.

8- ¿Podemos concluir que los resultados obtenidos avalan la hipótesis del investigador? A) Si; B) No; C) los
resultados son significativos al nivel de confianza del 95%, pero no del 99%.

SITUACIÓN 6. En un estudio piloto para un nuevo tratamiento contra el SIDA (Thompson, 1991), se midieron
diversas variables en 27 pacientes con SIDA. Entre ellas el número de células T-4 sanguíneas al inicio del
tratamiento y 90 días más tarde. Los resultados fueron: 𝑌̅0 𝑑𝑖𝑎𝑠 = 324; 𝑌̅90 𝑑𝑖𝑎𝑠 = 334,4. Por estudios
anteriores se sabe que la varianza poblacional de las diferencias en el contaje de células T-4 vale 150.
Asumiendo un nivel de confianza del 95%, conteste a las siguientes cuestiones:

1- Se trata de un diseño: A) de dos grupos dependientes; B) de más de dos grupos dependientes; C) de dos
grupos independientes.

2- La hipótesis nula en el caso de las medias es: A) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 = 𝜇90 𝑑𝑖𝑎𝑠 ; B) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 ≥ 𝜇90 𝑑𝑖𝑎𝑠 ; C)
𝐻0 : 𝜋0 𝑑𝑖𝑎𝑠 ≤ 𝜋90 𝑑𝑖𝑎𝑠

3- El valor del estadístico de contraste para comprobar si al inicio del tratamiento los sujetos tienen el mismo
número de células T-4 que al final del mismo es igual a: A) 1,045; B) -4,41; C) 1,841.

4- Los valores críticos que delimitan la zona de aceptación de 𝐻0 son: A) −1,05 𝑦 1,05; B) −1,96 𝑦 1,96; C)
−1,65 𝑦 1,65.

-3-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

5- El investigador: A) acepta 𝐻0 ya que el intervalo de confianza de la media incluye la media de las diferencias
entre ambas muestras; B) rechaza 𝐻0 porque la Z calculada es inferior al valor crítico; C) rechaza 𝐻1 ya que el
estadístico de contraste calculado se encuentra en la zona de rechazo.

6- Si el investigador hubiera vuelto a realizar una nueva medición del número de células T-4 180 días después
de iniciado el tratamiento, deberíamos aplicar como técnica de análisis: A) un ANOVA de medidas
independientes de un factor; B) un ANOVA de dos factores con interacción; C) un ANOVA de medidas
repetidas de un factor con tres niveles.

SITUACIÓN 7. Un psicólogo, sospecha que los alumnos de cuarto de grado (Grupo 1) presentan una media
superior y más variabilidad que los alumnos de primer curso de grado (Grupo 2) en la variable “autoestima”.
Para comprobar estas hipótesis selecciona dos muestras aleatorias de igual tamaño (𝑛1 = 𝑛2 = 31) a las que
aplica un test de autoestima. Los resultados fueron: 𝑌̅1 = 22,16, 𝑆̂12 = 76,42 para el Grupo 1 y 𝑌̅2 = 20,07,
𝑆̂22 = 47,58 para el Grupo 2. Asumiendo un nivel de confianza del 95% conteste a las siguientes cuestiones:

𝜎2 𝜎2 𝜎2
1- La hipótesis nula en el caso de las varianzas es: A) 𝐻0 : 𝜎12 = 1; B) 𝐻0 : 𝜎12 ≤ 1; C) B) 𝐻0 : 𝜎12 ≥ 1
2 2 2

2- El valor del estadístico de contraste para comprobar si los sujetos del Grupo 1 presentan más variabilidad
que los sujetos del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,841.

3- Asumiendo igualdad de varianzas poblacionales, el valor del estadístico de contraste para comprobar si la
media del Grupo 1 es superior a la media del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,671.

4- El nivel crítico en el caso del contraste sobre las varianzas es igual a: A) 0,05; B) 0,10; C) 0,15.

5- El nivel crítico en el caso del contraste sobre las medias es igual a: A) 0,05; B) 0,10; C) 0,15.

6- El tamaño del efecto en el caso del contraste sobre medias es igual a: A) 1,045; B) 0,265; C) 0,15.

7- Nuestro psicólogo mantiene la hipótesis nula: A) Para el contraste de las varianzas pero no para el contraste
de medias; B) Para el contraste de medias pero no para el contraste de varianzas; C) En ambos casos, tanto
en el caso de las medias, como en el caso de las varianzas.

SITUACIÓN 8: El equipo docente de una determinada asignatura quiere comprobar la eficacia de un material
docente nuevo respecto al utilizado en convocatorias anteriores. Selecciona una muestra aleatoria de 64
alumnos, con los que forma dos grupos de igual tamaño también al azar. A los sujetos del Grupo 1 les
proporciona en nuevo material, mientras que los del Grupo 2 trabajan con el material antiguo. El equipo
docente tiene la hipótesis de que con el nuevo material las notas serán más elevadas. Tras el examen de fin de
curso los alumnos del Grupo 1 obtienen una nota media igual a 7, con una cuasivarianza igual a 15, mientras
que para el Grupo 2 la media es igual a 5,2 y la cuasivarianza igual a 17.

1- Si con un nivel de confianza del 95% realizamos un contraste de hipótesis para comprobar si las varianzas
poblacionales son iguales o diferentes, aceptaremos: A) la hipótesis nula; B) la hipótesis alternativa; C) No
podemos saber qué cuasivarianza hay que poner en el numerador del estadístico de contraste.

2- Si realizamos un contraste de hipótesis sobre las medias para comprobar la hipótesis del equipo docente, el
estadístico de contraste vale: A) 2; B) 1,8; C) 1,67.

-4-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

3- El tamaño del efecto es igual a: A) 1,8; B) 0,90; C) 0,45.

4- Con un nivel de confianza del 95%, suponiendo que la hipótesis nula sobre el contraste de medias es cierta,
la probabilidad de obtener un valor igual o superior al estadístico de contraste que hemos obtenido: A) se
encuentra comprendida entre 0,01 y 0,025; B) se encuentra comprendida entre 0,025 y 0,05; C) es igual a
0,05.

5- Si trabajamos con un nivel de confianza del 95%, la probabilidad de rechazar la hipótesis nula suponiendo
que es cierta es igual a: A) se encuentra comprendida entre 0,01 y 0,025; B) es igual a 0,05; C) es igual a 0,95.

6- Tomando de las tablas el valor más próximo para los grados de libertad, el intervalo de confianza para la
diferencia de medias, para un nivel de confianza del 95% viene definido por los valores: A) 0,2 𝑦 3,8; B)
−0,2 𝑦 − 3,8; C) −0,2 𝑦 3,8.

7- El estadístico de contraste obtenido para contrastar la hipótesis del equipo docente: A) no es significativo; B)
Es significativo al nivel de confianza del 99%; C) es significativo al nivel de confianza del 95%.

SITUACIÓN 9: Un psicólogo imparte una conferencia a una muestra de 200 fumadores en la que les expone un
tratamiento para abandonar este hábito. También pregunta a los sujetos, antes y después de la conferencia,
que cuantifiquen en una escala de 0 a 10 si se sienten capaces de dejar de fumar tras recibir el tratamiento,
donde el cero indicaría que no se sienten capaces de ninguna forma y 10 que lo lograrán con absoluta certeza.
Antes de la conferencia, la mitad de los sujetos de la muestra están dispuestos a seguir el tratamiento. Tras la
conferencia, encuentra que 80 personas que estaban dispuestas a seguir la terapia mantienen la idea de
hacerlo, y que otras 80 personas que no estaban dispuestas a seguir la terapia han cambiado de opinión. El
psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia sea mayor tras la
conferencia. Respecto a la pregunta que plantea el psicólogo a los sujetos, se encuentra que aquellos que no se
sentían capaces de dejar de fumar antes de la conferencia obtienen una media superior después de la
conferencia, siendo dicha media un punto superior a la media antes de la conferencia y la cuasidesviación típica
de las diferencias es igual a 5. Con un nivel de confianza del 95%.

1- El valor absoluto del estadístico de contraste “Z” para comprobar la hipótesis del psicólogo es igual a: A)
1,64; B) 2,33; C) 6.

2- Si la hipótesis nula es cierta, la probabilidad de obtener un estadístico de contraste igual o más extremo que
el obtenido: A) es igual a 0,05; B) es igual a 0,95; C) es menor que 0,0002.

3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,64; B) 1,96; C) 2,33.

4- La hipótesis que antes de la conferencia tenía el psicólogo: A) queda confirmada porque mantenemos la
hipótesis nula; B) queda confirmada porque el nivel crítico es menor que el error de tipo I; C) queda
confirmada porque el nivel crítico es mayor que el valor crítico.

Si queremos comprobar que la media de los sujetos que inicialmente no están dispuestos a seguir el
tratamiento es superior después de la conferencia, y con un nivel de confianza del 95%:

5- El valor absoluto del estadístico de contraste es igual a: A) 1,64; B) 1,96; C) 2.

-5-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

6- Si realmente no existen diferencias entre las medias antes y después, la probabilidad del obtener un
estadístico de contraste igual o más extremo que el que proporcionan los datos vale: A) entre 0,10 y 0,05; B)
entre 0,01 y 0,025; C) 0,05.

7- El valor crítico vale, aproximadamente, A) 1,29; B) 1,66; C) 1,984.

8- Podemos afirmar que los sujetos que inicialmente no están dispuestos a seguir el tratamiento inicialmente,
se sienten más seguros de poder dejar de fumar tras la conferencia del psicólogo. A) Sí, porque el nivel
crítico es inferior al nivel de significación; B) Sí, porque el nivel crítico es inferior al nivel de confianza; C) No,
los resultados no son significativos.

SITUACIÓN 10. Un partido político X elabora un vídeo pre-electoral con la intención de incrementar el número
de votos en las siguientes elecciones. Extrae una muestra aleatoria de 200 personas a las que muestra el
vídeo. Antes de verlo 120 personas declararon que no votarían al partido X, 60 de las cuales cambiaron de
opinión tras ver el vídeo, siendo 136 sujetos en total los que manifestaron su intención de votar al partido X
después de ver el vídeo. Con un nivel de confianza del 95%.

1- El valor del estadístico de contraste Z es igual a: A) 1,64; B) 3,20; C) 7.

2- El valor del estadístico de contrate Chi cuadrado es igual a ; A) 10,24; B) 49; C) 1,96.

3- El valor crítico para el estadístico Z es igual a: A) 1,28; B) 1,64; C) 1,96.

4- El valor crítico para el estadístico Chi cuadrado es; A) 5,0239; B) 2,7055; C) 3,8415.

5- El nivel crítico es: A) mayor que 0,001; B) menor que 0,005; C) igual a 0,05.

6- Se rechaza la hipótesis nula porque: A) la probabilidad de encontrar un valor como el estadístico de


contraste o más extremo es muy pequeña; B) no existe error de tipo II; C) No se rechaza la hipótesis nula.

7- A la vista de los resultados, el partido X determina que: A) El vídeo resulta efectivo porque incrementa el
número de votantes del partido X; B) El vídeo no resulta efectivo porque hay pocas personas que cambian
de opinión a favor del partido X; C) El vídeo no resulta efectivo porque se rechaza la hipótesis nula.

8- Si la magnitud del efecto es pequeña: A) la diferencia entre dos medias nunca es significativa; B) la
diferencia entre dos medias siempre es significativa; C) la diferencia entre dos medias puede ser
significativa.

9- El supuesto de homocedasticidad se refiere a: A) las variables X e Y se distribuyen normalmente; B) el


tamaño de la muestra es igual a superior a 30 observaciones; C) igualdad de varianzas en la población.

-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

SITUACIÓN 1. Se pretende comprobar si los profesionales que llevan menos de cinco años en una empresa
(Grupo 1) poseen mayores aspiraciones que las personas que llevan cinco o más años (Grupo 2). Para ello se
entrevista a 32 personas que llevan menos de cinco años y a otras 32 personas que llevan cinco o más años,
todas ellas elegidas al azar. Los resultados mostraron que dentro del primer grupo se identificó a 18 personas
con altas aspiraciones, mientras que en el segundo grupo se identificaron a 14 personas con altas aspiraciones.
Nivel de confianza 95%.

1- La hipótesis alternativa es: A) 𝜋1 − 𝜋2 ≠ 0; B) 𝜋1 − 𝜋2 < 0; C) 𝝅𝟏 − 𝝅𝟐 > 𝟎

2- El valor del estadístico de contraste es: A) 0,5; B) 1; C) 2.

El estadístico de contraste es:

𝑝1 − 𝑝2 𝑛1 𝑝1 + 𝑛2 𝑝2
𝑍= 𝑠𝑖𝑒𝑛𝑑𝑜 𝑃=
1 1 𝑛1 + 𝑛2
√𝑃(1 − 𝑃) ( + )
𝑛1 𝑛2

Primero calculamos P
18 + 14
𝑃= = 0,5
32 + 32

Finalmente:
18 14
𝑍=
𝑝1 − 𝑝2
= 32 − 32 =
0,5625 − 0,4375
=1
1 1 0,125
√𝑃(1 − 𝑃) ( + ) √0,50(1 − 0,50) ( 1 + 1 )
𝑛1 𝑛2 32 32

3- El valor crítico es igual a: A) 1,64; B) 1,96; C) 2,33.

4- El nivel crítico p es igual a: A) 0,1587; B) 0’3174; C) 0’8413.

Acudiendo a la tabla de curva normal, observamos que la probabilidad de encontrar valores superiores a una
puntuación típica igual a 1 es 0’1587.

5- La decisión correcta es: A) Rechazar la hipótesis nula porque el nivel crítico p es menor que el nivel de
significación; B) Mantener la hipótesis nula porque el estadístico de contraste es menor que el valor
crítico; C) ninguna de las anteriores es correcta.

6- A un nivel de confianza del 95% concluimos que: A) los profesionales que llevan menos de cinco años
trabajando poseen mayores aspiraciones que el grupo que lleva trabajando 5 o más años; B) los
profesionales que llevan 5 o más años trabajando poseen mayores aspiraciones que el grupo que lleva
menos de 5 años; C) no existen diferencias en cuanto a las aspiraciones profesionales entre los dos grupos.

SITUACIÓN 2. En un estudio cuyo objeto es evaluar el efecto de la música clásica sobre la capacidad de
concentración disponemos de 62 sujetos con los que formamos de manera aleatoria dos grupos de 31 sujetos
cada uno. Al primero de ellos (Grupo 1) se le sometió a una prueba de concentración escuchando música clásica
y al segundo (Grupo 2) se le sometió a la misma prueba en condiciones normales de silencio. La puntuación
media para el Grupo 1 fue de 86 puntos con una cuasivarianza igual a 150. El Grupo 2 obtuvo una media
aritmética igual a 80 puntos y una cuasivarianza igual a 129. Sabiendo que la variable dependiente está medida
en una escala de intervalo, asumiendo varianzas poblacionales iguales y con un nivel de confianza del 9S%
¿podemos afirmar que la media en concentración es superior para el grupo que escuchó música clásica?

-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

1- La hipótesis nula es: A) 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝟎; B) 𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝐻0 : 𝜇1 − 𝜇2 ≥ 0.

Queremos comprobar si la media es superior para el Grupo 1 (música clásica) que para el Grupo 2 (silencio),
luego la hipótesis alternativa es 𝐻1 : 𝜇1 − 𝜇2 > 0. La hipótesis nula, por lo tanto, es la especificada en la
opción A.

2- El valor del estadístico de contraste es, aproximadamente: A) 1,671; B) 2; C) 0,508.

𝑌̅1 − 𝑌̅2 86 − 80
𝑇= = =2
(𝑛1 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 1 1 √30 ∙ 150 + 30 ∙ 129 ( 1 + 1 )
√ ( + ) 31 + 31 − 2 31 31
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

3- El tamaño del efecto es Igual a: A) 1,671; B) 2; C) 0,508.

𝑌̅1 − 𝑌̅2 86 − 80
𝐷= = = 0,508
(𝑛1 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 √30 ∙ 150 + 30 ∙ 129
√ 31 + 31 − 2
𝑛1 + 𝑛2 − 2

4- El valor crítico es igual a: A) 1,671; B) 2; C) 0,508.

El contraste es unilateral derecho. Buscando en las tablas T de Student para 60 grados de libertad
(𝑛1 + 𝑛2 − 2 = 60) la puntuación que supera una proporción igual a 0,95, comprobamos que la respuesta
correcta es A.

5- El nivel crítico p es igual a: A) entre 0,05 y 0,10; B) entre 0,05 y 0,95; C) 0,025.

Observamos en la tabla T de Student con 60 grados de libertad, que la puntuación 𝑇 = 2 (estadístico de


contraste) deja por debajo de sí una proporción igual a 0,975, luego el nivel crítico p es igual a: 1 − 0,975 =
0,025

6- Rechazamos la hipótesis nula porque: A) el nivel de significación es menor que el nivel crítico p; B) el
estadístico de contraste es mayor que el valor crítico; C) no rechazamos la hipótesis nula.

Claramente la opción correcta es B. La opción A es falsa porque si el nivel de significación es menor que el
nivel crítico mantenemos la hipótesis nula.

SITUACIÓN 3: En una tarea sobre decisión léxica con estímulos visuales en la que se miden tiempos de reacción,
un investigador dispone de una muestra aleatoria de 26 sujetos. Utiliza dos grupos de palabras y parte de la
hipótesis de que los tiempos de reacción serán más cortos ante palabras de alta frecuencia léxica (aquellas que
utilizamos más frecuentemente en el lenguaje, Grupo 1) que ante palabras de baja frecuencia léxica (Grupo 2).
Tras realizar el experimento observa que el tiempo de reacción medio para el Grupo 1 fue igual a 612,04 ms,
mientras que para el Grupo 2 fue igual a 645 ms, siendo la cuasivarianza de las diferencias igual a 6656 ms 2.
Asumiendo que se cumplen los supuestos para realizar un contraste paramétrico, conteste a las siguientes
cuestiones:

-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

1- El nivel de medida de la variable dependiente es: A) ordinal; B) de intervalo; C) de razón.

La variable dependiente es el tiempo de reacción, cuyo nivel de medida es de razón.

2- La hipótesis nula es: A) 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≥ 𝟎; B) 𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝐻0 : 𝜇1 − 𝜇2 ≤ 0.

La respuesta correcta es “A”, debemos de plantear un contraste de hipótesis sobre dos medias para dos
muestras relacionadas, siendo las hipótesis:

𝐻0 : 𝜇1 − 𝜇2 ≥ 0
𝐻1 : 𝜇1 − 𝜇2 < 0

3- La hipótesis alternativa es: A) 𝐻1 : 𝜇1 − 𝜇2 ≥ 0; B) 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 < 𝟎; C) 𝐻1 : 𝜇1 − 𝜇2 > 0.

4- El valor absoluto del estadístico de contraste es: A) 1,708; B) 2,06; C) 2,485.

La respuesta correcta es “B”. El estadístico de contraste es:

𝑌̅1 − 𝑌̅2 612,04 − 645


𝑇= = = −2,06
̂2
√𝑆𝑑 √6656
𝑛 26

5- Para un nivel de confianza del 95%, el valor absoluto del valor crítico es: A) 1,708; B) 2,06; C) 2,485.

Acudiendo a la tabla t de Student, observamos que la respuesta correcta es “A”.

6- El valor del nivel crítico p es: A) 0,05; B) 0,025; C) 0,01.

Acudiendo a la tabla t de Student, observamos que la respuesta correcta es “B”.

7- El resultado del experimento: A) no es significativo; B) es significativo al nivel de confianza del 95%; C) es


significativo al 95% y al 99%.

La respuesta correcta es “B”, puesto que el resultado es significativo para el nivel de confianza del 95%
(−2,06 < −1,708) pero no para el nivel de confianza del 99% (−2,06 > −2,485).

SITUACIÓN 4: Para comparar la eficacia de dos terapias (“A” y “B”) utilizadas para tratar el trastorno de
personalidad “X”, se toma una muestra aleatoria de 400 personas que sufren el trastorno “X”, formándose dos
grupos al azar de 200 personas cada uno. Al primer grupo se le aplica la terapia “A”, siendo 172 personas las
que se recuperan, mientras que al aplicar la terapia “B” se recuperan 148 personas. Con un nivel de confianza
del 95%, ¿son las dos terapias igualmente eficaces?

1- La hipótesis nula es: A) 𝐻0 : 𝜋𝐴 − 𝜋𝐵 ≤ 0; B) 𝑯𝟎 : 𝝅𝑨 − 𝝅𝑩 = 𝟎; C) 𝐻0 : 𝜋𝐴 − 𝜋𝐵 ≥ 0

2- El valor absoluto del estadístico de contraste es: A) 1,96; B) 2,58; C) 3.

Calculamos en primer las proporciones 𝑝1 , 𝑝2 𝑦 𝑃.

172 148 172 + 148


𝑝1 = = 0,86, 𝑝2 = = 0,74, 𝑃 = = 0,80
200 200 400

-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

El estadístico de contraste es:

𝑝1 − 𝑝2 0′ 86 − 0′74
𝑍= = =3
1 1
√𝑃(1 − 𝑃) ( + ) √0,8 ∙ 0,2 ∙ ( 1 + 1 )
𝑛1 𝑛2 200 200

3- El valor absoluto del valor crítico es: A) 1,96; B) 2,58; C) 3.

Según el enunciado hemos de tomar un nivel de confianza del 95% y el contraste es bilateral, luego la
respuesta correcta es A.

4- El nivel crítico p es igual a: A) 0,0013; B) 0,0026; C) 0,9987.

Acudiendo a la tabla de curva normal, observamos que la probabilidad de encontrar valores iguales o más
extremos que 𝑍 = 3 es igual a 0,0013. Como el contraste es bilateral, el nivel crítico es igual a: 𝑝 = 0,0013 ∙
2 = 0,0026.

5- Rechazamos la hipótesis nula porque: A) El valor absoluto del estadístico de contraste es superior al valor
absoluto del valor crítico; B) el nivel de significación es menor que el nivel de confianza; C) el nivel crítico p
es menor que el nivel de confianza.

6- ¿Se desprende de los resultados obtenidos que las dos terapias son igualmente eficaces? A) Si, porque
hemos aceptado la hipótesis alternativa; B) No, porque los resultados no son significativos; C) No, porque el
valor del estadístico de contraste es estadísticamente significativo.

Aceptamos la hipótesis alternativa porque el resultado es significativo (3 > 1,96), luego las dos terapias no
son igualmente eficaces, y por lo tanto la respuesta correcta es C.

7- Indique para qué niveles de confianza obtendremos resultados significativos: A) 95% y 99%; B) 99% y 99,9%;
C) para cualquier nivel de confianza.

Los resultados son significativos al nivel de confianza del 95% (3 > 1,96), también al nivel de confianza del
99% (3 > 2,58), pero no al nivel de confianza del 99,9 (3 < 3,1), luego la respuesta correcta es A.

SITUACIÓN 5: En una tarea de reconocimiento de palabras, un investigador mantiene la hipótesis de que los
estudiantes de carreras de “letras” tardarán menos que los estudiantes de “ciencias” en reconocer los estímulos
presentados. Tras seleccionar dos muestras aleatorias de 31 observaciones cada una, y registrar el tiempo de
reacción, obtiene una media aritmética igual a 653,2 ms para el grupo de estudiantes de ciencias (Grupo 1) y de
600 ms para el grupo de estudiantes de letras (Grupo 2), siendo la cuasivarianza igual en ambas muestras, con
un valor de 6200 ms2. Con un nivel de confianza del 95%, conteste a las siguientes cuestiones:

1- Si queremos comprobar si las varianzas de ambas poblaciones son iguales o diferentes, observaremos que el
valor del estadístico de contraste: A) no es significativo; B) es significativo; C) es significativo al nivel de
confianza del 95%, pero no al 99%.

2- Para comprobar la hipótesis del investigador, la hipótesis nula planteada es: A) 𝐻0 : 𝜇1 − 𝜇2 ≥ 0; B)


𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝟎.

-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

3- El valor del estadístico de contraste es: A) 0,6756; B) 1,671; C) 2,66.

653,2 − 600
𝑇= = 2,66
√30 ∙ 6200 + 30 ∙ 6200 ∙ ( 1 + 1 )
31 + 31 − 2 31 31

4- El valor crítico es igual a: A) 0,6756; B) 1,671; C) 2,66.

Se busca en la tabla de la distribución t con 60 grados de libertad y un nivel de confianza del 95%.

5- El tamaño del efecto es igual a: A) 0,6756; B) 1,671; C) 2,66.

|653,2 − 600|
𝑇= = 0,6756
√30 ∙ 6200 + 30 ∙ 6200
31 + 31 − 2

6- El nivel crítico p es igual a: A) 0’05; B) 0’01; C) 0’005.

7- Aceptamos la hipótesis alternativa porque: A) el valor del estadístico de contraste es menor que el nivel
crítico p; B) el nivel crítico p es menor que el nivel de significación; C) el nivel crítico p es mayor que el valor
crítico.

8- ¿Podemos concluir que los resultados obtenidos avalan la hipótesis del investigador? A) Si; B) No; C) los
resultados son significativos al nivel de confianza del 95%, pero no del 99%.

SITUACIÓN 6. En un estudio piloto para un nuevo tratamiento contra el SIDA (Thompson, 1991), se midieron
diversas variables en 27 pacientes con SIDA. Entre ellas el número de células T-4 sanguíneas al inicio del
tratamiento y 90 días más tarde. Los resultados fueron: 𝑌̅0 𝑑𝑖𝑎𝑠 = 324; 𝑌̅90 𝑑𝑖𝑎𝑠 = 334,4. Por estudios
anteriores se sabe que la varianza poblacional de las diferencias en el contaje de células T-4 vale 150.
Asumiendo un nivel de confianza del 95%, conteste a las siguientes cuestiones:

1- Se trata de un diseño: A) de dos grupos dependientes; B) de más de dos grupos dependientes; C) de dos
grupos independientes.

2- La hipótesis nula en el caso de las medias es: A) 𝑯𝟎 : 𝝁𝟎 𝒅𝒊𝒂𝒔 = 𝝁𝟗𝟎 𝒅𝒊𝒂𝒔; B) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 ≥ 𝜇90 𝑑𝑖𝑎𝑠 ; C)
𝐻0 : 𝜋0 𝑑𝑖𝑎𝑠 ≤ 𝜋90 𝑑𝑖𝑎𝑠

3- El valor del estadístico de contraste para comprobar si al inicio del tratamiento los sujetos tienen el mismo
número de células T-4 que al final del mismo es igual a: A) 1,045; B) -4,41; C) 1,841.

Nos encontramos con un contraste de medias para dos grupos dependientes conociendo la varianza de las
diferencias poblacionales. Luego el estadístico de contraste es:

-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

̅ − 𝜇𝑑
𝐷 324 − 334,4
𝑍= = = −4,41
2
√𝜎𝑑 √150
𝑛 27

4- Los valores críticos que delimitan la zona de aceptación de 𝐻0 son: A) −1,05 𝑦 1,05; B) −𝟏, 𝟗𝟔 𝒚 𝟏, 𝟗𝟔; C)
−1,65 𝑦 1,65.

5- El investigador: A) acepta 𝐻0 ya que el intervalo de confianza de la media incluye la media de las diferencias
entre ambas muestras; B) rechaza 𝑯𝟎 porque la Z calculada es inferior al valor crítico; C) rechaza 𝐻1 ya que
el estadístico de contraste calculado se encuentra en la zona de rechazo.

6- Si el investigador hubiera vuelto a realizar una nueva medición del número de células T-4 180 días después
de iniciado el tratamiento, deberíamos aplicar como técnica de análisis: A) un ANOVA de medidas
independientes de un factor; B) un ANOVA de dos factores con interacción; C) un ANOVA de medidas
repetidas de un factor con tres niveles.

En este caso se estaría midiendo la variable dependiente en los mismos sujetos en tres ocasiones distintas.
Por consiguiente son medidas dependientes y tenemos más de dos: deberíamos utilizar un ANOVA de
medidas dependientes con un factor de tres niveles (medición a 0 días, a 90 días y a 180 días).

SITUACIÓN 7. Un psicólogo, sospecha que los alumnos de cuarto de grado (Grupo 1) presentan una media
superior y más variabilidad que los alumnos de primer curso de grado (Grupo 2) en la variable “autoestima”.
Para comprobar estas hipótesis selecciona dos muestras aleatorias de igual tamaño (𝑛1 = 𝑛2 = 31) a las que
aplica un test de autoestima. Los resultados fueron: 𝑌̅1 = 22,16, 𝑆̂12 = 76,42 para el Grupo 1 y 𝑌̅2 = 20,07,
𝑆̂22 = 47,58 para el Grupo 2. Asumiendo un nivel de confianza del 95% conteste a las siguientes cuestiones:

𝜎2 𝝈𝟐 𝜎2
1- La hipótesis nula en el caso de las varianzas es: A) 𝐻0 : 𝜎12 = 1; B) 𝑯𝟎 : 𝝈𝟏𝟐 ≤ 𝟏; C) B) 𝐻0 : 𝜎12 ≥ 1
2 𝟐 2

2- El valor del estadístico de contraste para comprobar si los sujetos del Grupo 1 presentan más variabilidad
que los sujetos del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,841.

𝑆̂12 76,42
𝐹= = = 1,606
𝑆̂22 47,58

3- Asumiendo igualdad de varianzas poblacionales, el valor del estadístico de contraste para comprobar si la
media del Grupo 1 es superior a la media del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,671.

𝑌̅1 − 𝑌̅2 22,16 − 20,07


𝑇= = = 1,045
(𝑛 ̂ 2 (𝑛 ̂2 √30 ∙ 76,42 + 30 ∙ 47,58 ( 1 + 1 )
√ 1 − 1)𝑆1 + 2 − 1)𝑆2 ( 1 + 1 ) 31 + 31 − 2 31 31
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

4- El nivel crítico en el caso del contraste sobre las varianzas es igual a: A) 0,05; B) 0,10; C) 0,15.

Mirando en las tablas de la F obtenemos un valor de 0,90, es decir, una F = 1,606 con 30 y 30 grados de
libertad, deja por debajo de sí un área de 0,90. Luego el valor pedido es 1- 0,90 = 0,10.

-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

5- El nivel crítico en el caso del contraste sobre las medias es igual a: A) 0,05; B) 0,10; C) 0,15.

En las tablas observamos que un valor de T = 1,045 con 60 grados de libertad deja por debajo de sí el 0,850
del área de la distribución. Luego el valor pedido será 1-0,850 = 0,15 en un contraste unilateral.

6- El tamaño del efecto en el caso del contraste sobre medias es igual a: A) 1,045; B) 0,265; C) 0,15.
|𝑌̅1 − 𝑌̅2 | 22,16 − 20,07
𝑇= = = 0,2654
(𝑛 ̂ 2 (𝑛 ̂2 √30 ∙ 76,42 + 30 ∙ 47,58
√ 1 − 1)𝑆1 + 2 − 1)𝑆2 31 + 31 − 2
𝑛1 + 𝑛2 − 2

7- Nuestro psicólogo mantiene la hipótesis nula: A) Para el contraste de las varianzas pero no para el contraste
de medias; B) Para el contraste de medias pero no para el contraste de varianzas; C) En ambos casos, tanto
en el caso de las medias, como en el caso de las varianzas.

Los niveles críticos para los contrastes F y T son: 0,10 y 0,15 respectivamente, ambos superiores a: 𝛼 = 0,05,
luego se mantiene la hipótesis nula en ambos casos.

SITUACIÓN 8: El equipo docente de una determinada asignatura quiere comprobar la eficacia de un material
docente nuevo respecto al utilizado en convocatorias anteriores. Selecciona una muestra aleatoria de 64
alumnos, con los que forma dos grupos de igual tamaño también al azar. A los sujetos del Grupo 1 les
proporciona en nuevo material, mientras que los del Grupo 2 trabajan con el material antiguo. El equipo
docente tiene la hipótesis de que con el nuevo material las notas serán más elevadas. Tras el examen de fin de
curso los alumnos del Grupo 1 obtienen una nota media igual a 7, con una cuasivarianza igual a 15, mientras
que para el Grupo 2 la media es igual a 5,2 y la cuasivarianza igual a 17.

Tenemos dos muestras independientes con los siguientes datos:


Grupo 1. Material nuevo: 𝑌̅1 = 7 𝑆̂12 = 15 𝑛1 = 32
Grupo 2. Material Antiguo: 𝑌̅2 = 5,2 𝑆̂22 = 17 𝑛2 = 32

1- Si con un nivel de confianza del 95% realizamos un contraste de hipótesis para comprobar si las varianzas
poblacionales son iguales o diferentes, aceptaremos: A) la hipótesis nula; B) la hipótesis alternativa; C) No
podemos saber qué cuasivarianza hay que poner en el numerador del estadístico de contraste.

Las hipótesis y el estadístico de contraste son:

𝐻0 : 𝜎12 = 𝜎22 𝑆̂12 15


𝐹= = = 0,88
𝐻1 : 𝜎12 ≠ 𝜎22 𝑆̂22 17

Para un nivel de confianza del 95%, el valor que nos ofrece la tabla F para 30 grados de libertad en el
numerador y 30 grados de libertad en el denominador (los más próximos a 31) es igual a 1,841, luego los
valores críticos son:

1
𝐹0,025;30;30 = 2,074 = 0,482, 𝐹0,975;30;30 = 2,074

Dado que F = 0,88 se encuentra comprendido entre los valores críticos, aceptamos la hipótesis nula, por lo
que podemos suponer que las varianzas son iguales.

2- Si realizamos un contraste de hipótesis sobre las medias para comprobar la hipótesis del equipo docente, el
estadístico de contraste vale: A) 2; B) 1,8; C) 1,67.

-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

𝑌̅1 − 𝑌̅2 7 − 5,2


𝑇= = = 1,8
(𝑛 − 1)𝑆̂12 + (𝑛2 − 1)𝑆̂22 1 1 √31 ∙ 15 + 31 ∙ 17 ( 1 + 1 )
√ 1 ( + ) 62 32 32
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

3- El tamaño del efecto es igual a: A) 1,8; B) 0,90; C) 0,45.

|𝑌̅1 − 𝑌̅2 | |7 − 5,2|


𝑑= = = 0,45
(𝑛 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 √31 ∙ 15 + 31 ∙ 17
√ 1 62
𝑛1 + 𝑛2 − 2

4- Con un nivel de confianza del 95%, suponiendo que la hipótesis nula sobre el contraste de medias es cierta,
la probabilidad de obtener un valor igual o superior al estadístico de contraste que hemos obtenido: A) se
encuentra comprendida entre 0,01 y 0,025; B) se encuentra comprendida entre 0,025 y 0,05; C) es igual a
0,05.
Nos piden calcular el nivel crítico. Buscando en las tablas para 60 grados de libertad (los más próximos a 62),
observamos que el estadístico de contraste obtenido (T =1,8), se encuentra comprendido entre los valores
1,671 y 2, que dejan por encima de sí las probabilidades: 0,05 y 0,025.

5- Si trabajamos con un nivel de confianza del 95%, la probabilidad de rechazar la hipótesis nula suponiendo
que es cierta es igual a: A) se encuentra comprendida entre 0,01 y 0,025; B) es igual a 0,05; C) es igual a 0,95.

Nos preguntan por el nivel de significación, la respuesta correcta es B.

6- Tomando de las tablas el valor más próximo para los grados de libertad, el intervalo de confianza para la
diferencia de medias, para un nivel de confianza del 95% viene definido por los valores: A) 0,2 𝑦 3,8; B)
−0,2 𝑦 − 3,8; C) −𝟎, 𝟐 𝒚 𝟑, 𝟖.

(𝑛1 − 1)𝑆̂12 + (𝑛2 − 1)𝑆̂22 1 1


(𝑌̅1 − 𝑌̅2 ) ± 𝑡1−𝛼⁄ ;𝑛 +𝑛 −2 √ ( + ) → (7 − 5,2) ± 2 ∙ 1 → (−0,2; 3,8)
2 1 2
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

7- El estadístico de contraste obtenido para contrastar la hipótesis del equipo docente: A) no es significativo; B)
Es significativo al nivel de confianza del 99%; C) es significativo al nivel de confianza del 95%.

El contraste que hemos de aplicar es unilateral derecho y el estadístico de contraste es: T = 1,8. Este valor
supera al valor crítico t = 1,671 (NC = 95%), pero no supera al valor crítico t = 2,390 (NC=99%).

SITUACIÓN 9: Un psicólogo imparte una conferencia a una muestra de 200 fumadores en la que les expone un
tratamiento para abandonar este hábito. También pregunta a los sujetos, antes y después de la conferencia,
que cuantifiquen en una escala de 0 a 10 si se sienten capaces de dejar de fumar tras recibir el tratamiento,
donde el cero indicaría que no se sienten capaces de ninguna forma y 10 que lo lograrán con absoluta certeza.
Antes de la conferencia, la mitad de los sujetos de la muestra están dispuestos a seguir el tratamiento. Tras la
conferencia, encuentra que 80 personas que estaban dispuestas a seguir la terapia mantienen la idea de
hacerlo, y que otras 80 personas que no estaban dispuestas a seguir la terapia han cambiado de opinión. El
psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia sea mayor tras la
conferencia. Respecto a la pregunta que plantea el psicólogo a los sujetos, se encuentra que aquellos que no se

-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

sentían capaces de dejar de fumar antes de la conferencia obtienen una media superior después de la
conferencia, siendo dicha media un punto superior a la media antes de la conferencia y la cuasidesviación típica
de las diferencias es igual a 5. Con un nivel de confianza del 95%.

Con los datos aportados en la Situación 2 podemos construir la siguiente tabla:

Después de la conferencia
SI NO
Antes de la SI a = 80 b = 20 100
conferencia NO c = 80 d =20 100
160 40 200

1- El valor absoluto del estadístico de contraste “Z” para comprobar la hipótesis del psicólogo es igual a: A)
1,64; B) 2,33; C) 6.

Para comprobar la hipótesis del psicólogo realizamos un contraste de hipótesis para dos proporciones con
muestras relacionadas. Para calcular el estadístico de contraste “Z” nos fijamos en los sujetos que han
cambiado de opinión (casillas b y c de la tabla)
𝑏−𝑐 20 − 80
𝑍= = = −6
√𝑏 + 𝑐 √20 + 80

2- Si la hipótesis nula es cierta, la probabilidad de obtener un estadístico de contraste igual o más extremo que
el obtenido: A) es igual a 0,05; B) es igual a 0,95; C) es menor que 0,0002.

Tenemos que calcular el nivel crítico. El estadístico de contraste es muy extremo, superior al valor mayor que
podemos consultar en las tablas (Z = 3,59, que deja por encima de sí una proporción igual a 0,0002), por lo
que la respuesta correcta es C.

3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,64; B) 1,96; C) 2,33.
Como el psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia se mayor
tras la conferencia, el contraste es unilateral. Buscando en las tablas de curva normal para NC = 95%,
comprobamos que la respuesta correcta es A.

4- La hipótesis que antes de la conferencia tenía el psicólogo: A) queda confirmada porque mantenemos la
hipótesis nula; B) queda confirmada porque el nivel crítico es menor que el error de tipo I; C) queda
confirmada porque el nivel crítico es mayor que el valor crítico.

Si queremos comprobar que la media de los sujetos que inicialmente no están dispuestos a seguir el
tratamiento es superior después de la conferencia, y con un nivel de confianza del 95%:

5- El valor absoluto del estadístico de contraste es igual a: A) 1,64; B) 1,96; C) 2.


̅ − 𝜇𝑑 1 − 0
𝐷
𝑇= = =2
̂𝑑2
𝑆 5 2
√ √
𝑛 100

6- Si realmente no existen diferencias entre las medias antes y después, la probabilidad del obtener un
estadístico de contraste igual o más extremo que el que proporcionan los datos vale: A) entre 0,10 y 0,05; B)
entre 0,01 y 0,025; C) 0,05.

Los grados de libertad son: n – 1 = 100 – 1 = 99. En las tablas consultamos para 100 grados de libertad que
son los más próximos. Observamos que el estadístico de contraste se encuentra entre los valores 1,984 y

-9-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

2,364, que dejan por encima de sí, respectivamente, las proporciones: 0,025 y 0,01, luego la respuesta
correcta es B.

7- El valor crítico vale, aproximadamente, A) 1,29; B) 1,66; C) 1,984.


Para un nivel de confianza del 95% y 100 grados de libertad, comprobamos que la respuesta correcta es B.

8- Podemos afirmar que los sujetos que inicialmente no están dispuestos a seguir el tratamiento inicialmente,
se sienten más seguros de poder dejar de fumar tras la conferencia del psicólogo. A) Sí, porque el nivel
crítico es inferior al nivel de significación; B) Sí, porque el nivel crítico es inferior al nivel de confianza; C) No,
los resultados no son significativos.

SITUACIÓN 10. Un partido político X elabora un vídeo pre-electoral con la intención de incrementar el número
de votos en las siguientes elecciones. Extrae una muestra aleatoria de 200 personas a las que muestra el
vídeo. Antes de verlo 120 personas declararon que no votarían al partido X, 60 de las cuales cambiaron de
opinión tras ver el vídeo, siendo 136 sujetos en total los que manifestaron su intención de votar al partido X
después de ver el vídeo. Con un nivel de confianza del 95%.

En primer lugar completamos la tabla con los datos del enunciado:

Después
SI NO
SI a = 76 b=4 80
Antes
NO c = 60 d = 60 120
136 64 200

1- El valor absoluto del estadístico de contraste Z es igual a: A) 1,64; B) 3,20; C) 7.


𝑏−𝑐 4 − 60
𝑍= = = −7
√𝑏 + 𝑐 √4 + 60

2- El valor del estadístico de contrate Chi cuadrado es igual a; A) 10,24; B) 49; C) 1,96.

(𝑏 − 𝑐)2 (4 − 60)2
𝜒2 = = = 49
𝑏+𝑐 4 + 60

3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,28; B) 1,64; C) 1,96.
Buscando en la tabla de curva normal la puntuación típica que supera una proporción igual a 0,05,
observamos que la respuesta correcta es B.

4- El valor crítico para el estadístico Chi cuadrado es; A) 5,0239; B) 2,7055; C) 3,8415.
Buscando en la tabla de 𝜒 2 para un grado de libertad la puntuación que supera una proporción igual a
0,05, observamos que la respuesta correcta es C.

-10-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

5- El nivel crítico es: A) mayor que 0,001; B) menor que 0,005; C) igual a 0,05.

Tomando el estadístico de contraste Z y consultando las tablas de curva normal, observamos que la
puntuación más extrema que podemos consultar es igual a 3,59, que deja por encima de sí una
proporción igual a 0,0002, por lo que la respuesta correcta es B.

6- Se rechaza la hipótesis nula porque: A) la probabilidad de encontrar un valor como el estadístico de


contraste o más extremo es muy pequeña; B) no existe error de tipo II; C) No se rechaza la hipótesis
nula.

7- A la vista de los resultados, el partido X determina que: A) El vídeo resulta efectivo porque incrementa el
número de votantes del partido X; B) El vídeo no resulta efectivo porque hay pocas personas que
cambian de opinión a favor del partido X; C) El vídeo no resulta efectivo porque se rechaza la hipótesis
nula.

Rechazamos la hipótesis nula, luego la respuesta correcta es A.

8- Si la magnitud del efecto es pequeña: A) la diferencia entre dos medias nunca es significativa; B) la
diferencia entre dos medias siempre es significativa; C) la diferencia entre dos medias puede ser
significativa.

Aunque la magnitud del efecto sea pequeña, si el tamaño de las muestras es grande, podemos obtener
resultados significativos

9- El supuesto de homocedasticidad se refiere a: A) las variables X e Y se distribuyen normalmente; B) el


tamaño de la muestra es igual a superior a 30 observaciones; C) igualdad de varianzas en la población.

-11-
Cuestiones y ejercicios del Tema 5:

1.- Las varianzas intergrupos e intragrupos son:


A) Independientes; B) Dependientes; C) Controladas
2.- El estimador insesgado de la varianza poblacional en el análisis de
varianza es:
A) Media cuadrática intra sujetos; B) Media cuadrática inter sujetos; C)
Suma de cuadrados inter sujetos
3.- Un modelo aleatorio de análisis de varianza es aquel en que:
A) El azar determina los valores de la variable dependiente;
B) Los niveles de la variable independiente actúan como una muestra de
todos los posibles niveles que se pudiesen establecer;
C) Los niveles de la variable dependiente son al azar, no los fija el
investigador.
4.- El estadístico de contraste en el análisis de varianza se distribuye según
la distribución:
A) Normal; B) F de Snedecor; C) Chi cuadrado.
5.- El cometido del Análisis de Varianza es:
A)Minimizar el error experimental;
B) Maximizar los efectos del factor estudiado;
C) Discernir qué variabilidad corresponde al factor estudiado y cuál al error
experimental.
6.- En el análisis de varianza, llamamos factor a:
A) La/s variable/s independiente/s;
B) La/s variable/s dependiente/s;
C) La/s variables extrañas.
7.- MCinter es un estimador:
A) Sesgado de la varianza poblacional;
B) Insesgado de la varianza poblacional;
C) Insesgado de la media poblacional.
8.- La varianza intragrupos es la varianza atribuible:
A) Al error experimental;
B) Tanto al error experimental como a los distintos niveles del factor
estudiado;
C) A los distintos niveles del factor estudiado.
9.- En el análisis de varianza, cada nivel del factor es:
A) Una categoría de la variable dependiente;
B) Una categoría de la variable independiente;
C) Cada una de las variables independiente.
10.- En el razonamiento del análisis de varianza se supone que dentro de
un mismo nivel las puntuaciones deberían ser:
A) Semejantes; B) Correlacionadas; C) Diferentes.

Ejercicio 1.- Una muestra aleatoria de 30 alumnos de un colegio se han


repartido, también aleatoriamente, en grupos iguales para estudiar la
influencia de tres situaciones diferentes de aprendizaje (A, B y C).
Sabemos que, tras el aprendizaje, la suma de los cuadrados de las
puntuaciones diferenciales de todos los alumnos de la muestra es igual a
700. Que la media del grupo A es 30, la del grupo B es 20 y la del grupo C
es 50. Y, sabemos también, que la suma de cuadrados total supone el 150
por 100 de la suma de cuadrados intergrupos.
Realice un análisis de varianza e interprete los resultados.

Ejercicio 2.- Disponemos de tres grupos de sujetos: uno de niños, otro de


niñas y un tercero de adultos. Se les aplica un test que mide dependencia de
campo y los resultados fueron:

niños niñas adultos


6 9 8
5 8 10
6 8 8
4 5 3
3 10 7
5 7 6
4 6 7
4 8 9
5 8

Se desea saber si los tres grupos difieren en la variable estudiada y, caso de


que fuese así, si hay diferencias debidas al género.

Ejercicio 3.- Se desea saber si diferentes tiempos de deprivación


alimenticia afectan por igual a la velocidad con que las ratas recorren un
laberinto en cuya meta reciben, sistemáticamente, una cantidad igual de
comida.
Para ello se toma una muestra de 32 ratas macho y se distribuyen,
aleatoriamente, en cuatro grupos a los que se somete a diferentes tiempos
de deprivación. Grupo A = 5 horas; B = 10 horas; C = 15 horas y D = 20
horas.
Pasado ese tiempo se sitúa a cada rata en la salida del laberinto y se registra
el tiempo que tarda en llegar a la meta. Los tiempos medios y las
desviaciones típicas de esos tiempos, para cada grupo, aparecen a
continuación:

Grupo A Grupo B Grupo C Grupo D


Media 10.5 12.5 13 15
Desviación típica 3 4 3.5 4.5

¿Se puede afirmar, con un nivel de confianza del 95%, que los tiempos
medios de los grupos son iguales?
Cuestiones y ejercicios del Tema 5: SOLUCIONES

1.- Las varianzas intergrupos e intragrupos son:


A) Independientes; B) Dependientes; C) Controladas
Solución: A
2.- El estimador insesgado de la varianza poblacional en el análisis de
varianza es:
A) Media cuadrática intra sujetos; B) Media cuadrática inter sujetos; C)
Suma de cuadrados inter sujetos
Solución: A
3.- Un modelo aleatorio de análisis de varianza es aquel en que:
A) El azar determina los valores de la variable dependiente;
B) Los niveles de la variable independiente actúan como una muestra de
todos los posibles niveles que se pudiesen establecer;
C) Los niveles de la variable dependiente son al azar, no los fija el
investigador.
Solución: B
4.- El estadístico de contraste en el análisis de varianza se distribuye según
la distribución:
A) Normal; B) F de Snedecor; C) Chi cuadrado.
Solución: B
5.- El cometido del Análisis de Varianza es:
A)Minimizar el error experimental;
B) Maximizar los efectos del factor estudiado;
C) Discernir qué variabilidad corresponde al factor estudiado y cuál al error
experimental.
Solución: C
6.- En el análisis de varianza, llamamos factor a:
A) La/s variable/s independiente/s;
B) La/s variable/s dependiente/s;
C) La/s variables extrañas.
Solución: A
7.- MCinter es un estimador:
A) Sesgado de la varianza poblacional;
B) Insesgado de la varianza poblacional;
C) Insesgado de la media poblacional.
Solución: A
8.- La varianza intragrupos es la varianza atribuible:
A) Al error experimental;
B) Tanto al error experimental como a los distintos niveles del factor
estudiado;
C) A los distintos niveles del factor estudiado.
Solución: A
9.- En el análisis de varianza, cada nivel del factor es:
A) Una categoría de la variable dependiente;
B) Una categoría de la variable independiente;
C) Cada una de las variables independiente.
Solución: B
10.- En el razonamiento del análisis de varianza se supone que dentro de
un mismo nivel las puntuaciones deberían ser:
A) Semejantes; B) Correlacionadas; C) Diferentes.
Solución:A
Ejercicio 1.- Una muestra aleatoria de 30 alumnos de un colegio se han
repartido, también aleatoriamente, en grupos iguales para estudiar la
influencia de tres situaciones diferentes de aprendizaje (A, B y C).
Sabemos que, tras el aprendizaje, la suma de los cuadrados de las
puntuaciones diferenciales de todos los alumnos de la muestra es igual a
700. Que la media del grupo A es 30, la del grupo B es 20 y la del grupo C
es 50. Y, sabemos también, que la suma de cuadrados total supone el 150
por 100 de la suma de cuadrados intergrupos.
Realice un análisis de varianza e interprete los resultados.
Solución:
1) Hipótesis estadísticas:
H0: µ1 = µ2 = µ3
H1: µ1 ≠ µ2 ≠ µ3 al menos para una µi
2) Dado que nos piden que realicemos un análisis de varianza y no
tenemos los datos, vamos a suponer que se cumplen los supuestos de
independencia de las observaciones, normalidad de las distribuciones
y homogeneidad de las varianzas.
3) Estadístico de contraste:

𝑀𝐶inter
𝐹=
𝑀𝐶𝑖𝑛𝑡𝑟𝑎

4) Región crítica: El valor crítico de la tabla de la distribución F para


a-1 = 3-1 = 2 grados de libertad en el numerador y N-a = 30-3 = 27
grados de libertad en el denominador es 3,35 para un nivel de
confianza del 95%.
5) Calculamos el estadístico:

Sabemos, por el enunciado, que:


Ȳ1 = 30 Ȳ2 = 20 Ȳ3 = 50 por lo tanto Ȳ = 33,33

También sabemos que:

ƩƩ(Yij - Ȳ)2 = 700 = SCtotal


SCinter = (100)(700)/150 = 466,67
SCintra = 700 – 466,67 = 233,33

FV SC gl MC F
Entre niveles 466,67 2 233,335 27,006
Dentro de niveles 233,33 27 8,64
Total 700 29

6) Decisión:
Comparando nuestro valor con el valor tabular tenemos que:
27,006 > 3,35

7) Interpretamos:
A un nivel de confianza del 95% debemos considerar que los
tratamientos suministrados influyen de forma distinta en la ansiedad.
8) El paso siguiente es ver entre qué tratamientos está la diferencia,
para lo que debemos realizar las comparaciones múltiples.

CRScheffe = √(𝑎 − 1)𝐹(1−𝛼)(𝑎−1)(𝑁−𝑎) √𝑀𝐶𝑖𝑛𝑡𝑟𝑎 ⌊Ʃ(𝑐𝑖2 |𝑛𝑖 )⌋

Donde ci son los coeficientes de las combinaciones lineales que


podemos establecer entre las distintas medias a comparar y el resto
de los valores se pueden obtener de la tabla del ANOVA.

Como queremos comparar todas las medias entre sí, tenemos tres
posibles comparaciones y establecemos tres combinaciones lineales:

Media 1 con media 2: (1)Ȳ1 + (-1) Ȳ2 + (0) Ȳ3


Media 1 con media 3: (1)Ȳ1 + (0) Ȳ2 + (-1) Ȳ3
Media 2 con media 3: (0)Ȳ1 + (1) Ȳ2 + (-1) Ȳ3

Dado que el modelo es equilibrado, para todas las comparaciones el


valor dentro del corchete es el mismo:

⌊Ʃ(𝑐𝑖2 |𝑛𝑖 )⌋= 12 /n + (-1)2 /n = 2/n = 2/10 = 0,20

La diferencia mínima o rango crítico por encima de la cual diremos


que hay diferencias significativas entre las medias es igual a:

CRScheffe = √(2)(3,35) √(8,64)(0,20) = (2,588) (1,314) = 3,4

|Ȳ1 − Ȳ2 | = |30 − 20| = 10 > 3,4


|Ȳ1 − Ȳ3 | = |30 − 50| = 20 > 3,4
|Ȳ2 − Ȳ3 | = |20 − 50| = 30 > 3,4

Como vemos, las tres diferencias son significativas. Las tres


situaciones de aprendizaje producen resultados distintos.
Ejercicio 2.- Disponemos de tres grupos de sujetos: uno de niños, otro de
niñas y un tercero de adultos. Se les aplica un test que mide dependencia de
campo y los resultados fueron:

niños niñas adultos


6 9 8
5 8 10
6 8 8
4 5 3
3 10 7
5 7 6
4 6 7
4 8 9
5 8

Se desea saber si los tres grupos difieren en la variable estudiada y, caso de


que fuese así, si hay diferencias debidas al género.

Solución:
Dado que tenemos tres muestras independientes, aplicamos un análisis de
varianza de un solo factor.
1) Hipótesis estadísticas:
H0: µ1 = µ2 = µ3
H1: µ1 ≠ µ2 ≠ µ3 al menos para una µi
2) Supuestos:
Vamos a suponer que hemos aplicado el test de rachas, el de Bartlett
y el de Lilliefors y que se cumplen los supuestos de independencia,
homogeneidad de varianzas y normalidad.
3) Estadístico de contraste:

𝑀𝐶inter
𝐹=
𝑀𝐶𝑖𝑛𝑡𝑟𝑎

4) Región crítica: El valor crítico de la tabla de la distribución F para


a-1 = 3-1 = 2 grados de libertad en el numerador y N-a = 26-3 = 23
grados de libertad en el denominador es 3,42 para un nivel de
confianza del 95%.
5) Calculamos el estadístico:
A A2 B B2 C C2
6 36 9 81 8 64
5 25 8 64 10 100
6 36 8 64 8 64
4 16 5 25 3 9
3 9 10 100 7 49
5 25 7 49 6 36
4 16 6 36 7 49
4 16 8 64 9 81
5 25 8 64
42 204 61 483 66 516

SCtotal = (204+483+516) – ⌊(42 + 61 + 66)2 |26)⌋ = 1203 -1098,5 = 104,5


SCinter = ((42)2/9 + (61)2/8 + (66)2/9) – 1098,5 = 1145,125 – 1098,5 =
46,625
SCintra = 104,5 – 46,625 = 57,875
FV SC gl MC F
Entre niveles 46,625 2 23,3125 9,264
Dentro de niveles 57,875 23 2,5163
Total 104,5 25

6) Decisión:
Comparando nuestro valor con el valor tabular tenemos que:
9,264 > 3,42
Por lo tanto rechazamos la hipótesis nula.
7) Interpretamos:
Hemos comprobado, con un nivel de confianza del 95% que hay
diferencia entre los grupos. Vamos a comprobar si es debida a la
diferencia éntrelos niños y las niñas, tal como pide el enunciado del
problema.

CRScheffe = √(𝑎 − 1)𝐹(1−𝛼)(𝑎−1)(𝑁−𝑎) √𝑀𝐶𝑖𝑛𝑡𝑟𝑎 ⌊Ʃ(𝑐𝑖2 |𝑛𝑖 )⌋

Dado que sólo nos interesa una comparación:

Media 1 con media 2: (1)Ȳ1 + (-1) Ȳ2 + (0) Ȳ3


Tenemos:
⌊Ʃ(𝑐𝑖2 |𝑛𝑖 )⌋= 12 /9 + (-1)2 /8 = 0,236

La diferencia mínima o rango crítico por encima de la cual diremos


que hay diferencias significativas entre las medias es igual a:

CRScheffe = √(2)(3,42) √(2,5163)(0,236) = (2,615) (0,771) = 2,02

|Ȳ1 − Ȳ2 | = |4,667 − 7,625| = 2,958 > 2,02

Efectivamente, existe diferencia entre los niños y las niñas.

Ejercicio 3.- Se desea saber si diferentes tiempos de deprivación


alimenticia afectan por igual a la velocidad con que las ratas recorren un
laberinto en cuya meta reciben, sistemáticamente, una cantidad igual de
comida.
Para ello se toma una muestra de 32 ratas macho y se distribuyen,
aleatoriamente, en cuatro grupos a los que se somete a diferentes tiempos
de deprivación. Grupo A = 5 horas; B = 10 horas; C = 15 horas y D = 20
horas.
Pasado ese tiempo se sitúa a cada rata en la salida del laberinto y se registra
el tiempo que tarda en llegar a la meta. Los tiempos medios y las
desviaciones típicas de esos tiempos, para cada grupo, aparecen a
continuación:

Grupo A Grupo B Grupo C Grupo D


Media 10.5 12.5 13 15
Desviación típica 3 4 3.5 4.5

¿Se puede afirmar, con un nivel de confianza del 95%, que los tiempos
medios de los grupos son iguales?

Solución:
Dado que queremos comparar cuatro grupos, parece lógico que el diseño
sea un ANOVA de un factor.
Veamos qué datos tenemos y qué datos necesitamos.
Los cálculos que hay que realizar son:

2
(ƩƩ𝑌𝑖𝑗 )
SCtotal = ƩƩ 𝑌𝑖𝑗2 -
𝑁

2 2
(Ʃ𝑌𝑖𝑗 ) (ƩƩ𝑌𝑖𝑗 )
SCinter = Ʃ -
𝑛𝑖 𝑁

SCintra = SCtotal - SCinter

Así pues, necesitamos los sumatorios de las puntuaciones de cada grupo


total y los sumatorios de las puntuaciones al cuadrado.
Dado que en el enunciado del ejercicio se nos han dado las medias y las
desviaciones típicas, y conocemos sus fórmulas, podemos despejar los
datos que nos faltan.

10,5 = Ʃ YiA /8 → Ʃ YiA = 84


12,5 = Ʃ YiB /8 → Ʃ YiB = 100
13 = Ʃ YiC /8 → Ʃ YiC = 104
15 = Ʃ YiD /8 → Ʃ YiD = 120
ƩƩYij = 84+100+104+120= 408

2 2
9 = (Ʃ𝑌𝑖𝐴 /8) – (10,5)2 → Ʃ𝑌𝑖𝐴 = 954
2 2
16 = (Ʃ𝑌𝑖𝐵 /8) – (12,5)2 → Ʃ𝑌𝑖𝐵 = 1378
12,25 = (Ʃ𝑌𝑖𝐶2 /8) – (13)2 → Ʃ𝑌𝑖𝐶2 = 1450
2 2
20,25 = (Ʃ𝑌𝑖𝐷 /8) – (15)2 → Ʃ𝑌𝑖𝐷 = 1962
ƩƩ𝑌𝑖𝑗2 = 954 + 1378 + 1450 + 1962 = 5744

SCtotal = 5744 – ((408)2/32) = 5744 – 5202 = 542


SCinter = ((842/8) + (1002/8) + (1042/8) + (1202/8) ) – 5202= 5284-5202= 82
SCintra = 542 – 82 = 460

FV SC gl MC F
Entre niveles 82 3 27,33 1,66
Dentro de niveles 460 28 16,43
Total 542 31

Si buscamos en la tabla de la distribución F, el valor crítico para 3 y 28


grados de libertad, con un nivel de confianza del 95% es 2,95.

Como 1,66 < 2,95 no podemos rechazar la hipótesis nula del análisis de
varianza. No podemos considerar que haya diferencias en los tiempos que
tardan las ratas en recorrer el laberinto en función de los tiempos de
privación de alimentos, con un nivel de confianza del 95%.
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

SITUACIÓN 1: Con el objetivo de mejorar la función hepática, un investigador medico está interesado en la
tasa máxima de síntesis de urea en pacientes con cirrosis que experimentaron una operación estándar
(bypass no selectivo), un bypass selectivo para pacientes con una síntesis de urea menor de 40 (grupo
selectivo I) y un bypass selectivo para pacientes con una síntesis de urea superior a 40 (grupo selectivo II).
Cada uno de los tres grupos (bypass no selectivo, bypass selectivo Grupo I y bypass selectivo grupo II) estuvo
compuesto por 6 pacientes. Sabemos que: 𝑆𝐶𝐼𝑛𝑡𝑒𝑟 = 160,44 y que 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 710,66

1- La hipótesis nula es:


𝐴) 𝐻0 : 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜 = 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑛𝑜𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜 (𝐼) ≠ 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑛𝑜_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜(𝐼𝐼)
B) 𝐻0 : 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑛𝑜_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜 = 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑠𝑒𝑙𝑒𝑐𝑐𝑡𝑖𝑣𝑜(𝐼) = 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜(𝐼𝐼)
C) 𝐻0 : 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑛𝑜_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜 ≠ 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜(𝐼) = 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜(𝐼𝐼)

2- ¿Qué supuestos debo verificar que se cumplen en este caso para aplicar el ANOVA? A) las observaciones
se distribuyen según la distribución F en los tres grupos; B) las varianzas de los tres grupos deben ser
similares; C) la distribución de las puntuaciones es asimétrica en los tres grupos.

3- Los grados de libertad del estadístico F de contraste para evaluar el efecto del “tipo de operación
médica” valen: A) (15; 3); B) (2; 15); C) (2; 18).

4- El estadístico de contraste F para evaluar el efecto del “tipo de operación médica” vale
aproximadamente: A) 1,693; B) 3,295; C) 0,392

5- Si trabajamos a un nivel de confianza del 95%, el valor crítico para contrastar la F del “tipo de operación
médica” valdrá: A)1,693; B) 3,682; C) 2,695

SITUACIÓN 2. Un agrónomo desea conocer el efecto que sobre el rendimiento de una variedad de trigo tiene
la adición de 3 tipos diferentes de fosfatos al terreno. Para ello parcela un terreno en 12 áreas del mismo
tamaño y trata cada cuatro parcelas con un tipo distinto de fosfato (A, B o C). A continuación siembra trigo
en cada uno de ellos y, después de la recolección, mide la cantidad de trigo producida por cada superficie
(en hectólitros por hectárea o hl/ha). Nivel de confianza: 95%. Sabemos que:

𝑆𝐶𝑆/𝐴 = 𝑆𝐶𝑑𝑒𝑛𝑡𝑟𝑜_𝑛𝑖𝑣𝑒𝑙𝑒𝑠 = 6; 𝑆𝐶𝐴 = 𝑆𝐶𝑒𝑛𝑡𝑟𝑒_𝑛𝑖𝑣𝑒𝑙𝑒𝑠 = 8

Y la siguiente tabla muestra el rendimiento obtenido en función del tipo de fosfato añadido.

Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50

1- Se trata de un diseño: A) de una muestra con 12 observaciones; B) de un factor con tres niveles (tipo de
fosfato); C) de un factor (parcela de terreno) con cuatro niveles.

2- La hipótesis nula es A) 𝐻0 : 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐴 = 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐵 ; B) 𝐻0 : 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐴 = 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐵 = 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐶 ; C)


𝐻0 : 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐴 ≠ 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐵 ≠ 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐶

3- Los grados de libertad del estadístico F de contraste valen: A) (3;9); B) (2;11); C) (2;9).

4 - El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato” vale aproximadamente: A)
6; B) 3,295; C) 0,392.

-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

5- El diseño presentado es: A) de efectos fijos; B) desequilibrado; C) las dos opciones anteriores son
incorrectas.

6- El modelo estadístico que podemos aplicar a estos datos es: A) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖 + 𝜀𝑖𝑗 ; B) 𝐸(𝑀𝐶𝐼𝑛𝑡𝑒𝑟 ) =
1
𝜎 2 + (𝐼−1) 𝑛𝑖 𝛼𝑖2; C) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖 + (𝛼𝜀)𝑖𝑗 + 𝜀𝑖𝑗

7- El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196, 192, 200}; C) {2/3, 2/3,
2/3}.

8- La variación entre tratamientos vale: A) 4; B) 8; C) 14.

9- La variación dentro de los tratamientos vale aproximadamente: A) 5/3; B) 4/3; C) 2/3.

10- El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es superior en, aproximadamente,
6 veces a la MCInter; B) No, porque la SCintra es casi igual a la SCinter indicando que la variabilidad asociada al
tratamiento es casi idéntica a la del error; C) Sí, porque la F obtenida (6) es superior al valor crítico
𝐹2;9;0,05 = 4,256

11- ¿Entre qué niveles podemos asegurar que existen diferencias según CR de Scheffé? A) sólo entre los
niveles B y C; B) Sólo entre los niveles A y C; C) sólo entre los niveles A y B.

12- El diseño presentado no permite evaluar la interacción: A) porque el factor manipulado (tipo de
fertilizante) no puede interaccionar con ningún otro factor; B) porque tal interacción no ha sido incluida
en el modelo; C) porque sólo existe un factor manipulado y la interacción siempre se predica, como
mínimo, de dos factores.

SITUACIÓN 3. Un investigador sospecha que los tiempos de coagulación de la sangre difieren en función del
tipo de dieta. Para ello, ha realizado un experimento donde ha formado varios grupos de ratones,
sometiendo a cada grupo a distintos tipos de dietas. Tras analizar los datos mediante un ANOVA, parte de los
siguientes resultados:

F.V. S.C. g.l. M.C. F


Entre niveles 228 3
Dentro de niveles 112 20
Total 340 23

1- Asumiendo un diseño equilibrado, ¿cuántos animales utilizó por grupo? A) 6; B) 4; C) 5.

2- ¿Cuántos niveles tiene el factor “Tipo de dieta”? A) 6; B) 4; C) 3.

3- La hipótesis nula planteada en este diseño es: A) 𝐻0 : 𝜇𝑖 = 𝜇𝑗 para todo 𝑖 ≠ 𝑗; B) 𝐻0 : 𝜇𝑖 ≠ 𝜇𝑗 para todo
𝑖 = 𝑗; C) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖𝑗 + 𝜀𝑖𝑗 .

4- El valor de la F para el factor “Tipo de dieta” fue: A) 8,660; B) 2,380; C) 13,57.

5- Siendo 𝛼 = 0,05, el valor de la F crítica para el factor “Tipo de dieta” fue: A) 3,098; B) 2,380; C) 4,938.

-2-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

6- ¿Tendremos que realizar comparaciones a posteriori? A) Sí; B) No porque tenemos más de 2 niveles del
factor; C) No porque las comparaciones a posteriori solo se aplican en diseños intrasujetos.

7- Con un nivel de confianza del 95%, ¿Cuál será el valor mínimo de la diferencia entre dos medias
cualesquiera en este experimento para que resulten significativas según Scheffé (𝛼 = 0,05)? A) 12,39; B)
0,59; C) 4,17.

8- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a comparar deben de
cumplir el supuesto de: A) complementariedad y exhaustividad; B) homocedasticidad; C) independencia.

SITUACIÓN 4: Un fabricante de bolsas de papel está interesado en mejorar la resistencia a la tensión de las
mismas. El ingeniero piensa que la resistencia a la tensión es una función de la concentración de madera
frondosa (hardwood) en la pulpa con la que se hace el papel y que el rango de concentración de este tipo de
madera se encuentra entre el 5 y el 20%. Por ello, el equipo de ingenieros decide investigar cuatro niveles de
esta concentración: 5%, 10%, 15% y 20%. Deciden componer seis especímenes de test en cada nivel de
concentración. Los 24 especímenes se evalúan en el laboratorio para determinar su resistencia a la tensión
en orden aleatorio. En el informe los investigadores indican que “El factor Concentración fue significativo
[𝐹(3, 20) = 19,60, 𝑀𝐶𝑒𝑟𝑟𝑜𝑟 = 6,51, 𝑝 = 0,00000359]”

1- Se trata de un diseño: A) desequilibrado y de efectos aleatorios; B) de efectos aleatorios; C) equilibrado y


de efectos fijos.

2- El valor de MC para el factor Concentración es: A) 0,05; B) 127,60; C) 1,05.

3- El valor de la F crítica para un 𝛼 = 0,005 es: A) 21,332 B) 4,938; C) 5,818.

4- La suma de cuadrados para el factor Concentración vale: A) 382,8; B) 130,17; C) 127,60.

5- Dados los resultados obtenidos ¿deberían los ingenieros realizar pruebas de comparaciones múltiples o a
posteriori? A) sí ya que hay más de 2 grupos y la F ha resultado significativa; B) no son necesarias porque
la F ha resultado significativa; C) No, porque sólo tenemos cuatro grupos.

6- Si el experimento hubiera sido de efectos aleatorios, las concentraciones a utilizar en el experimento: A)


se habrían elegido al azar entre 5 y 20; B) serían las mismas que las que se han utilizado en el
experimento, es decir, 5, 10, 15 y 20%; B) se habrían elegido al azar entre 0 y 1.

7- El investigador también podría haber sustituido en el informe el valor de p = 0,00000359 por: A) p <
0,0001; B) p > 0,001; C) p > 0,05.

8- Como el factor manipulado es una variable numérica (no categórica), también sería posible: A) realizar un
análisis categórico para estos datos; B) realizar un análisis cualitativo sobre cada nivel del factor; C)
realizar un análisis de regresión lineal simple sobre estos datos.

9- El cumplimiento del supuesto de homocedasticidad en este análisis: A) implicaría que la varianza de los
valores de resistencia a la tensión del papel son semejantes independientemente de la concentración de
madera frondosa; B) implicaría que las medias de tensión del papel condicionadas a la concentración de
madera frondosa siguen una función lineal; C) implicaría que las medias de tensión del papel
condicionadas a la concentración de madera frondosa siguen una distribución lineal.

-3-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

10- El valor de p = 0,00000359 obtenido en el experimento es la probabilidad: A) del 𝑀𝐶𝑒𝑟𝑟𝑜𝑟 ; B) de la F


crítica; C) condicional de haber obtenido una F = 19,60 o superior siendo H0 cierta.

SITUACIÓN 5. Un investigador se encuentra interesado en la eficacia de los tratamientos para la pérdida de


peso. Considera interesante poner a prueba los tres tratamientos más relevantes: ejercicio, dieta y
ejercicio+dieta. Pero, además, cree que el lugar donde se realiza el tratamiento puede tener un efecto. Para
ello, contacta con una empresa que tiene un programa de reducción del sobrepeso para sus empleadas y
proporciona a 10 de ellas un carnet para la asistencia a una clínica dietética, a otras 10 un carnet de un club
deportivo y a un último grupo de 10 mujeres les proporciona ambos carnets que les permiten asistir
gratuitamente a estas instalaciones. En cada grupo, la mitad de mujeres (5) han sido elegidas aleatoriamente
de la planta de manufacturado y la otra mitad (otras 5) han sido elegidas de la sección de secretaría. La
variable dependiente fue la reducción de peso. Asumimos que se cumplen los supuestos del análisis de
varianza. Trabajamos a un 𝛼 = 0,05.

1- Se trata de un diseño factorial: A) 2x2 ya que se han manipulado los tratamientos (ejercicio y dieta) y el
tipo de carnet (clínica, club y ambos); B) desequilibrado; C) 3x2 ya que se ha manipulado el tipo de
tratamiento (con tres niveles) y el lugar de selección de las mujeres (con dos niveles).

2- El investigador ha informado que ninguno de los factores principales ha resultado significativo. Esto
significa que: A) la interacción no puede ser significativa; B) ni el lugar de selección de las mujeres ni el
tratamiento han resultado significativos; C) el experimento ha resultado fallido.

3- El investigador ha informado que la F de la interacción fue 4,722. De manera aproximada, y utilizando las
tablas correspondientes ¿ha resultado significativa?: A) No es posible saberlo sin conocer la media
cuadrática del error; B) Sí, ya que 4,722 es superior a 3,493; C) No porque, siendo cierta H0, la
probabilidad de obtener un valor de 4,722 o superior es superior a 0,05.

SITUACIÓN 6: Diversos estudios ponen de manifiesto que las enfermedades de tipo alérgico se ven
agravadas por la presencia de fuerte estrés. Además, la época del año parece afectar de forma decisiva a la
gravedad de los trastornos alérgicos. En un estudio se ha utilizado una muestra aleatoria de 5 pacientes
alérgicos (todos con el mismo tipo de alergia) sometidos a condiciones de alto estrés. Un grupo de
especialistas ha evaluado la gravedad de la alergia de cada paciente (en una escala de 0 a 10) en los cuatro
periodos estacionales: primavera, verano, otoño e invierno. Para analizar estos datos, el investigador utilizó
un ANOVA cuyas razones básicas aparecen a continuación (utilice un 𝛼 = 0,05):

[A] [S] [AxS] [T]


910 852,5 940 845

1- Se trata de un diseño: A) factorial de 2 factores (estrés y estación del año); B) factorial de un factor con 4
niveles; C) factorial de 2 factores con 2 niveles cada uno.

2- El análisis realizado es del tipo: A) contrabalanceado; B) inter-sujetos; C) intra-sujetos.

3- La Media Cuadrática del error (en este caso, AxS) vale aproximadamente: A) 5; B) 21,67; C) 1,87.

4- La F crítica para evaluar el efecto del factor vale: A) 3,49; B) 4,474; C) 5,953.

-4-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

5- El informe de este trabajo debería realizarse de la siguiente manera: A) F(3; 12) = 11.56, MSe = 1,875, p
< 0,05; B) F(3; 12) = 0,05, MSe = 11,59, p > 0,10; C) F(12; 3) = 11,59, MSe = 21,67, p = 0,05.

6- El análisis de los datos nos indicaron una potencia de 0.99 para el factor “Periodo estacional”. Esto
significa que: A) Como el valor es cercano a la unidad, no existen diferencias en la gravedad de la alergia
en función del periodo estacional; B) debemos realizar contrastes a posteriori; C) La probabilidad de
rechazar la hipótesis nula H 0 : Pr imavera  Verano  Otoño  Invierno siendo esta falsa vale 0,99.

7- Si deseamos evaluar el supuesto de simetría compuesta en este estudio, necesitaremos disponer de la


matriz de varianzas-covarianzas que tendrá: A) 4x3 celdillas; B) 3x3 celdillas; C) 4x4 celdillas.

8- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede adoptar valores
negativos porque: A) los valores de la ordenada (eje vertical) son todos positivos; B) toda distribución de
densidad de probabilidad se estandariza para que tenga un área igual a la unidad; C) es el cociente entre
dos varianzas y estas son siempre positivas.

9- El contrabalanceo de las condiciones experimentales es necesario realizarlo: A) en diseños intra-sujetos;


B) cuando no existen efectos de práctica o fatiga; C) para aleatorizar los efectos de las condiciones
manipuladas.

SITUACIÓN 7. Un investigador se interesó en estudiar si los efectos de la marihuana dependían de la


utilización previa (o no) de esta droga. Para responder a esta pregunta, realizó un experimento con 12
usuarios frecuentes de marihuana, 12 usuarios infrecuentes de marihuana y 12 estudiantes que no habían
probado anteriormente la marihuana. A su vez, asignó de manera aleatoria la condición placebo o
experimental a cada uno de los 12 sujetos de cada tipo. En la condición placebo se pidió a cada sujeto que
fumara dos cigarros normales pero que olían y sabían a marihuana. En la condición experimental se pidió a
cada participante que fumara dos cigarrillos hechos efectivamente con marihuana. Inmediatamente
después se les pidió realizar un test de rapidez motora que mide el tiempo (en segundos) en realizar una
tarea experimental sencilla. Los datos de este experimento aparecen en la siguiente tabla.

Grupo placebo Grupo experimental


usuario usuario sin contacto usuario usuario sin contacto
frecuente infrecuente previo frecuente infrecuente previo
79 80 79 81 84 96
69 70 70 73 76 86
63 64 64 98 71 81
60 61 60 63 66 87
75 75 75 78 81 91
70 71 71 74 77 84

1- El diseño es: A) de medidas repetidas 2x3; B) de dos factores inter-sujetos 2x3; C) de un factor intersujeto
con tres niveles.

2- Podemos calificar el diseño de: A) efectos aleatorios; B) de efectos fijos; C) desequilibrado.

-5-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

3- Los valores de las MC para los efectos principales valen: A) 33,19 y 90392,1; B) 29019,3 y 29993,10; C)
1013,361 y 116,583.

4- La SC y la MC para la interacción valen: A) 236,056 y 118,028; B) 29019,3 y 14509,7; C) 1013,361 y


506,681.

5- El valor F para el factor Grupo (experimental vs. placebo) es: A) 17,174; B) 1,058; C) 3,392.

6- El valor F para el factor Tipo de Usuario de Marihuana es: A) 1,976; B) 5,302; C) 9,992.

7- Las comparaciones “a posteriori” para el factor Grupo: A) no son necesarias ya que este factor sólo tiene
2 niveles y la F ya nos indica que las medias son diferentes entre sí; B) son necesarias ya que la F ha
resultado significativa; C) se aplican sólo cuando la interacción es significativa.

8- Con respecto a la interacción: A) habrá que analizarla mediante los 5 efectos simples; B) no se debe
realizar un análisis de efectos simples porque la interacción no es significativa; C) la interacción muestra
que los sujetos sin experiencia previa del grupo experimental difiere significativamente de los otros dos
grupos de usuarios en el grupo experimental, pero no en el placebo.

9- El experimentador debe concluir que: A) los sujetos que tienen experiencia infrecuente y frecuente con la
marihuana tienen una respuesta diferente a los sujetos que no han tenido experiencia previa; B) el
tiempo de respuesta es superior cuando los sujetos han fumado marihuana que cuando no lo han hecho,
y este resultado no se muestra afectado por la experiencia previa del usuario con esta droga; C) la
experiencia con la marihuana no afecta a los sujetos que toman la droga placebo, pero afecta
notablemente a los sujetos sin ningún tipo de experiencia con la marihuana.

-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

SITUACIÓN 1: Con el objetivo de mejorar la función hepática, un investigador medico está interesado en la
tasa máxima de síntesis de urea en pacientes con cirrosis que experimentaron una operación estándar
(bypass no selectivo), un bypass selectivo para pacientes con una síntesis de urea menor de 40 (grupo
selectivo I) y un bypass selectivo para pacientes con una síntesis de urea superior a 40 (grupo selectivo II).
Cada uno de los tres grupos (bypass no selectivo, bypass selectivo Grupo I y bypass selectivo grupo II) estuvo
compuesto por 6 pacientes. Sabemos que: y que

Tenemos que aplicar un análisis de la varianza para tres muestras independientes con tres niveles
con 6 sujetos en cada uno de ellos . El número total de sujetos es: .
Con estos datos y las sumas de cuadrados del enunciado, completamos fácilmente la tabla de
ANOVA.

FV SC g.l. MC F

Factor

Error

Total

1- La hipótesis nula es:

B)
C)

La hipótesis nula ha de postular la igualdad de las medias en los tres niveles.

2- ¿Qué supuestos debo verificar que se cumplen en este caso para aplicar el ANOVA? A) las observaciones
se distribuyen según la distribución F en los tres grupos; B) las varianzas de los tres grupos deben ser
similares; C) la distribución de las puntuaciones es asimétrica en los tres grupos.

3- Los grados de libertad del estadístico F de contraste para evaluar el efecto del “tipo de operación
médica” valen: A) (15, 3); B) (2, 15); C) (2, 18).

4- El estadístico de contraste F para evaluar el efecto del “tipo de operación médica” vale
aproximadamente: A) 1.693; B) 3.295; C) 0.392

5- Si trabajamos a un nivel de confianza del 95%, el valor crítico para contrastar la F del “tipo de operación
médica” valdrá: A)1.693; B) 3.682; C) 2.695

Buscamos en la tabla F de Fisher para 2 y 15 grados de libertad la puntuación que supera una proporción
igual a 0,95 (nivel de confianza).

-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

SITUACIÓN 2. Un agrónomo desea conocer el efecto que sobre el rendimiento de una variedad de trigo tiene
la adición de 3 tipos diferentes de fosfatos al terreno. Para ello parcela un terreno en 12 áreas del mismo
tamaño y trata cada cuatro parcelas con un tipo distinto de fosfato (A, B o C). A continuación siembra trigo
en cada uno de ellos y, después de la recolección, mide la cantidad de trigo producida por cada superficie
(en hectólitros por hectárea o hl/ha). Nivel de confianza: 95%. Sabemos que:

Y la siguiente tabla muestra el rendimiento obtenido en función del tipo de fosfato añadido.

Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50

Tenemos un factor con tres niveles , en el que en cada nivel hay 4 observaciones . Las
muestras son independientes. Fácilmente construimos la tabla de ANOVA.

SC gl MC F

Entre niveles

Dentro niveles

Total

1- Se trata de un diseño: A) de una muestra con 12 observaciones; B) de un factor con tres niveles (tipo de
fosfato); C) de un factor (parcela de terreno) con cuatro niveles.

2- La hipótesis nula es A) ; B) ; C)

La hipótesis nula ha de postular la igualdad de las medias en todos los niveles, luego la opción
correcta es B.

3- Los grados de libertad del estadístico F de contraste valen: A) (3,9); B) (2,11); C) (2,9).

4 - El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato” vale aproximadamente: A)
6; B) 3.295; C) 0.392.

5- El diseño presentado es: A) de efectos fijos; B) desequilibrado ; C) las dos opciones anteriores son
incorrectas.

Se trata de un diseño de efectos fijos. No puede ser desequilibrado ya que hay 4 terrenos o parcelas
para cada tipo de fertilizante (lo cual indicaría que es equilibrado). Solo nos interesan estos
fertilizantes (A, B y C), ningún otro.

-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

6- El modelo estadístico que podemos aplicar a estos datos es: A) B)


; C)

La opción B no es un modelo sino la expresión del valor esperado de la Media Cuadrática Inter. La
expresión C es incorrecta ya que asume la interacción entre los errores y los niveles del tratamiento.
La opción correcta es la A ya que expresa cada puntuación de la variable dependiente (Yij) como la
suma de tres componentes: una media global común (  ), el efecto del factor del terreno concreto
del que estemos hablando y un error aleatorio

7- El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196, 192, 200}; C) {2/3, 2/3,
2/3}.

Para obtener el rendimiento medio para los diferentes tratamientos simplemente calculamos la
media de cada fertilizante:

8- La variación entre tratamientos vale: A) 4; B) 8; C) 14.

9- La variación dentro de los tratamientos vale aproximadamente: A) 5/3; B) 4/3; C) 2/3.

10- El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es superior en, aproximadamente,
6 veces a la MCInter; B) No, porque la SCintra es casi igual a la SCinter indicando que la variabilidad asociada al
tratamiento es casi idéntica a la del error; C) Sí, porque la F obtenida (6) es superior al valor crítico

11- ¿Entre qué niveles podemos asegurar que existen diferencias según CR de Scheffé? A) sólo entre los
niveles B y C; B) Sólo entre los niveles A y C; C) sólo entre los niveles A y B.

Aplicamos la fórmula de la CR de Scheffé (como nos piden asegurar entre qué niveles existen
diferencias, ponemos los coeficientes típicos para la comparación entre dos niveles dejando el tercero
sin incluir):

√ √ ⁄ [∑ ( ⁄ )]

√ √ ⁄ ⁄

Ahora realizamos las diferencias (en valor absoluto) entre las tres medias:

| ̅ ̅| | |
| ̅ ̅| | |
|̅ ̅| | |

-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

12- El diseño presentado no permite evaluar la interacción: A) porque el factor manipulado (tipo de
fertilizante) no puede interaccionar con ningún otro factor; B) porque tal interacción no ha sido incluida
en el modelo; C) porque sólo existe un factor manipulado y la interacción siempre se predica, como
mínimo, de dos factores.

SITUACIÓN 3. Un investigador sospecha que los tiempos de coagulación de la sangre difieren en función del
tipo de dieta. Para ello, ha realizado un experimento donde ha formado varios grupos de ratones,
sometiendo a cada grupo a distintos tipos de dietas. Tras analizar los datos mediante un ANOVA, parte de los
siguientes resultados:

F.V. S.C. g.l. M.C. F


Entre niveles 228 3
Dentro de niveles 112 20
Total 340 23

Conociendo los grados de libertad, deducimos el número de niveles, el número de sujetos en cada
nivel y número total de sujetos:

Completamos la tabla de ANOVA:

F.V. S.C. g.l. M.C. F


Entre grupos 228 3 228/3 = 76 76/5,6 = 13,57
Error 112 20 112/20 = 5,6

Total 340 23

1- Asumiendo un diseño equilibrado, ¿cuántos animales utilizó por grupo? A) 6; B) 4; C) 5.

2- ¿Cuántos niveles tiene el factor “Tipo de dieta”? A) 6; B) 4; C) 3.

3- La hipótesis nula planteada en este diseño es: A) para todo ; B) para todo
; C) .

4- El valor de la F para el factor “Tipo de dieta” fue: A) 8,660; B) 2,380; C) 13,57.

5- Siendo   0.05 , el valor de la F crítica para el factor “Tipo de dieta” fue: A) 3,098; B) 2,380; C) 4,938.

Para un nivel de confianza del 95%, mirando en las tablas F de Fisher para 3 y 20 grados de libertad,
observamos que la F crítica es: 3,098, luego la alternativa correcta es “A”.

6- ¿Tendremos que realizar comparaciones a posteriori? A) Sí; B) No porque tenemos más de 2 niveles del
factor; C) No porque las comparaciones a posteriori solo se aplican en diseños intrasujetos.

-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

Tendremos que hacer comparaciones “a posteriori” porque hemos rechazado la hipótesis nula que
planteaba la igualdad entre las medias .

7- Con un nivel de confianza del 95%, ¿Cuál será el valor mínimo de la diferencia entre dos medias
cualesquiera en este experimento para que resulten significativas según Scheffé ( 0,05)? A) 12,39; B)
0,59; C) 4,17.

Como el modelo es equilibrado es igual para todas las diferencias entre pares de medias, dado
que:

∑( ⁄ ) ( ⁄ ) ( ⁄ ) ⁄

√ √ ⁄ [∑ ( ⁄ )]

√ √ ( ⁄ )

8- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a comparar deben de
cumplir el supuesto de: A) complementariedad y exhaustividad; B) homocedasticidad; C) independencia.

SITUACIÓN 4: Un fabricante de bolsas de papel está interesado en mejorar la resistencia a la tensión de las
mismas. El ingeniero piensa que la resistencia a la tensión es una función de la concentración de madera
frondosa (hardwood) en la pulpa con la que se hace el papel y que el rango de concentración de este tipo de
madera se encuentra entre el 5 y el 20%. Por ello, el equipo de ingenieros decide investigar cuatro niveles de
esta concentración: 5%, 10%, 15% y 20%. Deciden componer seis especímenes de test en cada nivel de
concentración. Los 24 especímenes se evalúan en el laboratorio para determinar su resistencia a la tensión
en orden aleatorio. En el informe los investigadores indican que “El factor Concentración fue significativo
[ , , ]”

El enunciado nos ofrece los siguientes datos de la tabla de ANOVA:

F.V. S.C. g.l. M.C. F


INTER
INTRA 6,51
TOTAL

De los que deducimos:

Una vez conocida :

-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

Las sumas de cuadrados total y de error son:

⁄ ⁄
⁄ ⁄

Con lo que completamos la tabla de ANOVA:

F.V. S.C. g.l. M.C. F


INTER
INTRA 6,51
TOTAL

1- Se trata de un diseño: A) desequilibrado y de efectos aleatorios; B) de efectos aleatorios; C) equilibrado y


de efectos fijos.

2- El valor de MC para el factor Concentración es: A) 0,05;B) 127,60; C) 1,05.

3- El valor de la F crítica para un es: A) 21,332 B) 4,938; C) 5,818.

Buscamos en la tabla de la distribución F para con 3 y 20 g.l

4- La suma de cuadrados para el factor Concentración vale: A) 382,8; B) 130,17; C) 127,60.

5- Dados los resultados obtenidos ¿deberían los ingenieros realizar pruebas de comparaciones múltiples o a
posteriori? A) sí ya que hay más de 2 grupos y la F ha resultado significativa; B) no son necesarias porque
la F ha resultado significativa; C) No, porque sólo tenemos cuatro grupos.

6- Si el experimento hubiera sido de efectos aleatorios, las concentraciones a utilizar en el experimento: A)


se habrían elegido al azar entre 5 y 20; B) serían las mismas que las que se han utilizado en el
experimento, es decir, 5, 10, 15 y 20%; B) se habrían elegido al azar entre 0 y 1.

7- El investigador también podría haber sustituido en el informe el valor de p = 0,00000359 por: A) p <
0,0001; B) p > 0,001; C) p > 0,05.

8- Como el factor manipulado es una variable numérica (no categórica), también sería posible: A) realizar un
análisis categórico para estos datos; B) realizar un análisis cualitativo sobre cada nivel del factor; C)
realizar un análisis de regresión lineal simple sobre estos datos.

9- El cumplimiento del supuesto de homocedasticidad en este análisis: A) implicaría que la varianza de los
valores de resistencia a la tensión del papel son semejantes independientemente de la concentración
de madera frondosa; B) implicaría que las medias de tensión del papel condicionadas a la concentración

-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

de madera frondosa siguen una función lineal; C) implicaría que las medias de tensión del papel
condicionadas a la concentración de madera frondosa siguen una distribución lineal.

10- El valor de p = 0,00000359 obtenido en el experimento es la probabilidad: A) del ; B) de la F


crítica; C) condicional de haber obtenido una F = 19,60 o superior siendo H0 cierta.

SITUACIÓN 5. Un investigador se encuentra interesado en la eficacia de los tratamientos para la pérdida de


peso. Considera interesante poner a prueba los tres tratamientos más relevantes: ejercicio, dieta y
ejercicio+dieta. Pero, además, cree que el lugar donde se realiza el tratamiento puede tener un efecto. Para
ello, contacta con una empresa que tiene un programa de reducción del sobrepeso para sus empleadas y
proporciona a 10 de ellas un carnet para la asistencia a una clínica dietética, a otras 10 un carnet de un club
deportivo y a un último grupo de 10 mujeres les proporciona ambos carnets que les permiten asistir
gratuitamente a estas instalaciones. En cada grupo, la mitad de mujeres (5) han sido elegidas aleatoriamente
de la planta de manufacturado y la otra mitad (otras 5) han sido elegidas de la sección de secretaría. La
variable dependiente fue la reducción de peso. Asumimos que se cumplen los supuestos del análisis de
varianza. Trabajamos a un   0.05 .

1- Se trata de un diseño factorial: A) 2x2 ya que se han manipulado los tratamientos (ejercicio y dieta) y el
tipo de carnet (clínica, club y ambos); B) desequilibrado; C) 3x2 ya que se ha manipulado el tipo de
tratamiento (con tres niveles) y el lugar de selección de las mujeres (con dos niveles).

El primer factor es el tipo de tratamiento con tres niveles (ejercicio, dieta y ejercicio+dieta) y el
segundo es el lugar con dos niveles (mujeres extraídas de la planta de manufactura y mujeres
extraídas de Secretaría). Luego se trata de un diseño intersujetos 3x2. El diseño está equilibrado
porque hay 5 mujeres en cada combinación de tratamiento con planta.

2- El investigador ha informado que ninguno de los factores principales ha resultado significativo. Esto
significa que: A) la interacción no puede ser significativa; B) ni el lugar de selección de las mujeres ni el
tratamiento han resultado significativos; C) el experimento ha resultado fallido.

Con la frase inicial (ninguno de los factores principales ha resultado significativo) lo único que
podemos concluir es que ninguno de los factores ha alcanzado la significatividad (ninguno ha
afectado a la pérdida de peso de las mujeres). No sabemos nada de la interacción (no nos lo han
dicho y de la afirmación realizada no podemos deducir nada ya que la significatividad de los factores
principales no nos dice nada sobre la significatividad de la interacción). Un experimento no resulta
fallido por sus resultados.

3- El investigador ha informado que la F de la interacción fue 4.722. De manera aproximada, y utilizando las
tablas correspondientes ¿ha resultado significativa?: A) No es posible saberlo sin conocer la media
cuadrática del error; B) Sí, ya que 4.722 es superior a 3.493; C) No porque, siendo cierta H0, la
probabilidad de obtener un valor de 4.722 o superior es superior a 0.05.

-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

Comparamos el estadístico de contraste ( ) con el valor crítico. Los grados de libertad son 2
y 24. Si sólo utilizamos las tablas buscamos con 2 y 20 grados de libertad, obteniendo un valor:
. Dado que: , existen diferencias significativas entre al menos un par
de medias.

SITUACIÓN 6: Diversos estudios ponen de manifiesto que las enfermedades de tipo alérgico se ven
agravadas por la presencia de fuerte estrés. Además, la época del año parece afectar de forma decisiva a la
gravedad de los trastornos alérgicos. En un estudio se ha utilizado una muestra aleatoria de 5 pacientes
alérgicos (todos con el mismo tipo de alergia) sometidos a condiciones de alto estrés. Un grupo de
especialistas ha evaluado la gravedad de la alergia de cada paciente (en una escala de 0 a 10) en los cuatro
periodos estacionales: primavera, verano, otoño e invierno. Para analizar estos datos, el investigador utilizó
un ANOVA cuyas razones básicas aparecen a continuación (utilice un   0,05 ):

[A] [S] [AxS] [T]


910 852.5 940 845

Tenemos un diseño de un factor de medidas repetidas con cuatro niveles (periodos estacionales) y
cinco sujetos. En primer lugar calculamos las sumas de cuadrados a partir de las razones básicas:

[ ] [ ]
[ ] [ ]
[ ] [ ]

A continuación construimos la tabla de ANOVA.

FV SC g.l. MC F
A 65 21,67 11,5573
S 7,5 1,875
AxS 22,5 12 1,875
T 95 5

1- Se trata de un diseño: A) factorial de 2 factores (estrés y estación del año); B) factorial de un factor con 4
niveles; C) factorial de 2 factores con 2 niveles cada uno.

2- El análisis realizado es del tipo: A) contrabalanceado; B) inter-sujetos; C) intra-sujetos.

3- La Media Cuadrática del error (en este caso, AxS) vale aproximadamente: A) 5; B) 21.67; C) 1.87.

4- La F crítica para evaluar el efecto del factor vale: A) 3.49; B) 4.474; C) 5.953.

Buscando en las Tablas F de Fisher para 3 y 12 grados de libertad, observamos que la respuesta
correcta es A.

-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

5- El informe de este trabajo debería realizarse de la siguiente manera: A) F(3, 12) = 11.56, MSe = 1.875, p
< 0.05; B) F(3, 12) = 0.05, MSe = 11.59, p > 0.10; C) F(12, 3) = 11.59, MSe = 21.67, p = 0.05.

6- El análisis de los datos nos indicaron una potencia de 0.99 para el factor “Periodo estacional”. Esto
significa que: A) Como el valor es cercano a la unidad, no existen diferencias en la gravedad de la alergia
en función del periodo estacional; B) debemos realizar contrastes a posteriori; C) La probabilidad de
rechazar la hipótesis nula H 0 : Pr imavera  Verano  Otoño  Invierno siendo esta falsa vale 0.99.

7- Si deseamos evaluar el supuesto de simetría compuesta en este estudio, necesitaremos disponer de la


matriz de varianzas-covarianzas que tendrá: A) 4x3 celdillas; B) 3x3 celdillas; C) 4x4 celdillas.

8- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede adoptar valores
negativos porque: A) los valores de la ordenada (eje vertical) son todos positivos; B) toda distribución de
densidad de probabilidad se estandariza para que tenga un área igual a la unidad; C) es el cociente entre
dos varianzas y estas son siempre positivas.

9- El contrabalanceo de las condiciones experimentales es necesario realizarlo: A) en diseños intra-sujetos;


B) cuando no existen efectos de práctica o fatiga; C) para aleatorizar los efectos de las condiciones
manipuladas.

-9-
Diseños de investigación y análisis de datos. Ejercicios Tema 8

SITUACIÓN 1. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final del curso (Y) y la obtenida en el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:

S.C. g.l. M.C. F Prob.


Regresión 28,097 1 28,097 V W
Residual 23,778 6 T
Total U

1- ¿Cuál fue el tamaño de la muestra elegida?: A) 6; B) 7; C) 8.


2- ¿Cuál es la varianza muestral insesgada de la calificación de los estudiantes (Y) al final del curso?:
A) 51,875; B) 7,411; C) 3,397.
3- ¿Qué proporción de la varianza de Y es explicada por la varianza de X?: A) 0,736; B) 0,542; C) No
hay datos suficientes para calcularlo.
4- Con un nivel de confianza del 95%, ¿cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que no hay relación lineal significativa entre X e Y?: A) 5,987; B) 5,59; C)
6,608.
5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
están correlacionados; B) las distribuciones condicionadas de los errores deben de tener una
distribución normal; C) No deben estar relacionadas la variables predictora y la variable
dependiente o criterio.

SITUACIÓN 2. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final de curso (Y) y la obtenida el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:

S.C. g.l. M.C. F


Regresión 42,734 1 42,734 17,345
Residual U V W
Total 64,909 10

1- ¿Aproximadamente, cuál es la varianza muestral insesgada de los errores del modelo de


regresión? A) 2,217; B) 4,273; C) 2,464.
2- ¿Con un nivel de confianza del 95%, cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que hay no relación lineal significativa entre Y y X?; A) 5,117; B) 5,59; C)
6,608.
3- ¿Aproximadamente cuál es el coeficiente de correlación de Pearson entre X e Y? A) 0,787; B) 0,97;
C) 0,811.
4- ¿Cuál es el error típico del modelo de regresión? A) 2,464; B) 1,57; C) 1,665.

-1-
Diseños de investigación y análisis de datos. Ejercicios Tema 8

5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
son independientes; B) las distribuciones condicionadas de los errores deben de tener una
distribución uniforme; C) no deben estar relacionadas las variables predictora y la variable
dependiente o criterio.

SITUACIÓN 3. Anscombe (1973) presentó cuatro conjuntos de datos artificiales que tenían la
misma recta de regresión pero eran claramente diferentes. En la Figura 1 se puede ver uno de
estos conjuntos de datos (11 pares de datos) junto con la recta de regresión que mejor ajusta por
el criterio de mínimos cuadrados.

Estadísticos de este conjunto de


datos:

𝑆𝑥 = 3,316

𝑆𝑦 = 2,030

𝑟𝑥𝑦 = 0,816

𝛼 = 0,05

1. El cumplimiento del supuesto de homocedasticidad en regresión no puede evaluarse en este


conjunto de datos debido a que: A) el proceso de selección de los datos no ha sido aleatorio; B)
para cada valor de X solo tenemos un valor de Y; C) no hay normalidad de las distribuciones
condicionadas de Y con respecto a Xi.
2. La recta de regresión no pasa exactamente por ningún punto porque: A) existe un valor atípico o
extremo; B) aunque la variabilidad es pequeña en este conjunto de datos, siempre existe una
cierta cantidad de ella que impide que el ajuste sea perfecto; C) el ajuste por mínimos cuadrados
está mal realizado.
3. Con los datos proporcionados, la pendiente de la recta de regresión vale aproximadamente: A)
0’499; B) 0; C) en la gráfica se ve claramente que la recta corta al eje Y en el punto 5, luego sin
hacer cálculos podemos afirmar que esta es la pendiente.
4. Si eliminamos el dato atípico que aparece en la gráfica (X10=13, Y10=12’74), el valor de rXY sería: A)
0.4992 = 0.249; B) igual al coeficiente de determinación; C) la unidad porque el ajuste sería
perfecto.
5. Si el valor de R2 es 0,666 esto significa que: A) también el error típico ( ) es de 0,666; B) la parte
de la variabilidad en Y atribuible a otros factores no relacionados linealmente con Y es de 0,666;
C) el porcentaje en que se reduce el error de Y cuando empleamos la recta de regresión para su
estimación es del 66,6%.

-2-
Diseños de investigación y análisis de datos. Ejercicios Tema 8

6. En el modelo de regresión (𝑌 = 𝐵0 + 𝐵𝑋 + 𝜀), ε representa: A) el efecto del factor manipulado; B)


la interacción entre el error y el factor manipulado; C) el efecto de todas aquellas variables que no
hemos manipulado ni controlado.
7. El análisis de la regresión para los datos de la Figura nos indicó que la regresión fue significativa
[F(1, 9) = 17,972, MCres = 1,528, p = 0,002]. Luego sabemos que el valor de t con 9 grados de
libertad fue aproximadamente: A) 4,24; B) 321,12; C) 0.
8. En un análisis de regresión múltiple tendremos tantas pendientes: A) como queramos; B) como
nos indiquen los grados de libertad de la fuente de variación “Residual” en la tabla del ANOVA; C)
como variables independientes hayamos introducido en el modelo.

SITUACIÓN 4. Los siguientes datos relacionan el número de cigarrillos diarios (X) consumidos con
el número de radicales libres (Y) localizados en los pulmones de 8 individuos:
2 2
Sujeto X Y XY X Y
1 0 94 0 0 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
Sumatorio 137 1735 39218 3545 452493
Des. Típica 12,24 97,60
rxy = 0,99

1- La ecuación de regresión en puntuaciones tipificadas que relaciona el número de cigarrillos con el


número de radicales libres viene dada por la expresión: A) 𝑍𝑦´ = −2,1 ∙ 𝑍𝑋 ; B) 𝑍𝑦´ = 1,5 ∙ 𝑍𝑋 ; C)
𝑍𝑦´ = 0,99 ∙ 𝑍𝑋
2- La ecuación de regresión en puntuaciones tipificadas que relaciona X e Y: A) tiene un único
parámetro; B) tiene como parámetro el mismo valor que la ecuación de regresión en
puntuaciones diferenciales; C) tiene dos parámetros: la pendiente y el punto de corte con la
ordenada.
3- La pendiente de la ecuación de regresión para predecir Y a partir de X en puntuaciones directas
vale: A) -3,32; B) 7,92; C) 0,99.
4- En regresión lineal por mínimos cuadrados se dice que la recta de regresión es una estimación
insesgada debido a que: A) se calculan los valores de pendiente y punto de corte con la ordenada
tales que hacen mínimo el error al cuadrado; B) cuantifica el incremento que se produce en la
estimación de la variable dependiente (Y’) cuando la independiente (X) aumenta en una unidad;
C) los valores esperados de los estimadores coinciden con los parámetros que estiman.
5- Sabiendo que el punto de corte con la ordenada (B0) vale 81,09, a un sujeto que fume 0 cigarrillos
le pronosticaremos un número de radicales libres en pulmones igual a: A) 7,93; B) 81,09; C) 0.
6- Conociendo la recta de regresión de mínimos cuadrados de Y sobre X podemos calcular Y’. La
correlación de estas puntuaciones predichas (Y’) con los errores (Y-Y’) vale: A) 0; B) lo mismo que
la pendiente; C) lo mismo que el coeficiente de alienación.

-3-
Diseños de investigación y análisis de datos. Ejercicios Tema 8

7- Si queremos poner a prueba la hipótesis 𝐻0 : 𝜌 = 0 mediante el estadístico de contraste F


obtendríamos un valor aproximado de: A) 594,00; B) 295,51; C) 1,00.
8- El error típico de la distribución muestral de la pendiente vale, aproximadamente: A) 0,12; B)
7,97; C) 0,46.
9- Si en la Situación 4 incluyéramos también la cantidad de grasas saturadas ingeridas a la semana
para predecir el número de radicales libres, el modelo de estimación lineal sería:
A)Radicales_Libres ′ = B1 Nº_cigarrillos + B2 Grasas_Saturadas + B0 ;
B)Radicales_Libres ′ = B1 Nº_cigarrillos + B2 Grasas_Saturadas;
C) Radicales_Libres ′ = Nº_cigarrillos + Grasas_Saturadas + B0 .

10- En un modelo de regresión múltiple, el cálculo de las correlaciones de orden cero: A) implica el
cálculo de la regresión entre las variables independientes y, posteriormente, la extracción de los
residuos; B) no nos permite saber qué parte de la varianza de la VD es capaz de explicar
independientemente cada una de las VI’s; C) nos permite hallar relaciones bivariadas puras.

Sujetos X Y
1 6 8
SITUACIÓN 5. Un psicólogo escolar considera que la 2 4 3
comprensión lectora es un elemento que juega un papel 3 7 8
fundamental en el éxito académico de los estudiantes. Para 4 3 4
comprobar su hipótesis, selecciona aleatoriamente un grupo 5 5 4
de 16 estudiantes de 4º de la ESO a los que aplica un test de 6 9 10
comprensión lectora (X). A continuación, y en coordinación 7 7 7
con el profesor de ciencias sociales, se les aplica una prueba 8 4 5
sobre un tema de historia (Y) que acaban de estudiar, 9 2 4
10 5 2
consistiendo dicha prueba en una serie de preguntas sobre un
11 8 7
texto básico que tienen que leer y que está relacionado con el
12 9 9
tema estudiado. 13 10 8
14 6 6
15 3 5
16 1 3

1- Con el fin de analizar la relación entre la comprensión lectora y el rendimiento en la prueba de


historia, ¿qué tipo de análisis es el más adecuado para una investigación de este tipo?: A) análisis
de varianza con dos factores completamente aletorizados; B) análisis de correlación/regresión; C)
análisis de la varianza de un factor.
2- ¿Cuál es el coeficiente de correlación de Pearson entre X e Y? A) 0,676; B) 0,324; C) 0,822.
3- La recta de regresión que mejor se ajusta a los datos es: Y´= 0,256 + 0,482X; B) Y´= 2,354 + 0,529X;
C) Y´= 1,681 + 0,743X
4- El valor de la suma de cuadrados de la regresión es: A) 27,991; B) 86,438; C) 58,447.
5- La proporción de variabilidad de Y explicada por la variabilidad en X, es: A) 0,676; B) 0,822; C)
0,324.
6- El valor del estadístico F para el contraste de la regresión es: A) 31,578; B) 29,233; C) 25,821.
7- La probabilidad asociada al estadístico F para el contraste de la regresión es 0,0001, de ello puede
deducirse que: A) para un nivel de significación de 0,01 NO existe relación entre X e Y; B) para un

-4-
Diseños de investigación y análisis de datos. Ejercicios Tema 8

nivel de significación de 0,01 existe relación entre X e Y; C) para un nivel de significación de 0,05
existe relación entre X e Y, pero no para un nivel de significación de 0,01.
8- El valor más aproximado del estadístico de contraste para la pendiente de regresión es: A) 5,407;
B) 1,996; C) 0,743.
9- Para un nivel de significación de 0,05, los límites del intervalo de confianza para la pendiente de la
regresión son: A) (-0,125; 3,487); B) (-0,125; 1,037); C) (0,448; 1,037).
10- Teniendo en cuenta los límites del intervalo de confianza obtenido para la pendiente de la
regresión, podemos decir que, a un nivel de significación de 0,05: A) se acepta la hipótesis
alternativa según la cual existe relación entre X e Y, ya que el intervalo de confianza no incluye el
valor cero; B) se acepta la hipótesis nula según la cual no existe relación entre X e Y, ya que el
intervalo de confianza incluye el valor cero; C) se acepta la hipótesis nula según la cual no existe
relación entre X e Y, ya que el intervalo de confianza no incluye el valor cero.

SITUACIÓN 6. El artículo “Efecto de la temperatura sobre el pH de la leche” (Journal of Dairy


Research, 1988, 277-280) informó de un estudio en el que se utilizaron 5 temperaturas diferentes
(medidas en grados centígrados) en condiciones experimentales controladas en una granja y se
midió el pH de la leche obtenida para cada temperatura. La ecuación de regresión calculada fue
𝑌 ′ = 0,65 + 0,22𝑋. El objetivo era predecir el pH de la leche (Y) a partir de la temperatura (X).
Utilice un 𝛼 = 0,05. Además se sabe que: 𝑆𝑦 = 1,87 y 𝑆𝑥 = 7,90.

1- La ecuación genérica de regresión de Y sobre X: 𝑌 = 𝑎 + 𝑏 𝑋 + 𝜖, es una relación: A)


probabilística ya que depende de la cantidad aleatoria 𝜖; B) funcional cúbica ya que existen tres
componentes aditivos en la ecuación; C) determinista ya que el valor de Y está completamente
determinado por el valor de X.

2- La distribución del error en la ecuación de regresión lineal simple 𝑌 = 𝑎 + 𝑏 𝑋 + 𝜖 tiene una


media igual a: A) 𝑌̅; B) 𝑋̅ ; C) 0.

3- En regresión lineal simple, se asume que la desviación típica del error en la ecuación 𝑌 = 𝑎 +
𝑏 𝑋 + 𝜖 : A) es igual a la unidad; B) es la misma para cada valor particular de X; C) es igual a 0.

4- El estadístico para poner a prueba la significación del coeficiente de correlación entre el pH y la


temperatura vale aproximadamente: A) 3,91; B) 4,36; C) 1,32.

5- El estadístico de la Tabla del Anova para poner a prueba si la Regresión como fuente de variación
es significativa vale aproximadamente: A) 19,0; B) 1,2; C) 2,1.

6- El contraste de hipótesis para determinar si la pendiente de la recta de regresión es significativa


es: A) bilateral; B) unilateral derecho; C) unilateral izquierdo.

7- El intervalo de confianza para contrastar la pendiente vale: A) (0’38, 0’06); B) (-0’15, +0’15); C) (-
0’32, -0’15).

8- El coeficiente de correlación semiparcial entre el pH y la temperatura: A) coincide con el


coeficiente de regresión estandarizado; B) no tiene sentido calcularlo ya que estamos en una
situación de regresión simple; C) coincide con el coeficiente de determinación.

-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

SITUACIÓN 1. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final del curso (Y) y la obtenida en el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:

S.C. g.l. M.C. F Prob.


Regresión 28,097 1 28,097 V W
Residual 23,778 6 T
Total U

En primer lugar deducimos los datos que faltan en la tabla de ANOVA.

23,778
𝑈 = 28,097 + 23,778 = 51,875 𝑇= = 3,963
6
28,097
𝑉= = 7,09
3,963

Completamos la tabla de ANOVA.

S.C. g.l. M.C. F


Regresión 28,097 1 28,097 7,09
Residual 23,778 6 3,963
Total 51,875 7 7,411

1- ¿Cuál fue el tamaño de la muestra elegida?: A) 6; B) 7; C) 8.

Sabiendo los grados de libertad de la suma de cuadrados total: 𝑛 − 1 = 7 → 𝑛 = 8

2- ¿Cuál es la varianza muestral insesgada de la calificación de los estudiantes (Y) al final del curso?:
A) 51,875; B) 7,411; C) 3,397.

La varianza muestral insesgada (cuasivarianza) es igual a:

∑(𝑌 − 𝑌̅)2
𝑆̂𝑦2 =
𝑛−1

Que podemos calcular con la tabla de ANOVA, dado que es igual a la media cuadrática total.

3- ¿Qué proporción de la varianza de Y es explicada por la varianza de X?: A) 0,736; B) 0,542; C) No


hay datos suficientes para calcularlo.

La proporción de varianza de Y explicada por la varianza de X es igual al coeficiente de


determinación (coeficiente de correlación de Pearson al cuadrado), que podemos deducir de la
tabla de ANOVA:

-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

2
𝑆𝐶𝑟𝑒𝑔 28,097
𝑟𝑥𝑦 = = = 0,542
𝑆𝐶𝑌 51,875

4- Con un nivel de confianza del 95%, ¿cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que no hay relación lineal significativa entre X e Y?: A) 5,987; B) 5,59; C)
6,608.

Consultando las tablas F para 1 y 6 grados de libertad comprobamos que la puntuación 5,987
supera una proporción igual a 5,987.

5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
están correlacionados; B) las distribuciones condicionadas de los errores deben de tener una
distribución normal; C) No deben estar relacionadas la variables predictora y la variable
dependiente o criterio.

SITUACIÓN 2. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final de curso (Y) y la obtenida el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:

S.C. g.l. M.C. F


Regresión 42,734 1 42,734 17,345
Residual U V W
Total 64,909 10

Deducimos fácilmente los datos que nos faltan en la tabla:


𝑈 22,175
𝑈 = 64,909 − 42,734 = 22,175; 𝑉 = 10 − 1 = 9; 𝑊 = 𝑉 = 9
= 2,4639

La tabla completa queda:

SC gl MC F
Regresión 42,734 1 42,734 17,345
Residual 22,175 9 2,4639
Total 64,909 10

1- ¿Aproximadamente, cuál es la varianza muestral insesgada de los errores del modelo de


regresión? A) 2,217; B) 4,273; C) 2,464.

La varianza muestral insesgada de los errores del modelo de regresión coincide con la media
cuadrática residual.

-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

2- ¿Con un nivel de confianza del 95%, cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que hay no relación lineal significativa entre Y y X?; A) 5,117; B) 5,59; C)
6,608.

Buscando en las tablas F de Fisher para 1 y 9 grados de libertad, comprobamos que la respuesta
correcta es A.

3- ¿Aproximadamente cuál es el coeficiente de correlación de Pearson entre X e Y? A) 0,787; B) 0,97;


C) 0,811.

El cociente entre la suma de cuadrados de la regresión y la suma de cuadrados total es el


coeficiente de determinación, luego su raíz cuadrada será el coeficiente de correlación de Pearson.

42,734
𝑟𝑥𝑦 = √ = ±0,811
64,909

Suponemos que la relación entre la calificación obtenida a final del curso y la obtenida en el curso
anterior es directa, por lo que: 𝑟𝑥𝑦 = 0,811

4- ¿Cuál es el error típico del modelo de regresión? A) 2,464; B) 1,57; C) 1,665.

∑(𝑌 − 𝑌′)2 22,175


𝑆̂𝑒 = √ =√ = 1,57
𝑛−2 9

5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
son independientes; B) las distribuciones condicionadas de los errores deben de tener una
distribución uniforme; C) no deben estar relacionadas las variables predictora y la variable
dependiente o criterio.

-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

SITUACIÓN 3. Anscombe (1973) presentó cuatro conjuntos de datos artificiales que tenían la
misma recta de regresión pero eran claramente diferentes. En la Figura 1 se puede ver uno de
estos conjuntos de datos (11 pares de datos) junto con la recta de regresión que mejor ajusta por
el criterio de mínimos cuadrados.

Estadísticos de este conjunto de


datos:

𝑆𝑥 = 3,316

𝑆𝑦 = 2,030

𝑟𝑥𝑦 = 0,816

𝛼 = 0,05

1. El cumplimiento del supuesto de homocedasticidad en regresión no puede evaluarse en este


conjunto de datos debido a que: A) el proceso de selección de los datos no ha sido aleatorio; B)
para cada valor de X solo tenemos un valor de Y; C) no hay normalidad de las distribuciones
condicionadas de Y con respecto a Xi.

La homocedasticidad se refiere a la igualdad de varianzas en Y para los diversos valores de la


variable predictora X. No podemos determinar esta igualdad de varianza si solo tenemos un valor
de Y para cada valor de X ya que no tenemos una distribución de valores de Y. Luego la opción
correcta es la B.
La opción A es incorrecta ya que la forma en que han sido seleccionados los datos es irrelevante
para la determinación de la homocedasticidad. La opción C es incorrecta porque no se refiere a la
homocedasticidad sino a la normalidad.

2. La recta de regresión no pasa exactamente por ningún punto porque: A) existe un valor atípico o
extremo; B) aunque la variabilidad es pequeña en este conjunto de datos, siempre existe una
cierta cantidad de ella que impide que el ajuste sea perfecto; C) el ajuste por mínimos cuadrados
está mal realizado.

Debemos observar que todos los puntos dados se sitúan exactamente de forma lineal entre sí. La
recta de regresión dibujada ha sido “alejada” debido a la influencia del valor “outlier” o extremo
en X = 13. Si no existiera este valor, la recta calculada habría pasado exactamente por el resto de
puntos. Luego la opción correcta es la A. La opción B es irrelevante en relación a la pregunta
planteada. La opción C es falsa ya que el ajuste por mínimos cuadrados se realizó correctamente
por Anscombe.

-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

3. Con los datos proporcionados, la pendiente de la recta de regresión vale aproximadamente: A)


0’499; B) 0; C) en la gráfica se ve claramente que la recta corta al eje Y en el punto 5, luego sin
hacer cálculos podemos afirmar que esta es la pendiente.

𝑆𝑦 2,030
𝐵 = 𝑟𝑥𝑦 = 0,816 ∙ = 0,499542
𝑆𝑥 3,316

4. Si eliminamos el dato atípico que aparece en la gráfica (X10=13, Y10=12,74), el valor de rXY sería: A)
0,4992 = 0,249; B) igual al coeficiente de determinación; C) la unidad porque el ajuste sería
perfecto.

En este caso, el ajuste sería perfecto ya que todos los puntos se sitúan sobre una línea recta. Si
este es el caso, el ajuste sería perfecto (no habría error).

5. Si el valor de R2 es 0,666 esto significa que: A) también el error típico (𝜎𝜀 ) es de 0,666; B) la parte
de la variabilidad en Y atribuible a otros factores no relacionados linealmente con Y es de 0,666;
C) el porcentaje en que se reduce el error de Y cuando empleamos la recta de regresión para su
estimación es del 66,6%.

La definición de R2 (o coeficiente de determinación) es “es la proporción de la variabilidad de la VD


que es imputada (o explicada por) la variabilidad de la VI” . Luego la opción correcta es la C.

6. En el modelo de regresión (𝑌 = 𝐵0 + 𝐵𝑋 + 𝜀), ε representa: A) el efecto del factor manipulado; B)


la interacción entre el error y el factor manipulado; C) el efecto de todas aquellas variables que
no hemos manipulado ni controlado.

El componente  del modelo representa el error que todavía queda cuando aplicamos la
pendiente y el punto de corte con la ordenada. Por consiguiente, representa la aportación de las
variables extrañas al experimento. Opción correcta C.

7. El análisis de la regresión para los datos de la Figura nos indicó que la regresión fue significativa
[F(1, 9) = 17,972, MCres = 1,528, p = 0,002]. Luego sabemos que el valor de t con 9 grados de
libertad fue aproximadamente: A) 4,24; B) 321,12; C) 0.

Una F y una t se relacionan según la fórmula: 𝑇𝑛2 = 𝐹1,𝑛 . Luego como sabemos que F1,9 = 17,972, el
valor de t será: √17,972 = 4,239

8. En un análisis de regresión múltiple tendremos tantas pendientes: A) como queramos; B) como


nos indiquen los grados de libertad de la fuente de variación “Residual” en la tabla del ANOVA; C)
como variables independientes hayamos introducido en el modelo.

-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

SITUACIÓN 4. Los siguientes datos relacionan el número de cigarrillos diarios (X) consumidos con
el número de radicales libres (Y) localizados en los pulmones de 8 individuos:
2 2
Sujeto X Y XY X Y
1 0 94 0 0 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
Sumatorio 137 1735 39218 3545 452493
Des. Típica 12,24 97,60
rxy = 0,99

1- La ecuación de regresión en puntuaciones tipificadas que relaciona el número de cigarrillos con el


número de radicales libres viene dada por la expresión: A) 𝑍𝑦´ = −2,1 ∙ 𝑍𝑋 ; B) 𝑍𝑦´ = 1,5 ∙ 𝑍𝑋 ; C)
𝑍𝑦´ = 0,99 ∙ 𝑍𝑋

La respuesta correcta es C. El propio enunciado nos proporciona el valor del coeficiente de


correlación de Pearson.
2- La ecuación de regresión en puntuaciones tipificadas que relaciona X e Y: A) tiene un único
parámetro; B) tiene como parámetro el mismo valor que la ecuación de regresión en
puntuaciones diferenciales; C) tiene dos parámetros: la pendiente y el punto de corte con la
ordenada.
3- La pendiente de la ecuación de regresión para predecir Y a partir de X en puntuaciones directas
vale: A) -3,32; B) 7,92; C) 0,99.
𝑆𝑦 97,60
𝐵 = 𝑟𝑥𝑦 = 0,99 = 7,929
𝑆𝑥 12,24
4- En regresión lineal por mínimos cuadrados se dice que la recta de regresión es una estimación
insesgada debido a que: A) se calculan los valores de pendiente y punto de corte con la ordenada
tales que hacen mínimo el error al cuadrado; B) cuantifica el incremento que se produce en la
estimación de la variable dependiente (Y’) cuando la independiente (X) aumenta en una unidad;
C) los valores esperados de los estimadores coinciden con los parámetros que estiman.
5- Sabiendo que el punto de corte con la ordenada (B0) vale 81,09, a un sujeto que fume 0 cigarrillos
le pronosticaremos un número de radicales libres en pulmones igual a: A) 7,93; B) 81,09; C) 0.
6- Conociendo la recta de regresión de mínimos cuadrados de Y sobre X podemos calcular Y’. La
correlación de estas puntuaciones predichas (Y’) con los errores (Y-Y’) vale: A) 0; B) lo mismo que
la pendiente; C) lo mismo que el coeficiente de alienación.
7- Si queremos poner a prueba la hipótesis 𝐻0 : 𝜌 = 0 mediante el estadístico de contraste F
obtendríamos un valor aproximado de: A) 594,00; B) 295,51; C) 1,00.
𝑅2 0,992
𝐹= = = 295,51
(1 − 𝑅 2 )/(𝑁 − 2) (1 − 0,992 )/(8 − 2)

-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

8- El error típico de la distribución muestral de la pendiente vale, aproximadamente: A) 0,12; B)


7,97; C) 0,46.

2
𝑆𝑦 1 − 𝑟𝑥𝑦 97,60 1 − 0,992
𝜎𝐵 = √ = √ = 0,46
𝑆𝑥 𝑛 − 2 12,24 6

9- Si en la Situación 4 incluyéramos también la cantidad de grasas saturadas ingeridas a la semana


para predecir el número de radicales libres, el modelo de estimación lineal sería:
A)𝐑𝐚𝐝𝐢𝐜𝐚𝐥𝐞𝐬_𝐋𝐢𝐛𝐫𝐞𝐬 ′ = 𝐁𝟏 𝐍º_𝐜𝐢𝐠𝐚𝐫𝐫𝐢𝐥𝐥𝐨𝐬 + 𝐁𝟐 𝐆𝐫𝐚𝐬𝐚𝐬_𝐒𝐚𝐭𝐮𝐫𝐚𝐝𝐚𝐬 + 𝐁𝟎 ;
B)Radicales_Libres ′ = B1 Nº_cigarrillos + B2 Grasas_Saturadas;
C) Radicales_Libres ′ = Nº_cigarrillos + Grasas_Saturadas + B0 .

10- En un modelo de regresión múltiple, el cálculo de las correlaciones de orden cero: A) implica el
cálculo de la regresión entre las variables independientes y, posteriormente, la extracción de los
residuos; B) no nos permite saber qué parte de la varianza de la VD es capaz de explicar
independientemente cada una de las VI’s; C) nos permite hallar relaciones bivariadas puras.

Sujetos X Y
1 6 8
SITUACIÓN 5. Un psicólogo escolar considera que la 2 4 3
comprensión lectora es un elemento que juega un papel 3 7 8
fundamental en el éxito académico de los estudiantes. Para 4 3 4
comprobar su hipótesis, selecciona aleatoriamente un grupo 5 5 4
de 16 estudiantes de 4º de la ESO a los que aplica un test de 6 9 10
comprensión lectora (X). A continuación, y en coordinación 7 7 7
con el profesor de ciencias sociales, se les aplica una prueba 8 4 5
sobre un tema de historia (Y) que acaban de estudiar, 9 2 4
10 5 2
consistiendo dicha prueba en una serie de preguntas sobre un
11 8 7
texto básico que tienen que leer y que está relacionado con el 12 9 9
tema estudiado. 13 10 8
14 6 6
15 3 5
16 1 3

En primer lugar, vamos a calcular varianzas de X e Y, coeficiente de correlación de Pearson y los


coeficientes de la recta de regresión.

-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

Sujetos X Y X2 Y2 XY
1 6 8 36 64 48
∑ 𝑋2 ∑ 𝑌2
2 4 3 16 9 12 𝑆𝑥2 = 𝑛
− 𝑋̅ 2 = 6,621; 𝑆𝑦2 = 𝑛
− 𝑌̅ 2 = 5,402
3 7 8 49 64 56
4 3 4 9 16 12 𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌
5 5 4 25 16 20 𝑟𝑥𝑦 = = 0,822
6 9 10 81 100 90 √[𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 ][𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ]
7 7 7 49 49 49
8 4 5 16 25 20
9 2 4 4 16 8 𝒓𝟐𝒙𝒚 = 𝟎, 𝟖𝟐𝟐𝟐 = 𝟎, 𝟔𝟕𝟔
10 5 2 25 4 10
11 8 7 64 49 56 𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 𝑆𝑦
𝐵= 2 2
= 𝑟𝑥𝑦 = 0,743
12 9 9 81 81 81 𝑛 ∑ 𝑋 − (∑ 𝑋) 𝑆𝑥
13 10 8 100 64 80
14 6 6 36 36 36
15 3 5 9 25 15
𝐵0 = 𝑌̅ − 𝐵𝑋̅ = 1,681
16 1 3 1 9 3
Sumas 89 93 601 627 596

1- Con el fin de analizar la relación entre la comprensión lectora y el rendimiento en la prueba de


historia, ¿qué tipo de análisis es el más adecuado para una investigación de este tipo?: A) análisis
de varianza con dos factores completamente aletorizados; B) análisis de correlación/regresión; C)
análisis de la varianza de un factor.
2- ¿Cuál es el coeficiente de correlación de Pearson entre X e Y? A) 0,676; B) 0,324; C) 0,822.
3- La recta de regresión que mejor se ajusta a los datos es: Y´= 0,256 + 0,482X; B) Y´= 2,354 + 0,529X;
C) Y´= 1,681 + 0,743X
4- El valor de la suma de cuadrados de la regresión es: A) 27,991; B) 86,438; C) 58,447.
La suma de cuadrados total es: 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = ∑(𝑌 − 𝑌̅)2
Conociendo 𝑆𝑦2 podemos calcularla: 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 𝑛 ∙ 𝑆𝑦2 = 16 ∙ 5,402 = 86,4375

También podemos calcular 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 con la fórmula utilizada en los temas de ANOVA:
(∑ 𝑌𝑖 )2 932
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑌𝑖2 − = [𝑌] − [𝑇] = 627 − = 86,4375
𝑛 16
2
Dado que el coeficiente de determinación es igual a: 𝑟𝑥𝑦 = 0,676, la suma de cuadrados debida a
2
la regresión es: 𝑆𝐶𝑅𝑒𝑔 = 𝑟𝑥𝑦 ∙ 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 0,676 ∙ 86,4375 = 58,447

Completamos la tabla de ANOVA para la regresión lineal:

FV SC gl MC F
Regres. 58,447 1 58,447 29,233
Residual 27,991 14 1,999
Total 86,438 15

-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

5- La proporción de variabilidad de Y explicada por la variabilidad en X, es: A) 0,676; B) 0,822; C)


0,324.
6- El valor del estadístico F para el contraste de la regresión es: A) 31,578; B) 29,233; C) 25,821.
7- La probabilidad asociada al estadístico F para el contraste de la regresión es 0,0001, de ello puede
deducirse que: A) para un nivel de significación de 0,01 NO existe relación entre X e Y; B) para un
nivel de significación de 0,01 existe relación entre X e Y; C) para un nivel de significación de 0,05
existe relación entre X e Y, pero no para un nivel de significación de 0,01.
8- El valor más aproximado del estadístico de contraste para la pendiente de regresión es: A) 5,407;
B) 1,996; C) 0,743.

𝐹 = 𝑇 2 → 𝑇 = √𝐹 = √29,233 = 5,407
9- Para un nivel de significación de 0,05, los límites del intervalo de confianza para la pendiente de la
regresión son: A) (-0,125; 3,487); B) (-0,125; 1,037); C) (0,448; 1,037)

2
𝑆𝑦 1 − 𝑟𝑥𝑦 2,324 1 − 0,676
𝐸𝑚𝑎𝑥 = 𝑡𝑛−2;1−𝛼⁄2 𝜎𝐵 = 𝑡𝑛−2;1−𝛼⁄2 √ = 2,145 √ = 0,2947
𝑆𝑥 𝑛 − 2 2,573 16 − 2

1,037
0,743 ± 0,2947 → {
0,448

10- Teniendo en cuenta los límites del intervalo de confianza obtenido para la pendiente de la
regresión, podemos decir que, a un nivel de significación de 0,05: A) se acepta la hipótesis
alternativa según la cual existe relación entre X e Y, ya que el intervalo de confianza no incluye
el valor cero; B) se acepta la hipótesis nula según la cual no existe relación entre X e Y, ya que el
intervalo de confianza incluye el valor cero; C) se acepta la hipótesis nula según la cual no existe
relación entre X e Y, ya que el intervalo de confianza no incluye el valor cero.

SITUACIÓN 6. El artículo “Efecto de la temperatura sobre el pH de la leche” (Journal of Dairy


Research, 1988, 277-280) informó de un estudio en el que se utilizaron 5 temperaturas diferentes
(medidas en grados centígrados) en condiciones experimentales controladas en una granja y se
midió el pH de la leche obtenida para cada temperatura. La ecuación de regresión calculada fue
𝑌 ′ = 0,65 + 0,22𝑋. El objetivo era predecir el pH de la leche (Y) a partir de la temperatura (X).
Utilice un 𝛼 = 0,05. Además se sabe que: 𝑆𝑌 = 1,87 y 𝑆𝑋 = 7,90.

1- La ecuación genérica de regresión de Y sobre X, 𝑌 = 𝑎 + 𝑏 𝑋 + 𝜖 , es una relación: A)


probabilística ya que depende de la cantidad aleatoria 𝝐; B) funcional cúbica ya que existen tres
componentes aditivos en la ecuación; C) determinista ya que el valor de Y está completamente
determinado por el valor de X.

2- La distribución del error en la ecuación de regresión lineal simple 𝑌 = 𝑎 + 𝑏 𝑋 + 𝜖 tiene una


media igual a: A) 𝑌̅; B) 𝑋̅ ; C) 0.

-9-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

3- En regresión lineal simple, se asume que la desviación típica del error en la ecuación 𝑌 = 𝑎 +
𝑏 𝑋 + 𝜖 : A) es igual a la unidad; B) es la misma para cada valor particular de X; C) es igual a 0.

4- El estadístico para poner a prueba la significación del coeficiente de correlación entre el pH y la


temperatura vale aproximadamente: A) 3,91; B) 4,36; C) 1,32.

𝑆𝑦 1,87
𝐵 = 𝑟𝑥𝑦 → 0,22 = 𝑟𝑥𝑦 → 𝑟𝑥𝑦 = 0,929
𝑆𝑥 7,90

𝑟𝑥𝑦 √𝑛 − 2 0,929√5 − 2
𝑡𝑛−2 = = = 4,36
√1 − 2
𝑟𝑥𝑦 √1 − 0,9292

5- El estadístico de la Tabla del Anova para poner a prueba si la Regresión como fuente de variación
es significativa vale aproximadamente: A) 19,0; B) 1,2; C) 2,1.

𝑡 2 = 𝐹 → 𝐹 = 4,362 = 19,01

6- El contraste de hipótesis para determinar si la pendiente de la recta de regresión es significativa


es: A) bilateral; B) unilateral derecho; C) unilateral izquierdo.

7- El intervalo de confianza para contrastar la pendiente vale: A) (0’38, 0’06); B) (-0’15, +0’15); C) (-
0’32, -0’15).

2
𝑆𝑦 1 − 𝑟𝑥𝑦 1,87 1 − 0,9292 0,38
𝐵 ± 𝑡1−𝛼⁄ ( √ ) → 0,22 ± 3,182 ∙ √ →{
2,𝑛−2 𝑆𝑥 𝑛 − 2 7,90 5−2 0,06

8- El coeficiente de correlación semiparcial entre el pH y la temperatura: A) coincide con el


coeficiente de regresión estandarizado; B) no tiene sentido calcularlo ya que estamos en una
situación de regresión simple; C) coincide con el coeficiente de determinación.

-10-
Susana R.

RCP respuesta única ( teoría) (si hay alguna pregunta que no os suena puede ser del libro
anterior y no es materia de estudio )
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS.
Tema 1

1. Si un estimador, no coincide, en promedio, con el parámetro que intenta estimar y además


su distribución tiene poca variabilidad: Decimos que es un estimador eficiente

2. La varianza muestral es: Un estimador consistente de la varianza poblacional y Un


estimador sesgado de la varianza poblacional.

3. La eficiencia relativa: Es un valor entre O y 1 y Es un cociente entre dos varianzas

4. La varianza insesgada es: b) La varianza muestral multiplicada por n y dividida por n-1.

5. La desviación típica de la distribución muestral de un estadístico es: Una medida de


variabilidad y El error típico de ese estadístico.

6. Si la varianza muestral (sesgada) vale 100, el estimador insesgado de la varianza


poblacional: a) Es mayor que 100

7. Si la esperanza de un estimador no es igual al parámetro: a) El sesgo no es nulo

8. La eficiencia de un estimador es una medida de variabilidad: a) De ese estimador.

9. La distribución de frecuencias de una característica en la población viene definida por


su media y su: c) Varianza.

10. Un estimador es insesgado: a) Si la media de la distribución muestral del estimador es


igual al parámetro y b) Si la esperanza del estimador es igual al parámetro.

11. ¿Cuál de estos estimadores es suficiente para m? b) 1/n (Y1+.......+Yn)

12. El error típico de la varianza es: a) La desviación típica de la distribución muestral de


la varianza.
13. E(P) = p por lo que la proporción de la muestra P: a) Es un estimador insesgado de la
proporción poblacional

14. Cuando la distribución muestral de un estimador Ô1 es menos variable que la de otro


estimador Ô2, diremos que: b) Ô1 es más eficiente que Ô2

15. Un estimador es suficiente: a) Si utiliza toda la información de la muestra para estimar


el parámetro.

16. El sesgo del estimador es: c) La diferencia entre la media de la distribución muestral
del estimador y el parámetro.

17. El error típico de la media es: a) La raíz cuadrada de la varianza de la distribución


muestral de la media
18. Si la eficiencia relativa de un estimador, Ô1 respecto a otro estimador, Ô2 es del 85%,
para un mismo tamaño muestral: c) El cociente entre las varianzas de las distribuciones
muestrales de los respectivos estimadores es 0,85

19. En la estimación puntual: b) Se toma un valor muestral concreto como estimación del
parámetro.

20. Un estimador es más eficiente: a) Cuanto mayor sea la varianza de la distribución


muestral del estimador. y b) Cuanto menos varíe el valor del estimador de una muestra a
otra

21. ¿Cuál es la varianza de la distribución muestral del estimador 1 si sabemos que la


eficiencia relativa de él y otro estimador 2 es de 0,89 y la varianza de 2 35?: c) 31,5

22. El intervalo de confianza: b) Es más pequeño cuanto mayor es el nivel de confianza,


para los mismos datos.

23. Cuando se rechaza Ho mediante el nivel crítico p: a) Necesariamente se rechazará con


el valor crítico.

24. El estadístico de contraste Z para una media vale -2,15, siendo alfa igual a 0,05, n= 145
y el contraste bilateral. b) Se rechaza Ho

25. El rechazo de H1 implica necesariamente que: c) El valor muestral del estadístico de


contraste cae en la zona de aceptación de Ho

26. A la zona de rechazo de la hipótesis nula se suele llamar: b) Región crítica

27. Cuando ponemos a prueba una hipótesis, el método que se utiliza para tomar una
decisiónentre la hipótesis nula (Ho) y la hipótesis alternativa (H1) es: c) El contraste de
hipótesis.

28. El nivel crítico p: b) Para su cálculo se tiene en cuenta la dirección del contraste
(unilateral/bilateral)

29. Elija la alternativa correcta: b) El nivel crítico p es un valor entre 0 y 1

30. Los intervalos de confianza: a) Formalmente son un método de estimación de


parámetros

31. En los contrastes de hipótesis. c) Si el valor obtenido al aplicar el estadístico de


contraste cae dentro de la región de aceptación, podemos rechazar la hipótesis alternativa.

32. La hipótesis nula: c) Ambas alternativas son incorrectas.

33. La desviación típica de la distribución muestral de un estadístico se llama: Error típico

34. Sobre el nivel de significación alfa de un contraste estadístico: a) Se fija antes de


analizar los datos

35. El nivel crítico p y el nivel de significación alfa: a) Son probabilidades


Y b) Su comparación permite decidir si se rechaza o no la hipótesis nula
36. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la
muestra: c) Mayor es la amplitud del intervalo.

37. Cuando construimos un intervalo de confianza para la media, manteniendo constantes


los demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n.c.) del 95% en lugar
del 99%. b) Aumenta la probabilidad de cometer error tipo I.

38. Una estimación por intervalos: c) Establece un rango de valores dentro del cual se
estima esté el valor del parámetro.

39. Beta de un contraste estadístico: b) Es una probabilidad.

40. La hipótesis nula: “la varianza del grupo 1 es mayor o igual que la varianza del grupo
2”, se refiere a un contraste: c) Unilateral izquierdo.

41. Con n = 50, la probabilidad del error tipo II es igual a 0,30. Con un n = 40 y
manteniendo constantes los demás factores: b) Beta será superior a 0,30

42. El valor crítico : b) Es función de alfa

43. El nivel crítico p: b) Su valor depende del valor muestral del estadístico

44. La probabilidad de error tipo II representa: c) La probabilidad de aceptar la hipótesis


nula siendo falsa.

45. Cuanto mayor es la probabilidad del error tipo II, manteniendo constantes los demás
factores: a) Menor es el nivel de significación

46. La probabilidad de error tipo I representa: a) La probabilidad de rechazar la hipótesis


nula siendo verdadera

47. El contraste de hipótesis tiene como finalidad:


a) Obtener información sobre algún aspecto de la población de la que se extrajo la
muestra.

48. Que dos hipótesis sean mutuamente excluyentes significa que: c) El rechazo de una de
ellas implica necesariamente la aceptación de la otra

49. La idea general del contraste de hipótesis es hallar: a) La probabilidad asociada al valor
muestral del estadístico.

50. Una hipótesis alternativa del tipo μ<μ0 plantea un contraste: a) Unilateral izquierdo

51. El nivel de significación (α): b) Se fija de forma arbitraria en la planificación de la


investigación

52. Sobre el nivel crítico p: b) Puede ser menor que uno

53. Cuando construimos un intervalo de confianza para la media, manteniendo constantes


los demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n. c.) del 99% en lugar
del 95%?: a) Con un n.c. del 99% la probabilidad de α será menor y menor la probabilidad
de cometer error tipo I.
54. Si obtenemos un nivel crítico p mayor que el alfa adoptado quiere decir que: c) Los
resultados no son estadísticamente significativos.

55. Sobre alfa y el nivel crítico p: b) Si sus valores son iguales se rechaza la hipótesis nula
56. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la
muestra: a) Mayor es la precisión del intervalo

57. La distribución muestral de la media es normal: a) Cuando es normal la distribución de


la variable estudiada o cuando tiende a la normalidad a medida que aumenta el tamaño de
la muestra

58. El error típico de la distribución muestral del estadístico varianza es: a) La desviación
típica de la distribución muestral de la varianza

59. Sabemos que la variable rendimiento académico se distribuye normalmente en la


población de estudiantes de Bachillerato en España, pero no conocemos el valor de la
varianza de tal variable. Un investigador quiere saber entre qué límites se encuentra la
media del rendimiento académico en la población. Toma una muestra aleatoria e
independiente de 400 estudiantes y obtiene una media de 20 siendo la varianza insesgada
de 4. ¿Cuál de las siguientes alternativas expresa el valor aproximado, del límite inferior
del intervalo de confianza para α = 0,05? c) 16,08

60. Hemos extraído una muestra aleatoria de 49 sujetos y le hemos medido el pulso en
reposo, obteniendo una media igual a 60 pulsaciones por minuto. Sabemos que las
pulsaciones forman una escala de intervalo y se distribuyen normalmente con varianza
poblacional igual a 16. Tomamos un n.c. del 99%. ¿cuál será el error máximo (Emáx)
aproximado en el cálculo del intervalo de confianza para μ? b) 1,47

61. Se considera que hemos obtenido un resultado estadísticamente significativo cuando:


a) Cuando se acepta H1
62. En el contraste de hipótesis para la varianza tratamos de:
a) Probar si nuestros datos concretos han podido ser obtenidos de una población con esa
varianza.

63. En el contraste de hipótesis, la elección de: b) μ0, μ1, α, β es arbitraria mientras que la σ2
y n no lo son.

64. La distribución muestral de un estadístico permite inferir:a) Un parámetro

65. Cuando calculamos el intervalo de confianza para la proporción, en el caso de una


muestra, nuestro objetivo es determinar: a) Los valores que limitan el valor del parámetro
proporción que cumplen la característica

66. Hemos extraído una muestra aleatoria de 36 sujetos y les hemos medido el tiempo de
reacción a un estímulo visual, obteniendo una media igual a 50 milisegundos. La varianza
poblacional de la distribución de los tiempos de reacción es igual a 9. Sabiendo esto, cuál
será el intervalo de confianza del 95% en torno a la media poblacional:
a) 49,02 < μ < 50,98

67. Hemos aplicado un cuestionario de ansiedad a una muestra de 16 deportistas antes de


una competición y obtuvimos una puntuación media en ansiedad iguala 5. Las
puntuaciones en el cuestionario de ansiedad forman una escala de intervalo y se
distribuyen normalmente con varianza igual a 4. ¿Entre qué valores esperamos se
encuentre la media poblacional de la ansiedad precompetitiva, a un nivel de confianza del
95%?.: b) 4,02 < μ < 5,98

68. Atendiendo a los datos del problema anterior, entre qué valores esperamos se
encuentre la media poblacional de la ansiedad precompetitiva, a un nivel de confianza del
99%: a) 3,71 < μ < 6,29

69. Hemos estimado en una muestra de 16 españoles, la media del grado de acuerdo sobre
la legalización del aborto obteniendo Ȳ = 8. El grado de acuerdo sobre la legalización del
aborto es una variable medida a nivel de intervalo que se distribuye normalmente en la
población con σ2 = 36. Asumiendo un nivel de confianza del 95%, qué tamaño debe tener
la muestra para que la media no se aleje más de ± 1 punto de la media poblacional: 139

70. Con los datos del problema anterior, sin tener en cuenta que conocemos la varianza
poblacional, sino que conocemos desviación típica y la media del grado de acuerdo sobre
la legalización del aborto, Ȳ = 8 y S = 5. Queremos saber, a un nivel de confianza del 99%
qué tamaño debe tener la muestra para que la media estimada no se aleje más de ± 3
puntos de la media poblacional: b) 26

71. En una investigación sobre ansiedad, contrastamos la hipótesis nula de que la media
poblacional e igual o mayor que 10. i sabemos que el valor muestral del estad stico de
contraste z = 2,88 y el nivel crítico, p= 0,002, ¿qué significa esta p?:
a) Que la probabilidad de obtener un estadístico de contraste igual o menor que el hallado
es 0,002.

72. Teniendo en cuenta los datos del problema anterior y adoptando un α= 0,01:
a) Se rechaza H0, puesto que p < α

TEMA 2: CONTRASTE DE HIPÓTESIS EN LOS CONTRASTES DE UNA MUESTRA.

La potencia: b) Es deseable que no sea inferior a 0,80

2. Con n = 40, la potencia es igual a 0,70. Con un n = 60 y manteniendo constantes los


demás factores: b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor
que 0,70

3. El estadístico de contraste Z para una media vale 3, siendo alfa igual a 0,05, n = 120, y el
contraste bilateral: c) Se rechaza H0

4. En los contrastes de hipótesis referidos a una muestra, cuando el interés del


investigador se centra en el parámetro media, lo que se prueba es: a) Si nuestros datos
concretos han sido obtenidos de una población con esa media

5. Con n = 30, la potencia es igual a 0,60. Con un n = 40 y manteniendo constantes los


demás factores: b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor
que 0,60

6. En la potencia del contraste de hipótesis, la relación de α y n: a) Es inversa con β

7. Para realizar el contraste de hipótesis sobre la proporción, utilizamos el estadístico P


que se calcula con:a) Datos dicotómicos.

8. En el contraste de hipótesis para la varianza, la variable aleatoria cuyo parámetro σ2


0 pretendemos contrastar, sigue un función de densidad de probabilidad: c) Normal.
9. Un contraste de varianza permite comprobar si los datos de la muestra proceden de una
población con varianza igual a la estipulada en H0: b) Sí
10. Un contraste de una media permite comprobar si los datos de la muestra proceden de
una población con media igual a la estipulada en la hipótesis nula: a) Sí

11. Cuál de las siguientes afirmaciones es correcta: b) En el caso de una sola muestra y si
se conoce la varianza de la población el estadístico de contraste para la varianza es Z.
12. Las condiciones para poder aplicar el estadístico de contraste Z en el caso de la
proporción (una sola muestra) incluyen: a) Muestra aleatoria de n observaciones y
población dicotómica.

13. Tenemos una población normal con varianza conocida. Se toma de ella una muestra de
tamaño n = 15. Para estimar el valor del parámetro media poblacional μ, utilizaremos un
estadístico de contraste cuya distribución es: a) Normal (N(0,1))

14. La distribución muestral de un estadístico de contraste es la distribución T de Student


con n – 1 g. L. Y el contraste es unilateral derecho. Para un valor muestral igual a 1,33 y 17
grados de libertad, el nivel crítico p es: a) 0,10

15. La prueba de Wilcoxon para una muestra: b) También conocida como prueba de
rangos y signos.

16. La prueba de Wilcoxon frente a la de signos: a) Gana en precisión ya que aprovecha


mejor la información disponible.

17. Aplicamos el estadístico de contraste W de Wilcoxon (para una muestra) y obtenemos


t+ =101 y t- =19, siendo α = 0,05, n= 15 y el contraste bilateral:
b) Se rechaza H0
18. Cuando en el cálculo del estadístico de contraste de Mann-Whitney-Wilcoxon se
observan empates: a) En la ordenación conjunta de las puntuaciones, a los valores
empatados se les asigna la media de sus órdenes.

19. Las condiciones para poder aplicar el estadístico de contraste S (signos) en el caso de
una sola muestra: c) Muestra aleatoria de n observaciones y cualquier tipo de distribución
20. El estadístico S se aproxima a una distribución normal: c) Siempre.

21. El estadístico S normalmente sigue una distribución: a) Normal

22. Para probar hipótesis relativas a la mediana, cuando se cumple la aleatoriedad de las
observaciones, la distribución de la variable es simétrica en la población y el nivel de
medida de intervalos, aplicaremos la prueba de: a) Wilcoxon antes que la de signos porque
aporta más información.

23. Para contrastar hipótesis sobre la mediana, si queremos utilizar la prueba de Wilcoxon,
es necesario que el nivel de medida de los datos sea, al menos: c) De intervalo

24. La depresión es una variable medida a nivel de intervalo que se distribuye


normalmente en la población con varianza conocida. Para una muestra n = 16, ¿qué valor
toma la probabilidad del error tipo II si al contrastar H0: μ = 5 frente a H1: μ = 7, vale 0,70
la probabilidad de rechazar la hipótesis nula siendo falsa?: a) 0,30
25. Sabemos por trabajos anteriores que un antidepresivo tiene una tolerancia media,
sobre los pacientes que lo toman, de 1,5 según algún índice de tolerancia (cuanto mayor es
el índice mayor es la tolerancia) y una varianza igual a 1. Pensamos que modificando la
fórmula química del antidepresivo podríamos incrementar la tolerancia a este
medicamento sin que se modifique su propiedad antidepresiva. El grado de tolerancia al
antidepresivo es una variable medida a nivel de razón que se distribuye normalmente en
la población. Para un n = 25, ¿cuál es la probabilidad de obtener un resultado significativo,
si hipotetizamos una diferencia de + 0,5 entre la media bajo la hipótesis alternativa y
aquélla bajo la hipótesis nula (μ1 – μ0 =0,5) teniendo en cuenta un α = 0,01?: c) 0,56

26. En algunas investigaciones sobre conformismo social, los madrileños fueron


calificados de conformistas. Un investigador basándose en sus propios estudios, opina que
los madrileños no son conformistas, hipotetizando un puntuación inferior a 5 en una
escala de conformismo social que va de 0 a 10, lo cual indicaría inconformismo. Sabiendo
que las puntuaciones en conformismo social forman una escala de intervalo y se
distribuyen normalmente en la población con varianza igual a 1, ¿cuál será la potencia del
contraste para H1 : μ = 4, manteniendo constantes los demás factores?: α = 0,05 y n = 25
c)0,9996

27. En una distribución muestral normal (del estadístico media), con una media de 30 y
una desviación típica de 16, ¿qué probabilidad hay de obtener al azar una media
comprendida entre 14 y 26?: b) 0,6826

28. En una muestra aleatoria de 101 sujetos, procedentes de una población normal e
infinita, se ha obtenido una media igual a 40 y una desviación típica igual a 15. ¿Qué
porcentaje de medias hay comprendido entre los valores t picos = 2,4 y = 1,5 de la
distribución muestral de la media?: a) 92,5%

29. Se ha realizado la distribución muestral de la media con 225 muestras, de 90 sujetos


cada una, y se ha comprobado que es normal. En la población, el valor de la media es de 45
(μ = 45) y el de la desviación típica de 15 (σ = 15). Cuál será el valor típico (puntuación
típica) que, llevado a ambos lados de la media, comprende el 90% de los casos de esa
distribución muestral?: b) ± 1,65

30. Teniendo en cuenta los datos del problema anterior, qué media de esa distribución
muestral dejará por debajo de sí el 90% de los casos: a) 47,02

31. A una muestra aleatoria de 17 estudiantes de secundaria se les aplicó una prueba cuya
finalidad era medir sus conocimientos sobre conceptos científicos básicos. En la variable
analizada, los estudiantes se distribuyen normalmente con una media igual a 78. Los
resultados del estudio en la muestra fueron: media igual a 84,984 y desviación típica igual
a 16. El intervalo de confianza de la distribución muestral será: α = 0,05 ± 2,12

32. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste será:
b) t = 1,746

33. con los datos de los dos problemas anteriores, el criterio de decisión será:
c) Para un n. c. del 0,95 no podemos aceptar la H1.

34. Una muestra aleatoria de 30 personas presenta una desviación típica, en la variable
“tiempo de ejecución” de una tarea de reconocimiento de palabras, igual a 120 segundos.
Queremos saber si es compatible este resultado, a un nivel de confianza de 99% con el
supuesto de que la desviación típica en la población (para esta variable), con una
distribución normal, es de 150 segundos. Teniendo esto en cuenta, el planteamiento de las
hipótesis sería: b) H0 : σ2 = 1502 y H1 : σ2≠ 1502

35. Con los datos del problema anterior, el estadístico de contraste será:
a) χ2 = 19,2
36. Teniendo en cuenta los datos de los dos problemas anteriores, el intervalo confidencial
será: c) 13,1 < χ2 < 52,3

37. La decisión tomada sobre los resultados será la siguiente: c) Como nuestro estadístico
de contraste se encuentra en el intervalo confidencial al 99% de n. c., no podemos rechazar
la hipótesis nula.

38. Con muestras aleatorias de 121 sujetos, la distribución muestral de la media (de una
variable que se distribuye normalmente en la población) tiene una media de 25 y como
desviacióntípica de 10. La formulación de las hipótesis será: n.c. : 95% a) H0 : μ = 25 y H1 : μ
≠ 2539. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste
para comprobar que una muestra del mismo tamaño con media = 28 y desviación típica =
30 pertenece a la misma población será: a) Z = 0,3

40. atendiendo a los resultados anteriores, el criterio de decisión será:


b) Podemos afirmar que la media obtenida por nosotros en la investigación, es
compatible, a un nivel de confianza del 95%, con la hipótesis de que la media de la
población sea de 25.

41. En una muestra aleatoria de 200 sujetos, procedentes de una población normal e
infinita, se ha obtenido una media igual a 60 y una desviación típica igual a 20. Cuál será el
error típico de la media: c) 1,42

42. Un educador piensa que sólo un 15% de los alumnos de cuarto de primaria, del colegio
en el que trabaja, son capaces de manejar con rapidez el diccionario. Para comprobar lo
que piensa, selecciona al azar una muestra de 150 alumnos de ese curso y les realiza una
prueba de manejo del diccionario. Teniendo en cuenta estos datos, la formulación de las
hipótesis estadísticas será: α = 0,05 a) H0: π = 0,15 y H1: π ≠ 0,15

43. Teniendo en cuenta los datos del problema anterior, el contraste será:
c) Bilateral

44. El estadístico de contraste para los datos de los dos problemas anteriores será:

b) Z = 1,715

45. Atendiendo a los datos de los problemas anteriores, la interpretación de los resultados
será: b) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador
está justificada, es decir, que sólo un 15% de los alumnos maneja con rapidez el
diccionario.

46. El equipo docente de la asignatura Diseños de Investigación y Análisis de Datos


considera que el 50% de los alumnos que se presentan a examen, obtienen una nota de 7 o
más. Tras realizar el examen de febrero, comprueban que en una muestra aleatoria de 200
exámenes, 70 obtienen la calificación de Notable, 20 son calificados con Sobresaliente, 80
obtienen la calificación de Aprobado y 30 la de Suspenso. Sabiendo que: Suspenso < 5; 7 >
Aprobado ≥ 5; 9 > Notable ≥ 7; Sobresaliente ≥ 9 ¿Qué planteamiento dará el equipo
docente a las hipótesis estadísticas?: (n. c., 95%) a) H0 : η = 7 y H1 : η ≠ 7
47. Según los datos del problema anterior, el estadístico de contraste será:
c) = 1,41

48. Atendiendo a los resultados obtenidos, la conclusión a la que se puede llegar es la


siguiente: a) Es posible seguir manteniendo que la mediana de la población de referencia
está en la puntuación 7, es decir, que el 50% de los alumnos que se presentan a examen
obtienen una nota de 7 o más, con un nivel de confianza del 95%.

TEMA 3

1. Los diseños de investigación intersujetos determinan analizar los datos con estadísticos
de contraste para: b) Muestras independientes

2. Si tras establecer el intervalo de confianza respecto a una diferencia entre proporciones


independientes, encontramos que el valor cero no se encuentra en el intervalo:
c) Debemos rechazar la hipótesis nula de igualdad entre proporciones poblacionales.

3. Cuando establecemos el intervalo de confianza para la diferencia entre pares de medias


correspondientes a muestras independientes, se mantendrá la H0 si:
a) El valor del parámetro estipulado en H0 cae dentro del intervalo.

4. ¿Cuál de las alternativas es correcta?: (LAS DOS)


a) Dos muestras son independientes cuando las observaciones o medidas son
independientes entre las muestras, pero no dentro de ellas.
b) Cuando se mide una variable en los dos miembros de n pares de sujetos siendo los
miembros de cada par muy similares en alguna característica relevante, estamos ante
un diseño de medida independientes.

5. En el cálculo del estadístico de contraste T para el caso de dos muestras independientes


es necesario conocer: a) La varianza insesgada de cada muestra

6. Para aplicar un contraste de medias en dos muestras independientes, se debe cumplir


que: b) La variable dependiente debe estar medida, al menos, a nivel de intervalo

7. Queremos contrastar que H0: π21 = π12. Hemos estimado que la diferencia entre las dos
proporciones poblacionales estará entre los valores 0,047 y 0,470 con una probabilidad
igual a 0,99. Se podría interpretar que: a) Ambas proporciones son distintas

8. En el contraste estadístico de dos medias independientes:


a) Lo más habitual es desconocer el valor de las varianzas poblacionales
9. Hemos seleccionado aleatoriamente un grupo de 10 imágenes y las procesamos con dos
programas de ordenador (cinco a cada programa asignadas aleatoriamente) para ver si
existen diferencias entre los tiempos medios de procesamiento de las imágenes, ¿cómo
son lasmuestras? a) Independientes

10. Para la aplicación del estadístico W de Wilcoxon (LAS DOS)


a) No importa la forma de la distribución de la variable
b) La distribución de la variable debe ser normal

11. En algunas investigaciones sobre percepción de olores, se encontró que la diferencia


entre la proporción de mujeres que detectan la presencia de moléculas de androsterona y
la de los varones es 0,10. Para contrastar este resultado, extraemos una muestra aleatoria
de 800 mujeres (M) y otra de 400 hombres (H), y encontramos que 640 mujeres y 200
varones detectan la presencia de dichas moléculas. Cuál sería la formulación de las
hipótesis estadísticas: (N.c. 99%) a) H0: πM πH = D = 0,10 y H1: πM πH ≠ D ≠ 0,10

12. El estadístico de contraste en el caso de los datos del problema anterior sería:
b) Z = 6,9
13. La conclusión obtenida en nuestro análisis sería: a) Para un n. c., igual a 0,99, la
diferencia entre la proporción poblacional de mujeres que detectan la presencia de
moléculas de androsterona y la de los varones es distinta de 0,10.

14. Un psicólogo deportivo desea estudiar el efecto de la relajación sobre la amplitud de


apertura de piernas (AP). Extrae aleatoria e independientemente 9 gimnastas con una AP
similar y las asigna también aleatoriamente a dos grupos. A los del primer grupo (grupo
experimental),les somete a un programa de estiramiento de 14 semanas de duración en el
que se introducen ejercicios de relajación y a los del segundo grupo (grupo control) les
somete al mismo programa de estiramiento pero sin ejercicios de relajación. Finalizado el
programa de estiramiento, mide la amplitud de la apertura de piernas a los 9 gimnastas.
Las medidas obtenidas en los grupos experimental (E) y control (C) son las siguientes:
E: 130 127 142 145 135
C: 110 125 120 115
La amplitud de movimiento es una variable medida en grados que se distribuye
normalmente
en ambas poblaciones con varianzas desconocidas pero supuestas iguales. N. c. 95%
Según estos datos, ¿cuál sería la formulación de la hipótesis nula?: (LAS DOS)
a) H0: μE = μC y H1: μE ≠ μC
b) H0: μE μC = 0 y H1: μE μC ≠ 0

15. Atendiendo a los datos del problema anterior, la zona de rechazo de la hipótesis nula
está formada por: b) Todos los valores iguales y menores que t7, 0,025 = 2,36 e iguales y
mayores que t7, 0,975 = 2,36

16. Continuando con el problema anterior, el valor del estadístico de contraste será:
a) t = 3,52

17. Según los datos de los problemas anteriores (14, 15 y 16), podemos afirmar:
a) Que los resultados llevan al rechazo de H0, a un nivel de significación igual a 0,05, de
que las muestras proceden de dos poblaciones con medias iguales.

18. Queremos comparar el método tradicional (T) de la UNED con un método nuevo, en
concreto, un método multimedia (M), para la enseñanza a distancia de la estadística.
Nuestra hipótesis es que los alumnos que estudien con el método tradicional obtendrán
unas notas inferiores a las de los alumnos que estudien con el método multimedia.
Extraemos aleatoria e independientemente 7 alumnos del segundo curso de psicología de
la UNED y les asignamos también aleatoriamente a los dos métodos de enseñanza. Los
datos que aparecen a continuación representan las notas obtenidas en un examen de
estadística en ambas muestras de alumnos:
Método Tradicional (MT): 4 5 6 2
Método Multimedia (MM): 9 8 10
La nota en estadística es una variable medida a nivel de intervalo que se distribuye
normalmente en ambas poblaciones con varianzas: σ2T = 4 y σ2 M = 2. N. c. 95%. Teniendo
en cuenta estos datos, ¿cuál será la formulación de las hipótesis estadísticas?:
b) H0: μT ≥ μM y H1: μT < Μm
19. Atendiendo a los datos del problema anterior, el valor del estadístico de contraste será:
c) Z = 3,68

20. Continuando con los datos de los problemas anteriores, podemos afirmar que: b) A
nivel poblacional, los alumnos que estudiaron con el método tradicional tienen una
nota media en estadística inferior a los que estudiaron con el método multimedia,
asumiendo un nivel de significación igual a 0,05.

21. Algunas variables ejercen su influencia sobre las conductas haciendo éstas más o
menos variables. Un investigador quiere investigar esta cuestión en la conducta afectiva de
los niños. Su hipótesis es que la conducta afectiva de los niños es menos variable que la de
las niñas. Extrae una muestra aleatoria de 41 niñas y otra de 31 niños y les mide la
afectividad mediante un cuestionario obteniendo una varianza insesgada igual a 9 en la
muestra de niños y una de 36 en la muestra de niñas. La variable puntuación en el
cuestionario de afectividad está medidaa nivel de intervalo. ¿cuál será el planteamiento
de la hipótesis estadísticas? (N. c. 99%)
c) H0: σ2A ≤ σ2 O ó H0: σ2A / σ2 O ≤ 1 y H1: σ2A > σ2 O ó H1: σ2 A / σ2 O > 1
22. El estadístico de contraste, atendiendo a los datos del problema anterior será:
c) f = 4

23. La zona de rechazo de la hipótesis nula estará formada por todos los valores:
a) Todos los valores iguales y mayores que f0,99; 40, 30 = 2,30

24. Los resultados llevan a las siguientes conclusiones:


b) Los resultados llevan al rechazo de H0 con un nivel de significación igual a 0,01, de que
la varianza de las puntuaciones en el cuestionario de afectividad en la población de
niñas, es igual o menor que en la de niños.

25. Se quiere comprobar el efecto de un método novedoso de aprendizaje en dos grupos


de niños, uno de 4 alumnos y otro de 3. Sabemos que el análisis estadístico ha aportado
diferencias significativas del efecto del nuevo método con respecto al tradicional. Sabemos
que el grupo de n=4 al que se le aplicó el método nuevo, obtuvo una media igual a 6 y una
desviación típica insesgada de 4, y que el grupo de n=3 al que se le aplicó el método
tradicional obtuvo una media de 5 y una desviación típica insesgada de 2. ¿Cuál será la
magnitud del efecto del método novedoso sobre el tradicional? c) 0,29

26. Tras realizar análisis estadístico sobre dos muestras de 7 y 8 sujetos, los resultados
apoyan la hipótesis del investigador de que la relajación influye positivamente sobre la
elasticidad en los deportistas. Los resultados obtenidos son los siguientes:
Grupo 1: n=7 ȲR = 125,8 σ2 R = 68,7 (Grupo con relajación) Grupo 2: n=8 ȲNR=119,5 σ2
NR =61,67 (Grupo sin relajación) ¿Cuál será la magnitud de la mejoría de la elasticidad tras
aplicar la relación?: a) 0,78

27. Un psicofísico hipotetiza que los hombres y las mujeres no son igualmente variables en
sensibilidad olfativa. Extrae una muestra aleatoria de 13 hombres (H) y otra de 25 mujeres
(M) y les mide la sensibilidad olfativa, obteniendo una varianza insesgada igual a 10 en la
muestra de hombres y de 17 en la de mujeres. La sensibilidad olfativa es una variable
medida a nivel de intervalo que se distribuye normalmente en ambas poblaciones. N. c.
90%. ¿Cuál será la formulación de la hipótesis estadística?:
b) H0: σ2M = σ2 H ó H0: σ2M / σ2H = 1 y H1: σ2 M ≠ σ2 H ó H1: σ2M / σ2H ≠ 1
28. La zona de aceptación de la hipótesis nula, teniendo en cuenta los datos del problema
anterior, está formada por todos los valores : a)f0,05; 24, 12 = 0,46 < H0 < f0,95; 24, 12 = 2,51
29. El estadístico de contraste, atendiendo a los datos de los dos problemas anteriores
será: c) f = 1,70
30. atendiendo a los datos de los problemas anteriores, (27, 28, 29), ¿se rechaza la
hipótesis nula?: b) No, ya que el valor del estadístico de contraste cae dentro de la zona de
aceptación de la hipótesis nula

31. Siguiendo con los problemas anteriores, ¿apoyan los resultados la hipótesis del
investigador?: a) No, ya que se acepta la hipótesis nula.

32. En una investigación en el área de la psicología deportiva, extraemos aleatoria e


independientemente 200 nadadores y les asignamos también aleatoriamente a las dos
condiciones de un experimento, obteniendo dos muestras de 100 nadadores (grupo
experimental y grupo control). Durante un mes, los nadadores del grupo experimental (E),
además de un entrenamiento intenso, son sometidos a una terapia de relajación, mientras
que los del grupo control (C) realizan el mismo entrenamiento intenso pero sin terapia de
relajación. Las respuestas afirmativas dadas por ambos grupos, al finalizar el período de
entrenamiento, a la pregunta “¿se siente muy cansado?”, fueron 60 en el grupo
experimental y 70 en el grupo control. Queremos saber si la terapia de relajación influye
en la proporción de respuestas afirmativas. Teniendo en cuenta un n. c. del 99%, cuál será
el planteamiento de las hipótesis estadísticas: a) H0: πE πC = 0 y H1: πE πC ≠ 0
33. El estadístico de contraste, teniendo en cuenta los datos del problema anterior, será:
c) z = 1,47

34. El nivel crítico p asociado a nuestro estadístico, será: c) 0,1416

35. Teniendo en cuenta los datos del problema anterior, se rechazará la hipótesis nula?:
a) No, porque p = 0,1416 > α = 0,01

36. Según los resultados de los problemas anteriores, a qué conclusiones llegaremos:
b) La relajación no ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.

37. Un investigador quiere estudiar el efecto de la privación de agua sobre el tiempo que
tardan las ratas en recorrer un laberinto. Extrae aleatoria e independientemente 60 ratas y
les asigna también aleatoriamente a las dos condiciones del experimento: 12 y 24 horas de
privación de agua. Las 30 ratas sometidas a 12 horas de privación de agua (muestra A)
tardaron un tiempo medio de 5,9 minutos en recorrer un laberinto y las 30 ratas
sometidas a 24 horas de privación (muestra B) tardaron 6,40 minutos en recorrer el
mismo laberinto, siendo las desviaciones típicas isesgadas 0,29 y 0,30 respectivamente.
Sabiendo que el n. c. fijado por el investigador es del 95%, cuál será el planteamiento de
las hipótesis estadísticas: a) H0: μA = μB ó μA μB = 0 y H1: μA ≠ μB ó μA μB ≠ 0

38. El estadístico de contraste atendiendo a los datos del problema anterior, será:
c) t = 6,58

39. ¿Cuál será el intervalo de confianza?:


b) 0,35 < μA μB < 0,65

40. ¿Se rechazaría la hipótesis nula?: b) Sí, porque la probabilidad asociada al estadístico
de contraste obtenido es menor que el nivel de significación acordado en nuestra
investigación.

TEMA 4
1. Un ejemplo de muestras relacionadas son las obtenidas:
a) Con un diseño clásico antes y después de un tratamiento.
2. Cuando hallamos los valores críticos del estadísticos T, para dos muestras relacionadas,
con más de 30 grados de libertad, acudimos a la tabla de distribución: c) Normal.

3. El estadístico Z aplicado para el contraste de medias en muestras relacionadas, se


distribuye normalmente: a) Con media 0 y varianza 1

4. Cuando hallamos los valores críticos del estadístico T, para dos muestras relacionadas,
con más de 30 grados de libertad, acudimos a la tabla de distribución:
a) Normal

5. En los contrastes para dos muestras dependientes:


c) Un ejemplo típico es el diseño en el que se toman medidas pre y post tratamiento.

6. Cuando se mida una variable en los dos miembros de n pares de sujetos siendo los
miembros de cada par muy similares en variables relevantes del estudio, asumiremos que
las observaciones de ambas muestras: a) Están relacionadas pero ello no implica que las
diferencias entre cada par de observaciones lo estén.

7. Se desea estudiar si una terapia de relajación reduce el nivel de ansiedad. Se obtiene una
muestra aleatoria de 8 sujetos y se les toman medidas en ansiedad antes y después de
aplicarles la terapia. Sabemos que la variable está medida a nivel de intervalo y que la
distribución poblacional de las diferencias entre cada par de puntuaciones es simétrica en
torno a la medida de tendencia central. ¿Qué estadístico de contraste aplicaría?:
W de Wilcoxon

8. La prueba de Wilcoxon: b) Presenta restricciones en cuanto a la distribución de la


variable en la población y en el nivel de medida de los datos.

9. Cuando utilizamos el estadístico de contraste de Mann-Witney-Wilcoxon, hay que tener


en cuenta que las dos poblaciones, si difieren, lo hacen: a) Sólo en tendencia central

TEMA 5: Diseños con más de dos grupos independientes.


1.El análisis de varianza se ocupa: c) De averiguar qué variabilidad corresponde al factor
estudiado y cuál al error experimental.

2. En el análisis de varianza: a) A las variables independientes se las denomina factores y a


las categorías en que se dividen, niveles.

3. Un modelo experimental se considera equilibrado: b) Cuando el número de elementos


es el mismo en todas sus muestras.

4. En un análisis de varianza, si la variabilidad intergrupo es mayor que la variabilidad


intragrupo: c) Significa que existe diferencia entre los grupos en cuanto a la varianza.

5. Dentro de una muestra en el análisis de varianza: b) Se llama variabilidad intra a la que


se produce dentro de las muestras e inter a la que se produce entre las muestras.

6. Se dice que la MCinter es un estimador sesgado de la varianza poblacional:


c) Porque su esperanza es igual a la varianza poblacional más un sumando.

7. Decimos que un modelo es de efectos fijos:


a) Cuando el investigador establece como niveles del factor sólo aquellos que está
interesado en estudiar.

8. En un modelo de efectos variables: b) Las hipótesis se establecen sobre las varianzas


poblacionales de los efectos del factor.

9. La importancia de las comparaciones planificadas radica c) En su naturaleza “ a priori “

10. Los supuestos de análisis de varianza son: b) Normalidad, homocedasticidad e


independencia.

11. El cometido del Análisis de Varianza es: c) Discernir qué variabilidad corresponde al
factor estudiado y cuál al error experimental.

12. El que un modelo sea o no equilibrado cuando aplicamos el análisis de varianza,


depende de: b) El número de elementos de las muestras

13. Con el ANOVA contrastamos, la diferencia de: b) Medias entre varias muestras

14. La varianza intragrupos es la varianza atribuible: a) El error experimental

15. El estadístico de contraste en el análisis de varianza se distribuye según la


distribución: a) F de Snedecor
16. En el razonamiento del análisis de varianza se supone que dentro de un mismo nivel,
las puntaciones deberían ser: a) Semejantes

17. Queremos comprobar si el ambiente en el que se desarrolla un niño influye en los


valores/puntuaciones obtenidas en un test de inteligencia. Para ello, extraemos de la
población dos grupos de 10 niños cada uno. Uno de ellos de una zona deprimida (grupo D)
y otro de otra zona con un nivel socieconómico elevado (grupo E). Se aplica a ambos
grupos un test de inteligencia y se obtienen los siguientes datos:
SCtotal = 2250,8 SCintra= 1379,6 ¿Cuál será el estadístico más adecuado a utilizar?
a) Estadístico F

18. Cuál será el resultado de nuestro estadístico atendiendo a los datos del problema 24?.
c) F= 11,36

19. Cuál será nuestro valor crítico, atendiendo a los datos del problema 24? b) 4,414

20. A un n.c. del 95% aceptaríamos la Hipótesis alternativa?: (datos del problema 24)
a) Sí porque el valor del estadístico es mayor que nuestro valor crítico.

21. Teniendo en cuenta los resultados obtenidos en los ejercicios anteriores (24 al 27), la
conclusión a la que hemos llegado es la siguiente: c) Al haber obtenido una diferencia
significativa en nuestro estudio, se deduce que el ambiente en el que se desarrolle un niño
influye en las puntuaciones obtenidas en un test de inteligencia.

TEMA 6: ANÁLISIS DE DATOS EN DISEÑOS INTRASUJETOS

1. La diferencia entre dos observaciones del mismo sujeto: (las dos)


a) Depende de la diferencia debida a los efectos del tratamiento
b) Depende de la varianza residual o error (efectos incontrolados)
2. Se pretende estudiar el efecto de un tratamiento, con 5 niveles o dosis diferentes, sobre
10 sujetos. El estadístico de contraste toma un valor F = 29,42 . Para un nivel de confianza
del 0,99. Deseamos saber si el tratamiento ha hecho algún efecto sobre los sujetos.
c) Sí, el tratamiento ha hecho efecto, por eso rechazamos la Ho
3. Según el problema anterior, ahora empleamos 3 niveles de tratamiento y 5 sujetos. El
estadístico obtenido es F = 18,12 El n. c. ahora es del 0,95. Según los datos: c) Rechazamos
la Ho puesto que el estadístico de contraste arroja diferencias significativas.
4. De una muestra de imágenes con el mismo número de puntos (es decir, del mismo
tamaño), se han escogido al azar ocho imágenes diferentes (tomadas en distintas escenas)
y se las ha procesado mediante cuatro algoritmos de emparejamiento (A, B, C, D), con el
objeto de ver el número de emparejamientos incorrectos (EI) que se producía con cada
uno y así determinar la eficacia relativa de los mismos. Teniendo en cuenta un n. c. del
99% y sabiendo que la suma de cuadrados del tratamiento es 248,5, la suma de cuadrados
error es 22 y la suma de cuadrados total es 341,5, cuál será el valor del estadístico de
contraste: c) 64,78

5. El valor crítico obtenido, atendiendo a los datos del problema anterior, será:
a) 4,87

6. Con un nivel de confianza del 99% podemos afirmar (según los datos de los problemas 4
y 5):
c) Que existen diferencias significativas entre al menos dos de los algoritmos en número
de emparejamientos incorrectos.

7. Se lleva a cabo una investigación para estudiar si las Técnicas de Inoculación de Estrés
(TIE) tienen efecto sobre la ansiedad precompetitiva de los corredores de velocidad. Para
ello, se seleccionaron aleatoriamente 12 atletas de entre todos aquéllos que puntuaron
alto en una batería de tests de ansiedad y se les enseñaron la TIE. Para estudiar el efecto
de las TIE se tomaron cuatro medidas de ansiedad precompetitiva mediante un
cuestionario específico en cuatro ocasiones: la 1ª fue tomada en una situación de
laboratorio antes de enseñarles las TIE (LA), la 2ª en una situación previa a la competición
antes de la TIE (CA), la 3ª en una situación de laboratorio después de las TIE (LD) y la 4ª
en una situación previa a la competición después de las TIE (CD). Teniendo en cuenta un
n.c. del 99% y que la suma de cuadrados del tratamiento vale 26,25, la suma de cuadrados
error vale 52,25 y la suma de cuadrados total vale 297,25, ¿cuál será el valor del
estadístico de contraste?: c) 5,526

8. El valor crítico, según los datos del problema anterior es: b) 4,51

9. Atendiendo a los datos de los dos problemas anteriores, podemos concluir que:
a) Existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.

DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 7


1. El laboratorio de aprendizaje animal dispone de doce ratas de una cierta raza, con las
que realiza un experimento. Posteriormente adquieren otro grupo de doce ratas (de otra
raza) y, tras la realización del mismo experimento, en las mismas condiciones, sospechan
que los resultados son diferentes según con qué grupo de ratas se realice la experiencia.
La prueba consistía en tomar los tiempos que tardaban en travesar un corredor con
recompensa final, después de 1, 2 ó 3 días de privación de comida.
La variable dependiente (tiempos) se distribuye normalmente, además, las observaciones
son independientes y las varianzas homogéneas. (n. c. 95%) Teniendo en cuenta estos
datos, cuál sería el valor crítico para el factor A (tipo de rata):
a) 4,41
2. Cuál sería el valor crítico para el factor B (tiempo de privación de comida): b) 3,55

3. Cuál sería el valor crítico para la interacción de ambos factores (AB): c) 3,55
4. Continuando con el problema 1, hemos obtenido las siguientes sumas de cuadrados:
SCA = 73,5 SCB = 312,33 SCAB = 7 SCS/AB = 47 A la luz de los resultados podemos concluir, con
respecto al factor A (ratas): b) Existen diferencias significativas entre los dos grupos de
ratas

5. Teniendo en cuenta las sumas de cuadrados anteriores, podemos concluir en cuanto al


factor B (tiempo de privación): c) Estar privadas de comida 1, 2 ó 3 días influye de forma
distinta.
6. Continuando con los datos de los ejercicios anteriores y refiriéndonos al efecto de la
interacción, podemos concluir que: a) No se da ningún efecto significativo cuando se
combinan los dos factores.

7. A 12 ratas procedentes de dos camadas (C y D) se las entrena en la ejecución de un


determinado problema en un laberinto. Se las deja durante cierto tiempo alejadas del
mismo y ejecutando otras tareas, y nuevamente se las lleva al laberinto. El investigador
quiere probar el recuerdo del aprendizaje y toma los tiempos de las ratas en esta segunda
ejecución del laberinto. Dado que no tomó los tiempos de esas mismas ratas antes del
entrenamiento, toma un grupo control de otras 12 ratas de las mismas camadas, y les mide
los tiempos. Los resultados fueron, tras calcular las sumas de cuadrados: SCA = 2,67 SCB =
16,67 SCAB = 20,16 SCS/AB = 101 Se dan los supuestos de homogeneidad de las varianzas y
normalidad. Nc. 95% Teniendo en cuenta estos datos, el valor del estadístico de contraste
para el factor A (ratas) es: c) 0,53
8. Siguiendo con el ejercicio anterior, es estadístico de contraste para el factor B
(adiestramiento) es: a) 3,30
9. Por otro lado, el valor del estadístico de contraste para la interacción sería:
a) 3,99

10. Tras realizar el cálculo de los estadísticos, podemos concluir, refiriéndonos al factor A:
b) No existen diferencias significativas entre las ratas

11. Del mismo modo, podemos concluir acerca del factor B (adiestramiento):
b) No existen diferencias significativas entre los adiestramientos.

12. En cuanto a la interacción, podemos concluir:


c) No se dan efectos significativos cuando se combinan los dos factores.
DI
SEÑOSDEI
NVESTI
GACI
ÓNYANÁLI
SISDEDATOS

I
NTRODUCCI
ÓN.CONSEJOSBÁSI
COSDEESTUDI
O

I.
-Elexamenconst
adet r
essi
tuaci
ones,cadaunadelascual
escompr
ende
unmíni
mode7preguntasyunmáximode10, par
auntot
alde25:

-Laprimer acompr endelost emas1- 4:Teor í


adel ai nf
erenciaest adí
sti
ca,
cálculodei nter
valosdeconf ianza,contr astedehi pótesis,valoryni velcrí
ti
co
sobr elamedi a,l
apr oporci
ónyl avarianza.Elt ema1eselmásl ar
goyesel
fundament al
,expr esa los f
undament os t eóricos de t oda la asignatura.Los
demássondesar roll
os,enlost emas1- 2par adi señosconunamuest raylos
temas3y4, paradiseñoscondosmuest ras.
-Lasegunda,lost emas5-7:Compr endel osanál isisdev ari
anza( ANOVA)con
variasmuest r
as.El t
ema5esel equiv
alent eal tema1.
-Later
cera,sóloel t
ema8: Análi
sisder egresiónlinealymúl ti
ple.

Enconsecuencial ológicoesdedicarlamay orpar t


edelt iempoaest udiary
asi
mi l
arbienl osconceptosdel ostemas1y5( fundament ost eór
icosdel a
asi
gnaturayl osANOVA)yelt ema8( anál
isisder egresión).LosANOVAson
cál
culosmuycompl ejos;enelexamendanl osdat osintermediosyset r
atade
completarlosquefal
tan,par al
ocualhayquet enerencuent alasrelaci
onesentre
sumasymedi ascuadráti
casyl osgradosdel i
ber t
adpar acompar arelval
ordeF
conlosv al
oresdelastablasalhacerelcontr
astedehi pótesis.Yparalosdiseños
máscompl ejoslaspreguntassuelenserdeteoría.

II.
-Apr oximadament eent r
e2/ 5ylami taddel aspreguntassondet eorí
a.Es
fundament aldomi narl
a,por quesisecont estanbi enlaspr eguntasdet eoría,
supone2/ 3delapr obadoysisecont estanmal ,esimposibl
eapr obaraunquese
haganbi enl ospr oblemas.Ademássudomi nioper mit
epl antearyr esolv
erlos
correctament e.Esmuyi mpor t
antefij
arsebi enenl oquepidenyl osdat osque
nosof recenpar aident i
fi
carelpr obl
ema:“ Distintoodi f
erent
e”,implicacontraste
bil
ateral(doscol as);“may oromenorque” ,unil
at er
al(unacola).Cuandosehabl a
deunpar ámet r
ogenér i
co, seestánrefi
ri
endoal amedia;porcentaj
eesl omi smo
quepr oporciónyv ariabi
li
dadesv ari
anzaodesv i
acióntí
pica.

Latécni
caopr
ocedi
mient
opar
aelcont
rast
edehi
pót
esi
sessi
empr
ela
mi
sma:

1.-Det er
minaci
ón delossupuest osdelproblema(ti
posdedi seño yde
contr
aste).
2.-Formulaci
óndelashipót
esisest
adíst
icas(
nulayal
ter
nati
va).
3.-Elecci
ónycálculodelestadí
sti
codecontraste(
EC),el
i
giendolafór
mula
corr
ecta.
1
4.
-Deci si
ónsobreelrechazoonodel ahi
pótesi
snul
aplanteadaparaelnivel
designifi
caciónαdeseadooquenosden,medi ant
elacompar aci
ónentreel(o
l
os)v alor
(es)crí
ti
co(
s),cálculodelni
velpcr
ít
ico,t
amañodelef ect
oyav eces,
pot
enci adelcontr
ast
e.
6.
-Concl usión e i
nter
pr et
aci
ón de l
os r
esult
ados en elcontext
o de la
i
nvestigaci
ón.

TEMA1:
ESTI
MACI
ÓNDEPARÁMETROSYCONTRASTEDEHI
PÓTESI
S

1.
-Concept
osbási
cos.

Lainfer enci
aestadísticaesl apartedel acienci
aest adísticaqueestudi
alos
procedimi entosat r
avésdel oscualessepuede:
Esti
marconunel ev adogr adodepr obabi
li
daddet erminadaspr opi
edadeso
parámet ros de una pobl ación,parti
endo de l os estadísticos di
sponibl
es o
calculadosenunamuest r
adel ami smaobt eni
dadef ormaal eator
ia.
Al ai nversa,estudiarsidet erminados v al
ores muest ral
es se apart
an
si
gni f
icati
v ament edelospar ámet r
ospobl aci
onales.

Enest aasi gnaturalosest adí


sti
cossobr el osquesev aat r
abajarsonl a
media,lapr oporci
ón,lav ar
ianza( osuraízcuadr ada,ladesviacióntípica)ylos
coefi
cientes de regresi
ón,cor rel
aci
ón ydet erminaci
ón,aunque l ai nferenci
a
pueder eali
zarsesobr ecualquierotr
oest adísti
co( mediana,moda,r ango,et c.
),
exi
sti
endounpr ocedimientoof órmul
adiferentepar acadaestadísti
co.

-Eler
rormuestralesladi
fer
enci
aentreelresul
tadoobteni
doenlamuest
ray
el
quehabr í
amosobt eni
dosisehubi
esetrabaj
adocont odalapobl
aci
ón.
-Eler
rortí
picoesladesvi
aci
óntí
picadelestadí
sti
co.

Si obt enemos disti


ntas muest
ras al
eatori
as de una pobl ación, l
os
est
adísticosdecadaunadeel l
ast
omaránvalor
esdiferentes.Ladist
ribuciónde
l
osest adísti
cosmuestral
essecompor t
acomounav ariablealeat
ori
a,conocida
comodi str
ibuci
ónmuest r
al.Esmuyi mpor
tantedisti
nguirynoconf undirl
os
si
guientesconceptos:

a)Dist
ribuciónde( oen)l amuest ra:Sonl osdat osov al
ores(dist
ribuciónde
fr
ecuenci as)quet omal avariableenunamuest r
aconcr eta.Lamedi a,
medi ana,proporción, desvi
aci
ónt í
pica,correl
ación,
etc.delamuest ra,son
l
osest adísticos.
b)Dist
ribución pobl acional:Son l os dat os o v al
ores (distr
ibución de
fr
ecuenci as)quet omaunav ariableenelconj untodel apobl ación.Su
medi a,medi ana,pr oporci
ón,desv i
aciónt í
picas,et
c.sonl ospar ámet ros
poblacionales.
c)Dist
ribución muest ralde un est adíst
ico:Son l os datos o v alores
2
(di
stri
bucióndef r
ecuenci
as)quet omaunav ari
abl
eoest adísti
coenel
conjuntodet odaslasinf
init
asmuest r
asquepuedenobt ener sedeuna
población.Comoent odadist
ri
buci
ón,tambiéndeladist
ri
buci ónmuest ral
,
podemos obt enersu medi a ysu desvi
ación t
ípi
ca o errort í
pico del
estadísti
co.

Cuandolosestadíst
icos(muestrales)seref
ier
enaunamuest raconcreta,se
desi
gnanconl et
raslati
nasmayúscul as(Mediadelamuest r
a=Y,Varianzadel a
muest a=S2,
r Proporci
óndel amuest ra=P).Losmi smosparámet
rosrefer
idosa
l
apobl aci
ón,
seindicanconloscaracteresgri
egosequival
ent
esenminúsculas( µ,
2
π,σ) .

3
2.Di
str
ibuci
ónmuest
ral
del
aMEDI
A.

Hayquedi
sti
ngui
rtr
essupuest
os:

1.-Siladistr
ibuci
ónpoblacionaldel av ariabl
edeest udioesnor malcon
mediaµ yv ar
ianzao desvi
aciónt í
pica σ conocidas,coni ndependenciadel
tamañodel amuest r
a,ladi
stri
buciónmuest raldelestadíst
icomedi aest ambi
én
normal,siendo su media y desviaci
ón típica (o err
ort ípi
co de l a media),
respect
ivamenteµY yσ/n( fórmula1,pág.9delf ormulario).Sitipif
icamoslas
medidas,seráN(0,1)
.

2.-Sisedesconocel avari
anza(olaformadeladistr
ibuci
ónpobl
acional
),el
estadísti
co mediasedi st
ri
buyecomo unaT deSt udent,conn-1gradosde
l
ibertadyusar emosladesvi
aci
ónt í
picai
nsesgadaocuasidesvi
aci
óntí
picadela
muest ra(fór
mula2,pági
na9del f
ormular
io,oj
osiempren-1envezden).

3.-Enelsupuest o2,sil amuestraesl osufici


entementegr ande( n>30o
n>100,segúnlosautores),aunqueelest
adíst
icomedi aseguirádi
st r
ibuyéndose
según la T de Student,porelTeor ema CentraldelLí mitetender á a una
dist
ri
buciónnormalypodr emosusarlaprimerafórmuladelcuader ni
llosiempre
queseut il
i
cenladesv i
aciónt í
picai
nsesgadaocuasi desv
iaci
ónt ípicadel a
muestraconn- 1env ezden,sin.Sino,saldrámal( pr
oblema1delexamende
septi
embr e-
2016)
.

3.Di
str
ibuci
ónmuest
ral
del
aPROPORCI
ÓN.

Enlasv ari
ablesdi cotómicasodi cotomi zadas(lasquesól opuedent omar
dos valores),la propor ci
ón es elpor centaje de elementos que t i
enen una
deter
minada pr opi
edad ( éxi
to)en r el
ación con elt otal
.Las probabi l
idades
asoci
adasacadav alorconcr etosedi st
ribuyensegúnl adist
ri
buciónbi nomi al
conparámet rosnyπ.Conmuest r
asgrandesl abinomi alti
endeaapr oximar sea
l
anor malN( π,σp),(f
ór mula3, pági
na9delcuader ni
ll
o).Enestaasignaturapar a
resol
verlospr oblemassól oseusal adistr
ibuciónnormal .

4.Di
str
ibuci
ónmuest
ral
del
aVARI
ANZA.

Ladistri
buci
ónmuestr
aldelavari
anzaseaj aaunaχ2(
ust chi
-cuadr
ado),con
2
n-
1gr adosdel i
ber
tad.Cuandolamuestraesmay orde100,laχ t i
endeal a
2
nor
mal ,aunquel
avari
anzasi
guedist
ri
buyéndosesegúnlaχ.

Esmuyimport
anter
etenerquecadaestadí
sti
cosedist
ribuy
econsupr opi
a
funci
óndedist
ri
buci
ónquenocambi aconelt amañodel amuest r
a;cuesti
ón
dif
erent
eesqueporelTCLcuantomay orsealamuest
ra,taldi
str
ibuci
ón(Tde
4
Student
,binomi
alochi
-cuadrado)seapr
oxi
memásal anormal,
perodebeusarse
si
empr elaf ór
mula delest adí
sti
co que cor
responda,aunque l
uego dicho
estadí
sti
coseuseenlatablanormal.

5.
-ESTI
MACI
ÓNDEPARÁMETROS:
PUNTUALYPORI
NTERVALOS.

Unest imadoresunest adí


sti
cocalcul
adoenl amuest raqueseut il
izapara
esti
maroel abor
arhipótesisacercadelval
ordelpar ámetr
ocorrespondienteenla
población.Parat odopar ámetroexistendiversosestimadores,condi ferent
es
propiedades.Porejempl o,paralamedi apoblaci
onalpodríanuti
li
zarselamedi a
ari
tmét i
caol amedi ageomét ri
cadelamuest ra.Elusodeunodeot r
odepender á
delpar ámetroquepr etendaest imar
seydel abondadenelcumpl i
mi entode
determinadaspropiedades.

Laspr
opi
edadespr
inci
pal
esdel
osest
imador
esson:

a)Sesgo:Unest imadoresi nsesgadocuandosuv al


oresper ado,esdeci r,la
medi adeladi stri
buciónmuest ral
,coincideconel parámetroest i
mado.
b)Efi
ciencia o pr eci
sión:Esl ainversa de lav ari
anza.Un est i
madores
efi
ciente cuando t i
ene poca v ar i
abil
i
dad. Ent re dos est i
madores
i
nsesgadosesmásef ici
enteelquet i
enemenordesv iaci
ónt ípicaoer ror

picodemedi dayport anto,menorv ari
anza.
c)Consistencia.Unest imadoresconsi st
entecuandoalaument arelt amaño
del amuest ra,lavarianzadelest i
madordi sminuy e,t
endiendoenell ímite
a0.
d)Sufici
encia.Unest imadoressuf i
cientesiparaest imarelpar ámet rodel a
poblaci
ónut il
izat odosl oselement osoi nf
ormaci óndi sponiblesenl a
muest r
a.

La propi
edad de l
os est
imador
es i
nsesgados yef
ici
ent
es (
con v
ari
anza
pequeña)sell
amaacuraci
dad.

Losest adí
sti
cosmedi a,pr oporciónycoef i
cientedecor rel
aciónmuest r
ales
son est imadores insesgados,ef icient
es,consi stent
es ysuf icientes de los
parámetros media,pr oporción y coef i
cient
e de cor rel
ación pobl aci
onal.La
medianaesef ici
enteyconsi st enteper onoesi nsesgada;nitampocosuf ici
ente
alusarsólolosvalor
escent ralesdel amuest r
a.

La v ari
anza muestralno es un est imador insesgado de l av ari
anza
poblacional
,aunquesícumpleconlasotrastrespropiedades.Porelcontrar
io,l
a
cuasivari
anzamuest r
al( ovar
ianzainsesgada,calculadasobren- 1)síesun
esti
madori nsesgadodel av
ari
anzapoblacional,per
oesmenosef i
cient
equel a
vari
anzamuest ral
.

5
Resumendel
aspr
opi
edadesdeest
adí
sti
cos

Car
enci
adesesgo Ef
ici
enci
a Suf
ici
enci
a Consi
stenci
a
Medi
aAr
it
mét
ica SI >Medi
ana SI SI
Medi
ana NO <Medi
a NO SI
Pr
opor
ción SI -
--
-- SI SI
Var
ianza NO >S2n-1 SI SI
2
Cuasi
var
ianza SI <S SI SI
Laesti
macióndepar ámet rosapar ti
rdel osest adí
sticosmuest ralespuede
serpuntualoporinter
valos.Enl aesti
maciónpunt ualseut i
li
zadi r
ectament eel
valordelest adí
sti
co calculado en una muest ra aleatori
a concret a como
verdaderoval
ordelpar ámetropobl acional.Sinembar go,comoesmuypoco
probablequeasíocurr
a,espr efer
ibl
edef i
niruni nt
ervalodev al
oresent r
ecuy os
l
ími tes i
nfer
ior y super i
or se encont r ar
á, con una al ta pr obabil
idad
predeter
minada,elver
dader ov al
ordelpar ámet r
o.A est epr ocedi
mient osel e
conoceconel nombredeest i
maci ónporinter v
alosdeconf ianza.

Lapr obabil
idadsobrelaquesecalcul
aelinterv
alodeconfianza,sel l
ama
ni
veldeconf i
anza(1-α)ysedefinecomol apr
obabil
idaddequeelpar ámetro
poblacionalestéconteni
do ent
relosextremosdeli nt
erv
alo.Lapr obabil
idad
compl ementari
a delnivelde confi
anza (α)r
ecibe elnombr e de nivelde
si
gnifi
cación.

Par auntamañodemuest r
adado, cuantomay orsealaamplituddeli nter
valo,
may orseráelni veldeconfianza(pr
obabi l
idaddequeelv al
orpobl aci
onalest é
dentrodelmi smo),peromenorl apr eci
sión( puestoqueeli nt er
valoesmás
ampl i
o).Cuant omay orsealadisper
siónmuest ral(var
ianzaodesv iaciónt í
pica,
sesgadaoi nsesgada),menorser áelni veldeconf i
anza.Sóloalaument arel
tamañodel amuest ra,seincrementanl apr ecisi
ónyelni veldeconf ianza.En
consecuencia,par aunni veldeconf ianzadado,l aampl i
tuddeli nt
er v
alo de
confianzatendráqueserporf uer
zamay orcuant omenorseaelt amañomuest ral
ocuant omay orsealadispersi
ónmuest r
al.

Losint
erval
osdeconf i
anzasecal cul
ansegúnl asfórmulascorrespondient
es
acadaestadíst
icoenlacolumna2ªdel apági na9delformular
io.Par alamedia
seuti
li
zaladelafil
a1ªsi l
avari
anzapobl acionalesconoci
da(normal )olasdela
2ªsiesdesconoci da(TdeSt udent,aproximadaporl anor mal,sin>100per o
usandolamismaf órmul
adelestadísti
co).Paralaproporci
ón,l
afila3ª( nor
mal)y
2
paralavar
ianza,l
a4ª( χ,aproxi
madaporl anormalsin>100,fi
la5ª ).Entodos
l
oscasos,unami taddelniveldesignifi
caciónα/ 2quedaporenci madell ímit
e
superi
orylaotr
a,pordebajodell
ímiteinf
eriordeli.
c.

Cuandol
afunci
óndedi
str
ibuci
óndelest
adí
sti
coessi
mét
ri
ca(
nor
maloTde
6
Student
),bastaráconcal cularelvalorcorrespondientea1- α/
2,calculareler ror
máximoysumar l
oyr estar
lodelv al
ordel amedi aopr oporci
ónmuest r
al,que
ocuparáelv alorcentral(mediaopr oporci
ónmuest ral+/ -Emax).Sinembar go,
cuandonol oes( varanza,χ2,chi
i -cuadrado),hayquebuscarenl at ablalosdos
valor
escorrespondi entesaα/ 2ya1- α/2par acal cularlosl ímit
esi nferiory
superi
ordeli nterval
odeconf i
anza,estandoelv alorinferi
ordeli nterval
omás
próxi
moal av arianzamuestralqueel superi
or.

Eltamañomí nimodel amuest rapar aesti


marl amedi aol apropor ci
ón
pobl aci
onalconundet er
mi nadopor centajedeerrorsecalcul
aconl osv alor
es
correspondientesacadaf i
laenl acolumna3del apágina9delf or
mul ari
o.La
preguntairár ef
eri
daaunni veldesignif
icaciónodeer r
ordif
erent
ealαi nici
alde
tr
abaj oparauner rorexpresadoenunpor cent
aje(2o3%,porej emplo)oenun
valorabsoluto,sobreelquecal cul
arl
o.
I
NTERVALODECONFI
ANZAPARALAMEDI
A

N(
0,1) t
n-1gl
2 2
Dist
ri
buci
ónNor
mal
(Conoci
daσ) Desconoci
dal
aσ (
Muest
ras
pequeñas)

̅ ̅ ̅
X-(
Zα/2)·(
σX/ n)<µ<X +(
Z1-α/2)·(
σX/ n) X-( Sn-1/n)<µ<X +(
tα/2)·( t 2)
1-α/ ·(
Sn-
1/n)

7
6.
-CONTRASTE(
opr
ueba)DEHI
PÓTESI
S.

Una hipótesi
s estadísti
ca es una conjet
ura que se for
mula sobre una
pobl
aciónyquepuedesomet erseapruebaocont rast
aci
ónempír
icaaparti
rde
unamuest rarepresentat
ivadeesapobl aci
ón.Unav ezquelahi
pótesi
sseha
contr
astado se pueden t omardeci si
ones sobrel a mi
sma.Elcont r
aste de
hi
pótesisesunapar t
eesenci aldelmétodoci
entíf
ico.

Lamet odologíadelcont rasteesf rutodelost rabajosdeFi sher,Neymany


Pearson.Sul ógicarecuerdaal adeunj uicioenunest adodederecho: Elacusado
(l
ahipót esi
snul a)esinocent e(verdadera)hast
aquel aspruebas( contr
aste)no
demuest renlocont r
ario.Silosdatos( EC)aportanresul t
adossignifi
cati
vamente
dif
erentesdel ospl anteadosenl ahipótesisnula(VC) ,éstaesr echazadayse
acepta l a hipótesis alter
nat i
va. En caso cont rar
io, se mant iene como
provi
sionalment everdaderahast aqueseencuent rennuev asevi
dencias.

Paraelcont
rast
edehi
pót
esi
ssedebenf or
marunahi
pót
esi
snulaH0 yot
ra
al
ternat
ivaH1.Enlahi
pót
esi
snula,f
orzosament
edebeest
arelsi
gnoigualy
8
ademáspuedenestarelmayorqueoelmenorque,per
onoambosalav ez.Enl
a
H1nuncaest
áelsignoigual
,conl
asexcepci
onesquesever
ánencadacaso.

Engener al,l
ahi pótesisnulaaf i
rmaquenoexi stedif
erenci
aent r
eelv alordel
estadí sti
co obt enido en l a muest ra yelque f or
mul amos como par ámet ro
pobl acional,esdeci r,
quel adiferenciaobser vadaentreestosdosv al
oresesnul a.
Sin embar go,como elv al
ordelest adísti
co muest raly eldelpar ámet ro
pobl acionalr aravezcoi ncidi
rán,loqueseaf i
rmaesquel adifer
enciaobser vada
entreambospuedeexpl i
carsecomo r esult
ado delazar .Esto es,quesise
repitiesel ai nvesti
gaciónunnúmer osuf ici
ent edev ecesconot r
asmuest ras
aleator i
as delmi smo t ipo yt amaño ext raídas de l
a poblaci
ón,l a mediao
esper anza mat emát i
ca de l as diferencias observadas entr
el os valores del
estadí sti
coyelpar ámet ropobl acionalformul adoenlahi pót
esisnulatenderíaa
desapar ecer( v
alorcero).

Paracadahipótesisnulaseplanteaunahipótesi
salter
nat
iva,r
epresentada
porH1,queeslanegaci óndel ahi
pótesi
snula,detalformaquesilahi pótesi
s
nul
aesf al
sal ahipótesisalt
ernat
ivati
enequeserf or
zosamenteverdader ay
vi
cever
sa.Por tanto,est as dos hipótesi
st i
enen que ser exhaustivas y
mutuamenteexcl
uyentes.

Dependiendodecómoest éformul
adalahi pótesisnulasemarcaladi recci
ón
delcontr
aste.Sil
ahipót
esisnulaH0estáplanteadacomoi gual
daddev aloresyla
al
ternati
vaessunegación,esuncont r
astebilateralporquelaH1 admitequel a
dif
erenci
apuedaserposi t
ivaonegat iv
a.Si,porelcont rari
o,conocemosquel a
dir
ección en quelaH0 puedeserf alsasólo puedeserposi ti
vao negat i
va,
entoncestendremosuncont r
asteunil
ater
al.Ser áuncont r
ast
eunilat
eralderecho
siestamosbuscandounv al
orsuper i
oralpost ul
adoporl aH0 ei zquierdosi
estamosbuscandounv alorinferi
orparaelpar ámetropoblaci
onal(θ)dequese
tr
ate:

Cont
rast
ebi
l
ater
al Uni
l
ater
alder
echo Uni
l
ater
ali
zqui
erdo

H0:θ=θ0 θ≤θ0
H0: θ≥θ0
H0:
H1:θ≠θ0 θ>θ0
H1: θ<θ0
H1:

Elcontr
astebilat
eralsi
empreesmásconservador
,enelsent
idodequehace
másdi
fíci
lrechazarl
ahipótesi
snul
apar
aunmi smoniveldeconf
ianza.

El
procedi
mient
opar
ael
cont
rast
edehi
pót
esi
sesel
sigui
ent
e:

9
a.
-Condici
onesde l ainvesti
gaci
ón ysupuest
osque cumplen l
osdatos
obser
vados.Lavar
iabledebesercuanti
tati
vaymedir
seconunaescal
aderazón
odeinter
val
o(nosirv
epar avar
iabl
esordinal
esonominal
es)
.

b.-For mul acióndel ahi pótesisnul aydel aalt


ernat iv
a.Conf ormealcont exto
del ai nv estigaciónsef ormul anl ashi pótesisnul ayal ternativ
a.Engener alla
hipót esi
sci ent í
fi
ca, diri
gidaaencont rarresultadossi gnif
icativosesl aal ternativa,
que sól o se acept ará como v erdadera sielr esul t
ado delcont rast e apor t
a
evidenci ascont r
al ahipót esisnulaquesepr etender echazar .
Par anoconf undi rnos,esmej orformul arprimerol ahi pótesisalter nati
va,que
esl oquepr et endemoscont r
astar( silamedi adel apobl aciónesmay orque; sila
varianzaesmenorque,et c.).Unav ezf i
jada,lahipót esi
scont rari
aexcl uyent ey
exhaust iva,quef orzosament eincl ui
rási empr eelsi gnoi gual ,serál ahi pótesis
nula.Alf i
jarl ahipót esi
sal ternativasepl antearátambi énelcar ácteruni lateralo
bil
at eraldel contrast e.

c.
-El
ecci
ónycál
cul
odel
est
adí
sti
codecont
rast
e.

Elestadí
sti
co de contr
aster epr
esenta una medida est
andari
zada de la
discrepanci
a entr
elai nf
ormación proporcionada porlos datos empír
icos
recogidosenlamuestr
ayl aproposici
ónteóricaplant
eadaenlahipót
esisnul
a.

ElEC es una v ari


able al
eat
ori
a con una deter
minada di
stri
buci
ón de
pr
obabil
idad que depender
á delestadí
sti
co de que se t
rat
e y delti
po de
ex
perimento.

Elest
adí
sti
codecont
rast
eomedi dadediscrepanci
anodependedel
as
uni
dadesenqueest
émedi
dalavar
iabl
eysuf
ormulaciónhabi
tual
es:

d.
-Regl
adedeci
sión,
deacuer
doconel
niv
eldesi
gni
fi
caci
ónα.

Cal culadoelvalordelest adísti


codecont r
ast
eodi screpanciaent r
elosdat os
empí ri
cosobser vadosenl amuest raylosdat osteór
icosquepl anteamosenl a
hi
pót esis nula se t oma una deci si
ón respecto alr echazo o no de H0,
estableciendopreviamenteelni veldesigni
ficaci
ónque, segúnFi sher,r
epresenta
elmáxi mo riesgo de rechazaruna hi pótesisnulav erdadera.En pur i
dad,l a
hi
pót esisnulanoseacept a,sinoquenoser echaza(def ormapr ovisi
onal)
,porno
haberev idenciaempíricasuficientedesuf al
sedad.
10
Dicho de otro modo,además de def inirla discrepanci
a( estadíst
ico de
contrast
e)espr ecisoconsi derarcuant adiscr epanciaconsideramosadmi si
ble
paranoserat r
ibuiblealazar.Esdeci r,debemosdet erminar,aprior
i,cuálserála
di
ferenci
amáxi maent reelestimadoryelpar ámetroqueest amosdi spuestosa
consider
arcompat i
bleconl aH0.Est adeci sióndepender ádel adistri
buciónde
probabil
i
daddel amedi dadedi screpancia,del adirecci
óndelcont r
asteydel
ri
esgodeer r
orqueest emosdi spuestosaasumi r
.

Cual quieraqueseal aformadel af uncióndedi st


ribuci
óndelest adísti
code
contr
ast e,sielcont rasteesbilateraltendremost reszonasdel imit
adasporl os
dosv alorescr ít
icosquesesi t
úanenelej ehor i
zontaldel adistr
ibuciónmuest r
al.
Siladistribuciónessi métri
calapr eguntahabi t
ualparal oscontrastesbi lat
eral
es
es“ v
alorcr ít
icoenv alorabsoluto”.Sielcont rast
eesuni later
alizqui erdosolo
tendr
emosdoszonas, siendolaregiónder echazolasi t
uadaenl apar t
ei zquier
da
deladi stribuciónysielcont r
asteesuni l
ateralder
echo,l aregiónder echazose
sit
uaráenl apar t
ederechadel adi str
ibuciónmuest ralcomoser epresentanen
l
ossi guient esgráfi
cosesquemát i
cos:

CONTRASTEUNI
LATERALI
ZQUI
ERDO CONTRASTEUNI
LATERALDERECHO

Zona ZonaAcept
aci
ón ZonaAcept
aci
ón Zona
RechazoH0 H0(
1–α) H0 (
1–α) RechazoH0
|
--
--
--
--
-|
--
--
--
--
--
--
--
---
--
---
--
----
--
--
--
--
--
--
--
-| |
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
--
|-
--
--
--
-|
α / VALOR CRÍ
TICO VALORCRÍ
TICO / 1-α

CONTRASTEBI
LATERAL Val
oresα/1-α/Zmásf
recuent
es

11
Val
orcr
ít
ico(
Zα/2) Val
orcr
ít
ico(
Zα/2) α 0´
05 0´
01 0´
001

1-α 0´
95 ´
99 0´
999
Z -1´
96 - -
α/
2 2´
58 3´
29
Z1-α/2 1´
96 2´
58 3´
29
α Ni
vel
desi
gni
fi
caci
ón

1–α Ni
vel
deconf
ianza
Zα/2 Z(
Tabl
aII
Inegat
iva)
Z1-α/2 Z(
Tabl
aIVposi
ti
va)

Lasgr
áfi
cassei
nter
pret
andel
asi
gui
ent
emaner
a:

-En elej ei nferi


orhor izontal( abscisas)se r epresentan l
os v alor
es del
estadísti
co.En l a nor maly T de St udentv an de menos a más i nfini
to,
2
coincidi
endoel0conelpi codel acur va.Enl aχ yl aFdeFi scher
-Snedecor,de0
ainf i
nit
o.
-La cur var epresental a di st
ri
buci ón o f r
ecuencia para cada v al
ordel
estadísti
co.
-Eláreacompr endidaent r
elacur va,elejedeabsci sasyelej eper pendicul
ar
correspondi enteal val
ordel estadísti
cor epresentalaprobabi l
i
daddequesedéel
val
order eferencia,entre0y1.
-Last ablasdanl apr obabili
daddequeelest adíst
icotomeunv alori
gualo
i
nfer i
oralder eferencia,esdeci r,eláreacompr endidaent r
el acurvayelej ede
abscisassi tuadoal aizquierdadelv alordel av ari
able(loponeenelgr áfi
coque
hayenci madel ast ablas)

Elnivelde signifi
cación que suele ut i
li
zarse en l a mayor í
a de las
i
nvest
igaci
onesesdel0, 05,aunqueeninvestigacionesmásr i
gur
osasset r
abaj
a
conunniveldesi
gnif
icaciónde0,01yauni nferi
or.Ser echazarál
ahipótesisnul
a
si
emprequel apr
obabili
daddeexpl i
carlosresultadosobt eni
dosenr el
aciónala
H0seamenorqueel niv
el designi
fi
caci
ón.

Unav ezfi
jadoelni
v eldesignif
icación,seobtienenelval
oroval
orescr í
ti
cos
deladi st
ri
buciónmuestralquemar caránl oslí
mitesdel azonadeaceptaci
óno
rechazodel aH0 oseal amáxi madi ferenci
aquepodemosadmi ti
r,porsimple
azar,entr
eelvalort
eór
icoplanteadoenH0yel valorobteni
doenlamuestra.

Lazonader echazodelaH0dependedelniveldesigni
fi
caciónαyeselár ea
deladistr
ibuci
ónmuest r
alquecorrespondeaunv al
ordel adiscr
epanci
at an
al
ejadodeH0quel aprobabi
li
daddeobtenerl
o,si
endoH0v erdader
a,esi
nfer
ioral
12
valordesi gni
fi
cación.Lar egi
óndenor echazodeaH0,compl ementari
aal a
anteri
or,dependedelni veldeconfianza,1- αyeselár eadel adistr
ibuci
ón
muest r
alquecor respondeav al
oresdel adi scr
epanci
atanpocoalejadosdel
formuladoenlaH0quel aprobabi
li
daddeobt ener
lossi
endoH0v
erdaderaesmuy
elevada,noexi
sti
endoev idenci
apararechazar l
a.

Port anto,sielestadísti
codecont rast
esesi t
úaenl azonadeNOr echazo, l
a
diferenciaobser vadanoessi gnif
icati
vaysedebeaer roresal
eat or
iosporl oque
nopodemosr echazarlahipótesisnulaconundet er
minadoni veldeconf ianza.En
caso de si tuarse en la zona de r echazo,diremos que elv alordelEC es
si
gni fi
cat i
vo par a un determinado ni velde signifi
cación y se r echazarál a
hipótesisnul a.Endef i
niti
va,sielv alorabsolutodelECesmay orqueelv al
or
críti
co( elcorrespondientealniveldesi gni
fi
cación),
ser echazalahipót esisnulay
noser echazar áencasocont r
ari
o.

Ladecisiónpuedetomarsetambiénmedi
anteelcálcul
odelnivelpcr í
ti
co,
queesl apr obabil
i
daddeobt enerunosr
esul
tadoscomol osobser
v adosenla
muest r
abaj oelsupuest
odequel aH0esci
ert
a.Laregl
adedecisi
ónat r
avésdel
nivelcrí
ti
coesj ustolainv
ersa:Sipes≤α,rechazar
emosH0,ysip>α,nol a
rechazaremos.Estoes:

Ho( Cierta) (
p)esmay orque( α) Elvalorseencuent raenelinter
val
ode
conf
ianza.Elv al
ordelestadí
sti
coest áentrelosvalorescr
ít
icos.
Ho( Falsa)(p)esmenoroi gualque( α)Elv alorest
áf uer
adelinter
val
ode
conf
ianza.Elv al
orabsolutodelestadíst
icoesmay orquelosv al
orescrí
ti
cos.

e.
-Conclusi
ón.Formulada l
a hipótesi
s nula,provisi
onalmenteverdadera,
someti
daacont r
asteempí
ri
coyunav ezcal
culadoelestadíst
icodecontr
aste,se
concl
uyerechazándol
aomant eniéndolasegúnseai ncompatibl
eonoconl a
evi
denci
amuest r
al.

f
.-Inter
pret
aci
ón.Laconclusi
ónsi
mpleyl l
anaentérminosderechazoonode
l
ahipót esi
snul
ati
enesucorrespondi
ent
ei nt
erpr
etaci
óndentrodelcontext
odel
a
i
nvestigaci
ónydel ahipótesisyobjet
ivosqueeli nvesti
gadorformulaensu
t
rabajo.

RESUMENDELPROCEDI MIENTODELCONTRASTEDEHI PÓTESIS)


1.
-Det erminaci
óndelossupuest osdelproblema( car
acter
íst
icasdel a
var
iabl
eenl apoblaci
ónydat
osdel amuestr
a):Tamañoynúmer odemuest r
as,
sison i ndependient
es o r
elaci
onadas,sila distr
ibuci
ón de la pobl
aci
ón
conocida,etc.

13
2.-For mulacióndel ashi pótesi sestadíst
icas( exhaust
ivasymut uamente
excluy entes)deacuer doconl ahi pótesi
sci ent
ífica(H1yH0).
3.-Elecciónycál cul
odelest adísti
codecont r
asteapropiadoalpr oblema
planteadoycál culoconl osdatosmuest rales.
4.-Fijarα( r
egladedeci sión).Lazonader echazodel aH0est ar
áf or
mada
port odosl osvaloresdelest adísticotanext r
emosquel aprobabili
daddeser
obteni dosesmuypequeñabaj oelsupuest odequel aH0esciert
a.
5.-Deci si
ónsobr eelr echazoonodel aH0 medi anteelnivelcrí
ti
co( p)o
medi ant eelolosv alorescrí
ti
cos( α).
6.-Concl usión ei nter
pretación del osresul t
adosen elcont exto dela
i
nv estigación.

7.
-ERRORESENLADECI
SIÓNENUNCONTRASTEDEHI
PÓTESI
S.

Aldecidirentrelahipótesisnulaosual ternat
ivapodemoscomet erdost i
pos
deerrores:
-Er r
ortipoI(α):Eslapr obabili
dadder echazarunahipótesisnulaverdadera.
Coincideconelni veldesi gnif
icaciónα,fij
adoapr i
oriporeli nvest
igador.Su
compl ement ar
io,probabil
i
dad de acept aruna H0 v erdadera es elni velde
confi
anza.
ErrortipoI I(
β):Esl apr obabil
idaddeacept arunahi pótesisnulafalsa.Su
compl ement ar
io1-β,probabili
dadder echazarunaH0 f alsaesl apotenciadel
contraste.

Deci
sión Nat
ural
ezadeH0
VERDADERA FALSA

Deci
sióncor
rect
a. Deci
sióner
rónea
Nose
Ni
vel
deconf
ianza Er
rort
ipoI
I
r
echaza
1-
α β

Deci
sióner
rónea Deci
sióncor
rect
a
Ser
echaza Er
rort
ipoI Potenciadel
Ni
vel
desi
gni
fi
caci
ónα contrast
e
1-
β

14
Paraigualtamañomuest rall
adi sminucióndelerrort
ipoIaumentaelerror
ti
poII.Laopci ónporunouot rodepender ádelt i
podeexperi
ment oydesus
consecuenci
as;en un t ratamient
o médi co elerrorde ti
po IIes peor( no
benefi
ciar
sedeunt rat
ami entomásef i
caz,frent
ealcostedeinversi
ónenuno
quenol oes).Sinembargo, enunjuicioelerrordetipoIesmásgrave(condenar
auninocente,frent
eadejarlibreauncul pabl
e).

Laf uerzadeunfenómenosemi demedi anteelt


amañodelef ecto,coefi
ciente
que expr esa l
a magnitud de l
a dif
er enci
a observ
ada entr
e elv alorteórico
plant eadoporlahipótesisnul
ayelv alorobservadoparal
ahi pótesisalter
nativa
expr esadoenunamét ri
cacomún( estadísti
co“d”deCohen).Oscilaent r
e0e∞.
Seconsi deraelef
ectofuert
esies0,8omay or
,moderadosiestáent r
e0,5y0, 7y
débil siesmenorde0, 5.

15
TEMA2.
-CONTRASTEDEHI
PÓTESI
SENLOSDI
SEÑOSDEUNAMUESTRA.

1.
-INTRODUCCI
ÓN.(
Fór
mul
asdel
apági
na9del
for
mul
ari
o(UNAMUESTRA)
.

Cuandosetratadeinfer
irl
ascaracterí
sti
casdel apobl
aci
ónapar t
irdel
os
datosrecogi
dosdeunamuest r
a,l
ahi pótesi
sacont r
astarespreci
sament
euna
deter
minadacaract
erí
sti
cadeaquell
a.Loscont rast
esbasadosenunamuestra
puedenser:

-Par
amét r
icos,cuandoser efi
erenalestudiodeunparámet
ropobl
aci
onal
(medi
a,var
ianza,propor
ción,cor
rel
ación,et
c.)enunapobl
aci
ónconunaf
unción
dedensi
daddepr obabil
i
dadconocida.

-Noparamétr
icos,cuandonoser elaci
onanconpar
ámetr
ospoblaci
onaleso
seencuent
ranref
eri
dasadat osquepr ovi
enendeunapobl
aci
ónconunaf unci
ón
de densi
dad de probabil
idad desconoci
da.Son menos pot
entes que los
ant
eri
oresynoseest udi
anaquí.

Ademásdepar aesti
marparámetr
ospoblaci
onal
es,eli
nter
val
odeconfi
anza
puedetambiénaplicar
separaelcontrast
edehipót
esi
s.Sinembargo,esmucho
másf r
ecuenteobtenerelest
adí
sti
codecont r
ast
ecomounamedi damásexacta
deladi scr
epanci
aent r
eelv al
orplanteadoenlaH0 yelv al
orobteni
doenla
muestra.

Est
a medi da de la discrepanciat i
ene una di str
ibuci
ón de pr obabil
idad
conocidapar acadapar ámet r
oyv aacompañadadeunapr obabil
idad,ll
amada
niv
el crí
ti
cop, queeslaprobabi l
i
daddeobt enerunr esultadocomoel obteni
doen
l
a muest r
a,o más ext remo,baj o elsupuest o de que l a hipót
esis nula es
verdadera.Noesl apr obabil
idaddequel aH0 seaci ert
asinounapr obabil
idad
condicionada:SiH0fueraciert
a( condici
ón)elnivelpcr í
ti
coindicalaprobabil
idad
deobt enerunv al
ordelest adísti
codecont rastei gualomásext remoqueel
obtenidoefectiv
amenteenl amuest r
a( P(Y≥y i|H0)=p) .

2.
-CONTRASTESSOBRELAMEDI
APOBLACI
ONAL.

a)Cont
rast
esobr
elamedi
apobl
aci
onal
conoci
dal
avar
ianzapobl
aci
onal
.

Elest adí
sti
codecont rast
eeseldel afór
muladelafil
a1yl acolumna1del a
página9delf ormulari
o,quesedi st
ri
buyecomonormalN( 0,1),
siendoYl amedia
obtenidaenl amuest r
a,µo elv al
ordelamedi apoblaci
onalf ormuladoenl a
hi
pót esisnul
a,σY eler
rortípi
codel amediaodesvi
aci
ónt í
picadel adistri
buci
ón
muest raldel amedi a( denominador
),σ ladesvi
aci
ón típicapoblacionalque
suponemosconoci daynelt amañodel amuestr
aqueest amosut il
izandopara

16
cont
rast
arl
ahi
pót
esi
s.

Elestadí
sti
coZcuanti
fi
caladist
anci
adelamedi adelamuest
raalamedia
poblaci
onalenunidadesdelerr
ortípi
co(desv
iaci
óntípi
ca)deladi
str
ibuci
ón
muest r
al.

b)Cont
rast
esobr
elamedi
apobl
aci
onal
desconoci
dal
avar
ianzapobl
aci
onal
.

-Elestadísti
codecontrasteeselcor respondientealafi
la2del acolumna1
delapágina9del f
ormul
ario.
-Sedistri
buyeconarregloalaTdeSt udent,conn-1gradosdel i
ber
tad.
-Elerrortípi
codelamedi aodesv iacióntípicadeladist
ri
buciónmuestralde
l
a media se cal cul
a uti
l
izando la cuasidesviación t
ípi
ca o desvi
aci
ón típi
ca
i
nsesgadadel amuestr
a(denomi nador).

3.
-CONTRASTESOBRELAPROPORCI
ÓNPOBLACI
ONAL.

-Elestadí
sticoecont r
asteeselcorrespondient
ealafi
la3delacolumna1de
l
apági
na9del formul
ario.
-Sedistri
buy enor
mal menteconarregloalanormalN(0,1).
-Elerr
ort í
picodelamedi aodesv i
aci óntí
picadeladist
ri
buci
ónmuest ralde
l
amediasecal culaut
il
izandoladesvi
aciónt í
picadelamuestr
a(denominador).

4.
-CONTRASTEDEHI
PÓTESI
SSOBRELAVARI
ANZAPOBLACI
ONAL.

-Elestadísticodecont r
asteeselcor respondi entealafil
a4del acolumna1
delapágina9del f
ormul ar
io(usandolavar ianzamuest rali
nsesgada, conn-1).
2
-Sedi str
ibuy econar r
egloalaχ ( chi-cuadr ado)conn-1gr adosdel ibertad,
queadi f
erenciadel aN yl aT,noessi mét rica,aunquesít i
enel apropiedad
recí
procaoi nv ersa,demodoque,porej empl o,elv al
ordel adist r
ibuci
ónpar a
0,95esigualal 1/valorpara0,05.
-Paraelcál culodel osinter
valosdeconf i
anzaoer r
ormáximo, cuandon>100
sepuedeut i
l
izarl anormal ,per
oconl afórmul adel af i
la5yl av ari
anzanor mal
(noinsesgada).

5.
-CÁLCULODELAPOTENCI
ADELCONTRASTE.

Lapot enci
adelcont rasteesl aprobabil
idadder echazarunahipót esi
snula
queenr eali
dadesf alsa( i
gualal aprobabil
i
daddeacept arunaH1 verdadera)y
portantoesel compl ement ar
iodel er
rorti
poII(1−β)
, queeslaprobabil
idaddeno
rechazaruna hi pótesis nula que es fal
sa.Elcál culo de l
a potencia de un
contrast
epueder ef
erirseacual qui
erparámetro,per
oaquísól oseexponepar ala
mediayl aproporciónpobl aci
onales.

17
Par apodercal cularlapotenciadeuncont rastelashipótesisnulayal t
ernativ
a
debensersi mpl es,compar ándoseencadaunadeel lasunúni copar ámet r
o
pobl acional,env ezdeunr angodev alores(porej emplomedi a=7f renteamedi a
=9) .Port ant o,porexcepci ón,sepl anteandoshi pótesi
senl asquef i
guraelsigno
i
gualt antoenl ahi pótesisnulacomoenl aalternati
va.Lapot enciadelcont rast
e
variaráenf uncióndel tamañomuest ral yladistanciaentreelvalordel ahipótesis
nulayl ahipót esisalternati
va.
Par a un mi smo v al
ordeler rort ipo Iydi sti
ntos valores de H1,di chas
variacionesser epresent anmedi antel ascur vasdepot encia,quer epresentanla
potenci adeuncont rast
esegúnl osdi st
int
osv alor
esquepuedat omarH1 yel
tamañodel amuest r
a.
Par a calcularl a pot encia delcont r
aste,una v ezest ableci
do elni v
elde
signifi
cación:

a)Sedeterminaelv al
orcríti
codelestadísti
coquecor respondealni velde
si
gnifi
caci
ónelegido,segúnlafuncióndedistr
ibuci
ónapl i
cable.
b)A continuación,se calculala puntuación tí
pica correspondient
eal a
dif
erenci
aent
redi chov al
orobtenidoyeldelahipótesi
salternativa.
c)Laprobabili
dadasoci adaal apuntuacióntípi
cadedi chadiferenci
aesel
err
ortipoI
Io(β),siendolapotenciadelcontr
astelaprobabili
dadcompl ementari
a
será1−β.

Lodeseableenuncont rast
edehipótesi
sesquel asprobabi
li
dadesdeambos
ti
posdeer r
orfuer
anl omenorposi bl
e.Sinembar go,parauntamañodemuest r
a
prefi
j
ado, di
sminuirlaprobabil
i
daddelerrordetipoI ,
α,conduceaincrementarl
a
probabili
daddelerrordetipoII
,β.Elúni
cor ecur
sopar aaumentarlapotenci
adel
contrasteydisminuirlaprobabil
i
daddeer rordet ipoII
,esaument areltamaño
muest ral
.

6.
-NI
VELCRÍ
TICOpYERRORESENLOSCONTRASTES.

Dependi endodelni v eldesi gni


ficaciónαqueseadopt eapr i
ori,ladecisi
ón
queset omer espectodel aH0puedev ari
ar.Porejempl o,queunahi pótesi
snula
puedar echazarseconunni veldesi gnifi
caciónde0. 05per onode0. 01.Para
evit
arest osinconvenient es,seuti
li
zaeldenomi nadoni velcrí
ticop,quesedef i
ne
comoelni veldesignificaciónmáspequeñoalqueunahi pót
esi snulapuedeser
rechazadaconl amedi dadedi screpanciaobt enida.Esdeci r,elnivelcrí
ti
cop
cuanti
fical apr obabil
idad deobt enerunosdat oscomo l osobt enidosen la
muest r
abaj oel supuest odequel ahi pótesi
snulaesv erdadera.

Aluti
lizarcomocr i
teri
oelnivelcrít
icopnohayqueest abl
ecerpreviament
e
unniv
eldesi gni
fi
caci
ón, y
aquel adecisiónset
omaenf unci
óndel v
alordep.Sip
espequeñoser echazar
áH0, siesgr andeseacept
aráH0ysiestáent ornoaese
val
or,
sev uelveatomarnuev aevidenciamuestr
alyserepi
teelcontr
aste.Elni
vel
18
cr
ít
icopcomocr
it
eri
odedeci
siónt
ambi
éndependedelt
amañodel
amuest
ra
ut
il
izada.

Elni velpcr í
ti
coes“ elniveldesignifi
cacióndelEC” ,esdeci r,l
apr obabili
dad
asoci adaal a(s)cola(s)paraelvalordelEC.Enelcont rasteuni l
ater
alder echo, es
l
apr obabi l
idadquehayal aderechadelEC( coladerecha) .Comol atablanosda
elv alordepr obabil
i
dadquehayal aizquierda,elni velcrít
ico psecal cula
restandode1di chov alor
.Eneluni later
alizqui
erdo,esl apr obabil
i
dadsi t
uadaa
l
ai zqui erdadelEC( colaizqui
erda)yport anto,eselv alorquenosdal at abla.En
l
osbi laterales,comol asdoscol astienenelmi smov alor
,semul t
ipl
icapor2el
valordel acol aderecha.

Comoelni velpcr í
ti
coi nf
ormadel apr obabil
idadasociadaalv al
ormuest r al
obtenido,proporci
onai nf
ormaciónmáspr ecisaqueelECporsísól oyper mite
mat i
zarlasconcl usionesdelest udi
o.Porej empl o,sip=0.
011,nopodr í
amos
rechazarlaH0 paraunni veldesignif
icacióndel0. 01,perosiseprescindieradel
establ
ecimientodeunni veldesi gni
ficaciónpr edet er
minadopodríar echazarse
coneseni velpcrít
ico.
Recapitulaci
ón:Disti
nciónconceptual entrevalorcrít
icoyniv
elcrít
ico.

1º .
-Elv al
orcrít
icoeselv al
ordelestadí
sti
coparaunni veldeconf i
anza
2
determinado.¿Cómosecal cul
a?Sebuscadi r
ect
amenteenl at
ablaZ,T,χ oF
para0.95o0. 99,siescontr
ast
eunil
ater
alo0.975o0.995siesbil
ater
al.Elval
or
crí
ticodeZyTosci l
aentremásymenosi nf
ini
to,
eldechi
-cuadr
adoyFent re0e
i
nfinit
o.


.-Elni
velpcrí
ti
coeselniv
eldesigni
fi
caci
óndelestadí
sti
codecont r
aste,
esdeci
r,l
aprobabi
l
idaddequeelval
ordelavari
ableseaeldelamuestraomás
ext
remo.¿Cómopuedenpregunt
arl
oycómosecal cul
a?Vari
asposi
bil
idades:

a)Sinospidenelv alorpcrítcopar
i aundet erminadovalordel
av ar
iable,hay
quecalcul
arelestadí
sticocorrespondienteybuscarl aprobabil
i
dadasociadaal a
tabl
a.Sielcont
rasteesuni l
ateralderecho,elniv
el pcrí
ti
coes1menosel valorde
l
at abl
a.Siesbi l
ateraleser esultado semul t
ipli
capor2.Y siesuni l
ateral
i
zquier
do,elval
ordel atablaesel nivelpcrít
ico.

b)Sil
opidenpar
aunval
ordelest
adí
sti
codecont
rast
eseaelcal
cul
adou
otr
ohipot
éti
coquenosden,sebuscadi
rect
ament
eenl atabl
ayseprocede
comoena).

c)Sinocoi
nci
deexactamenteelval
ordelECconeldelat abl
a,sebuscanl os
val
oresdelest
adí
sti
comáspr óxi
mosporexcesoypordef ectoyl aprobabil
i
dad
asoci
adaal osmismoscalcul
adaconformea)ob) ,ent
rel oscualesest ar
áel
niv
elpcrít
ico(
nosofr
ecer
áncomor espuest
asvari
asdesi
gualdades).
19

.-Cont
rast
edehi
pót
esi
sconel
val
orcr
ít
icoyel
niv
elpcr
ít
ico.

Cuant
omásext r
emoeselv al
ordelest
adísti
codecontr
aste,menoressu
ni
velpcrí
ti
co.Port
anto,
lar
egl
adedecisi
ónexpresadaent
érminosequi
val
ent
es
es:

-Si
elECesmásext
remoqueelVC,
ser
echazal
aH0yseacept
aH1.

-Sielnivelp crí
ti
co cor
respondi
ente alEC es menorque elni
velde
si
gnif
icaci
ónα,ser
echazal
aH0yseacept aH1.

20
TEMA3.ANÁLISI
SDEDATOSPARADISEÑOSDEDOSGRUPOS.MUESTRAS
I
NDEPENDIENTES.(
Fór
mul
aspági
na10delcuader
nil
l
o)

1.
-INTRODUCCI
ÓN.

Paramej orarlosr esultadosdel ai nf


erenciaest adí
sticaoelcont r
astede
hipótesi
s,se pr ecisa trabajarcon dos o más muest ras.Las muest ras son
i
ndependi entescuandonoexi st
er el
aciónent r
el ossujetosdeunaydeot ra,l
o
quesegar antizasi l
ossuj etossonasignadosal eatori
ament eacadaunadeel l
as.
Lasmuest r
asest ánr elaci
onadascuando l osmi smossuj et
os( o par
ejasde
sujetosequi paradasenci ertasvari
ablesestudiadas,comogemel os)pasanpor
l
asdi ferent escondi cionesexper i
ment al
es.Sienambasmuest r
ashayelmi smo
númer odesuj etos,eldiseñoesequi l
ibrado.Sihaydi sti
ntonúmer odesujetos,el
diseñoesnoequi l
ibr
ado.Losdi señosconmuest rasrelacionadassólopueden
serequilibrados.

2.
-CONTRASTES DE HI
PÓTESI
S SOBRE DOS MEDI
AS EN MUESTRAS
I
NDEPENDI
ENTES.

a)Var
ianzaspobl
aci
onal
esconoci
das.

Lascondi cionesysupuest osson:Var i


abledependient
econ un nivelde
medi dadei nterval
oor azón,dospobl aci
onesquesedistr
ibuyennormalmente,o
ensudef ecto,muest rasgr andes( n1 ≥30y n2 ≥30)yenamboscasos,con
var
ianzaspobl aci
onalesconoci das.Lasfórmul
asparaelestadíst
icodecont
raste
yeli nter
valodeconf ianzaenest ecasosonl asquef i
guranenl afil
a1del a
página10del formulari
o( di
stri
buciónnormal).

b)Vari
anzas poblaci
onal
es desconoci
das supuest
as i
gual
es
(homocedast
icidad).

Lascondi cionesysupuest ossonlosmi smos,peronoseconocennil af orma


de lasdi stri
buci onespobl acional
esnisusv ari
anzas,per o ést
asúlti
masse
suponeni guales.Lasf órmulasparaelestadíst
icodecont rast
eyeli nt
ervalode
confianza son l as que f i
guran en l
af i
la 2 de la página 10 delformulari
o
(di
stribuciónTdeSt udent,conn1+n2-
2gradosdel i
bert
ad),enl aqueseut i
li
zan
l
osv aloresde l ascuasiv ar
ianzaso vari
anzasi nsesgadasmuest ral
es).Este
contrastedehi pótesi
sseconocecomopr uebaT.

c)Var
ianzaspobl
aci
onal
esdesconoci
dasysupuest
asdi
sti
ntas.

Lascondi
cionesysupuestosson:Var i
abl
edependi
ent
emedidaaniv
elde
i
nterval
ooderazón,dospobl
acionessupuest
ament
edist
ri
bui
dasnor
mal
menteo
21
ensudef ectomuest rasgrandes( n1 ≥30y n2 ≥30) .Lasfórmul
aspar ael
estadíst
icodecontrasteyl
osgr adosdel i
bert
adsonlasquef i
gur
anenlafi
la4de
l
apági na10( Welch,1938)(di
stribuci
ónTdeSt udent,conl osgr
adosdeli
bertad
quer esult
andelaf ór
mula),
enl aqueseut il
i
zanlosvaloresdelascuasi
var
ianzas
ovarianzasinsesgadasmuest r
ales.
3.-CONTRASTE DE HI PÓTESI S SOBRE DOS VARI ANZAS EN MUESTRAS
INDEPENDI ENTES.

Las condiciones ysupuest os son vari


able dependiente con un niv
elde
medida de interval
oor azón ydospobl acionescon v ari
ablesnor malmente
di
stri
buidas,obienn1≥30yn2≥30.Elest adísti
codecont rastesecalculasegún
l
asf ór
mul asdel afil
a5del apágina10delf ormulari
o( dist
ri
buciónFdeFi sher
conn1-1gr adosdel i
bertadenelnumer adoryn2- 1gr adosdel i
bertadenel
denominador).Sihayquecal cul
aral
gúnv al
orquenoapar eceenl atabladeberá
apl
icar
sel apropiedadinv
er sadeladist
ri
bución.

4.
-CONTRASTEDEHI
PÓTESI
SSOBREDOSPROPORCI
ONESENMUESTRAS
I
NDEPENDI
ENTES.

Condicionesysupuest os:Variabledicotómicaodi cotomizada( sólopuede


tomardosv al
ores),dosmuest raspr ocedentesdeobser vaci
onesal eatori
aso
i
ndependi entesymuest r
asgr andes( n1 ≥30y n2 ≥30) .Lasf ór
mul aspar ael
estadí
sti
codecont rast eyeli nterval
odeconf i
anzadedospr oporcionesen
muestrasi ndependient essonl asquef iguranenl afila6del apági na10del
for
mul ar
iosil adiferenciaentrelasdospr oporci
onesesi guala0( propor ci
ones
supuestasi gual
es)yl adel afil
a7siesdi sti
ntade0( distr
ibuciónN( 0,1)),
siendo
l
apr i
mer aunaapl i
caci óndel asegundacuandol asproporcionessoni guales.

5.
-TAMAÑODELEFECTO(
índi
ce“
d”,
est
adí
sti
codeCohen)
.

Lamagni tudot amañodelef ectoesuní ndice( ofami l


i
adeí ndices)quese
apli
cacuandohayi mpli
cadosalmenosdosgr upos, unodet rat
ami entoyot r
ode
controlyadi fer
enciadel oscont rastesclásicosesi ndependientedelt amaño
muest r
al.Lafórmulaqueseut i
li
zaesl adel af i
lanúmer o3del apági na10del
formulari
o(seutil
izanlascuasivarianzasov ariacionestípi
casi nsesgadascomo
esti
mador es)ycomoelnumer adorv aenv alorabsol uto,si
empr et endráunv al
or
posit
ivo(entre0ei nf
ini
to).SegúnCohensidesi gualomay ora0, 8,elefect
oes
grande,siesmenora0, 2,pequeñoymedi anosi r
ondael 0,5.

22
TEMA4.ANÁLI
SISDEDATOSPARADISEÑOSDEDOSGRUPOS.MUESTRAS
RELACI
ONADAS.(
Fór
mulaspági
na11delcuader
nil
l
o)

1.
-CONTRASTES DE HI PÓTESIS SOBRE DOS MEDIAS EN MUESTRAS
RELACIONADAS.(Todos l
os sujet
os pasan por l
as mismas condi
ciones
exper
iment
ales)

a)Var
ianzadel
asdi
fer
enci
asconoci
da.

Lascondi cionesysupuest osson:Var i


abl
edependi ent
econ un nivelde
medi da de int erv
aloor azón,población de dif
erenci
as que se di
stribuye
normal mente,oensudef ecto,muestr
asgr andes(n1 ≥30y n2 ≥30)yvarianza
poblacionaldel asdifer
enciasconocida.Lasf ór
mul asparaelestadí
sti
code
contrasteyeli nterval
odeconf i
anzasonl asquefi
gur anenlafi
la1delapági na
11del formulario(dist
ri
buci
ónnor mal
).

b)Var
ianzadel
asdi
fer
enci
asdesconoci
da.

Lascondi cionesysupuestosson:Var iabl


edependi entecon un nivelde
medida de i nterval
oor azón,población de di fer
encias que se dist
ribuye
normalmente, oensudefecto,muestr
asgr andes( n1≥30yn2≥30)yenambos
casos,conv arianzapobl
aci
onaldel asdi f
erenciasdesconocida.Lasfórmul as
paraelestadí
st i
codecontr
asteyelinterv
alodeconf i
anzasonlasquefiguranen
l
af i
la2del apági na11delfor
mulari
o( di
stri
buciónTdeSt udentconn-1grados
deli
bertad).

3.
-CONTRASTEDEHI
PÓTESI
SSOBREDOSPROPORCI
ONESENMUESTRAS
RELACIONADAS.

Condi cionesysupuest os:Variabledi cotómicaodi cotomizada(sól opuede


tomardos v al
ores),dos muest ras r el
acionadas con b y c obser v aciones
i
ndependi entesdondeb+c>25.Lasf ór mulasparaelest adí
sti
codecont rast eyel
i
ntervalo deconf i
anzasonl asquef iguranenl afi
la3del apágina11del
for
mul ari
o.Ambasf órmulassólot ienenencuent aloscambi osodi f
er encias
entr
eunayot r
acondi ciónexperi
ment al
.Lasegundaseconocecomot estde
McNemarysól osepuedeempl earsi seutil
izauncontrastedehipótesisbi lateral
,
yaquealest arelevadoalcuadradonoi nformadel adi
reccióndel asdifer encias.
2
Porot r
apar t
e,sielvalordeχ esmuypequeño,t ampocot i
enesent i
dor echazar
l
ahipót esisnula.

Resumendet
rucost
emas1-
4:

-Si
pregunt
anporpor
cent
aje,
esuncontr
ast
edepr opor
ciones.
-Si
pregunt
anporundat
oengeneral
,esuncont
rastedemedi as,
sal
voquese
23
i
ndi queotr
acosa.
-Sinosdaneldatodecuasi
vari
anzaovar
ianzainsesgada,hacer
efer
enci
aa
valoresmuestral
es,nodel
apoblaci
ón.Sal
voquesedi gaotracosaosehagal a
prueba F,sepr esumequel asvari
anzaspoblaci
onalesson desconoci
dasy
supuestasdif
erentes.

TEMA5DI
SEÑOSCONMÁSDEDOSGRUPOSI
NDEPENDI
ENTES.

1.
-INTRODUCCI
ÓN.

ElAnálisisdeVar ianza( Analy


sisofVarianceoANOVA oANVAR)esuna
técni
ca par amétr
ica de análisi
sestadí
sti
co que se ut i
li
za par
a compar arl
a
vari
abil
idaddel asmedi asdemásdedosgr uposestudiandolainf
luenciademás
dedosv aloresdel aVIsobr elaVD,conmásposi bil
i
dadesdeest abl
ecerl
a
rel
aciónprecisaentr
eel las.

2.
-CONCEPTOSBÁSI
COSDELANOVA.

Enelmodel omássimple,deunsol
of act
orounifact
ori
al,l
avar
iabi
l
idado
vari
anzagener
alocomúnqueseobser vaentr
elaspuntuaci
onesdel
osgr upos
despuésdehaberint
roduci
docambiosenlaVI,est
áformadapordospar t
eso
componentes:

a)Laquesedebeal osdistintosnivelesdelf act


orestudiadoovar
iabl
e
i
ndependi
ent
e,conoci
dacomov arianzaintergrupos.
b)Laquesedebeal osfactor esextr
añosynocont r
olados,quer
eci
beel
nombredeer
rorexper
imentalovarianzaintr
agr upos.

ElcometidodelANOVA esdiscerni
rquév ari
abil
idadcor respondeacada
parte.En l
at er
minol
ogí
a delANOVA,l as v
ar i
ables independientes que se
estudi
anreci
benelnombredefactoresylascategoríasenquesedi videnlos
factor
es,
eldenivel
es.

Losdiseñosenl osquel osni velesact


úancomounamuest radel osposi
bles
nivelesdelfactorycuyasconcl usionessepuedengeneral
izarparatodosell
os,se
conocecomodeef ectosaleatoriosomodel oal
eator
io.Silasconcl
usionesestán
restri
ngidasal osnivelesestablecidosprevi
amenteeneldi seño,set r
atadeun
diseñodeef ectosomodel osf i
jos.Silosgruposomuest rasti
enenelmi smo
númer odeel ementos, est
aremosant eunmodeloequili
brado;enotrocaso,ante
unmodel onoequi l
i
brado.

3.
-FUNDAMENTOSDELANÁLI
SISDEVARI
ANZA.

Sipar
ahacercompar
aci
onesent
remásdedosmuest
rasut
il
izár
amosl
as
24
pruebasT( temas3y4),ademásdel acompleji
daddeloscál
culosport enerque
analizarl
asdedosendosent odaslascomplicaci
onesposi
bles,tendr
íamosdos
problemas:
a)Sepasar í
aporaltolainter
acci
ónent relasvari
abl
esi ndependient
eso
factores.
b)Aument arí
alapr
obabil
i
daddecomet erelerr
ordeti
poI.

Par
aev i
tarestosproblemasseut il
izaelAnál isi
sdeVar i
anza(ANOVA o
ANVAR)cont rast
andoladifer
enci
ademedi asentrev ar
iasmuest
ras.
Lahipótesisnul
ageneralesquenoexi st
ediferenci
aalgunaentr
elasmedi
as
(enlav
ariabledependi
ente)delosdi
sti
ntosgruposomuest r
as.

Parami ni
mizarl ainfl
uenci adelasv ari
ablesextrañas,conoci
dasonoyev i
tar
sesgossi stemáticosenl osr esult
adosqueseconf undenconl osef ect
osque
pudierandeber seal av ariableindependientesepr ocedeal aal
eatori
zacióndel
muest reot antoenl ael eccióndel ossuj etoscomoenelor dendeasi gnacióna
l
ascondi cionesexper i
ment al
esoni v
eles( contr
abalanceo).Estoreduceaunque
noel i
mi nal aposi bi
li
daddequel asdi f
erenciasobser vadasentrelosnivelesno
seanf rutodelef ectoconj untodel av ar
iableindependienteydef actor
esdeazar
yport anto,per mitesuponerquel oserroresexper i
ment al
essoni ndependient
es
delosef ect osdel osdisti
nt osnivel
esdel osf act
ores.

4.
-ANÁLI
SISDEVARI
ANZADEUNFACTOR(
ANOVAUNI
FACTORI
AL)

Enelmodel omássi mple, deunsól ofactor,l


avariabil
idadsedescomponeen
l
av ari
anzaat r
ibuibleal osdi stintosnivelesdelfactorov arianzai nter
gruposyl a
vari
anzaat ri
buibleal errorov ar i
anzai ntr
agrupos.Elpunt oesenci alesdetermi nar
silav ar
ianza intergrupos ( debi da alf actormani pulado)es si gni
fi
cativa en
rel
aciónconl av ari
anzai ntragrupos( debidaalazar).Elest adíst
icodecont raste
eselcoci enteent reambasv arianzasysedi st
ri
buyeconar regloal aFdeFi sher-
Snedecor.Elcont rasteesuni lateralderecho,porquesól ov al
oresgr andesdeF
permitenat r
ibuirsignif
icaciónest adísti
caal avari
abil
idadobser v
ada, si
endomuy
i
mpr obablequesuv alorseai nferiora1( impli
carí
aquel avar i
anzadeler rorono
expl
icadaesmay orquel aobser v
adaent regrupos).

Lospasospar areali
zarelANOVAson:
1.
-Pr obarl ossupuest osqueper mit
enapl i
carelANOVA:VD cuant itati
va
medida a escal a de inter
valoor azón (no sir
ve sies or di
nalo nomi nal),
i
ndependenci a de l as observaci
ones (testde r achas),normali
dad de l as
di
stri
buciones( pruebasdel abondaddeaj uste,Li
ll
iefor
s,Kolmogorov-
Smir nov,
2
X dePear son),yhomogenei daddel asv ar
ianzas( homocedast
ici
dad,testde
Cochran par a model os equili
brados y testde Bar t
let
tpar a modelos no
equi
li
brados).
2.
-Enunci arlashipótesi
sestadísti
cas.
25
3.
-Deci di
rel estadíst
icodecont rastequevamosaut i
li
zarparaprobarl
aH0.
4.
-Est abl
ecerel niveldeconf i
anzaol aregi
óncrí
ti
cader echazodelaH0
5.
-Cal cul
arel valordelestadíst
icodecont r
aste(
TabladelANOVA)
6.
-Tomarl adeci si
ónsobr elaH0( comparandoelval
orFobt eni
doconelval
or
cr
ít
ico,contrasteuni l
ater
alderecho) .
7.
-Interpret
aciónenel contextodel ai
nvesti
gaci
ón.

Elmodel oser epresentamedi ant


el aexpr esi
ónYij=µ+αi+εij,enelque
act
úansobr elaVDY, def ormali
neal t
rescomponent es, si
endo:
-Yijescadapunt uacióndel av ar
iabledependientepar acadasujetoycada
ni
vel.
-µesl amedi adelapoblaci
ón( constante).
-αieselnivelcomúnat odoslosel ement ossomet i
dosaeseni vel
delfact
or.
-εijesel
er r
orexperi
ment al
paracadasuj etoycadani v
el.
Lossubí ndicesirepresent
anl osIni v el
esdelf actoryl ossubíndi
cesj,el
númer o ndeel ementososuj etosmedi dosencadani vel
.Elesquemaesel
si
guiente:

26
HIPÓTESI
S Efectosf
ij
os(sobr
elasmediaspobl
aci
onal
es)/
/Ef
ect
osal
eat
ori
os(
sobr
elasv
ari
anzas
cuandoson=0,lasmedi
assonigual
es)
.

EFECTOSFI
JOS EFECTOSALEATORI
OS
H0:
µ1=µ2=µ3=…=µi σ2B=0
H0:
H1:
µ1≠µ2≠µ3≠…≠µial σ2B≠0
H1:
menospar
aunaµi
Cál
cul
osi
mil
ar

TABLAANOVAUNI
FACTORI
AL(
Últ
imocuadr
opági
na12f
ormul
ari
o)

FUENTEDE SUMAS GRADOSDE MEDIAS ESTADÍSTI


CODE
VARIACI
ÓN CUADRÁTI
CAS LI
BERTAD CUADRÁTI
CAS CONTRASTE
ENTRENI
VELES SCINTER I–1 MCINTER
Nºdegr uposo (
SCINTER)/(
I–1) MCINTER
ni
vel
esmenos1 F= -
--
--
--
---
--
-
DENTRODELOS SCINTRA N–I MCINTRA MCINTRA
NI
VELES Nºde (
SCINTRA)/(
N–I)
suj
etos
menosNº
degrupos
TOTAL SCTOTAL N–1 Sedist
ri
buyeFdeFisher
-Snedecorcon
Nºdesujet
os (I–1)y(N–I)gr
adosdeli
bertad.
menos1

CÁLCULOS:
Secumpl
e[SCTOTAL=SCINTER+SCINTRA]yG.l
i
ber
tad:
[N–1=(
I–1)+(
N–I
)]

SCTOTAL=ΣΣY2–{ 2
(ΣΣY)/N}
SCINTRA=SCTOTAL-SCINTER
2 2
SCINTER=Σ(
ΣY) /n–{ (ΣΣY) /N}

DECISIÓN:RechazamosH0 ( i
gualdad demediasenl osdisti
ntosni
vel
es)sielvalordelaF
experi
ment al(
estadíst
icodecont
raste)esmay orqueelv
alorFobteni
doenlastabl
as,
par
aunnivelde
si
gnifi
cación(α)predeter
minado.

ElNumer
adordelestadísti
codecontr
ast
e( MCINTER)conti
enelaVarianzadeer
ror+Efector
ealdela
VI
.ElDenomi
nador(
MCINTRA)c ont
ienel
aVari
anzadeer ror.Port
anto,cuantomenoreselefect
orealde
l
aVImásseacercaelcocienteauno.

Val
orCr
ít
ico:F(I-1)(N-I)(1-α) ZonadeAcept
aci
ón:F<F((I-1)(N-I)(1-α)

Deci
sión:
ZonadeRechazo:F≥F(I-1)(N-I)(1-α) SiF<Fcrítico AceptamosH0
SiF≥Fcrítico RechazamosH0

27
Cálcul
osabreviados(Util
izamoselsist
emadenot aci
ónpropuestoporKeppel
):ElcálculodelasSumas
de cuadrados se r eal
iza sumando y restando l
as r
azones básicas:[Y]( r
elacionada con l
as
puntuaci
onesindivi
duales);[
A]conlostot
alesdelosni
vel
esy[ T]conl
asumat otal
.

Estr
uctur
adecálculodelnumerador
:Seelevanalcuadr
adol
ascanti
dadesi
mpl
i
cadasypost
eri
orment
e
sesuman.
Estr
uctur
adecál cul
odeldenomi nador:Cual
quier
aqueseaelt ér
minosedivi
deporelnúmerode
puntuaci
onesquecontr
ibuyenasucálcul
o.

Fór
mul
aspar
alasr
azonesbási
cas SumasCuadr
adosapar
ti
rder
azonesbási
cas

[T]=T2/(a)(
n) Di
señoequi
l
ibr
ado SCTOTAL=[
Y]–[
T]
2
[T]=T /N Di
señono
2
equi
li
brado SCT=∑∑(
Y–YTOTAL)

A]=∑A2/n
[ Di
señoequi
l
ibr
ado SCA=[
A]–[
T] SCINTERGRUPO
2
SCA=∑n(
YA–YTOTAL)
[
A]=(∑A21/n1)+(
∑A22/n2)+…
(
Diseñono
equi
l
ibrado) SCS|A=[
Y]–[
A] SCINTRAGRUPO

Y]=∑Y2
[ SCS|A=∑∑(–
Y YA)
2

N=Númer
otot
aldeobser
vaci
ones/
/n=Obser
vaci
onesporni
vel

Recapi
tul
ando,enelANOVA uni
fact
ori
al,l
ashi
pót
esi
squesesomet
ena
contr
asteson:

-Enelmodel odeef ectosfijos,lahi pótesi


snul apost ul
al aigualdadde
mediasentr
et odosl osnivelesdelf actormani puladoyl aal t
ernati
va,queal
menosunaesdi fer
ente.
-En elmodel o de efectos aleatori
os,la hipótesi
s nula es que no hay
var
iabi
li
dad(vari
anza)ent
relasmedi as(soniguales)ylaalt
ernati
va,quesílahay
(I
nci
so,l
av ar
ianzasól
opuedeserposi t
iva,
porserunv aloralcuadrado).

Elestadí
stico de contr
aste es elcociente entr
el a medi
a cuadrát
ica
i
ntergr
uposylamedi acuadráti
caintr
agrupos,quesedistri
buy
esegúnunaFde
Fi
sher-
Snedecor,con( I-1)y( N -I)gradosdel iber
tad,enelnumeradory
denominador
,respect
ivamente(pági
na12del for
mulari
o).

En elexamen se suel
en f
aci
l
itarl
osdat
osde l
asmedi
aso l
assumas
28
cuadráti
casnecesar
iospar
acalcul
arlosr
estantesylomási mpor t
ant
eessaber
rel
aci
onar l
asambasmedi ant
elasf ór
mulascor r
espondi
entes(estátodoenel
formular
io,enelexamenhayquet enerpacienci
apar abuscarlosdatosenla
tabl
aquecor r
esponda):

SCtotal=SCInter.+SCintra(SC=sumacuadr áti
ca),midelavari
abili
dadt otalyes
i
gualal asumadet odasl aspuntuacionesmenosl amediatotalalcuadrado.
SCIntermi delav ar
iabilidadentr
elosnivelesov ari
abi
li
daddebidaalef ectodel
fact
oryesi gualal asumadel amediadecadani velmenoslamedi adelf actoral
cuadrado.
SCintra midelav ari
abilidaddentrodecadani velov ar
iabi
l
idaddebi daaler ror
experi
ment alyesl asumadecadapunt uaci
ónmenosl amedi adesuni velal
cuadrado.

Las medias cuadrát


icas se obt
ienen di
vi
diendo l
as respect
ivas sumas
cuadrát
icasporl
osrespecti
vosgradosdeli
bert
ad( MC=SC/g.
l.
).

Par aresolv
erelSudoku,convi
eneempezarporelfi
nal
:Losgradosdeliber
tad
tot
alesdelANOVAesN- 1yapar ti
rdeahísev acomplet
ando.Comoseexpl ica
enelr ecuadro,sinosdanlasrazonesbási
cas(comoensept i
embre) asA2son
,l
l
oscuadr adostotal
esdelassumasdel asA,nol assumasdel asAelevadasal
cuadradoyl asn,elnúmerodesujetosdecadamuestraoniv
el.

5.
-COMPARACI
ONESMÚLTI
PLES(
prev
ior
echazodeH0)
.

ElANOVA, mediantelaobt enci


óndeunar azónFsigni
fi
cati
va,permiteafir
mar
quealmenosent redosmedi ashaydiferenciasquenosondebi dasalazar ,pero
nodicedóndeest áesadi ferenciasignifi
cati
va.Lascompar aci
onesmúl ti
ples
permit
enestablecerunai nf
or maciónmásexact asobrelaimportanciadecada
unodel osni
velesdel avari
abl ei
ndependiente.ComopartedelANOVA, elobjeto
delascompar acionesmúl ti
pl eses,aplicandopruebasespecí f
icas,reducirla
canti
dad deerrorTi po I(α)quecomet erí
amossicompar ásemost odasl as
muestrasdosadosmedi antel apr
uebaT.

Parti
endodelrechazodel ahi
pótesi
snulasisóloint
eresacompararal
gunos
ni
v eles delf act
or el egi
dos de antemano,habl ar
emos de compar aci
ones
plani f
icadasoapr i
ori.Enestoscasos,l
osresul
tadosobtenidosdeFnisiquier
a
suel encitar
se.Perosii nt
eresahacer
lassobretodoslosnivelesdelANOVA,se
tr
at arádecompar acionesnoplani
fi
cadas,apost
erioroposthoc.
i

Una delaspruebasmásut i
li
zadasen est esegundo caso esl
a del as
compar aci
onesmúlt
ipl
esdeScheff
é,queademásdecompar arl
asmedi
asdel os
nivelesdelANOVAdosadosper mitereal
izarcomparacionesmáscompl ej
as
(porejemplolamediadeunni
velconunconj unt
odemedi asdeotr
osni
veles,un
29
conj
unt
odemedi
asdedi
sti
ntosni
vel
esconot
roconj
unt
odemedi
asdeot
ros
ni
vel
es,et
c.)
.

Est
apruebafi
jalatasadeerrordeti
poIenelαalqueest emost rabaj
andoy
obti
eneunv al
orll
amadodi fer
enciamínima,r
angoov al
orcr í
ti
coCR ( Cri
ti
cal
Range)deSchef
féporencimadelcualseconsi
der
aquehaydi ferenci
asentrelas
mediasogruposdemedi asqueest emoscomparando.Lafórmulaest áalfi
nal
delapági
na12del f
ormular
io:

__
___
___
____ __ ____ _ __
___
______
___
__ _
_
2
CRSCHEFFÉ=√(
k-1)F(k-1),glERROR ·√MCERROR[
Σ(cj/nj)
]

Siendo, k=Númer odegr upos;ni=númer odesujetosdecadagr upo;F(k-1),gl


ERROR =Fe xper
imentaldelANOVA;MC ERROR =Medi acuadráticaerroryc2j=
Coef i
ci ente de l as combi naci
ones lineales. Los coeficientes son l as
combi naci oneslineal
esquepodemosest ablecerentr
elasdi stint
asmedi asa
compar ar;elrestodev aloressepuedeobt enerdel atabl
adelANOVA.Encada
combi naci óndecoef icientesci,lasumadel osmi smosesi gualacer o.Un
coef i
cient e ci iguala 0 si gni
fi
ca que ese gr upo queda el iminado de l a
compar ación.Vamosav erunosejemplosdecómosecal culanl oscoefici
entes,
con 5 gr
upos:

Comosev e,lasumadel oscj,


siemprees0.Pr i
merosecal culanloscjdelos
quesecombi nanconj untamenteysel esponeun1consi gnonegat i
vo(enalgún
examensal i
óconcoef i
cient
escomo½) ,conlaponderacióncorrespondi
ente.Es
decirsicompar amosunamedi acontrados,est
asdosúl ti
masdebendi vi
dir
se
por2, ol
oqueesl omismo, laquev asoladebemulti
pli
carsepor2.Enelej emplo
3,lasmedias1y5semul ti
pli
canpor3yl asrest
antes,por2.Comoseel evanal
cuadrado,daigualelsigno+o–quesepongaacadacoef ici
ent
e.

30
Regl
adedeci
sión:

Sielval
orabsol
utodeladiferenciadel asmedi asdel osgruposcomparados
es may or que elCR,existen di ferencias signi
fi
cati
v as ent
rel os ni
vel
es
consi
deradosynoencasocont r
ario.Elr esul
tadoindicar
áaquégr upoogrupos
corr
espondelavari
abi
li
dadsi
gnificati
v adetectada.

31
TEMA6.ANÁLI
SISDEDATOSENDI
SEÑOSI
NTRASUJETOS.

Un di seño intrasuj et
os,ANOVA uni factorialint
rasuj etos o de medi das
dependi entes or epet i
dasesaquelenelquesesomet eal osmi smosoalúni co
sujetoex periment alat odosl osni veles( estudiados)delf actor
.Par ami nimizar
(nuncael iminarporcompl eto)elprincipalriesgodeer ror( aprendizaje,
paut asno
detect adas,f ati
ga,et c.),l
asecuenci auor denenquesepr esentanoapl i
canl as
condi cionesal ossuj etosdeber eali
zarsecont r
abalanceando.Si nembar go,est o
sólo es est rict
ament e necesar i
o siut i
l
izamos un di seño en que t odos l os
estímul osdelmi smot iposepr esentanagr upadosenundet erminadoor deno, si
esenor denal eatori
o, sequi er
edescar t
arquehay apat
ronesdepr esentaciónque
hanpasadodesaper cibidos.Fór mulaspági nas12yss.delf ormulari
o,siendol os
valoresdel ossumat or i
osr epresentadosent r
ecor chet
esl asr azonesbási cas.

Condici
onesysupuest os:Lossupuestosquedebencumpl i
rsepar apoder
apli
carcor r
ectamente elANOVA son l os mi smos v i
stos par a elANOVA
i
ntersuj
etos,est
oes,VDmedi da,aunniveldeintervalooder azón, puntuaciones
de la VD en cada ni v
eldelf act
orindependi entes entre síy di stri
buidas
normalmenteyademás,doscondi ci
onespar t
icul
arespar areducireler r
orporl a
i
nteracci
ón:Lasv ari
anzasdel aspuntuacionespar al
osdi st
intosniv el
esdel
fact
ordebenseri gualesentresíylascovarianzasent retodosl osni vel
esdel
fact
ordebenserigualesentr
esí.

Supuestaslahomocedastici
dad (i
gual
dad dev arianzas)yl aigualdad de
correl
aciónent
recadapardet r
atami
entos,lamat r
izdev ari
anzas-
covari
anzas
tendrálapropi
edaddelasimet r
íacompuesta,condi
ciónsuf ici
entepar
ausarel
model operononecesar
ia,si
endo pococomúnenl aprácticayexcesi
v amente
restri
cti
va.

Metodologí
a: Lav ari
abil
idadtotalSCT=SCA+SCS+SCAxS, si
endo:
-SCA,lavar
iabil
idad( var
ianza)delfact
ormani pul σ2A)
ado( .
-SCS,lavar
iabil
idad( var
ianza)delossujetos( σ2S).
-SCAxS,l
avariabil
idad( v
arianza)delainteracciónentr
eelf act
oryl
ossuj
etos
2
(
σAxS,error)
.

Enelmodel oseconsideraquelaf uent


edeler
roreslainter
acci
ónent reel
factoryelsujetoporlai
nconsist
enci
aconquelossujet
ossecompor tanbajolos
diferent
estratamient
os[ (
AxS)->MCSXA oMCe]
.Parareducirsuv ar
ianzayl os
gradosdel i
bertadsedescomponeenuncomponent easociadoalaposi ci
óndel
tratamient
o( SCP),queser educeconelcont r
abal
anceo yunr estor esi
dual
,
desconocidoei rr
educi
ble:

(
SCAXS)=(
SCp)+(
SCresidual)si
endo(
g.l
.AxS)=(
g.l
.p)+(
g.l
.r
esi )
dual

32
El
est
adí
sti
codecont
rast
eesF=(
MCA/MCSxA)(
Fisher
-Snedecor
).

Lafor
madecálcul
oesmuysimil
araladelt
emaanteri
or,perouti
li
zandol as
fór
mulasdelapági
na13delf
ormul
ari
o(v
arí
anlosg.l
.yportanto,l
asrelaciones
entr
eMCySC) .
TEMA7.DISEÑOSCONMÁSDEDOSGRUPOSI NDEPENDI ENTES.ANÁLI SIS
DE VARIANZA CON DOS FACTORES COMPLETAMENTE ALEATORI ZADOS
(ANOVABIFACTORI
AL).

Enlosdi señosfactori
alessequi er
eestudiarelefectoquesobr eunav ari
abl
e
dependiente ejercen dos f actores o v ari
ables independientes A y B
completament ealeatori
zados,todosel l
osconi gualnúmer odecat egoríasde
modot odosl osnivelesdeunosecombi nanconl osdelot ro.Undiseñofactori
al
consi
steenunconj untodedi señossimplesdeunf actorenelcuall ami sma
var
iabl
ei ndependienteesmani puladaencombi naciónconunasegundav ari
abl
e
i
ndependi ent
e.

Conundi
señof
act
ori
alsepuedenanal
i
zar
:

1)Losef ectospr i
nci esdecadaunadel
pal asVI(factores)sobrel
aVD.Se
consi
derantantosef ectospri
nci
palescomof actoreshayimpl i
cadoseneldiseño
yseanal i
zanmedi anteunANOVA decadaf actorsi
nconsi derarelotr
o.Los
efect
ospr i
ncipalesdeunav ar
iableindependienteo factorser ef
ier
enal os
efect
ospromedi otot al
esdeunav ari
ableyseobt i
enecombi nandoelconjunto
complet
odecomponent esexper
imentalespresentesenesef actor
.

2)Elef ect
oi nt
eracci
ónent r
el osf act es.Exi
or steinter
accióncuandoelefecto
producidoporl osnivel
esdecadaunodel osfactoresdependedel osnivel
esde
otrofactor.Enelmodel oANOVA,l asVIseconsi deranindependi
entesentresí
perolosv alor
esdeunosf act
oresi nf
luy ensobrenlosdeot ros.Portanto,
además
de lai nfl
uencia que cada factorej erce porsepar ado en la VD,existe una
i
nfluencia debida a l a combinación de ambos.Se consi der
a que existe
i
nteracciónencual qui
eradelossi guient escasos:

-Cuandolosef ectossobr elaVDdeunf actorcambiaantediferentesnivel


es
deotro.
-Cuandol ospat ronesdedi ferenci
asasociadosconunf actorcambi ancon
l
osdi f
erent
esnivelesdeot ro.
-Cuandol osef ectossimplesdeunf actornosonl osmismosent odoslos
ni
velesdeotro.
-Cuandol osef ectosprinci
palesdeunf actornosonr epresentati
vosdel os
ef
ectossimplesdeesemi smof actor.
-Cuandol asdi fer
enciasent r
el asmediasdel asceldasquer epresentanel
ef
ecto de un f actoren al gún ni veldelotrof act
orno son i guales a las
33
cor
respondi
entesdif
erenci
asenotr
oniveldeest
efactor.
-Cuandolosefectosdeunfact
orestáncondi
cional
menterel
acionadosalos
ni
velesdeotr
o.
-Cuandounfactornoti
eneunefect
oconstant
eent odosl
osnivelesdeot
ro.

3)Losefect
ossi
mples,omásf zadosdecadaf
ocal
i actorconcadani
veldel
ot
rofactor
.Sepuedenconsider
artant
osefect
ossimplescomol asumade
ni
vel
esdecadafact
or.

Procedimiento:Apar t
irdelatabladelANOVAf actori
alsereali
zal aprueba
ómnibus( efectosprinci
palesyefectointeracción).Sielefectointeracci
ónes
si
gnifi
cati
voseconcl uyequeelef ectoproduci doporl osnivel
esdeunf actor
dependedel osni v
elesdeot r
ofactoryrechazar emosH0. SiFnoessi gnifi
cati
va,
seacept aH0,seconsi deraquenoexi st
eef ect
oi nt
eracci
ónyelmodel ose
convi
erteenf actori
aladit
ivo(nor
mal )
,demodoqueenelcuadr odelANOVAl a
fi
ladelainteracci
ónsesumaal er
roryser ecalculaF.

Sielef
ect ointeracciónessi gni
fi
cati
vo,sereali
zalapr uebadelosef
ect
os
simplesycompar aci ónporpar esydespuésl adel osef ect
ospri
nci
pal
esen
funci
óndel osefectossi mples.Sinoessignif
icat
ivo,sereali
zalapr
uebadel
os
efect
osprincipal
esysial gunoessi gni
fi
cati
vo,sepr ocedealestudi
odelas
comparaci
onesmúl t
iples.

Model
oest
adí
sti
codeANOVAconi
nter
acci
ón:
Y=µ+α+β+(
αβ)+ε.

Cualquierpunt
uaci
ónYt i
ene5component es:Lamediatotaldelapoblación,
l
osni v
elesdel osdosfactor
es,comúnat odosloscomponentesadscrit
osaesos
ni
veles(promediosdel osefect
osdeltr
atamientoenlosniv
elesdel osfact
ores),
elef
ectointeracci
ónentreambosyel er
rorexperi
mentalnocontrol
able.

Model
oest
adí
sti
codeANOVAsi
nint
eracci
ón:
Y=µ+α+β+ε.

Cualqui
er punt
uaci
ón Y t
iene l
os mi
smos component
es,except
o l
a
i
nteracci
ón.

Alconsiderarlaint
eracción,l
aSCintra dismi
nuy
eenl acuantí
aquer ecogela
SCAxB delainteracci
ón,asícomol osgr adosdelibertad,demodoquel aF
resul
tant
eser ámay orporladi sminuci
óndel aMCerrory
,enconsecuencia,más
preci
soelcontrastedehipótesis.

Lashi
pót
esi
sest
adí
sti
cassepuedenexpr
esardel
asi
gui
ent
efor
ma:

Ef
ect
ospr
inci
pal
esf
act
orA:H0:
Todosl
osαi=0;
H1:
Not
odosl
osαi=0.
Ef
ect
ospr
inci
pal
esf
act
orB:
H0:Todosl
osβi=0;
H1:
Not
odosl
osβi=0.
34
Ef
ect
oint
eracci
ónAxB:
H0:
Todosl
osαβij=0;
H1:
Not
odosl
osαβij=0.

Losestadísti
cosdecont
rast
esonl asrazonesentr
elasmediascuadr
áti
cas
cor
respondientesyl
amediacuadrát
icai
ntr
agr upos,
quesedi
str
ibuy
esegúnF.

Lasf órmul aspar aloscálculosdelANOVAest ánenl aspáginas14y15del


formulario,consi derando sólo diseñosequi li
brados.Elpat r
ón deanál i
sises
análogoal osdel osot rosmodel os, incl
uy endodosf actor
es, l
aint
eracciónentre
ambosyaj ustandol osgradosdel ibertad.LaSCintra sedivideasuv ezent res
component es:
-Ent retratami entosdelfactorA( SCA),quer ef
lej
al osefectosprinci
palesdel
factorA.
-Ent ret r
atami entosdelfactorB( SCB),quer ef
lej
al osefectosprinci
palesdel
factorB.
-Lai nteracci
ónent reAyB( SCAxB).
Acont inuaciónsepr esentaunej empl odelmodel ocon2f actores,zonay
duración,asícomol asecuenciadeanál i
sisf actori
al:

35
Fi
gur
a7.
5Secuenci
adeanál
i
sisenundi
señof
act
ori
al

36
TEMA8.
-ANÁLI
SISDEREGRESI
ÓNLI
NEALSI
MPLEYMÚLTI
PLE.

1.
-INTRODUCCI
ÓN.

Elanálisisder egr esiónesundi seño expostf acto quepuedeserusado


siempr equeunav ari
abl ecuant i
tati
vapuedaserest udiadacomounaf unciónde
una( ARS,anál i
sisder egresiónsi mple)ov ar
iasvariabl
es( ARM,análisi sde
regresiónmúl ti
ple)
.Lasr el
acionesent relaVDyl aVIpuedensermuydi v ersas:
l
ineal,exponenci al
,logar í
tmica,etc.Enest etemasóloseest udialaregr esi
ón
l
ineal.Elanál i
sisder egr esióntambi énsepuedeapl i
carasi tuaci
onesenl asque
se mani pulen condi ciones exper imentales,de modo que “ casicual quier
i
nf ormaciónquet engai nt
eréspar aelest udi
odel aVD puedeserobj etode
i
ncor poraciónenest et ipodeanál i
si
s”.

Unabaj a corr
elaciónent r
ev ari
abl
esimplicaquenohayr el
aci
ónl i
nealentr
e
ell
as, per
onodescar t
aquepudi erahaberl
adeot rot
ipo(exponenci
al,l
ogarí
tmica,
etc.).Unaal t
acor relaciónl i
nealoi mpli
canecesar i
amentequehay arelaci
ón
causalent reellas,puespodr íaocurri
rqueambasf ueranafect
adasporuna
vari
abl eajenaalmodel o,porejemplo,C.I
.yal t
urat
ienenaltacorr
elaci
ónenl os
niñosper oambasest ánr el
aci
onadasconl aedad.

2.
-ANÁLI
SISDEREGRESI
ÓN(
LINEAL)SI
MPLE.

Cuando una v ar
iable,independi
ente(VI)
,aport
ai nformaci
ón sobre ot
ra,
dependient
e( VD),decimosqueambasest áncor
rel
acionadas.Elobjet
odel a
corr
elaciónesanal i
zarelgr adodeasoci aci
ónentrelasv ari
abl
esyeldel a
regr
esión,efect
uarpr edicci
onesacercadel osval
oresdel aVD paravalor
es
dadosdel aVI.LaVIser epresentaporX,l
aVDporYyl osv al
oresest
imadospor
Y’.

I
maginemosqueenunagr áfi
caserepr esentanlospunt os(nubedepuntos)
queindi
canl osv alor
esdeX eY.Lar egresi
ónl i
nealser eal
izamedianteel
métododel osmí nimoscuadr adosajustandoadi chosdat osunalí
nearect
aque
mini
micel oscuadr adosdel asdifer
enciasent r
el osv al
oresreal
esdeYpar aun
val
orcualquieradeXyl osv al
oresesti
madosdeY( Y’)queresul
tar
íandeapli
car
l
aecuaciónder egresiónresult
ante.
Ej
empl osderegr esi
ónlinealyexponencial:

37
El
model
oser
epr
esent
a:

a)Par
apunt
uaci
onesdi
rect
as:
Y’=BX+B0,
siendo:

-Y’elval
orest i
madodeY,
-B l a pendiente de lar ecta de regr
esi
ón (coefi
ciente de r egresi
ón)y
representaelaument odev al
orqueexper i
mentaYcuandoXaument aenuna
unidad;
-B0,eli
nterceptoov alordelaordenadaenelorigen(v alorpronosticadodeY
cuandoX es0) .Eli nter
cepto,ali gualquelosdemásv al
oresdeY’quese
encuent r
enf ueradelr angodev al
oresdel aVI,noesobj etodei nterpret
aci
ón,
salvoqueel valor0seencuent redent r
odel r
angodev al
oresdel aVI .

b)Par a puntuaciones di
fer
enci
ales (dif
erenci
as entr
elas punt
uaci
ones
di
rectasyl amedi a):Y’=B(
X-)
X.Laor denadaenelor igenpar
apuntuaci
ones
di
ferenci
alesval
e0.

c)Par
apunt
uaci
onest
ípi
cas:
Z’=rZ.Y XY X

Lasdiferenci
asent
relosval
oresdel avar
iabl
eobservadosylosesti
mados
sonloser r
oresdeesti
maciónopredicci
ón.Lasumadel amediadelosv al
ores
pronost
icadosesigual
alasumadel amediadelosval
oresobser
vados.

Enconsecuenciaelmodel oderegresi
ónlinealesY’=BX+B0+ε endoεel
,si
errordeest i
maciónolosr esiduosunav ezesti
madoelv alordelaVD.Par aque
sean v áli
das l
as inf
erencias sobrela VD se deben cumpl irlas sigui
entes
condicionesysupuest osbási cos(sucompr obaciónrequier
equehay av ar
ias
muest rasqueper mit
anest udiarl
adistri
buci
óndel osdisti
ntosv al
oresdeY
predichosparacadavalordeX) :

-Independenci
adel asobservaci
ones(muestraselecci
onadaal
eatori
amente)
.
- Homocedasti
cidad,var
ianzasdelasdi
str
ibucionesdeloserr
oresigual
es.
38
- Nor
mal i
daddelasdi
str
ibuci
onescondi
cionadas.
-Independenci
aentrelosv al
oresesti
madosyl oser
ror
esdeest
imaci
ón.
Expr
esadoent ér
minosdecoef
ici
ent
edecorr
elaci
óndePear
son,r’
ε=0,est
o Y

es,l
oserr
oressedist
ri
buy
endemaneraal
eat
ori
a,si
ncor
rel
aci
ónconlaVD.

3.
-BONDADDEAJUSTEDELARECTADEREGRESI
ÓN.

Laexpr esi ónbondaddeaj ust


e,serefi
ereacómode“ expli
cat
iva”eslar ect
a
respect odel osdat ossobr el
osquesehaaj ustado.LavarianzadelaVD( tant
o
paraARScomopar aARM)sepuededescomponerenl asumadedosv ar
ianzas:
2 2 2
l
adel ospr onóst i
cosyl adel oserror
esor esiduos:SY =SY’+Sε,esdeci r
SCtotal=SCregresión+SCresidual.

Elgradodeasoci aciónent r
el asvariabl
esseexpr esamedi anteelcoefi
cient
e
de cor r
elación de Pear son,cuy ov alorest á si
empr e compr endi
do entr
e- 1
(relaciónlinealnegativ
a)y1( r
elaci
ónl i
nealpositiv
a),indicandoel0quenohay
relaciónl i
nealentrelasv ar
iabl
es( podríahaber l
adeot r
ot ipo,noobst ant
e).Su
fórmul a(pági na15)es:
Rxy=Sxy
SxSy
2 2
Elcuadrado delcoefi
cient
edecor r
elaci
ónr xy o R e selcoeficientede
determinaci
ón( v
alorcomprendi
doentre0y1)yexpr esalaproporcióndel a
vari
anzadel aVDexpl i
cadaporlavari
anzadel aVIyl apr opor
ciónenquese
reduceelerrordelaVDcuandoempleamosl arectader egresi
ónparaest i
mar l
a.
Elvalorabsolut
odelcoefi
cient
ededet erminaciónesmenorqueelcor relaci
ón,
salvocuandores0o+/ -1,quecoi
nci
den.
2
Elcompl ementari
odelcoef i
cient
ededet erminaci
ón1-r xy eselcoefi
ciente
dealienaci
ónyesl apar
teresidualdelav ar
iabi
li
daddelaVD,at ri
bui
bleaot ros
fact
oresnor el
aci
onadosl i
nealmenteconl aVD,esdeci r
,lapr oporci
óndel a
vari
anzadel aVDnoexpl icadaporl avar
ianzadel aVIoloqueesl omismo,l a
vari
anzadeler r
or.

Ot
roindicadordelajust
eeselerr
ortí
pico,queesunest
imadorinsesgadode
l
a desvi
ación tí
pica delerror
.Su f
órmula esla úl
ti
ma dela página 15 del
f
ormular
io.

4.
-INFERENCI
ASSOBRECORRELACI
ÓNYREGRESI
ÓN.

Normalment
el oscoef
ici
entesdecorr
elaci
ónyregresi
óndelapoblaci
ónson
desconoci
dos. Los supuestos bási
cos y condici
ones par
a poder hacer
i
nferenci
asdelosdatosmuest ral
esalosdelconj
untodel apobl
aciónsonlos
39
vi
stosant es(independencia de l
asobservaci
ones,homocedast
ici
dad de l
as
var
ianzas,normalidaddel asdistr
ibuci
oneseindependenci
aentrelosval
ores
est
imadosyl oserroresdeestimaci
ón).

-Contr
ast esobreelcoef i
cientedecorrelaci
óndePearson.Lahipótesi
snula
esquenohayr elaci
ónentreVIyVD( coef
icientedecor
rel
aciónpoblaci
onaligual
acero),mientrasquel ahipótesisal
ter
nati
v apostul
aquelar el
aci
ónl i
nealentr
e
ambasessi gnif
icat
iva:H0:ρ=0.H1:ρ<>0( ρeslalet
ragr i
egaro).Haydos
for
masder eal
izarl
o:

-Conelest adíst
icodelaf
il
a1col
umna1delatabl
a1delapági
na16del
f
ormular
io,quesedi st
ri
buy
ecomounaTdeSt
udentconn-
2gr
adosdeli
ber
tad
(
cont
rastebil
ater
al).

-Medi ant
eelANOVAdel ar
egresi
ón, conlar azónF=MCregresión/
MCresiduos,que
sedistri
buyesegúnunaFdeSnedecorcon1yn- 2gradosdel iber tad(cont r
aste
unil
ater
alderecho)
,for
mulari
o,tabl
a2, página16, gradosdeli
ber tadtot
al esdel a
regr
esión n-1.Se usa cuando nos dan l os datos de l
as sumas o medi as
cuadráti
cas.

-Hayunar
el ónT2=F,
aci vieneenel
for
mul
ari
o.

-Cont r
astepar aloscoefi
cientesder egr esiónByB0 ( ANOVA).Lahipótesi
s
nulayl aalternati
vasonH0:B=0;H1:B≠0sielcont r
asteesbi l
ater
al.Sies
unil
ateral
,l
aH0ser áB≤oB≥queelv alorfor muladopar alaH0.Losest adí
sti
cos
seincluyenenl asfi
las2y3del aprimerat abl adelapági na16delformular
io(T
deStudentconn- 2gr adosdel
ibertad),
cont rastebilater
al.
Hayquet enercuidadoconl asfórmulas“ ocult
as”delf or
mulari
o,porsienel
examenpusi eranunat abl
adedat osparalar egresión(pocof r
ecuent
e,peropor
siacaso):

S2Y.Enl
-SCtotal=n· acal culador aCasi o, enmodor egr esión,hayqueut ilzarσ2y.
i
Estafórmul anov ieneenni ngunapar t
eyhancaí dopr obl
emasenex ámenes
2
anti
guosenl osquedabanl av ar ianzat otaldeY( SY)per onol aSCtotal.
-SCtotal=SCregresión+SCresidual.Sededucedel cuadrodel ANOVAdel aregresi
ón
enlapági na16delf or mular io.Apar ecedef ormaexpl íci
taysepar adaenel
cuadrodel aARM.Despej ando, SCresidual=SCtotal-SCregresión
2 2
-r=SCregresión/ SCtotal.Despej ando, SCregresión=r ·SCtotal.

Lacal cul
adoraCasiopr opor
cionaB( b),B0 (a)yr,sinosdier
anlat abl
ade
datos.Sidanl ossumat ori
os,hayqueut i
lizarlasfórmulasdelapágina15del
for
mul ar
io,conelcui dadodequel abet asenl asqueseusanpunt uaci
ones

picasnohacenr ef
erencianoalosv al
oresdel osparámetrospobl
aci
onales

40
5.
-ANÁLI
SISDEREGRESI
ÓNMÚLTI
PLE.(
Fór
mul
as,
pági
na17del
for
mul
ari
o).

a)Regr
esi
óncondosv
ari
abl
esi
ndependi
ent
es.

Mi ent
rasqueelARSpr oducelalínearect
aquer elaci
onal aVD(Y)conlaVI
(X)
,elARM condosv ar
iablesi
ndependient
esproduceunpl anoderegresi
ónque
rel
acionalaVD( Y)conl osval
oresdel asdosVI( X1 yX2)(paramásdedosVI
serí
aunhi per
plano)
.

El
model
odeest
imaci
ónl
i
neal
múl
ti
plees:
Y’=B1X1+B2X2+B0+ε

Donde B1 y B2 son los coefi


cientes de r
egr esi
ón parcialde X1 y X2,
respectivament
e,B0,eselinter
ceptoov al
ordel aor denadaenelor igen(val
or
pronost i
cadodeYcuandoX1 yX2 v alen0,quenosei nterpr
etacuandoel0no
estáenel r
angodelosvalor
esdelaVD)yε, eler
rordeest imaciónoresiduosuna
vezest i
madal aVD.Lo señalado par aARS esv áli
do paraelARM,conl as
diferenci
asqueseseñal anacont i
nuación.Lasf órmulasest ánenl apr i
mera
tabladel apági
na17del f
ormulari
o.

b)Aj
ust
edel
model
o.Medi
dasdeasoci
aci
ón.

Elcoefici
ent
edecor r
elaci
ónmúltipl
eReselcoef i
cient equecor r
elacionala
VD conunacombi naci ónópt i
madedosomásv ar
iablesi ndependientes.Su
2
cuadr adoeselcoef icientededet erminaciónR,queexpl icaelpor centajede
variabil
idaddelaVIat r
ibuiblealaacciónconjunt
adel asVD.Comoocur reconla
2 2
varianzamuest r
alR noesunest i
madori nsesgadodeρ,por quecuant omás
pequeñaseal amuest ra,may orser
ál acontri
bucióndel av ari
acióndel aVIal a
2
del aVD.Elest imadori nsesgado deρ eselcoef i
cient ededet ermi naci
ón
ajustado, (
2ªfór
muladel a2ªtablapág.17del f
ormulari
o).

c)Cor
rel
aci
ónbi
var
iadaycor
rel
aci
ónsemi
par
cial
.

Sicalculamospar acadaVIsucor relaciónconl aVDsegúnl ast écni


casdel
ARS, obt endremosl oscorr
espondientescoef i
cientesdecor r
elación,quese
l
lamancor relacionesdosados,bi v
ar i
adasodeor dencer o.Conl acalcul
adora
Casio,sidi
erant ablasdeval
ores,
sepuedehacermet iendoenl atablalosval
ores
deYyl osvaloresdeX1,calcul
arB1yr 1yl uegosustit
uirlosdeX1porl osdeX2y
cal
cularB2yX2.

Sinembargo,estascorrel
acionessól
oof r
ecenunai ndi
caciónaparent
edel
i
nfl
ujodecadaVIenlaVDynosonpur aspuesnorefl
ejanlaverdader
ainfl
uenci
a
decadaVIai sl
adamenteconsi der
adasenl aV,alno t enerencuent anila
i
nfl
uenci
aentrelasdist
int
asVI ,nisuinf
luenci
aconjunt
aenl aVD.Poresol a
41
sumadel oscoef
ici
ent
esdecorrel
aci
ónbi
var
iadosser
ási
empr
emay
orqueel
coef
ici
ent
edecorrel
aci
ónmúl
ti
ple.

Par asaberquépar tedel aVDesexpl icadaexcl usiv


ament eporunaVI ,es
necesar i
oel i
minareli nf
luj
oquesobr ecadaVIt i
enenelr estodel asVI ’
s.La
correlaci
ónsemi parcialmidelasrelacionesent r
eunaVIyl aVDalmar gendel
i
nflujoquel asdemásVIdelmodel opuedant enersobredi chaVI.Sitenemosdos
vari
abl es i
ndependientes o predi
ctoras,en la correlaci
ón semi parci
alsr 1 se
eli
mi nalainfl
uenciadeX2 enX1;anál ogament eensr 2s eeliminalainfl
uenciade
X1enX2.

Elcálculodeloscoeficientesdecorrel
aci
ónsemiparcial (
sr1ys r
2)ser eal
i
zaa
partirdel oscoefici
entesdecor r
elaci
óndeor dencero(fórmul as,penúl
t i
maf il
a
de l a página 17 delcuader ni
ll
o).Los cuadrados correspondientes son los
coef i
cientes de determinación semiparci
al,que expresan l a proporción de
varianzadel aVIatri
buibleacadaVD,el i
minandoelinflujodel asdemásVIen
dichaVI .

Par
aent
ender
lomej
or,
veamosundi
agramadeVenn:
Y

a c
b

X1 X2

Eldiagramar epresent al av ari


abil
idadt otaldeY,l adeX1 yl adeX2.La
2
var
iabi
li
dadconj unta( R)deY at r
ibuibl
eaX1 yX2 esa+b+c.Lav ari
abil
i
dad
atr
ibui
bleaX1yX2( coeficientesdedet er
mi naciónbiv ar
iadosoaparentes)serían
a+b yb+c,r espectivament e.La v ari
abil
idad r esi
dualesd.Como v emos,si
sumamossi nmásl asv ariabil
i
dadesdecadaVI ,sumamosdosv ecesb.La
var
iabi
li
dadat r
ibui
bledef ormaexcl usivaaX1yX2( coefici
entesdedeterminación
2 2
semiparci
alsr1 ys r
2 )e sayc,r espectivament e,siendobl aproporciónde
var
ianzaconjunta.Comov emos,lasumadel oscoef i
cient
esdedet erminación
2
semiparci
alesesinferioral av ari
abil
idadconj untaR, yaquedejafueralacomún
42
deambasv
ari
abl
esi
ndependi
ent
es(
b).

La asi gnación de una par t


e de (b)a cada VI ,est o es,l a cont r
ibución
especí fi
cadecadav ari
ableenlav ari
abil
i
dadconj untadepender ádesuor dende
entrada.Par adet erminaresteordenhayv ari
osmét odos:Forwar d( haciaadelante)
yBackwar d(hacia atrás).Elmás usado es uno de l os pr imer os l
lamado
(stepwi seost epbyst ep)enelque,par ti
endodel ascor r
elacionessemi parcial
es
entrel as di st
intas vari
ables,se seleccionan poror den de may ora menor
correlación,secal cul
alaecuaciónder egresiónysev anintroduciendol asdemás
variables una poruna hast a que elaument o en elpor cent aje de varianza
propor cionadoporl aVIcor r
espondienteenlaVDnoseasi gnificativo.

Loscontr
astesconest
oscoefici
ent
esconsist
enencomprobarsilavari
aci
ón
expl
icadaporlavari
abl
eov ar
iabl
esintr
oduci
dasessigni
fi
cati
varespectodela
vari
anzaal
eator
iaoresi
dual
.Lasfórmul
asestánenlapági
na17del f
ormulari
o.

d)Cor
rel
aci
ónpar
cial
.

Ent odomodeloder egresi


ónexisteunapar t
edev ar
ianzadel aVD(cri
teri
o)
quenopuedeserexpl icadaporl asVI( predict
ores).Lacor r
el aci
ónsemiparci
al
permi t
e est
udiarla contri
bución de las disti
ntas VIa l a VD,el i
minando la
i
nfluenciaquesobrecadaVIej ercenlasdemásVI .Lacorrelaciónparci
alvaun
pasomásal l
á,el
iminandoademásl ai nf
luenciadecual quierv ari
abl
eespúreao
extrañaalmodelosobret odaslasvari
ables,tantolaVDcomol asVI.

Medi ant
eelestudiodel acor
rel
aci
ónentr
elosr esi
duos,esdeci
r,lav ar
ianza
noexpl i
cadaporlacorrel
aciónentr
eYyX2porunl adoyporl acorr
elaciónentre
X1 yX2 porotro,lacor r
elaci
ónparci
alseeli
mi naelefectodecual quierotra
var
iable,conocida o no,entrela VIconsi
derada yl a VD.En definiti
va,la
corr
elaciónpar
cialmidelacorrel
aci
ónpuradedosv ari
abl
eselimi
nandoeli nfl
ujo
decualquierot
ratantoenlaVIcomoenl aVD.
2 2
Elcuadradodeloscoef i
cientesdecorrel
aciónpar alpr
ci 1 ypr2 (coefici
ent
es
dedeterminaciónparci
al)sei nt
erpr
etacomol apropor
cióndel av arianzadela
VD no asoci ada a X2 que síest á asoci ada a X1 (yv i
cev ersa) y l
os
2
complement ar
ios1-
pr ,r
epresentanloscoefi
cientesdeal
ienaciónpar cial
.

Lasf
órmul
asestánenl
aspági
nas17y18del
cuader
nil
l
o.Vol
vi
endoal
di
agramadeVenn:

43
d

a c
b

X1 X2
2 2
pr
1 =a/(a+d)ypr
2 =c/(c+d)

Enconclusión,mientr
asl acorr
elaciónsemi par
cialsesi t
úaenelcont exto
excl
usi
v odelARM, tr
atandodeexpli
carl acontri
buci
óni ndependientedecadaVI
alaVD,l acorr
elaci
ónparcialponeelacent oenlaeli
mi naci
óndel osef
ectosde
cual
quiervari
ableextr
añaydel ascorrelaci
onesespúreaspr oducidasportales
vari
abl
esextrañasalmodelo.

RESUMENDETEORÍ
ADEARSYARM:

-Elanál i
sisdel osdiseñosexpostf actotrat
adedet erminarcómo un
conj
unto dev ariabl
es,quellamamosf act
ores,i
ndependient
es,pr edi
ctor
aso
expl
icati
vas,puedenexpli
carelcomport
amientodelavari
ableobjetodeestudi
o,
quellamamosdependi ent
eocr i
ter
io.

-Elmodel
oder egresi
ónli
nealest
imaelvalordel
aVD, mediant
eunafunci
ón
l
inealdeunaov ar
iasVI( Regr
esi
ónLinealSi
mpl eyMúlt
ipl
e,r
especti
vament
e).El
coefi
cient
edecor relaci
óndePear son(múlt
iple)mi
deelgr adodeasociaci
ón
entr
elaVDyla(s)VIyosci l
aentr
e-1y1.

-Elcoef icientededet ermi nacióneselest adísti


coquecuant if
icalabondad
delajusteeselcuadr adodelcoef icientedecor rel
acióndePear son( múlti
ple)
.Su
val
orosci l
aent re0y1ei nfor madel aproporciónenquel av ariacióndel aolas
VI’
sexpl i
canl adel aVDydel apropor ci
ónenqueser educeeler r
oralest i
marla
VD.Lapar tenoexpl icadaporelmodel oder egresión(error)esaquel laqueno
estár el
acionadal inealment econl aVDyesel coefici
entedeal ienaci ón.
-Elcont rast edel asignificacióndelcoef icient
ededet erminaci ónR2,sehace
medi anteelcoci enteent rel amedi ascuadr áti
casdel ar egresiónydeler r
or,
tomadodel at abladelANOVA( Fcont rast
euni later
alder echo)omedi anteel
estadísti
coT( contrastebil
at eral).
44
-Rexpr
esal
acor
rel
aci
ónent
rel
aVD(
Y)yl
amej
orf
unci
ónl
i
nealdel
asVI

s
(
Xi’
s).

-R2,eslapr
oporci
óndevar
ianzadeVDasoci adaalacombinaci
ónli
nealde
l
asVI ’
syt ambiénexpr
esal
areducciónproporci
onaldeler
rori
nici
aldelaVD
cuandoseajust
aunmodelodeesti
maciónconlasVI’
s.

-sr
i,
coef
ici
ent
edecor
rel
aci
ónsemi
par
cial
,expr
esal
acorr
elaci
ónent
reYyXi,
cuandodeestaúl
ti
masehaextraí
dol
aquemant i
eneconelr
estodelasVIdel
modelo.
2
-sri,coefi
cient
ededet er
minaciónsemipar
cialexpresal
apropor
ciónde
v
ar i
anzadeYasoci adaúni
camentelavari
anzadeXi,asícomoeli
ncr
ementoen
2
R cuandol
av ari
ableXient
raenelmodelo.

-pr,coef
i i
cient
edecorrel
aciónparcialexpr
esalacorr
elaci
ón“
pura”entr
eYy
Xi,el
i
mi nandolainfl
uenci
adecual quierotravar
iabl
e,estéonoenelmodel o.
Tambiénexpr esalarel
aci
ónent r
el apar t
edeYyl apartedeXiquenoest án
asoci
adasl i
nealment
econelrestodepr edi
ctor
as(var
iabi
li
dadent
rer
esiduos).
2
-pri,coef
ici
ent
ededeter
minaciónparci
alexpr
esal
apr
opor
cióndevar
ianza
deYnoasoci adaalr
est
odev ar
iabl
es,esténonoenelmodelo,quesíestá
asoci
adaconXi.

45
ADENDA:
PERLI
TASQUEHAYQUETENERENCUENTAPARANOFALLAREN
TONTERÍ
AS:

1.-Hayquel eerei nter pr etarbi enl osenunci ados.Sipi dencont rast essobr e
varianzas o sobr e pr opor ciones l o di r
án expr esament e o en elcaso de
propor ci ones,habl ando de por cent ajes o en elcaso de l as v ar i
anzas,de
variabilidades.Ent odosl osdemáscasos,si empr eesuncont r astedemedi as
(i
ncl usosihabl andepr opor ciónmedi aof recuenci adeaci ertos,elcont r ast ees
demedi as, sal voqueser ef i
er aapor cent aje, frecuenci aopr opor cióndesuj etos) .
Hayque f ij
ar se bi en siesbi later al( H0 esque no haydi fer enci as,H1,hay
diferenci as)ouni later al( der echo,H0 menoroi gual ,H1,may orque;i zquier do,HO
may oroi gual ,H1,menorque) .Cui dadoconf ij
arbi enn,cui dadocuandoden
muchosdat ospor queav ecesnospr egunt ansól osobr eunapar te.Cui dadocon
cadapr egunt a,not odassonsobr el omi smo.Enl asituaci ón1onor malesque
pregunt en pormedi as,pr opor ci ones yv arianzas.Sihaydos muest ras con
diferent enúmer odesuj et os,soni ndependi ent es.Sól osonr elaci onadassil os
mi smossuj et os( or elacionadosporpar es,i .
e.gemel os)sonsomet idosat odos
l
osdi stint osni velesdel fact or .
Sino sabemossegur al ar espuest a de pr imer ase i ncluso en t alcaso,
conv ienedescar tarl asqueseani mposi bles.Elv alorcr íticosebuscaenl at abla
par a1- αo1- α/ 2.
Par a ev itarer ror eso det ect arlos,conv ieneescr i
bi rdepuño yl et ra,con
claridad,t odosl osdat os,enl ugarsepar adoydest acadodedondehacemosl as
oper aciones.Par al acal cul ador a,conv i
eneescr ibirlasf órmul ast alv i
enenenel
formul ar io,si n si mpl ifi
caci ones que nos puedan i nduci ra er ror,con l os
par éntesi sensusi tio( est oesv i
t al).
2.-Pr uebapr ev iadelcont rast edei gual dad dev arianzas.Sedi videnl as
cuasi var i
anzaso v arianzasmuest ral esi nsesgadas,poni endo l amay orenel
numer ador( arriba) .Elcont rast eesbi l
at eral, port ant ohayqueacudi ral ast abl as
de l a F buscando 1- α/ 2;t i
ene que haber mucha di f
er enci a ent r
el as
cuasi var i
anzaspar aqueseconsi der el adi f
er enci adev ar ianzaspobl aci onal es
significat i
v a.SielEC >VC,ser echazal ahi pót esisdequel asv arianzasson
i
gual es.Si esmenor , seacept a.
3.-Ni velpcr íti
co:Eselni veldesi gni fi
caci óndelest adí st i
codecont rast e,es
deci r,lapr obabi l
idad,si endoH0 ci erta,deobt enerunv alori gualomásext r
emo
queeldelECquehemoscal culado.Lat abl anosdasi empr el apr obabi lidadque
hayal ai zqui er da, poreso:
-Sielcont rast eesuni lat eralder echo, elni velpcr í
ticoes1–pr obabi li
dadde
l
at abla.Buscamoselv alordel apr obabi l
idadquehayenl acol ader echadelECy
l
at abl anosdal aquehayal ai zqui erda, poresor estamosde1el v alordel at abl a.
-Sielcont rast eesuni l
at er alizqui erdo, elni velpcr í
ticoeselv al
ordel at abl a,
yaquebuscamosel valorquehayenl acol ai zqui erdayesel quenosdal at abla
-Si esbi lat eral,(1–pr obabi l
idaddel at abl a)semul tipl i
capor2.
Cuandonocoi nci de,ent oncesseest abl ecer áelni v elpcr í
ticocomomay oro
46
menorqueeldel at abla, dependi endodesielECesmásgr andeomáspequeño
queel VC.
¡Hazt eelesquemadel agr áf icayr ay al aszonasdeacept aci ónyr echazo!En
elej ehor i
zont alest ánl osv al oresdelest adí st i
coyelár eadelej econl acur v aes
l
apr obabi l
i
dad.Regl ai nf ali
ble:Cuant oMÁSGRANDEeselv al orabsol utodelEC
(est ámásal ejadodel cent ro), MENOResel ni velpcr í
ticoyv icev ersa.Port ant oel
rechazodeH0espor que| EC| >|VC| ol oqueesl omi smo, porquep<α.
4. -ANOVAS.Hayquer el l
enarelSudoku.Sinosei dent i
f icabi enelt ipode
ANOVA que es ( unifact orialcon muest ras i ndependi ent es o r elaci onadas;
bifact orialídem) ,ay udar áempezarporelmássenci l
loysisobr andat os,ser áel
otro.Sepuedehaceralr evés:Sif al tandat os,l onor malesqueseaelmásf áci
l
.
Par al osgr adosdel i
ber tadempi ezaporelf i
nal,puesesf áci li dentificarN- 1.A
par ti
rdeahí ,seponenl osgr adosdel iber taddecadaf actor ,al ai nteracci ónyl a
diferenci aaler roroMCi nter .Luegosev ancal culandol oquef alte,t eni endoen
cuent aqueMC=SC/ g.l.yquel asumat otaldeg. l
.esN- 1, salv oenr egr esi ón, que
esN- 2.Nor mal ment el osgr adosdel iber taddeler rorol aSCINTER ser ánmucho
may or esquel osdel aSCINTRA.Fór mul aquef al t
a:SC=n· S2(númer odeel ement os
porl av ari
anza) .
5. -Model odeef ect osf ij
os- aleat or i
os.Ef ectosf ij
os:Sól oi nteresanl osdat os
par al osni velesdel osf act oresmanej ados.Ef ectosal eator ios,i nter esanpar a
cual esqui erani velesdel osf act or es.Encasodeduda, nocont est ar.
6. -Cont rastes en r egr esi ón l ineal :Son bi laterales ( sal v o elANOVA de
regr esión)yport antohayquef unci onarcon1- α/2.Elgr adodel iber taddel a
regr esiónsi mpl ees1yel t
ot al del osg. l
.,n- 2.
7. -Di sti
nci ónent r
ecor r
el aci ónsemi par cialypar cial.Enl asemi par ci alse
eli
mi nadeli nfl
ujodeunaVIenl aVD,eli nf l
ujodet odasl asdemásVI .Enl a
par cialse el imi na además eli nflujo de cual esqui era ot ras v ariabl es no
consi der adas( incluidaseneler ror ).Lascor r
elacionescal cul adassi nmás,es
deci rsi nel iminareli nflujodeot rasv ariabl esest énonoenelmodel o,noson
pur asysel l
amanbi variadasodeor dencer o.
8. -Elcoef iciente de cor relaci ón mi de elgr ado de asoci ación ent rel as
variabl es.Sucuadr adoescoef i
ci ent ededet erminaciónymi deelpor cent aj ede
variabi li
daddel aVDat r
ibuibl eal aVI .Sucompl ement arioeselcoef icient ede
ali
enaci ón y mi de elpor cent aje de v ar iabil
idad at ri
bui bleav ariabl es no
consi der adas( error).

Enelexamen,cr
eoqueesmejorempezarporlaspregunt
asdet eorí
ano
asoci
adasdir
ect
amenteal
ospr
obl
emas(ser
ánentr
e7-10)yluegoirr
esolv
iendo
l
assituaci
onesenqueest
emosmásseguros,dej
andoparaelf i
nall
oqueno
sal
ga.

Par
aaprobarsenecesi
tancomomí ni
mo13aci er
tosy1error(cont
est
ando
14)yapar
tirdeaquí14/3(
17) ,
15/5(20),
16/7(23)
.Hayquecontarconfri
aldad
l
asqueestánbien(l
asdepr oblemaslassabr
emossegurascasial100%)ei ra
47
asegurar
.Sisabemosocr eemosquet enemosbien16,hayquecont est
ar23,
porquecontest
ando24o25necesitar
íamos17par aapr obarycont
est
ando21o
22,también16.Encasodedudasenal gunaspregunt
as,hayqueelegiraquel
las
enlasquepodamosdescartarunar
espuest a,
esdeci
r,sólodudemosentre2.

48
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

TEMA Nº 1 ! ESTIMACIÓN DE PARÁMETROS Y CONTRASTE DE HIPÓTESIS

1.- INFERENCIA ESTADÍSTICA

Estudio de las muestras para conocer la población a la que representan. La inferencia siempre se hace
en términos probabilísticos (afirmamos con una cierta probabilidad de éxito). El error muestral es la
diferencia entre el resultado obtenido en la muestra y el que habríamos obtenido si se hubiese trabajado
con la población.
Para cada característica de la muestra que evaluemos se obtiene lo que se conoce como estadístico:
índices descriptivos de centralidad (Media), variabilidad (Varianza), etc. A partir de los estadísticos
obtenidos en la muestra (lo concreto), se realizan afirmaciones sobre los parámetros de la población (lo
general)

DISTRIBUCIONES DE PROBABILIDAD !

Distribución Poblacional: (Distribución de frecuencias que presenta la variable en la población sobre la


que se quiere generalizar). Las medidas en la población se denominan parámetros poblacionales y se
designan con letras griegas ! (Parámetros: Media de la población = µ , Varianza de la población = σ2,
Proporción de la población = π)

Distribución de la Muestra: (Distribución de frecuencias que presenta la variable en la en la muestra


con la que se trabaja). Las medidas realizadas en la muestra se denominan estadísticos y se designan
con letras latinas mayúsculas ! (Estadísticos: Media de la muestra = Y, Varianza de la muestra = S2,
Proporción de la muestra = P)

Distribución Muestral de un estadístico: (Distribución de frecuencias que presenta el estadístico que


vamos a utilizar como base del proceso de inferencia para estimar los parámetros). Resulta de obtener
todas las muestras posibles (de un determinado tamaño) de una población y medir en ellas una
determinada característica. Las distribuciones muestrales que más vamos a utilizar son: la media, la
varianza y la proporción.

DISTRIBUCIÓN MUESTRAL DE LA MEDIA !

Teorema Central del límite: Si una población tiene una media µ y una varianza σ2 finitas, la
distribución de las medias muestrales de tamaño “n” extraídas de manera aleatoria e independiente,
se aproxima a la forma de una distribución normal con varianza σ2/n y media µ conforme el
tamaño de n se va incrementando. __
N ( µ , σ / √ n)

La Distribución muestral de la media (media de


todas las medias posibles): Se trata de una
distribución de probabilidad conocida que viene
recogida en las tablas. Es Normal N (0, 1) cuando
lo es la distribución de la variable estudiada (al
margen del tamaño de la muestra) y tiende a la
normal a medida que n va aumentando (al
margen de la distribución de la variable).
La distribución muestral de la media se ajusta a
la distribución t de Student (con n-1 grados de
libertad), si ignoramos la forma de la distribución
de la variable y/o el tamaño de la muestra es
pequeño.

R. MEDRANO (TUTOR) Página 1


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

DISTRIBUCIÓN MUESTRAL DE LA VARIANZA !

La varianza es un índice de dispersión que permite


determinar la homogeneidad de la variable de estudio. La
distribución muestral de la varianza se ajusta a la
distribución Chi-cuadrado (con n-1 grados de libertad).La
cuasi varianza muestral (S2n- 1) es la mejor estimación de la
varianza poblacional (σ2). Tiende a la normal a medida que
aumenta el tamaño de la muestra (mayor de 100 sujetos)

DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN !

Se trata de variables dicotómicas o dicotomizadas;


normalmente éxito o fracaso. La distribución de la
proporción poblacional se ajusta al modelo binomial
con parámetros n y π. La distribución binomial se
aproxima a la normal a medida que el tamaño de la
muestra va aumentado (Teorema Central del Límite), con
parámetros ! N (π, σp)

D. Muestral (Media) D muestral (Varianza) D. Muestral (Proporción)


_
Media E (X) = µ E (S2n- 1) = σ2 µp = π
_ ________ __________
Desviación Típica σx = σ / √n σS2n-1 = σ2 · √ 2 / n – 1) σp = √ π (1- π) / n
Error Típico Media Error Típico Cuasi Varianza Error Típico Proporción
_ _
X-µ X-µ (n-1) S2n-1 P-π
2
Tipificación Z = --------- y T = ----------- X n-1 = --------------------- Z = -------------------
σ / √n Sn-1 / √n σ2 √ π (1- π) / n
D. Normal D. T Student 2
Distribución X n-1 gl Distribución Normal

PROBLEMAS EJEMPLO

El CI de los alumnos de un centro de E. Especial se distribuye normalmente con µ = 80 y σ =10. Si de


esta población extraemos una muestra aleatoria de 25 alumnos. ¿Cuál es la probabilidad de obtener
una media mayor de 75 puntos?
_ 75 - 80
P (X ≥ 75) ! Z = ------------ ! Z = (- 2´50) se corresponde con p = 0´0062 ! 1 - 0´0062 = 0´9938
10 / √25

Los tiempos requeridos por un cierto autobús para alcanzar uno de sus destinos en una ciudad
grande forman una distribución normal con una desviación típica σ =1 minuto. Si se elige al azar una
muestra de 17 tiempos, encuentre la probabilidad de que la cuasi varianza muestral sea mayor que 2.
Se busca el valor de ji-cuadrado correspondiente a S2n-1=2
(n-1) S2n-1 16 · 2
X2n-1 = --------------------- ! X2n-1 = ------------ = 32
σ2 12
El valor de 32 se busca en la tabla Chi Cuadrado con 16 grados de
libertad. A este valor le corresponde una probabilidad de 0,99. En
consecuencia, 1-0´99 = 0´01! P(S2n-1 >2)

R. MEDRANO (TUTOR) Página 2


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

Un partido político cree que el 60% del electorado está a favor de su programa. Como su líder
encuentra que esta predicción es demasiado optimista decide hacer un sondeo con una muestra de
90 personas. ¿Cuál es la probabilidad de que como máximo 60 personas estén a favor de su partido?

0´67 – 0´60
P (60/90 = 0´67)! Z = --------------------- ! Z = (1´35) se corresponde con p = 0´9115
√ 0´6 · 0´4 / 90

2.- ESTIMACIÓN DE PARÁMETROS

Generalmente se desconocen los parámetros de la población por lo que se hace necesario estimarlos a
partir de los valores muestrales. Un estimador es un estadístico que utilizamos para estimar
parámetros. Se pueden considerar dos formas de estimar los parámetros poblacionales: estimación
puntual (Conocida como método de los momentos de Pearson, se extrapola el estadístico de la
muestra directamente a la población) y estimación por intervalos (establece un rango de valores
dentro del cual estaría el valor del parámetro, con una determinada probabilidad)

Para que el estimador represente correctamente al parámetro !r cuatro propiedades básicas:

1.- Carencia de sesgo: un estimador es insesgado o centrado cuando el valor del estadístico (en las
infinitas muestras de tamaño “n” extraídas de una población) coincide con el valor del parámetro que
queremos estimar ! U es un estimador insesgado de θ, si ! E (U) = θ
La media, la proporción y la cuasi varianza de la muestra son estimadores insesgados de sus valores
poblacionales
2.- Eficiencia (Precisión): Se considera la inversa de la varianza de su distribución muestral. Cuanto
mayor es el cociente, mayor es la eficiencia. Eficiencia ! θ = 1 / σ20 (A mayor varianza, menor
eficiencia). La Media Aritmética es más eficiente que la Mediana. La Varianza es más eficiente que la
Cuasi varianza. Cuando tenemos distintos estimadores y queremos determinar el más eficiente, se
comparan sus eficiencias. Ejemplo: La varianza de la distribución muestral de dos estimadores es 2 y
1,5. Para un mismo tamaño muestral, la eficiencia relativa sería 1,5 / 2 = 0,75. Si el cociente fuera 1
serían iguales.
3.- Suficiencia: el estimador utiliza toda la información de la muestra para estimar el parámetro
(Ejemplo: La media muestral sería suficiente para estimar la media poblacional. No lo sería la amplitud
intercuartílica para estimar la varianza poblacional)
4.- Consistencia: El requisito mínimo que se le exige a un estimador es que sea consistente. Un
estimador es consistente si, a medida que se dispone de más información (que aumenta el tamaño de
la muestra), aumenta la probabilidad de que la estimación coincida con el parámetro. La media, la
proporción y la varianza insesgada son consistentes porque son estimadores insesgados de los
parámetros correspondientes y en sus límites valen cero (su sesgo y su varianza tienden a 0 a media
que aumenta n)

Cuando el valor del parámetro (población) coincide con el valor del estadístico (muestra), se considera
que la estimación (inferencia sobre la población a partir de la muestra) es insesgada. Siempre que
operemos se debe procurar que nuestros estimadores sean insesgados y tengan una varianza pequeña;
estas dos características se denominan acuracidad.

Resumen de las propiedades de los principales estadísticos


Carencia de sesgo Eficiencia Suficiencia Consistencia
Media Aritmética SI > Mediana SI SI
Mediana NO < Media NO SI
Proporción SI ----- SI SI
2
Varianza NO > S n-1 SI SI
2
Cuasi varianza SI <S SI SI

R. MEDRANO (TUTOR) Página 3


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

ESTIMACIÓN POR INTERVALOS

Una estimación por intervalos expresa el grado de confianza con el que se espera que esté el valor
del parámetro dentro del intervalo, por lo que se suele llamar intervalo de confianza. La amplitud del
intervalo nos indicará su precisión. A menor amplitud, más precisión, más informativo es, más útil.
Una estimación por intervalos depende de cuatro parámetros: una estimación puntual del
parámetro; una medida de variabilidad; una probabilidad (nivel de confianza) y un supuesto acerca de
la distribución en la población.

INTERVALO DE CONFIANZA PARA LA MEDIA

N(0,1) t n-1 gl
Distribución Normal (Conocida σ2) Desconocida la σ2 (Muestras pequeñas)

_ _ _ _ _ _
X + (Z α/2) · (σX) < µ < X + (Z1- α/2) · (σX) X + (t α/2) · (Sn- 1/√ n) < µ < X + (t1- α/2) · (Sn- 1/√ n)

Problemas ejemplo: Se midieron los niveles de depresión en una muestra de 100 personas.
Asumiendo un nivel de medida de intervalo y que la variable se distribuye normalmente en la
población, se calculó la media de las puntuaciones y se obtuvo un valor de (Media = 8) y una cuasi
desviación típica = 2. Hallar los límites del intervalo de confianza para la media de la población
con un nivel de confianza del 99%.
_
Datos ! X = 8 Distribución normal de la VD α = 0,01 Sn- 1 = 2

Desconocida la varianza poblacional ! n = 100 (muestra grande: Distribución normal)


_
Intervalo de confianza ! X ± (Z α · σ Y) = Límite superior y Límite inferior

α / 2 = 0,01/2 = 0,005 1 - (α / 2) = 0,995 |Z α| = 2,58


__
Error Típico ! σX = Sn- 1 / √ n ! σX = 2 / 10 ! 0,20

Error máximo de estimación ! |Z α| · σX = (2,58 · 0,20) = 0,516

Límites del intervalo de confianza ! 8 ± (2,58 · 0,20) = [7,484 y 8,516]

Hallar los límites del intervalo de confianza suponiendo que la muestra está compuesta por 25
personas, a un nivel de confianza del 95%.
_
Datos ! X = 8 Distribución normal de la VD α = 0,05 Sn- 1 = 2

R. MEDRANO (TUTOR) Página 4


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

Desconocida la varianza poblacional ! n = 25 (muestra pequeña: Distribución t de Student)

_ _
Intervalo de confianza ! X ± (t α · Sn- 1 / √ n) = Límite superior y Límite inferior

α / 2 = 0,05/2 = 0,025 1 - ( α / 2) = 0,975 |t α| = 2,06 (Tablas t de Student)


__
Error Típico ! Sn- 1 / √ n ! 2 / 5 ! 0,4
__
Error máximo de estimación ! |t α| · Sn- 1 / √ n = (2,06 · 0,4) = 0,824

Límites del intervalo de confianza ! 8 ± (2,06 · 0,4) = [7,176 y 8,824]

INTERVALO DE CONFIANZA PARA LA VARIANZA


.

(n-1) S2n- 1 (n-1) S2n- 1


Li = ----------------- y Ls = ---------------
X2 (n-1)(1-α/2) X2 (n-1)α/2

P (Li < σ2 < Ls) = 1 - α

Los valores de X2 se obtienen en la tabla X2n-1


(Chi-Cuadrado con n-1 grados de libertad)

Distribución X2n-1 (Chi Cuadrado con n-1 gl)

Problemas Ejemplo: En una muestra aleatoria de 20 sujetos, extraída de una población normal, se ha
obtenido una media de 24 puntos y una cuasi desviación típica de 10,8 puntos. Averiguar los límites del
intervalo de confianza para la varianza de la población, suponiendo α = 0,05.

Estimamos la varianza de la población a partir de la varianza de la muestra (estimación por intervalo):

(n – 1) · S2n- 1 / (χ2 α / 2) < σ2 < (n – 1) · S2n- 1 / (χ2 1- α / 2)

Según las tablas χ2n-1 (χ219) ! para (α / 2 = 0,025) ! 8,91 y para (1 - α / 2 = 0,975) ! 32,9

(19 · 10,82) / 32,9 < σ2 < (19 · 10,82) / 8,91 ! Límites del intervalo de confianza ! [67,36 y 248,7]

INTERVALO DE CONFIANZA PARA LA PROPORCIÓN

P + (Z α / 2 ) · (SP ) < π < P + (Z1- α / 2 ) · (SP )


___________
Donde : SP = √ P (1 – P) / n

P (Li < π < Ls) = 1 – α P = (Li + Ls) / 2

Z α/2 · Sp = Error máximo de estimación

Sp = Error Típico (distribución muestral de la Proporción)

R. MEDRANO (TUTOR) Página 5


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

Problema Ejemplo: Para comprobar la eficacia en la aplicación de un tratamiento, se someten al mismo


64 pacientes. Finalizado el periodo de aplicación, se observó que remitió la enfermedad en 50 casos.
Con un nivel de significación del 92% (α = 0,08), estime por intervalo el porcentaje de efectividad del
tratamiento objeto de estudio.

Datos: Para (α / 2 = 0,04) ! Z = (- 1,75) y Para (1 - α / 2 = 0,96) ! Z = (+ 1,75)

Proporción muestral ! (50 / 64) = 0,781

Intervalo de confianza ! P ± |Z α / 2| · (SP) = Límites Superior e Inferior


___________ ___________________
SP = √ P (1 – P) / n ! SP = √ 0,781 · (1 – 0,781) / 64 = 0,0517

P ± |Z α / 2| · (SP) ! 0, 781 ± (1,75 · 0,0517) = [0,87 y 0,69]

Con un margen de error del 8% el tratamiento será efectivo entre el 69% y el 87% de los casos.

AMPLITUD DEL INTERVALO DE CONFIANZA Y RELACIÓN CON EL TAMAÑO MUUESTRAL

La amplitud del intervalo de confianza depende de dos factores: el nivel de confianza y el error típico de
la distribución muestral del estadístico (La suma de ambos E = Error máximo de estimación). Cuanto
mayor es el tamaño de la muestra mayor es la precisión del intervalo y mayor la precisión de la
estimación. Cuanto menor es el error típico, menor es el intervalo de confianza y, por tanto, más preciso
(para reducirlo se aumenta el tamaño muestral)

ESTADÍSTICO SUPUESTOS FÓRMULA


2 2 2
MEDIA Var. Poblacional conocida n = (σ · Z α / 2) /E
Var. Poblacional desconocida
2 2 2
y muestra grande n = (S n-1 · Z α / 2) /E
Var. Poblacional desconocida
2 · 2 2
y muestra pequeña n = (S n-1 α / 2 t n-1) /E
4 2 2
VARIANZA Error Típico (muestras grandes) n = (2S n-1 · Z α / 2) /E
2 2
PROPORCIÓN Error Típico ( muestras grandes) n = P · (1 – P) · Z α/2 /E

Problemas Ejemplo: Por experiencias anteriores se sabe que las estaturas de los soldados tienen una
varianza de 64 cm. ¿Qué tamaño debe tener la muestra para que la media estimada no se aleje más de
± 1, 5 puntos de la media poblacional?: considere (α = 0,02).

Para (α / 2 = 0,01) ! Z Tablas = ± 2,33 Varianza poblacional conocida σ2 = 64

n = (σ2 · Z2 α / 2) / E2 máximo de estimación ! n = (64 · 2,332) / 1,52 = 154, 42 ≈ 154 soldados

Con un margen de error del 2% debemos tomar una muestra de 154 soldados.

" Un estudio sobre la proporción de fumadores entre el personal de un hospital estableció que sólo
fumaban el 35%. Si el análisis se efectuó con un nivel de confianza del 95%, ¿Qué tamaño debió
tener la muestra para que la proporción estimada no se aleje más de ± 0,15 puntos de la proporción
poblacional?: considere (α = 0,05).

Para (α / 2 = 0,025) ! Z Tablas = ± 1,96

n = P · (1 – P) · Z2 α / 2 / E2 máximo de estimación ! n = 0,35 · 0,65 · 1,962 / 0,152 = 38,84 ≈ 39

Con un margen de error del 5% debemos tomar una muestra de 39 personas.

R. MEDRANO (TUTOR) Página 6


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

3.- CONTRASTE DE HIPÓTESIS

Hipótesis estadística: proposición (afirmación) sobre algún aspecto de la distribución de una población
(parámetro, forma, etc.) que puede someterse a prueba a través de una muestra aleatoria de esa
población. No tiene por qué suponerse interés científico.

Contraste de hipótesis: Procedimiento por el cual decidimos si una propuesta sobre la población
puede aceptarse o no. Su finalidad es generalizar un resultado muestral a la población de la que procede
la muestra. Siempre se formulan dos hipótesis (exhaustivas y mutuamente excluyentes); de tal modo,
que el rechazo de una implica la aceptación de la otra.
H0 (hipótesis nula): se acepta provisionalmente como verdadera y se somete a contraste.
H1 (hipótesis alternativa): se acepta al rechazar la hipótesis nula.

Dependiendo de cómo se formule la hipótesis hablamos de dirección del contraste.

BILATERAL O BIDIRECCIONAL UNILATERAL IZQUIERDO UNILATERAL DERECHO

" La media (µ) es algún valor " La media (µ) es algún valor " La media (µ) es algún valor
Igual o distinto a (X) No inferior a (X). No superior a (X).
Ho : µ = X Ho : µ ≥ X Ho : µ ≤ X
H1 : µ ≠ X H1 : µ < X H1 : µ > X

La decisión de utilizar contrastes unilaterales o bilaterales depende de la información o la idea del


investigador sobre la tendencia de la variable en la población. Esta decisión influye en el nivel de
significación (α) y en la interpretación de los resultados. El tipo de contraste es similar para la media
(µ), la proporción (π) y la varianza (σ2). En los tres tipos de contraste, el signo igual está en la H0.
Las hipótesis siempre se hacen sobre los parámetros poblacionales.
Estadístico de Contraste (medida de discrepancia): Instrumento para tomar decisiones sobre la
hipótesis nula, con una cierta probabilidad. La elección de un estadístico de contraste depende de las
características de la variable en la población (forma, parámetros,...), de los datos muestrales (forma de
obtenerlos, nivel de medida,...) y de la hipótesis estadística que se quiere contrastar (generada a partir
de la hipótesis de investigación y los supuestos).
Estadístico de Contraste (Discrepancia)

Estadístico de Contraste Valor del estadístico en la muestra – Valor del parámetro en la H0


Discrepancia = -----------------------------------------------------------------------------------------------------
Error típico de estimación

Se trata de averiguar la discrepancia entre los datos empíricos observados en la muestra y los datos
teóricos que planteamos en la H0.

Regla de decisión: Tomando en consideración el valor o los valores críticos (máxima diferencia
que cabe esperar por simple azar entre los datos empíricos y los teóricos) y a partir del nivel de
significación. Acumulado en los contrastes unilaterales (α) y dividido por dos en los bilaterales (α/2)

CONTRASTE BILATERAL Valores α / 1- α / Z más frecuentes


Valor crítico (Z α/2) Valor crítico (Z α/2)

α 0´05 0´01 0´001


1-α 0´95 ´99 0´999
Z α/2 - 1´96 - 2´58 - 3´29
Z 1-α/2 1´96 2´58 3´29
α ! Nivel de significación
1 – α ! Nivel de confianza
Z α/2 ! Z (Tabla III negativa)
Z 1-α/2 ! Z (Tabla IV positiva)

R. MEDRANO (TUTOR) Página 7


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

CONTRASTE UNILATERAL IZQUIERDO CONTRASTE UNILATERAL DERECHO

Zona Zona Aceptación Zona Aceptación Zona


Rechazo H0 H0 (1 – α) H0 (1 – α) Rechazo H0
|------------|---------------------------------------| |-----------------------------------|-------------|
α VALOR VALOR α
CRÍTICO CRÍTICO

Nivel crítico (p) ! Calcular la probabilidad de obtener unos resultados como los observados en la
muestra bajo el supuesto de que la H0 es cierta.

Zona de rechazo (depende de que el contraste sea bilateral o unilateral). Teniendo en cuenta el riesgo
adoptado se determinan los valores del estadístico y se decide si la hipótesis nula es verdadera o falsa.
Nunca puede afirmarse categóricamente que la hipótesis es cierta o falsa, se afirma con un determinado
nivel de probabilidad. Así, ¿Cómo decidir sobre la hipótesis nula? ! Dos métodos equivalentes:

# A través del nivel crítico ! si p es ≤ α, rechazaremos H0, y si p > α, no la rechazaremos.


# A través del valor o los valores críticos. El criterio alfa divide la distribución de probabilidad del
estadístico de contraste en dos zonas: la zona de aceptación de H0 y la zona de rechazo de H0
(región crítica). Si el valor muestral del estadístico de contraste cae en la zona de aceptación no lo
rechazaremos, y sí lo haremos cuando cae en la zona de rechazo.
# A través del intervalo de confianza que delimita dos valores entre los cuales se encuentra o no el valor de
la hipótesis. Si está entre ellos se acepta la hipótesis nula, si no es así, se rechaza.

Ho (Cierta) ! (p) es mayor que (α) ! El valor se encuentra en el intervalo de confianza. El valor del
estadístico está entre los valores críticos.
Ho (Falsa) ! (p) es menor o igual que (α) ! El valor está fuera del intervalo de confianza. El valor del
estadístico supera o es inferior a los valores críticos.

El nivel de significación (α) se fija de antemano, mientras que el nivel crítico p es consecuencia
del resultado obtenido al aplicar el estadístico de contraste.
El contraste bilateral es más conservador que el contraste unilateral (es más difícil rechazar la H0)

Conclusión e interpretación: Contrastada la H0, considerada de forma provisional como verdadera,


y calculado el estadístico de contraste, se concluye rechazando o no la H0. Después se interpreta el
resultado en el contexto de la investigación.

R. MEDRANO (TUTOR) Página 8


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

3.1.- RESUMEN DEL PROCEDIMIENTO (CONTRASTE DE HIPÓTESIS)

1.- Supuestos (descripción de las características de la variable en la población, y de los datos de


la muestra): Nº de muestras con el que trabajamos; son independientes o relacionadas;
seleccionadas de forma aleatoria o no; cómo son las escalas de medida utilizadas para las variables,
la distribución de la que provienen los datos es conocida o desconocida, etc.

2.- Formulación de las Hipótesis Estadísticas (exhaustivas y mutuamente excluyentes) de acuerdo


con la hipótesis científica y las características anteriores.

3.- Elección del estadístico de contraste apropiado.

4.- Fijar α (regla de decisión). La zona de rechazo de la H0 estará formada por todos los valores del
estadístico cuya probabilidad de ser obtenidos es muy pequeña bajo el supuesto de que la H0 es
cierta.

5.- Cálculo del estadístico de contraste con los datos obtenidos en la muestra.

6.- Decisión sobre el rechazo o no de la H0.


Mediante el nivel crítico (p) ------------------- Mediante el ó los valores críticos (α)

7.- Conclusión e interpretación de los resultados en el contexto de la investigación.

PROBLEMA EJEMPLO ! CONTRASTE DE HIPÓTESIS

Queremos contrastar la hipótesis que supone que la media poblacional en un test de atención de los
estudiantes de la ESO es de 35 puntos. La distribución de la variable en la población es normal con
varianza = 225. Extraemos una muestra aleatoria de 144 alumnos y obtenemos: una media = 32 puntos.
Fijamos un nivel de significación α = 0,05.

Supuestos ! La variable (atención) está medida a nivel de razón. Se distribuye normalmente en la


población. Se trata de una muestra de observaciones aleatorias e independientes.

Hipótesis Estadísticas ! H0: µ = 35 H1: µ ≠ 35 (Contraste Bilateral)


_ __
Estadístico de Contraste ! Z = (Y – µ) / (σ / √ n (varianza poblacional conocida)

Regla de decisión: Nivel de Significación ! (α = 0,05) / Zona de rechazo de la H0 (Contraste


bilateral) ! Todos los valores iguales o menores que Z α/2 = (- 1,96) y todos los valores iguales o
mayores que Z1 – α/2 = (+ 1,96), según la distribución normal.
____
Cálculo del Estadístico de Contraste (datos de la muestra) ! Z = (32 – 35) / (15 / √ 144 = (- 2,4)

Toma de decisión sobre la H0:

# Nivel crítico: Como p = 2 · [Z ≥ |- 2,4 |] = 2 · (0,0082) = 0,0164 es menor que α = 0,05,


rechazamos la hipótesis nula. Por tanto ! 0,0164 cae en la zona de rechazo de la H0.
# Valores críticos: Como (-2,4) < (-1,96) rechazamos hipótesis nula.
# Intervalo de confianza: 32 ± (1,96) · (1,25) = 29,55 < µ < 34,45. Como 35 no está en el intervalo
de confianza se rechaza la H0.

Interpretación de resultados ! Para un nivel de significación α = 0,05, podemos rechazar la


hipótesis nula (la media en atención de los estudiantes de la ESO no es de 35 puntos).

R. MEDRANO (TUTOR) Página 9


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 1 (INTRODUCCIÓN)

ERRORES EN LA TOMA DE DECISIONES

Los contrastes de hipótesis están basados en estadísticos (medidas de discrepancia) y tienen una
distribución de probabilidad conocida; así, todas las decisiones llevan aparejadas una probabilidad de
ocurrencia. Al tomar una decisión sobre una H0 pueden darse cuatro situaciones (dos de ellas son
decisiones acertadas y dos erróneas). Siempre debemos proponernos que (1 - α) y (1 - β) sean altos
y que α y β sean bajos.

Decisión Ho (cierta) H1 (cierta)

Acepto H1 ERROR TIPO I DECISIÓN CORRECTA


Probabilidad ! α Probabilidad ! 1 – β
Acepto Ho
DECISIÓN CORRECTA ERROR TIPO II
Probabilidad ! 1 – α Probabilidad ! β

Siempre se cumple ! α + (1 - α) = 1 y β + (1 - β) = 1

Error tipo I (α) ! Bajo la distribución de H0


representa la probabilidad de rechazar una
H0 verdadera = la probabilidad de aceptar
una H1 falsa / (α = probabilidad de cometer
error de tipo I = nivel de significación)

Nivel de confianza (1–α) ! Representa la


probabilidad de aceptar una H0 verdadera =
la probabilidad de rechazar una H1 falsa.

Error tipo II (β) ! Bajo la distribución de H1 cuando aceptamos erróneamente la H0 siendo falsa (β =
probabilidad de cometer error de tipo II)
Potencia de contraste (1–β) ! Representa la probabilidad de rechazar la H0 siendo falsa = la
probabilidad de aceptar una H1 verdadera (probabilidad de obtener un resultado estadísticamente
significativo) 1 – β = Probabilidad de no cometer Error tipo II.

Tamaño del efecto: Expresa la magnitud de la diferencia observada entre la H0 (el valor teórico) y la
H1 (el valor observado)

R. MEDRANO (TUTOR) Página 10


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

TEMA Nº 2 ! CONTRASTE DE HIPÓTESIS EN LOS DISEÑOS DE UNA MUESTRA

1.- TIPOS DE CONTRASTE:

Contrastes paramétricos: Son aquellos que se relacionan con el estudio de un parámetro


poblacional (media, varianza, proporción, correlación, etc.) y la variable de estudio proviene de una
población con una función de densidad de probabilidad conocida. Ejemplo: Determinar si un
parámetro poblacional puede tomar un valor concreto / Determinar si las variables medidas en la
muestra son independientes en la población. Según Amón (1986):

" Las hipótesis recaen sobre los parámetros de la distribución de la variable.


" El nivel de medida es, al menos, de intervalo.
" Los supuestos sobre la forma de la distribución (normalidad) y/o sobre sus parámetros (varianza
conocida, desconocida, etc.) son restrictivos

En general, el contraste paramétrico es más potente que su equivalente no paramétrico.

Contrastes no paramétricos: Son aquellos que no se relacionan con parámetros poblacionales o


se refieren a datos que provienen de una población con una función de densidad de probabilidad
desconocida. Ejemplo: Determinar la forma de distribución de una variable en la población /
Determinar si los datos observados en la muestra son independientes entre sí. Según Amón (1986):

" Nivel de medida inferior al intervalo.


" Solo se establecen supuestos generales sobre la distribución (continuidad, simetría, etc.)

En general, la utilización de contrastes no paramétricos disminuye la potencia de contraste


(probabilidad de aceptar la H1 cuando esta es cierta)

2.- PASOS DE CONTRASTE DE HIPÓTESIS !

Un contraste de hipótesis es un procedimiento para decidir si una hipótesis se acepta como válida
o se rechaza. Los principales pasos para tomar la decisión son:

1. Establecer los supuestos.


2. Formular las hipótesis estadísticas
3. Elección del estadístico de contraste apropiado (discrepancia entre los datos del estadístico de la
muestra y el parámetro planteado en la hipótesis poblacional),
4. Regla de decisión (la distribución muestral del estadístico nos permite fijar los valores críticos que
determinan la zona de rechazo de la H0). El cálculo del estadístico de contraste nos permite
también la determinación del nivel crítico p (probabilidad de que, siendo cierta la H0, obtengamos
unos datos como los observados en la muestra)
5. Conclusión (rechazamos o no la H0 a partir del nivel crítico p, o del valor o los valores críticos)
6. Interpretación (en el contexto de la investigación)

3.- CONTRASTE SOBRE LA TENDENCIA CENTRAL DE LOS DATOS !

MEDIA POBLACIONAL
2
PARAMÉTRICOS CONOCIDA σ
2
DESCONOCIDA σ

NO PARAMÉTRICOS PRUEBA DE LOS SIGNOS


PRIUEBA DE WILCOXON

R. MEDRANO (TUTOR) Página 1


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

CONTRASTES PARAMÉTRICOS SOBRE LA MEDIA POBLACIONAL

Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente sigue una distribución normal
en la población y está medida, al menos, a nivel de intervalo. Podemos conocer o no el valor de la
varianza poblacional (también aplicable a cualquier otro tipo de distribución, con varianza
desconocida, si n ≥ 30, según el Teorema Central del Límite)

Hipótesis Estadísticas: µ0 es el valor concreto de la media poblacional acerca del cual queremos
comprobar si µ es diferente, menor o mayor // Se aconseja formular primero H1

Contraste Bilateral: H0: µ = µo


H1: µ ≠ µo
Contraste Unilateral Izquierdo H0: µ ≥ µo
H1: µ < µo
Contraste Unilateral Derecho H0: µ ≤ µo
H1: µ > µo

Estadístico de contraste:
_ __
Conocida la varianza de la población ! Z = (Y - µ0) / σ / √ n
_ _
Y es la media muestral // σ / √n es el error típico de la media
µ0 es el valor propuesto para la media poblacional por H0
El Estadístico de Contraste sigue la distribución N (0,1)
_ __
Desconocida la varianza de la población ! T = (Y - µ0) / S n-1 / √ n
_
S2n-1 = (Y – Y)2 / n – 1 es la cuasi varianza muestal (estimador insesgado de varianza poblacional)
El Estadístico de Contraste sigue la distribución T de Student con n – 1 gl. (Cuando gl > 30 la
distribución T de Student se aproxima a la normal).
n S2
Relación entre la varianza y la cuasi varianza muestral ! (n-1) S n-1 = n S // Luego S n-1 = ---------
2 2 2

n-1
Intervalo de confianza: _ _
Y + Z α/2 · σ / √n = LS y LI (conocida σ2 poblacional)
_ ______
Y + T n-1; α/2 · Sn-1 / √n = LS y LI (desconocida σ2 poblacional)

CONTRASTES NO PARAMÉTRICOS SOBRE LA MEDIANA POBLACIONAL

PRUEBA DE LOS SIGNOS: Considera que el valor de la mediana bajo la H0 es correcto; por tanto,
en la población, existirán similares valores por encima y por debajo (mismo número de signos
positivos y negativos al calcular la diferencia entre cada valor y la mediana propuesta en la H0)

Supuestos (Razones que justifican su elección): muestra aleatoria de “n” observaciones aleatorias
e independientes de una población con mediana desconocida. Contraste sobre el Promedio
Poblacional. Desconocemos el cumplimiento de los supuestos paramétricos. Asumimos que la
distribución de la variable es continua por lo que no debemos encontrar diferencias nulas, si
aparecen, se descartan). Datos directos, sin agrupar, medidos, al menos, en una escala ordinal.

Hipótesis Estadísticas:
Contraste Bilateral: H0: η = η0
H1: η ≠ η0
Contraste Unilateral Izquierdo H0: η ≥ η0
H1: η < η0
Contraste Unilateral Derecho H0: η ≤ η0
H1: η > η0

η0 es el valor concreto de la mediana poblacional // Se aconseja formular primero la H1

R. MEDRANO (TUTOR) Página 2


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

Estadístico de contraste: (S+ ó S-) se obtienen al restar cada una de las observaciones del valor
de la mediana propuesto por la H0. Si alguna diferencia es nula, se elimina, reduciéndose el tamaño
de la muestra. ____
Cuando la muestra es grande se aproxima a la normal mediante [S+ (ó S-) – n/2] / √ n/4

Distribución muestral del estadístico: modelo binomial con parámetros n = S+ + S- y π = 0’50.

PRUEBA DE WILCOXON: Conocida como “prueba de rangos y signos”, gana en precisión con
respecto a la prueba de los Signos, ya que aprovecha mejor la información disponible; tiene en
cuenta, a la vez, el signo de las diferencias y la magnitud de las mismas. Wilcoxon es una prueba
más precisa.

Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. Se trata de un contraste sobre el Promedio Poblacional.
Desconocemos el cumplimiento de los supuestos paramétricos. La distribución de la variable en la
población ha de ser simétrica y continua. Datos directos, sin agrupar. Nivel de medida de los
datos, al menos, de intervalo.

Hipótesis Estadísticas: similares a la prueba de signos

Cálculo del Estadístico de Contraste: (∑R+ ó ∑R-) suma de rangos positivos y negativos.
Conocemos los datos obtenidos en la muestra // Calculamos las diferencias entre cada observación
y la mediana propuesta por la H0. Se eliminan las diferencias nulas, reduciendo el tamaño muestral
“n” // Estas diferencias, en valor absoluto, se ordenan de menor a mayor, y se sustituye cada una de
ellas por el rango que le corresponde // Si hay empates, se adopta el “criterio del rango medio”; es
decir, se le atribuye a cada una el rango promedio de los rangos que les hubieran correspondido de
ser diferentes // A cada rango se le añade el signo + o – de la puntuación de diferencia
correspondiente y se suman, obteniendo R+ y R-

Distribución muestral del estadístico: distribución de valores de Wilcoxon. Para utilizar la tabla W
de Wilcoxon se selecciona el sumatorio más pequeño y se toma la decisión mediante los valores
críticos.

R. MEDRANO (TUTOR) Página 3


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

PROBLEMAS EJEMPLO
CONTRASTE SOBRE LA MEDIA (VARIANZA POBLACIONAL CONOCIDA)

Supongamos que pertenecemos al consejo regulador de la denominación de origen de los vinos de


Ribera de Duero. Sabemos que los vinos jóvenes de años anteriores tienen un grado alcohólico
medio de 12.5 grados y una varianza de 0´52 y que los datos en la población se ajustan a una
distribución normal N (12´5, 0´5). Para el año actual, el consejo regulador, de acuerdo con todos sus
miembros, ha decidido cambiar algunos de los pasos del proceso de fabricación. El primer problema
que se plantea es: ¿Se ha modificado el grado alcohólico al modificar el proceso de fabricación? La
definición del problema a estudiar nos permite determinar la población que queremos estudiar, los
vinos jóvenes de ribera de Duero en el año actual; la variable que queremos medir, el grado
alcohólico de los mismos, y la hipótesis de trabajo inicial ¿Se ha modificado el grado alcohólico?
Para realizar el contraste de hipótesis, extraemos una muestra aleatoria de 14 observaciones que
aportan una media de 12´529 grados y una cuasi varianza de 0´3382 establecemos un nivel de
confianza del 95%.

Estadístico de contraste: Discrepancia entre


el estimador (muestra) y el parámetro de la H0.

Valores críticos: con α = 0´05 y un contraste


bilateral ! ± 1´96 (región de aceptación)
Decisión estadística: El valor del estadístico
de contraste (0´217) se sitúa en la región de
aceptación (entre los valores críticos); por tanto
aceptamos H0. El nivel crítico (p) asociado al E.
Contraste (0´217) es 2·0´4129 = 0´8258 (1-
0´5871 = 0´4129) que resulta mayor que el
Supuestos: Se trata de una muestra aleatoria nivel de significación fijado (α = 0´05); por
con datos medidos, al menos, en una escala de tanto, aceptamos H0. A partir del intervalo de
intervalo. Asumimos que la variable se confianza, aceptamos H0 (12´5 está incluido)
distribuye normalmente en la población con ___
varianza conocida. 12´529 ± (1´96 · 0´5 / √14 )! (12´27 y 12´79)

Hipótesis: Contraste bilateral H0: µ = 12´5 Conclusión: El cambio en el proceso de


H1: µ ≠ 12´5 fabricación no ha modificado significativamente
Se trata de determinar si los datos de la el grado alcohólico.
muestra arrojan evidencia a favor o en contra Interpretación: Con la información de la que
de la H0. disponemos no hemos encontrado evidencia
suficiente de que la media sea distinta de 12.5

Vamos a plantear otro supuesto que modificaría la definición de las hipótesis ! Sospechamos,
antes de realizar el experimento, que la modificación en el proceso de fabricación aumenta el
grado alcohólico.
Supuestos: Similares; Hipótesis (Contraste unilateral derecho): H0: µ = 12´5 y H1: µ > 12´5
Estadístico de contraste: Similar
Valores críticos: con α = 0´05 y un contraste unilateral derecho ! 1´65
Decisión estadística: El valor del estadístico de contraste (0´217) se sitúa en la región de
aceptación (por debajo del valor crítico 1´65); por tanto aceptamos H0.
El nivel crítico (p): asociado al estadístico de contraste (0´217) es 0´4129 (1-0´5871) que resulta
mayor que el nivel de significación fijado (α = 0´05); por tanto, aceptamos H0
Conclusión: El cambio en la fabricación no ha modificado significativamente el grado alcohólico.
Interpretación: Con la información de la que disponemos no hemos encontrado evidencia
suficiente de que la media no sea igual a 12.5

R. MEDRANO (TUTOR) Página 4


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

CONTRASTE SOBRE LA MEDIA (VARIANZA POBLACIONAL DESCONOCIDA)

Siguiendo con el ejemplo del grado alcohólico de los vinos de la denominación de origen de
Ribera de Duero, los resultados del contraste bilateral desconocida la varianza de la población
(suponiendo que no nos hubieran facilitado este parámetro), serían:

Estadístico de contraste: Discrepancia entre el


estimador (muestra) y el parámetro de la H0.

Valores críticos: con α = 0´05 y un contraste


bilateral ! t18 gl = ± 2´101 (región aceptación)

Decisión estadística: El valor del estadístico de


contraste (0´316) se sitúa en la región de
Supuestos: Se trata de una muestra aceptación (entre los valores críticos); por tanto
aleatoria con datos medidos, al menos, en aceptamos H0. El nivel crítico (p) asociado al E.
una escala de intervalo. Asumimos que la Contraste (0´316) es aproximadamente (1-0´65 =
variable se distribuye normalmente en la 0´35) ! 0´35 · 2 = 0´7 > 0´05 (Aceptamos H0). A
población con varianza desconocida. partir del intervalo de confianza, aceptamos H0
(12´5 está incluido)
___
Hipótesis: Contraste bilateral H0: µ = 12´5 12´529 ± (1´96 · 0´338 / √14 )! (12´35 y 12´705)
H1: µ ≠ 12´5
Conclusión: El cambio en el proceso de
Se trata de determinar si los datos de la fabricación no ha modificado significativamente el
muestra arrojan evidencia a favor o en contra grado alcohólico.
de la H0. Interpretación: Con la información de la que
disponemos no hemos encontrado evidencia
suficiente de que la media sea distinta de 12.5

CONTRASTES NO PARAMÉTRICOS (PRUEBA DE LOS SIGNOS Y PRUEBA DE WILCOXON)

En la figura se muestra como para distribuciones


asimétricas es mucho más intuitiva la comparación de
las medianas que la comparación de las medias, ya que
estas están afectadas por los valores muy extremos de
la distribución.

Problema ejemplo: Una determinada empresa utiliza, desde hace muchos años, un test de aptitudes
para seleccionar a sus empleados. Para dicho test tiene establecido que la mediana está en 180. El
psicólogo de la empresa quiere probar que efectivamente la mediana sigue siendo correcta (probar la
H0 de que la mediana en la población es igual a 180). Para ello obtiene una muestra de 15
trabajadores y les aplica el test obteniendo los siguientes resultados:

189 233 195 160 212 176 231 202 193 174 166 248 199 213 185

Suponemos que la variable en la población es simétrica y continua (medida en una escala de


intervalo) y que no sabemos nada acerca de la forma de la población. Con estos datos y
únicamente con fines pedagógicos aplicaremos las pruebas de los Signos y la de Wilcoxon (sería
directamente aplicable Wilcoxon).

R. MEDRANO (TUTOR) Página 5


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

Supuestos # Muestra aleatoria de n = 15 observaciones. Distribución de la variable en la población


(simétrica y continua). Nivel de medida de los datos, al menos, escala de intervalo.

Hipótesis (C. Bilateral) # H0: η = 180 y H1: η ≠ 180 // α = 0,05

Estadísticos de Contraste: #
Signos: Previamente ordenamos las puntuaciones (la mediana es un índice de posición). Restando
180 a cada una de las 15 puntuaciones obtenidas por los sujetos, obtenemos 11 (S+) y 4 (S-)

160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
- - - - + + + + + + + + + + + SIGNOS

Probabilidad binomial con n = 15 (participantes) y p = 0´5 (probabilidad de éxito si la H0 es cierta)

Wilcoxon: Más precisa. Después de ordenar las puntuaciones de menor a mayor y ordenar las
diferencias con la mediana en valor absoluto, obtenemos:

160 166 174 176 185 189 193 195 199 202 212 213 231 233 248 ORDEN
-20 -14 -6 -4 5 9 13 15 19 22 32 33 51 53 68 RESTA
-4 5 -6 9 13 -14 15 19 -20 22 32 33 51 53 68 ORDEN
- + - + + - + + - + + + + + + SIGNOS
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 RANGOS

Sumando los rangos cuyas diferencias tienen valor positivo y negativo:


R+ (2+4+5+7+8+10+ 11+12+13+14+15 = 101) y R- (1+3+6+9 = 19)
Utilizaremos como estadístico W ! R- (1+3+6+9 = 19) dado que es el más pequeño ! W = 19

Decisión estadística:
Signos: Función de distribución Binomial (Tabla II); para n = 15 y probabilidad = 0,50, encontramos el
valor 0,0592 ! P (S- ≤ 4) = 0,0592. Para averiguar el nivel crítico p, multiplicamos por 2 la
probabilidad asociada al estadístico de contraste (0´0592 · 2 = 0´1184) dado que es bilateral.
Wilcoxon: Tablas ! para un contraste bilateral con α/2 = 0,025 y n = 15; el valor crítico es ! 26

Conclusión:
Signos: Como p (0´1184) es mayor que α (0,05) Mantenemos H0. También tabla (Test de signos dos
direcciones) para n =15 y α = 0,05, y un contraste bilateral, el valor crítico es igual a 3 ! como S- = 4 >
3 (Mantenemos H0)
Wilcoxon (más precisa): Como 19 (se toma la suma menor) < 26 ! Rechazamos la H0
Interpretación:
Signos: Teniendo en cuenta los resultados, es posible seguir manteniendo que la Mediana de la
población de referencia es 180, con un α = 0,05.
Wilcoxon: Teniendo en cuenta los resultados, no es posible seguir manteniendo que la Mediana de la
población de referencia es 180, con un α = 0,05.

R. MEDRANO (TUTOR) Página 6


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

4.- CONTRASTE SOBRE LA VARIANZA POBLACIONAL !

Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente sigue una distribución normal y
está medida, al menos, a nivel de intervalo.

Hipótesis Estadísticas:
2 2
Contraste Bilateral: H0: σ = σ 0
2 2
H1: σ ≠ σ 0
2 2
Contraste Unilateral Izquierdo H0: σ ≥ σ 0
2 2
H1: σ < σ 0
2 2
Contraste Unilateral Derecho H0: σ ≤ σ 0
2 2
H1: σ > σ 0

σ20 es el valor concreto de la varianza poblacional acerca del cual queremos comprobar si la
varianza poblacional es diferente, menor o mayor // Se aconseja formular primero H1.

Estadístico de contraste ! X2 = (n-1) S2n-1 / σ20

σ2o es el valor propuesto para la varianza poblacional por H0 y S2n-1 = la cuasi varianza muestral. El
Estadístico de Contraste sigue una distribución Chi-Cuadrado con (n-1) gl.

(n-1) S2e (n-1) S2e


Intervalo de confianza ! 2
---------------- < σ < -----------------
X2 (n-1) (1-α/2) X2 (n-1) α/2

Si el contraste se hace a partir de la varianza poblacional, se sustituye (n-1) por n.

5.- CONTRASTE SOBRE LA PROPORCIÓN POBLACIONAL !

Supuestos (Razones que justifican su elección): Disponemos de una muestra aleatoria de “n”
observaciones aleatorias e independientes. La variable dependiente es dicotómica.La proporción es
el cociente entre el número de veces que aparece la observación dividido entre el número total de
observaciones)

Hipótesis Estadísticas:
Contraste Bilateral: H0: π = π0
H1: π ≠ π0
Contraste Unilateral Izquierdo Ho: π ≥ π0
H1: π < π0
Contraste Unilateral Derecho H0: π ≤ π0
H1: π > π0

π0 es el valor concreto de la proporción poblacional acerca del cual queremos comprobar si la


proporción poblacional es diferente, menor o mayor // Se aconseja formular primero H1
____________
Estadístico de contraste: Z = (P - π0) / √ (π0 (1 - π0) / n

P es la proporción muestral de la característica que interesa.


π0 es el valor propuesto para la proporción poblacional por la H0.
σ0 es el error típico de la distribución muestral de la proporción.

El Estadístico de Contraste sigue la distribución N (0,1) cuando “n” es suficientemente grande, lo


que significa que “n · p” > 5 ó n = 25. Cuando no se cumple esta condición (muestras pequeñas), se
utiliza la distribución binomial.
____________
Intervalo de Confianza ! P ± |Zα/2| √ (π0 (1 - π0) / n

R. MEDRANO (TUTOR) Página 7


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

PROBLEMAS EJEMPLO

Contraste de hipótesis sobre la varianza: Los resultados de un reciente estudio indican que 81
estudiantes de primero de Psicología de la UNED, elegidos mediante muestreo aleatorio simple,
estudian una media de 6 horas a la semana, con una cuasi desviación típica de 3. La población
universitaria europea estudia, también, una media de 6 horas a la semana, pero con una desviación
típica de 2. Queremos saber si la variabilidad encontrada en nuestra muestra es estadísticamente
diferente de la de la población de estudiantes europeos. Trabajaremos a un nivel de confianza del
95 %.
_
Supuestos: Muestra aleatoria de 81 estudiantes de la UNED (X = 6 y SX = 3). Datos de la población
de estudiantes europea (µ = 6 y σ = 2) para α = 0,05. La variable dependiente está medida, al
menos, a nivel de intervalo. Se plantea un CH sobre la varianza.

Hipótesis: Contraste bilateral (resultado estadísticamente diferente). Las hipótesis siempre se


plantean sobre la población (la población universitaria europea tiene una σ = 2; luego la varianza de
la población a contrastar será ! σ2 = 4. Luego ! H0: σ2 = 4; H1: σ2 ≠ 4

Estadístico de contraste: χ2 = (n – 1) S2n-1 / σ20 ! χ2 = 80 · 9 / 4 = 180

Decisión estadística:
$ A partir de los valores críticos (80 gl; α/2 = 0,025 y 1-α/2 = 0,975) ! 57´15 y 106´63.
Rechazamos la H0 porque el valor muestral del estadístico de contraste (180) > el valor
crítico superior (χ2 = 106´63)
$ Si tenemos en cuenta el nivel crítico p (χ2 = 180 con 80 gl ! encontramos que p es < 0´005)
y dado que p < α (0´05) ! Rechazamos H0.
$ Considerando el intervalo de confianza: Rechazamos H0 (σ2 = 4 no está en el intervalo)
80 · 9 80 · 9
Intervalo de confianza ! ---------------- < σ2 < ----------------- (6´75 y 12´61)
106´63 57´11

Conclusión e interpretación: Dado que hemos rechazado la H0 con α = 0,05 ! La variabilidad en


el tiempo de estudio que emplean los estudiantes de Psicología de 1º de la UNED no es igual que la
variabilidad en el tiempo de estudio semanal de la población universitaria europea.

Contraste de hipótesis sobre la proporción (Febrero 2008): Se quiere conocer la postura de la


población española frente a la inmigración ilegal. Se fija α = 0´04, se extraen aleatoria e
independientemente 750 españoles y se les pide que manifiesten si están a favor o en contra. De los
750 españoles, 435 se manifiestan en contra y 315 a favor. Se desea estudiar si son compatibles
estos resultados con la hipótesis que establece que las 3/5 partes de la población española están en
contra de la inmigración ilegal.

Supuestos: Variable dependiente ! postura de la población española frente a la inmigración ilegal


(a favor o en contra). Se trata de una variable cualitativa dicotómica.
P = (435/750 = 0´58); se cumple (n·p > 5)! (750 · 0´58 = 435) Muestra grande (aproximación a la
normal ! CH Proporción

Hipótesis: Contraste bilateral (no se especifica ninguna dirección a favor o en contra). Sabemos
que π = 3/5 = 0,6 y la hipótesis nula se centra si nuestros datos son compatibles con este resultado
(teóricamente poblacional). Luego ! H0: π = 0´6; H1: π ≠ 0´6

Estadístico de contraste: Nuestra proporción es ! 435/750 = 0´58. Con estos datos aplicamos la
fórmula del estadístico de contraste ! Z = (0´58 – 0´6) / (√ 0´6·0´4 / 750) = - 0´02 / 0´0179 = - 1´12.

Valores críticos: Al tratarse de un contraste bilateral deben ser dos valores. Buscando en las tablas
de la curva normal con α = 0´04 (bilateral α/2 = 0´02 y 1-α/2 = 0´98) encontramos las puntuaciones
típicas (- 2´05 y 2´05)

R. MEDRANO (TUTOR) Página 8


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

Decisión estadística:
$ Teniendo en cuenta los anteriores valores críticos (- 2´05 y 2´05), Aceptamos la H0 porque el
valor muestral del estadístico de contraste (- 1´12) > el valor crítico inferior (- 2´05)
$ Si tenemos en cuenta el nivel crítico p (Z (-1´12) = 0´1314; luego 2 · 0´1314 = 0´2628). Como p
(0´2628) > que α (0´04) ! Aceptamos H0.
$ Considerando el intervalo de confianza: Aceptamos H0 (0´6 está en el intervalo)
____________ __________________
P ± |Zα/2| √ (π0 (1 - π0) / n ! 0´58 ± 2´05 √ (0´58 (1 – 0´58) / 750 = (0´543 y 0´617)

Conclusión e interpretación: Dado que hemos aceptado la hipótesis nula (π = 0´6) podemos
afirmar que el 60% de la población española están en contra de la inmigración ilegal; por tanto, el
40% estará a favor.

6.- CÁLCULO DE LA POTENCIA DE CONTRASTE !

Potencia de contraste (1–β): Representa la probabilidad de rechazar la H0 siendo falsa = la


probabilidad de aceptar una H1 verdadera (probabilidad de obtener un resultado estadísticamente
significativo). 1 –β = Probabilidad de no cometer Error tipo II. La disminución de (α = Error de tipo I
provoca un aumento automático de β = Error tipo II)

Problema ejemplo: La aplicación de un test entre docentes tiene, por experiencias anteriores, una
media de 55 y una varianza de 121, N (55, 121). Un psicólogo educativo considera que en la actualidad
el promedio se ha incrementado, pasando a ser de 60 puntos. Para contrastar esta hipótesis somete al
test a 50 individuos extraídos aleatoriamente de la población y obtiene una media de 58. Fijando un
nivel de significación α = 0,01. ¿Puede aceptarse la hipótesis del psicólogo?

Hipótesis estadísticas (contraste unilateral derecho): H0: µ0 = 55 y H1: µ1 > 55 (µ1 = 60)

Descripción de la variable y de los datos muestrales: Variable medida a nivel de intervalo, distribución
normal, con varianza conocida N (55, 121) y observaciones aleatorias e independientes.

Estadístico de contraste y cálculo: Bajo la H0: µ0 = 55, tipificamos la media muestral = 58.
_ ___
Z = (Y – µ0) / σY ! Z = (58 - 55) / (11 / √ 50) = 1,93
Decisión estadística:
$ A partir del valor crítico (para α = 0,01. Se trata de un contraste unilateral, acumula α en una
sola cola ! Z = 2,33). Como 1´93 (valor del estadístico de contraste) < 2´33 (valor crítico) ! Se
acepta la H0.
$ A partir del nivel crítico p (al valor del estadístico de contraste 1´93 le corresponde en las tablas
una probabilidad de p (Z < 1,93) = 0,9732 ! 1-0´9732 = 0´0268). Al tratarse de un contraste
unilateral p = 0´0268 > α = 0´01; Por tanto, Se acepta la H0

R. MEDRANO (TUTOR) Página 9


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 2 (CH UNA MUESTRA)

Interpretación de los resultados: Para un nivel de significación α = 0,01, no podemos afirmar que la
media poblacional se ha incrementado en la actualidad.

¿Cuál es la probabilidad de cometer error tipo II? (Rechazar la H1 siendo cierta)

Bajo la Hipótesis nula (H0: µ0 = 55) se determina el límite entre la región de aceptación y rechazo
(Contraste unilateral derecho)
_ -----------------------------------|-----
Z = (Yc – µ0) / σY ! Z = 2,33 Z = (Yc - 55) / (11 / √50); Yc = 58,62

Se busca la (Z) que corresponde al valor 58,62 en la distribución de la H1 ! (H1: µ1 = 60)

_ ------------------|------------------------------
Z = (Yc – µ1) / σY Z = (58,62 - 60) / (11 / √50); Z = (- 0,89)

Probabilidad de obtener una Z ≤ (- 0,89) ! Z (-0,89) = 0,1867 ! β = 0,1867 (error tipo II)
Potencia de Contraste ! (1 – β) = 0,8133

R. MEDRANO (TUTOR) Página 10


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

TEMA Nº 3 ! ANÁLISIS DE DATOS PARAMÉTRICOS PARA DISEÑOS DE DOS GRUPOS

TIPOS DE MUESTRAS

Muestras independientes: n1 y n2 muestras de sujetos diferentes, extraídos aleatoriamente de sus


respectivas poblaciones.
Muestras relacionadas: se trata de los mismos n sujetos observados en condiciones experimentales
diferentes, o n pares de sujetos semejantes entre sí (gemelos, hermanos,...)

CONTRASTES DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES

Poblaciones normales N (0, 1)

Medias distintas y varianzas iguales Medias iguales y varianzas distintas

CONTRASTE DE HIPÓTESIS

VARIANZAS POBLACIONALES CONOCIDAS


SOBRE DOS MEDIAS VARIANZAS POBLACIONALES DESCONOCIDAS
(PARAMÉTRICOS) Y SUPUESTAMENTE IGUALES
VARIANZAS POBLACIONALES DESCONOCIDAS
Y SUPUESTAS DISTINTAS

SOBRE DOS MEDIANAS TEST DE MANN-WHITNEY-WILCOXON


(NO PARAMÉTRICOS)

SOBRE DOS VARIANZAS DIFERENCIA DE VARIANZAS

DIFERENCIA PROPORCIONES VALOR IGUAL A CERO


SOBRE DOS
PROPORCIONES DIFERENCIA PROPORCIONES VALOR DISTINTO DE CERO

Pasos para realizar el contraste de hipótesis:

1. Establecer los supuestos.


2. Formular las hipótesis estadísticas
3. Elección del estadístico de contraste apropiado
4. Regla de decisión (la distribución muestral del
estadístico nos permite fijar los valores críticos que
determinan la zona de rechazo de la H0). El cálculo del
estadístico de contraste nos permite también la
determinación del nivel crítico p (probabilidad de que,
siendo cierta la H0, obtengamos unos datos como los
observados en la muestra). También podemos utilizar el
intervalo de confianza.
5. Conclusión (rechazamos o no la H0 a partir del nivel
crítico p, o del valor o los valores críticos)
6. Interpretación (en el contexto de la investigación)

R. MEDRANO (TUTOR) Página 1


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

CONTRASTES DE HIPÓTESIS PARA DOS MEDIAS

" Observaciones independientes


Supuestos " Nivel de medida de intervalo o razón
" Distribuciones normales en la población ó (n1 ≥ 30 y n2 ≥ 30)

Varianzas población Desconocidas Desconocidas


conocidas Supuestamente iguales Supuestamente distintas
Hipótesis (homocedasticidad)
(Iguales en
los C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo
Tres casos) H0 : µ1-µ2 = 0 H0 : µ1-µ2 ≤ 0 H0 : µ1-µ2 ≥ 0
H1 : µ1-µ2 ≠ 0 H1 : µ1-µ2 > 0 H1 : µ1-µ2 < 0

Estadístico
de
Contraste

Distribución Normal Tipificada “t” de Student


Muestral N (0, 1) gl = n1 + n2 - 2

Conocida (Z) o desconocida (t) la varianza de la población (valor o valores críticos)

Regla (C. Bilateral) ! t ≤ t α / 2; n-2 y t ≥ t1 - α / 2; n-2 // Z ≤ Z α / 2 y Z ≥ Z 1 - α / 2


decisión (C. Unilateral Izquierdo) t ≤ t α; n-2 // Z ≤ Z α
(C. Unilateral Derecho) t ≥ t 1 – α; n-2 // Z ≥ Z 1 – α

Nivel crítico p ! Se rechaza H0 si p < α y se acepta si p > α

PROBLEMAS EJEMPLO (CH diferencia de Medias)

Dos centros de Educación Especial vienen utilizando, desde hace dos años, métodos diferentes
para estimular las funciones superiores de los niños con retraso mental. El director de uno de los
centros sostiene que su método (Método A) logra mejores resultados que el del otro centro (Método
B). Para estudiar esta cuestión, fijamos α = 0,03, extraemos aleatoria e independientemente dos
muestras de niños, una en cada centro (nA = 120 y nB = 50) y les medimos el cociente intelectual (CI)
en una escala de intervalo. Los niños de ambos centros iniciaron el programa de estimulación con
un CI medio igual a 70 y los CI medios tras el programa fueron 79 para los niños estimulados con el
método A y 74 para los estimulados con el método B. La distribución de los CI es normal en las
poblaciones con σA = 18 y σB = 12 y todas las observaciones son independientes entre sí.

Supuestos: Se trata de contrastar las medias de dos muestras independientes (varianzas


poblacionales conocidas); Distribución Normal de los CI en ambas poblaciones; Variable
dependiente medida a nivel de intervalo.

Hipótesis: Planteamos un contraste unilateral derecho (queremos probar si el método A es más eficaz)

H0: µA - µB ≤ 0 H1: µA - µB > 0 También ! H0: µA ≤ µB H1: µA > µB

Estadístico de contraste: Conocidas las varianzas poblacionales.


_ _ ________________ ___________________
Z = (Y1 – Y2) / √ (σ21 / n1) + (σ22 / n2) ! Z = (79 – 74) / √ (324 / 120) + (144 / 50) = 2,12

R. MEDRANO (TUTOR) Página 2


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

Sigue una distribución Normal tipificada N (0, 1)

Regla de decisión:

Valores críticos (para un nivel de confianza del 97% y un contraste unilateral, el valor crítico es !
Z0´97 = (1´88)
Nivel crítico p (el estadístico de contraste 2´12 se asocia a una probabilidad p = P (Z ≥ 2,12)
! 1 – 0,983 = 0,017

Conclusión: Se rechaza H0 [el estadístico de contraste 2´12 > 1´88 (valor crítico) y también p =
0,017 (nivel crítico) < α = 0,03 (nivel de significación)].

Interpretación: El programa de estimulación del CI ha sido eficaz con un nivel de confianza del
97% (mejor el método A que el método B)

Intervalo de confianza: Para realizarlo suponemos que se trata de un contraste bilateral; por tanto,
habría que reformular las hipótesis:
_ _
(Y1 – Y2) ± | Z α/2 | · Error típico ! Límite superior y Límite inferior

(79 – 74) ± (0,03/2 = Z (-2´17) · 2,36 (denominador e. contraste) = 5 ± 5´12 ! (- 0´12 y 10´12)

Decisión: Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la
diferencia de medias en la población puede tomar ese valor

En una investigación psicopedagógica se pasó la misma prueba de nivel de lectura a dos grupos de
niños: los participantes habían sido elegidos de forma aleatoria de entre los alumnos de EGB de dos
provincias españolas. Los datos se muestran en la tabla. La variable se midió en una escala de
intervalo y se supone que σ2A = σ2B

TAMAÑO MEDIA VAR. INSESGADA


PROVINCIA A 121 40 7
PROVINCIA B 61 38 6

Supuestos: Disponemos de dos muestras independientes (dos grupos de niños) que se someten a
una prueba de lectura. La variable dependiente medida a nivel de intervalo. Varianzas
poblacionales desconocidas y supuestamente iguales (σ2A = σ2B). Muestras grandes (121 y 61).

Contraste las hipótesis para las medias (muestras independientes)

Hipótesis: Planteamos un contraste bilateral para ver si las diferencias se deben al azar.

(H0: µA – µB = 0 y H1: µA – µB ≠ 0) // También ! H0: µA = µB y H1: µA ≠ µB)

Estadístico de contraste: Aplicamos el E. de Contraste para la diferencia de medias. Desconocidas


las varianzas de la población (supuestamente iguales) :
_ _
T = (Y1 – Y2) / Error típico ! T = (40 – 38) / 0,408 = 4,90

_________________________________________________
Error típico = √[( n1 – 1) S21 + (n2 – 1) S22 / (n1 + n2 – 2)] · (1 / n1 ) + (1 / n2 )
______
Error típico = √0´1665 = 0,408

Sigue una distribución t de Student con n1 + n2 – 2 grados de libertad.

R. MEDRANO (TUTOR) Página 3


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

Regla de decisión:

Valores críticos (tabla t de Student con 121 + 61 – 2 = 180 grados de libertad y α = 0,05). Se trata
de un contraste bilateral y son muestras grandes; por tanto, utilizamos Z0´025 (- 1´96) y Z0´975 = (1´96)
Nivel crítico p (el estadístico de contraste 4´90 se asocia a una probabilidad < 0´0005 que es más
pequeña que α)

Conclusión: Rechazamos H0 (el estadístico de contraste 4´90 no está entre los valores críticos ±
1´96 y de igual forma, considerando el nivel p crítico, p < α)

Interpretación: El rendimiento medio en la prueba de lectura no es igual en los dos grupos con un
nivel de significación α = 0,05.

Intervalo de confianza:
_ _
(Y1 – Y2 ) ± | tα (n1 + n2 – 2) | · Error típico = (Límites inferior y superior)

(40 – 38) ± 1´96 · 0´408 = 2 ± 0´8 = (1´2 y 2´08) ! Rechazamos H0 (el intervalo de confianza no
contiene el valor 0, luego asumimos que la diferencia de medias en la población no puede tomar
ese valor)

Distintos estudios muestran que la relajación es eficaz para reducir la ansiedad precompetitiva.
Siguiendo esta línea de investigación y habiendo hipotetizado una reducción de la ansiedad en las
escaladoras tratadas con relajación, extraemos aleatoria e independientemente 12 escaladoras y
les asignamos aleatoriamente a las dos condiciones del experimento: la mitad de las escaladoras se
somete a un programa de relajación durante seis meses y la otra mitad no realiza ningún tipo de
relajación (suponemos que las poblaciones se distribuyen normalmente con distinta varianza). Al
finalizar el programa de relajación, medimos la ansiedad precompetitiva de todas las escaladoras,
obteniendo una ansiedad media de 8 y una varianza insesgada de 150 en el grupo “sin relajación” y
una ansiedad media de 6´5 y una varianza sesgada de 100 en el grupo “con relajación”. El nivel de
significación alfa se fijó en 0,05, la variable dependiente está medida a nivel de intervalo y a mayor
puntuación mayor ansiedad. ¿Podemos afirmar que realmente la ansiedad precompetitiva de las
escaladoras se reduce utilizando técnicas de relajación?

Supuestos: 12 escaladoras en un experimento con dos condiciones: 6 escaladoras “sin relajación”


y 6 “con relajación”. Variable dependiente (ansiedad) medida a nivel de intervalo. Poblaciones con
distribución normal ! Contraste de hipótesis para dos muestras Independientes (desconocidas
las varianzas poblacionales y supuestas distintas)

Hipótesis: Siguiendo a los investigadores planteamos un contraste unilateral derecho.

H0 : µ1 - µ2 ≤ 0 H1 : µ1 - µ2 > 0 // // También ! H0: µ1 ≤ µ2 y H1: µ1 > µ2)

Estadístico de contraste: Contraste de medias, desconocidas las varianzas (supuestas distintas)


_ _
T = (Y1 – Y2) / Error típico ! (8 - 6´5) / 6´23 = 0´24
_______________
Donde ! Error típico = √ Ŝ21 / n1 + Ŝ22 / n2

Cálculos adicionales (Medias y Varianzas insesgadas) !


_ _
YSR = 8 Ŝ2 SR = 150 (insesgada) YR = 6,5 Ŝ2 R = 83 (insesgada)

Donde ! S2 R = 100 (sesgada) = (5 / 6) · 100 ! 83


_____________ __________
Error Típico de la diferencia ! √150 / 6 + 83 / 6 ! √25 + 13´83 = 6´23

R. MEDRANO (TUTOR) Página 4


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

(150 / 6 + 83 / 6)2
gl = ----------------------------------------------------- =
[(150 / 6)2 / (6 – 1) + (83 / 6)2 / (6 – 1)

gl = 1507´77 / 163´27 = 9´23 ≈ 9 (valor < t = n1 + n2 – 2)

Regla de decisión:
Valor crítico para α = 0,05 ! Según la tabla t de Student (contraste unilateral derecho), con 9 gl
encontramos el valor ! t9; 0´05 = 1´833
Nivel crítico p ! el valor del E. Contraste T = 0´24, con 9 gl se encuentra entre 0´55 < p < 0´60

Conclusión e interpretación: Se acepta H0 para un nivel de confianza del 95%. Según el valor
crítico (contraste unilateral derecho) T (0´24) < 1´833 ! Aceptamos H0.
Según el nivel p crítico (0´55 < p < 0´60) > que el valor de α = 0,05. La ansiedad precompetitiva de
las escaladoras no disminuye utilizando técnicas de relajación.

CONTRASTES DE HIPÓTESIS DOS MEDIANAS (TEST DE MANN-WHITNEY-WILCOXON)

Supuestos " Variable dependiente con un nivel de medida ordinal o superior


" Dos poblaciones con distribuciones similares (misma forma) en la población

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hipótesis H0 : µ1-µ2 = 0 H0 : µ1-µ2 ≤ 0 H0 : µ1-µ2 ≥ 0
H1 : µ1-µ2 ≠ 0 H1 : µ1-µ2 > 0 H1 : µ1-µ2 < 0

1.- Asignamos rangos a todas las puntuaciones (muestra 1 y muestra 2) como si


formaran un único grupo.
2.- Calculamos las sumas de rangos para las puntuaciones procedentes de cada
Estadístico una de las muestras (S1 para la primera muestra y S2 para la segunda muestra)
Contraste 3.- Calculamos los siguientes valores:

U1 = S1 - ½ n 1 (n1 + 1) // U2 = S2 - ½ n 2 (n2 + 1)

El estadístico de contraste “U” es el menor de U1 ó U2

Distribución
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon

Conocida (Z) o desconocida (t) la varianza de la población (valor o valores críticos)

Regla (C. Bilateral) ! U > un1, n2; α/2


decisión (C. Unilateral Izquierdo) ! U < un1, n2; α
(C. Unilateral Derecho) ! U > un1, n2; α

Nivel crítico p ! Se rechaza H0 si p < α y se acepta si p > α

Aproximación (Ui) – [(n1 · n2) / 2]


A la Normal Z = -------------------------------
√ n1 n2 (n1 + n2 + 1) / 12

R. MEDRANO (TUTOR) Página 5


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

PROBLEMA EJEMPLO

En una investigación de Psicología Social sobre valores, se han extraído dos muestras aleatorias de
personas. Una muestra se extrajo de una región del interior de la Península (n=5) y la otra de la
costa (n=6). Los participantes cumplimentaron un cuestionario de xenofobia, que ofrece
puntuaciones en una escala ordinal, obteniendo los resultados que se presentan en la Tabla 1 (a
mayor puntuación mayor xenofobia). Se desea saber si la tendencia central de los habitantes de la
costa es más baja que la de los del interior. Se asume que las distribuciones de la variable en las
dos poblaciones tienen la misma forma (si difieren sólo lo hacen en su tendencia central)

Interior 6 14 10 18 20
Costa 16 12 4 8 2 22

Supuestos: Se trata de dos muestras independientes (personas de la península y personas de la


costa). Puntuaciones del cuestionario en escala ordinal. Las distribuciones de la VD en las
poblaciones tienen la misma forma y, si difieren, lo hacen sólo en su tendencia central.

Hipótesis: La hipótesis nula siempre es aquella que afirma lo contrario de lo que el investigador
desea probar. Desea probar que la tendencia central (contraste no paramétrico, mediana) en
habitantes de la costa es menor que en habitantes del interior. Contraste unilateral izquierdo

Hipótesis de la que parte el investigador ! H1: η C < η P


Hipótesis nula (negación de la anterior) ! H0: η C ≥ η P

Estadístico de contraste:

1º.- Ordenamos el total de las puntuaciones de menor a mayor (puntuaciones de interior en negrita)

2 4 6 8 10 12 14 16 18 20 22

2º.- Asignamos rangos (vemos que no hay empates):

2 4 6 8 10 12 14 16 18 20 22
1 2 3 4 5 6 7 8 9 10 11

3º.- Sumamos los rangos de cada grupo: Rangos de interior (negrita) S1 = 3+ 5+ 7+ 9 +10 = 34
Rangos de costa S2 = 1+2+4+6+8+11 = 32

4º.- Aplicamos las fórmulas del estadístico de contraste (U):


U1 = S1 - ½ n 1 (n1 + 1) ! U1 = 34 – (2´5 · 6) = 19
U2 = S2 - ½ n 2 (n2 + 1) ! U2 = 32 – (3 · 7) = 11

Elegimos como estadístico de contraste el valor inferior de U (U2 = 11)

Regla de decisión:

Si consideramos como estadístico de contraste la suma de rangos, el estadístico de contraste es W


= 34 (se elige la muestra 1 porque es la que tiene menor número de sujetos. El nivel crítico p del
estadístico W de MWW se encuentra en la Tabla A.7 ! buscamos n1 = 5 y n2 = 6. El nivel crítico es
el valor de probabilidad que tiene nuestro estadístico muestral. Como W = 34, vemos que p = 0.268

Conclusión: Dado que el nivel crítico p (0´268) es mayor que α (0´05) ! Aceptamos H0

Interpretación: Las distribuciones del interior y las de la costa no difieren en cuanto a las medianas
en sus apreciaciones sobre la xenofobia.

R. MEDRANO (TUTOR) Página 6


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

CONTRASTES DE HIPÓTESIS DOS PROPORCIONES

Supuestos " Observaciones independientes


" Variable dependiente dicotómica o dicotomizada
" n ≥ 30

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hipótesis H0 : π1- π2 = D H0 : π1- π2 ≤ D H0 : π1- π2 ≥ D
H1 : π1- π2 ≠ D H1 : π1- π2 > D H1 : π1- π2 < D

D=0 D≠0
_____________________
Z = (P1 – P2 ) - 0 / √ P (1 - P ) · (1 / n1 ) + (1 / n2 ) ___________________________
Estadístico Z = (P1 – P2) - λ. / √ P1 (1 – P1 ) / n1 + P2 (1 – P2 ) / n2
Contraste Donde P = (n1 · P1 ) + (n2 · P2 ) / (n1 + n2 )

Distribución
Muestral Normal tipificada N (0, 1)

Conocida (Z) o desconocida (t) la varianza de la población (valor o valores críticos)

Regla (C. Bilateral) ! Z ≤ Z α/2 y Z ≥ Z 1-α/2


decisión (C. Unilateral Izquierdo) ! Z ≤ Z α
(C. Unilateral Derecho) ! Z ≥ Z 1 – α

Nivel crítico p ! Se rechaza H0 si p < α y se acepta si p > α

Intervalo (P1 – P2 ) ± | Zα | · Error típico = (Límites inferior y superior)


confianza

PROBLEMAS EJEMPLO

El grado de dificultad de las preguntas de un test se suele medir por el número de los sujetos que
los aciertan, o más exactamente, por la proporción de aciertos. Para averiguar si dos preguntas de
un determinado test de aptitud general difieren en dificultad, hemos seleccionado una muestra
aleatoria simple de 200 sujetos y los hemos repartido aleatoriamente en dos grupos de 100. Un
grupo de sujetos ha respondido a la pregunta 1 y el otro a la pregunta 2. La pregunta 1 la han
acertado 70 sujetos y la 2 la han acertado 60. El nivel de significación α se fijó en 0,05.

Supuestos: Tenemos una muestra aleatoria de n = 200 sujetos, repartidos en dos grupos
independientes de 100 (cada uno responde a una pregunta y se considera el acierto o el error !
variable dicotómica). Se fija α = 0,05. Se dan los supuestos para realizar un Contraste de
Proporciones al comparar el grado de dificultad de las dos preguntas del test.

Hipótesis: Planteamos un contraste bilateral para ver si las preguntas difieren en dificultad.

H0: π1 = π2 // H1: π1 ≠ π2

Estadístico de contraste: La hipótesis se establece sobre una diferencia nula D = 0)


________________________
Z = (P1 – P2 ) / √ P (1 - P ) · (1 / n1 ) + (1 / n2 ) // Donde P = (n1 · P1) + (n2 · P2) / (n1 + n2)

R. MEDRANO (TUTOR) Página 7


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

Cálculos previos: Aciertos ! G1 = 70 / 100 = 0,7 / G2 = 60 / 100 = 0,6

P = (n1 · G1) + (n2 · G2) / (n1 + n2) ! (100 · 0,7) + (100 · 0,6) / (100 + 100) = 0,65
_______________________________
Z = (0,7 – 0,6) / √ 0,65 (1 – 0,65) · (1 / 100) + (1 / 100) = 1,48

Sigue una distribución Normal tipificada N (0, 1)

Regla de decisión:

Valores críticos (para un nivel de confianza del 95% y un contraste bilateral, los valores críticos
son ! ± 1´96 ! Z0´025 (- 1´96) y Z0´975 = (1´96)
Nivel crítico p [el estadístico de contraste (Z = 1,48) en la tabla de la curva normal deja por debajo
0,9306] ! Probabilidad (Z ≥ 1,48) = 1 - 0,9306 = 0,0694; al ser bilateral ! 2 · 0,069 = 0,1388.

Conclusión: Aceptamos H0 (el estadístico de contraste 1´48 está entre los valores críticos ± 1´96 y
de igual forma, considerando el nivel p crítico, p (0´1388) > α (0´05)

Interpretación: Para un nivel de confianza del 95%, aceptamos la hipótesis nula (las preguntas no
difieren en dificultad)

Intervalo de confianza: (P1 – P2 ) ± | Zα | · Error típico = (Límites inferior y superior)

(0,7 – 0,6) ± 1´96 · 0´067 = (- 0´03 y 0´23)

Aceptamos H0 (el intervalo de confianza contiene el valor 0, luego asumimos que la diferencia de
medias en la población puede tomar ese valor)

CONTRASTES DE HIPÓTESIS DOS VARIANZAS

Supuestos " Variable dependiente con un nivel de medida de intervalo o razón


" Dos poblaciones con variables distribuidas normalmente ó n1 ≥ 30 y n2 ≥ 30

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


2 2 2 2 2 2
Hipótesis H0 : σ 1 / σ 2 = 1 H0 : σ 1 / σ 2 ≤ 1 H0 : σ 1 / σ 2 ≥ 1
2 2 2 2
H1 : σ 1 / σ 2 ≠ 1 2 2
H1 : σ 1 / σ 2 > 1 H1 : σ 1 / σ 2 < 1

2 2 2 2
Estadístico F =S 1 / S 2 Donde S 1 ≥S 2 (varianzas insesgadas)
Contraste

Distribución Distribución Muestral F de Fisher


Muestral
con gl numerador = (n1 – 1) gl y gl denominador = ( n2 – 1)

Regla F ≤ f α/2 y F ≥ f 1-α/2 (C. Bilateral)


decisión F ≥ f 1–α (C. Unilateral Derecho)
F≤ fα (C. Unilateral Izquierdo)

Intervalo
2 2 2 2 2 2
confianza (f α / 2 ; n1 – 1 y n2 – 1) ·Ŝ 1 / Ŝ 2 < σ 1 / σ 2 < (f 1 – α / 2 ; n1 – 1 y n2 – 1) ·Ŝ1 / Ŝ 2

R. MEDRANO (TUTOR) Página 8


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

PROBLEMAS EJEMPLO

Deseamos contrastar si las pacientes anoréxicas (PA) son más variables, en cuanto a su nivel de
estrés, que las pacientes bulímicas (PB). Para ello, extraemos dos muestras aleatorias de dichas
pacientes y se obtienen los siguientes datos sobre su nivel de estrés (donde a mayor puntuación
mayor estrés), considere α = 0,05:

PA 4 6 8 12 16
PB 3 5 7 9 14

Sabemos que la variable “nivel de estrés” está medida a nivel de intervalo y distribuida normalmente en
ambas poblaciones.

Supuestos: Disponemos de dos muestras independientes, la variable dependiente medida a nivel de


intervalo y dos poblaciones con variables normalmente distribuidas! Se trata de un contraste de
varianzas para dos muestras independientes.

Hipótesis: H0: σ2PA / σ2PB ≤ 1 y H1: σ2PA / σ2PB > 1. Contraste Unilateral Derecho.

También ! H0: σ2PA ≤ σ2PB y H1: σ2PA > σ2PB

Estadístico de contraste: F = Ŝ21 / Ŝ22 ! Donde Ŝ21 ≥ Ŝ22 (varianzas insesgadas)

Distribución Muestral F de Fisher con (n1 – 1) gl y (n2 – 1) gl


2 2
PA PB PA PB
4 3 16 9
2 2
6 5 36 25 F =Ŝ 1 / Ŝ2
8 7 64 49
12 9 144 81 F = 23,2 / 17,8 = 1,3
16 14 256 196
Σ = 46 Σ = 38 Σ = 516 Σ = 360

Media PA = 46 / 5 = 9,2 Ŝ21 = (516 / 5) – 9,22 · (5 / 4) = 23,2


Media PB = 38 / 5 = 7,6 Ŝ22 = (360 / 5) – 7,62 · (5 / 4) = 17,8

Regla de decisión: Valor crítico ! f0, 05; 4 y 4 gl = 6,39

Conclusión e interpretación: No se rechaza H0 porque 1,3 (estadístico de contraste) < 6,39 (valor
crítico). Por tanto, las pacientes anoréxicas (PA) no son más variables que las bulímicas (PB) en
cuanto a su nivel de estrés considerando un nivel de confianza del 95%.

Intervalo de confianza (para poder realizarlo suponemos contraste bilateral):

(f α / 2 ; n1 – 1 y n2 – 1) · Ŝ21 / Ŝ22 < σ21 / σ22 < (f 1 – α / 2 ; n1 – 1 y n2 – 1) · Ŝ21 / Ŝ22

0,10) · (23,2 / 17,8) = 0,13 < σ21 / σ22 < (9,60) · (23,2 / 17,8) = 12,48

Siendo los valores críticos: f 0,025; 4 y 4 gl = 9,60 y f 0,975; 4 y 4 gl = 1 / 9,60 ! 0,10 (propiedad recíproca).

Decisión: Como la H0 debe plantear que las varianzas son iguales (σ21 / σ22 = 1) y apreciamos que
uno está dentro del intervalo de confianza (0,13 y 12,48). Se aceptaría la H0 (las varianzas de
ambas poblaciones son iguales)

R. MEDRANO (TUTOR) Página 9


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 3 (DISEÑOS 2 GRUPOS INDEPENDIENTES)

TAMAÑO (MAGNITUD) DEL EFECTO

La magnitud o tamaño del efecto alude al índice que mide el efecto que tiene un tratamiento. Deben
estar implicados al menos dos grupos (el experimental y el control). Es independiente del tamaño
muestral.
|YTRATAMIENTO – YCONTROL |
Índice d = -------------------------------------------------------
√[( n1 – 1) Ŝ21 + (n2 – 1) Ŝ22 / (n1 + n2 – 2)]

Según Cohen (1988) ! Magnitud del efecto [pequeño (d = 0´2); mediano (d = 0´5) y grande (d =
0´8 o superior)

Problema ejemplo: En un equipo de baloncesto se desea contrastar la eficacia del entrenamiento


psicológico en los tiros libres, por lo que se seleccionaron aleatoriamente 5 jugadores, a los que se
entrenó técnica y psicológicamente, que fueron comparados con los otros 5, a los que sólo se
entrenó técnicamente. El porcentaje de mejora a lo largo de la temporada aparece en la siguiente
tabla:

ENTRENAMIENTO PSICOLÓGICO 37 14 38 43 35
ENTRENAMIENTO TÉCNICO 29 36 11 17 13

Supuestos: Disponemos de dos muestras independientes con n = 5 para contrastar la eficacia de


un tipo de entrenamiento (el psicológico). Datos en porcentaje de mejora ! Comprobar la
magnitud del efecto.

PSICOLÓGICO TÉCNICO DATOS INSESGADOS


2 2
X X Y Y
37 1369 29 841 MEDIA PSICOLÓGICO = 167 / 5 = 33,4
14 196 36 1296 MEDIA TÉCNICO = 106 / 5 = 21,2
38 1444 11 121 2
43 1849 17 289 VARIANZA PSIC = (6083 / 5) – 33,4 = 101,04 · (5/4) = 126,3
2
35 1225 13 169 VARIANZA TÉCN = (2716 / 5) – 21,2 = 93,76 · (5/4) = 117,2

T = MEDIA PSIC - MEDIA TÉCN = (33,4 – 21,2) = 12,2


____________________________
Error Típico = √ (4 · 126,3) + (4 · 117,2) / (5+5-2) = 9
Σ = 167 Σ = 6083 Σ = 106 Σ = 2716
d = 12,2 / 9 = 1,35 ! (0´9115)

La d = 1´35 es la distancia estandarizada entre las medias de los dos grupos y su probabilidad
asociada (0´9115) ! El 91´15% de los sujetos con entrenamiento psicológico mejoran respecto a
los que únicamente reciben entrenamiento técnico.

R. MEDRANO (TUTOR) Página 10


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

TEMA Nº 4 ! ANÁLISIS DE DATOS PARAMÉTRICOS PARA DISEÑOS DE DOS GRUPOS


(MUESTRAS RELACIONADAS)

CONTRASTES DE HIPÓTESIS PARA DOS MUESTRAS RELACIONADAS

Muestras independientes: n1 y n2 muestras de sujetos diferentes, extraídos aleatoriamente de sus


respectivas poblaciones.
Muestras relacionadas: se trata de los mismos n sujetos observados en condiciones experimentales
diferentes, o n pares de sujetos semejantes entre sí (gemelos, hermanos,...)

Las muestras relacionadas nos ayudan a reducir la varianza de error. Así, cuanto mayor sea la
relación entre ambas muestras, menor será la varianza de la distribución muestral de las diferencias
y, por tanto, mayor el estadístico de contraste.

CONTRASTES DE HIPÓTESIS:

PARA DOS MEDIAS CONOCIDA LA VARIANZA POBLACIONAL DE LAS DIFERENCIAS


(PARAMÉTRICOS) DESCONOCIDA LA VARIANZA POBLACIONAL DE LAS DIFERENCIAS

PARA DOS MEDIANAS (NO PARAMÉTRICOS) ! TEST DE WILCOXON

PARA DOS PROPORCIONES

CONTRASTES DE HIPÓTESIS PARA DOS MEDIAS (MUESTRAS RELACIONADAS)

" Observaciones independientes


Supuestos " Nivel de medida de intervalo o razón
" Distribuciones normales en la población de diferencias ó bien (n ≥ 30)

VARIANZA POBLACIONAL VARIANZA POBLACIONAL DE LAS


DE LAS DIFERENCIAS CONOCIDA DIFERENCIAS DESCONOCIDA
Hipótesis
(similares) C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo
H0 : µ1-µ2 = 0 H0 : µ1-µ2 ≤ 0 H0 : µ1-µ2 ≥ 0
H1 : µ1-µ2 ≠ 0 H1 : µ1-µ2 > 0 H1 : µ1-µ2 < 0

_ __ _ __
2
Estadístico Z = (D – µd) / (σd / √ n ) T = (D – µd) / (Ŝ d / √ n )
Contraste
Distribución
Muestral Normal Tipificada: (0, 1) “t” de Student: gl = n-1

Conocida (Z) o desconocida (t) la varianza de la población (valor o valores críticos)

Regla (C. Bilateral) ! t ≤ t α / 2; n-2 y t ≥ t1 - α / 2; n-2 // Z ≤ Z α / 2 y Z ≥ Z 1 - α / 2


decisión (C. Unilateral Izquierdo) t ≤ t α; n-2 // Z ≤ Z α
(C. Unilateral Derecho) t ≥ t 1 – α; n-2 // Z ≥ Z 1 – α

Nivel crítico p ! Se rechaza H0 si p < α y se acepta si p > α

_ __ _ __
Intervalo D ± | Z α/2 | · σD / √ n = (Lím. infer y sup) D ± | t α/2; n– 1 | · SD / √ n = (Lím. infer y sup)
confianza Distribución Muestral Z con N (0,1) Distribución Muestral T con (n – 1) gl

R. MEDRANO (TUTOR) Página 1


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

PROBLEMAS EJEMPLO (CH diferencia de Medias Relacionadas)

Se desea estudiar si los alumnos de la ESO son más variables en cuanto a su nivel de
concentración antes y después de haberles sometido a una terapia. Sobre una muestra aleatoria de
7 alumnos se toman medidas del nivel de concentración previo y posterior a la aplicación de la
terapia, obteniéndose los siguientes resultados (a mayor puntuación, mayor concentración):

MEDIDA PREVIA 12 9 11 10 9 6 7
MEDIDA POSTERIOR 7 5 6 6 5 6 7

Sabiendo que para aplicar el estadístico de contraste se resta la medida posterior de la previa, que
la concentración es una variable medida a nivel de intervalo y que se distribuye normalmente en
ambas poblaciones, tómese un nivel de significación α = 0,05 y compruebe si los alumnos se
concentran más al finalizar la terapia.

Supuestos: Siete alumnos de la ESO (antes y después de la terapia) ! Muestras relacionadas, (α


= 0,05), variable medida a nivel de intervalo y se distribuye normalmente en ambas poblaciones.
Varianza poblacional desconocida ! Diferencia de medias (muestras relacionadas)

Hipótesis: La hipótesis alternativa es la hipótesis del investigador. Del planteamiento del problema
se deduce de que se trata de un contraste unilateral izquierdo donde:

H0: µ después ≥ µ antes ! H1: µ después < µ antes


Estadístico de contraste:

2
Medida Medida Diferencia D - DMedia (D - DMedia)
Previa Posterior Posterior - Previa
12 7 -5 - 1,86 3,4596
9 5 -4 - 0,86 0,7396
11 6 -5 - 1,86 3,4596
10 6 -4 - 0,86 0,7396
9 5 -4 - 0,86 0,7396
6 6 0 3,14 9,86
7 7 0 3,14 9,86
Σ = 64 Σ = 42 Σ = (- 22) Σ = 28,86

_
Averiguamos la media (D) y la varianza insesgada (Ŝ2d) de las puntuaciones diferencia:
_ __ __
Desconocida la varianza de la población: T = (D – 0) / (Ŝ2d) / √ n) ! T = (- 3,14) / (4,81 / √ 7) = - 1,7
__________________ _ _ _
Donde: Ŝ2d = √ Σ (Di – DMedia)2 / (n – 1) y D = Y1 – Y2 = Σ Di / n
________ _
Ŝ2d = √ 28,86 / 6 = 4,81 y D = (- 22) / 7 = (- 3,14)

Regla de decisión:

Valor crítico (contraste unilateral izquierdo) ! - 1,943 (valor crítico T0, 05 y 6 gl)
Nivel crítico p sólo puede obtenerse el valor aproximado, porque 1,7 no figura en la tabla T de
Student para n–1 = 6 gl. El valor 1,7 está entre 0,10 (1,4) y 0,05 (1,9).

Conclusión e interpretación: Teniendo en cuenta que se trata de un contraste unilateral izquierdo


se acepta H0 ! El estadístico de contraste (-1,7) < (-1,943) (valor crítico T0, 05 y 6 gl) // El nivel p crítico
(0´05 < p < 0´10) > α = 0,05 por lo que se acepta H0. No disponemos de evidencia suficiente para
afirmar que los alumnos se concentran más al finalizar la terapia.

R. MEDRANO (TUTOR) Página 2


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

Intervalo de confianza: Suponemos un contraste bilateral para realizar el intervalo.


_ __
D ± | t α/2; n– 1 | · Ŝ2d / √ n = (Límite inferior y superior) // Distribución Muestral T con (n – 1) gl

(-3´14) ± 1´943 · 4´81 / 2´64 ! (- 3´14) ± 3´54 ! (0´4 y 6´68) ! No contiene el 0, Rechazamos H0

Unos psicólogos hipotetizan que los hombres (H) con más de 20 años son más afectuosos hacia su
pareja que las mujeres (M). Extrae una muestra aleatoria de 8 parejas casadas y les mide el grado
de afectividad hacia la pareja, obteniendo los datos que aparecen a continuación (a mayor
puntuación mayor afectividad hacia la pareja). Se sabe que la puntuación en afectividad es una
variable medida a nivel de intervalo que se distribuye normalmente y que las observaciones entre
las muestras no son independientes. Se fija alfa en 0´01. Suponemos conocida la varianza de las
diferencias (σ2d = 5).

PAREJAS 1 2 3 4 5 6 7 8
HOMBRES 13 5 6 9 10 7 11 8
MUJERES 1 9 8 6 5 8 3 5

Supuestos: Se sabe que la puntuación en afectividad es una variable medida a nivel de intervalo,
que se distribuye normalmente en ambas poblaciones y que conocemos la varianza de las
diferencias (σ2d = 25). Se fija α en 0,04. Según el enunciado ! Diferencia de medias (muestras
relacionadas)

Hipótesis: Se plantea un contraste unilateral derecho ! H0: µH ≤ µM. y H1: µH > µM

Estadístico de contraste:
H M D
13 1 12
5 9 -4
6 8 -2
9 6 3
10 5 5
7 8 -1
11 3 8
8 5 3
Media = 8,7 Media = 5,7 Σ = 24
_ _ _ _
D = H – M = Σ Di / n ! D = 24 / 8 = 3 // σ2d = 5
_ __ _
Z = (D – 0) / (σ2d / √ n) ! T = 3 / (5 / √8) = 3 / 1´77 = 1,69

Regla de decisión:
El nivel crítico p (probabilidad de obtener un valor del estadístico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadístico de contraste (1,69) que buscando en la
tabla de la curva normal ! p = 1 – P (T ≤ 1´69) ! 1-0`9545 = 0´0455.
El valor crítico para un contraste unilateral derecho y un alfa = 0´01 es ! 2´33

Conclusión e interpretación: Al nivel de confianza del 99% no existen diferencias significativas.


No aceptamos la hipótesis de psicólogo (H1); por tanto, aceptamos H0 (los hombres no son más
afectuosos que las mujeres)

Intervalo de confianza: Suponemos un contraste bilateral para realizar el intervalo.


_ __
D ± |Z α/2| · σ2d / √ n = (Límite inferior y superior) // Distribución Muestral Z con N (0, 1)

3 ± 2´58 · 5 / 2´83 ! 3 ± 4´57 ! (- 1´57 y 7´57) ! Como contiene 0 aceptamos H0

R. MEDRANO (TUTOR) Página 3


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

CH DOS MEDIANAS (MUESTRAS RELACIONADAS) PRUEBA DE WILCOXON

Supuestos " Variable dependiente con un nivel de medida al menos ordinal


" La distribución de la diferencia de los rangos es simétrica

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hipótesis H0 : M1 = M2 H0 : M1 ≤ M2 H0 : M1 ≥ M2
H1 : M1 ≠ M2 H1 : M1 > M2 H1 : M1 < M2

1.- Calculamos las diferencias entre las puntuaciones originales.


2.- Asignamos rangos a los valores absolutos de las diferencias.
Estadístico 3.- Sumamos los rangos que proceden de diferencias positivas y los rangos que
Contraste proceden de diferencias negativas, obteniendo: ∑ R - y ∑ R +

El estadístico de contraste “W” es el menor de ∑ R - y ∑ R +

Distribución
Muestral Utilizamos la tabla U de Mann-Whitney-Wilcoxon

Conocida (Z) o desconocida (t) la varianza de la población (valor o valores críticos)

Regla (C. Bilateral) ! W > wn1, n2; α/2


decisión (C. Unilateral Izquierdo) ! W < wn1, n2; α
(C. Unilateral Derecho) ! W > wn1, n2; α

Aproximación (T) – [n (n +1) / 4]


A la Normal Z = -------------------------------
n ≥ 30 √ n (n+1)(2n+1) / 24

PROBLEMA EJEMPLO
Un investigador desea comparar el grado de hiperactividad en obesos cuando están en un
programa para bajar de peso (dieta) y sin programa para bajar de peso. Dispone de 10 sujetos a los
que somete a las dos condiciones experimentales (con dieta y sin dieta). Las puntuaciones se
reflejan en la tabla. Sabiendo que la distribución de las diferencias es simétrica, con un nivel de
confianza del 95%, ¿se puede afirmar que hay diferencias en hiperactividad en obesos cuando
están o no en un programa de dieta?

Supuestos: Disponemos de dos muestras relacionadas (tamaño pequeño). Sabemos que la


distribución de las diferencias en la población es simétrica. Datos medidos, al menos, a un nivel
ordinal.

Hipótesis: Planteamos un contraste bilateral ! H0 : M1 = M2 y H1 : M1 ≠ M2

Estadístico de contraste:

R. MEDRANO (TUTOR) Página 4


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

∑ R+ = (1´5 + 7´5 + 9´5 + 4´5 + 7´5 + 4´5 + 4´5) = 39´5 y ∑ R- = (1´5 + 9´5 + 4´5) = 15´5
Se toma el valor del más pequeño de los sumatorios ! W = 15´5 (Estadístico de Contraste)

Regla de decisión: Con α/2 = 0´05 (contraste bilateral) y n = 10, acudimos a la tabla de Wilcoxon y
obtenemos un valor crítico = W0´025; 10 = 9

Conclusión e interpretación: Dado que el estadístico de contraste (W = 15´5) > el valor crítico (W = 9)
no podemos rechazar la H0 con un nivel de confianza del 95%. Las diferencias en el incremento o
disminución de la hiperactividad en personas obesas con dieta o sin dieta, no son significativas.
Estadísticamente resultan iguales, en razón de que pueden ser diferencias dadas al azar.

CONTRASTES DE HIPÓTESIS DOS PROPORCIONES


Típico problema sobre cambios de opinión (pretest-postest), cuando la variable está dicotomizada.

Supuestos " Variable dependiente dicotómica o dicotomizada que medimos en la misma


muestra en dos ocasiones.
" Muestra con [b + c] Observaciones independientes, donde [b + c] > 25
(b+c) representan a los sujetos cuya puntuación es distinta en las dos ocasiones.

C. Bilateral C. Unilateral Derecho C. Unilateral Izquierdo


Hipótesis H0 : πb = πc H0 : πb ≤ πc H0 : πb ≥ πc
H1 : πb ≠ πc H1 : πb > πc H1 : πb < πc

_______
2 2
Z = (b - c) / √ (b + c) χ = (b – c) / (b + c)
Estadístico
Contraste b ! (sujetos que puntúan 1 en la primera medida y 2 en la segunda).
c ! (sujetos que puntúan 2 en la primera medida y 1 en la segunda)
Distribución
Muestral Normal tipificada N (0, 1) Chi Cuadrado con 1 grado de libertad
2 2
Regla (C. Bilateral) ! Z ≤ Z α / 2 y Z ≥ Z 1 - α / 2 χ < χ 1; 1-α → Mantener H0
decisión (C. Unilateral Izquierdo) ! Z ≤ Z α
2 2
(C. Unilateral Derecho) ! Z ≥ Z 1 – α χ > χ 1; 1-α → Rechazar H0

_______
Intervalo (P1 – P2 ) ± | Z α/2 | · √ (b + c) = (Límites inferior y superior)
confianza

PROBLEMA EJEMPLO

Una psicóloga desea estudiar si la proyección de imágenes de accidentes de tráfico influye en la


forma de conducir. Extrae una muestra aleatoria de 102 sujetos con elevado historial de infracciones
de tráfico y observa si cometen o no infracción en una determinada situación que propicia el hacerlo
(saltarse un semáforo que acaba de cambiar a rojo). Encuentra que 54 no se lo saltan. Tras
proyectarles imágenes de accidentes de tráfico, vuelve a observar si los sujetos se saltan o no se
saltan el semáforo en las mismas condiciones. Encuentra que 34 de los que no se lo saltaban antes
de proyectarles las imágenes se lo saltan después y 5 que se lo saltaban antes, también se lo saltan
después. Se desea saber si ha habido un cambio significativo en cuanto a infracciones tras la
proyección de imágenes. Utilice alfa = 0,01

Supuestos: Muestra grande de 102 sujetos sometidos a dos medidas de la misma variable
(cometer o no cometer infracción)! Variable dependiente dicotómica. [b + c] > 25 Se trata de
contrastar las proporciones en dos muestras de observaciones relacionadas.

Hipótesis: Planteamos un contraste bilateral ! H0 : πb = πc y H1 : πb ≠ πc

R. MEDRANO (TUTOR) Página 5


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS ORIENTACIONES TEMA Nº 4 (DISEÑOS 2 GRUPOS RELACIONADOS)

Estadístico de contraste:

Primera medida (Antes)


Si saltan (SI = 1) No saltan (NO = 2) TOTALES
Si saltan a=5 b = 34 39
Segunda (SI = 1)
Medida No saltan c = 63-20 = 43 d = 54-34 = 20 102 – 39 = 63
(Después) (NO = 2)
48 54 102
TOTALES
______ ________
Z = (b - c) / √ (b + c) ! (34 – 43) / √ (34 + 43) = ± 1`02 // Distribución normal N (0,1)

Regla de decisión:

Los valores críticos, contraste bilateral, con α/2 = 0,005 y 1- α/2 = 0,995 ! ± 2´58.
El nivel crítico p (probabilidad de obtener un valor del estadístico, al menos, tan extremo como el
hallado) se obtiene a partir del valor muestral del estadístico de contraste (± 1´02) que buscando en
la tabla de la curva normal ! 2 [P (Z ≥ 1´02) = 2 · (1 – 0,8461) = 2 · 0,1539 ! 0,3078.

Conclusión e interpretación:

Como p (0,3078) > α (0,01) ! Aceptamos H0. También como 1´02 (valor muestral del estadístico de
contraste) < 2´58 (el mayor de los valores críticos). También 1´02 está entre los valores críticos (-
2´58 y 2´58).
Para α = 0´01, podemos afirmar que la proporción poblacional de los sujetos que se saltan el
semáforo es la misma antes de la proyección de imágenes que después.

También con el test de McNemar: χ2 = (b – c)2 / (b + c) ! χ2 = (34 – 43)2 / (34 + 43) = 1´05

Para χ2con un grado de libertad, el valor 1´05 se encuentra entre (0´10 < p < 0´90) por lo que el nivel p
crítico > que α (0,01) ! Aceptamos H0

R. MEDRANO (TUTOR) Página 6


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

TEMA Nº 5 ! DISEÑOS CON MÁS DE DOS GRUPOS INDEPENDIENTES

FUNDAMENTOS DEL ANÁLISIS DE VARIANZA (ANOVA)

Análisis de Varianza (ANOVA ó ANVAR) ! es una técnica paramétrica de análisis estadístico que
se utiliza para comparar las medias de más de dos grupos.
El diseño de más de dos grupos tiene por objeto estudiar la influencia de más de dos valores de la
variable independiente sobre la variable dependiente y, por tanto, tiene más posibilidades de establecer
la relación precisa entre ellas. Una de las características más importantes del diseño de experimentos
es la aleatoriedad: elección de un grupo (muestra) y su distribución en tres o más grupos de forma
aleatoria.
Al comparar distintos grupos para realizar un estudio tenemos en cuenta la variabilidad que aparezca
entre los sujetos en la variable dependiente que se considera formada por dos componentes: la que se
debe al factor estudiado (atribuible a los distintos tratamientos experimentales; variable independiente) y
la que se debe a factores extraños y no controlados (Error Experimental)
El Análisis de Varianza se fundamenta en el estudio de estas variabilidades. La varianza general o
común se divide en: varianza intergrupos (atribuible a los distintos niveles del factor estudiado) y
varianza intragrupos (atribuible al error experimental). Al comparar ambas varianzas obtenemos la
aceptación o rechazo de la hipótesis nula (que consiste en afirmar que no existe diferencia entre las
medias de los distintos grupos)
Lógica del método: Los sujetos se distribuyen aleatoriamente en los mencionados grupos (para
minimizar la influencia de las variables extrañas); por tanto, son semejantes en cuanto a la variable
estudiada dentro de cada grupo y entre los distintos grupos. Si después de aplicar el tratamiento
experimental existen diferencias, se puede pensar que son debidas a los procedimientos aplicados.

TERMINOLOGÍA:

Factores = Var. Independientes que se estudian. Niveles = categorías en que dividimos los factores.
Efectos Fijos = sólo nos interesan unos niveles concretos, los establecidos. Los resultados sólo afectan
a estos niveles. Efectos Aleatorios = los niveles actúan como una muestra y las conclusiones se pueden
generalizar en el sentido de los datos de la muestra.
Modelo Equilibrado = igual número de sujetos en los grupos. Modelo no Equilibrado = distinto número
de sujetos en los grupos.

PASOS PARA REALIZAR EL ANOVA !

1.- Probar los supuestos (independencia de las observaciones, normalidad de las distribuciones y
homogeneidad de las varianzas)para asegurarnos que se puede aplicar el ANOVA
2.- Enunciar las hipótesis estadísticas
3.- Decidir el estadístico de contraste que vamos a utilizar para probar la H0
4.- Con qué nivel de confianza vamos a trabajar (establecer la región crítica de rechazo de la H0
5.- Calcular el estadístico de contraste (Tabla del ANOVA)
6.- Tomar la decisión sobre la H0 (comparar el valor F obtenido con el valor crítico)
7.- Interpretación en el contexto de la investigación

SUPUESTOS DEL ANOVA

1.- Escala de medida de la VD, al menos, de intervalo.


2.- Normalidad de las distribuciones: Las muestras o grupos a comparar proceden de poblaciones que
se distribuyen normalmente ! Pruebas de Bondad de Ajuste (Lilliefors, Kolmogorov-Smirnov, X2 de
Pearson) // No es necesario desarrollarlas.
3.- Independencia de las observaciones: Las muestras o grupos han sido obtenidos de forma aleatoria
(las muestras y las observaciones deben ser independientes) ! Test de rachas.
4.- Homogeneidad de las varianzas (homocedasticidad): Los grupos a comparar deben proceder de
poblaciones cuyas varianzas no difieran de forma significativa ! Test de Cochran (modelos equilibrados
y Test de Bartlett (modelos no equilibrados)

R. MEDRANO (TUTOR) Página 1


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

INDEPENDENCIA DE LAS OBSERVACIONES (TEST DE RACHAS) !

Hipótesis estadísticas:
H0: Las observaciones y las muestras son independientes
H1: Las observaciones y las muestras no son independientes

Estadístico de Contraste: (r = nº de rachas // n1 = nº de signos + // n2 = nº de signos –)


Si n1 y n2 ≤ 20, entonces Estadístico r ! (nº de rachas = nº de grupos de signos iguales seguidos)
Si n1 y/o n2 > 20, entonces Estadístico T ! Distribución ! Curva Normal N (0, 1)
r – [(2n1n2 / n1 + n2) + 1]
T = -----------------------------------------------------------
√ 2n1n2 (2n1n2 – n1 n2) / (n1 + n2)2 (n1 + n2 – 1)

Distribución Muestral: Estadístico r ! Tabla (Test de Rachas) // Estadístico T ! Tabla N (0,1)

Cálculo del Estadístico de Contraste: Para poder aplicar el Test hemos de dicotomizar la variable
observada. Para ello: A partir de la Mediana (Md) de todas las puntuaciones tomadas conjuntamente
(si una puntuación es mayor que la Md se sustituye por un signo + y si es menor por un signo –)

Valores Críticos: Si el estadístico es r ! Uα/2 y U1-α/2 (en la tabla de valores críticos del Test de
Rachas, buscamos los valores de n1 y n2) // Si el estadístico es T ! Zα/2 y Z1-α/2

Zona de Aceptación: Zona de Rechazo:


Estadístico r ! Uα/2 < r < U1-α/2 Estadístico r ! r ≤ Uα/2 y r ≥ U1-α/2
Estadístico T ! Zα/2 < T < Z1-α/2 Estadístico T ! T ≤ Zα/2 y T ≥ Z1-α/2

Decisión: Estadístico r ! Decisión: Estadístico T !


Si Uα/2 < r < U1-α/2 ! Aceptamos Ho Si Zα/2 < T < Z1-α/2 ! Aceptamos Ho
Si r ≤ Uα/2 ó r ≥ U1-α/2 ! Rechazamos Ho Si T ≤ Zα/2 o T ≥ Z1-α/2 ! Rechazamos Ho.

PROBLEMA EJEMPLO

Un seleccionador de baloncesto desea averiguar como incide la hora del día a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de mañana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:

TURNOS NÚMERO DE CANASTAS ENCESTADAS POR LOS 18 SUJETOS


MAÑANA 15 12 14 10 11 16
TARDE 7 9 12 17 10 12
NOCHE 13 15 20 17 16 18

Comprobar si las observaciones son independientes (sabemos que la Mediana = 13´5):


Hipótesis ! H: Las muestras son aleatorias y H1: Las muestras no son aleatorias

Para contrastar la independencia (Test Rachas) ! las observaciones pueden dicotomizarse, utilizando la
mediana (asignando un + cuando la puntuación sea mayor y un - cuando la puntuación sea menor)

Canastas 15 12 14 10 11 16 7 9 12 17 10 12 13 15 20 17 16 18
Signo + - + - - + - - - + - - - + + + + +
Rachas 1 2 3 4 5 6 7 8 9
r ! (nº de rachas) = 9 // n + = 9 (signos positivos) // n - = 9 (signos negativos)

Con un nivel de significación α = 0,05, buscamos los valores críticos en la tabla del test de Rachas
n - = 9; n + = 9; α / 2 = 0,025 y 1 - α / 2 = 0´975 (bilateral)
T (0,025) = 5 y T (0,975) = 14 ! Como (rachas = 9) está dentro del intervalo (entre 5 y 14), se acepta H0. Las
observaciones son independientes.

R. MEDRANO (TUTOR) Página 2


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

HOMOGENEIDAD DE LAS VARIANZAS (TEST DE COCHRAN) !

Este supuesto es el que más va a distorsionar los resultados, en caso de no cumplirse, porque si al
final hay diferencias entre los grupos, no podremos saber si se deben a la variable independiente o a
que ya existían con anterioridad. Supuestos (Modelo equilibrado)

Hipótesis estadísticas:
H0: σ21 = σ22 = σ23 =…… (Las varianzas poblacionales son iguales)
H1: σ21 ≠ σ22 ≠ σ23 ≠……. (Para alguna σ2i)

Estadístico de Contraste ! R = (Varianza Muestral Mayor / ∑ Varianzas Muestrales)

El estadístico de contraste (distribución de valores críticos según la tabla de Cochran)

Valor Crítico: R r,n,α


(r = nº de grupos y n = nº de sujetos por grupo) Zona de Aceptación: R < R r,n,α

Decisión:
Zona de Rechazo: R ≥ R r,n,α Si R < R r,n,α ! Aceptamos Ho
Si R ≥ R r,n,α ! Rechazamos Ho

PROBLEMA EJEMPLO

Con el enunciado del problema utilizado para el test de rachas (Modelo equilibrado):

TURNOS NÚMERO DE CANASTAS ENCESTADAS POR LOS 18 SUJETOS


MAÑANA 15 12 14 10 11 16
TARDE 7 9 12 17 10 12
NOCHE 13 5 20 17 16 18

Sabiendo que se cumple el supuesto de normalidad de las distribuciones, comprobar si las varianzas
son homogéneas ! H0: Las varianzas son iguales // H1: No todas las varianzas son iguales
Para contrastar la homocedasticidad (Test de Cochran) ! R = máx Ŝ2I / Σ Ŝ2I

Ŝ2MAÑANA = (1042 / 6) - 132 = 4,67 Ŝ2TARDE = (807 / 6) – 11,172 = 9,73

Ŝ2NOCHE = (1663 / 6) – 16,52 = 4,92 R = 9,73 / (4,67 + 9,73 + 4,92) = 0,504

Con un nivel de significación α = 0,05, buscamos los valores críticos de las tablas de Cochran ! n = 6
// r (grupos) = 3 // R = 0,7071

Decisión ! Como 0,504 < 0,7071, se acepta H0 (Las varianzas no difieren significativamente)

HOMOGENEIDAD DE LAS VARIANZAS (TEST DE BARTLETT) !

Hipótesis estadísticas ! Similares a las enunciadas en el test de Cochran.

Supuestos ! El test de Bartlett se usa para modelos no equilibrados.

Estadístico de Contraste ! Sigue la distribución Chi-Cuadrado con (r-1) gl (r = nº de grupos)


2 2 2
Valor Crítico: X (r-1)(1-α) Zona de Aceptación: X < X (r-1)(1-α)

Decisión:
2 2 2 2
Zona de Rechazo: X ≥ X (r-1)(1-α) Si X < X (r-1)(1-α) ! Aceptamos Ho
2 2
Si X ≥ X (r-1)(1-α) ! Rechazamos Ho

R. MEDRANO (TUTOR) Página 3


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

PROBLEMA EJEMPLO

Sean tres muestras para probar la homogeneidad de varianzas:

Niños Niñas Adultos


6 9 8 Medias ! 4,67 (Niños) // 7,625 Niñas // 7,33 Adultos
5 8 10
6 8 8 Varianzas Insesgadas !
4 5 3
3 10 7 Ŝ2 NIÑOS = 1 Ŝ2 NIÑAS = 2,55 Ŝ2ADULTOS = 4
5 7 6
4 6 7
4 8 9 Varianza insesgada ponderada ! Σgi Ŝ2 i / g
5 8
2 2 2
Σ = 42 Σ = 61 Σ = 66 (n1 – 1) · Ŝ N + (n2 – 1) · Ŝ N + (n3 – 1) · Ŝ A
2
Σ2 = 204 Σ2 = 483 Σ2 = 516 Ŝ = -----------------------------------------------------------------
n1 = 9 n2 = 8 n3 = 9 (n1 – 1) + (n2 –1) + (n3 – 1)

ESTADÍSTICO DE CONTRASTE !

Con logaritmos decimales (r = grupos)! χ2 R-1 = 2,3026 / C {g log Ŝ2 - Σ gi log Ŝ2 i}

Siendo C = 1 + {1 / 3 (r - 1)} · {(Σ 1 / gi) – 1 / g}


gi = denominador de cada varianza insesgada i (n – 1)
g = suma de todas las gi (Σ gi)

Averiguamos la Varianza Ponderada ! Ŝ2 = Σgi Ŝ2 i / g = 2,515

Ŝ2 = {(9 – 1) · 1 + (8 – 1) · 2,55 + (9 – 1) · 4} / (9 – 1) + (8 – 1) + (9 – 1) = 2,515

Averiguamos C ! 1 + {1 / 3 (3 - 1)} · {(1 / 8 + 1 / 7 + 1 / 8) – 1 / 23} = 1,0291

Aplicamos el estadístico de Contraste !

χ2 r-1 = 2,3026 / {1,0291 · [23 log 2,515 – (8 log 1 + 7 log 2,55 + 8 log 4)]} = 3,45

CONCLUSIÓN ! Distribución χ2 con (r –1= 2) gl y α = 0,05 ! 5,99

DECISIÓN ! Como 5,99 > 3,45 Aceptamos hipótesis nula de homocedasticidad.

R. MEDRANO (TUTOR) Página 4


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

ANOVA (UN FACTOR) !


______________________
ANOVA UNIFACTORIAL ! Influencia de un único factor (variable) en distintos niveles (categorías).
Se utiliza el mismo esquema operativo para el efecto fijo y aleatorio, para el modelo equilibrado y el no
equilibrado.

MODELO "Yij = µ + αij + εij // Cualquier puntuación (Y) tiene tres componentes: (µ) que es la media de
la población. (α) el nivel en que se encuentra, común a todos los componentes adscritos a ese nivel.
(ε) el error experimental o factores no controlados en el experimento (se asume que es una variable
aleatoria distribuida según N (0, σ). Ejemplo ! Y17 = puntuación del sujeto 7º del grupo 1º.

HIPÓTESIS " Efectos fijos (sobre las medias poblacionales) // Efectos aleatorios (sobre las
varianzas ! cuando son = 0, las medias son iguales).

EFECTOS FIJOS ! EFECTOS ALEATORIOS !


2
H0: µ1 = µ2 = µ3 =… = µi H0: σ B = 0
2
H1 : µ1 ≠ µ2 ≠ µ3 ≠ … ≠ µi H1: σ B ≠ 0
al menos para una µi
Cálculo similar

TABLA ANOVA UNIFACTORIAL


FUENTE DE S MAS GRADOS DE MEDIAS ESTADÍSTICO
VARIACIÓN CUADRÁTICAS LIB RTAD CUA RÁTICAS DE CONTRASTE
ENTRE SC INTER I–1 MC INTER
NIVELES Nº de grupos o (SC INTER) / (I – 1) MC INTER
niveles menos 1 F = ---------------
DENTRO DE SC INTRA N–I MC INTRA MC INTRA
LOS NIVELES Nº de sujetos (SC INTRA) / (N – I)
menos Nº de
grupos
TOTAL SC TOTAL N–1 F se distribuye ! F con (I –1) y (N – I)
Nº de sujetos grados de libertad.
menos 1

CÁLCULOS " Se cumple [SC TOTAL = SC INTER + SC INTRA] y G. Libertad: [N – 1 = (I – 1) + (N – I)]

SC TOTAL = Σ Σ Y2 – {(Σ Σ Y)2 / N}


SC INTRA = SC TOTAL - SC INTER
SC INTER = Σ (Σ Y)2 / n – {(Σ Σ Y)2 / N}

DECISIÓN " Rechazamos H0 (igualdad de medias en los distintos niveles) si el valor de la F


experimental (estadístico de contraste) es mayor que el valor F obtenido en las tablas, para un nivel de
significación (α) predeterminado.

El Numerador del estadístico de contraste contiene la Varianza de error + Efecto real de la VI. El
Denominador contiene la Varianza de error. Por tanto, cuanto menor es el efecto real de la VI más se
acerca el cociente a uno.

Valor Crítico: F (I-1) (N-I) (1-α) Zona de Aceptación: F < F ((I-1) (N-I) (1-α)

Decisión:
Zona de Rechazo: F ≥ F (I-1) (N-I) (1-α) Si F < F crítico ! Aceptamos H0
Si F ≥ F crítico ! Rechazamos H0

R. MEDRANO (TUTOR) Página 5


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

Cálculos abreviados (Utilizamos el sistema de notación propuesto por Keppel): El cálculo de las
Sumas de cuadrados se realiza sumando y restando las razones básicas: [Y] (relacionada con las
puntuaciones individuales); [A] con los totales de los niveles y [T] con la suma total.

Estructura de cálculo del numerador ! Se elevan al cuadrado las cantidades implicadas y


posteriormente se suman.
Estructura de cálculo del denominador ! Cualquiera que sea el término se divide por el número de
puntuaciones que contribuyen a su cálculo.

Fórmulas para las razones básicas Sumas Cuadrados a partir de razones básicas

[T] = T2 / (a)(n) ! Diseño equilibrado SCTOTAL = [Y] – [T] ! SCTOTAL


[T] = T2 / N ! Diseño no equilibrado _
SCT = ∑∑ (Y –YTOTAL)2
[A] = ∑A2 / n ! Diseño equilibrado
SCA = [A] – [T] ! SCINTERGRUPO
[A] = (∑A21 / n1) + (∑A22 / n2) + … _ _
(Diseño no equilibrado) SCA = ∑n (YA –YTOTAL)2

[Y] = ∑Y2 SCS | A = [Y] – [A] ! SCINTRAGRUPO

SCS | A = ∑∑ (Y –YA)2

N = Número total de observaciones // n = Observaciones por nivel

PROBLEMA EJEMPLO

Un seleccionador de baloncesto desea averiguar cómo incide la hora del día a la que se entrena en el
rendimiento de los jugadores durante los partidos. Para ello selecciona 18 sujetos y los distribuye
aleatoriamente en turnos de mañana (M), tarde (T) y noche (N); seis en cada turno. Al final de la
temporada el seleccionador los convoca a un torneo y hace el recuento de canastas conseguidas por los
jugadores, obteniendo los siguientes resultados:

TURNOS NÚMERO DE CANASTAS ENCESTADAS POR LOS 18 SUJETOS


MAÑANA 15 12 14 10 11 16
TARDE 7 9 12 17 10 12
NOCHE 13 15 20 17 16 18

2
SUMATORIOS (Σ) Σ Nº DE CASOS MEDIAS
MAÑANA 78 1042 6 13
TARDE 67 807 6 11,17
NOCHE 99 1663 6 16,5
TOTAL 244 3512 18 13,55

Cálculo de las Sumas Cuadráticas:

SC TOTAL = Σ Σ Y2 – {(Σ Σ Y)2 / N} ! 3512 - (244)2 / 18 = 204,45 ! Abreviado: [Y] – [T]

Σ Σ Y2 = según tabla 3512


(Σ Σ Y)2 / N = según tabla 2442 / 18 = 3307,55

SC INTER = Σ (Σ Y)2 / n – {(Σ Σ Y)2 / N} ! 3395,67 - (244)2 / 18 = 88,11 ! Abreviado: [A] – [T]

Σ (Σ Y)2 / n = (782/6) + (672/6) + (992/6) = 3395,67


(Σ Σ Y)2 / N = según tabla 2442 / 18 = 3307,55

SC INTRA = SC TOTAL - SC INTER ! 204,45 - 88,11 = 116,3

R. MEDRANO (TUTOR) Página 6


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

TABLA ANOVA UNIFACTORIAL


FUENTE DE SUMAS GRADOS DE MEDIAS ESTADÍSTICO DE
VARIACIÓN CUADRÁTICAS LIBERTAD CUADRÁTICAS CONTRASTE
ENTRE SC INTER I–1 MC INTER
NIVELES 88,11 3–1=2 88,11 / 2 = 44,05 F = 44,05 / 7,75 =
DENTRO DE SC INTRA N–I MC INTRA 5,68
LOS NIVELES 116,3 18 – 3 = 15 116,3 / 15 = 7,75
TOTAL SC TOTAL N–1 F de Snedecor con (2 y 15) g l. y α = 0,05
204,45 18 – 1 =17 F (Tablas) = 3,68

Decisión ! Comparando los resultados F (tablas) = 3,68 < F (experimental) = 5,68, por tanto
rechazamos la hipótesis nula. Existen diferencias significativas entre el rendimiento de los jugadores
dependiendo de la hora del día a la que entrenan a un nivel de confianza del 95%.

COMPARACIONES MÚLTIPLES (previo rechazo de la H0) "

Permiten obtener información sobre las diferencias entre los distintos tratamientos considerados uno a
uno. El objetivo de las comparaciones múltiples es reducir la cantidad de Error Tipo I (α) que
cometeríamos si se compararan sin más, dos a dos, todas las muestras posibles. Dos tipos:
! Comparaciones planificadas o a priori (no interesan todas las comparaciones, sólo algunas)
! Comparaciones no planificadas, a posteriori o post hoc.
Las que vamos a utilizar se denominan no planificadas, a posteriori o post hoc (se llevan a cabo
cuando se ha realizado el Análisis de Varianza y la F ha sido significativa / hemos rechazado la H0). Las
más importantes ! TUKEY // SECHEFFÉ.

___________
PRUEBA TUKEY (HSD) ! HDS TUKEY = q α, gl, K √ MC error / n

q ! valor crítico en la tabla de rango studentizado. Se averigua considerando el nivel de confianza fijado
(α), los grados de libertad de la MC error y el número de grupos o tratamientos a comparar en el ANOVA.
MC ERROR ! media cuadrática error del Anova (MCINTRA / MCS | A)
n ! tamaño de cada grupo (los modelos han de ser equilibrados). Cuando el modelo no es equilibrado,
se sustituye n por n´ ! n´ = k / (1 / n1) + (1 / n2)...
_ _
Rechazamos H0 cuando (| Yi – Yj | ≥ HDS TUKEY

PRUEBA SCHEFFÉ (CR) ! Permite, además, realizar comparaciones complejas (una media con otras
dos consideradas en conjunto). Los coeficientes c (pesos) ! (2), (- 1) y (-1). Cuando se utiliza en lugar
de Tukey, para comparaciones dos a dos, es menos potente y más conservadora que Tukey, lo que
significa que, en igualdad de condiciones, el valor crítico de Scheffé es ligeramente superior al de
Tukey, por lo que resulta más difícil rechazar la hipótesis nula de la igualdad de medias.
_________________ ___________________
CR SCHEFFÉ = √ (k - 1) F (k - 1), gl ERROR √ MC ERROR [Σ (c2j / nj)]

k ! Número de grupos
ni = número de sujetos de cada grupo.
F (k - 1), gl ERROR ! F experimental del ANOVA.
MC ERROR ! Media cuadrática error.
c2j ! Coeficiente de las combinaciones lineales (en cada combinación la suma de coeficientes = 0)
_ _ _
φ1 = 2 ·Y1 – (Y2 + Y3) ! Entonces: c1 = 2, c2 = (-1), c3 = (-1) ! Dado que (∑cj = 0)

Para hallar los cj, se debe tener en cuenta que siempre deben sumar 0. Es más fácil calcular primero
los cj de los que se combinan conjuntamente, que siempre serán negativos, y luego el del que se
compara frente a todos, que será la suma de los otros, pero con signo positivo.
Decisión:
Si φ1 ≥ CR ! Existen diferencias significativas entre el nivel y los otros tomados conjuntamente.
Si φ1 < CR ! No existen diferencias significativas entre el nivel y los otros tomados conjuntamente

R. MEDRANO (TUTOR) Página 7


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

PROBLEMAS EJEMPLO !

Siguiendo con nuestro planteamiento anterior:


_________
Prueba Tukey (HSD) ! HDS TUKEY = q α, gl, K √ MC error / n
_ _ _
n = 6 // k = 3 // XMAÑANA = 13 // XTARDE = 11,17 // XNOCHE = 16,5

Valor q para α = 0,05; 15 grados de libertad y tres grupos ! 3,67 MCINTRA ! 7,75
_______
HDS TUKEY = 3,67 √ 7,75 / 6 = 4,17 (modelo equilibrado)

| 13 - 11,17 | = 1,83 < 4,17 Diferencia no significativa.


| 13 - 16,5 | = 3,5 < 4,17 Diferencia no significativa.
| 11,17 - 16,5 | = 5,33 > 4,17 Diferencia significativa.

Decisión ! Existen diferencias significativas entre entrenar por la tarde y por la noche, siendo el mejor
rendimiento por la noche (media más alta)

Prueba Scheffé (CR) ! Comparación entre la media del turno de noche con las de mañana y tarde
consideradas conjuntamente.
__________________ __________________
CR SCHEFFÉ = √ (k - 1) F (k - 1), gl ERROR √ MC ERRROR [Σ (c2j / nj)

Valor F para α = 0,05 // 2 y 15 grados de libertad ! 3,68 MCINTRA ! 7,75


__________ ________________________
CR SCHEFFÉ = √ (3-1) · 3,68 √ (7,75) · (22 / 6 + 12 / 6 + 12 /6) = 6,15

Coeficientes c (pesos) ! (2), (- 1) y (-1) ψ ! | (2 · 16,5) + (- 1 · 11,17) + (- 1 · 13) | = 8,83

Decisión ! Como 8,83 > 6,15 ! Rechazamos H0 (existen diferencias significativas entre el turno de
noche y los de mañana y tarde considerados conjuntamente.

MODELOS NO PARAMÉTRICOS PARA MUESTRAS INDEPENDIENTES:


Se utilizan como alternativa al ANOVA cuando no se cumplen los supuestos ya indicados. Tienen
menos restricciones y también una potencia menor.
TEST DE KRUSKAL - WALLIS " Es una ampliación del test de Mann-Whitney.
Supuestos: VD es una variable continua que se transforma en una escala ordinal (que disminuye el
impacto de los valores extremos); la distribución poblacional puede ser de cualquier tipo (las varianzas
deben ser homogéneas); se trata de k muestras aleatorias e independientes que queremos comparar.

HIPÓTESIS ! H0: ŋ1 = ŋ2 =… = ŋK
H1: ŋ1 ≠ ŋ2 ≠… ≠ ŋK Al menos para una ŋ

ESTADÍSTICO DE CONTRASTE ! H = {12 / N (N + 1)} · {Σ (R2 / n} – 3 (N + 1)


N = número total de observaciones; n = número de observaciones de cada muestra
R2 = suma de rangos de cada muestra, previa ordenación única.
El estadístico de contraste sigue la distribución X2 con (k-1) gl

Cálculo: Se ordenan todas las puntuaciones en una sola serie, (es decir, tomándolas todas en cuenta),
asignamos rangos de 1 a n, dando a la puntuación menor el rango 1. En caso de empate ! (rango
medio); es decir, asignándoles la media aritmética de los rangos que les hubieran correspondido de ser
distintas.

Decisión: Cuando se rechaza la H0, se procede a realizar comparaciones múltiples (tratamientos entre
los que se producen las diferencias)

R. MEDRANO (TUTOR) Página 8


DISEÑOS INVESTIGACIÓN Y ANADATOS ORIENTACIONES TEMA Nº 5 (DISEÑOS MÁS DE 2 GRUPOS INDEPENDIENTES / 1 FACTOR)

_________________
Diferencia mínima crítica ! MVKV = Z adj √ N(N+1) /12 · (∑1/ai)

Siendo Z adj el percentil 1 – (α / 2c) de la distribución normal tipificada. (c) es el nº de comparaciones a


realizar en un contraste bilateral [en uno unilateral ! Z adj = 1 – (α / c)]
_ _
Para comparar las diferencias de rangos ! │Ri - Rj│ > MVKW

PROBLEMA EJEMPLO

En un estudio sobre antojo por el chocolate varios autores querían determinar si la distribución
poblacional del consumo de chocolate en una semana era igual en una muestra de niños (N), que en una
muestra de mujeres adultas (MA) y que en una de hombres adultos (HA). Para ello se seleccionaron
aleatoriamente 5 sujetos de cada grupo y se midió su consumo de chocolate contabilizando (según se
recoge en la tabla) el número de alimentos con chocolate consumidos en una semana (C):

NIÑOS MUJERES ADULTAS HOMBRES ADULTOS


N RANGO N RANGO N RANGO
6 1 31 13,5 13 7
11 4,5 7 2 32 15
12 6 9 3 31 13,5
20 9 11 4,5 30 12
24 10 16 8 28 11

= 30,5 / 5 = 6´1
Rango Medio Rango Medio =
31 / 5 = 6´2 Rango Medio =
58,5 / 5 = 11´7
2 2 2
Σ RANGOS = 930,25 Σ RANGOS = 961 Σ RANGOS = 3422,25
2 2 2
Σ R / 5 = 186,05 Σ R / 5 = 192,20 Σ R / 5 = 684,45

Asumiendo que la distribución de consumo es continua y α = 0,10. Se trata de tres muestras


independientes y los datos están medidos en una escala de razón.

Hipótesis !
H0: No existen diferencias poblacionales en el consumo semanal de chocolate entre N, MA y HA.
H1: Existen diferencias poblacionales en el consumo semanal de chocolate entre, al menos dos grupos.

Estadístico de Contraste ! Kruskal – Wallis H = {12 / N (N + 1)} · {Σ (R2 / n} – 3 (N + 1)

H = {12 / 15 (15 + 1)} · {186,05 + 192,20 + 684,5} – 3 (15 + 1) = 5,135

El estadístico de contraste sigue la distribución X2 con (3-1) gl y α = 0,10 ! X22; 090 = 4´61

Decisión ! Como 5,135 > 4,61 Se Rechaza la Hipótesis Nula (Comparaciones múltiples ! Las tres
muestras son equilibradas)
_________________ _______________
MVKV = Z adj √ N(N+1) /12 · (∑1/ni) ! MVKV = 2´13 √ 15(16) /12 · (1/5) ! MVKV = 4´26

Donde Z adj ! [1 – (α / 2c)] ! [1 – (0´10/ 6)] = 0´9834 (Z = 2´13) (c = 3 comparaciones)


_ _
| RMA – RN | = | 6´2 – 6´1 | = 0,1 < 4´26 Diferencia no significativa
_ _
| RMA – RHA | = | 6´2 – 11´7 | = 5´5 > 4´26 Diferencia significativa
_ _
| RN – RHA | = | 6´1 – 11´7 | = 5´6 > 4´26 Diferencia significativa

Interpretación del resultado en el contexto de la investigación ! Existen diferencias significativas en


el consumo semanal de chocolate entre N, MA y HA a un nivel de confianza del 90 % considerado
globalmente. Analizando los resultados, las diferencias se dan entre N y MA con HA.

R. MEDRANO (TUTOR) Página 9


DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

TEMA 1: INTRODUCCIÓN AL ANÁLISIS INFERENCIAL Y AL CONTRASTE DE HIPÓTESIS EN LOS


DISEÑOS DE INVESTIGACIÓN.

1. Si un estimador, no coincide, en promedio, con el parámetro que intenta estimar y además su


distribución tiene poca variabilidad:
a) Decimos que es un estimador eficiente
b) Decimos que es un estimador suficiente
c) Decimos que es un estimador insesgado.

2. La varianza muestral es:


a) Un estimador consistente de la varianza poblacional.
b) Un estimador sesgado de la varianza poblacional.
c) Ambas respuestas son correctas.

3. La eficiencia relativa:
a) Es un valor entre O y 1.
b) Es un cociente entre dos varianzas
c) Ambas respuestas son correctas.

4. La varianza insesgada es:


a) Un estimador insesgado de la varianza muestral.
b) La varianza muestral multiplicada por n y dividida por n-1.
c) La varianza muestral multiplicada por n-1 y dividida por n

5. La desviación típica de la distribución muestral de un estadístico es:


a) Una medida de variabilidad.
b) El error típico de ese estadístico.
c) Ambas alternativas son correctas.

6. Si la varianza muestral (sesgada) vale 100, el estimador insesgado de la varianza poblacional:


a) Es mayor que 100
b) Es menor que 100
c) Es igual a 100.

7. Si la esperanza de un estimador no es igual al parámetro:


a) El sesgo no es nulo
b) El sesgo es nulo
c) El estimador es insesgado.

8. La eficiencia de un estimador es una medida de variabilidad:


a) De ese estimador.
b) Del parámetro.
c) Que puede ser negativa.

9. La distribución de frecuencias de una característica en la población viene definida por su media


y su:
a) Forma
b) Error muestral
c) Varianza.

1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

10. Un estimador es insesgado:


a) Si la media de la distribución muestral del estimador es igual al parámetro.
b) Si la esperanza del estimador es igual al parámetro.
c) Ambas respuestas son correctas.

11. ¿Cuál de estos estimadores es suficiente para m?


a) 1/(n-2) (Y1+.....+Yn)
b) 1/n (Y1+.......+Yn)
c) 1/(n-1) (Y1+......+Yn)

12. El error típico de la varianza es:


a) La desviación típica de la distribución muestral de la varianza.
b) La varianza de la distribución muestral de la desviación típica.
c) La varianza de la distribución muestral de la varianza.

13. E(P) = p por lo que la proporción de la muestra P:


a) Es un estimador insesgado de la proporción poblacional
b) Es un estimador sesgado de la proporción poblacional
c) No es un buen estimador de la proporción poblacional

14. Cuando la distribución muestral de un estimador Ô1 es menos variable que la de otro


estimador Ô2, diremos que:
a) Ô1 es más consistente que Ô2
b) Ô1 es más eficiente que Ô2
c) Ô1 es menos eficiente que Ô2

15. Un estimador es suficiente:


a) Si utiliza toda la información de la muestra para estimar el parámetro.
b) Si a medida que se dispone de más información, aumenta la probabilidad de que la
estimación coincida con el parámetro.
c) Cuando no sobre ni subestima al parámetro correspondiente.

16. El sesgo del estimador es:


a) El error típico de la media
b) El error máximo del intervalo de confianza
c) La diferencia entre la media de la distribución muestral del estimador y el parámetro.
17. El error típico de la media es:
a) La raíz cuadrada de la varianza de la distribución muestral de la media
b) La raíz cuadrada de la varianza de la población
c) Puede ser negativo.

18. Si la eficiencia relativa de un estimador, Ô1 respecto a otro estimador, Ô2 es del 85%, para un
mismo tamaño muestral:
a) El cociente entre sus respectivas varianzas poblacionales es 0,85
b) El cociente entre sus medias es 0,85
c) El cociente entre las varianzas de las distribuciones muestrales de los respectivos
estimadores es 0,85
19. En la estimación puntual:
a) Se establece un rango de valores dentro del cual estaría el valor del parámetro
b) Se toma un valor muestral concreto como estimación del parámetro
c) Se establece un intervalo confidencial.
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

20. Un estimador es más eficiente:


a) Cuanto mayor sea la varianza de la distribución muestral del estimador.
b) Cuanto menos varíe el valor del estimador de una muestra a otra
c) Ambas alternativas son incorrectas
21. ¿Cuál es la varianza de la distribución muestral del estimador 1 si sabemos que la eficiencia
relativa de él y otro estimador 2 es de 0,89 y la varianza de 2 35?:
a) 30
b) 21,5
c) 31,5

22. El intervalo de confianza:


a) Es más pequeño cuanto menor es el nivel de confianza, para los mismos datos.
b) Es más pequeño cuanto mayor es el nivel de confianza, para los mismos datos.
c) No tiene nada que ver con el nivel de confianza.

23. Cuando se rechaza Ho mediante el nivel crítico p:


a) Necesariamente se rechazará con el valor crítico.
b) No se rechazará necesariamente con el valor crítico.
c) Implica que p>a

24. El estadístico de contraste Z para una media vale -2,15, siendo alfa igual a 0,05, n= 145 y el
contraste bilateral.
a) Los valores críticos son -1,64 y 1,64
b) Se rechaza Ho
c) Se acepta Ho

25. El rechazo de H1 implica necesariamente que:


a) p < a
b) p < a
c) El valor muestral del estadístico de contraste cae en la zona de aceptación de Ho

26. A la zona de rechazo de la hipótesis nula se suele llamar:


a) Región m
b) Región crítica
c) Región b

27. Cuando ponemos a prueba una hipótesis, el método que se utiliza para tomar una decisión
entre la hipótesis nula (Ho) y la hipótesis alternativa (H1) es:
a) La prueba de significación.
b) El intervalo de confianza para una media
c) El contraste de hipótesis.
28. El nivel crítico p:
a) Es siempre un valor muy pequeño
b) Para su cálculo se tiene en cuenta la dirección del contraste (unilateral/bilateral)
c) Se fija en la planificación del estudio.

29. Elija la alternativa correcta:


a) La potencia puede valer más que 1
b) El nivel crítico p es un valor entre 0 y 1

3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

c) El nivel de significación puede ser negativo


30. Los intervalos de confianza:
a) Formalmente son un método de estimación de parámetros
b) No pueden utilizarse para contrastar hipótesis.
c) Se calculan de la misma manera que la región de aceptación de un contraste de
hipótesis.

31. En los contrastes de hipótesis.


a) Si el valor obtenido al aplicar el estadístico de contraste cae dentro de la región de
rechazo es posible aceptar la Ho
b) La región crítica es la región de rechazo de H1
c) Si el valor obtenido al aplicar el estadístico de contraste cae dentro de la región de
aceptación, podemos rechazar la hipótesis alternativa.

32. La hipótesis nula:


a) Es una hipótesis estadística
b) Puede ser igual a la hipótesis alternativa
c) Ambas alternativas son incorrectas.

33. La desviación típica de la distribución muestral de un estadístico se llama:


a) Error típico
b) Valor crítico
c) Nivel crítico.

34. Sobre el nivel de significación alfa de un contraste estadístico:


a) Se fija antes de analizar los datos
b) Si es menor que el nivel crítico p, el resultado del contraste es estadísticamente
significativo.
c) No es una probabilidad.

35. El nivel crítico p y el nivel de significación alfa:


a) Son probabilidades
b) Su comparación permite decidir si se rechaza o no la hipótesis nula
c) Ambas alternativas son correctas.

36. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la muestra:
a) Mayor es la precisión del intervalo
b) Menor es la precisión de nuestra estimación
c) Mayor es la amplitud del intervalo.

37. Cuando construimos un intervalo de confianza para la media, manteniendo constantes los
demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n.c.) del 95% en lugar del
99%.
a) Ganamos en precisión porque el intervalo es más preciso
b) Aumenta la probabilidad de cometer error tipo I.
c) Perdemos en precisión porque el intervalo es más grande.

38. Una estimación por intervalos:


a) Toma un valor muestral concreto como estimación del parámetro.
b) Depende de cuatro parámetros: una estimación puntual del parámetro, una medida de
variabilidad, una probabilidad y un supuesto distribucional de la muestra.
c) Establece un rango de valores dentro del cual se estima esté el valor del parámetro.
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

39. Beta de un contraste estadístico:


a) Es igual a la potencia.
b) Es una probabilidad.
c) Es deseable que sea un valor alto.

40. La hipótesis nula: “la varianza del grupo 1 es mayor o igual que la varianza del grupo 2”,
se refiere a un contraste:
a) Bilateral.
b) Unilateral derecho
c) Unilateral izquierdo.

41. Con n = 50, la probabilidad del error tipo II es igual a 0,30. Con un n = 40 y manteniendo
constantes los demás factores:
a) 1-beta será 0,70
b) Beta será superior a 0,30
c) Beta será inferior a 0,30

42. El valor crítico :


a) Cambia según el valor muestral del estadístico.
b) Es función de alfa
c) Se obtiene a partir del nivel crítico p.

43. El nivel crítico p:


a) Representa la probabilidad de obtener un resultado significativo
b) Su valor depende del valor muestral del estadístico
c) Su valor es función directa de la potencia del contraste.

44. La probabilidad de error tipo II representa:


a) La probabilidad de rechazar la hipótesis nula siendo verdadera
b) La probabilidad de aceptar la hipótesis nula siendo verdadera
c) La probabilidad de aceptar la hipótesis nula siendo falsa.

45. Cuanto mayor es la probabilidad del error tipo II, manteniendo constantes los demás factores:
a) Menor es el nivel de significación
b) Mayor es la potencia estadística
c) Mayor es la probabilidad de error tipo I

46. La probabilidad de error tipo I representa:


a) La probabilidad de rechazar la hipótesis nula siendo verdadera
b) La probabilidad de aceptar la hipótesis nula siendo verdadera
c) La probabilidad de aceptar la hipótesis nula siendo falsa.

47. El contraste de hipótesis tiene como finalidad:


a) Obtener información sobre algún aspecto de la población de la que se extrajo la
muestra
b) Comprobar si la muestra es lo suficientemente adecuada para investigar.
c) Decidir si en la población se representa adecuadamente la variable de interés.

48. Que dos hipótesis sean mutuamente excluyentes significa que:


a) Son contradictorias
b) El rechazo de una de ellas supone el rechazo de la otra
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

c) El rechazo de una de ellas implica necesariamente la aceptación de la otra


49. La idea general del contraste de hipótesis es hallar:
a) La probabilidad asociada al valor muestral del estadístico.
b) La probabilidad asociada al parámetro
c) El valor del parámetro.

50. Una hipótesis alternativa del tipo µ<µ0 plantea un contraste:


a) Unilateral izquierdo
b) Bilateral
c) Unilateral derecho

51. El nivel de significación (α):


a) Equivale a la probabilidad del error tipo II
b) Se fija de forma arbitraria en la planificación de la investigación
c) Es consecuencia del resultado muestral

52. Sobre el nivel crítico p:


a) Para su cálculo se necesita conocer el valor que toma el nivel de significación alfa
b) Puede ser menor que uno
c) Puede ser mayor que uno

53. Cuando construimos un intervalo de confianza para la media, manteniendo constantes los
demás factores, ¿qué ocurre si adoptamos un nivel de confianza (n. c.) del 99% en lugar del
95%?:
a) Con un n.c. del 99% la probabilidad de α será menor y menor la probabilidad de
cometer error tipo I.
b) Con un n.c. del 99% aumentaría la probabilidad asociada a dicho intervalo
c) Con un n.c. del 99% perderíamos en precisión

54. Si obtenemos un nivel crítico p mayor que el alfa adoptado quiere decir que:
a) Los resultados son improbables bajo el supuesto de que H0 sea cierta
b) Los resultados son estadísticamente significativos
c) Los resultados no son estadísticamente significativos.
55. Sobre alfa y el nivel crítico p:
a) Ambos tienen valores constantes
b) Si sus valores son iguales se rechaza la hipótesis nula
c) Ambos se fijan antes de obtener los datos de la muestra.
56. En general, dado un mismo nivel de confianza, cuanto mayor es el tamaño de la muestra:
a) Mayor es la precisión del intervalo
b) Menor es la precisión de nuestra estimación
c) Ambas respuestas son incorrectas.
57. La distribución muestral de la media es normal:
a) Cuando es normal la distribución de la variable estudiada o cuando tiende a la
normalidad a medida que aumenta el tamaño de la muestra
b) Sólo cuando es normal la distribución de la variable estudiada.
c) Sólo cuando el tamaño de la muestra es el adecuado.

58. El error típico de la distribución muestral del estadístico varianza es:


a) La desviación típica de la distribución muestral de la varianza
b) La varianza de la distribución muestral de la desviación típica.

6
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

c) La varianza de la distribución muestral de la varianza.


59. Sabemos que la variable rendimiento académico se distribuye normalmente en la población
de estudiantes de Bachillerato en España, pero no conocemos el valor de la varianza de tal
variable. Un investigador quiere saber entre qué límites se encuentra la media del
rendimiento académico en la población. Toma una muestra aleatoria e independiente de 400
estudiantes y obtiene una media de 20 siendo la varianza insesgada de 4. ¿Cuál de las
siguientes alternativas expresa el valor aproximado, del límite inferior del intervalo de
confianza para α = 0,05?
a) 19,8
b) 18,2
c) 16,08

60. Hemos extraído una muestra aleatoria de 49 sujetos y le hemos medido el pulso en reposo,
obteniendo una media igual a 60 pulsaciones por minuto. Sabemos que las pulsaciones forman
una escala de intervalo y se distribuyen normalmente con varianza poblacional igual a 16.
Tomamos un n.c. del 99%. ¿cuál será el error máximo (Emáx) aproximado en el cálculo del
intervalo de confianza para µ?
a) 1,33
b) 1,47
c) 1,12

61. Se considera que hemos obtenido un resultado estadísticamente significativo cuando:


a) Cuando se acepta H1
b) Sólo cuando se acepta H0
c) Cuando la probabilidad asociada al estadístico de contraste (p) es mayor que el nivel de
significación (α)
62. En el contraste de hipótesis para la varianza tratamos de:
a) Probar si nuestros datos concretos han podido ser obtenidos de una población con esa
varianza.
b) Saber el valor de la varianza para nuestros datos concretos
c) Hallar el valor exacto de la varianza poblacional.
63. En el contraste de hipótesis, la elección de:
a) µ0, µ1, α, β, σ2 y n son arbitrarias.
b) µ0, µ1, α, β es arbitraria mientras que la σ2 y n no lo son.
c) µ0, µ1, α, β, σ2 y n no son arbitrarias.
64. La distribución muestral de un estadístico permite inferir:
a) Un parámetro
b) Un estadístico
c) Ambos

65. Cuando calculamos el intervalo de confianza para la proporción, en el caso de una muestra,
nuestro objetivo es determinar:
a) Los valores que limitan el valor del parámetro proporción que cumplen la característica
en estudio, a un nivel de confianza determinado.
b) Si la variable, antes de ser dicotomizada, se distribuía según la distribución normal.
7
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

c) El valor exacto del parámetro, con un nivel de significación determinado.


66. Hemos extraído una muestra aleatoria de 36 sujetos y les hemos medido el tiempo de reacción
a un estímulo visual, obteniendo una media igual a 50 milisegundos. La varianza poblacional
de la distribución de los tiempos de reacción es igual a 9. Sabiendo esto, cuál será el intervalo
de confianza del 95% en torno a la media poblacional:
a) 49,02 < μ < 50,98
b) 32,03 < μ < 40,54
c) 60,02 < μ < 70,33

67. Hemos aplicado un cuestionario de ansiedad a una muestra de 16 deportistas antes de una
competición y obtuvimos una puntuación media en ansiedad iguala 5. Las puntuaciones en el
cuestionario de ansiedad forman una escala de intervalo y se distribuyen normalmente con
varianza igual a 4. ¿Entre qué valores esperamos se encuentre la media poblacional de la
ansiedad precompetitiva, a un nivel de confianza del 95%?.:
a) 3,71 < μ < 6,29
b) 4,02 < μ < 5,98
c) 6,51 < μ < 7,63

68. Atendiendo a los datos del problema anterior, entre qué valores esperamos se encuentre la
media poblacional de la ansiedad precompetitiva, a un nivel de confianza del 99%:
a) 3,71 < μ < 6,29
b) 4,02 < μ < 5,98
c) 6,51 < μ < 7,63

69. Hemos estimado en una muestra de 16 españoles, la media del grado de acuerdo sobre la
legalización del aborto obteniendo Ȳ = 8. El grado de acuerdo sobre la legalización del aborto
es una variable medida a nivel de intervalo que se distribuye normalmente en la población
con σ2 = 36. Asumiendo un nivel de confianza del 95%, qué tamaño debe tener la muestra
para que la media no se aleje más de ± 1 punto de la media poblacional:
a) 139
b) 147
c) 154

70. Con los datos del problema anterior, sin tener en cuenta que conocemos la varianza
poblacional, sino que conocemos desviación típica y la media del grado de acuerdo sobre la
legalización del aborto, Ȳ = 8 y S = 5. Queremos saber, a un nivel de confianza del 99% qué
tamaño debe tener la muestra para que la media estimada no se aleje más de ± 3 puntos de la
media poblacional:
a) 23
b) 26
c) 20
8
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA 1

71. En una investigación sobre ansiedad, contrastamos la hipótesis nula de que la media
poblacional e igual o mayor que 10. i sabemos que el valor muestral del estad stico de
contraste z = 2,88 y el nivel crítico, p= 0,002, ¿qué significa esta p?:
a) Que la probabilidad de obtener un estadístico de contraste igual o menor que el hallado
es 0,002.
b) Que la probabilidad de aceptar H0 siendo falsa es 0,002
c) Es el error tipo II.

72. Teniendo en cuenta los datos del problema anterior y adoptando un α= 0,01:
a) Se rechaza H0, puesto que p < α
b) Se acepta H0 , puesto que p < α
c) Ninguna de las dos opciones es válida.

9
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

TEMA 2: CONTRASTE DE HIPÓTESIS EN LOS CONTRASTES DE UNA MUESTRA.

1. La potencia:
a) Es igual a β
b) Es deseable que no sea inferior a 0,80
c) Es deseable que sea muy baja

2. Con n = 40, la potencia es igual a 0,70. Con un n = 60 y manteniendo constantes los demás
factores:
a) La probabilidad del error tipo II será 0,30
b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor que 0,70
c) La potencia será inferior a 0,70

3. El estadístico de contraste Z para una media vale 3, siendo alfa igual a 0,05, n = 120, y el
contraste bilateral:
a) Los valores críticos son -2,33 y 2,33
b) Se acepta H0
c) Se rechaza H0

4. En los contrastes de hipótesis referidos a una muestra, cuando el interés del investigador se
centra en el parámetro media, lo que se prueba es:
a) Si nuestros datos concretos han sido obtenidos de una población con esa media
b) Si la media obtenida para la muestra presenta un valor determinado
c) Si la media obtenida para la muestra es un estimador correcto dado el tamaño de la
muestra utilizada.

5. Con n = 30, la potencia es igual a 0,60. Con un n = 40 y manteniendo constantes los demás
factores:
a) La probabilidad del error tipo II será mayor que 0,60
b) La probabilidad de rechazar la hipótesis nula siendo falsa será mayor que 0,60
c) La potencia será inferior a 0,60

6. En la potencia del contraste de hipótesis, la relación de α y n:


a) Es inversa con β
b) Es directa con la media poblacional
c) Es directa con β

7. Para realizar el contraste de hipótesis sobre la proporción, utilizamos el estadístico P que se


calcula con:
a) Datos dicotómicos.
b) Variables continuas.
c) Variables a un nivel de medida de razón.

8. En el contraste de hipótesis para la varianza, la variable aleatoria cuyo parámetro σ20


pretendemos contrastar, sigue un función de densidad de probabilidad:
a) T
b) Binomial
c) Normal.

1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

9. Un contraste de varianza permite comprobar si los datos de la muestra proceden de una


población con varianza igual a la estipulada en H0:
a) No
b) Sí
c) Sólo si g.l. > 100

10. Un contraste de una media permite comprobar si los datos de la muestra proceden de una
población con media igual a la estipulada en la hipótesis nula:
a) Sí
b) No
c) Sólo si n es pequeño

11. Cuál de las siguientes afirmaciones es correcta:


a) En el caso de un contraste de hipótesis para la varianza (una sola muestra), no tiene
sentido considerar la situación de la varianza conocida.
b) En el caso de una sola muestra y si se conoce la varianza de la población el estadístico
de contraste para la varianza es Z.
c) En el caso de una sola muestra y tanto si se conoce la varianza de la población como si
se desconoce este dato, el estadístico de contraste para la varianza es X2

12. Las condiciones para poder aplicar el estadístico de contraste Z en el caso de la proporción
(una sola muestra) incluyen:
a) Muestra aleatoria de n observaciones y población dicotómica.
b) Variable dependiente medida a nivel ordinal, al menos y se trata de muestras
independientes
c) Variable dependiente dicotómica (o dicotomizada) y se trata de muestras
independientes.

13. Tenemos una población normal con varianza conocida. Se toma de ella una muestra de
tamaño n = 15. Para estimar el valor del parámetro media poblacional µ, utilizaremos un
estadístico de contraste cuya distribución es:
a) Normal (N(0,1))
b) T de Student
c) F de Snedecor
14. La distribución muestral de un estadístico de contraste es la distribución T de Student con n –
1 g. L. Y el contraste es unilateral derecho. Para un valor muestral igual a 1,33 y 17 grados de
libertad, el nivel crítico p es:
a) 0,10
b) 0,90
c) Ambas respuestas son incorrectas.

15. La prueba de Wilcoxon para una muestra:


a) Sólo tiene en cuenta si nuestros valores están por encima o por debajo del valor de la
mediana que queremos contrastar en la Ho
b) También conocida como prueba de rangos y signos.
c) Establece supuestos menos exigentes que el test de signos.
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

16. La prueba de Wilcoxon frente a la de signos:


a) Gana en precisión ya que aprovecha mejor la información disponible.
b) Establece algunos supuestos menos exigentes.
c) No tiene en cuenta en su aplicación si las diferencias entre cada valor y la mediana
propuesta bajo Ho son más grandes o más pequeñas.

17. Aplicamos el estadístico de contraste W de Wilcoxon (para una muestra) y obtenemos t+ =


101 y t- =19, siendo α = 0,05, n= 15 y el contraste bilateral:
a) Los valores críticos son - 1,96 y 1,96
b) Se rechaza H0
c) Se acepta H0

18. Cuando en el cálculo del estadístico de contraste de Mann-Whitney-Wilcoxon se observan


empates:
a) En la ordenación conjunta de las puntuaciones, a los valores empatados se les asigna la
media de sus órdenes.
b) No puede aplicarse este estadístico de contraste.
c) En la ordenación conjunta de las puntuaciones, a los valores empatados se les asigna
los límites inferior y superior del intervalo de confianza.

19. Las condiciones para poder aplicar el estadístico de contraste S (signos) en el caso de una sola
muestra:
a) Muestra aleatoria de n observaciones y distribución normal.
b) Muestra aleatoria de n observaciones y distribución binomial.
c) Muestra aleatoria de n observaciones y cualquier tipo de distribución.

20. El estadístico S se aproxima a una distribución normal:


a) Cuando tenemos un n mayor o igual que 20
b) Cuando tenemos un n mayor o igual que 10
c) Siempre.

21. El estadístico S normalmente sigue una distribución:


a) Normal
b) Poisson
c) Binomial.

22. Para probar hipótesis relativas a la mediana, cuando se cumple la aleatoriedad de las
observaciones, la distribución de la variable es simétrica en la población y el nivel de medida
de intervalos, aplicaremos la prueba de:
a) Wilcoxon antes que la de signos porque aporta más información.
b) Signos antes que la de Wilcoxon ya que aporta la misma información y la segunda es
más restrictiva.
c) Wilcoxon o la de signos indistintamente ya que arroja resultados iguales.

23. Para contrastar hipótesis sobre la mediana, si queremos utilizar la prueba de Wilcoxon, es
necesario que el nivel de medida de los datos sea, al menos:
a) Nominal
b) Ordinal
c) De intervalo

3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

24. La depresión es una variable medida a nivel de intervalo que se distribuye normalmente en la
población con varianza conocida. Para una muestra n = 16, ¿qué valor toma la probabilidad del
error tipo II si al contrastar H0: μ = 5 frente a H1: μ = 7, vale 0,70 la probabilidad de
rechazar la hipótesis nula siendo falsa?:
a) 0,30
b) 0,40
c) 0,70

25. Sabemos por trabajos anteriores que un antidepresivo tiene una tolerancia media, sobre los
pacientes que lo toman, de 1,5 según algún índice de tolerancia (cuanto mayor es el índice
mayor es la tolerancia) y una varianza igual a 1. Pensamos que modificando la fórmula
química del antidepresivo podríamos incrementar la tolerancia a este medicamento sin que se
modifique su propiedad antidepresiva. El grado de tolerancia al antidepresivo es una variable
medida a nivel de razón que se distribuye normalmente en la población. Para un n = 25, ¿cuál
es la probabilidad de obtener un resultado significativo, si hipotetizamos una diferencia de +
0,5 entre la media bajo la hipótesis alternativa y aquélla bajo la hipótesis nula (μ1 – μ0 =
0,5) teniendo en cuenta un α = 0,01?:
a) 0,63
b) 0,48
c) 0,56

26. En algunas investigaciones sobre conformismo social, los madrileños fueron calificados de
conformistas. Un investigador basándose en sus propios estudios, opina que los madrileños no
son conformistas, hipotetizando un puntuación inferior a 5 en una escala de conformismo
social que va de 0 a 10, lo cual indicaría inconformismo. Sabiendo que las puntuaciones en
conformismo social forman una escala de intervalo y se distribuyen normalmente en la
población con varianza igual a 1, ¿cuál será la potencia del contraste para H1 : μ = 4,
manteniendo constantes los demás factores?: α = 0,05 y n = 25
a) 0,8763
b) 0,9213
c) 0,9996

27. En una distribución muestral normal (del estadístico media), con una media de 30 y una
desviación típica de 16, ¿qué probabilidad hay de obtener al azar una media comprendida
entre 14 y 26?:
a) 0,7836
b) 0,6826
c) 0,5763

28. En una muestra aleatoria de 101 sujetos, procedentes de una población normal e infinita, se ha
obtenido una media igual a 40 y una desviación típica igual a 15. ¿Qué porcentaje de medias
hay comprendido entre los valores t picos = 2,4 y = 1,5 de la distribución muestral de
la media?:
a) 92,5%
b) 95,3%
c) 91,4%
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

29. Se ha realizado la distribución muestral de la media con 225 muestras, de 90 sujetos cada una,
y se ha comprobado que es normal. En la población, el valor de la media es de 45 (μ = 45) y el
de la desviación típica de 15 (σ = 15). Cuál será el valor típico (puntuación típica) que, llevado a
ambos lados de la media, comprende el 90% de los casos de esa distribución muestral?:
a) ± 1,54
b) ± 1,65
c) ± 1,78

30. Teniendo en cuenta los datos del problema anterior, qué media de esa distribución muestral
dejará por debajo de sí el 90% de los casos:
a) 47,02
b) 53,01
c) 42,37

31. A una muestra aleatoria de 17 estudiantes de secundaria se les aplicó una prueba cuya
finalidad era medir sus conocimientos sobre conceptos científicos básicos. En la variable
analizada, los estudiantes se distribuyen normalmente con una media igual a 78. Los
resultados del estudio en la muestra fueron: media igual a 84,984 y desviación típica igual
a 16. El intervalo de confianza de la distribución muestral será: α = 0,05
a) ± 2,12
b) ± 1,98
c) ± 2,72

32. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste será:
a) Z = 1,893
b) t = 1,746
c) χ2 = 1,572

33. con los datos de los dos problemas anteriores, el criterio de decisión será:
a) A ese nivel de confianza no podemos aceptar la hipótesis nula.
b) Como el valor del estadístico de contraste no se encuentra en el intervalo confidencial,
rechazamos H0.
c) Para un n. c. del 0,95 no podemos aceptar la H1.

34. Una muestra aleatoria de 30 personas presenta una desviación típica, en la variable “tiempo de
ejecución” de una tarea de reconocimiento de palabras, igual a 120 segundos. Queremos saber
si es compatible este resultado, a un nivel de confianza de 99% con el supuesto de que la
desviación típica en la población (para esta variable), con una distribución normal, es de 150
segundos. Teniendo esto en cuenta, el planteamiento de las hipótesis sería:
a) H0 : μ = 150 y H1 : μ ≠ 150
b) H0 : σ2 = 1502 y H1 : σ2≠ 1502
c) H0 : μ < 1502 y H1 : μ > 1502

35. Con los datos del problema anterior, el estadístico de contraste será:
a) χ2 = 19,2
b) Z = 17,3
c) t = 18,4

36. Teniendo en cuenta los datos de los dos problemas anteriores, el intervalo confidencial será:
a) 13,6 < χ2 < 16,3
b) 43,1 < χ2 < 54,2
c) 13,1 < χ2 < 52,3
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

37. La decisión tomada sobre los resultados será la siguiente:


a) Como nuestro estadístico de contraste no cae dentro del intervalo confidencial,
aceptamos la hipótesis nula.
b) La desviación típica de la población no es de 150 a ese nivel de confianza
c) Como nuestro estadístico de contraste se encuentra en el intervalo confidencial al 99%
de n. c., no podemos rechazar la hipótesis nula.

38. Con muestras aleatorias de 121 sujetos, la distribución muestral de la media (de una variable
que se distribuye normalmente en la población) tiene una media de 25 y como desviación
típica de 10. La formulación de las hipótesis será: n.c. : 95%
a) H0 : μ = 25 y H1 : μ ≠ 25
b) H0 : σ2 = 25 y H1 : σ2≠ 25
c) H0 : μ < 25 y H1 : μ > 25

39. Teniendo en cuenta los datos del problema anterior, el estadístico de contraste para
comprobar que una muestra del mismo tamaño con media = 28 y desviación típica = 30
pertenece a la misma población será:
a) Z = 0,3
b) t = 3,7
c) χ2 = 4,2

40. atendiendo a los resultados anteriores, el criterio de decisión será:


a) No podemos aceptar que una muestra (del mismo tamaño) con media igual a 28
pertenezca a la misma población
b) Podemos afirmar que la media obtenida por nosotros en la investigación, es
compatible, a un nivel de confianza del 95%, con la hipótesis de que la media de la
población sea de 25.
c) Rechazamos la hipótesis nula puesto que la probabilidad asociada a nuestro estadístico
de contraste (p), es menor que α.

41. En una muestra aleatoria de 200 sujetos, procedentes de una población normal e infinita, se ha
obtenido una media igual a 60 y una desviación típica igual a 20. Cuál será el error típico de la
media:
a) 1,87
b) 1,63
c) 1,42

42. Un educador piensa que sólo un 15% de los alumnos de cuarto de primaria, del colegio en el
que trabaja, son capaces de manejar con rapidez el diccionario. Para comprobar lo que piensa,
selecciona al azar una muestra de 150 alumnos de ese curso y les realiza una prueba de manejo
del diccionario. Teniendo en cuenta estos datos, la formulación de las hipótesis estadísticas
será: α = 0,05
a) H0: π = 0,15 y H1: π ≠ 0,15
b) H0 : μ = 15 y H1 : μ ≠ 15
c) H0 : μ < 15 y H1 : μ > 15

43. Teniendo en cuenta los datos del problema anterior, el contraste será:
a) Unilateral izquierdo
b) Unilateral derecho
c) Bilateral

6
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS. TEMA - 2

44. El estadístico de contraste para los datos de los dos problemas anteriores será:
a) t = 3,825
b) Z = 1,715
c) χ2 = 4,247
45. Atendiendo a los datos de los problemas anteriores, la interpretación de los resultados será:
a) Con un nivel de confianza del 95% no podemos afirmar que sólo ese porcentaje de
alumnos sea capaz de manejar el diccionario.
b) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador está
justificada, es decir, que sólo un 15% de los alumnos maneja con rapidez el diccionario.
c) Con un nivel de confianza del 95% podemos afirmar que la sospecha del educador está
justificada, es decir, que más del 15% de los alumnos maneja con rapidez el diccionario.

46. El equipo docente de la asignatura Diseños de Investigación y Análisis de Datos considera que
el 50% de los alumnos que se presentan a examen, obtienen una nota de 7 o más. Tras realizar
el examen de febrero, comprueban que en una muestra aleatoria de 200 exámenes, 70
obtienen la calificación de Notable, 20 son calificados con Sobresaliente, 80 obtienen la
calificación de Aprobado y 30 la de Suspenso.
Sabiendo que: Suspenso < 5; 7 > Aprobado ≥ 5; 9 > Notable ≥ 7; Sobresaliente ≥ 9
¿Qué planteamiento dará el equipo docente a las hipótesis estadísticas?: (n. c., 95%)
a) H0 : η = 7 y H1 : η ≠ 7
b) H0 : μ = 7 y H1 : μ ≠ 7
c) H0 : μ < 7 y H1 : μ > 7

47. Según los datos del problema anterior, el estadístico de contraste será:
a) t = 5,825
b) χ2 = 4,227
c) = 1,41

48. Atendiendo a los resultados obtenidos, la conclusión a la que se puede llegar es la siguiente:
a) Es posible seguir manteniendo que la mediana de la población de referencia está en la
puntuación 7, es decir, que el 50% de los alumnos que se presentan a examen obtienen
una nota de 7 o más, con un nivel de confianza del 95%.
b) Es posible seguir manteniendo que la media de la población de referencia está en la
puntuación 7 a un nivel de confianza del 95%.
c) No es posible seguir manteniendo el planteamiento de la investigación, es decir,
debemos afirmar que el 50% de los alumnos que se presentan a examen no obtienen
una nota de 7 o más a un nivel de confianza del 95%.

7
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

TEMA 3: ANÁLISIS DE DATOS PARAMÉTRICOS PARA DISEÑOS DE DOS GRUPOS.

1. Los diseños de investigación intersujetos determinan analizar los datos con estadísticos de
contraste para:
a) Muestras relacionadas
b) Muestras independientes
c) Bondad de ajuste.

2. Si tras establecer el intervalo de confianza respecto a una diferencia entre proporciones


independientes, encontramos que el valor cero no se encuentra en el intervalo:
a) No podemos tomar ninguna decisión respecto a la hipótesis nula de igualdad de
proporciones.
b) No podemos rechazar la hipótesis nula de igualdad de proporciones poblacionales.
c) Debemos rechazar la hipótesis nula de igualdad entre proporciones poblacionales.

3. Cuando establecemos el intervalo de confianza para la diferencia entre pares de medias


correspondientes a muestras independientes, se mantendrá la H0 si:
a) El valor del parámetro estipulado en H0 cae dentro del intervalo.
b) El valor muestral del estadístico cae dentro del intervalo.
c) El valor del parámetro estipulado en H0 cae fuera del intervalo.

4. ¿Cuál de las alternativas es correcta?:


a) Dos muestras son independientes cuando las observaciones o medidas son
independientes entre las muestras, pero no dentro de ellas.
b) Cuando se mide una variable en los dos miembros de n pares de sujetos siendo los
miembros de cada par muy similares en alguna característica relevante, estamos ante
un diseño de medida independientes.
c) Ambas alternativas son incorrectas.

5. En el cálculo del estadístico de contraste T para el caso de dos muestras independientes es


necesario conocer:
a) La varianza insesgada de cada muestra
b) La varianza insesgada de cada población.
c) La varianza de cada población.

6. Para aplicar un contraste de medias en dos muestras independientes, se debe cumplir que:
a) La variable dependiente debe estar medida, al menos a nivel de razón
b) La variable dependiente debe estar medida, al menos, a nivel de intervalo
c) La variable dependiente debe estar medida, al menos, a nivel ordinal.

7. Queremos contrastar que H0: π21 = π12. Hemos estimado que la diferencia entre las dos
proporciones poblacionales estará entre los valores 0,047 y 0,470 con una probabilidad igual
a 0,99. Se podría interpretar que:
a) Ambas proporciones son distintas
b) Ambas proporciones son iguales
c) No se puede contestar porque faltan datos en el enunciado.
8. En el contraste estadístico de dos medias independientes:
a) Lo más habitual es desconocer el valor de las varianzas poblacionales
b) Lo más habitual es utilizar el estadístico de contraste Z
c) Debe utilizarse el estadístico de contraste X2

1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

9. Hemos seleccionado aleatoriamente un grupo de 10 imágenes y las procesamos con dos


programas de ordenador (cinco a cada programa asignadas aleatoriamente) para ver si
existen diferencias entre los tiempos medios de procesamiento de las imágenes, ¿cómo son las
muestras?
a) Independientes
b) Relacionadas
c) Coherentes

10. Para la aplicación del estadístico W de Wilcoxon:


a) No importa la forma de la distribución de la variable
b) La distribución de la variable debe ser normal
c) Ambas respuestas son incorrectas
11. En algunas investigaciones sobre percepción de olores, se encontró que la diferencia entre la
proporción de mujeres que detectan la presencia de moléculas de androsterona y la de los
varones es 0,10. Para contrastar este resultado, extraemos una muestra aleatoria de 800
mujeres (M) y otra de 400 hombres (H), y encontramos que 640 mujeres y 200 varones
detectan la presencia de dichas moléculas. Cuál sería la formulación de las hipótesis
estadísticas: (N.c. 99%)
a) H0: πM πH = D = 0,10 y H1: πM πH ≠ D ≠ 0,10
b) H0: μM μH = 0,10 y H1: μM μH ≠ 0,10
c) H0: ηM ηH = 0,10 y H1: ηM ηH ≠ 0,10

12. El estadístico de contraste en el caso de los datos del problema anterior sería:
a) F = 3,6
b) Z = 6,9
c) T = 5,4

13. La conclusión obtenida en nuestro análisis sería:


a) Para un n. c., igual a 0,99, la diferencia entre la proporción poblacional de mujeres que
detectan la presencia de moléculas de androsterona y la de los varones es distinta de
0,10.
b) Para un n. c., igual a 0,99, la diferencia entre la proporción poblacional de mujeres que
detectan la presencia de moléculas de androsterona y la de los varones es igual a 0,10.
c) Para un n. c., igual a 0,99 y atendiendo a los resultados, se acepta la hipótesis nula.
14. Un psicólogo deportivo desea estudiar el efecto de la relajación sobre la amplitud de apertura
de piernas (AP). Extrae aleatoria e independientemente 9 gimnastas con una AP similar y las
asigna también aleatoriamente a dos grupos. A los del primer grupo (grupo experimental),les
somete a un programa de estiramiento de 14 semanas de duración en el que se introducen
ejercicios de relajación y a los del segundo grupo (grupo control) les somete al mismo
programa de estiramiento pero sin ejercicios de relajación. Finalizado el programa de
estiramiento, mide la amplitud de la apertura de piernas a los 9 gimnastas. Las medidas
obtenidas en los grupos experimental (E) y control (C) son las siguientes:
E: 130 127 142 145 135
C: 110 125 120 115
La amplitud de movimiento es una variable medida en grados que se distribuye normalmente
en ambas poblaciones con varianzas desconocidas pero supuestas iguales. N. c. 95%
Según estos datos, ¿cuál sería la formulación de la hipótesis nula?:
a) H0: μE = μC y H1: μE ≠ μC
b) H0: μE μC = 0 y H1: μE μC ≠ 0
c) Ambas opciones son correctas.

2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

15. Atendiendo a los datos del problema anterior, la zona de rechazo de la hipótesis nula está
formada por:
a) Todos los valores iguales y menores que t7, 0,025 = 2,36
b) Todos los valores iguales y menores que t7, 0,025 = 2,36 e iguales y mayores
que t7, 0,975 = 2,36
c) Todos los valores iguales y mayores que t7, 0,975 = 2,36

16. Continuando con el problema anterior, el valor del estadístico de contraste será:
a) t = 3,52
b) Z = 4,20
c) Z = 3,80

17. Según los datos de los problemas anteriores (14, 15 y 16), podemos afirmar:
a) Que los resultados llevan al rechazo de H0, a un nivel de significación igual a 0,05, de
que las muestras proceden de dos poblaciones con medias iguales.
b) Que el resultado del contraste no apoya la hipótesis del investigador de que la amplitud
de apertura de piernas es distinta cuando en el programa de estiramiento se
introducen ejercicios de relajación que cuando no se introducen.
c) Que el grupo experimental obtuvo una amplitud media de apertura de piernas menor
que el grupo control, lo que indica, a nivel descriptivo, que la relajación no aumenta la
amplitud de apertura de piernas.
18. Queremos comparar el método tradicional (T) de la UNED con un método nuevo, en concreto,
un método multimedia (M), para la enseñanza a distancia de la estadística. Nuestra hipótesis es
que los alumnos que estudien con el método tradicional obtendrán unas notas inferiores a las
de los alumnos que estudien con el método multimedia. Extraemos aleatoria e
independientemente 7 alumnos del segundo curso de psicología de la UNED y les asignamos
también aleatoriamente a los dos métodos de enseñanza. Los datos que aparecen a
continuación representan las notas obtenidas en un examen de estadística en ambas muestras
de alumnos:
Método Tradicional (MT): 4 5 6 2
Método Multimedia (MM): 9 8 10
La nota en estadística es una variable medida a nivel de intervalo que se distribuye
normalmente en ambas poblaciones con varianzas: σ2T = 4 y σ2M = 2. N. c. 95%. Teniendo
en cuenta estos datos, ¿cuál será la formulación de las hipótesis estadísticas?:
a) H0: μT μM = 0 y H1: μT μM ≠ 0
b) H0: μT ≥ μM y H1: μT < μM
c) H0: μT = μM y H1: μT ≠ μM
19. Atendiendo a los datos del problema anterior, el valor del estadístico de contraste será:
a) Z = 2,28
b) t = 3,80
c) Z = 3,68

20. Continuando con los datos de los problemas anteriores, podemos afirmar que:
a) La probabilidad de obtener un valor del estadístico tal como el hallado, o uno menor, no
es nula, por lo tanto rechazamos H0.
b) A nivel poblacional, los alumnos que estudiaron con el método tradicional tienen una
nota media en estadística inferior a los que estudiaron con el método multimedia,
asumiendo un nivel de significación igual a 0,05.
c) Este resultado sugiere que el método multimedia es peor método de enseñanza que el
método tradicional.

3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

21. Algunas variables ejercen su influencia sobre las conductas haciendo éstas más o menos
variables. Un investigador quiere investigar esta cuestión en la conducta afectiva de los niños.
Su hipótesis es que la conducta afectiva de los niños es menos variable que la de las niñas.
Extrae una muestra aleatoria de 41 niñas y otra de 31 niños y les mide la afectividad mediante
un cuestionario obteniendo una varianza insesgada igual a 9 en la muestra de niños y una de
36 en la muestra de niñas. La variable puntuación en el cuestionario de afectividad está medida
a nivel de intervalo. ¿cuál será el planteamiento de la hipótesis estadísticas? (N. c. 99%)
a) H0: μA ≥ μO y H1: μA < μO
b) H0: σ2A = σ2O y H1: σ2A ≠ σ2O
c) H0: σ2A ≤ σ2O ó H0: σ2A / σ2O ≤ 1 y H1: σ2A > σ2O ó H1: σ2A / σ2O > 1

22. El estadístico de contraste, atendiendo a los datos del problema anterior será:
a) Z = 5,28
b) t = 2,80
c) f = 4

23. La zona de rechazo de la hipótesis nula estará formada por todos los valores:
a) Todos los valores iguales y mayores que f0,99; 40, 30 = 2,30
b) Todos los valores iguales y menores que f0,99; 40, 30 = 2,30
c) Todos los valores iguales y mayores que f0,99; 41, 31 = 3,50

24. Los resultados llevan a las siguientes conclusiones:


a) Los resultados llevan al rechazo de H0 con un nivel de significación igual a 0,99, de que
la varianza de las puntuaciones en el cuestionario de afectividad en la población de
niñas, es igual o mayor que en la de niños.
b) Los resultados llevan al rechazo de H0 con un nivel de significación igual a 0,01, de que
la varianza de las puntuaciones en el cuestionario de afectividad en la población de
niñas, es igual o menor que en la de niños.
c) Los resultados no apoyan la hipótesis del investigador de que los niños son menos
variables que las niñas en cuanto a conducta afectiva.

25. Se quiere comprobar el efecto de un método novedoso de aprendizaje en dos grupos de niños,
uno de 4 alumnos y otro de 3. Sabemos que el análisis estadístico ha aportado diferencias
significativas del efecto del nuevo método con respecto al tradicional. Sabemos que el grupo
de n=4 al que se le aplicó el método nuevo, obtuvo una media igual a 6 y una desviación típica
insesgada de 4, y que el grupo de n=3 al que se le aplicó el método tradicional obtuvo una
media de 5 y una desviación típica insesgada de 2. ¿Cuál será la magnitud del efecto del método
novedoso sobre el tradicional?
a) 0,78
b) 0,30
c) 0,29

26. Tras realizar análisis estadístico sobre dos muestras de 7 y 8 sujetos, los resultados apoyan la
hipótesis del investigador de que la relajación influye positivamente sobre la elasticidad en los
deportistas. Los resultados obtenidos son los siguientes:
Grupo 1: n=7 ȲR = 125,8 σ2R = 68,7 (Grupo con relajación)
Grupo 2: n=8 ȲNR=119,5 σ2NR =61,67 (Grupo sin relajación)
¿Cuál será la magnitud de la mejoría de la elasticidad tras aplicar la relación?:
a) 0,78
b) 0,27
c) 0,35
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

27. Un psicofísico hipotetiza que los hombres y las mujeres no son igualmente variables en
sensibilidad olfativa. Extrae una muestra aleatoria de 13 hombres (H) y otra de 25 mujeres (M)
y les mide la sensibilidad olfativa, obteniendo una varianza insesgada igual a 10 en la muestra
de hombres y de 17 en la de mujeres. La sensibilidad olfativa es una variable medida a nivel de
intervalo que se distribuye normalmente en ambas poblaciones. N. c. 90%. ¿Cuál será la
formulación de la hipótesis estadística?:
a) H0: μM ≥ μH y H1: μM < μH
b) H0: σ2M = σ2H ó H0: σ2M / σ2H = 1 y H1: σ2M ≠ σ2H ó H1: σ2M / σ2H ≠ 1
c) H0: σ2M ≤ σ2H ó H0: σ2M / σ2H ≤ 1 y H1: σ2M > σ2H ó H1: σ2M / σ2H > 1

28. La zona de aceptación de la hipótesis nula, teniendo en cuenta los datos del problema anterior,
está formada por todos los valores :
a) f0,05; 24, 12 = 0,46 < H0 < f0,95; 24, 12 = 2,51
b) f0,95; 24, 12 = 0,46 < H0 < f0,05; 24, 12 = 2,51
c) f0,05; 25, 13 = 0,46 < H0 < f0,95; 25, 13 = 2,51

29. El estadístico de contraste, atendiendo a los datos de los dos problemas anteriores será:
a) f = 2,58
b) t = 1,28
c) f = 1,70

30. atendiendo a los datos de los problemas anteriores, (27, 28, 29), ¿se rechaza la hipótesis nula?:
a) Sí, ya que el valor de nuestro estadístico de contraste no está dentro de la zona de
aceptación de H0.
b) No, ya que el valor del estadístico de contraste cae dentro de la zona de aceptación de la
hipótesis nula
c) No, ya que el valor del estadístico de contraste cae en la zona de aceptación de la
hipótesis alternativa.

31. Siguiendo con los problemas anteriores, ¿apoyan los resultados la hipótesis del investigador?:
a) No, ya que se acepta la hipótesis nula.
b) No, ya que no se acepta la hipótesis nula.
c) Sí, ya que se rechaza la hipótesis nula.

32. En una investigación en el área de la psicología deportiva, extraemos aleatoria e


independientemente 200 nadadores y les asignamos también aleatoriamente a las dos
condiciones de un experimento, obteniendo dos muestras de 100 nadadores (grupo
experimental y grupo control). Durante un mes, los nadadores del grupo experimental (E),
además de un entrenamiento intenso, son sometidos a una terapia de relajación, mientras que
los del grupo control (C) realizan el mismo entrenamiento intenso pero sin terapia de
relajación. Las respuestas afirmativas dadas por ambos grupos, al finalizar el período de
entrenamiento, a la pregunta “¿se siente muy cansado?”, fueron 60 en el grupo experimental y
70 en el grupo control. Queremos saber si la terapia de relajación influye en la proporción de
respuestas afirmativas. Teniendo en cuenta un n. c. del 99%, cuál será el planteamiento de las
hipótesis estadísticas:
a) H0: πE πC = 0 y H1: πE πC ≠ 0
b) H0: πE πC ≥ 0 y H1: πE πC < 0
c) H0: πE πC < 0 y H1: πE πC ≥ 0

33. El estadístico de contraste, teniendo en cuenta los datos del problema anterior, será:
a) t = 2,48
5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA - 3

b) f = 1,98
c) z = 1,47

34. El nivel crítico p asociado a nuestro estadístico, será:


a) 0,3214
b) 0,0002
c) 0,1416

35. Teniendo en cuenta los datos del problema anterior, se rechazará la hipótesis nula?:
a) No, porque p = 0,1416 > α = 0,01
b) Sí , porque p = 0,0002 < α = 0,01
d) No, porque p = 0,3214 < α = 0,01

36. Según los resultados de los problemas anteriores, a qué conclusiones llegaremos:
a) Con un α = 0,01, la proporción de nadadores que dicen sentirse muy cansados tras el
periodo de entrenamiento intenso no es la misma en la población experimental que en
la de control.
b) La relajación no ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.
c) La relajación ha tenido efecto sobre la proporción de respuestas afirmativas a la
pregunta ¿se siente muy cansado?.

37. Un investigador quiere estudiar el efecto de la privación de agua sobre el tiempo que tardan las
ratas en recorrer un laberinto. Extrae aleatoria e independientemente 60 ratas y les asigna
también aleatoriamente a las dos condiciones del experimento: 12 y 24 horas de privación de
agua. Las 30 ratas sometidas a 12 horas de privación de agua (muestra A) tardaron un tiempo
medio de 5,9 minutos en recorrer un laberinto y las 30 ratas sometidas a 24 horas de privación
(muestra B) tardaron 6,40 minutos en recorrer el mismo laberinto, siendo las desviaciones
típicas isesgadas 0,29 y 0,30 respectivamente. Sabiendo que el n. c. fijado por el investigador es
del 95%, cuál será el planteamiento de las hipótesis estadísticas:
a) H0: μA = μB ó μA μB = 0 y H1: μA ≠ μB ó μA μB ≠ 0
b) H0: μA < μB ó μA μB < 0 y H1: μA > μB ó μA μB >0
c) H0: μA ≥ μB ó μA μB ≥ 0 y H1: μA < μB ó μA μB <0

38. El estadístico de contraste atendiendo a los datos del problema anterior, será:
a) t = 5,32
b) t = 4,28
c) t = 6,58

39. ¿Cuál será el intervalo de confianza?:


a) 0,57 < μA μB < 0,84
b) 0,35 < μA μB < 0,65
c) 0,44 < μA μB < 0,78

40. ¿Se rechazaría la hipótesis nula?:


a) No, porque el valor del estadístico de contraste cae en la zona de rechazo de H1
b) Sí, porque la probabilidad asociada al estadístico de contraste obtenido es menor que
el nivel de significación acordado en nuestra investigación.
c) Sí, porque p > α
6
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4

TEMA 4: ANÁLISIS DE DATOS PARAMÉTRICOS PARA DISEÑOS DE DOS GRUPOS. MUESTRAS


RELACIONADAS.

1. Un ejemplo de muestras relacionadas son las obtenidas:


a) Con un diseño clásico antes y después de un tratamiento.
b) Independientemente, mediante un muestreo aleatorio simple
c) Independientemente, mediante muestreo probabilístico.

2. Cuando hallamos los valores críticos del estadísticos T, para dos muestras relacionadas, con
más de 30 grados de libertad, acudimos a la tabla de distribución:
a) T de Student
b) X2 de Pearson
c) Normal.

3. El estadístico Z aplicado para el contraste de medias en muestras relacionadas, se distribuye


normalmente:
a) Con media 0 y varianza 1
b) Con media 1 y varianza 0
c) Con media 0 y varianza desconocida.

4. Cuando hallamos los valores críticos del estadístico T, para dos muestras relacionadas, con
más de 30 grados de libertad, acudimos a la tabla de distribución:
a) Normal
b) T de Student
c) X2

5. En los contrastes para dos muestras dependientes:


a) Tenemos una muestra de diferencias que podemos suponer relacionadas
b) Las dos observaciones o puntuaciones de un mismo sujeto (o de los dos sujetos de un
mismo par), no pueden estar relacionados.
c) Un ejemplo típico es el diseño en el que se toman medidas pre y post tratamiento.

6. Cuando se mida una variable en los dos miembros de n pares de sujetos siendo los miembros
de cada par muy similares en variables relevantes del estudio, asumiremos que las
observaciones de ambas muestras:
a) Están relacionadas pero ello no implica que las diferencias entre cada par de
observaciones lo estén.
b) Son independientes.
c) Están relacionadas, lo cual implica que las diferencias entre cada par de observaciones
también lo están.

7. Se desea estudiar si una terapia de relajación reduce el nivel de ansiedad. Se obtiene una
muestra aleatoria de 8 sujetos y se les toman medidas en ansiedad antes y después de
aplicarles la terapia. Sabemos que la variable está medida a nivel de intervalo y que la
distribución poblacional de las diferencias entre cada par de puntuaciones es simétrica en
torno a la medida de tendencia central. ¿Qué estadístico de contraste aplicaría?:
a) W de Wilcoxon
b) S de signos
c) T para dos muestras relacionadas.
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4

8. La prueba de Wilcoxon:
a) Tiene las mismas restricciones que la prueba de signos.
b) Presenta restricciones en cuanto a la distribución de la variable en la población y en el
nivel de medida de los datos.
c) No tiene restricciones.

9. Cuando utilizamos el estadístico de contraste de Mann-Witney-Wilcoxon, hay que tener en


cuenta que las dos poblaciones, si difieren, lo hacen:
a) Sólo en tendencia central
b) Sólo en variabilidad
c) Tanto en tendencia central como en variabilidad.

10. Un investigador desea estudiar si un vídeo preelectoral aumenta el número de votos a favor de
cierto partido político en la población española. Extrae una muestra aleatoria de 250 españoles
que vieron el vídeo en televisión. Las respuestas (a favor o en contra) de los 250 españoles
antes y después de ver el vídeo aparecen a continuación: (N. c. 95%)
Antes ¿Cuál será el planteamiento de las
hipótesis estadísticas?:
A favor En Contra a) H0: πc ≤ πb y H1: πc > πb
b) H0: πc ≥ πb y H1: πc < πb
Después A favor 100 60
c) H0: πc = πb y H1: πc ≠ πb
En Contra 35 55

11. La zona de aceptación de la hipótesis nula está formada por:


a) Todos los valores mayores que z0,95 = 1,64
b) Todos los valores menores que z0,95 = 1,64
c) Todos los valores menores que z0,95 = 1,98

12. Atendiendo a los datos de los problemas anteriores, el valor del estadístico de contraste
empleado será:
a) t = 3,28
b) z = 2,56
c) z = 3,28

13. Atendiendo a los datos de los problemas anteriores, se aceptará la hipótesis alternativa?:
a) No, porque el valor del estadístico de contraste cae fuera de la zona de aceptación de la
hipótesis nula.
b) Sí, porque el valor del estadístico de contraste cae fuera de la zona de aceptación de la
hipótesis nula.
c) No, porque p > 0,005
14. La probabilidad asociada a nuestro estadístico de contraste será:
a) 0,0052
b) 0,052
c) 0,002
2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4

15. Un investigador desea estudiar si una campaña informativa sobre los beneficios de la práctica
deportivo aumenta dicha práctica. Extrae una muestra aleatoria de 100 españoles. Las
respuestas de los 8 españoles antes y después de la campaña informativa a la pregunta “ ¿
practica algún tipo de deporte?”, aparecen a continuación:
Antes Si tenemos en cuenta un n. c. del 95%, ¿cuál será el planteamiento
de las hipótesis?:
Sí No a) H0: πc = πb y H1: πc ≠ πb
b) H0: πc ≥ πb y H1: πc < πb
Después Sí 44 37
c) H0: πc ≤ πb y H1: πc > πb
No 9 10

16. El estadístico de contraste sería:


a) Z = 4,129
b) Z = 1,538
c) Z = 3,278
17. ¿Cuál será la probabilidad asociada al estadístico de contraste?
a) 0,9772
b) 0,0028
c) 0,0002

18. Atendiendo a los datos del problema anterior, ¿Se aceptará la hipótesis nula?:
a) No, ya que el valor del estadístico de contraste es mayor que p
b) No, ya que p < α
c) Sí, ya que p < α

19. Teniendo en cuenta los resultados, ¿a qué conclusiones llegaremos?:


a) A un nivel de significación del 5%, los datos permiten rechazar la hipótesis nula de que
la proporción poblacional de españoles que practican deporte después de la campaña
informativa y no antes, es mayor que la proporción poblacional de españoles que
practican deporte antes de la campaña informativa y no después.
b) A un nivel de significación del 5%, los datos no permiten rechazar la hipótesis nula de
que la proporción poblacional de españoles que practican deporte después de la
campaña informativa y no antes, no es mayor que la proporción poblacional de
españoles que practican deporte antes de la campaña informativa y no después.
c) Este resultado no apoya la hipótesis del investigador de que una campaña informativa
sobre los beneficios de la práctica deportiva aumenta dicha práctica.

20. Un investigador quiere estudiar la influencia de una terapia cognitiva sobre la agresividad.
Extrae una muestra aleatoria de 36 sujetos violentos y les mide la agresividad mediante un
cuestionario (medida pretest). Posteriormente, les trata durante 3 meses con la terapia
cognitiva, y vuelve a pasarles el cuestionario de agresividad (medida postest). En el pretest,
obtuvo una media igual a 38 y una varianza igual a 35. En el postest obtuvo una media de 30 y
una varianza igual a 35. La varianza muestral de las diferencias entre las medidas pre y postest
es igual a 18,56. La puntuación en el cuestionario de agresividad es una variable medida a nivel
3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4

de intervalo y el n. c. 99%. Teniendo en cuenta lo anterior, cuál será el planteamiento de las


hipótesis estadísticas:
a) H0: μd = 0 y H1: μd ≠ 0
b) H0: μd <0 y H1: μd > 0
c) H0: μd > 0 y H1: μd < 0

21. El valor del estadístico de contraste será:


a) 5,34
b) 7,28
c) 10,96

22. La zona de rechazo de la hipótesis nula será:


a) ± 1,98
b) ± 3,52
c) ±2,58

23. Se aceptará la hipótesis alternativa?:


a) No, ya que el valor del estadístico de contraste cae en la zona de aceptación de la
hipótesis nula.
b) Sí, ya que el valor del estadístico de contraste cae en la zona de aceptación de la
hipótesis alternativa.
c) Sí, ya que p < α
24. Las conclusiones obtenidas a partir de los resultados son:
a) A nivel descriptivo, la terapia cognitiva no es efectiva para el control de la agresividad.
b) Para un nivel de significación igual a 0,01 los resultados indican que la terapia no es
efectiva.
c) A nivel descriptivo, la terapia cognitiva es efectiva para el control de la agresividad, es
decir, disminuye la ansiedad.
25. Un psicofísico desea comparar los umbrales sensoriales en dos sesiones distintas. Su hipótesis
es que la magnitud de los umbrales no es la misma en ambas sesiones. Extrae una muestra
aleatoria de 7 sujetos y les mide el umbral sensorial a un estímulo olfativo (primera sesión).
Una semana más tarde el investigador presenta de nuevo el estímulo olfativo a los mismos
sujetos, manteniendo constantes todas las condiciones del experimento, y obtiene nuevos
umbrales sensoriales (segunda sesión). Los umbrales sensoriales (a mayor puntuación mayor
es el umbral sensorial y menor es la sensibilidad del sujeto) obtenidos en ambas sesiones
aparecen a continuación:
1ª sesión 2ª sesión

21 15

28 13

40 25

13 11

20 20

26 22

10 19

4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 4

El umbral sensorial a un estímulo olfativo es una variable medida a nivel de intervalo y la


distribución poblacional de las diferencias en sensibilidad entre ambas sesiones es simétrica
en torno a la mediana. Teniendo en cuenta estos datos y sabiendo que tenemos un n. c. del
95%, cuál será la formulación de las hipótesis estadísticas:
a) H0: μd = 0 y H1: μd ≠ 0
b) H0: η2 = η1 y η2 ≠ η1
c) H0: μd <0 y H1: μd > 0

26. ¿cuál será la probabilidad asociada al estadístico de contraste?:


a) 0,20
b) 0,52
c) 0,002

27. ¿Se rechazaría en este caso la hipótesis nula?:


a) Si, porque el estadístico de contraste está en la zona de rechazo de la hipótesis nula
b) Sí, porque p > α
c) No, porque p > α

28. Las conclusiones a las que llegaremos a través de los resultados obtenidos serán:
a) A un nivel de confianza del 95%, los datos no permiten rechazar la hipótesis nula de
que las medianas poblacionales son iguales.
b) En promedio, el umbral sensorial medido en la primera sesión es distinto de aquél
medido en la segunda sesión.
c) Los resultados apoyan la hipótesis del investigador.

5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5

TEMA 5: Diseños con más de dos grupos independientes.

1. El análisis de varianza se ocupa:


a) De averiguar qué factor varía más.
b) De Estudiar los tipos de varianzas que se dan en las muestras.
c) De averiguar qué variabilidad corresponde al factor estudiado y cuál al error
experimental.

2. En el análisis de varianza:
a) A las variables independientes se las denomina factores y a las categorías en que se
dividen, niveles.
b) A las variables dependientes se las denomina niveles y a sus efectos, factores.
c) A las variables extrañas se las denomina factores y a sus categorías o dosis de
tratamiento, niveles.

3. Un modelo experimental se considera equilibrado:


a) Cuando existe equilibrio entre sus factores y niveles.
b) Cuando el número de elementos es el mismo en todas sus muestras.
c) Cuando sus varianzas son iguales.

4. En un análisis de varianza, si la variabilidad intergrupo es mayor que la variabilidad


intragrupo:
a) Significa que existe acuerdo entre grupos en cuanto a la varianza.
b) Significa que existe acuerdo entre parte de los grupos en cuanto a la varianza.
c) Significa que existe diferencia entre los grupos en cuanto a la varianza.

5. Dentro de una muestra en el análisis de varianza:


a) Se llama variabilidad intragrupo a la que se produce entre dos muestras e
intergrupo a la que se produce dentro de las muestras.
b) Se llama variabilidad intra a la que se produce dentro de las muestras e inter a la
que se produce entre las muestras.
c) Se llama variabilidad intra a la intrapoblacional e inter a la que se da en
poblaciones de igual varianza.

6. Se dice que la MCinter es un estimador sesgado de la varianza poblacional:


a) Porque no representa a la varianza poblacional.
b) MCinter no es un estimador sesgado.
c) Porque su esperanza es igual a la varianza poblacional más un sumando.

7. Decimos que un modelo es de efectos fijos:


a) Cuando el investigador establece como niveles del factor sólo aquellos que está
interesado en estudiar.
b) Cuando se establecen como “i” niveles del factor, una muestra aleatoria de todos
los niveles posibles del factor.
c) Cuando el investigador establece de forma aleatoria los niveles que desea estudiar.

8. En un modelo de efectos variables:


a) Las hipótesis se establecen sobre las medias poblacionales de los efectos del factor.
b) Las hipótesis se establecen sobre las varianzas poblacionales de los efectos del
factor.
c) Las hipótesis no se establecen sobre las varianzas poblacionales de los efectos del
factor.

1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5

9. La importancia de las comparaciones planificadas radica:


a) En su independencia.
b) En su dependencia.
c) En su naturaleza “ a priori “

10. Los supuestos de análisis de varianza son:


a) Independencia, conservación y aleatoriedad.
b) Normalidad, homocedasticidad e independencia.
c) Homocedasticidad, independencia y aleatoriedad.

11. El cometido del Análisis de Varianza es:


a) Minimizar el error experimental
b) Maximizar los efectos del factor estudiado
c) Discernir qué variabilidad corresponde al factor estudiado y cuál al error
experimental.

12. El que un modelo sea o no equilibrado cuando aplicamos el análisis de varianza, depende
de:
a) Que el muestreo sea aleatorio.
b) El número de elementos de las muestras
c) El número de variables independientes.

13. Con el ANOVA contrastamos, la diferencia de:


a) Porcentaje entre dos o más muestras.
b) Medias entre varias muestras
c) Proporción entre dos o más muestras.

14. La varianza intragrupos es la varianza atribuible:


a) El error experimental
b) Tanto al error experimental como a los distintos niveles del factor estudiado
c) A los distintos niveles del factor estudiado.

15. El estadístico de contraste en el análisis de varianza se distribuye según la distribución:


a) F de Snedecor
b) Chi cuadrado
c) Normal.

16. En el razonamiento del análisis de varianza se supone que dentro de un mismo nivel, las
puntaciones deberían ser:
a) Semejantes
b) Correlacionadas
c) Diferentes.

17. Queremos comprobar si el ambiente en el que se desarrolla un niño influye en los


valores/puntuaciones obtenidas en un test de inteligencia. Para ello, extraemos de la
población dos grupos de 10 niños cada uno. Uno de ellos de una zona deprimida (grupo D)
y otro de otra zona con un nivel socieconómico elevado (grupo E). Se aplica a ambos
grupos un test de inteligencia y se obtienen los siguientes datos:
SCtotal = 2250,8 SCintra= 1379,6

¿Cuál será el estadístico más adecuado a utilizar?


a) Estadístico F
b) Estadístico T
c) Estadístico Z

2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5

18. Cuál será el resultado de nuestro estadístico atendiendo a los datos del problema 24?.
a) T= 11,36
b) F = 3,37
c) F= 11,36

19. Cuál será nuestro valor crítico, atendiendo a los datos del problema 24?
a) 3,007
b) 4,414
c) 5,978

20. A un n.c. del 95% aceptaríamos la Hipótesis alternativa?: (datos del problema 24)
a) Sí porque el valor del estadístico es mayor que nuestro valor crítico.
b) No porque el valor del estadístico es menor que nuestro valor crítico.
c) Sí porque el valor del estadístico es mayor que nuestro valor crítico.

21. Teniendo en cuenta los resultados obtenidos en los ejercicios anteriores (24 al 27), la
conclusión a la que hemos llegado es la siguiente:
a) Al no haber obtenido una diferencia significativa en nuestro estudio, se deduce que
el ambiente en el que se desarrolle un niño no influye en las puntuaciones
obtenidas en un test de inteligencia.
b) Al haber obtenido una diferencia significativa en nuestro estudio, se deduce que el
ambiente en el que se desarrolle un niño no influye en las puntuaciones obtenidas
en un test de inteligencia.
c) Al haber obtenido una diferencia significativa en nuestro estudio, se deduce que el
ambiente en el que se desarrolle un niño influye en las puntuaciones obtenidas en
un test de inteligencia.

22. Se quiere estudiar la incidencia del número de hijos en la intensidad del lazo afectivo de las
madres hacia sus hijos. Tras realizar el muestreo aleatorio apropiado, se obtuvieron tres
grupos de 5 unidades familiares compuestas de madre e hijos, donde el Grupo 1 estaba
compuesto por familias con un hijo, el Grupo 2 por familias con 2 hijos el Grupo 3 por
familias con 3 hijos. Se procuró que las relaciones existentes en las unidades familiares no
fueran patológicas. A continuación, se midió la intensidad del lazo afectivo delas madres
hacia sus hijos en una escala de intervalo, obteniendo las siguientes puntuaciones (a mayor
puntuación, mayor intensidad afectiva):
Grupo 1 Grupo 2 Grupo 3
10 4 9
9 5 10
7 6 8
8 7 7
10 4 6

Sabemos que todas las observaciones son independientes, varianzas homogéneas y las
distribuciones poblacionales normales. Tómese un α=0,05 .
Según los datos y conociendo SCtotal = 59,33 y SCinter = 35,73, el valor muestral del
estadístico de contraste es aproximadamente:
a) 13,21
b) 14,38
c) 9,07

23. El valor crítico atendiendo a los datos del problema 29 es:


a) 3,27
b) 3,88
c) 4,12

3
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5

24. ¿Se rechaza H0?:


a) Sí, porque el valor muestral del estadístico de contraste es mayor que 4,12
b) Sí, porque el valor crítico es menor que el valor muestral del estadístico de
contraste
c) Ambas respuestas son correctas.

25. Sabiendo que, Ȳ1= 8,8, Ȳ2= 5,2 y Ȳ3= 8, indique la alternativa correcta a un n.c. del 95%
(según los datos del problema 29):
a) Podemos decir que existen diferencias significativas entre las medias de todas las
poblaciones
b) Podemos decir que existen diferencias significativas entre las medias de las
poblaciones 1 y 2.
c) Podemos decir que existen diferencias significativas entre las medias de las
poblaciones 1 y 2 y entre las medias de las poblaciones 2 y 3.

26. En un análisis de varianza, se acepta la hipótesis alternativa de desigualdad de más de dos


medias si la probabilidad p asociada al estadístico F es:
a) Mayor que α
b) Menor o igual que α
c) Ambas alternativas son incorrectas.

27. Las comparaciones múltiples a posteriori son aquellas que se realizan después de un
análisis de varianza:
a) Si F es significativa.
b) Si F no es significativa.
c) Si p > α

28. Las puntuaciones obtenidas en un test por dos grupos de 10 alumnos cada grupo. Calcule el
estadístico F del análisis de varianza entre los dos grupos, sabiendo que:
SCintra = 1379,6 y g.l. = 18 SCT = 2250,8
a) 11,36
b) 14,57
c) 12,87

29. Una muestra aleatoria de 30 alumnos de un colegio se han repartido, también


aleatoriamente, en grupos iguales para estudiar la influencia de tres situaciones diferentes
de aprendizaje. Sabemos que la suma de los cuadrados de las puntuaciones diferenciales de
todos los alumnos de la muestra es igual a 700. Que la media del primer grupo es 30, la del
segundo grupo 20 y la del tercero 50. Y, sabemos también, que la suma de cuadrados total
supone el 150% de la suma de cuadrados intergrupo.
El resultado del estadístico de contraste del análisis de varianza será (n. c. del 95%):
a) 42,003
b) 27,006
c) 31,005

30. Cuál será el valor crítico atendiendo a los datos del problema anterior?:
a) 4,25
b) 2,18
c) 3,35
31. La interpretación de los resultados es la siguiente:
a) A un nivel de confianza del 95% debemos considerar que los tratamientos
suministrados influyen de forma distinta.
b) A un nivel de confianza del 95% debemos considerar que los tratamientos
suministrados influyen de igual forma.
c) A un nivel de confianza del 95% aceptamos la hipótesis nula.
4
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 5

32. Disponemos de tres grupos de sujetos, uno de niños, otro de niñas y un tercero de adultos.
Se les aplica un test que mide dependencia de campo y los resultados fueron:
Niños Niñas Adult.
6 9 8
5 8 10
6 8 8
4 5 3
3 10 7
5 7 6
4 6 7
4 8 9
5 8 8

Se desea saber si los tres grupos difieren en la variable estudiada y, en caso de que fuese así, si hay
diferencias debidas al género. Para ello, se aportan los siguientes datos:
SCinter = 46,625 y SCT = 104,5 n.c. del 95%.
Teniendo en cuenta estos datos, el valor del estadístico de contraste será:
a) 9,67
b) 8,795
c) 10,152

33. El valor crítico será:


a) 2,57
b) 4,25
c) 3,42

34. La conclusión obtenida a partir de los resultados será:


a) Se acepta la hipótesis nula
b) Con un nivel de confianza del 95%, se ha podido comprobar que hay diferencia
entre los grupos.
c) Se rechaza la hipótesis alternativa.

35. Ahora queremos calcular a qué es debida tal diferencia. Para el cálculo de las
comparaciones múltiples, aplicando la prueba de Scheffé, obtenemos un valor del C.R. de:
a) 0,452
b) 0,2585
c) 2,1748

36. Teniendo en cuenta este resultado, al comparar las medias, podemos concluir:
a) No existe diferencia significativa debida al género
b) Existe diferencia significativa debida al género.
c) No es posible realizar las comparaciones múltiples.

5
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 6

TEMA 6: ANÁLISIS DE DATOS EN DISEÑOS INTRASUJETOS

1. La diferencia entre dos observaciones del mismo sujeto:


a) Depende de la diferencia debida a los efectos del tratamiento
b) Depende de la varianza residual o error (efectos incontrolados)
c) “a” y “b” son ciertas.

2. Se pretende estudiar el efecto de un tratamiento, con 5 niveles o dosis diferentes, sobre 10


sujetos. El estadístico de contraste toma un valor F = 29,42 . Para un nivel de confianza del
0,99. Deseamos saber si el tratamiento ha hecho algún efecto sobre los sujetos.
a) Sí, el tratamiento ha hecho efecto, por eso aceptamos la Ho
b) No, el tratamiento no ha hecho efecto, por eso aceptamos la Ho
c) Sí, el tratamiento ha hecho efecto, por eso rechazamos la Ho

3. Según el problema anterior, ahora empleamos 3 niveles de tratamiento y 5 sujetos. El


estadístico obtenido es F = 18,12 El n. c. ahora es del 0,95. Según los datos:
a) Sí, aceptamos la Ho puesto que nuestro estadístico de contraste no arroja diferencias
significativas.
b) Rechazamos la Ho puesto que el tratamiento no ha hecho efecto
c) Rechazamos la Ho puesto que el estadístico de contraste arroja diferencias
significativas.

4. De una muestra de imágenes con el mismo número de puntos (es decir, del mismo tamaño), se
han escogido al azar ocho imágenes diferentes (tomadas en distintas escenas) y se las ha
procesado mediante cuatro algoritmos de emparejamiento (A, B, C, D), con el objeto de ver el
número de emparejamientos incorrectos (EI) que se producía con cada uno y así determinar la
eficacia relativa de los mismos. Teniendo en cuenta un n. c. del 99% y sabiendo que la suma de
cuadrados del tratamiento es 248,5, la suma de cuadrados error es 22 y la suma de cuadrados
total es 341,5, cuál será el valor del estadístico de contraste:
a) 82,833
b) 79,04
c) 64,78

5. El valor crítico obtenido, atendiendo a los datos del problema anterior, será:
a) 4,87
b) 5,54
c) 3,25

6. Con un nivel de confianza del 99% podemos afirmar (según los datos de los problemas 4 y 5):
a) Que todas las medias son iguales
b) Que no existen diferencias significativas entre al menos dos de los algoritmos en
número de emparejamientos incorrectos.
c) Que existen diferencias significativas entre al menos dos de los algoritmos en número
de emparejamientos incorrectos.

7. Se lleva a cabo una investigación para estudiar si las Técnicas de Inoculación de Estrés (TIE)
tienen efecto sobre la ansiedad precompetitiva de los corredores de velocidad. Para ello, se
seleccionaron aleatoriamente 12 atletas de entre todos aquéllos que puntuaron alto en una
batería de tests de ansiedad y se les enseñaron la TIE. Para estudiar el efecto de las TIE se
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 6

tomaron cuatro medidas de ansiedad precompetitiva mediante un cuestionario específico en


cuatro ocasiones: la 1ª fue tomada en una situación de laboratorio antes de enseñarles las TIE
(LA), la 2ª en una situación previa a la competición antes de la TIE (CA), la 3ª en una situación
de laboratorio después de las TIE (LD) y la 4ª en una situación previa a la competición
después de las TIE (CD). Teniendo en cuenta un n.c. del 99% y que la suma de cuadrados del
tratamiento vale 26,25, la suma de cuadrados error vale 52,25 y la suma de cuadrados total
vale 297,25, ¿cuál será el valor del estadístico de contraste?:
a) 4,253
b) 6,147
c) 5,526

8. El valor crítico, según los datos del problema anterior es:


a) 5,53
b) 4,51
c) 3,25

9. Atendiendo a los datos de los dos problemas anteriores, podemos concluir que:
a) Existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.
b) No existen diferencias significativas entre al menos dos de las cuatro situaciones de
recogida de datos sobre la ansiedad.
c) Se acepta H0

2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 7

TEMA 7 : Diseños con más de dos grupos independientes. Análisis de la varianza con dos
factores completamente aleatorizados

1. El laboratorio de aprendizaje animal dispone de doce ratas de una cierta raza, con las que
realiza un experimento. Posteriormente adquieren otro grupo de doce ratas (de otra raza) y,
tras la realización del mismo experimento, en las mismas condiciones, sospechan que los
resultados son diferentes según con qué grupo de ratas se realice la experiencia.
La prueba consistía en tomar los tiempos que tardaban en travesar un corredor con
recompensa final, después de 1, 2 ó 3 días de privación de comida.
La variable dependiente (tiempos) se distribuye normalmente, además, las observaciones son
independientes y las varianzas homogéneas. (n. c. 95%)
Teniendo en cuenta estos datos, cuál sería el valor crítico para el factor A (tipo de rata):
a) 4,41
b) 3,49
c) 3,55

2. Cuál sería el valor crítico para el factor B (tiempo de privación de comida):


a) 4,35
b) 3,55
c) 3,85

3. Cuál sería el valor crítico para la interacción de ambos factores (AB):


a) 4,35
b) 3,49
c) 3,55

4. Continuando con el problema 1, hemos obtenido las siguientes sumas de cuadrados:


SCA = 73,5 SCB = 312,33 SCAB = 7 SCS/AB = 47
A la luz de los resultados podemos concluir, con respecto al factor A (ratas):
a) No existen diferencias significativas entre los dos grupos de ratas
b) Existen diferencias significativas entre los dos grupos de ratas
c) No se puede calcular porque faltan datos.

5. Teniendo en cuenta las sumas de cuadrados anteriores, podemos concluir en cuanto al factor B
(tiempo de privación):
a) Es necesario realizar las comparaciones múltiples entre 1 y 3 días de privación
b) Se acepta la hipótesis nula, es decir, el estar privadas de alimento tiene efectos sobre el
resultado de las pruebas.
c) Estar privadas de comida 1, 2 ó 3 días influye de forma distinta.

6. Continuando con los datos de los ejercicios anteriores y refiriéndonos al efecto de la


interacción, podemos concluir que:
a) No se da ningún efecto significativo cuando se combinan los dos factores.
b) Se rechaza la hipótesis nula sobre la interacción.
c) No podemos averiguar los efectos, ya que faltan datos.

7. A 12 ratas procedentes de dos camadas (C y D) se las entrena en la ejecución de un


determinado problema en un laberinto. Se las deja durante cierto tiempo alejadas del mismo y
ejecutando otras tareas, y nuevamente se las lleva al laberinto. El investigador quiere probar el
recuerdo del aprendizaje y toma los tiempos de las ratas en esta segunda ejecución del
laberinto. Dado que no tomó los tiempos de esas mismas ratas antes del entrenamiento, toma
un grupo control de otras 12 ratas de las mismas camadas, y les mide los tiempos. Los
resultados fueron, tras calcular las sumas de cuadrados:
SCA = 2,67 SCB = 16,67 SCAB = 20,16 SCS/AB = 101
1
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS TEMA 7

Se dan los supuestos de homogeneidad de las varianzas y normalidad. Nc. 95%


Teniendo en cuenta estos datos, el valor del estadístico de contraste para el factor A (ratas) es:
a) 3,30
b) 0,46
c) 0,53

8. Siguiendo con el ejercicio anterior, es estadístico de contraste para el factor B (adiestramiento)


es:
a) 3,30
b) 3,54
c) 0,53

9. Por otro lado, el valor del estadístico de contraste para la interacción sería:
a) 3,99
b) 5,40
c) 1,98

10. Tras realizar el cálculo de los estadísticos, podemos concluir, refiriéndonos al factor A:
a) Existen diferencias significativas entre las ratas.
b) No existen diferencias significativas entre las ratas
c) Aceptamos la hipótesis alternativa.

11. Del mismo modo, podemos concluir acerca del factor B (adiestramiento):
a) Existen diferencias significativas entre los adiestramientos
b) No existen diferencias significativas entre los adiestramientos.
c) Rechazamos la hipótesis nula.

12. En cuanto a la interacción, podemos concluir:


a) Se dan efectos significativos cuando se combinan los dos factores
b) Se rechaza la hipótesis nula de la interacción
c) No se dan efectos significativos cuando se combinan los dos factores.

2
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS

GRADO

SOLUCIONES de los TEMAS 1 AL 9

Nº TM-1 TM-2 TM-3 TM-4 TM-5 TM-6 TM-7 TM-8 TM-9 TM-2 TM-1 Nº
1 A B B A C C A C A 47
2 C B C C A C B A C 48
3 C C A A B C C A 49
4 B A C A C B B A 50
5 C B A C B A C B 51
6 A A B A C C A B 52
7 A A A A A C C A 53
8 A C A B B B A C 54
9 C B A A C A A B 55
10 C A C B B B A 56
11 B B A B C B A 57
12 A A B B B C A 58
13 A A A B B C 59
14 B A C A A B 60
15 A B B B A A 61
16 C A A A A A 62
17 A B A C A B 63
18 C A B B C A 64
19 B C C A B A 65
20 C A B A A A 66
21 C A C C C B 67
22 B A C C C A 68
23 A C A B B A 69
24 B A B C B B 70
25 C C C B C A 71
26 B C A A B A 72
27 C B B C A 73
28 B A A A A 74
29 B B C B
30 A A B C
31 C A A A
32 C B A A
33 A C C C
34 A B C B
35 C A A A
36 C C B B
37 B C A
38 C A C
39 B A B
40 C B B
41 B C
42 B A
43 B C
44 C B
45 A B
46 A A
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2

1- Si a medida que aumenta el tamaño de la muestra tanto la varianza de la distribución de


probabilidad de un estimador como su sesgo tiende a cero, decimos que el estimador es: A)
suficiente; B) consistente; C) sesgado.

2- A la probabilidad de rechazar H0 cuando es falsa se la denomina: A) error tipo I; B) nivel de


confianza; C) potencia del contraste.

3- A medida que aumenta el tamaño de la muestra, la distribución muestral de la proporción se


aproxima a una distribución: A) Normal; B) Binomial; C) con grados de libertad.

4- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el


tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.

5- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A) cuya
distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más estrecho
alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza toda la
Información muestral relacionada con el parámetro.

6- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un nivel
de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación; B)
aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.

7- Sean “X” e “Y” dos estimadores de un mismo parámetro, si la distribución de probabilidad de


“X” tiene menor variabilidad que “Y”: A) el estimador “Y” es más eficiente; B) el estimador “X”
es más eficiente; C) el estimador “X” es más suficiente.

8- El nivel de confianza se refiere a: A) La probabilidad de que el parámetro se encuentre dentro


de un intervalo de confianza; B) El valor inverso del error típico; C) La probabilidad de que el
estadístico se encuentre dentro de la distribución muestral del parámetro.

9- En un contraste de hipótesis, la máxima diferencia que cabe esperar por simple azar entre el
valor teórico formulado en la hipótesis nula y el valor empírico obtenido a partir de los datos
de la muestra, recibe el nombre de: A) estadístico de contraste; B) valor crítico; C) nivel crítico.

10- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II es
siempre igual a 1; C) El nivel de confianza más nivel significación es igual a 1.

11- ¿Cuál de las siguientes afirmaciones es VERDADERA?: A) Potencia más nivel de confianza es
mayor o igual que uno; B) Error tipo I más error tipo II es igual a 1; C) Nivel de confianza más
nivel crítico p es igual a 1.

12- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula
que es verdadera, se llama: A) nivel crítico p; B) nivel de confianza; C) nivel de significación.

-1-
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2

13- En un contraste de hipótesis, el valor crítico representa: A) la probabilidad de rechazar la


hipótesis nula siendo verdadera; B) la máxima diferencia que cabe esperar entre el valor
teórico formulado en la hipótesis nula y el valor que encontramos en nuestros datos para esa
hipótesis; C) la probabilidad de que siendo cierta la hipótesis nula encontremos unos
resultados como los observados en la muestra o más extremos.

14- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume como
provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los datos
obtenidos en la muestra.

15- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones;
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria
ordinaria.

16- ¿Cuál de las siguientes afirmaciones es VERDADERA? La distribución muestral de un


estadístico: A) proporciona información sobre las características de la muestra siempre que
esta sea representativa de la población; B) proporciona todos los valores que puede asumir
un estadístico junto con la probabilidad de obtener ese valor; C) es normal o tiende a la
normal con independencia del tamaño de la muestra.

17- ¿Cuál de las siguientes afirmaciones es VERDADERA? Desde un punto de vista conceptual, la
potencia de un contraste: A) es el complementario del nivel de confianza; B) disminuye
cuando aumenta el nivel de significación; C) es la sensibilidad de un experimento para
detectar una diferencia significativa cuando la hipótesis nula es falsa.

18- A partir de una población con media 80 y desviación típica 8 ¿Cuánto vale la media y la
desviación típica, respectivamente, de la distribución muestral de la media generada a partir
de muestras de tamaño n = 16?: A) 10 y 2; B) 80 y 2; C) 10 y 8.

19- Si la variable dependiente está medida a nivel ordinal; A) debemos utilizar un contraste no
paramétrico; B) debemos utilizar un contraste paramétrico; C) ninguna de las opciones
anteriores es correcta.

20- El nivel crítico p: A) depende del nivel de confianza; B) es una probabilidad asociada al
estadístico de contraste; C) lo multiplicamos por dos cuando el contraste es unilateral.

21- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

22- Si trabajamos con dos grupos, siendo los tamaños de las muestras: ,
sabemos que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C)
las muestras son independientes.

-2-
Diseños de Investigación y Análisis de Datos. Soluciones de preguntas teóricas Temas 1 y 2

23- Partiendo de una población con varianza desconocida, la distribución muestral de la media es
una distribución: A) T de Student con grados de libertad; B) normal; C) Ji-cuadrado con
grados de libertad.

24- El objetivo del análisis inferencial de los datos es: A) realizar un análisis descriptivo de los
datos de la investigación; B) inferir los estadísticos muestrales a partir de lo observado; C)
inferir los parámetros de la población a partir de la información proporcionada por la
muestra.

25- Bajo qué condiciones podemos asumir que la distribución muestral de la proporción es
normal: A) cuando la muestra es grande; B) cuando la variable es cuantitativa continua; C)
sólo cuando es normal la distribución de la variable en la población.

26- Se llama error típico de un estadístico a la desviación típica de: A) el parámetro poblacional; B)
la distribución muestral de este estadístico; C) los datos recogidos en la muestra.

-3-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2

1- Si a medida que aumenta el tamaño de la muestra tanto la varianza de la distribución de


probabilidad de un estimador como su sesgo tiende a cero, decimos que el estimador es: A)
suficiente; B) consistente; C) sesgado.

2- A la probabilidad de rechazar H0 cuando es falsa se la denomina: A) error tipo I; B) nivel de


confianza; C) potencia del contraste.

3- A medida que aumenta el tamaño de la muestra, la distribución muestral de la proporción se


aproxima a una distribución: A) Normal; B) Binomial; C) con grados de libertad.

4- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el


tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para la
varianza; C) siempre verdadera.

5- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A) cuya
distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que utiliza
toda la Información muestral relacionada con el parámetro.

6- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un nivel
de confianza previamente fijado: A) aumenta cuando aumenta el error en la estimación; B)
aumenta cuando disminuye el error en la estimación; C) no depende del error en la
estimación.

7- Sean “X” e “Y” dos estimadores de un mismo parámetro, si la distribución de probabilidad de


“X” tiene menor variabilidad que “Y”: A) el estimador “Y” es más eficiente; B) el estimador “X”
es más eficiente; C) el estimador “X” es más suficiente.

8- El nivel de confianza se refiere a: A) La probabilidad de que el parámetro se encuentre dentro


de un intervalo de confianza; B) El valor inverso del error típico; C) La probabilidad de que el
estadístico se encuentre dentro de la distribución muestral del parámetro.

9- En un contraste de hipótesis, la máxima diferencia que cabe esperar por simple azar entre el
valor teórico formulado en la hipótesis nula y el valor empírico obtenido a partir de los datos
de la muestra, recibe el nombre de: A) estadístico de contraste; B) valor crítico; C) nivel crítico.

10- ¿Cuál de las siguientes afirmaciones es FALSA? La suma de las probabilidades de: A) La
potencia más nivel de confianza es mayor o igual que uno; B) El error tipo I más error tipo II
es siempre igual a 1; C) El nivel de confianza más nivel significación es igual a 1.

11- ¿Cuál de las siguientes afirmaciones es VERDADERA?: A) Potencia más nivel de confianza es
mayor o igual que uno; B) Error tipo I más error tipo II es igual a 1; C) Nivel de confianza más
nivel crítico p es igual a 1.

12- El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula
que es verdadera, se llama: A) nivel crítico p; B) nivel de confianza; C) nivel de significación.

-1-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2

13- En un contraste de hipótesis, el valor crítico representa: A) la probabilidad de rechazar la


hipótesis nula siendo verdadera; B) la máxima diferencia que cabe esperar entre el valor
teórico formulado en la hipótesis nula y el valor que encontramos en nuestros datos para
esa hipótesis; C) la probabilidad de que siendo cierta la hipótesis nula encontremos unos
resultados como los observados en la muestra o más extremos.

14- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume como
provisionalmente verdadera; B) es la hipótesis a contrastar; C) su valor depende de los datos
obtenidos en la muestra.

15- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un
estudio de la Agencia Tributaria que detalla los ingresos medios de la población activa por
sectores profesionales; B) Un informe del Centro de Investigaciones Sociológicas reflejando
cómo sería la composición del Congreso de los Diputados si se realizarán hoy las elecciones;
C) Un análisis presentado por el Ministerio de Educación sobre las notas de selectividad, por
Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria
ordinaria.

16- ¿Cuál de las siguientes afirmaciones es VERDADERA? La distribución muestral de un


estadístico: A) proporciona información sobre las características de la muestra siempre que
esta sea representativa de la población; B) proporciona todos los valores que puede asumir
un estadístico junto con la probabilidad de obtener ese valor; C) es normal o tiende a la
normal con independencia del tamaño de la muestra.

17- ¿Cuál de las siguientes afirmaciones es VERDADERA? Desde un punto de vista conceptual, la
potencia de un contraste: A) es el complementario del nivel de confianza; B) disminuye
cuando aumenta el nivel de significación; C) es la sensibilidad de un experimento para
detectar una diferencia significativa cuando la hipótesis nula es falsa.

18- A partir de una población con media 80 y desviación típica 8 ¿Cuánto vale la media y la
desviación típica, respectivamente, de la distribución muestral de la media generada a partir
de muestras de tamaño n = 16?: A) 10 y 2; B) 80 y 2; C) 10 y 8.

19- Si la variable dependiente está medida a nivel ordinal; A) debemos utilizar un contraste no
paramétrico; B) debemos utilizar un contraste paramétrico; C) ninguna de las opciones
anteriores es correcta.

20- El nivel crítico p: A) depende del nivel de confianza; B) es una probabilidad asociada al
estadístico de contraste; C) lo multiplicamos por dos cuando el contraste es unilateral.

21- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

22- Si trabajamos con dos grupos, siendo los tamaños de las muestras: ,
sabemos que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C)
las muestras son independientes.

-2-
Diseños de Investigación y Análisis de Datos. Preguntas teóricas Temas 1 y 2

23- Partiendo de una población con varianza desconocida, la distribución muestral de la media es
una distribución: A) T de Student con grados de libertad; B) normal; C) Ji-cuadrado con
grados de libertad.

24- El objetivo del análisis inferencial de los datos es: A) realizar un análisis descriptivo de los
datos de la investigación; B) inferir los estadísticos muestrales a partir de lo observado; C)
inferir los parámetros de la población a partir de la información proporcionada por la
muestra.

25- Bajo qué condiciones podemos asumir que la distribución muestral de la proporción es
normal: A) cuando la muestra es grande; B) cuando la variable es cuantitativa continua; C)
sólo cuando es normal la distribución de la variable en la población.

26- Se llama error típico de un estadístico a la desviación típica de: A) el parámetro poblacional;
B) la distribución muestral de este estadístico; C) los datos recogidos en la muestra.

-3-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

SITUACIÓN 1. Para contrastar la hipótesis de si la edad media de inicio en el consumo de alcohol de los
jóvenes de una determinada comunidad es más tardía que la media de la población general establecida
en 13 años, un investigador utiliza una muestra de 25 jóvenes encontrando que la edad media en su
comunidad es de 14 años con una desviación típica insesgada de 2,8. Asumimos que la variable edad de
inicio en el consumo de alcohol se distribuye normalmente en la población.

1. A partir de la información de la muestra utilizada el intervalo de confianza más aproximado para la


varianza poblacional con un nivel de confianza del 95% es: A) 5,70; 14,41; B) 4,77; 15,17; C) 5,23;
15,13.
2. La hipótesis nula para contrastar la hipótesis sobre la edad media en el consumo de alcohol es:
A) ; B) ; C) .
3. Con los datos de la situación 1, el estadístico de contraste para poner a prueba la media es: A) 2,102;
B) 1,78; C) 1,59.
4. Conforme a los objetivos del investigador y un “alfa”= 0’05, la máxima diferencia que puede
producirse por simple azar, si H0 es cierta, entre la media observada en la muestra y la media
planteada en la hipótesis nula, expresado en unidades de desviación típica es: A) 2,064; B) 1,711; C)
2,79.
5. La interpretación de los resultados obtenidos es que la edad media de inicio en el consumo de
alcohol de los jóvenes de la comunidad: A) es más tardía que la media general con un nivel de
confianza del 95%; B) es más tardía que la media general con un nivel de confianza del 99%; C) no es
más tardía que la media general con un nivel de confianza del 95%.

SITUACIÓN 2. La empresa SND's de sondeos electorales ha pronosticado que el nivel de apoyo que
recibirá el partido X en las próximas elecciones será del 40%. Desde el propio partido X se promueve un
nuevo sondeo con el fin de contrastar la veracidad de esta afirmación. Se elige al azar una muestra
aleatoria de 400 personas, con derecho a voto, de los cuales 128 manifiestan su intención de votar al
partido X.

1. Con un nivel de confianza del 95%, el Intervalo de confianza aproximado de la proporción de


personas que votarán al partido X, es: A) 0,2743; 0,3657; B) 0,352; 0,424; C) 0,318; 0,322.
2. La hipótesis alternativa es; A) ; B) ; C) .
3. El estadístico de contraste es: A) -3,43; B) -3,266; C) -6,67.
4. Con un nivel de confianza del 99%, si los dirigentes del partido X considerasen que Ia proporción de
apoyos no alcanza el valor pronosticado por la empresa SND's, el valor crítico para rechazar la
hipótesis nula, es: A) -2,58; B) 1,64; C) -2,33.
5. Para un contraste bilateral con un nivel de significación de 0,01, la conclusión es: A) Rechazar la
hipótesis nula con un nivel de significación del 0,01; B) No hay evidencias para rechazar la hipótesis
nula con un nivel de significación 0,05; C) No hay evidencias para rechazar la hipótesis nula con un
nivel de significación 0,01.

-1-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

SITUACIÓN 3. “La formación alcanzada por la población adulta española ha mejorado, de forma
continua, en los últimos 10 años. Desde 1998 el porcentaje de españoles de 25 a 64 años que poseen
estudios superiores a los obligatorios ha pasado de 33% al 51% en 2008. En la misma proporción ha
disminuido, por tanto, el porcentaje de españoles que sólo poseen estudios obligatorios, que ha pasado
del 67% en 1998 al 49% en 2008” (Panorama de la Educación. Informe OCDE 2010). Suponga que usted
quiere estudiar si estos datos son los que realmente existen en su Comunidad, para lo que utiliza una
muestra aleatoria de 900 adultos con edades comprendidas entre 25 y 64 años, encontrando que 378
de ellos tienen solo los estudios obligatorios.

1. Si decide trabajar con un nivel de confianza del 95% y se establece el error máximo de estimación en
el 3%, ¿cuál debe ser el tamaño de la muestra?: A) 1040; B) 544; C) 789.

2. Trabajando con un nivel de confianza del 95%, el intervalo de confianza de la proporción de adultos
de su Comunidad que solo tienen estudios obligatorios, se encuentra entre: A) 0,378 y 0,462; B)
0,388 y 0,452; C) 0,376 y 0,461.

3. Si el investigador quiere confirmar que la proporción de adultos de su Comunidad que solo tienen los
estudios obligatorios es significativamente inferior que el indicador de España en 2008, la hipótesis
alternativa es: A) H1: π< 0,49; B) H1: π> 0,49; C) H1: π≤ 0,42.

4. Si el investigador cree que la proporción de adultos que solo tienen los estudios obligatorios es
inferior que el indicador de España en 2008, el estadístico de contraste y el nivel p-crítico para
analizar si la diferencia es estadísticamente significativa es: A) 3,34 (p=0,0008); B) -4,2 (p<0,0002); C)
-2,33 (p=0,0198).

5. Respecto a la hipótesis del investigador analizada en las preguntas anteriores, el investigador


concluye que la proporción de adultos que solo tienen estudios obligatorios en su Comunidad, es: A)
inferior a la del resto de España con un nivel de significación de 0,01; B) la misma que la del resto de
España con un nivel de significación de 0,05; C) superior a la del resto de España con un nivel de
significación de 0,01.

SITUACIÓN 4. “En Educación Primaria, la media de alumnos por clase en los centros públicos de España
(19,7) es más baja que en la OCDE (21,6) y que en la Unión Europea (20,3). En los centros privados
ocurre lo contrario, pues la media en España es de 24,4 frente a 20,8 de media de la OCDE y 19,1 de la
UE”. (Panorama de la Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos
difieren significativamente de los que existen en su Comunidad. Asumiendo que la variable número de
alumnos por clase se distribuye normalmente, selecciona una muestra aleatoria de 100 aulas de
educación primaria en centros públicos, encontrando que la media de alumnos por clase es de 20,9 con
una desviación típica poblacional de 5,8.

1. Trabajando con un nivel de confianza del 95%, el intervalo de confianza para la media de alumnos
por clase en los centros públicos de su Comunidad es: A) 19,98; 21,8; B) 19,4; 22,39; C) 19,76; 22,04.
2. El procedimiento que aplicaría para contrastar si la media de los datos de su Comunidad es
significativamente menor que de la media de la OCDE es: A) la prueba t con n-1 grados de libertad; B)
la prueba z; C) la prueba de chi-cuadrado con n grados de libertad.

-2-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

3. Si se decide trabajar con un nivel de confianza del 95% y se establece un error máximo de estimación
en 1 punto, ¿Cuál debe ser el tamaño de la muestra? A) 129; B) 12923; C) 378.
4. El estadístico de contraste para analizar si la media de alumnos en los centros públicos de su
Comunidad es significativamente mayor que la media de España, toma el valor: A) 1,056; B) 1,261; C)
2,069.
5. Si sospecha que la media de los centros públicos de su Comunidad es significativamente mayor que
la media de España, el nivel p-crítico es: A) p=0,1446; B) p< 0,05; C) p=0,0192.
6. Teniendo en cuenta el estadístico de contraste obtenido ¿cuál de las siguientes sentencias es
verdadera?: A) no hay evidencia suficiente para rechazar que la media de alumnos por clase en los
colegios públicos de la Comunidad es igual a la media de España; B) La media de alumnos por clase
en los colegios públicos de la Comunidad es mayor que la media de España (NC= 95%); C)
rechazamos la hipótesis nula con un nivel de confianza del 99%.
7. Trabajando con un nivel de confianza del 95%, la interpretación del intervalo de confianza para la
media de alumnos por clase en los centros públicos de su Comunidad, le permite afirmar que la
media de su comunidad es: A) significativamente distinta que la de España pero igual que la de la UE;
B) significativamente distinta a la de la OCDE pero igual que la de España; C) significativamente
distinta que la de la UE pero igual que la de la OCDE.

SITUACIÓN 5. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en
estudiantes de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7%
éxtasis. Además, el inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más
tempranas. Así, mientras que en el año 2004 la edad media de inicio para la cocaína era de 15,9 años en
los hombres y 15,7 en las mujeres, en el año 2008 disminuyó a 15,3 años y 15,2, respectivamente
(ENCUESTA ESTATAL SOBRE USO DE DROGAS EN ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los
datos disponibles por un equipo de atención primaria que cubre a un determinado sector de su
municipio indican que en la muestra de 37 jóvenes varones y 41 mujeres atendidos el pasado año, el 8%
habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el consumo de cocaína de
15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 para los
hombres y 1,1 en las mujeres.

1. Bajo el supuesto de que la edad media de los hombres que han consumido cocaína al menos una vez,
es de 15,9 años, el error típico de la distribución muestral de la media es: A) 0,453; B) 0,2166; C)
0,334.
2. Si la hipótesis del investigador es que la edad media de inicio en el consumo de cocaína en los
hombres de su municipio ha disminuido significativamente respecto a los datos del 2004, el
estadístico de contraste es: A) -2,43; B) -2,7; C) -2,3.
3. A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95% ¿cuál es el
tamaño de la muestra necesario para estimar la proporción poblacional de jóvenes de su municipio
que han consumido cocaína al menos una vez con un error máximo de estimación del 2%?: A) 707; B)
1536; C) 978.
4. A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95%, ¿entre qué
valores se encontrará la proporción poblacional de jóvenes de su municipio que han consumido
cocaína al menos una vez?: A) 0,71; 0,88; B) 0,02; 0,14; C) 0,04; 0,12.
5. Con un nivel de confianza del 95%, el intervalo de confianza de la varianza poblacional de la edad de
las mujeres de su municipio que han consumido al menos una vez cocaína es: A) 0,83; 2,03; B) 0,89;
1,87; C) 0,95; 1,23.

-3-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

6. Si desea contrastar la hipótesis de que la varianza poblacional de la edad de las mujeres de su


municipio es mayor que 1, el nivel crítico p que obtiene para tomar una decisión respecto a la H0, es:
A) p > 0,10; B) p < 0,05; C) p > 0,01.

SITUACIÓN 6. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en
estudiantes de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7%
éxtasis. Además, el inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más
tempranas. Así, mientras que en el año 2004 la edad media de inicio para la cocaína era de 15,9 años en
los hombres y 15,7 en las mujeres, en el año 2008 disminuyó a 15,3 años y 15,2, respectivamente
(ENCUESTA ESTATAL SOBRE EL USO DE DROGAS EN ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los
datos disponibles por un equipo de atención primaria que cubre un determinado sector de su municipio
indican que con 41 jóvenes varones y 51 mujeres atendidos el pasado año, el 8% habían consumido
cocaína, al menos un vez, siendo la edad media de inicio en el consumo de cocaína de 15,4 años en los
hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 años y 1,1 años,
respectivamente.
1. Bajo el supuesto de que el 8% de los jóvenes ha consumido cocaína al menos una vez, el error típico
de la distribución muestral de la proporción es: A) 0,901; B) 0,0282; C) 0,0417.
2. Para comprobar si la edad media del inicio en el consumo de cocaína ha disminuido respecto a los
datos del 2004, el estadístico de contraste que aplicaría, es: A) Z porque utilizamos una muestra
grande proveniente de una variable que se distribuye normalmente en la población; B) T porque
desconocemos la varianza y la forma de la distribución poblacional; C) El intervalo de confianza
porque proporciona más información sobre la seguridad al tomar una decisión.
3. Si fijamos un nivel de confianza del 95%, ¿entre qué valores se encontrará la edad media del
consumo de cocaína en las mujeres de su municipio?: A) 14,887; 15,512; B) 14,941; 15,962; C)
14,682; 15,621.
4. Si su hipótesis es que la edad media del inicio en el consumo de cocaína en los hombres de su
municipio ha disminuido respecto a los datos de 2004, el valor del estadístico de contraste que
obtiene es: A) 2,34; B) -3,11; C) -2,43.
5. Si desea contrastar la hipótesis de que la varianza poblacional en la edad de inicio del consumo de
cocaína en los hombres de su municipio es significativamente mayor que 1,1 el nivel crítico p que
obtiene para tomar una decisión respecto a la Ho, es: A) p> 0,10; B) p< 0,025; C) p< 0,01.

SITUACIÓN 7. El Centro de Investigaciones Sociológicas (CIS) realiza constantes estudios sobre la


ideología e intención de voto de los españoles. Uno de los ítems que incluye en sus cuestionarios es el
de la “identificación ideológica”, para lo que se le pide al entrevistado que se ubique ideológicamente en
una escala de 1 a 10 (donde 1 significa extrema izquierda y 10 extrema derecha). En su última encuesta
a la población española la media aritmética obtenida para la variable identificación ideológica fue de un
4,86. Un psicólogo social interesado en estudiar esta temática en su localidad selecciona una muestra
aleatoria formada por 31 sujetos a los que aplica el ítem de identificación ideológica, obteniendo una
media de 5,40 y una cuasi-desviación típica de 1,2. Con esta información, responda a las siguientes
preguntas:

-4-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

1. Con un nivel de confianza del 95%, el tamaño de la muestra necesario para que el error de
estimación de la media en la escala de Identificación ideológica no supere 0,2 puntos, es: a) 150; b)
102; c) 138.
2. Con un nivel de confianza del 95%, el intervalo de confianza aproximado para la media en la escala
de identificación ideológica de los residentes en su localidad es: A) 4,98; 5,82; B) 5,03; 5,76; C) 4,952;
5,847.
3. De acuerdo a los objetivos del psicólogo, la hipótesis nula es: A) ; B) ; C)

4. El procedimiento que aplicaría para probar la hipótesis del psicólogo, es: A) la Prueba Z; B) la prueba t
con n-1 grados de libertad; C) la prueba Chi cuadrado con n-1 grados de libertad.
5. El estadístico de contraste para la hipótesis del psicólogo es: A) 2,352; B) 1,697; C) 2,5.
Si el psicólogo fija un nivel de significación de 0,05 el valor crítico para tomar una decisión respecto a
la hipótesis nula es: A) 1, 697; B) 1,96; C) 2,042.
6. Bajo el supuesto de que la H0 es verdadera, la probabilidad de obtener una muestra con una media
tan alejada o más de 5,39 es: A) p > 0,10; B) p < 0,001; C) p < 0,02.
7. Con los datos originales obtenidos en nuestra muestra, la decisión que toma respecto a la hipótesis
nula es: A) Rechazarla porque, bajo el supuesto de que fuera cierta, la probabilidad de obtener una
muestra con una media de 5,40 o superior es muy pequeña; B) Mantenerla porque el valor absoluto
del estadístico de contraste es menor que el valor absoluto del valor crítico; C) No se puede rechazar
la hipótesis nula.

SITUACIÓN 8. El “Síndrome Jubilación” es la situación que experimentan ciertas personas ante esta
nueva etapa vital con manifestaciones somáticas, psíquicas y sociales negativas que afectan la calidad de
vida del jubilado. Un estudio publicado por el GIE (Grupo de Investigación del Envejecimiento) mediante
una encuesta realizada en el 2006 utilizando una muestra de jubilados con edad media de 77,6 años y
desviación típica de 8,79 años encuentra que las manifestaciones psíquicas más frecuentes eran la
ansiedad (82%), el pesimismo (13,3%) y la depresión (4,7%) y que para el 32% de los expertos
consultados el apoyo psicológico constituye la estrategia de intervención más adecuada para superar
estos estados. Suponga que usted quiere estudiar la situación de los jubilados de su localidad respecto a
este "síndrome", para lo que utiliza una muestra aleatoria de 362 jubilados, con una edad media de 71,2
años y una desviación típica de 12,5 y de los cuales, el 59,8% presenta signos de ansiedad, el 35%
pesimismo y el 5,2% depresión.

1. Utilizando los datos del GIE y con un nivel de confianza del 95%: si le dicen que el intervalo de
confianza de la proporción de jubilados con manifestaciones de depresión, es un valor comprendido
entre 0,0387 (3,87%) y 0,0553 (5,53%), ¿Cuál es el tamaño más aproximado de la muestra que se ha
utilizado?: A) 1348; B) 2500; C) 3481.
2. Utilizando los datos de su estudio y con un nivel de confianza del 95%, la edad media de los jubilados
de su localidad es un valor comprendido, aproximadamente, entre: A) 69,9 y 72,5 años; B) 69,5 y 72,9
años; C) 70,2 y 73,1 años.
3. Con los datos de su estudio y un nivel de confianza del 99%, el intervalo de confianza para la
proporción de jubilados con manifestaciones psíquicas de ansiedad, es: A) 0,557 y 0,639; B) 0,547 y
0,648; C) 0,531 y 0,664.

-5-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

4. Si desea comprobar que la proporción de jubilados de su localidad con manifestaciones psíquicas de


pesimismo es significativamente mayor que el valor 0,133 facilitado por el GIE en el 2006, ¿cuál es,
aproximadamente, el valor del estadístico de contraste que obtendría?: A) 8,77; B) 10,3; C) 12,18.
5. Utilizando la información de su trabajo, si desea comprobar que la proporción de jubilados de su
localidad con manifestaciones psíquicas de pesimismo es significativamente mayor que el valor 0,133
facilitado por el GIE en el 2006, el nivel crítico que obtienes: A) es menor que 0,0002; B) es mayor
que 0,001; C) depende del nivel de confianza.

SITUACIÓN 9. El barómetro del CIS de marzo de 2012 realizado en 240 municipios de 48 provincias
señalaba que el 23,4% estaba en situación de paro y de éstos, a la pregunta ¿Y cree Ud. que es muy
probable, bastante, poco o nada probable que durante los próximos doce meses encuentre Ud. trabajo?,
el 22,6% manifestaba que “bastante probable”, frente al 43,1% que creía que “poco probable” y el
19,2% que “nada probable” y el resto “NS/NC”. Suponga que quiere estudiar si estos resultados se
reproducen actualmente en su localidad, para lo que realiza una encuesta sobre una muestra de 100
personas en situación de paro con una edad media de 39 años y desviación típica de 8,6 años de los
cuales 25 le responden que “bastante probable”, 35 responden que “poco probable” y 20 que “nada
probable” mientras que el resto “no saben o no contestan”.
1. Trabajando con un nivel de confianza del 95% y apoyándose en la distribución chi-cuadrado, el
intervalo de confianza de la varianza de la edad de las personas en situación de paro de su localidad
es un valor comprendido entre: A) 57,08 y 99,65; B) 6,64 y 11,59; C) 59,48 y 100,01.

Con los datos de su encuesta desea comprobar que la proporción de personas en paro que
consideran “poco probable” encontrar trabajo en los próximos doce meses en su localidad es
significativamente menor que el valor 43,1% proporcionados en el estudio del CIS:

2. ¿Cuál sería la hipótesis nula?: A) B) C) .


3. ¿Cuál sería el estadístico de contraste que utilizaría?: A) Z para dos muestras independientes con
varianzas poblacionales conocidas; B) Z como aproximación de la distribución binomial; C) t por
tratarse de una muestra grande con varianza poblacional desconocida.
4. ¿Cuál es el valor aproximado del estadístico de contraste de su hipótesis?: A) -1,70; B) -1,873;
C) -1,63.
5. ¿Cuál es el valor aproximado del nivel crítico?: A) 0,0516; B) 0,0734; C) 0,0307.
6. Su decisión respecto a la hipótesis formulada, es: A) rechazar la H0 con un nivel de confianza del 99%;
B) rechazar la H0 con un nivel de confianza del 95%; C) no se puede rechazar la H0 nula con un nivel
de confianza del 95%.
7. Con los datos de su encuesta y con un nivel de confianza del 95%, el intervalo de confianza para la
proporción de personas en situación de paro que considera “poco o nada probable” encontrar
trabajo en los próximos doce meses, es un valor comprendido entre: A) 0,256 y 0,443; B) 0,122 y
0,278; C) 0,452 y 0,647.
8. Si desea contrastar la hipótesis nula de que la edad media de los parados de su localidad es menor de
40 años, el estadístico de contraste que utilizaría es: A) Z por tratarse de una variable cuantitativa
con distribución normal; B) t por tratarse de una variable normalmente distribuida; C) t por tratarse
de una variable cuantitativa con varianza desconocida en la población.

-6-
Diseños de Investigación y Análisis de Datos. Problemas temas 1 y 2

SITUACIÓN 10. Un psicólogo que investiga la percepción del tiempo, considera que dicha
habilidad se encuentra deteriorada en los fumadores durante la retirada de nicotina, para lo
que toma una muestra aleatoria de 41 fumadores a los que somete a una abstinencia de
tabaco con una duración de 24 horas, pidiéndoles que estimen el tiempo transcurrido (en
segundos) en un periodo que, objetivamente, fue de 45 segundos. La media aritmética de la
muestra fue igual a 51 segundos con una cuasivarianza igual a 164. El psicólogo desea
determinar si la abstinencia tiene un impacto negativo sobre la percepción temporal,
provocando que el tiempo se sobre-estime. Nivel de confianza 95%.

1- La hipótesis nula que ha de plantear el psicólogo es: A) ; B) ; C)


.
2- El estadístico de contraste es igual a: A) 1; B) 2; C) 3.
3- El valor crítico es igual a: A) 1,303; B) 1,684; C) 2,2021.
4- Con los datos recogidos, ¿se rechaza la hipótesis nula?: A) Sí, porque el estadístico de
contraste es superior al valor crítico; B) Sí, porque el nivel de significación es menor que el
nivel crítico; C) No, porque el estadístico de contraste es menor que el valor crítico.
5- ¿Es significativo el estadístico de contraste?: A) No; B) Si para un nivel de confianza del 95%,
pero no para un nivel de confianza del 99%; C) Es significativo a un nivel de confianza del 99%.
6- ¿Cuál es el valor del nivel crítico p?: A) 0,005; B) menor que 0,005; C) 0,005 < p < 0,01.
7- Si hemos realizado un estudio donde el nivel crítico ha sido superior a α. A) Mantenemos la
hipótesis nula; B) Rechazamos la hipótesis nula; C) No tenemos información para mantener o
rechazar la hipótesis nula.
8- La probabilidad de mantener H0 falsa se denomina: A) nivel de significación; B) error de tipo II;
C) potencia del contraste.
9- Un estadístico cuyo valor medio es igual al valor de esta característica en la población, se dice
que es; A) eficiente; B) suficiente; C) insesgado.
10- Dados varios estadísticos insesgados para estimar la misma característica poblacional, la mejor
elección es utilizar el estadístico: A) con la desviación típica mas grande; B) con la desviación
típica más pequeña; C) con la media mas grande.

-7-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

SITUACIÓN 1. Para contrastar la hipótesis de si la edad media de inicio en el consumo de alcohol de los jóvenes
de una determinada comunidad es más tardía que la media de la población general establecida en 13 años, un
investigador utiliza una muestra de 25 jóvenes encontrando que la edad media en su comunidad es de 14 años
con una desviación típica insesgada de 2,8. Asumimos que la variable edad de inicio en el consumo de alcohol
se distribuye normalmente en la población.

1. A partir de la información de la muestra utilizada el intervalo de confianza más aproximado para la varianza
poblacional con un nivel de confianza del 95% es: A) 5,70; 14,41; B) 4,77; 15,17; C) 5,23; 15,13.

El intervalo de confianza para la varianza poblacional viene dado por la siguiente expresión:

2
(𝑛 − 1)𝑆𝑛−1 2
(𝑛 − 1)𝑆𝑛−1
2 < 𝜎2 <
𝜒1− 𝛼⁄ 𝜒𝛼2⁄
2 2

Para un nivel de confianza del 95%

2
(𝑛 − 1)𝑆𝑛−1 2
(𝑛 − 1)𝑆𝑛−1
2
2 < 𝜎 < 2
𝜒0,975 𝜒0,025

Buscando en la tabla y sustituyendo:

24 ∙ 2,82 2
24 ∙ 2,82
<𝜎 < → (4,77 < 𝜎 2 < 15,17)
39,3641 12,4012

2. La hipótesis nula para contrastar la hipótesis sobre la edad media en el consumo de alcohol es: A)
𝑯𝟎 : 𝝁 ≤ 𝟏𝟑; B) 𝐻0 : 𝜇 = 13; C) 𝐻0 : 𝜇 ≥ 13

3. Con los datos de la situación 1, el estadístico de contraste para poner a prueba la media es: A) 2,102; B) 1,78;
C) 1,59.
𝑌̅ − 𝜇0 14 − 13
𝑇= = = 1,786
𝑆𝑛−1 2,8
⁄ ⁄
√𝑛 √25

4. Conforme a los objetivos del investigador y un “alfa”= 0’05, la máxima diferencia que puede producirse por
simple azar, si 𝐻0 es cierta, entre la media observada en la muestra y la media planteada en la hipótesis nula,
expresado en unidades de desviación típica es: A) 2,064; B) 1,711; C) 2,79.

Nos piden el valor crítico. El contraste de hipótesis es unilateral derecho, luego tenemos que buscar en la
tabla “t” de Student para 24 grados de libertad (𝑛 − 1), la puntuación que supera una proporción igual a
0’95. La respuesta correcta es “B”.

5. La interpretación de los resultados obtenidos es que la edad media de inicio en el consumo de alcohol de los
jóvenes de la comunidad: A) es más tardía que la media general con un nivel de confianza del 95%; B) es
más tardía que la media general con un nivel de confianza del 99%; C) no es más tardía que la media general
con un nivel de confianza del 95%.

El estadístico de contraste es significativo a un nivel de confianza del 95% (1’786>1’711), pero no es


significativo al nivel de confianza del 99% (1’786<2’492).

-1-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

SITUACIÓN 2: La empresa SND's de sondeos electorales ha pronosticado que el nivel de apoyo que recibirá el
partido X en las próximas elecciones será del 40%. Desde el propio partido X se promueve un nuevo sondeo con
el fin de contrastar la veracidad de esta afirmación. Se elige al azar una muestra aleatoria de 400 personas, con
derecho a voto, de los cuales 128 manifiestan su intención de votar al partido X.

1- Con un nivel de confianza del 95%, el Intervalo de confianza aproximado de la proporción de personas que
votarán al partido X, es: A) 0,2743; 0,3657; B) 0,352; 0,424; C) 0,318; 0,322.

128
La proporción en la muestra es: 𝑝 = 400 = 0,32
Al nivel de confianza del 95%, las puntuaciones típicas son: ±1,96

𝑝(1 − 𝑝)
𝑝 ± 𝑍𝛼⁄2 √
𝑛

0,32(1 − 0,32)
0,32 ± 1,96√ → (0,2743; 0,3657)
400

2- La hipótesis alternativa es; A) 𝐻1 : 𝜋 < 0,40 ; B) 𝑯𝟏 : 𝝅 ≠ 𝟎, 𝟒𝟎; C) 𝐻1 : 𝜋 > 0,40.

El contraste es bilateral porque el enunciado no especifica si el partido X espera unos resultados inferiores o
superiores a los obtenidos por la empresas SND’s. Simplemente, el partido X pretende contrastar la veracidad
de los datos pronosticados por SND’s.

3- El estadístico de contraste es: A) -3,43; B) -3,266; C) -6,67.

𝑝 − 𝜋0 0,32 − 0,40
𝑍= = = −3,266
√𝜋0 (1 − 𝜋0 ) √0,40 ∙ 0,60
𝑛 400

4- Con un nivel de confianza del 99%, si los dirigentes del partido X considerasen que Ia proporción de apoyos
no alcanza el valor pronosticado por la empresa SND's, el valor crítico para rechazar la hipótesis nula, es: A)
-2,58; B) 1,64; C) -2,33.

Marcamos como correctas las opciones A y C, porque esta pregunta puede plantear problemas de
interpretación.

Si nos ceñimos al enunciado planteado para esta situación, el contraste es bilateral. Es decir, inicialmente el
partido X no sabe si el nivel de apoyo que recibirá será superior o inferior al pronosticado por la empresa
SND’s, pero “después” de realizar el estudio, observa que la proporción es inferior a 0,40. En este caso el
valor crítico es -2,58.

Por otro lado, podríamos interpretar que “antes” de realizar el estudio, el partido X considera que la
proporción de apoyos será inferior a la proporción pronosticada por SND’s, por lo que el contraste sería
unilateral y por lo tanto la respuesta correcta sería C.

-2-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

5- Para un contraste bilateral con un nivel de significación de 0,01, la conclusión es: A) Rechazar la hipótesis
nula con un nivel de significación del 0,01; B) No hay evidencias para rechazar la hipótesis nula con un nivel
de significación 0,05; C) No hay evidencias para rechazar la hipótesis nula con un nivel de significación 0,01.

Rechazamos la hipótesis nula al nivel de confianza del 99% porque el estadístico de contraste es menor que el
valor crítico (−3,266 < −2,58), luego la opción A es correcta, siendo las opciones B y C claramente
incorrectas.

SITUACIÓN 3: “La formación alcanzada por la población adulta española ha mejorado, de forma continua, en los
últimos 10 años. Desde 1998 el porcentaje de españoles de 25 a 64 años que poseen estudios superiores a los
obligatorios ha pasado de 33% al 51% en 2008. En la misma proporción ha disminuido, por tanto, el porcentaje
de españoles que sólo poseen estudios obligatorios, que ha pasado del 67% en 1998 al 49% en 2008”
(Panorama de la Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos son los que
realmente existen en su Comunidad, para lo que utiliza una muestra aleatoria de 900 adultos con edades
comprendidas entre 25 y 64 años, encontrando que 378 de ellos tienen solo los estudios obligatorios.

Los datos son:

Estudios Estudios Muestra:


superiores obligatorios 𝑛 = 900 378
1998 33% 67% }→𝑝= = 0,42
378 𝑐𝑜𝑛 𝑒𝑠𝑡𝑢𝑑𝑖𝑜𝑠 𝑜𝑏𝑙𝑖𝑔𝑎𝑡𝑜𝑟𝑖𝑜𝑠 900
2008 51% 49%

1- Si decide trabajar con un nivel de confianza del 95% y se establece el error máximo de estimación en el 3%,
¿cuál debe ser el tamaño de la muestra?: A) 1040; B) 544; C) 789.
2
𝑍1− 𝛼⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) = 0,42 ∙ 0,58 ∙ = 1039,79 ≈ 1040
𝐸2 0,032

2- Trabajando con un nivel de confianza del 95%, el intervalo de confianza de la proporción de adultos de su
Comunidad que solo tienen estudios obligatorios, se encuentra entre: A) 0,378 y 0,462; B) 0,388 y 0,452; C)
0,376 y 0,461.

𝑝(1 − 𝑝) 0,42 ∙ 0,58 0,388


𝑝 ± 𝑍1−𝛼⁄ √ → 0,42 ± 1,96√ →{
2 𝑛 900
0,452

3- Si el investigador quiere confirmar que la proporción de adultos de su Comunidad que solo tienen los
estudios obligatorios es significativamente inferior que el indicador de España en 2008, la hipótesis
alternativa es: A) 𝑯𝟏 : 𝝅 < 𝟎, 𝟒𝟗; B) 𝐻1 : 𝜋 > 0,49; C) 𝐻1 : 𝜋 ≤ 0,42.

La respuesta correcta es “A”, puesto que las hipótesis que debemos plantear son:

𝐻0 : 𝜋 ≥ 0,49
𝐻1 : 𝜋 < 0,49

-3-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

4- Si el investigador cree que la proporción de adultos que solo tienen los estudios obligatorios es inferior que
el indicador de España en 2008, el estadístico de contraste y el nivel crítico p para analizar si la diferencia es
estadísticamente significativa es: A) 3,34 (p=0,0008); B) -4,2 (p<0,0002); C) -2,33 (p=0,0198);

0,42 − 0,49 𝑇𝑎𝑏𝑙𝑎 𝑐𝑢𝑟𝑣𝑎 𝑛𝑜𝑟𝑚𝑎𝑙


𝑍= = −4,20 → 𝑝 < 0,0002
√0,49 ∙ 0,51
900

5- Respecto a la hipótesis del investigador analizada en las preguntas anteriores, el investigador concluye que
la proporción de adultos que solo tienen estudios obligatorios en su Comunidad, es: A) inferior a la del
resto de España con un nivel de significación de 0,01; B) la misma que la del resto de España con un nivel
de significación de 0,05; C) superior a la del resto de España con un nivel de significación de 0,01.

SITUACIÓN 4. “En Educación Primaria, la media de alumnos por clase en los centros públicos de España (19,7)
es más baja que en la OCDE (21,6) y que en la Unión Europea (20,3). En los centros privados ocurre lo contrario,
pues la media en España es de 24,4 frente a 20,8 de media de la OCDE y 19,1 de la UE”. (Panorama de la
Educación. Informe OCDE 2010). Suponga que usted quiere estudiar si estos datos difieren significativamente
de los que existen en su Comunidad. Asumiendo que la variable número de alumnos por clase se distribuye
normalmente, selecciona una muestra aleatoria de 100 aulas de educación primaria en centros públicos,
encontrando que la media de alumnos por clase es de 20,9 con una desviación típica poblacional de 5,8.

Los datos del enunciado son:

Media de alumnos por clase


España OCDE UE
Públicos 19,7 21,6 20,3
Privados 24,4 20,8 19,1

Datos de la muestra: 𝑛 = 100, 𝑌̅ = 20,9, 𝜎 = 5,8

1- Trabajando con un nivel de confianza del 95%, el intervalo de confianza para la media de alumnos por clase
en los centros públicos de su Comunidad es: A) 19,98; 21,8; B) 19,4; 22,39; C) 19,76; 22,04.

5,8
20,9 ± 1,96 → (19,76; 22,04)
√100
2- El procedimiento que aplicaría para contrastar si la media de los datos de su Comunidad es
significativamente menor que de la media de la OCDE es: A) la prueba t con n-1 grados de libertad; B) la
prueba z; C) la prueba de chi-cuadrado con n grados de libertad.

La distribución en la población es normal, el nivel de medida de la variable dependiente es de razón y


conocemos la varianza de la población, luego la respuesta correcta es B.

3- Si se decide trabajar con un nivel de confianza del 95% y se establece un error máximo de estimación en 1
punto, ¿Cuál debe ser el tamaño de la muestra? A) 129; B) 12923; C) 378.
2
(𝑍1−𝛼⁄2 ) 1,962
𝑛 = 𝜎2 = 5,82 = 129,23 ≈ 129
𝐸2 12

-4-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

4- El estadístico de contraste para analizar si la media de alumnos en los centros públicos de su Comunidad es
significativamente mayor que la media de España, toma el valor: A) 1,056; B) 1,261; C) 2,069.

𝑌̅ − 𝜇0 20,9 − 19,7
𝑍= 𝜎 = = 2,069 ≈ 2,07
⁄ 𝑛 5,8⁄
√ 10
5- Si sospecha que la media de los centros públicos de su Comunidad es significativamente mayor que la media
de España, el nivel crítico p es: A) p=0,1446; B) p< 0,05; C) p=0,0192.

Acudiendo a la tabla de curva normal, deducimos que la probabilidad de obtener valores iguales o más
extremos que el estadístico de contraste (2,07) es 0,0192, luego la respuesta correcta es C.

6- Teniendo en cuenta el estadístico de contraste obtenido ¿cuál de las siguientes sentencias es verdadera?: A)
no hay evidencia suficiente para rechazar que la media de alumnos por clase en los colegios públicos de la
Comunidad es igual a la media de España; B) La media de alumnos por clase en los colegios públicos de la
Comunidad es mayor que la media de España (NC= 95%); C) rechazamos la hipótesis nula con un nivel de
confianza del 99%.

Los resultados obtenidos son significativos a un nivel de confianza del 95% (2,069 > 1,64), pero no a un nivel
de confianza del 99% (2,069 < 2,33) luego la respuesta correcta es B.

7- Trabajando con un nivel de confianza del 95%, la interpretación del intervalo de confianza para la media de
alumnos por clase en los centros públicos de su Comunidad, le permite afirmar que la media de su
comunidad es: A) significativamente distinta que la de España pero igual que la de la UE; B)
significativamente distinta a la de la OCDE pero igual que la de España; C) significativamente distinta que la
de la UE pero igual que la de la OCDE.

El intervalo de confianza (19,76; 22,04) incluye a la media de la OCDE (21,6) y la media de la UE (20,3), pero
no incluye la media de España (19,7). Luego la respuesta correcta es A.

SITUACIÓN 5. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en estudiantes
de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7% éxtasis. Además, el
inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más tempranas. Así, mientras que en el
año 2004 la edad media de inicio para la cocaína era de 15,9 años en los hombres y 15,7 en las mujeres, en el
año 2008 disminuyó a 15,3 años y 15,2, respectivamente (ENCUESTA ESTATAL SOBRE USO DE DROGAS EN
ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los datos disponibles por un equipo de atención primaria que
cubre a un determinado sector de su municipio indican que en la muestra de 37 jóvenes varones y 41 mujeres
atendidos el pasado año, el 8% habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el
consumo de cocaína de 15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3
para los hombres y 1,1 en las mujeres.

Datos de encuestas estatales: Datos de la muestra:

2009 5,1% Cocaína 2,7% Éxtasis


Edad media consumo de cocaína 𝑛 𝑌̅ 𝑆𝑛
Hombres Mujeres Hombres 37 15,4 1,3 8%
2004 15,9 15,7 Mujeres 41 15,2 1,1 Cocaína
2008 15,3 15,2

-5-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

1- Bajo el supuesto de que la edad media de los hombres que han consumido cocaína al menos una vez, es de
15,9 años, el error típico de la distribución muestral de la media es: A) 0,453; B) 0,2166; C) 0,334.

En el caso de los hombres, el error típico de la distribución cuando no conocemos la varianza poblacional
viene dado por:
𝑆𝑛 1,3
= = 0,2167
√𝑛 − 1 √37 − 1

2- Si la hipótesis del investigador es que la edad media de inicio en el consumo de cocaína en los hombres de
su municipio ha disminuido significativamente respecto a los datos del 2004, el estadístico de contraste es:
A) -2,43; B) -2,7; C) -2,3.

Contraste unilateral de medias para una muestra (varones) varianza poblacional desconocida:
𝑌̅ − 𝜇0 15,4 − 15,9
𝑇= = = −2,31
𝑆𝑛 1,3
√𝑛 − 1 √37 − 1

3- A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95% ¿cuál es el tamaño de
la muestra necesario para estimar la proporción poblacional de jóvenes de su municipio que han consumido
cocaína al menos una vez con un error máximo de estimación del 2%?: A) 707; B) 1536; C) 978.

2
𝑧1− 𝛼⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) 2 = 0,08 ∙ (1 − 0,08) = 706,85 ≈ 707
𝐸𝑚𝑎𝑥 0,022

4- A partir de los datos obtenidos en la muestra y fijando un nivel de confianza del 95%, ¿entre qué valores se
encontrará la proporción poblacional de jóvenes de su municipio que han consumido cocaína al menos una
vez?: A) 0,71; 0,88; B) 0,02; 0,14; C) 0,04; 0,12.

𝑝(1 − 𝑝) 0,08(1 − 0,08)


𝐸𝑚𝑎𝑥 = 𝑧1−𝛼⁄2 √ = 1,96√ = 0,06
𝑛 37 + 41
0,14
𝑝 ± 𝐸𝑚𝑎𝑥 → 0,08 ± 0,06 {
0,02

5- Con un nivel de confianza del 95%, el intervalo de confianza de la varianza poblacional de la edad de las
mujeres de su municipio que han consumido al menos una vez cocaína es: A) 0,83; 2,03; B) 0,89; 1,87; C)
0,95; 1,23.

𝑛𝑆𝑛2 41 ∙ 1,12 𝑛𝑆𝑛2 41 ∙ 1,12


𝑙𝑖 = 2 = = 0,836 𝑙𝑠 = 2 = = 2,03
𝜒𝑛−1;1−𝛼⁄ 59,3417 𝜒𝑛−1;𝛼⁄ 24,4330
2 2

-6-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

6- Si desea contrastar la hipótesis de que la varianza poblacional de la edad de las mujeres de su municipio es
mayor que 1, el nivel crítico p que obtiene para tomar una decisión respecto a la 𝐻0 , es: A) p > 0,10; B) p <
0,05; C) p > 0,01.
𝑛𝑆𝑛2 41 ∙ 1,12
𝜒2 = 2 = = 49,61
𝜎0 1

Buscando en la Tabla de Chi-cuadrado observamos que para 40 grados de libertad, el valor 49,61 se
encuentra entre las puntuaciones:
29,05 que deja por encima de sí el 0,90 de la distribución
51,80 que deja por encima de sí el 0,10 de la distribución.
Luego sabemos que 49,61 deja por encima una proporción superior a 0,10.

SITUACIÓN 6. Según el último estudio del Observatorio Español sobre Drogas (2009), realizado en estudiantes
de Secundaria de 14 a 18 años, el 5,1% ha consumido cocaína alguna vez en la vida y el 2,7% éxtasis. Además, el
inicio en el consumo de cocaína y éxtasis tiene lugar cada vez a edades más tempranas. Así, mientras que en el
año 2004 la edad media de inicio para la cocaína era de 15,9 años en los hombres y 15,7 en las mujeres, en el
año 2008 disminuyó a 15,3 años y 15,2, respectivamente (ENCUESTA ESTATAL SOBRE EL USO DE DROGAS EN
ENSEÑANZAS SECUNDARIAS, 2009). Imagine que los datos disponibles por un equipo de atención primaria que
cubre un determinado sector de su municipio indican que con 41 jóvenes varones y 51 mujeres atendidos el
pasado año, el 8% habían consumido cocaína, al menos un vez, siendo la edad media de inicio en el consumo de
cocaína de 15,4 años en los hombres y de 15,2 años en las mujeres con una desviación típica de 1,3 años y 1,1
años, respectivamente.

Datos de encuestas estatales: Datos de la muestra:

2009 5,1% Cocaína 2,7% Éxtasis


𝑛 𝑌̅ 𝑆𝑛
Edad media consumo de cocaína
Hombres 41 15,4 1,3 8%
Hombres Mujeres
Mujeres 51 15,2 1,1 Cocaína
2004 15,9 15,7
2008 15,3 15,2

1. Bajo el supuesto de que el 8% de los jóvenes ha consumido cocaína al menos una vez, el error típico de la
distribución muestral de la proporción es: A) 0,901; B) 0,0282; C) 0,0417.

𝑝(1 − 𝑝) 0,08(1 − 0,08)


√ =√ = 0,02828
𝑛 41 + 51

2. Para comprobar si la edad media del inicio en el consumo de cocaína ha disminuido respecto a los datos del
2004, el estadístico de contraste que aplicaría, es: A) Z porque utilizamos una muestra grande proveniente
de una variable que se distribuye normalmente en la población; B) T porque desconocemos la varianza y la
forma de la distribución poblacional; C) El intervalo de confianza porque proporciona más información
sobre la seguridad al tomar una decisión.

-7-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

3. Si fijamos un nivel de confianza del 95%, ¿entre qué valores se encontrará la edad media del consumo de
cocaína en las mujeres de su municipio?: A) 14,887; 15,512; B) 14,941; 15,962; C) 14,682; 15,621.

Nos están pidiendo el intervalo de confianza (con 𝛼 = 0,05) para la edad media del consumo de cocaína en
las mujeres. Este viene dada por las fórmulas:

𝑆𝑛−1 1,1
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 2,009 = 0,3125
√𝑛 √51 − 1

15,5125
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 15,2 ± 0,3125 → {
14,8875

4. Si su hipótesis es que la edad media del inicio en el consumo de cocaína en los hombres de su municipio ha
disminuido respecto a los datos de 2004, el valor del estadístico de contraste que obtiene es: A) 2,34; B) -
3,11; C) -2,43.

Para el grupo de hombres el estadístico de contraste es:

𝑌̅ − 𝜇0 15,4 − 15,9
𝑇= = = −2,4325
𝑆𝑛 1,3
√𝑛 − 1 √41 − 1

5. Si desea contrastar la hipótesis de que la varianza poblacional en la edad de inicio del consumo de cocaína
en los hombres de su municipio es significativamente mayor que 1,1 el nivel crítico p que obtiene para tomar
una decisión respecto a la 𝐻0 , es: A) p> 0,10; B) p< 0,025; C) p< 0,01.

𝑛𝑆𝑛2 4,1 ∙ 1,32


𝜒2 = = = 62,99
𝜎02 1,1

En las tablas (𝑔. 𝑙. = 𝑛 − 1 = 40) no podemos encontrar el valor exacto, pero observamos que el estadístico
de contraste (62,99) se encuentra entre las puntuaciones 59,3417 y 63,6907 que dejan por encima de sí,
respectivamente unas probabilidades iguales a 0,025 y 0,01, luego la opción correcta es B.

SITUACIÓN 7. El Centro de Investigaciones Sociológicas (CIS) realiza constantes estudios sobre la ideología e
intención de voto de los españoles. Uno de los ítems que incluye en sus cuestionarios es el de la “identificación
ideológica”, para lo que se le pide al entrevistado que se ubique ideológicamente en una escala de 1 a 10
(donde 1 significa extrema izquierda y 10 extrema derecha). En su última encuesta a la población española la
media aritmética obtenida para la variable identificación ideológica fue de un 4,86. Un psicólogo social
interesado en estudiar esta temática en su localidad selecciona una muestra aleatoria formada por 31 sujetos a
los que aplica el ítem de identificación ideológica, obteniendo una media de 5,40 y una cuasi-desviación típica
de 1,2. Con esta información, responda a las siguientes preguntas:

-8-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

1- Con un nivel de confianza del 95%, el tamaño de la muestra necesario para que el error de estimación de la
media en la escala de Identificación ideológica no supere 0,2 puntos, es: A) 150; B) 102; C) 138.

2
𝑡𝑛−1;1− 𝛼⁄ 2,0422
2 2
𝑛= 𝑆𝑛−1 2 = 1,22 = 150,11 ≈ 150
𝐸𝑚𝑎𝑥 0,22

2- Con un nivel de confianza del 95%, el intervalo de confianza aproximado para la media en la escala de
identificación ideológica de los residentes en su localidad es: A) 4,98; 5,82; B) 5,03; 5,76; C) 4,952; 5,847.

𝑆𝑛−1 1,2
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 2,042 = 0,44
√𝑛 √31

5,84
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 5,40 ± 0,44 → {
4,96

3- De acuerdo a los objetivos del psicólogo, la hipótesis nula es: A) 𝑯𝟎 : 𝝁 = 𝟒, 𝟖𝟔; B) 𝐻0 : 𝜇 ≥ 4,86; C)
𝐻0 : 𝜇 ≤ 4,86

El contraste es bilateral, porque el psicólogo no parte de una hipótesis previa sobre los resultados de la
muestra.

4- El procedimiento que aplicaría para probar la hipótesis del psicólogo, es: A) la Prueba Z; B) la prueba t con
𝒏 − 𝟏 grados de libertad; C) la prueba Chi cuadrado con 𝑛 − 1 grados de libertad.

Tenemos un contraste sobre una media con una muestra de 31 sujetos y de la población no conocemos la
varianza.

5- El estadístico de contraste para la hipótesis del psicólogo es: A) 2,352; B) 1,697; C) 2,5.

𝑌̅ − 𝜇0 5,40 − 4,86
𝑇= = = 2,51
𝑆𝑛−1 1,2
√𝑛 √31

6- Si el psicólogo fija un nivel de significación de 0,05 el valor crítico para tomar una decisión respecto a la
hipótesis nula es: A) 1, 697; B) 1,96; C) 2,042.

Buscando en las tablas para un contraste bilateral: 𝑔. 𝑙. = 𝑛 − 1 = 30 y 𝛼⁄2 = 0,025

7- Bajo el supuesto de que la 𝐻0 es verdadera, la probabilidad de obtener una muestra con una media tan
alejada o más de 5,39 es: A) p > 0,10; B) p < 0,001; C) p < 0,02.

El valor en las tablas más próximo al estadístico de contraste (𝑇 = 2,51) corresponde a la puntuación 2,457,
que deja por debajo de sí una proporción igual a 0,990 (1 − 0,990 = 0,01 por encima). Como el contraste
es bilateral, se multiplica por dos la probabilidad obtenida en la tabla.

-9-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

8- Con los datos originales obtenidos en nuestra muestra, la decisión que toma respecto a la hipótesis nula es:
A) Rechazarla porque, bajo el supuesto de que fuera cierta, la probabilidad de obtener una muestra con
una media de 5,40 o superior es muy pequeña; B) Mantenerla porque el valor absoluto del estadístico de
contraste es menor que el valor absoluto del valor crítico; C) No se puede rechazar la hipótesis nula.

SITUACIÓN 8: El “Síndrome Jubilación” es la situación que experimentan ciertas personas ante esta nueva etapa
vital con manifestaciones somáticas, psíquicas y sociales negativas que afectan la calidad de vida del jubilado.
Un estudio publicado por el GIE (Grupo de Investigación del Envejecimiento) mediante una encuesta realizada
en el 2006 utilizando una muestra de jubilados con edad media de 77,6 años y desviación típica de 8,79 años
encuentra que las manifestaciones psíquicas más frecuentes eran la ansiedad (82%), el pesimismo (13,3%) y la
depresión (4,7%) y que para el 32% de los expertos consultados el apoyo psicológico constituye la estrategia de
intervención más adecuada para superar estos estados. Suponga que usted quiere estudiar la situación de los
jubilados de su localidad respecto a este "síndrome", para lo que utiliza una muestra aleatoria de 362 jubilados,
con una edad media de 71,2 años y una desviación típica de 12,5 y de los cuales, el 59,8% presenta signos de
ansiedad, el 35% pesimismo y el 5,2% depresión.

Datos del enunciado:


Proporción de:
Apoyo psicológico
Edad Ansiedad Pesimismo Depresión como
Mejor estrategia
GIE 𝑌̅ = 77,6 𝑆𝑛 = 8,79 0,82 0,133 0,047 0,32
𝑌̅ = 71,2 𝑆𝑛 = 12,5
Muestra 0,598 0,35 0,052 -
𝑛 = 362

1- Utilizando los datos del GIE y con un nivel de confianza del 95%: si le dicen que el intervalo de confianza de
la proporción de jubilados con manifestaciones de depresión, es un valor comprendido entre 0,0387 (3,87%)
y 0,0553 (5,53%), ¿Cuál es el tamaño más aproximado de la muestra que se ha utilizado?: A) 1348; B) 2500;
C) 3481.
Conociendo los límites superior e inferior del intervalo de confianza, deducimos fácilmente el error máximo:
𝑙𝑖 = 𝑝 − 𝐸 𝑙𝑠 − 𝑙𝑖 0,0553 − 0,0387
}→𝐸= = = 0,0083
𝑙𝑠 = 𝑝 + 𝐸 2 2
El tamaño de la muestra será igual a:

𝑧𝛼2⁄ 1,962
2
𝑛 = 𝑝(1 − 𝑝) = 0,047(1 − 0,047) = 2497,73 ≈ 2500
𝐸2 0,00832

2- Utilizando los datos de su estudio y con un nivel de confianza del 95%, la edad media de los jubilados de su
localidad es un valor comprendido, aproximadamente, entre: A) 69,9 y 72,5 años; B) 69,5 y 72,9 años; C)
70,2 y 73,1 años.

12,5
71,2 ± 1,96 → 71,2 ± 1,29 → (69,91; 72,49)
√362 − 1

-10-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

3- Con los datos de su estudio y un nivel de confianza del 99%, el intervalo de confianza para la proporción de
jubilados con manifestaciones psíquicas de ansiedad, es: A) 0,557 y 0,639; B) 0,547 y 0,648; C) 0,531 y 0,664.

0,598(1 − 0,598)
0,598 ± 2,58√ → (0,5315; 0,6645)
362

4- Si desea comprobar que la proporción de jubilados de su localidad con manifestaciones psíquicas de


pesimismo es significativamente mayor que el valor 0,133 facilitado por el GIE en el 2006, ¿cuál es,
aproximadamente, el valor del estadístico de contraste que obtendría?: A) 8,77; B) 10,3; C) 12,18.

𝑝 − 𝜋0 0,35 − 0,133
𝐻0 : 𝜋 ≤ 0,133 𝑧= = = 12,158
𝐻1 : 𝜋 > 0,133 √𝜋0 (1 − 𝜋0 ) √0,133(1 − 0,133)
𝑛 362

5- Utilizando la información de su trabajo, si desea comprobar que la proporción de jubilados de su localidad


con manifestaciones psíquicas de pesimismo es significativamente mayor que el valor 0,133 facilitado por el
GIE en el 2006, el nivel crítico que se obtiene: A) es menor que 0,0002; B) es mayor que 0,001; C) depende
del nivel de confianza.

El estadístico de contraste es un valor muy extremo (z = 12,158). El valor máximo que podemos consultar en
las tablas de curva normal es z = 3,59, que deja por encima de sí una proporción: p = 0,0002

SITUACIÓN 9: El barómetro del CIS de marzo de 2012 realizado en 240 municipios de 48 provincias señalaba
que el 23,4% estaba en situación de paro y de éstos, a la pregunta ¿Y cree Ud. que es muy probable, bastante,
poco o nada probable que durante los próximos doce meses encuentre Ud. trabajo?, el 22,6% manifestaba que
“bastante probable”, frente al 43,1% que creía que “poco probable” y el 19,2% que “nada probable” y el resto
“NS/NC”. Suponga que quiere estudiar si estos resultados se reproducen actualmente en su localidad, para lo
que realiza una encuesta sobre una muestra de 100 personas en situación de paro con una edad media de 39
años y desviación típica de 8,6 años de los cuales 25 le responden que “bastante probable”, 35 responden que
“poco probable” y 20 que “nada probable” mientras que el resto “no saben o no contestan”.

Pregunta: ¿probabilidad de encontrar


Datos de la Situación 1
trabajo en los próximos doce meses?

Bastante Poco Nada NS/NC

CIS 0,234 en paro 0,226 0,431 0,192 0,151

Encuesta investigador 𝑌̅ = 39; 𝑆𝑛 = 8,6; 𝑛 = 100 0,25 0,35 0,20 0,20

-11-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

1- Trabajando con un nivel de confianza del 95% y apoyándose en la distribución chi-cuadrado, el intervalo de
confianza de la varianza de la edad de las personas en situación de paro de su localidad es un valor
comprendido entre: A) 57,08 y 99,65; B) 6,64 y 11,59; C) 59,48 y 100,01.

𝑛𝑆𝑛2 𝑛𝑆𝑛2 100 ∙ 8,62 100 ∙ 8,62


2 < 𝜎2 < → < 𝜎2 < → 57,085 < 𝜎 2 < 99,65
𝜒1− 𝛼⁄ 𝜒𝛼2⁄ 129,5612 74,2219
2 ,𝑛−1 2 ,𝑛−1

Con los datos de su encuesta desea comprobar que la proporción de personas en paro que consideran “poco
probable” encontrar trabajo en los próximos doce meses en su localidad es significativamente menor que el valor
43,1% proporcionados en el estudio del CIS:

2- ¿Cuál sería la hipótesis nula?: A) 𝐻𝑜 : 𝜋 ≤ 0,431; B) 𝑯𝒐 : 𝝅 ≥ 𝟎, 𝟒𝟑𝟏; C) 𝐻𝑜 : 𝜋 = 0,431.


3- ¿Cuál sería el estadístico de contraste que utilizaría?: A) Z para dos muestras independientes con varianzas
poblacionales conocidas; B) Z como aproximación de la distribución binomial; C) t por tratarse de una
muestra grande con varianza poblacional desconocida.
4- ¿Cuál es el valor aproximado del estadístico de contraste de su hipótesis?: A) -1,70; B) -1,873; C) -1,63
𝑝 − 𝜋0 0,35 − 0,431
𝑧= = = −1,636
√𝜋0 (1 − 𝜋0 ) √0,431(1 − 0,431)
𝑛 100
5- ¿Cuál es el valor aproximado del nivel crítico?: A) 0,0516; B) 0,0734; C) 0,0307.
Buscando en las tablas de curva normal la probabilidad de encontrar valores inferiores a: z = -1,63,
comprobamos que la respuesta correcta es A.
6- Su decisión respecto a la hipótesis formulada, es: A) rechazar la 𝐻0 con un nivel de confianza del 99%; B)
rechazar la 𝐻0 con un nivel de confianza del 95%; C) no se puede rechazar la 𝑯𝟎 nula con un nivel de
confianza del 95%.
Los valores críticos para los niveles de confianza del 95 y 99% son, respectivamente: z = -1,64 y z = -2,33, por
lo que no podemos rechazar la hipótesis nula.
7- Con los datos de su encuesta y con un nivel de confianza del 95%, el intervalo de confianza para la
proporción de personas en situación de paro que considera “poco o nada probable” encontrar trabajo en los
próximos doce meses, es un valor comprendido entre: A) 0,256 y 0,443; B) 0,122 y 0,278; C) 0,452 y 0,647.
La proporción de personas que consideran “poco o nada probable” encontrar trabajo es: p = 0,35 + 0,20 =
0,55

0,55(1 − 0,55)
0,55 ± 1,96√ → (0,4525; 0,6475)
100

8- Si desea contrastar la hipótesis nula de que la edad media de los parados de su localidad es menor de 40
años, el estadístico de contraste que utilizaría es: A) Z por tratarse de una variable cuantitativa con
distribución normal; B) t por tratarse de una variable normalmente distribuida; C) t por tratarse de una
variable cuantitativa con varianza desconocida en la población.

-12-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

SITUACIÓN 10. Un psicólogo que investiga la percepción del tiempo, considera que dicha habilidad se
encuentra deteriorada en los fumadores durante la retirada de nicotina, para lo que toma una muestra
aleatoria de 41 fumadores a los que somete a una abstinencia de tabaco con una duración de 24 horas,
pidiéndoles que estimen el tiempo había transcurrido (en segundos) en un periodo que, objetivamente, fue
de 45 segundos. La media aritmética de la muestra fue igual a 51 segundos con una cuasivarianza igual a
164. El psicólogo desea determinar si la abstinencia tiene un impacto negativo sobre la percepción temporal,
provocando que el tiempo se sobre-estime. Nivel de confianza 95%.

1- La hipótesis nula que ha de plantear el psicólogo es: A) 𝑯𝟎 : 𝝁 ≤ 𝟒𝟓; B) 𝐻0 : 𝜇 = 45; C) 𝐻0 : 𝜇 ≥ 45.

Dado que el psicólogo desea comprobar si el tiempo se sobre-estima, hemos de plantear un contraste
unilateral derecho, cuyas hipótesis son:
𝐻0 : 𝜇 ≤ 45
𝐻1 : 𝜇 > 45

2- El estadístico de contraste es igual a: A) 1; B) 2; C) 3.

𝑌̅ − 𝜇0 51 − 45
𝑇= = =3
𝑆𝑛−1 164

√𝑛 41

3- El valor crítico es igual a: A) 1,303; B) 1,684; C) 2,2021.

4- Con los datos recogidos, se rechaza la hipótesis nula: A) Sí, porque el estadístico de contraste es superior al
valor crítico; B) Sí, porque el nivel de significación es menor que el nivel crítico; C) No, porque el estadístico
de contraste es menor que el valor crítico.

5- ¿Es significativo el estadístico de contraste?: A) No; B) Si para un nivel de confianza del 95%, pero no a un
nivel de confianza del 99%; C) Es significativo a un nivel de confianza del 99%.

El estadístico de contraste (𝑇 = 3) supera un nivel de confianza del 95% (3 > 1,684), pero también supera
un nivel de confianza del 99% (3 > 2,423), luego la respuesta correcta es C.

6- ¿Cuál es el valor del nivel crítico p?: A) 0,005; B) menor que 0,005; C) 0,005 < p < 0,01.

El valor más extremo que podemos consultar en las tablas t de Student, para 40 grados de libertad, es 2,704,
que deja por encima de sí una probabilidad igual a: 0,005, luego el estadístico de contraste (𝑇 = 3) que es
todavía más extremo, dejará por encima de sí una probabilidad menor que 0,005

7- Si hemos realizado un estudio donde el nivel crítico ha sido superior a α. A) Mantenemos la hipótesis nula;
B) Rechazamos la hipótesis nula; C) No tenemos información para mantener o rechazar la hipótesis nula.

8- La probabilidad de mantener 𝐻0 falsa se denomina: A) nivel de significación; B) error de tipo II; C) potencia
del contraste.

La probabilidad pedida es el error de tipo II, que también podemos definir como la probabilidad de rechazar
𝐻1 verdadera.

9- Un estadístico cuyo valor medio es igual al valor de esta característica en la población, se dice que es; A)
eficiente; B) suficiente; C) insesgado.

-13-
Diseños de investigación y análisis de datos. Soluciones problemas temas 1 y 2

10- Dados varios estadísticos insesgados para estimar la misma característica poblacional, la mejor elección es
utilizar el estadístico: A) con la desviación típica mas grande; B) con la desviación típica más pequeña; C) con
la media mas grande.

La respuesta correcta es B, puesto que el estimador con la desviación típica más pequeña es el más eficiente.

-14-
Diseños de experimentos y análisis de datos. Enunciados de preguntas teóricas temas 3 y 4

1- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en


muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas; C) ninguna de las anteriores es correcta.

2- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

3- Si trabajamos con dos grupos siendo los tamaños de las muestras: n1 = 30 y n2 =35, sabemos
que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C) las
muestras son independientes.

4- Para comprobar si la diferencia entre dos medias es significativa, calculamos: A) el estadístico


de contraste; B) el tamaño del efecto; C) las dos opciones anteriores son verdaderas.

5- Si en un contraste unilateral sobre dos medias con varianzas desconocidas obtenemos un


estadístico de contraste “T” igual a cero, podemos deducir que el nivel crítico es: A) 0,5; B) 1;
C) No podemos saber cuál es el valor exacto.

6- Si en un contraste unilateral sobre dos medias con varianzas desconocidas obtenemos un


estadístico de contraste “T” igual a cero, podemos deducir que el nivel crítico es: A) 0,5; B) 1;
C) No podemos saber cuál es el valor exacto.

7- En un contraste sobre dos proporciones con muestras relacionadas, cuál de los siguientes
estadísticos es insensible a la dirección del cambio producido: A) Chi cuadrado de la prueba de
McNemar; B) el estadístico Z; C) no es correcta ninguna de las opciones anteriores.

8- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

9- En el caso de que la variable dependiente estuviese medida en una escala ordinal: A)


habríamos tenido que transformarla a escala de intervalo utilizando puntuaciones Z; B)
tendríamos que haber utilizado un contraste no paramétrico; C) habríamos tenido que utilizar
un ANOVA para el análisis de estos datos.

-1-
Diseños de experimentos y análisis de datos. Preguntas teóricas temas 3 y 4

1- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en


muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas; C) ninguna de las anteriores es correcta.

2- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

3- Si trabajamos con dos grupos siendo los tamaños de las muestras: n1 = 30 y n2 =35, sabemos
que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas; C) las
muestras son independientes.

4- Para comprobar si la diferencia entre dos medias es significativa, calculamos: A) el estadístico


de contraste; B) el tamaño del efecto; C) las dos opciones anteriores son verdaderas.

5- Si en un contraste unilateral sobre dos medias con varianzas desconocidas obtenemos un


estadístico de contraste “T” igual a cero, podemos deducir que el nivel crítico es: A) 0,5; B) 1;
C) No podemos saber cuál es el valor exacto.

6- Si en un contraste unilateral sobre dos medias con varianzas desconocidas obtenemos un


estadístico de contraste “T” igual a cero, podemos deducir que el nivel crítico es: A) 0,5; B) 1;
C) No podemos saber cuál es el valor exacto.

7- En un contraste sobre dos proporciones con muestras relacionadas, cuál de los siguientes
estadísticos es insensible a la dirección del cambio producido: A) Chi cuadrado de la prueba de
McNemar; B) el estadístico Z; C) no es correcta ninguna de las opciones anteriores.

8- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

9- En el caso de que la variable dependiente estuviese medida en una escala ordinal: A)


habríamos tenido que transformarla a escala de intervalo utilizando puntuaciones Z; B)
tendríamos que haber utilizado un contraste no paramétrico; C) habríamos tenido que utilizar
un ANOVA para el análisis de estos datos.

-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

SITUACIÓN 1. Se pretende comprobar si los profesionales que llevan menos de cinco años en una empresa
(Grupo 1) poseen mayores aspiraciones que las personas que llevan cinco o más años (Grupo 2). Para ello se
entrevista a 32 personas que llevan menos de cinco años y a otras 32 personas que llevan cinco o más años,
todas ellas elegidas al azar. Los resultados mostraron que dentro del primer grupo se identificó a 18 personas
con altas aspiraciones, mientras que en el segundo grupo se identificaron a 14 personas con altas aspiraciones.
Nivel de confianza 95%.

1- La hipótesis alternativa es: A) 𝜋1 − 𝜋2 ≠ 0; B) 𝜋1 − 𝜋2 < 0; C) 𝜋1 − 𝜋2 > 0

2- El valor del estadístico de contraste es: A) 0,5; B) 1; C) 2.

3- El valor crítico es igual a: A) 1,64; B) 1,96; C) 2,33.

4- El nivel crítico p es igual a: A) 0,1587; B) 0’3174; C) 0’8413.

5- La decisión correcta es: A) Rechazar la hipótesis nula porque el nivel crítico p es menor que el nivel de
significación; B) Mantener la hipótesis nula porque el estadístico de contraste es menor que el valor crítico;
C) ninguna de las anteriores es correcta.

6- A un nivel de confianza del 95% concluimos que: A) los profesionales que llevan menos de cinco años
trabajando poseen mayores aspiraciones que el grupo que lleva trabajando 5 o más años; B) los
profesionales que llevan 5 o más años trabajando poseen mayores aspiraciones que el grupo que lleva
menos de 5 años; C) no existen diferencias en cuanto a las aspiraciones profesionales entre los dos grupos.

SITUACIÓN 2. En un estudio cuyo objeto es evaluar el efecto de la música clásica sobre la capacidad de
concentración disponemos de 62 sujetos con los que formamos de manera aleatoria dos grupos de 31 sujetos
cada uno. Al primero de ellos (Grupo 1) se le sometió a una prueba de concentración escuchando música clásica
y al segundo (Grupo 2) se le sometió a la misma prueba en condiciones normales de silencio. La puntuación
media para el Grupo 1 fue de 86 puntos con una cuasivarianza igual a 150. El Grupo 2 obtuvo una media
aritmética igual a 80 puntos y una cuasivarianza igual a 129. Sabiendo que la variable dependiente está medida
en una escala de intervalo, asumiendo varianzas poblacionales iguales y con un nivel de confianza del 9S%
¿podemos afirmar que la media en concentración es superior para el grupo que escuchó música clásica?

1- La hipótesis nula es: A) 𝐻0 : 𝜇1 − 𝜇2 ≤ 0; B) 𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝐻0 : 𝜇1 − 𝜇2 ≥ 0.

2- El valor del estadístico de contraste es, aproximadamente: A) 1,671; B) 2; C) 0,508.

3- El tamaño del efecto es Igual a: A) 1,671; B) 2; C) 0,508.

4- El valor crítico es igual a: A) 1,671; B) 2; C) 0,508.

5- El nivel crítico p es igual a: A) entre 0,05 y 0,10; B) entre 0,05 y 0,95; C) 0,025.

6- Rechazamos la hipótesis nula porque: A) el nivel de significación es menor que el nivel crítico p; B) el
estadístico de contraste es mayor que el valor crítico; C) no rechazamos la hipótesis nula.

-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

SITUACIÓN 3: En una tarea sobre decisión léxica con estímulos visuales en la que se miden tiempos de reacción,
un investigador dispone de una muestra aleatoria de 26 sujetos. Utiliza dos grupos de palabras y parte de la
hipótesis de que los tiempos de reacción serán más cortos ante palabras de alta frecuencia léxica (aquellas que
utilizamos más frecuentemente en el lenguaje, Grupo 1) que ante palabras de baja frecuencia léxica (Grupo 2).
Tras realizar el experimento observa que el tiempo de reacción medio para el Grupo 1 fue igual a 612,04 ms,
mientras que para el Grupo 2 fue igual a 645 ms, siendo la cuasivarianza de las diferencias igual a 6656 ms 2.
Asumiendo que se cumplen los supuestos para realizar un contraste paramétrico, conteste a las siguientes
cuestiones:

1- El nivel de medida de la variable dependiente es: A) ordinal; B) de intervalo; C) de razón.

2- La hipótesis nula es: A) 𝐻0 : 𝜇1 − 𝜇2 ≥ 0; B) 𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝐻0 : 𝜇1 − 𝜇2 ≤ 0.

3- La hipótesis alternativa es: A) 𝐻1 : 𝜇1 − 𝜇2 ≥ 0; B) 𝐻1 : 𝜇1 − 𝜇2 < 0; C) 𝐻1 : 𝜇1 − 𝜇2 > 0.

4- El valor absoluto del estadístico de contraste es: A) 1,708; B) 2,06; C) 2,485.

5- Para un nivel de confianza del 95%, el valor absoluto del valor crítico es: A) 1,708; B) 2,06; C) 2,485.

6- El valor del nivel crítico p es: A) 0,05; B) 0,025; C) 0,01.

7- El resultado del experimento: A) no es significativo; B) es significativo al nivel de confianza del 95%; C) es


significativo al 95% y al 99%.

SITUACIÓN 4: Para comparar la eficacia de dos terapias (“A” y “B”) utilizadas para tratar el trastorno de
personalidad “X”, se toma una muestra aleatoria de 400 personas que sufren el trastorno “X”, formándose dos
grupos al azar de 200 personas cada uno. Al primer grupo se le aplica la terapia “A”, siendo 172 personas las
que se recuperan, mientras que al aplicar la terapia “B” se recuperan 148 personas. Con un nivel de confianza
del 95%, ¿son las dos terapias igualmente eficaces?

1- La hipótesis nula es: A) 𝐻0 : 𝜋𝐴 − 𝜋𝐵 ≤ 0; B) 𝐻0 : 𝜋𝐴 − 𝜋𝐵 = 0; C) 𝐻0 : 𝜋𝐴 − 𝜋𝐵 ≥ 0

2- El valor absoluto del estadístico de contraste es: A) 1,96; B) 2,58; C) 3.

3- El valor absoluto del valor crítico es: A) 1,96; B) 2,58; C) 3.

4- El nivel crítico p es igual a: A) 0,0013; B) 0,0026; C) 0,9987.

5- Rechazamos la hipótesis nula porque: A) El valor absoluto del estadístico de contraste es superior al valor
absoluto del valor crítico; B) el nivel de significación es menor que el nivel de confianza; C) el nivel crítico p es
menor que el nivel de confianza.

6- ¿Se desprende de los resultados obtenidos que las dos terapias son igualmente eficaces? A) Si, porque
hemos aceptado la hipótesis alternativa; B) No, porque los resultados no son significativos; C) No, porque el
valor del estadístico de contraste es estadísticamente significativo.

7- Indique para qué niveles de confianza obtendremos resultados significativos: A) 95% y 99%; B) 99% y 99,9%;
C) para cualquier nivel de confianza.

-2-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

SITUACIÓN 5: En una tarea de reconocimiento de palabras, un investigador mantiene la hipótesis de que los
estudiantes de carreras de “letras” tardarán menos que los estudiantes de “ciencias” en reconocer los estímulos
presentados. Tras seleccionar dos muestras aleatorias de 31 observaciones cada una, y registrar el tiempo de
reacción, obtiene una media aritmética igual a 653,2 ms para el grupo de estudiantes de ciencias (Grupo 1) y de
600 ms para el grupo de estudiantes de letras (Grupo 2), siendo la cuasivarianza igual en ambas muestras, con
un valor de 6200 ms2. Con un nivel de confianza del 95%, conteste a las siguientes cuestiones:

1- Si queremos comprobar si las varianzas de ambas poblaciones son iguales o diferentes, observaremos que el
valor del estadístico de contraste: A) no es significativo; B) es significativo; C) es significativo al nivel de
confianza del 95%, pero no al 99%.

2- Para comprobar la hipótesis del investigador, la hipótesis nula planteada es: A) 𝐻0 : 𝜇1 − 𝜇2 ≥ 0; B)


𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝐻0 : 𝜇1 − 𝜇2 ≤ 0.

3- El valor del estadístico de contraste es: A) 0,6756; B) 1,671; C) 2,66.

4- El valor crítico es igual a: A) 0,6756; B) 1,671; C) 2,66.

5- El tamaño del efecto es igual a: A) 0,6756; B) 1,671; C) 2,66.

6- El nivel crítico p es igual a: A) 0’05; B) 0’01; C) 0’005.

7- Aceptamos la hipótesis alternativa porque: A) el valor del estadístico de contraste es menor que el nivel
crítico p; B) el nivel crítico p es menor que el nivel de significación; C) el nivel crítico p es mayor que el valor
crítico.

8- ¿Podemos concluir que los resultados obtenidos avalan la hipótesis del investigador? A) Si; B) No; C) los
resultados son significativos al nivel de confianza del 95%, pero no del 99%.

SITUACIÓN 6. En un estudio piloto para un nuevo tratamiento contra el SIDA (Thompson, 1991), se midieron
diversas variables en 27 pacientes con SIDA. Entre ellas el número de células T-4 sanguíneas al inicio del
tratamiento y 90 días más tarde. Los resultados fueron: 𝑌̅0 𝑑𝑖𝑎𝑠 = 324; 𝑌̅90 𝑑𝑖𝑎𝑠 = 334,4. Por estudios
anteriores se sabe que la varianza poblacional de las diferencias en el contaje de células T-4 vale 150.
Asumiendo un nivel de confianza del 95%, conteste a las siguientes cuestiones:

1- Se trata de un diseño: A) de dos grupos dependientes; B) de más de dos grupos dependientes; C) de dos
grupos independientes.

2- La hipótesis nula en el caso de las medias es: A) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 = 𝜇90 𝑑𝑖𝑎𝑠 ; B) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 ≥ 𝜇90 𝑑𝑖𝑎𝑠 ; C)
𝐻0 : 𝜋0 𝑑𝑖𝑎𝑠 ≤ 𝜋90 𝑑𝑖𝑎𝑠

3- El valor del estadístico de contraste para comprobar si al inicio del tratamiento los sujetos tienen el mismo
número de células T-4 que al final del mismo es igual a: A) 1,045; B) -4,41; C) 1,841.

4- Los valores críticos que delimitan la zona de aceptación de 𝐻0 son: A) −1,05 𝑦 1,05; B) −1,96 𝑦 1,96; C)
−1,65 𝑦 1,65.

-3-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

5- El investigador: A) acepta 𝐻0 ya que el intervalo de confianza de la media incluye la media de las diferencias
entre ambas muestras; B) rechaza 𝐻0 porque la Z calculada es inferior al valor crítico; C) rechaza 𝐻1 ya que el
estadístico de contraste calculado se encuentra en la zona de rechazo.

6- Si el investigador hubiera vuelto a realizar una nueva medición del número de células T-4 180 días después
de iniciado el tratamiento, deberíamos aplicar como técnica de análisis: A) un ANOVA de medidas
independientes de un factor; B) un ANOVA de dos factores con interacción; C) un ANOVA de medidas
repetidas de un factor con tres niveles.

SITUACIÓN 7. Un psicólogo, sospecha que los alumnos de cuarto de grado (Grupo 1) presentan una media
superior y más variabilidad que los alumnos de primer curso de grado (Grupo 2) en la variable “autoestima”.
Para comprobar estas hipótesis selecciona dos muestras aleatorias de igual tamaño (𝑛1 = 𝑛2 = 31) a las que
aplica un test de autoestima. Los resultados fueron: 𝑌̅1 = 22,16, 𝑆̂12 = 76,42 para el Grupo 1 y 𝑌̅2 = 20,07,
𝑆̂22 = 47,58 para el Grupo 2. Asumiendo un nivel de confianza del 95% conteste a las siguientes cuestiones:

𝜎2 𝜎2 𝜎2
1- La hipótesis nula en el caso de las varianzas es: A) 𝐻0 : 𝜎12 = 1; B) 𝐻0 : 𝜎12 ≤ 1; C) B) 𝐻0 : 𝜎12 ≥ 1
2 2 2

2- El valor del estadístico de contraste para comprobar si los sujetos del Grupo 1 presentan más variabilidad
que los sujetos del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,841.

3- Asumiendo igualdad de varianzas poblacionales, el valor del estadístico de contraste para comprobar si la
media del Grupo 1 es superior a la media del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,671.

4- El nivel crítico en el caso del contraste sobre las varianzas es igual a: A) 0,05; B) 0,10; C) 0,15.

5- El nivel crítico en el caso del contraste sobre las medias es igual a: A) 0,05; B) 0,10; C) 0,15.

6- El tamaño del efecto en el caso del contraste sobre medias es igual a: A) 1,045; B) 0,265; C) 0,15.

7- Nuestro psicólogo mantiene la hipótesis nula: A) Para el contraste de las varianzas pero no para el contraste
de medias; B) Para el contraste de medias pero no para el contraste de varianzas; C) En ambos casos, tanto
en el caso de las medias, como en el caso de las varianzas.

SITUACIÓN 8: El equipo docente de una determinada asignatura quiere comprobar la eficacia de un material
docente nuevo respecto al utilizado en convocatorias anteriores. Selecciona una muestra aleatoria de 64
alumnos, con los que forma dos grupos de igual tamaño también al azar. A los sujetos del Grupo 1 les
proporciona en nuevo material, mientras que los del Grupo 2 trabajan con el material antiguo. El equipo
docente tiene la hipótesis de que con el nuevo material las notas serán más elevadas. Tras el examen de fin de
curso los alumnos del Grupo 1 obtienen una nota media igual a 7, con una cuasivarianza igual a 15, mientras
que para el Grupo 2 la media es igual a 5,2 y la cuasivarianza igual a 17.

1- Si con un nivel de confianza del 95% realizamos un contraste de hipótesis para comprobar si las varianzas
poblacionales son iguales o diferentes, aceptaremos: A) la hipótesis nula; B) la hipótesis alternativa; C) No
podemos saber qué cuasivarianza hay que poner en el numerador del estadístico de contraste.

2- Si realizamos un contraste de hipótesis sobre las medias para comprobar la hipótesis del equipo docente, el
estadístico de contraste vale: A) 2; B) 1,8; C) 1,67.

-4-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

3- El tamaño del efecto es igual a: A) 1,8; B) 0,90; C) 0,45.

4- Con un nivel de confianza del 95%, suponiendo que la hipótesis nula sobre el contraste de medias es cierta,
la probabilidad de obtener un valor igual o superior al estadístico de contraste que hemos obtenido: A) se
encuentra comprendida entre 0,01 y 0,025; B) se encuentra comprendida entre 0,025 y 0,05; C) es igual a
0,05.

5- Si trabajamos con un nivel de confianza del 95%, la probabilidad de rechazar la hipótesis nula suponiendo
que es cierta es igual a: A) se encuentra comprendida entre 0,01 y 0,025; B) es igual a 0,05; C) es igual a 0,95.

6- Tomando de las tablas el valor más próximo para los grados de libertad, el intervalo de confianza para la
diferencia de medias, para un nivel de confianza del 95% viene definido por los valores: A) 0,2 𝑦 3,8; B)
−0,2 𝑦 − 3,8; C) −0,2 𝑦 3,8.

7- El estadístico de contraste obtenido para contrastar la hipótesis del equipo docente: A) no es significativo; B)
Es significativo al nivel de confianza del 99%; C) es significativo al nivel de confianza del 95%.

SITUACIÓN 9: Un psicólogo imparte una conferencia a una muestra de 200 fumadores en la que les expone un
tratamiento para abandonar este hábito. También pregunta a los sujetos, antes y después de la conferencia,
que cuantifiquen en una escala de 0 a 10 si se sienten capaces de dejar de fumar tras recibir el tratamiento,
donde el cero indicaría que no se sienten capaces de ninguna forma y 10 que lo lograrán con absoluta certeza.
Antes de la conferencia, la mitad de los sujetos de la muestra están dispuestos a seguir el tratamiento. Tras la
conferencia, encuentra que 80 personas que estaban dispuestas a seguir la terapia mantienen la idea de
hacerlo, y que otras 80 personas que no estaban dispuestas a seguir la terapia han cambiado de opinión. El
psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia sea mayor tras la
conferencia. Respecto a la pregunta que plantea el psicólogo a los sujetos, se encuentra que aquellos que no se
sentían capaces de dejar de fumar antes de la conferencia obtienen una media superior después de la
conferencia, siendo dicha media un punto superior a la media antes de la conferencia y la cuasidesviación típica
de las diferencias es igual a 5. Con un nivel de confianza del 95%.

1- El valor absoluto del estadístico de contraste “Z” para comprobar la hipótesis del psicólogo es igual a: A)
1,64; B) 2,33; C) 6.

2- Si la hipótesis nula es cierta, la probabilidad de obtener un estadístico de contraste igual o más extremo que
el obtenido: A) es igual a 0,05; B) es igual a 0,95; C) es menor que 0,0002.

3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,64; B) 1,96; C) 2,33.

4- La hipótesis que antes de la conferencia tenía el psicólogo: A) queda confirmada porque mantenemos la
hipótesis nula; B) queda confirmada porque el nivel crítico es menor que el error de tipo I; C) queda
confirmada porque el nivel crítico es mayor que el valor crítico.

Si queremos comprobar que la media de los sujetos que inicialmente no están dispuestos a seguir el
tratamiento es superior después de la conferencia, y con un nivel de confianza del 95%:

5- El valor absoluto del estadístico de contraste es igual a: A) 1,64; B) 1,96; C) 2.

-5-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 3 y 4

6- Si realmente no existen diferencias entre las medias antes y después, la probabilidad del obtener un
estadístico de contraste igual o más extremo que el que proporcionan los datos vale: A) entre 0,10 y 0,05; B)
entre 0,01 y 0,025; C) 0,05.

7- El valor crítico vale, aproximadamente, A) 1,29; B) 1,66; C) 1,984.

8- Podemos afirmar que los sujetos que inicialmente no están dispuestos a seguir el tratamiento inicialmente,
se sienten más seguros de poder dejar de fumar tras la conferencia del psicólogo. A) Sí, porque el nivel
crítico es inferior al nivel de significación; B) Sí, porque el nivel crítico es inferior al nivel de confianza; C) No,
los resultados no son significativos.

SITUACIÓN 10. Un partido político X elabora un vídeo pre-electoral con la intención de incrementar el número
de votos en las siguientes elecciones. Extrae una muestra aleatoria de 200 personas a las que muestra el
vídeo. Antes de verlo 120 personas declararon que no votarían al partido X, 60 de las cuales cambiaron de
opinión tras ver el vídeo, siendo 136 sujetos en total los que manifestaron su intención de votar al partido X
después de ver el vídeo. Con un nivel de confianza del 95%.

1- El valor del estadístico de contraste Z es igual a: A) 1,64; B) 3,20; C) 7.

2- El valor del estadístico de contrate Chi cuadrado es igual a ; A) 10,24; B) 49; C) 1,96.

3- El valor crítico para el estadístico Z es igual a: A) 1,28; B) 1,64; C) 1,96.

4- El valor crítico para el estadístico Chi cuadrado es; A) 5,0239; B) 2,7055; C) 3,8415.

5- El nivel crítico es: A) mayor que 0,001; B) menor que 0,005; C) igual a 0,05.

6- Se rechaza la hipótesis nula porque: A) la probabilidad de encontrar un valor como el estadístico de


contraste o más extremo es muy pequeña; B) no existe error de tipo II; C) No se rechaza la hipótesis nula.

7- A la vista de los resultados, el partido X determina que: A) El vídeo resulta efectivo porque incrementa el
número de votantes del partido X; B) El vídeo no resulta efectivo porque hay pocas personas que cambian
de opinión a favor del partido X; C) El vídeo no resulta efectivo porque se rechaza la hipótesis nula.

8- Si la magnitud del efecto es pequeña: A) la diferencia entre dos medias nunca es significativa; B) la
diferencia entre dos medias siempre es significativa; C) la diferencia entre dos medias puede ser
significativa.

9- El supuesto de homocedasticidad se refiere a: A) las variables X e Y se distribuyen normalmente; B) el


tamaño de la muestra es igual a superior a 30 observaciones; C) igualdad de varianzas en la población.

-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

SITUACIÓN 1. Se pretende comprobar si los profesionales que llevan menos de cinco años en una empresa
(Grupo 1) poseen mayores aspiraciones que las personas que llevan cinco o más años (Grupo 2). Para ello se
entrevista a 32 personas que llevan menos de cinco años y a otras 32 personas que llevan cinco o más años,
todas ellas elegidas al azar. Los resultados mostraron que dentro del primer grupo se identificó a 18 personas
con altas aspiraciones, mientras que en el segundo grupo se identificaron a 14 personas con altas aspiraciones.
Nivel de confianza 95%.

1- La hipótesis alternativa es: A) 𝜋1 − 𝜋2 ≠ 0; B) 𝜋1 − 𝜋2 < 0; C) 𝝅𝟏 − 𝝅𝟐 > 𝟎

2- El valor del estadístico de contraste es: A) 0,5; B) 1; C) 2.

El estadístico de contraste es:

𝑝1 − 𝑝2 𝑛1 𝑝1 + 𝑛2 𝑝2
𝑍= 𝑠𝑖𝑒𝑛𝑑𝑜 𝑃=
1 1 𝑛1 + 𝑛2
√𝑃(1 − 𝑃) ( + )
𝑛1 𝑛2

Primero calculamos P
18 + 14
𝑃= = 0,5
32 + 32

Finalmente:
18 14
𝑍=
𝑝1 − 𝑝2
= 32 − 32 =
0,5625 − 0,4375
=1
1 1 0,125
√𝑃(1 − 𝑃) ( + ) √0,50(1 − 0,50) ( 1 + 1 )
𝑛1 𝑛2 32 32

3- El valor crítico es igual a: A) 1,64; B) 1,96; C) 2,33.

4- El nivel crítico p es igual a: A) 0,1587; B) 0’3174; C) 0’8413.

Acudiendo a la tabla de curva normal, observamos que la probabilidad de encontrar valores superiores a una
puntuación típica igual a 1 es 0’1587.

5- La decisión correcta es: A) Rechazar la hipótesis nula porque el nivel crítico p es menor que el nivel de
significación; B) Mantener la hipótesis nula porque el estadístico de contraste es menor que el valor
crítico; C) ninguna de las anteriores es correcta.

6- A un nivel de confianza del 95% concluimos que: A) los profesionales que llevan menos de cinco años
trabajando poseen mayores aspiraciones que el grupo que lleva trabajando 5 o más años; B) los
profesionales que llevan 5 o más años trabajando poseen mayores aspiraciones que el grupo que lleva
menos de 5 años; C) no existen diferencias en cuanto a las aspiraciones profesionales entre los dos grupos.

SITUACIÓN 2. En un estudio cuyo objeto es evaluar el efecto de la música clásica sobre la capacidad de
concentración disponemos de 62 sujetos con los que formamos de manera aleatoria dos grupos de 31 sujetos
cada uno. Al primero de ellos (Grupo 1) se le sometió a una prueba de concentración escuchando música clásica
y al segundo (Grupo 2) se le sometió a la misma prueba en condiciones normales de silencio. La puntuación
media para el Grupo 1 fue de 86 puntos con una cuasivarianza igual a 150. El Grupo 2 obtuvo una media
aritmética igual a 80 puntos y una cuasivarianza igual a 129. Sabiendo que la variable dependiente está medida
en una escala de intervalo, asumiendo varianzas poblacionales iguales y con un nivel de confianza del 9S%
¿podemos afirmar que la media en concentración es superior para el grupo que escuchó música clásica?

-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

1- La hipótesis nula es: A) 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝟎; B) 𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝐻0 : 𝜇1 − 𝜇2 ≥ 0.

Queremos comprobar si la media es superior para el Grupo 1 (música clásica) que para el Grupo 2 (silencio),
luego la hipótesis alternativa es 𝐻1 : 𝜇1 − 𝜇2 > 0. La hipótesis nula, por lo tanto, es la especificada en la
opción A.

2- El valor del estadístico de contraste es, aproximadamente: A) 1,671; B) 2; C) 0,508.

𝑌̅1 − 𝑌̅2 86 − 80
𝑇= = =2
(𝑛1 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 1 1 √30 ∙ 150 + 30 ∙ 129 ( 1 + 1 )
√ ( + ) 31 + 31 − 2 31 31
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

3- El tamaño del efecto es Igual a: A) 1,671; B) 2; C) 0,508.

𝑌̅1 − 𝑌̅2 86 − 80
𝐷= = = 0,508
(𝑛1 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 √30 ∙ 150 + 30 ∙ 129
√ 31 + 31 − 2
𝑛1 + 𝑛2 − 2

4- El valor crítico es igual a: A) 1,671; B) 2; C) 0,508.

El contraste es unilateral derecho. Buscando en las tablas T de Student para 60 grados de libertad
(𝑛1 + 𝑛2 − 2 = 60) la puntuación que supera una proporción igual a 0,95, comprobamos que la respuesta
correcta es A.

5- El nivel crítico p es igual a: A) entre 0,05 y 0,10; B) entre 0,05 y 0,95; C) 0,025.

Observamos en la tabla T de Student con 60 grados de libertad, que la puntuación 𝑇 = 2 (estadístico de


contraste) deja por debajo de sí una proporción igual a 0,975, luego el nivel crítico p es igual a: 1 − 0,975 =
0,025

6- Rechazamos la hipótesis nula porque: A) el nivel de significación es menor que el nivel crítico p; B) el
estadístico de contraste es mayor que el valor crítico; C) no rechazamos la hipótesis nula.

Claramente la opción correcta es B. La opción A es falsa porque si el nivel de significación es menor que el
nivel crítico mantenemos la hipótesis nula.

SITUACIÓN 3: En una tarea sobre decisión léxica con estímulos visuales en la que se miden tiempos de reacción,
un investigador dispone de una muestra aleatoria de 26 sujetos. Utiliza dos grupos de palabras y parte de la
hipótesis de que los tiempos de reacción serán más cortos ante palabras de alta frecuencia léxica (aquellas que
utilizamos más frecuentemente en el lenguaje, Grupo 1) que ante palabras de baja frecuencia léxica (Grupo 2).
Tras realizar el experimento observa que el tiempo de reacción medio para el Grupo 1 fue igual a 612,04 ms,
mientras que para el Grupo 2 fue igual a 645 ms, siendo la cuasivarianza de las diferencias igual a 6656 ms 2.
Asumiendo que se cumplen los supuestos para realizar un contraste paramétrico, conteste a las siguientes
cuestiones:

-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

1- El nivel de medida de la variable dependiente es: A) ordinal; B) de intervalo; C) de razón.

La variable dependiente es el tiempo de reacción, cuyo nivel de medida es de razón.

2- La hipótesis nula es: A) 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≥ 𝟎; B) 𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝐻0 : 𝜇1 − 𝜇2 ≤ 0.

La respuesta correcta es “A”, debemos de plantear un contraste de hipótesis sobre dos medias para dos
muestras relacionadas, siendo las hipótesis:

𝐻0 : 𝜇1 − 𝜇2 ≥ 0
𝐻1 : 𝜇1 − 𝜇2 < 0

3- La hipótesis alternativa es: A) 𝐻1 : 𝜇1 − 𝜇2 ≥ 0; B) 𝑯𝟏 : 𝝁𝟏 − 𝝁𝟐 < 𝟎; C) 𝐻1 : 𝜇1 − 𝜇2 > 0.

4- El valor absoluto del estadístico de contraste es: A) 1,708; B) 2,06; C) 2,485.

La respuesta correcta es “B”. El estadístico de contraste es:

𝑌̅1 − 𝑌̅2 612,04 − 645


𝑇= = = −2,06
̂2
√𝑆𝑑 √6656
𝑛 26

5- Para un nivel de confianza del 95%, el valor absoluto del valor crítico es: A) 1,708; B) 2,06; C) 2,485.

Acudiendo a la tabla t de Student, observamos que la respuesta correcta es “A”.

6- El valor del nivel crítico p es: A) 0,05; B) 0,025; C) 0,01.

Acudiendo a la tabla t de Student, observamos que la respuesta correcta es “B”.

7- El resultado del experimento: A) no es significativo; B) es significativo al nivel de confianza del 95%; C) es


significativo al 95% y al 99%.

La respuesta correcta es “B”, puesto que el resultado es significativo para el nivel de confianza del 95%
(−2,06 < −1,708) pero no para el nivel de confianza del 99% (−2,06 > −2,485).

SITUACIÓN 4: Para comparar la eficacia de dos terapias (“A” y “B”) utilizadas para tratar el trastorno de
personalidad “X”, se toma una muestra aleatoria de 400 personas que sufren el trastorno “X”, formándose dos
grupos al azar de 200 personas cada uno. Al primer grupo se le aplica la terapia “A”, siendo 172 personas las
que se recuperan, mientras que al aplicar la terapia “B” se recuperan 148 personas. Con un nivel de confianza
del 95%, ¿son las dos terapias igualmente eficaces?

1- La hipótesis nula es: A) 𝐻0 : 𝜋𝐴 − 𝜋𝐵 ≤ 0; B) 𝑯𝟎 : 𝝅𝑨 − 𝝅𝑩 = 𝟎; C) 𝐻0 : 𝜋𝐴 − 𝜋𝐵 ≥ 0

2- El valor absoluto del estadístico de contraste es: A) 1,96; B) 2,58; C) 3.

Calculamos en primer las proporciones 𝑝1 , 𝑝2 𝑦 𝑃.

172 148 172 + 148


𝑝1 = = 0,86, 𝑝2 = = 0,74, 𝑃 = = 0,80
200 200 400

-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

El estadístico de contraste es:

𝑝1 − 𝑝2 0′ 86 − 0′74
𝑍= = =3
1 1
√𝑃(1 − 𝑃) ( + ) √0,8 ∙ 0,2 ∙ ( 1 + 1 )
𝑛1 𝑛2 200 200

3- El valor absoluto del valor crítico es: A) 1,96; B) 2,58; C) 3.

Según el enunciado hemos de tomar un nivel de confianza del 95% y el contraste es bilateral, luego la
respuesta correcta es A.

4- El nivel crítico p es igual a: A) 0,0013; B) 0,0026; C) 0,9987.

Acudiendo a la tabla de curva normal, observamos que la probabilidad de encontrar valores iguales o más
extremos que 𝑍 = 3 es igual a 0,0013. Como el contraste es bilateral, el nivel crítico es igual a: 𝑝 = 0,0013 ∙
2 = 0,0026.

5- Rechazamos la hipótesis nula porque: A) El valor absoluto del estadístico de contraste es superior al valor
absoluto del valor crítico; B) el nivel de significación es menor que el nivel de confianza; C) el nivel crítico p
es menor que el nivel de confianza.

6- ¿Se desprende de los resultados obtenidos que las dos terapias son igualmente eficaces? A) Si, porque
hemos aceptado la hipótesis alternativa; B) No, porque los resultados no son significativos; C) No, porque el
valor del estadístico de contraste es estadísticamente significativo.

Aceptamos la hipótesis alternativa porque el resultado es significativo (3 > 1,96), luego las dos terapias no
son igualmente eficaces, y por lo tanto la respuesta correcta es C.

7- Indique para qué niveles de confianza obtendremos resultados significativos: A) 95% y 99%; B) 99% y 99,9%;
C) para cualquier nivel de confianza.

Los resultados son significativos al nivel de confianza del 95% (3 > 1,96), también al nivel de confianza del
99% (3 > 2,58), pero no al nivel de confianza del 99,9 (3 < 3,1), luego la respuesta correcta es A.

SITUACIÓN 5: En una tarea de reconocimiento de palabras, un investigador mantiene la hipótesis de que los
estudiantes de carreras de “letras” tardarán menos que los estudiantes de “ciencias” en reconocer los estímulos
presentados. Tras seleccionar dos muestras aleatorias de 31 observaciones cada una, y registrar el tiempo de
reacción, obtiene una media aritmética igual a 653,2 ms para el grupo de estudiantes de ciencias (Grupo 1) y de
600 ms para el grupo de estudiantes de letras (Grupo 2), siendo la cuasivarianza igual en ambas muestras, con
un valor de 6200 ms2. Con un nivel de confianza del 95%, conteste a las siguientes cuestiones:

1- Si queremos comprobar si las varianzas de ambas poblaciones son iguales o diferentes, observaremos que el
valor del estadístico de contraste: A) no es significativo; B) es significativo; C) es significativo al nivel de
confianza del 95%, pero no al 99%.

2- Para comprobar la hipótesis del investigador, la hipótesis nula planteada es: A) 𝐻0 : 𝜇1 − 𝜇2 ≥ 0; B)


𝐻0 : 𝜇1 − 𝜇2 < 0; C) 𝑯𝟎 : 𝝁𝟏 − 𝝁𝟐 ≤ 𝟎.

-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

3- El valor del estadístico de contraste es: A) 0,6756; B) 1,671; C) 2,66.

653,2 − 600
𝑇= = 2,66
√30 ∙ 6200 + 30 ∙ 6200 ∙ ( 1 + 1 )
31 + 31 − 2 31 31

4- El valor crítico es igual a: A) 0,6756; B) 1,671; C) 2,66.

Se busca en la tabla de la distribución t con 60 grados de libertad y un nivel de confianza del 95%.

5- El tamaño del efecto es igual a: A) 0,6756; B) 1,671; C) 2,66.

|653,2 − 600|
𝑇= = 0,6756
√30 ∙ 6200 + 30 ∙ 6200
31 + 31 − 2

6- El nivel crítico p es igual a: A) 0’05; B) 0’01; C) 0’005.

7- Aceptamos la hipótesis alternativa porque: A) el valor del estadístico de contraste es menor que el nivel
crítico p; B) el nivel crítico p es menor que el nivel de significación; C) el nivel crítico p es mayor que el valor
crítico.

8- ¿Podemos concluir que los resultados obtenidos avalan la hipótesis del investigador? A) Si; B) No; C) los
resultados son significativos al nivel de confianza del 95%, pero no del 99%.

SITUACIÓN 6. En un estudio piloto para un nuevo tratamiento contra el SIDA (Thompson, 1991), se midieron
diversas variables en 27 pacientes con SIDA. Entre ellas el número de células T-4 sanguíneas al inicio del
tratamiento y 90 días más tarde. Los resultados fueron: 𝑌̅0 𝑑𝑖𝑎𝑠 = 324; 𝑌̅90 𝑑𝑖𝑎𝑠 = 334,4. Por estudios
anteriores se sabe que la varianza poblacional de las diferencias en el contaje de células T-4 vale 150.
Asumiendo un nivel de confianza del 95%, conteste a las siguientes cuestiones:

1- Se trata de un diseño: A) de dos grupos dependientes; B) de más de dos grupos dependientes; C) de dos
grupos independientes.

2- La hipótesis nula en el caso de las medias es: A) 𝑯𝟎 : 𝝁𝟎 𝒅𝒊𝒂𝒔 = 𝝁𝟗𝟎 𝒅𝒊𝒂𝒔; B) 𝐻0 : 𝜇0 𝑑𝑖𝑎𝑠 ≥ 𝜇90 𝑑𝑖𝑎𝑠 ; C)
𝐻0 : 𝜋0 𝑑𝑖𝑎𝑠 ≤ 𝜋90 𝑑𝑖𝑎𝑠

3- El valor del estadístico de contraste para comprobar si al inicio del tratamiento los sujetos tienen el mismo
número de células T-4 que al final del mismo es igual a: A) 1,045; B) -4,41; C) 1,841.

Nos encontramos con un contraste de medias para dos grupos dependientes conociendo la varianza de las
diferencias poblacionales. Luego el estadístico de contraste es:

-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

̅ − 𝜇𝑑
𝐷 324 − 334,4
𝑍= = = −4,41
2
√𝜎𝑑 √150
𝑛 27

4- Los valores críticos que delimitan la zona de aceptación de 𝐻0 son: A) −1,05 𝑦 1,05; B) −𝟏, 𝟗𝟔 𝒚 𝟏, 𝟗𝟔; C)
−1,65 𝑦 1,65.

5- El investigador: A) acepta 𝐻0 ya que el intervalo de confianza de la media incluye la media de las diferencias
entre ambas muestras; B) rechaza 𝑯𝟎 porque la Z calculada es inferior al valor crítico; C) rechaza 𝐻1 ya que
el estadístico de contraste calculado se encuentra en la zona de rechazo.

6- Si el investigador hubiera vuelto a realizar una nueva medición del número de células T-4 180 días después
de iniciado el tratamiento, deberíamos aplicar como técnica de análisis: A) un ANOVA de medidas
independientes de un factor; B) un ANOVA de dos factores con interacción; C) un ANOVA de medidas
repetidas de un factor con tres niveles.

En este caso se estaría midiendo la variable dependiente en los mismos sujetos en tres ocasiones distintas.
Por consiguiente son medidas dependientes y tenemos más de dos: deberíamos utilizar un ANOVA de
medidas dependientes con un factor de tres niveles (medición a 0 días, a 90 días y a 180 días).

SITUACIÓN 7. Un psicólogo, sospecha que los alumnos de cuarto de grado (Grupo 1) presentan una media
superior y más variabilidad que los alumnos de primer curso de grado (Grupo 2) en la variable “autoestima”.
Para comprobar estas hipótesis selecciona dos muestras aleatorias de igual tamaño (𝑛1 = 𝑛2 = 31) a las que
aplica un test de autoestima. Los resultados fueron: 𝑌̅1 = 22,16, 𝑆̂12 = 76,42 para el Grupo 1 y 𝑌̅2 = 20,07,
𝑆̂22 = 47,58 para el Grupo 2. Asumiendo un nivel de confianza del 95% conteste a las siguientes cuestiones:

𝜎2 𝝈𝟐 𝜎2
1- La hipótesis nula en el caso de las varianzas es: A) 𝐻0 : 𝜎12 = 1; B) 𝑯𝟎 : 𝝈𝟏𝟐 ≤ 𝟏; C) B) 𝐻0 : 𝜎12 ≥ 1
2 𝟐 2

2- El valor del estadístico de contraste para comprobar si los sujetos del Grupo 1 presentan más variabilidad
que los sujetos del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,841.

𝑆̂12 76,42
𝐹= = = 1,606
𝑆̂22 47,58

3- Asumiendo igualdad de varianzas poblacionales, el valor del estadístico de contraste para comprobar si la
media del Grupo 1 es superior a la media del Grupo 2 es igual a: A) 1,045; B) 1,606; C) 1,671.

𝑌̅1 − 𝑌̅2 22,16 − 20,07


𝑇= = = 1,045
(𝑛 ̂ 2 (𝑛 ̂2 √30 ∙ 76,42 + 30 ∙ 47,58 ( 1 + 1 )
√ 1 − 1)𝑆1 + 2 − 1)𝑆2 ( 1 + 1 ) 31 + 31 − 2 31 31
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

4- El nivel crítico en el caso del contraste sobre las varianzas es igual a: A) 0,05; B) 0,10; C) 0,15.

Mirando en las tablas de la F obtenemos un valor de 0,90, es decir, una F = 1,606 con 30 y 30 grados de
libertad, deja por debajo de sí un área de 0,90. Luego el valor pedido es 1- 0,90 = 0,10.

-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

5- El nivel crítico en el caso del contraste sobre las medias es igual a: A) 0,05; B) 0,10; C) 0,15.

En las tablas observamos que un valor de T = 1,045 con 60 grados de libertad deja por debajo de sí el 0,850
del área de la distribución. Luego el valor pedido será 1-0,850 = 0,15 en un contraste unilateral.

6- El tamaño del efecto en el caso del contraste sobre medias es igual a: A) 1,045; B) 0,265; C) 0,15.
|𝑌̅1 − 𝑌̅2 | 22,16 − 20,07
𝑇= = = 0,2654
(𝑛 ̂ 2 (𝑛 ̂2 √30 ∙ 76,42 + 30 ∙ 47,58
√ 1 − 1)𝑆1 + 2 − 1)𝑆2 31 + 31 − 2
𝑛1 + 𝑛2 − 2

7- Nuestro psicólogo mantiene la hipótesis nula: A) Para el contraste de las varianzas pero no para el contraste
de medias; B) Para el contraste de medias pero no para el contraste de varianzas; C) En ambos casos, tanto
en el caso de las medias, como en el caso de las varianzas.

Los niveles críticos para los contrastes F y T son: 0,10 y 0,15 respectivamente, ambos superiores a: 𝛼 = 0,05,
luego se mantiene la hipótesis nula en ambos casos.

SITUACIÓN 8: El equipo docente de una determinada asignatura quiere comprobar la eficacia de un material
docente nuevo respecto al utilizado en convocatorias anteriores. Selecciona una muestra aleatoria de 64
alumnos, con los que forma dos grupos de igual tamaño también al azar. A los sujetos del Grupo 1 les
proporciona en nuevo material, mientras que los del Grupo 2 trabajan con el material antiguo. El equipo
docente tiene la hipótesis de que con el nuevo material las notas serán más elevadas. Tras el examen de fin de
curso los alumnos del Grupo 1 obtienen una nota media igual a 7, con una cuasivarianza igual a 15, mientras
que para el Grupo 2 la media es igual a 5,2 y la cuasivarianza igual a 17.

Tenemos dos muestras independientes con los siguientes datos:


Grupo 1. Material nuevo: 𝑌̅1 = 7 𝑆̂12 = 15 𝑛1 = 32
Grupo 2. Material Antiguo: 𝑌̅2 = 5,2 𝑆̂22 = 17 𝑛2 = 32

1- Si con un nivel de confianza del 95% realizamos un contraste de hipótesis para comprobar si las varianzas
poblacionales son iguales o diferentes, aceptaremos: A) la hipótesis nula; B) la hipótesis alternativa; C) No
podemos saber qué cuasivarianza hay que poner en el numerador del estadístico de contraste.

Las hipótesis y el estadístico de contraste son:

𝐻0 : 𝜎12 = 𝜎22 𝑆̂12 15


𝐹= = = 0,88
𝐻1 : 𝜎12 ≠ 𝜎22 𝑆̂22 17

Para un nivel de confianza del 95%, el valor que nos ofrece la tabla F para 30 grados de libertad en el
numerador y 30 grados de libertad en el denominador (los más próximos a 31) es igual a 1,841, luego los
valores críticos son:

1
𝐹0,025;30;30 = 2,074 = 0,482, 𝐹0,975;30;30 = 2,074

Dado que F = 0,88 se encuentra comprendido entre los valores críticos, aceptamos la hipótesis nula, por lo
que podemos suponer que las varianzas son iguales.

2- Si realizamos un contraste de hipótesis sobre las medias para comprobar la hipótesis del equipo docente, el
estadístico de contraste vale: A) 2; B) 1,8; C) 1,67.

-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

𝑌̅1 − 𝑌̅2 7 − 5,2


𝑇= = = 1,8
(𝑛 − 1)𝑆̂12 + (𝑛2 − 1)𝑆̂22 1 1 √31 ∙ 15 + 31 ∙ 17 ( 1 + 1 )
√ 1 ( + ) 62 32 32
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

3- El tamaño del efecto es igual a: A) 1,8; B) 0,90; C) 0,45.

|𝑌̅1 − 𝑌̅2 | |7 − 5,2|


𝑑= = = 0,45
(𝑛 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 √31 ∙ 15 + 31 ∙ 17
√ 1 62
𝑛1 + 𝑛2 − 2

4- Con un nivel de confianza del 95%, suponiendo que la hipótesis nula sobre el contraste de medias es cierta,
la probabilidad de obtener un valor igual o superior al estadístico de contraste que hemos obtenido: A) se
encuentra comprendida entre 0,01 y 0,025; B) se encuentra comprendida entre 0,025 y 0,05; C) es igual a
0,05.
Nos piden calcular el nivel crítico. Buscando en las tablas para 60 grados de libertad (los más próximos a 62),
observamos que el estadístico de contraste obtenido (T =1,8), se encuentra comprendido entre los valores
1,671 y 2, que dejan por encima de sí las probabilidades: 0,05 y 0,025.

5- Si trabajamos con un nivel de confianza del 95%, la probabilidad de rechazar la hipótesis nula suponiendo
que es cierta es igual a: A) se encuentra comprendida entre 0,01 y 0,025; B) es igual a 0,05; C) es igual a 0,95.

Nos preguntan por el nivel de significación, la respuesta correcta es B.

6- Tomando de las tablas el valor más próximo para los grados de libertad, el intervalo de confianza para la
diferencia de medias, para un nivel de confianza del 95% viene definido por los valores: A) 0,2 𝑦 3,8; B)
−0,2 𝑦 − 3,8; C) −𝟎, 𝟐 𝒚 𝟑, 𝟖.

(𝑛1 − 1)𝑆̂12 + (𝑛2 − 1)𝑆̂22 1 1


(𝑌̅1 − 𝑌̅2 ) ± 𝑡1−𝛼⁄ ;𝑛 +𝑛 −2 √ ( + ) → (7 − 5,2) ± 2 ∙ 1 → (−0,2; 3,8)
2 1 2
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

7- El estadístico de contraste obtenido para contrastar la hipótesis del equipo docente: A) no es significativo; B)
Es significativo al nivel de confianza del 99%; C) es significativo al nivel de confianza del 95%.

El contraste que hemos de aplicar es unilateral derecho y el estadístico de contraste es: T = 1,8. Este valor
supera al valor crítico t = 1,671 (NC = 95%), pero no supera al valor crítico t = 2,390 (NC=99%).

SITUACIÓN 9: Un psicólogo imparte una conferencia a una muestra de 200 fumadores en la que les expone un
tratamiento para abandonar este hábito. También pregunta a los sujetos, antes y después de la conferencia,
que cuantifiquen en una escala de 0 a 10 si se sienten capaces de dejar de fumar tras recibir el tratamiento,
donde el cero indicaría que no se sienten capaces de ninguna forma y 10 que lo lograrán con absoluta certeza.
Antes de la conferencia, la mitad de los sujetos de la muestra están dispuestos a seguir el tratamiento. Tras la
conferencia, encuentra que 80 personas que estaban dispuestas a seguir la terapia mantienen la idea de
hacerlo, y que otras 80 personas que no estaban dispuestas a seguir la terapia han cambiado de opinión. El
psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia sea mayor tras la
conferencia. Respecto a la pregunta que plantea el psicólogo a los sujetos, se encuentra que aquellos que no se

-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

sentían capaces de dejar de fumar antes de la conferencia obtienen una media superior después de la
conferencia, siendo dicha media un punto superior a la media antes de la conferencia y la cuasidesviación típica
de las diferencias es igual a 5. Con un nivel de confianza del 95%.

Con los datos aportados en la Situación 2 podemos construir la siguiente tabla:

Después de la conferencia
SI NO
Antes de la SI a = 80 b = 20 100
conferencia NO c = 80 d =20 100
160 40 200

1- El valor absoluto del estadístico de contraste “Z” para comprobar la hipótesis del psicólogo es igual a: A)
1,64; B) 2,33; C) 6.

Para comprobar la hipótesis del psicólogo realizamos un contraste de hipótesis para dos proporciones con
muestras relacionadas. Para calcular el estadístico de contraste “Z” nos fijamos en los sujetos que han
cambiado de opinión (casillas b y c de la tabla)
𝑏−𝑐 20 − 80
𝑍= = = −6
√𝑏 + 𝑐 √20 + 80

2- Si la hipótesis nula es cierta, la probabilidad de obtener un estadístico de contraste igual o más extremo que
el obtenido: A) es igual a 0,05; B) es igual a 0,95; C) es menor que 0,0002.

Tenemos que calcular el nivel crítico. El estadístico de contraste es muy extremo, superior al valor mayor que
podemos consultar en las tablas (Z = 3,59, que deja por encima de sí una proporción igual a 0,0002), por lo
que la respuesta correcta es C.

3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,64; B) 1,96; C) 2,33.
Como el psicólogo pretende lograr que el número de sujetos que deciden someterse a la terapia se mayor
tras la conferencia, el contraste es unilateral. Buscando en las tablas de curva normal para NC = 95%,
comprobamos que la respuesta correcta es A.

4- La hipótesis que antes de la conferencia tenía el psicólogo: A) queda confirmada porque mantenemos la
hipótesis nula; B) queda confirmada porque el nivel crítico es menor que el error de tipo I; C) queda
confirmada porque el nivel crítico es mayor que el valor crítico.

Si queremos comprobar que la media de los sujetos que inicialmente no están dispuestos a seguir el
tratamiento es superior después de la conferencia, y con un nivel de confianza del 95%:

5- El valor absoluto del estadístico de contraste es igual a: A) 1,64; B) 1,96; C) 2.


̅ − 𝜇𝑑 1 − 0
𝐷
𝑇= = =2
̂𝑑2
𝑆 5 2
√ √
𝑛 100

6- Si realmente no existen diferencias entre las medias antes y después, la probabilidad del obtener un
estadístico de contraste igual o más extremo que el que proporcionan los datos vale: A) entre 0,10 y 0,05; B)
entre 0,01 y 0,025; C) 0,05.

Los grados de libertad son: n – 1 = 100 – 1 = 99. En las tablas consultamos para 100 grados de libertad que
son los más próximos. Observamos que el estadístico de contraste se encuentra entre los valores 1,984 y

-9-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

2,364, que dejan por encima de sí, respectivamente, las proporciones: 0,025 y 0,01, luego la respuesta
correcta es B.

7- El valor crítico vale, aproximadamente, A) 1,29; B) 1,66; C) 1,984.


Para un nivel de confianza del 95% y 100 grados de libertad, comprobamos que la respuesta correcta es B.

8- Podemos afirmar que los sujetos que inicialmente no están dispuestos a seguir el tratamiento inicialmente,
se sienten más seguros de poder dejar de fumar tras la conferencia del psicólogo. A) Sí, porque el nivel
crítico es inferior al nivel de significación; B) Sí, porque el nivel crítico es inferior al nivel de confianza; C) No,
los resultados no son significativos.

SITUACIÓN 10. Un partido político X elabora un vídeo pre-electoral con la intención de incrementar el número
de votos en las siguientes elecciones. Extrae una muestra aleatoria de 200 personas a las que muestra el
vídeo. Antes de verlo 120 personas declararon que no votarían al partido X, 60 de las cuales cambiaron de
opinión tras ver el vídeo, siendo 136 sujetos en total los que manifestaron su intención de votar al partido X
después de ver el vídeo. Con un nivel de confianza del 95%.

En primer lugar completamos la tabla con los datos del enunciado:

Después
SI NO
SI a = 76 b=4 80
Antes
NO c = 60 d = 60 120
136 64 200

1- El valor absoluto del estadístico de contraste Z es igual a: A) 1,64; B) 3,20; C) 7.


𝑏−𝑐 4 − 60
𝑍= = = −7
√𝑏 + 𝑐 √4 + 60

2- El valor del estadístico de contrate Chi cuadrado es igual a; A) 10,24; B) 49; C) 1,96.

(𝑏 − 𝑐)2 (4 − 60)2
𝜒2 = = = 49
𝑏+𝑐 4 + 60

3- El valor absoluto del valor crítico para el estadístico Z es igual a: A) 1,28; B) 1,64; C) 1,96.
Buscando en la tabla de curva normal la puntuación típica que supera una proporción igual a 0,05,
observamos que la respuesta correcta es B.

4- El valor crítico para el estadístico Chi cuadrado es; A) 5,0239; B) 2,7055; C) 3,8415.
Buscando en la tabla de 𝜒 2 para un grado de libertad la puntuación que supera una proporción igual a
0,05, observamos que la respuesta correcta es C.

-10-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 3 y 4

5- El nivel crítico es: A) mayor que 0,001; B) menor que 0,005; C) igual a 0,05.

Tomando el estadístico de contraste Z y consultando las tablas de curva normal, observamos que la
puntuación más extrema que podemos consultar es igual a 3,59, que deja por encima de sí una
proporción igual a 0,0002, por lo que la respuesta correcta es B.

6- Se rechaza la hipótesis nula porque: A) la probabilidad de encontrar un valor como el estadístico de


contraste o más extremo es muy pequeña; B) no existe error de tipo II; C) No se rechaza la hipótesis
nula.

7- A la vista de los resultados, el partido X determina que: A) El vídeo resulta efectivo porque incrementa el
número de votantes del partido X; B) El vídeo no resulta efectivo porque hay pocas personas que
cambian de opinión a favor del partido X; C) El vídeo no resulta efectivo porque se rechaza la hipótesis
nula.

Rechazamos la hipótesis nula, luego la respuesta correcta es A.

8- Si la magnitud del efecto es pequeña: A) la diferencia entre dos medias nunca es significativa; B) la
diferencia entre dos medias siempre es significativa; C) la diferencia entre dos medias puede ser
significativa.

Aunque la magnitud del efecto sea pequeña, si el tamaño de las muestras es grande, podemos obtener
resultados significativos

9- El supuesto de homocedasticidad se refiere a: A) las variables X e Y se distribuyen normalmente; B) el


tamaño de la muestra es igual a superior a 30 observaciones; C) igualdad de varianzas en la población.

-11-
Cuestiones y ejercicios del Tema 5:

1.- Las varianzas intergrupos e intragrupos son:


A) Independientes; B) Dependientes; C) Controladas
2.- El estimador insesgado de la varianza poblacional en el análisis de
varianza es:
A) Media cuadrática intra sujetos; B) Media cuadrática inter sujetos; C)
Suma de cuadrados inter sujetos
3.- Un modelo aleatorio de análisis de varianza es aquel en que:
A) El azar determina los valores de la variable dependiente;
B) Los niveles de la variable independiente actúan como una muestra de
todos los posibles niveles que se pudiesen establecer;
C) Los niveles de la variable dependiente son al azar, no los fija el
investigador.
4.- El estadístico de contraste en el análisis de varianza se distribuye según
la distribución:
A) Normal; B) F de Snedecor; C) Chi cuadrado.
5.- El cometido del Análisis de Varianza es:
A)Minimizar el error experimental;
B) Maximizar los efectos del factor estudiado;
C) Discernir qué variabilidad corresponde al factor estudiado y cuál al error
experimental.
6.- En el análisis de varianza, llamamos factor a:
A) La/s variable/s independiente/s;
B) La/s variable/s dependiente/s;
C) La/s variables extrañas.
7.- MCinter es un estimador:
A) Sesgado de la varianza poblacional;
B) Insesgado de la varianza poblacional;
C) Insesgado de la media poblacional.
8.- La varianza intragrupos es la varianza atribuible:
A) Al error experimental;
B) Tanto al error experimental como a los distintos niveles del factor
estudiado;
C) A los distintos niveles del factor estudiado.
9.- En el análisis de varianza, cada nivel del factor es:
A) Una categoría de la variable dependiente;
B) Una categoría de la variable independiente;
C) Cada una de las variables independiente.
10.- En el razonamiento del análisis de varianza se supone que dentro de
un mismo nivel las puntuaciones deberían ser:
A) Semejantes; B) Correlacionadas; C) Diferentes.

Ejercicio 1.- Una muestra aleatoria de 30 alumnos de un colegio se han


repartido, también aleatoriamente, en grupos iguales para estudiar la
influencia de tres situaciones diferentes de aprendizaje (A, B y C).
Sabemos que, tras el aprendizaje, la suma de los cuadrados de las
puntuaciones diferenciales de todos los alumnos de la muestra es igual a
700. Que la media del grupo A es 30, la del grupo B es 20 y la del grupo C
es 50. Y, sabemos también, que la suma de cuadrados total supone el 150
por 100 de la suma de cuadrados intergrupos.
Realice un análisis de varianza e interprete los resultados.

Ejercicio 2.- Disponemos de tres grupos de sujetos: uno de niños, otro de


niñas y un tercero de adultos. Se les aplica un test que mide dependencia de
campo y los resultados fueron:

niños niñas adultos


6 9 8
5 8 10
6 8 8
4 5 3
3 10 7
5 7 6
4 6 7
4 8 9
5 8

Se desea saber si los tres grupos difieren en la variable estudiada y, caso de


que fuese así, si hay diferencias debidas al género.

Ejercicio 3.- Se desea saber si diferentes tiempos de deprivación


alimenticia afectan por igual a la velocidad con que las ratas recorren un
laberinto en cuya meta reciben, sistemáticamente, una cantidad igual de
comida.
Para ello se toma una muestra de 32 ratas macho y se distribuyen,
aleatoriamente, en cuatro grupos a los que se somete a diferentes tiempos
de deprivación. Grupo A = 5 horas; B = 10 horas; C = 15 horas y D = 20
horas.
Pasado ese tiempo se sitúa a cada rata en la salida del laberinto y se registra
el tiempo que tarda en llegar a la meta. Los tiempos medios y las
desviaciones típicas de esos tiempos, para cada grupo, aparecen a
continuación:

Grupo A Grupo B Grupo C Grupo D


Media 10.5 12.5 13 15
Desviación típica 3 4 3.5 4.5

¿Se puede afirmar, con un nivel de confianza del 95%, que los tiempos
medios de los grupos son iguales?
Cuestiones y ejercicios del Tema 5: SOLUCIONES

1.- Las varianzas intergrupos e intragrupos son:


A) Independientes; B) Dependientes; C) Controladas
Solución: A
2.- El estimador insesgado de la varianza poblacional en el análisis de
varianza es:
A) Media cuadrática intra sujetos; B) Media cuadrática inter sujetos; C)
Suma de cuadrados inter sujetos
Solución: A
3.- Un modelo aleatorio de análisis de varianza es aquel en que:
A) El azar determina los valores de la variable dependiente;
B) Los niveles de la variable independiente actúan como una muestra de
todos los posibles niveles que se pudiesen establecer;
C) Los niveles de la variable dependiente son al azar, no los fija el
investigador.
Solución: B
4.- El estadístico de contraste en el análisis de varianza se distribuye según
la distribución:
A) Normal; B) F de Snedecor; C) Chi cuadrado.
Solución: B
5.- El cometido del Análisis de Varianza es:
A)Minimizar el error experimental;
B) Maximizar los efectos del factor estudiado;
C) Discernir qué variabilidad corresponde al factor estudiado y cuál al error
experimental.
Solución: C
6.- En el análisis de varianza, llamamos factor a:
A) La/s variable/s independiente/s;
B) La/s variable/s dependiente/s;
C) La/s variables extrañas.
Solución: A
7.- MCinter es un estimador:
A) Sesgado de la varianza poblacional;
B) Insesgado de la varianza poblacional;
C) Insesgado de la media poblacional.
Solución: A
8.- La varianza intragrupos es la varianza atribuible:
A) Al error experimental;
B) Tanto al error experimental como a los distintos niveles del factor
estudiado;
C) A los distintos niveles del factor estudiado.
Solución: A
9.- En el análisis de varianza, cada nivel del factor es:
A) Una categoría de la variable dependiente;
B) Una categoría de la variable independiente;
C) Cada una de las variables independiente.
Solución: B
10.- En el razonamiento del análisis de varianza se supone que dentro de
un mismo nivel las puntuaciones deberían ser:
A) Semejantes; B) Correlacionadas; C) Diferentes.
Solución:A
Ejercicio 1.- Una muestra aleatoria de 30 alumnos de un colegio se han
repartido, también aleatoriamente, en grupos iguales para estudiar la
influencia de tres situaciones diferentes de aprendizaje (A, B y C).
Sabemos que, tras el aprendizaje, la suma de los cuadrados de las
puntuaciones diferenciales de todos los alumnos de la muestra es igual a
700. Que la media del grupo A es 30, la del grupo B es 20 y la del grupo C
es 50. Y, sabemos también, que la suma de cuadrados total supone el 150
por 100 de la suma de cuadrados intergrupos.
Realice un análisis de varianza e interprete los resultados.
Solución:
1) Hipótesis estadísticas:
H0: µ1 = µ2 = µ3
H1: µ1 ≠ µ2 ≠ µ3 al menos para una µi
2) Dado que nos piden que realicemos un análisis de varianza y no
tenemos los datos, vamos a suponer que se cumplen los supuestos de
independencia de las observaciones, normalidad de las distribuciones
y homogeneidad de las varianzas.
3) Estadístico de contraste:

𝑀𝐶inter
𝐹=
𝑀𝐶𝑖𝑛𝑡𝑟𝑎

4) Región crítica: El valor crítico de la tabla de la distribución F para


a-1 = 3-1 = 2 grados de libertad en el numerador y N-a = 30-3 = 27
grados de libertad en el denominador es 3,35 para un nivel de
confianza del 95%.
5) Calculamos el estadístico:

Sabemos, por el enunciado, que:


Ȳ1 = 30 Ȳ2 = 20 Ȳ3 = 50 por lo tanto Ȳ = 33,33

También sabemos que:

ƩƩ(Yij - Ȳ)2 = 700 = SCtotal


SCinter = (100)(700)/150 = 466,67
SCintra = 700 – 466,67 = 233,33

FV SC gl MC F
Entre niveles 466,67 2 233,335 27,006
Dentro de niveles 233,33 27 8,64
Total 700 29

6) Decisión:
Comparando nuestro valor con el valor tabular tenemos que:
27,006 > 3,35

7) Interpretamos:
A un nivel de confianza del 95% debemos considerar que los
tratamientos suministrados influyen de forma distinta en la ansiedad.
8) El paso siguiente es ver entre qué tratamientos está la diferencia,
para lo que debemos realizar las comparaciones múltiples.

CRScheffe = √(𝑎 − 1)𝐹(1−𝛼)(𝑎−1)(𝑁−𝑎) √𝑀𝐶𝑖𝑛𝑡𝑟𝑎 ⌊Ʃ(𝑐𝑖2 |𝑛𝑖 )⌋

Donde ci son los coeficientes de las combinaciones lineales que


podemos establecer entre las distintas medias a comparar y el resto
de los valores se pueden obtener de la tabla del ANOVA.

Como queremos comparar todas las medias entre sí, tenemos tres
posibles comparaciones y establecemos tres combinaciones lineales:

Media 1 con media 2: (1)Ȳ1 + (-1) Ȳ2 + (0) Ȳ3


Media 1 con media 3: (1)Ȳ1 + (0) Ȳ2 + (-1) Ȳ3
Media 2 con media 3: (0)Ȳ1 + (1) Ȳ2 + (-1) Ȳ3

Dado que el modelo es equilibrado, para todas las comparaciones el


valor dentro del corchete es el mismo:

⌊Ʃ(𝑐𝑖2 |𝑛𝑖 )⌋= 12 /n + (-1)2 /n = 2/n = 2/10 = 0,20

La diferencia mínima o rango crítico por encima de la cual diremos


que hay diferencias significativas entre las medias es igual a:

CRScheffe = √(2)(3,35) √(8,64)(0,20) = (2,588) (1,314) = 3,4

|Ȳ1 − Ȳ2 | = |30 − 20| = 10 > 3,4


|Ȳ1 − Ȳ3 | = |30 − 50| = 20 > 3,4
|Ȳ2 − Ȳ3 | = |20 − 50| = 30 > 3,4

Como vemos, las tres diferencias son significativas. Las tres


situaciones de aprendizaje producen resultados distintos.
Ejercicio 2.- Disponemos de tres grupos de sujetos: uno de niños, otro de
niñas y un tercero de adultos. Se les aplica un test que mide dependencia de
campo y los resultados fueron:

niños niñas adultos


6 9 8
5 8 10
6 8 8
4 5 3
3 10 7
5 7 6
4 6 7
4 8 9
5 8

Se desea saber si los tres grupos difieren en la variable estudiada y, caso de


que fuese así, si hay diferencias debidas al género.

Solución:
Dado que tenemos tres muestras independientes, aplicamos un análisis de
varianza de un solo factor.
1) Hipótesis estadísticas:
H0: µ1 = µ2 = µ3
H1: µ1 ≠ µ2 ≠ µ3 al menos para una µi
2) Supuestos:
Vamos a suponer que hemos aplicado el test de rachas, el de Bartlett
y el de Lilliefors y que se cumplen los supuestos de independencia,
homogeneidad de varianzas y normalidad.
3) Estadístico de contraste:

𝑀𝐶inter
𝐹=
𝑀𝐶𝑖𝑛𝑡𝑟𝑎

4) Región crítica: El valor crítico de la tabla de la distribución F para


a-1 = 3-1 = 2 grados de libertad en el numerador y N-a = 26-3 = 23
grados de libertad en el denominador es 3,42 para un nivel de
confianza del 95%.
5) Calculamos el estadístico:
A A2 B B2 C C2
6 36 9 81 8 64
5 25 8 64 10 100
6 36 8 64 8 64
4 16 5 25 3 9
3 9 10 100 7 49
5 25 7 49 6 36
4 16 6 36 7 49
4 16 8 64 9 81
5 25 8 64
42 204 61 483 66 516

SCtotal = (204+483+516) – ⌊(42 + 61 + 66)2 |26)⌋ = 1203 -1098,5 = 104,5


SCinter = ((42)2/9 + (61)2/8 + (66)2/9) – 1098,5 = 1145,125 – 1098,5 =
46,625
SCintra = 104,5 – 46,625 = 57,875
FV SC gl MC F
Entre niveles 46,625 2 23,3125 9,264
Dentro de niveles 57,875 23 2,5163
Total 104,5 25

6) Decisión:
Comparando nuestro valor con el valor tabular tenemos que:
9,264 > 3,42
Por lo tanto rechazamos la hipótesis nula.
7) Interpretamos:
Hemos comprobado, con un nivel de confianza del 95% que hay
diferencia entre los grupos. Vamos a comprobar si es debida a la
diferencia éntrelos niños y las niñas, tal como pide el enunciado del
problema.

CRScheffe = √(𝑎 − 1)𝐹(1−𝛼)(𝑎−1)(𝑁−𝑎) √𝑀𝐶𝑖𝑛𝑡𝑟𝑎 ⌊Ʃ(𝑐𝑖2 |𝑛𝑖 )⌋

Dado que sólo nos interesa una comparación:

Media 1 con media 2: (1)Ȳ1 + (-1) Ȳ2 + (0) Ȳ3


Tenemos:
⌊Ʃ(𝑐𝑖2 |𝑛𝑖 )⌋= 12 /9 + (-1)2 /8 = 0,236

La diferencia mínima o rango crítico por encima de la cual diremos


que hay diferencias significativas entre las medias es igual a:

CRScheffe = √(2)(3,42) √(2,5163)(0,236) = (2,615) (0,771) = 2,02

|Ȳ1 − Ȳ2 | = |4,667 − 7,625| = 2,958 > 2,02

Efectivamente, existe diferencia entre los niños y las niñas.

Ejercicio 3.- Se desea saber si diferentes tiempos de deprivación


alimenticia afectan por igual a la velocidad con que las ratas recorren un
laberinto en cuya meta reciben, sistemáticamente, una cantidad igual de
comida.
Para ello se toma una muestra de 32 ratas macho y se distribuyen,
aleatoriamente, en cuatro grupos a los que se somete a diferentes tiempos
de deprivación. Grupo A = 5 horas; B = 10 horas; C = 15 horas y D = 20
horas.
Pasado ese tiempo se sitúa a cada rata en la salida del laberinto y se registra
el tiempo que tarda en llegar a la meta. Los tiempos medios y las
desviaciones típicas de esos tiempos, para cada grupo, aparecen a
continuación:

Grupo A Grupo B Grupo C Grupo D


Media 10.5 12.5 13 15
Desviación típica 3 4 3.5 4.5

¿Se puede afirmar, con un nivel de confianza del 95%, que los tiempos
medios de los grupos son iguales?

Solución:
Dado que queremos comparar cuatro grupos, parece lógico que el diseño
sea un ANOVA de un factor.
Veamos qué datos tenemos y qué datos necesitamos.
Los cálculos que hay que realizar son:

2
(ƩƩ𝑌𝑖𝑗 )
SCtotal = ƩƩ 𝑌𝑖𝑗2 -
𝑁

2 2
(Ʃ𝑌𝑖𝑗 ) (ƩƩ𝑌𝑖𝑗 )
SCinter = Ʃ -
𝑛𝑖 𝑁

SCintra = SCtotal - SCinter

Así pues, necesitamos los sumatorios de las puntuaciones de cada grupo


total y los sumatorios de las puntuaciones al cuadrado.
Dado que en el enunciado del ejercicio se nos han dado las medias y las
desviaciones típicas, y conocemos sus fórmulas, podemos despejar los
datos que nos faltan.

10,5 = Ʃ YiA /8 → Ʃ YiA = 84


12,5 = Ʃ YiB /8 → Ʃ YiB = 100
13 = Ʃ YiC /8 → Ʃ YiC = 104
15 = Ʃ YiD /8 → Ʃ YiD = 120
ƩƩYij = 84+100+104+120= 408

2 2
9 = (Ʃ𝑌𝑖𝐴 /8) – (10,5)2 → Ʃ𝑌𝑖𝐴 = 954
2 2
16 = (Ʃ𝑌𝑖𝐵 /8) – (12,5)2 → Ʃ𝑌𝑖𝐵 = 1378
12,25 = (Ʃ𝑌𝑖𝐶2 /8) – (13)2 → Ʃ𝑌𝑖𝐶2 = 1450
2 2
20,25 = (Ʃ𝑌𝑖𝐷 /8) – (15)2 → Ʃ𝑌𝑖𝐷 = 1962
ƩƩ𝑌𝑖𝑗2 = 954 + 1378 + 1450 + 1962 = 5744

SCtotal = 5744 – ((408)2/32) = 5744 – 5202 = 542


SCinter = ((842/8) + (1002/8) + (1042/8) + (1202/8) ) – 5202= 5284-5202= 82
SCintra = 542 – 82 = 460

FV SC gl MC F
Entre niveles 82 3 27,33 1,66
Dentro de niveles 460 28 16,43
Total 542 31

Si buscamos en la tabla de la distribución F, el valor crítico para 3 y 28


grados de libertad, con un nivel de confianza del 95% es 2,95.

Como 1,66 < 2,95 no podemos rechazar la hipótesis nula del análisis de
varianza. No podemos considerar que haya diferencias en los tiempos que
tardan las ratas en recorrer el laberinto en función de los tiempos de
privación de alimentos, con un nivel de confianza del 95%.
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

SITUACIÓN 1: Con el objetivo de mejorar la función hepática, un investigador medico está interesado en la
tasa máxima de síntesis de urea en pacientes con cirrosis que experimentaron una operación estándar
(bypass no selectivo), un bypass selectivo para pacientes con una síntesis de urea menor de 40 (grupo
selectivo I) y un bypass selectivo para pacientes con una síntesis de urea superior a 40 (grupo selectivo II).
Cada uno de los tres grupos (bypass no selectivo, bypass selectivo Grupo I y bypass selectivo grupo II) estuvo
compuesto por 6 pacientes. Sabemos que: 𝑆𝐶𝐼𝑛𝑡𝑒𝑟 = 160,44 y que 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 710,66

1- La hipótesis nula es:


𝐴) 𝐻0 : 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜 = 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑛𝑜𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜 (𝐼) ≠ 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑛𝑜_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜(𝐼𝐼)
B) 𝐻0 : 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑛𝑜_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜 = 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑠𝑒𝑙𝑒𝑐𝑐𝑡𝑖𝑣𝑜(𝐼) = 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜(𝐼𝐼)
C) 𝐻0 : 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑛𝑜_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜 ≠ 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜(𝐼) = 𝜇𝑏𝑦𝑝𝑎𝑠𝑠_𝑠𝑒𝑙𝑒𝑐𝑡𝑖𝑣𝑜(𝐼𝐼)

2- ¿Qué supuestos debo verificar que se cumplen en este caso para aplicar el ANOVA? A) las observaciones
se distribuyen según la distribución F en los tres grupos; B) las varianzas de los tres grupos deben ser
similares; C) la distribución de las puntuaciones es asimétrica en los tres grupos.

3- Los grados de libertad del estadístico F de contraste para evaluar el efecto del “tipo de operación
médica” valen: A) (15; 3); B) (2; 15); C) (2; 18).

4- El estadístico de contraste F para evaluar el efecto del “tipo de operación médica” vale
aproximadamente: A) 1,693; B) 3,295; C) 0,392

5- Si trabajamos a un nivel de confianza del 95%, el valor crítico para contrastar la F del “tipo de operación
médica” valdrá: A)1,693; B) 3,682; C) 2,695

SITUACIÓN 2. Un agrónomo desea conocer el efecto que sobre el rendimiento de una variedad de trigo tiene
la adición de 3 tipos diferentes de fosfatos al terreno. Para ello parcela un terreno en 12 áreas del mismo
tamaño y trata cada cuatro parcelas con un tipo distinto de fosfato (A, B o C). A continuación siembra trigo
en cada uno de ellos y, después de la recolección, mide la cantidad de trigo producida por cada superficie
(en hectólitros por hectárea o hl/ha). Nivel de confianza: 95%. Sabemos que:

𝑆𝐶𝑆/𝐴 = 𝑆𝐶𝑑𝑒𝑛𝑡𝑟𝑜_𝑛𝑖𝑣𝑒𝑙𝑒𝑠 = 6; 𝑆𝐶𝐴 = 𝑆𝐶𝑒𝑛𝑡𝑟𝑒_𝑛𝑖𝑣𝑒𝑙𝑒𝑠 = 8

Y la siguiente tabla muestra el rendimiento obtenido en función del tipo de fosfato añadido.

Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50

1- Se trata de un diseño: A) de una muestra con 12 observaciones; B) de un factor con tres niveles (tipo de
fosfato); C) de un factor (parcela de terreno) con cuatro niveles.

2- La hipótesis nula es A) 𝐻0 : 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐴 = 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐵 ; B) 𝐻0 : 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐴 = 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐵 = 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐶 ; C)


𝐻0 : 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐴 ≠ 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐵 ≠ 𝜇𝑓𝑜𝑠𝑓𝑎𝑡𝑜𝐶

3- Los grados de libertad del estadístico F de contraste valen: A) (3;9); B) (2;11); C) (2;9).

4 - El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato” vale aproximadamente: A)
6; B) 3,295; C) 0,392.

-1-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

5- El diseño presentado es: A) de efectos fijos; B) desequilibrado; C) las dos opciones anteriores son
incorrectas.

6- El modelo estadístico que podemos aplicar a estos datos es: A) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖 + 𝜀𝑖𝑗 ; B) 𝐸(𝑀𝐶𝐼𝑛𝑡𝑒𝑟 ) =
1
𝜎 2 + (𝐼−1) 𝑛𝑖 𝛼𝑖2; C) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖 + (𝛼𝜀)𝑖𝑗 + 𝜀𝑖𝑗

7- El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196, 192, 200}; C) {2/3, 2/3,
2/3}.

8- La variación entre tratamientos vale: A) 4; B) 8; C) 14.

9- La variación dentro de los tratamientos vale aproximadamente: A) 5/3; B) 4/3; C) 2/3.

10- El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es superior en, aproximadamente,
6 veces a la MCInter; B) No, porque la SCintra es casi igual a la SCinter indicando que la variabilidad asociada al
tratamiento es casi idéntica a la del error; C) Sí, porque la F obtenida (6) es superior al valor crítico
𝐹2;9;0,05 = 4,256

11- ¿Entre qué niveles podemos asegurar que existen diferencias según CR de Scheffé? A) sólo entre los
niveles B y C; B) Sólo entre los niveles A y C; C) sólo entre los niveles A y B.

12- El diseño presentado no permite evaluar la interacción: A) porque el factor manipulado (tipo de
fertilizante) no puede interaccionar con ningún otro factor; B) porque tal interacción no ha sido incluida
en el modelo; C) porque sólo existe un factor manipulado y la interacción siempre se predica, como
mínimo, de dos factores.

SITUACIÓN 3. Un investigador sospecha que los tiempos de coagulación de la sangre difieren en función del
tipo de dieta. Para ello, ha realizado un experimento donde ha formado varios grupos de ratones,
sometiendo a cada grupo a distintos tipos de dietas. Tras analizar los datos mediante un ANOVA, parte de los
siguientes resultados:

F.V. S.C. g.l. M.C. F


Entre niveles 228 3
Dentro de niveles 112 20
Total 340 23

1- Asumiendo un diseño equilibrado, ¿cuántos animales utilizó por grupo? A) 6; B) 4; C) 5.

2- ¿Cuántos niveles tiene el factor “Tipo de dieta”? A) 6; B) 4; C) 3.

3- La hipótesis nula planteada en este diseño es: A) 𝐻0 : 𝜇𝑖 = 𝜇𝑗 para todo 𝑖 ≠ 𝑗; B) 𝐻0 : 𝜇𝑖 ≠ 𝜇𝑗 para todo
𝑖 = 𝑗; C) 𝑌𝑖𝑗 = 𝜇 + 𝛼𝑖𝑗 + 𝜀𝑖𝑗 .

4- El valor de la F para el factor “Tipo de dieta” fue: A) 8,660; B) 2,380; C) 13,57.

5- Siendo 𝛼 = 0,05, el valor de la F crítica para el factor “Tipo de dieta” fue: A) 3,098; B) 2,380; C) 4,938.

-2-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

6- ¿Tendremos que realizar comparaciones a posteriori? A) Sí; B) No porque tenemos más de 2 niveles del
factor; C) No porque las comparaciones a posteriori solo se aplican en diseños intrasujetos.

7- Con un nivel de confianza del 95%, ¿Cuál será el valor mínimo de la diferencia entre dos medias
cualesquiera en este experimento para que resulten significativas según Scheffé (𝛼 = 0,05)? A) 12,39; B)
0,59; C) 4,17.

8- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a comparar deben de
cumplir el supuesto de: A) complementariedad y exhaustividad; B) homocedasticidad; C) independencia.

SITUACIÓN 4: Un fabricante de bolsas de papel está interesado en mejorar la resistencia a la tensión de las
mismas. El ingeniero piensa que la resistencia a la tensión es una función de la concentración de madera
frondosa (hardwood) en la pulpa con la que se hace el papel y que el rango de concentración de este tipo de
madera se encuentra entre el 5 y el 20%. Por ello, el equipo de ingenieros decide investigar cuatro niveles de
esta concentración: 5%, 10%, 15% y 20%. Deciden componer seis especímenes de test en cada nivel de
concentración. Los 24 especímenes se evalúan en el laboratorio para determinar su resistencia a la tensión
en orden aleatorio. En el informe los investigadores indican que “El factor Concentración fue significativo
[𝐹(3, 20) = 19,60, 𝑀𝐶𝑒𝑟𝑟𝑜𝑟 = 6,51, 𝑝 = 0,00000359]”

1- Se trata de un diseño: A) desequilibrado y de efectos aleatorios; B) de efectos aleatorios; C) equilibrado y


de efectos fijos.

2- El valor de MC para el factor Concentración es: A) 0,05; B) 127,60; C) 1,05.

3- El valor de la F crítica para un 𝛼 = 0,005 es: A) 21,332 B) 4,938; C) 5,818.

4- La suma de cuadrados para el factor Concentración vale: A) 382,8; B) 130,17; C) 127,60.

5- Dados los resultados obtenidos ¿deberían los ingenieros realizar pruebas de comparaciones múltiples o a
posteriori? A) sí ya que hay más de 2 grupos y la F ha resultado significativa; B) no son necesarias porque
la F ha resultado significativa; C) No, porque sólo tenemos cuatro grupos.

6- Si el experimento hubiera sido de efectos aleatorios, las concentraciones a utilizar en el experimento: A)


se habrían elegido al azar entre 5 y 20; B) serían las mismas que las que se han utilizado en el
experimento, es decir, 5, 10, 15 y 20%; B) se habrían elegido al azar entre 0 y 1.

7- El investigador también podría haber sustituido en el informe el valor de p = 0,00000359 por: A) p <
0,0001; B) p > 0,001; C) p > 0,05.

8- Como el factor manipulado es una variable numérica (no categórica), también sería posible: A) realizar un
análisis categórico para estos datos; B) realizar un análisis cualitativo sobre cada nivel del factor; C)
realizar un análisis de regresión lineal simple sobre estos datos.

9- El cumplimiento del supuesto de homocedasticidad en este análisis: A) implicaría que la varianza de los
valores de resistencia a la tensión del papel son semejantes independientemente de la concentración de
madera frondosa; B) implicaría que las medias de tensión del papel condicionadas a la concentración de
madera frondosa siguen una función lineal; C) implicaría que las medias de tensión del papel
condicionadas a la concentración de madera frondosa siguen una distribución lineal.

-3-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

10- El valor de p = 0,00000359 obtenido en el experimento es la probabilidad: A) del 𝑀𝐶𝑒𝑟𝑟𝑜𝑟 ; B) de la F


crítica; C) condicional de haber obtenido una F = 19,60 o superior siendo H0 cierta.

SITUACIÓN 5. Un investigador se encuentra interesado en la eficacia de los tratamientos para la pérdida de


peso. Considera interesante poner a prueba los tres tratamientos más relevantes: ejercicio, dieta y
ejercicio+dieta. Pero, además, cree que el lugar donde se realiza el tratamiento puede tener un efecto. Para
ello, contacta con una empresa que tiene un programa de reducción del sobrepeso para sus empleadas y
proporciona a 10 de ellas un carnet para la asistencia a una clínica dietética, a otras 10 un carnet de un club
deportivo y a un último grupo de 10 mujeres les proporciona ambos carnets que les permiten asistir
gratuitamente a estas instalaciones. En cada grupo, la mitad de mujeres (5) han sido elegidas aleatoriamente
de la planta de manufacturado y la otra mitad (otras 5) han sido elegidas de la sección de secretaría. La
variable dependiente fue la reducción de peso. Asumimos que se cumplen los supuestos del análisis de
varianza. Trabajamos a un 𝛼 = 0,05.

1- Se trata de un diseño factorial: A) 2x2 ya que se han manipulado los tratamientos (ejercicio y dieta) y el
tipo de carnet (clínica, club y ambos); B) desequilibrado; C) 3x2 ya que se ha manipulado el tipo de
tratamiento (con tres niveles) y el lugar de selección de las mujeres (con dos niveles).

2- El investigador ha informado que ninguno de los factores principales ha resultado significativo. Esto
significa que: A) la interacción no puede ser significativa; B) ni el lugar de selección de las mujeres ni el
tratamiento han resultado significativos; C) el experimento ha resultado fallido.

3- El investigador ha informado que la F de la interacción fue 4,722. De manera aproximada, y utilizando las
tablas correspondientes ¿ha resultado significativa?: A) No es posible saberlo sin conocer la media
cuadrática del error; B) Sí, ya que 4,722 es superior a 3,493; C) No porque, siendo cierta H0, la
probabilidad de obtener un valor de 4,722 o superior es superior a 0,05.

SITUACIÓN 6: Diversos estudios ponen de manifiesto que las enfermedades de tipo alérgico se ven
agravadas por la presencia de fuerte estrés. Además, la época del año parece afectar de forma decisiva a la
gravedad de los trastornos alérgicos. En un estudio se ha utilizado una muestra aleatoria de 5 pacientes
alérgicos (todos con el mismo tipo de alergia) sometidos a condiciones de alto estrés. Un grupo de
especialistas ha evaluado la gravedad de la alergia de cada paciente (en una escala de 0 a 10) en los cuatro
periodos estacionales: primavera, verano, otoño e invierno. Para analizar estos datos, el investigador utilizó
un ANOVA cuyas razones básicas aparecen a continuación (utilice un 𝛼 = 0,05):

[A] [S] [AxS] [T]


910 852,5 940 845

1- Se trata de un diseño: A) factorial de 2 factores (estrés y estación del año); B) factorial de un factor con 4
niveles; C) factorial de 2 factores con 2 niveles cada uno.

2- El análisis realizado es del tipo: A) contrabalanceado; B) inter-sujetos; C) intra-sujetos.

3- La Media Cuadrática del error (en este caso, AxS) vale aproximadamente: A) 5; B) 21,67; C) 1,87.

4- La F crítica para evaluar el efecto del factor vale: A) 3,49; B) 4,474; C) 5,953.

-4-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

5- El informe de este trabajo debería realizarse de la siguiente manera: A) F(3; 12) = 11.56, MSe = 1,875, p
< 0,05; B) F(3; 12) = 0,05, MSe = 11,59, p > 0,10; C) F(12; 3) = 11,59, MSe = 21,67, p = 0,05.

6- El análisis de los datos nos indicaron una potencia de 0.99 para el factor “Periodo estacional”. Esto
significa que: A) Como el valor es cercano a la unidad, no existen diferencias en la gravedad de la alergia
en función del periodo estacional; B) debemos realizar contrastes a posteriori; C) La probabilidad de
rechazar la hipótesis nula H 0 : Pr imavera  Verano  Otoño  Invierno siendo esta falsa vale 0,99.

7- Si deseamos evaluar el supuesto de simetría compuesta en este estudio, necesitaremos disponer de la


matriz de varianzas-covarianzas que tendrá: A) 4x3 celdillas; B) 3x3 celdillas; C) 4x4 celdillas.

8- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede adoptar valores
negativos porque: A) los valores de la ordenada (eje vertical) son todos positivos; B) toda distribución de
densidad de probabilidad se estandariza para que tenga un área igual a la unidad; C) es el cociente entre
dos varianzas y estas son siempre positivas.

9- El contrabalanceo de las condiciones experimentales es necesario realizarlo: A) en diseños intra-sujetos;


B) cuando no existen efectos de práctica o fatiga; C) para aleatorizar los efectos de las condiciones
manipuladas.

SITUACIÓN 7. Un investigador se interesó en estudiar si los efectos de la marihuana dependían de la


utilización previa (o no) de esta droga. Para responder a esta pregunta, realizó un experimento con 12
usuarios frecuentes de marihuana, 12 usuarios infrecuentes de marihuana y 12 estudiantes que no habían
probado anteriormente la marihuana. A su vez, asignó de manera aleatoria la condición placebo o
experimental a cada uno de los 12 sujetos de cada tipo. En la condición placebo se pidió a cada sujeto que
fumara dos cigarros normales pero que olían y sabían a marihuana. En la condición experimental se pidió a
cada participante que fumara dos cigarrillos hechos efectivamente con marihuana. Inmediatamente
después se les pidió realizar un test de rapidez motora que mide el tiempo (en segundos) en realizar una
tarea experimental sencilla. Los datos de este experimento aparecen en la siguiente tabla.

Grupo placebo Grupo experimental


usuario usuario sin contacto usuario usuario sin contacto
frecuente infrecuente previo frecuente infrecuente previo
79 80 79 81 84 96
69 70 70 73 76 86
63 64 64 98 71 81
60 61 60 63 66 87
75 75 75 78 81 91
70 71 71 74 77 84

1- El diseño es: A) de medidas repetidas 2x3; B) de dos factores inter-sujetos 2x3; C) de un factor intersujeto
con tres niveles.

2- Podemos calificar el diseño de: A) efectos aleatorios; B) de efectos fijos; C) desequilibrado.

-5-
Diseños de investigación y análisis de datos. Enunciados ejercicios Temas 5, 6 y 7

3- Los valores de las MC para los efectos principales valen: A) 33,19 y 90392,1; B) 29019,3 y 29993,10; C)
1013,361 y 116,583.

4- La SC y la MC para la interacción valen: A) 236,056 y 118,028; B) 29019,3 y 14509,7; C) 1013,361 y


506,681.

5- El valor F para el factor Grupo (experimental vs. placebo) es: A) 17,174; B) 1,058; C) 3,392.

6- El valor F para el factor Tipo de Usuario de Marihuana es: A) 1,976; B) 5,302; C) 9,992.

7- Las comparaciones “a posteriori” para el factor Grupo: A) no son necesarias ya que este factor sólo tiene
2 niveles y la F ya nos indica que las medias son diferentes entre sí; B) son necesarias ya que la F ha
resultado significativa; C) se aplican sólo cuando la interacción es significativa.

8- Con respecto a la interacción: A) habrá que analizarla mediante los 5 efectos simples; B) no se debe
realizar un análisis de efectos simples porque la interacción no es significativa; C) la interacción muestra
que los sujetos sin experiencia previa del grupo experimental difiere significativamente de los otros dos
grupos de usuarios en el grupo experimental, pero no en el placebo.

9- El experimentador debe concluir que: A) los sujetos que tienen experiencia infrecuente y frecuente con la
marihuana tienen una respuesta diferente a los sujetos que no han tenido experiencia previa; B) el
tiempo de respuesta es superior cuando los sujetos han fumado marihuana que cuando no lo han hecho,
y este resultado no se muestra afectado por la experiencia previa del usuario con esta droga; C) la
experiencia con la marihuana no afecta a los sujetos que toman la droga placebo, pero afecta
notablemente a los sujetos sin ningún tipo de experiencia con la marihuana.

-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

SITUACIÓN 1: Con el objetivo de mejorar la función hepática, un investigador medico está interesado en la
tasa máxima de síntesis de urea en pacientes con cirrosis que experimentaron una operación estándar
(bypass no selectivo), un bypass selectivo para pacientes con una síntesis de urea menor de 40 (grupo
selectivo I) y un bypass selectivo para pacientes con una síntesis de urea superior a 40 (grupo selectivo II).
Cada uno de los tres grupos (bypass no selectivo, bypass selectivo Grupo I y bypass selectivo grupo II) estuvo
compuesto por 6 pacientes. Sabemos que: y que

Tenemos que aplicar un análisis de la varianza para tres muestras independientes con tres niveles
con 6 sujetos en cada uno de ellos . El número total de sujetos es: .
Con estos datos y las sumas de cuadrados del enunciado, completamos fácilmente la tabla de
ANOVA.

FV SC g.l. MC F

Factor

Error

Total

1- La hipótesis nula es:

B)
C)

La hipótesis nula ha de postular la igualdad de las medias en los tres niveles.

2- ¿Qué supuestos debo verificar que se cumplen en este caso para aplicar el ANOVA? A) las observaciones
se distribuyen según la distribución F en los tres grupos; B) las varianzas de los tres grupos deben ser
similares; C) la distribución de las puntuaciones es asimétrica en los tres grupos.

3- Los grados de libertad del estadístico F de contraste para evaluar el efecto del “tipo de operación
médica” valen: A) (15, 3); B) (2, 15); C) (2, 18).

4- El estadístico de contraste F para evaluar el efecto del “tipo de operación médica” vale
aproximadamente: A) 1.693; B) 3.295; C) 0.392

5- Si trabajamos a un nivel de confianza del 95%, el valor crítico para contrastar la F del “tipo de operación
médica” valdrá: A)1.693; B) 3.682; C) 2.695

Buscamos en la tabla F de Fisher para 2 y 15 grados de libertad la puntuación que supera una proporción
igual a 0,95 (nivel de confianza).

-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

SITUACIÓN 2. Un agrónomo desea conocer el efecto que sobre el rendimiento de una variedad de trigo tiene
la adición de 3 tipos diferentes de fosfatos al terreno. Para ello parcela un terreno en 12 áreas del mismo
tamaño y trata cada cuatro parcelas con un tipo distinto de fosfato (A, B o C). A continuación siembra trigo
en cada uno de ellos y, después de la recolección, mide la cantidad de trigo producida por cada superficie
(en hectólitros por hectárea o hl/ha). Nivel de confianza: 95%. Sabemos que:

Y la siguiente tabla muestra el rendimiento obtenido en función del tipo de fosfato añadido.

Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50

Tenemos un factor con tres niveles , en el que en cada nivel hay 4 observaciones . Las
muestras son independientes. Fácilmente construimos la tabla de ANOVA.

SC gl MC F

Entre niveles

Dentro niveles

Total

1- Se trata de un diseño: A) de una muestra con 12 observaciones; B) de un factor con tres niveles (tipo de
fosfato); C) de un factor (parcela de terreno) con cuatro niveles.

2- La hipótesis nula es A) ; B) ; C)

La hipótesis nula ha de postular la igualdad de las medias en todos los niveles, luego la opción
correcta es B.

3- Los grados de libertad del estadístico F de contraste valen: A) (3,9); B) (2,11); C) (2,9).

4 - El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato” vale aproximadamente: A)
6; B) 3.295; C) 0.392.

5- El diseño presentado es: A) de efectos fijos; B) desequilibrado ; C) las dos opciones anteriores son
incorrectas.

Se trata de un diseño de efectos fijos. No puede ser desequilibrado ya que hay 4 terrenos o parcelas
para cada tipo de fertilizante (lo cual indicaría que es equilibrado). Solo nos interesan estos
fertilizantes (A, B y C), ningún otro.

-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

6- El modelo estadístico que podemos aplicar a estos datos es: A) B)


; C)

La opción B no es un modelo sino la expresión del valor esperado de la Media Cuadrática Inter. La
expresión C es incorrecta ya que asume la interacción entre los errores y los niveles del tratamiento.
La opción correcta es la A ya que expresa cada puntuación de la variable dependiente (Yij) como la
suma de tres componentes: una media global común (  ), el efecto del factor del terreno concreto
del que estemos hablando y un error aleatorio

7- El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196, 192, 200}; C) {2/3, 2/3,
2/3}.

Para obtener el rendimiento medio para los diferentes tratamientos simplemente calculamos la
media de cada fertilizante:

8- La variación entre tratamientos vale: A) 4; B) 8; C) 14.

9- La variación dentro de los tratamientos vale aproximadamente: A) 5/3; B) 4/3; C) 2/3.

10- El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es superior en, aproximadamente,
6 veces a la MCInter; B) No, porque la SCintra es casi igual a la SCinter indicando que la variabilidad asociada al
tratamiento es casi idéntica a la del error; C) Sí, porque la F obtenida (6) es superior al valor crítico

11- ¿Entre qué niveles podemos asegurar que existen diferencias según CR de Scheffé? A) sólo entre los
niveles B y C; B) Sólo entre los niveles A y C; C) sólo entre los niveles A y B.

Aplicamos la fórmula de la CR de Scheffé (como nos piden asegurar entre qué niveles existen
diferencias, ponemos los coeficientes típicos para la comparación entre dos niveles dejando el tercero
sin incluir):

√ √ ⁄ [∑ ( ⁄ )]

√ √ ⁄ ⁄

Ahora realizamos las diferencias (en valor absoluto) entre las tres medias:

| ̅ ̅| | |
| ̅ ̅| | |
|̅ ̅| | |

-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

12- El diseño presentado no permite evaluar la interacción: A) porque el factor manipulado (tipo de
fertilizante) no puede interaccionar con ningún otro factor; B) porque tal interacción no ha sido incluida
en el modelo; C) porque sólo existe un factor manipulado y la interacción siempre se predica, como
mínimo, de dos factores.

SITUACIÓN 3. Un investigador sospecha que los tiempos de coagulación de la sangre difieren en función del
tipo de dieta. Para ello, ha realizado un experimento donde ha formado varios grupos de ratones,
sometiendo a cada grupo a distintos tipos de dietas. Tras analizar los datos mediante un ANOVA, parte de los
siguientes resultados:

F.V. S.C. g.l. M.C. F


Entre niveles 228 3
Dentro de niveles 112 20
Total 340 23

Conociendo los grados de libertad, deducimos el número de niveles, el número de sujetos en cada
nivel y número total de sujetos:

Completamos la tabla de ANOVA:

F.V. S.C. g.l. M.C. F


Entre grupos 228 3 228/3 = 76 76/5,6 = 13,57
Error 112 20 112/20 = 5,6

Total 340 23

1- Asumiendo un diseño equilibrado, ¿cuántos animales utilizó por grupo? A) 6; B) 4; C) 5.

2- ¿Cuántos niveles tiene el factor “Tipo de dieta”? A) 6; B) 4; C) 3.

3- La hipótesis nula planteada en este diseño es: A) para todo ; B) para todo
; C) .

4- El valor de la F para el factor “Tipo de dieta” fue: A) 8,660; B) 2,380; C) 13,57.

5- Siendo   0.05 , el valor de la F crítica para el factor “Tipo de dieta” fue: A) 3,098; B) 2,380; C) 4,938.

Para un nivel de confianza del 95%, mirando en las tablas F de Fisher para 3 y 20 grados de libertad,
observamos que la F crítica es: 3,098, luego la alternativa correcta es “A”.

6- ¿Tendremos que realizar comparaciones a posteriori? A) Sí; B) No porque tenemos más de 2 niveles del
factor; C) No porque las comparaciones a posteriori solo se aplican en diseños intrasujetos.

-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

Tendremos que hacer comparaciones “a posteriori” porque hemos rechazado la hipótesis nula que
planteaba la igualdad entre las medias .

7- Con un nivel de confianza del 95%, ¿Cuál será el valor mínimo de la diferencia entre dos medias
cualesquiera en este experimento para que resulten significativas según Scheffé ( 0,05)? A) 12,39; B)
0,59; C) 4,17.

Como el modelo es equilibrado es igual para todas las diferencias entre pares de medias, dado
que:

∑( ⁄ ) ( ⁄ ) ( ⁄ ) ⁄

√ √ ⁄ [∑ ( ⁄ )]

√ √ ( ⁄ )

8- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a comparar deben de
cumplir el supuesto de: A) complementariedad y exhaustividad; B) homocedasticidad; C) independencia.

SITUACIÓN 4: Un fabricante de bolsas de papel está interesado en mejorar la resistencia a la tensión de las
mismas. El ingeniero piensa que la resistencia a la tensión es una función de la concentración de madera
frondosa (hardwood) en la pulpa con la que se hace el papel y que el rango de concentración de este tipo de
madera se encuentra entre el 5 y el 20%. Por ello, el equipo de ingenieros decide investigar cuatro niveles de
esta concentración: 5%, 10%, 15% y 20%. Deciden componer seis especímenes de test en cada nivel de
concentración. Los 24 especímenes se evalúan en el laboratorio para determinar su resistencia a la tensión
en orden aleatorio. En el informe los investigadores indican que “El factor Concentración fue significativo
[ , , ]”

El enunciado nos ofrece los siguientes datos de la tabla de ANOVA:

F.V. S.C. g.l. M.C. F


INTER
INTRA 6,51
TOTAL

De los que deducimos:

Una vez conocida :

-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

Las sumas de cuadrados total y de error son:

⁄ ⁄
⁄ ⁄

Con lo que completamos la tabla de ANOVA:

F.V. S.C. g.l. M.C. F


INTER
INTRA 6,51
TOTAL

1- Se trata de un diseño: A) desequilibrado y de efectos aleatorios; B) de efectos aleatorios; C) equilibrado y


de efectos fijos.

2- El valor de MC para el factor Concentración es: A) 0,05;B) 127,60; C) 1,05.

3- El valor de la F crítica para un es: A) 21,332 B) 4,938; C) 5,818.

Buscamos en la tabla de la distribución F para con 3 y 20 g.l

4- La suma de cuadrados para el factor Concentración vale: A) 382,8; B) 130,17; C) 127,60.

5- Dados los resultados obtenidos ¿deberían los ingenieros realizar pruebas de comparaciones múltiples o a
posteriori? A) sí ya que hay más de 2 grupos y la F ha resultado significativa; B) no son necesarias porque
la F ha resultado significativa; C) No, porque sólo tenemos cuatro grupos.

6- Si el experimento hubiera sido de efectos aleatorios, las concentraciones a utilizar en el experimento: A)


se habrían elegido al azar entre 5 y 20; B) serían las mismas que las que se han utilizado en el
experimento, es decir, 5, 10, 15 y 20%; B) se habrían elegido al azar entre 0 y 1.

7- El investigador también podría haber sustituido en el informe el valor de p = 0,00000359 por: A) p <
0,0001; B) p > 0,001; C) p > 0,05.

8- Como el factor manipulado es una variable numérica (no categórica), también sería posible: A) realizar un
análisis categórico para estos datos; B) realizar un análisis cualitativo sobre cada nivel del factor; C)
realizar un análisis de regresión lineal simple sobre estos datos.

9- El cumplimiento del supuesto de homocedasticidad en este análisis: A) implicaría que la varianza de los
valores de resistencia a la tensión del papel son semejantes independientemente de la concentración
de madera frondosa; B) implicaría que las medias de tensión del papel condicionadas a la concentración

-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

de madera frondosa siguen una función lineal; C) implicaría que las medias de tensión del papel
condicionadas a la concentración de madera frondosa siguen una distribución lineal.

10- El valor de p = 0,00000359 obtenido en el experimento es la probabilidad: A) del ; B) de la F


crítica; C) condicional de haber obtenido una F = 19,60 o superior siendo H0 cierta.

SITUACIÓN 5. Un investigador se encuentra interesado en la eficacia de los tratamientos para la pérdida de


peso. Considera interesante poner a prueba los tres tratamientos más relevantes: ejercicio, dieta y
ejercicio+dieta. Pero, además, cree que el lugar donde se realiza el tratamiento puede tener un efecto. Para
ello, contacta con una empresa que tiene un programa de reducción del sobrepeso para sus empleadas y
proporciona a 10 de ellas un carnet para la asistencia a una clínica dietética, a otras 10 un carnet de un club
deportivo y a un último grupo de 10 mujeres les proporciona ambos carnets que les permiten asistir
gratuitamente a estas instalaciones. En cada grupo, la mitad de mujeres (5) han sido elegidas aleatoriamente
de la planta de manufacturado y la otra mitad (otras 5) han sido elegidas de la sección de secretaría. La
variable dependiente fue la reducción de peso. Asumimos que se cumplen los supuestos del análisis de
varianza. Trabajamos a un   0.05 .

1- Se trata de un diseño factorial: A) 2x2 ya que se han manipulado los tratamientos (ejercicio y dieta) y el
tipo de carnet (clínica, club y ambos); B) desequilibrado; C) 3x2 ya que se ha manipulado el tipo de
tratamiento (con tres niveles) y el lugar de selección de las mujeres (con dos niveles).

El primer factor es el tipo de tratamiento con tres niveles (ejercicio, dieta y ejercicio+dieta) y el
segundo es el lugar con dos niveles (mujeres extraídas de la planta de manufactura y mujeres
extraídas de Secretaría). Luego se trata de un diseño intersujetos 3x2. El diseño está equilibrado
porque hay 5 mujeres en cada combinación de tratamiento con planta.

2- El investigador ha informado que ninguno de los factores principales ha resultado significativo. Esto
significa que: A) la interacción no puede ser significativa; B) ni el lugar de selección de las mujeres ni el
tratamiento han resultado significativos; C) el experimento ha resultado fallido.

Con la frase inicial (ninguno de los factores principales ha resultado significativo) lo único que
podemos concluir es que ninguno de los factores ha alcanzado la significatividad (ninguno ha
afectado a la pérdida de peso de las mujeres). No sabemos nada de la interacción (no nos lo han
dicho y de la afirmación realizada no podemos deducir nada ya que la significatividad de los factores
principales no nos dice nada sobre la significatividad de la interacción). Un experimento no resulta
fallido por sus resultados.

3- El investigador ha informado que la F de la interacción fue 4.722. De manera aproximada, y utilizando las
tablas correspondientes ¿ha resultado significativa?: A) No es posible saberlo sin conocer la media
cuadrática del error; B) Sí, ya que 4.722 es superior a 3.493; C) No porque, siendo cierta H0, la
probabilidad de obtener un valor de 4.722 o superior es superior a 0.05.

-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

Comparamos el estadístico de contraste ( ) con el valor crítico. Los grados de libertad son 2
y 24. Si sólo utilizamos las tablas buscamos con 2 y 20 grados de libertad, obteniendo un valor:
. Dado que: , existen diferencias significativas entre al menos un par
de medias.

SITUACIÓN 6: Diversos estudios ponen de manifiesto que las enfermedades de tipo alérgico se ven
agravadas por la presencia de fuerte estrés. Además, la época del año parece afectar de forma decisiva a la
gravedad de los trastornos alérgicos. En un estudio se ha utilizado una muestra aleatoria de 5 pacientes
alérgicos (todos con el mismo tipo de alergia) sometidos a condiciones de alto estrés. Un grupo de
especialistas ha evaluado la gravedad de la alergia de cada paciente (en una escala de 0 a 10) en los cuatro
periodos estacionales: primavera, verano, otoño e invierno. Para analizar estos datos, el investigador utilizó
un ANOVA cuyas razones básicas aparecen a continuación (utilice un   0,05 ):

[A] [S] [AxS] [T]


910 852.5 940 845

Tenemos un diseño de un factor de medidas repetidas con cuatro niveles (periodos estacionales) y
cinco sujetos. En primer lugar calculamos las sumas de cuadrados a partir de las razones básicas:

[ ] [ ]
[ ] [ ]
[ ] [ ]

A continuación construimos la tabla de ANOVA.

FV SC g.l. MC F
A 65 21,67 11,5573
S 7,5 1,875
AxS 22,5 12 1,875
T 95 5

1- Se trata de un diseño: A) factorial de 2 factores (estrés y estación del año); B) factorial de un factor con 4
niveles; C) factorial de 2 factores con 2 niveles cada uno.

2- El análisis realizado es del tipo: A) contrabalanceado; B) inter-sujetos; C) intra-sujetos.

3- La Media Cuadrática del error (en este caso, AxS) vale aproximadamente: A) 5; B) 21.67; C) 1.87.

4- La F crítica para evaluar el efecto del factor vale: A) 3.49; B) 4.474; C) 5.953.

Buscando en las Tablas F de Fisher para 3 y 12 grados de libertad, observamos que la respuesta
correcta es A.

-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Temas 5, 6 y 7

5- El informe de este trabajo debería realizarse de la siguiente manera: A) F(3, 12) = 11.56, MSe = 1.875, p
< 0.05; B) F(3, 12) = 0.05, MSe = 11.59, p > 0.10; C) F(12, 3) = 11.59, MSe = 21.67, p = 0.05.

6- El análisis de los datos nos indicaron una potencia de 0.99 para el factor “Periodo estacional”. Esto
significa que: A) Como el valor es cercano a la unidad, no existen diferencias en la gravedad de la alergia
en función del periodo estacional; B) debemos realizar contrastes a posteriori; C) La probabilidad de
rechazar la hipótesis nula H 0 : Pr imavera  Verano  Otoño  Invierno siendo esta falsa vale 0.99.

7- Si deseamos evaluar el supuesto de simetría compuesta en este estudio, necesitaremos disponer de la


matriz de varianzas-covarianzas que tendrá: A) 4x3 celdillas; B) 3x3 celdillas; C) 4x4 celdillas.

8- Una distribución de densidad de probabilidad (f.d.p) que siga la distribución F no puede adoptar valores
negativos porque: A) los valores de la ordenada (eje vertical) son todos positivos; B) toda distribución de
densidad de probabilidad se estandariza para que tenga un área igual a la unidad; C) es el cociente entre
dos varianzas y estas son siempre positivas.

9- El contrabalanceo de las condiciones experimentales es necesario realizarlo: A) en diseños intra-sujetos;


B) cuando no existen efectos de práctica o fatiga; C) para aleatorizar los efectos de las condiciones
manipuladas.

-9-
Diseños de investigación y análisis de datos. Ejercicios Tema 8

SITUACIÓN 1. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final del curso (Y) y la obtenida en el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:

S.C. g.l. M.C. F Prob.


Regresión 28,097 1 28,097 V W
Residual 23,778 6 T
Total U

1- ¿Cuál fue el tamaño de la muestra elegida?: A) 6; B) 7; C) 8.


2- ¿Cuál es la varianza muestral insesgada de la calificación de los estudiantes (Y) al final del curso?:
A) 51,875; B) 7,411; C) 3,397.
3- ¿Qué proporción de la varianza de Y es explicada por la varianza de X?: A) 0,736; B) 0,542; C) No
hay datos suficientes para calcularlo.
4- Con un nivel de confianza del 95%, ¿cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que no hay relación lineal significativa entre X e Y?: A) 5,987; B) 5,59; C)
6,608.
5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
están correlacionados; B) las distribuciones condicionadas de los errores deben de tener una
distribución normal; C) No deben estar relacionadas la variables predictora y la variable
dependiente o criterio.

SITUACIÓN 2. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final de curso (Y) y la obtenida el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:

S.C. g.l. M.C. F


Regresión 42,734 1 42,734 17,345
Residual U V W
Total 64,909 10

1- ¿Aproximadamente, cuál es la varianza muestral insesgada de los errores del modelo de


regresión? A) 2,217; B) 4,273; C) 2,464.
2- ¿Con un nivel de confianza del 95%, cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que hay no relación lineal significativa entre Y y X?; A) 5,117; B) 5,59; C)
6,608.
3- ¿Aproximadamente cuál es el coeficiente de correlación de Pearson entre X e Y? A) 0,787; B) 0,97;
C) 0,811.
4- ¿Cuál es el error típico del modelo de regresión? A) 2,464; B) 1,57; C) 1,665.

-1-
Diseños de investigación y análisis de datos. Ejercicios Tema 8

5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
son independientes; B) las distribuciones condicionadas de los errores deben de tener una
distribución uniforme; C) no deben estar relacionadas las variables predictora y la variable
dependiente o criterio.

SITUACIÓN 3. Anscombe (1973) presentó cuatro conjuntos de datos artificiales que tenían la
misma recta de regresión pero eran claramente diferentes. En la Figura 1 se puede ver uno de
estos conjuntos de datos (11 pares de datos) junto con la recta de regresión que mejor ajusta por
el criterio de mínimos cuadrados.

Estadísticos de este conjunto de


datos:

𝑆𝑥 = 3,316

𝑆𝑦 = 2,030

𝑟𝑥𝑦 = 0,816

𝛼 = 0,05

1. El cumplimiento del supuesto de homocedasticidad en regresión no puede evaluarse en este


conjunto de datos debido a que: A) el proceso de selección de los datos no ha sido aleatorio; B)
para cada valor de X solo tenemos un valor de Y; C) no hay normalidad de las distribuciones
condicionadas de Y con respecto a Xi.
2. La recta de regresión no pasa exactamente por ningún punto porque: A) existe un valor atípico o
extremo; B) aunque la variabilidad es pequeña en este conjunto de datos, siempre existe una
cierta cantidad de ella que impide que el ajuste sea perfecto; C) el ajuste por mínimos cuadrados
está mal realizado.
3. Con los datos proporcionados, la pendiente de la recta de regresión vale aproximadamente: A)
0’499; B) 0; C) en la gráfica se ve claramente que la recta corta al eje Y en el punto 5, luego sin
hacer cálculos podemos afirmar que esta es la pendiente.
4. Si eliminamos el dato atípico que aparece en la gráfica (X10=13, Y10=12’74), el valor de rXY sería: A)
0.4992 = 0.249; B) igual al coeficiente de determinación; C) la unidad porque el ajuste sería
perfecto.
5. Si el valor de R2 es 0,666 esto significa que: A) también el error típico ( ) es de 0,666; B) la parte
de la variabilidad en Y atribuible a otros factores no relacionados linealmente con Y es de 0,666;
C) el porcentaje en que se reduce el error de Y cuando empleamos la recta de regresión para su
estimación es del 66,6%.

-2-
Diseños de investigación y análisis de datos. Ejercicios Tema 8

6. En el modelo de regresión (𝑌 = 𝐵0 + 𝐵𝑋 + 𝜀), ε representa: A) el efecto del factor manipulado; B)


la interacción entre el error y el factor manipulado; C) el efecto de todas aquellas variables que no
hemos manipulado ni controlado.
7. El análisis de la regresión para los datos de la Figura nos indicó que la regresión fue significativa
[F(1, 9) = 17,972, MCres = 1,528, p = 0,002]. Luego sabemos que el valor de t con 9 grados de
libertad fue aproximadamente: A) 4,24; B) 321,12; C) 0.
8. En un análisis de regresión múltiple tendremos tantas pendientes: A) como queramos; B) como
nos indiquen los grados de libertad de la fuente de variación “Residual” en la tabla del ANOVA; C)
como variables independientes hayamos introducido en el modelo.

SITUACIÓN 4. Los siguientes datos relacionan el número de cigarrillos diarios (X) consumidos con
el número de radicales libres (Y) localizados en los pulmones de 8 individuos:
2 2
Sujeto X Y XY X Y
1 0 94 0 0 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
Sumatorio 137 1735 39218 3545 452493
Des. Típica 12,24 97,60
rxy = 0,99

1- La ecuación de regresión en puntuaciones tipificadas que relaciona el número de cigarrillos con el


número de radicales libres viene dada por la expresión: A) 𝑍𝑦´ = −2,1 ∙ 𝑍𝑋 ; B) 𝑍𝑦´ = 1,5 ∙ 𝑍𝑋 ; C)
𝑍𝑦´ = 0,99 ∙ 𝑍𝑋
2- La ecuación de regresión en puntuaciones tipificadas que relaciona X e Y: A) tiene un único
parámetro; B) tiene como parámetro el mismo valor que la ecuación de regresión en
puntuaciones diferenciales; C) tiene dos parámetros: la pendiente y el punto de corte con la
ordenada.
3- La pendiente de la ecuación de regresión para predecir Y a partir de X en puntuaciones directas
vale: A) -3,32; B) 7,92; C) 0,99.
4- En regresión lineal por mínimos cuadrados se dice que la recta de regresión es una estimación
insesgada debido a que: A) se calculan los valores de pendiente y punto de corte con la ordenada
tales que hacen mínimo el error al cuadrado; B) cuantifica el incremento que se produce en la
estimación de la variable dependiente (Y’) cuando la independiente (X) aumenta en una unidad;
C) los valores esperados de los estimadores coinciden con los parámetros que estiman.
5- Sabiendo que el punto de corte con la ordenada (B0) vale 81,09, a un sujeto que fume 0 cigarrillos
le pronosticaremos un número de radicales libres en pulmones igual a: A) 7,93; B) 81,09; C) 0.
6- Conociendo la recta de regresión de mínimos cuadrados de Y sobre X podemos calcular Y’. La
correlación de estas puntuaciones predichas (Y’) con los errores (Y-Y’) vale: A) 0; B) lo mismo que
la pendiente; C) lo mismo que el coeficiente de alienación.

-3-
Diseños de investigación y análisis de datos. Ejercicios Tema 8

7- Si queremos poner a prueba la hipótesis 𝐻0 : 𝜌 = 0 mediante el estadístico de contraste F


obtendríamos un valor aproximado de: A) 594,00; B) 295,51; C) 1,00.
8- El error típico de la distribución muestral de la pendiente vale, aproximadamente: A) 0,12; B)
7,97; C) 0,46.
9- Si en la Situación 4 incluyéramos también la cantidad de grasas saturadas ingeridas a la semana
para predecir el número de radicales libres, el modelo de estimación lineal sería:
A)Radicales_Libres ′ = B1 Nº_cigarrillos + B2 Grasas_Saturadas + B0 ;
B)Radicales_Libres ′ = B1 Nº_cigarrillos + B2 Grasas_Saturadas;
C) Radicales_Libres ′ = Nº_cigarrillos + Grasas_Saturadas + B0 .

10- En un modelo de regresión múltiple, el cálculo de las correlaciones de orden cero: A) implica el
cálculo de la regresión entre las variables independientes y, posteriormente, la extracción de los
residuos; B) no nos permite saber qué parte de la varianza de la VD es capaz de explicar
independientemente cada una de las VI’s; C) nos permite hallar relaciones bivariadas puras.

Sujetos X Y
1 6 8
SITUACIÓN 5. Un psicólogo escolar considera que la 2 4 3
comprensión lectora es un elemento que juega un papel 3 7 8
fundamental en el éxito académico de los estudiantes. Para 4 3 4
comprobar su hipótesis, selecciona aleatoriamente un grupo 5 5 4
de 16 estudiantes de 4º de la ESO a los que aplica un test de 6 9 10
comprensión lectora (X). A continuación, y en coordinación 7 7 7
con el profesor de ciencias sociales, se les aplica una prueba 8 4 5
sobre un tema de historia (Y) que acaban de estudiar, 9 2 4
10 5 2
consistiendo dicha prueba en una serie de preguntas sobre un
11 8 7
texto básico que tienen que leer y que está relacionado con el
12 9 9
tema estudiado. 13 10 8
14 6 6
15 3 5
16 1 3

1- Con el fin de analizar la relación entre la comprensión lectora y el rendimiento en la prueba de


historia, ¿qué tipo de análisis es el más adecuado para una investigación de este tipo?: A) análisis
de varianza con dos factores completamente aletorizados; B) análisis de correlación/regresión; C)
análisis de la varianza de un factor.
2- ¿Cuál es el coeficiente de correlación de Pearson entre X e Y? A) 0,676; B) 0,324; C) 0,822.
3- La recta de regresión que mejor se ajusta a los datos es: Y´= 0,256 + 0,482X; B) Y´= 2,354 + 0,529X;
C) Y´= 1,681 + 0,743X
4- El valor de la suma de cuadrados de la regresión es: A) 27,991; B) 86,438; C) 58,447.
5- La proporción de variabilidad de Y explicada por la variabilidad en X, es: A) 0,676; B) 0,822; C)
0,324.
6- El valor del estadístico F para el contraste de la regresión es: A) 31,578; B) 29,233; C) 25,821.
7- La probabilidad asociada al estadístico F para el contraste de la regresión es 0,0001, de ello puede
deducirse que: A) para un nivel de significación de 0,01 NO existe relación entre X e Y; B) para un

-4-
Diseños de investigación y análisis de datos. Ejercicios Tema 8

nivel de significación de 0,01 existe relación entre X e Y; C) para un nivel de significación de 0,05
existe relación entre X e Y, pero no para un nivel de significación de 0,01.
8- El valor más aproximado del estadístico de contraste para la pendiente de regresión es: A) 5,407;
B) 1,996; C) 0,743.
9- Para un nivel de significación de 0,05, los límites del intervalo de confianza para la pendiente de la
regresión son: A) (-0,125; 3,487); B) (-0,125; 1,037); C) (0,448; 1,037).
10- Teniendo en cuenta los límites del intervalo de confianza obtenido para la pendiente de la
regresión, podemos decir que, a un nivel de significación de 0,05: A) se acepta la hipótesis
alternativa según la cual existe relación entre X e Y, ya que el intervalo de confianza no incluye el
valor cero; B) se acepta la hipótesis nula según la cual no existe relación entre X e Y, ya que el
intervalo de confianza incluye el valor cero; C) se acepta la hipótesis nula según la cual no existe
relación entre X e Y, ya que el intervalo de confianza no incluye el valor cero.

SITUACIÓN 6. El artículo “Efecto de la temperatura sobre el pH de la leche” (Journal of Dairy


Research, 1988, 277-280) informó de un estudio en el que se utilizaron 5 temperaturas diferentes
(medidas en grados centígrados) en condiciones experimentales controladas en una granja y se
midió el pH de la leche obtenida para cada temperatura. La ecuación de regresión calculada fue
𝑌 ′ = 0,65 + 0,22𝑋. El objetivo era predecir el pH de la leche (Y) a partir de la temperatura (X).
Utilice un 𝛼 = 0,05. Además se sabe que: 𝑆𝑦 = 1,87 y 𝑆𝑥 = 7,90.

1- La ecuación genérica de regresión de Y sobre X: 𝑌 = 𝑎 + 𝑏 𝑋 + 𝜖, es una relación: A)


probabilística ya que depende de la cantidad aleatoria 𝜖; B) funcional cúbica ya que existen tres
componentes aditivos en la ecuación; C) determinista ya que el valor de Y está completamente
determinado por el valor de X.

2- La distribución del error en la ecuación de regresión lineal simple 𝑌 = 𝑎 + 𝑏 𝑋 + 𝜖 tiene una


media igual a: A) 𝑌̅; B) 𝑋̅ ; C) 0.

3- En regresión lineal simple, se asume que la desviación típica del error en la ecuación 𝑌 = 𝑎 +
𝑏 𝑋 + 𝜖 : A) es igual a la unidad; B) es la misma para cada valor particular de X; C) es igual a 0.

4- El estadístico para poner a prueba la significación del coeficiente de correlación entre el pH y la


temperatura vale aproximadamente: A) 3,91; B) 4,36; C) 1,32.

5- El estadístico de la Tabla del Anova para poner a prueba si la Regresión como fuente de variación
es significativa vale aproximadamente: A) 19,0; B) 1,2; C) 2,1.

6- El contraste de hipótesis para determinar si la pendiente de la recta de regresión es significativa


es: A) bilateral; B) unilateral derecho; C) unilateral izquierdo.

7- El intervalo de confianza para contrastar la pendiente vale: A) (0’38, 0’06); B) (-0’15, +0’15); C) (-
0’32, -0’15).

8- El coeficiente de correlación semiparcial entre el pH y la temperatura: A) coincide con el


coeficiente de regresión estandarizado; B) no tiene sentido calcularlo ya que estamos en una
situación de regresión simple; C) coincide con el coeficiente de determinación.

-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

SITUACIÓN 1. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final del curso (Y) y la obtenida en el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:

S.C. g.l. M.C. F Prob.


Regresión 28,097 1 28,097 V W
Residual 23,778 6 T
Total U

En primer lugar deducimos los datos que faltan en la tabla de ANOVA.

23,778
𝑈 = 28,097 + 23,778 = 51,875 𝑇= = 3,963
6
28,097
𝑉= = 7,09
3,963

Completamos la tabla de ANOVA.

S.C. g.l. M.C. F


Regresión 28,097 1 28,097 7,09
Residual 23,778 6 3,963
Total 51,875 7 7,411

1- ¿Cuál fue el tamaño de la muestra elegida?: A) 6; B) 7; C) 8.

Sabiendo los grados de libertad de la suma de cuadrados total: 𝑛 − 1 = 7 → 𝑛 = 8

2- ¿Cuál es la varianza muestral insesgada de la calificación de los estudiantes (Y) al final del curso?:
A) 51,875; B) 7,411; C) 3,397.

La varianza muestral insesgada (cuasivarianza) es igual a:

∑(𝑌 − 𝑌̅)2
𝑆̂𝑦2 =
𝑛−1

Que podemos calcular con la tabla de ANOVA, dado que es igual a la media cuadrática total.

3- ¿Qué proporción de la varianza de Y es explicada por la varianza de X?: A) 0,736; B) 0,542; C) No


hay datos suficientes para calcularlo.

La proporción de varianza de Y explicada por la varianza de X es igual al coeficiente de


determinación (coeficiente de correlación de Pearson al cuadrado), que podemos deducir de la
tabla de ANOVA:

-1-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

2
𝑆𝐶𝑟𝑒𝑔 28,097
𝑟𝑥𝑦 = = = 0,542
𝑆𝐶𝑌 51,875

4- Con un nivel de confianza del 95%, ¿cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que no hay relación lineal significativa entre X e Y?: A) 5,987; B) 5,59; C)
6,608.

Consultando las tablas F para 1 y 6 grados de libertad comprobamos que la puntuación 5,987
supera una proporción igual a 5,987.

5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
están correlacionados; B) las distribuciones condicionadas de los errores deben de tener una
distribución normal; C) No deben estar relacionadas la variables predictora y la variable
dependiente o criterio.

SITUACIÓN 2. En un colegio se estudia la relación que puede existir entre la calificación global de
los estudiantes al final de curso (Y) y la obtenida el curso anterior (X). Efectuado un análisis de
regresión, con una muestra de estudiantes, la prueba para determinar la significación del modelo
de regresión ajustado es la siguiente:

S.C. g.l. M.C. F


Regresión 42,734 1 42,734 17,345
Residual U V W
Total 64,909 10

Deducimos fácilmente los datos que nos faltan en la tabla:


𝑈 22,175
𝑈 = 64,909 − 42,734 = 22,175; 𝑉 = 10 − 1 = 9; 𝑊 = 𝑉 = 9
= 2,4639

La tabla completa queda:

SC gl MC F
Regresión 42,734 1 42,734 17,345
Residual 22,175 9 2,4639
Total 64,909 10

1- ¿Aproximadamente, cuál es la varianza muestral insesgada de los errores del modelo de


regresión? A) 2,217; B) 4,273; C) 2,464.

La varianza muestral insesgada de los errores del modelo de regresión coincide con la media
cuadrática residual.

-2-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

2- ¿Con un nivel de confianza del 95%, cuál es el valor de la F teórica, por encima del cual se debería
rechazar la hipótesis de que hay no relación lineal significativa entre Y y X?; A) 5,117; B) 5,59; C)
6,608.

Buscando en las tablas F de Fisher para 1 y 9 grados de libertad, comprobamos que la respuesta
correcta es A.

3- ¿Aproximadamente cuál es el coeficiente de correlación de Pearson entre X e Y? A) 0,787; B) 0,97;


C) 0,811.

El cociente entre la suma de cuadrados de la regresión y la suma de cuadrados total es el


coeficiente de determinación, luego su raíz cuadrada será el coeficiente de correlación de Pearson.

42,734
𝑟𝑥𝑦 = √ = ±0,811
64,909

Suponemos que la relación entre la calificación obtenida a final del curso y la obtenida en el curso
anterior es directa, por lo que: 𝑟𝑥𝑦 = 0,811

4- ¿Cuál es el error típico del modelo de regresión? A) 2,464; B) 1,57; C) 1,665.

∑(𝑌 − 𝑌′)2 22,175


𝑆̂𝑒 = √ =√ = 1,57
𝑛−2 9

5- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y los errores
son independientes; B) las distribuciones condicionadas de los errores deben de tener una
distribución uniforme; C) no deben estar relacionadas las variables predictora y la variable
dependiente o criterio.

-3-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

SITUACIÓN 3. Anscombe (1973) presentó cuatro conjuntos de datos artificiales que tenían la
misma recta de regresión pero eran claramente diferentes. En la Figura 1 se puede ver uno de
estos conjuntos de datos (11 pares de datos) junto con la recta de regresión que mejor ajusta por
el criterio de mínimos cuadrados.

Estadísticos de este conjunto de


datos:

𝑆𝑥 = 3,316

𝑆𝑦 = 2,030

𝑟𝑥𝑦 = 0,816

𝛼 = 0,05

1. El cumplimiento del supuesto de homocedasticidad en regresión no puede evaluarse en este


conjunto de datos debido a que: A) el proceso de selección de los datos no ha sido aleatorio; B)
para cada valor de X solo tenemos un valor de Y; C) no hay normalidad de las distribuciones
condicionadas de Y con respecto a Xi.

La homocedasticidad se refiere a la igualdad de varianzas en Y para los diversos valores de la


variable predictora X. No podemos determinar esta igualdad de varianza si solo tenemos un valor
de Y para cada valor de X ya que no tenemos una distribución de valores de Y. Luego la opción
correcta es la B.
La opción A es incorrecta ya que la forma en que han sido seleccionados los datos es irrelevante
para la determinación de la homocedasticidad. La opción C es incorrecta porque no se refiere a la
homocedasticidad sino a la normalidad.

2. La recta de regresión no pasa exactamente por ningún punto porque: A) existe un valor atípico o
extremo; B) aunque la variabilidad es pequeña en este conjunto de datos, siempre existe una
cierta cantidad de ella que impide que el ajuste sea perfecto; C) el ajuste por mínimos cuadrados
está mal realizado.

Debemos observar que todos los puntos dados se sitúan exactamente de forma lineal entre sí. La
recta de regresión dibujada ha sido “alejada” debido a la influencia del valor “outlier” o extremo
en X = 13. Si no existiera este valor, la recta calculada habría pasado exactamente por el resto de
puntos. Luego la opción correcta es la A. La opción B es irrelevante en relación a la pregunta
planteada. La opción C es falsa ya que el ajuste por mínimos cuadrados se realizó correctamente
por Anscombe.

-4-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

3. Con los datos proporcionados, la pendiente de la recta de regresión vale aproximadamente: A)


0’499; B) 0; C) en la gráfica se ve claramente que la recta corta al eje Y en el punto 5, luego sin
hacer cálculos podemos afirmar que esta es la pendiente.

𝑆𝑦 2,030
𝐵 = 𝑟𝑥𝑦 = 0,816 ∙ = 0,499542
𝑆𝑥 3,316

4. Si eliminamos el dato atípico que aparece en la gráfica (X10=13, Y10=12,74), el valor de rXY sería: A)
0,4992 = 0,249; B) igual al coeficiente de determinación; C) la unidad porque el ajuste sería
perfecto.

En este caso, el ajuste sería perfecto ya que todos los puntos se sitúan sobre una línea recta. Si
este es el caso, el ajuste sería perfecto (no habría error).

5. Si el valor de R2 es 0,666 esto significa que: A) también el error típico (𝜎𝜀 ) es de 0,666; B) la parte
de la variabilidad en Y atribuible a otros factores no relacionados linealmente con Y es de 0,666;
C) el porcentaje en que se reduce el error de Y cuando empleamos la recta de regresión para su
estimación es del 66,6%.

La definición de R2 (o coeficiente de determinación) es “es la proporción de la variabilidad de la VD


que es imputada (o explicada por) la variabilidad de la VI” . Luego la opción correcta es la C.

6. En el modelo de regresión (𝑌 = 𝐵0 + 𝐵𝑋 + 𝜀), ε representa: A) el efecto del factor manipulado; B)


la interacción entre el error y el factor manipulado; C) el efecto de todas aquellas variables que
no hemos manipulado ni controlado.

El componente  del modelo representa el error que todavía queda cuando aplicamos la
pendiente y el punto de corte con la ordenada. Por consiguiente, representa la aportación de las
variables extrañas al experimento. Opción correcta C.

7. El análisis de la regresión para los datos de la Figura nos indicó que la regresión fue significativa
[F(1, 9) = 17,972, MCres = 1,528, p = 0,002]. Luego sabemos que el valor de t con 9 grados de
libertad fue aproximadamente: A) 4,24; B) 321,12; C) 0.

Una F y una t se relacionan según la fórmula: 𝑇𝑛2 = 𝐹1,𝑛 . Luego como sabemos que F1,9 = 17,972, el
valor de t será: √17,972 = 4,239

8. En un análisis de regresión múltiple tendremos tantas pendientes: A) como queramos; B) como


nos indiquen los grados de libertad de la fuente de variación “Residual” en la tabla del ANOVA; C)
como variables independientes hayamos introducido en el modelo.

-5-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

SITUACIÓN 4. Los siguientes datos relacionan el número de cigarrillos diarios (X) consumidos con
el número de radicales libres (Y) localizados en los pulmones de 8 individuos:
2 2
Sujeto X Y XY X Y
1 0 94 0 0 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
Sumatorio 137 1735 39218 3545 452493
Des. Típica 12,24 97,60
rxy = 0,99

1- La ecuación de regresión en puntuaciones tipificadas que relaciona el número de cigarrillos con el


número de radicales libres viene dada por la expresión: A) 𝑍𝑦´ = −2,1 ∙ 𝑍𝑋 ; B) 𝑍𝑦´ = 1,5 ∙ 𝑍𝑋 ; C)
𝑍𝑦´ = 0,99 ∙ 𝑍𝑋

La respuesta correcta es C. El propio enunciado nos proporciona el valor del coeficiente de


correlación de Pearson.
2- La ecuación de regresión en puntuaciones tipificadas que relaciona X e Y: A) tiene un único
parámetro; B) tiene como parámetro el mismo valor que la ecuación de regresión en
puntuaciones diferenciales; C) tiene dos parámetros: la pendiente y el punto de corte con la
ordenada.
3- La pendiente de la ecuación de regresión para predecir Y a partir de X en puntuaciones directas
vale: A) -3,32; B) 7,92; C) 0,99.
𝑆𝑦 97,60
𝐵 = 𝑟𝑥𝑦 = 0,99 = 7,929
𝑆𝑥 12,24
4- En regresión lineal por mínimos cuadrados se dice que la recta de regresión es una estimación
insesgada debido a que: A) se calculan los valores de pendiente y punto de corte con la ordenada
tales que hacen mínimo el error al cuadrado; B) cuantifica el incremento que se produce en la
estimación de la variable dependiente (Y’) cuando la independiente (X) aumenta en una unidad;
C) los valores esperados de los estimadores coinciden con los parámetros que estiman.
5- Sabiendo que el punto de corte con la ordenada (B0) vale 81,09, a un sujeto que fume 0 cigarrillos
le pronosticaremos un número de radicales libres en pulmones igual a: A) 7,93; B) 81,09; C) 0.
6- Conociendo la recta de regresión de mínimos cuadrados de Y sobre X podemos calcular Y’. La
correlación de estas puntuaciones predichas (Y’) con los errores (Y-Y’) vale: A) 0; B) lo mismo que
la pendiente; C) lo mismo que el coeficiente de alienación.
7- Si queremos poner a prueba la hipótesis 𝐻0 : 𝜌 = 0 mediante el estadístico de contraste F
obtendríamos un valor aproximado de: A) 594,00; B) 295,51; C) 1,00.
𝑅2 0,992
𝐹= = = 295,51
(1 − 𝑅 2 )/(𝑁 − 2) (1 − 0,992 )/(8 − 2)

-6-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

8- El error típico de la distribución muestral de la pendiente vale, aproximadamente: A) 0,12; B)


7,97; C) 0,46.

2
𝑆𝑦 1 − 𝑟𝑥𝑦 97,60 1 − 0,992
𝜎𝐵 = √ = √ = 0,46
𝑆𝑥 𝑛 − 2 12,24 6

9- Si en la Situación 4 incluyéramos también la cantidad de grasas saturadas ingeridas a la semana


para predecir el número de radicales libres, el modelo de estimación lineal sería:
A)𝐑𝐚𝐝𝐢𝐜𝐚𝐥𝐞𝐬_𝐋𝐢𝐛𝐫𝐞𝐬 ′ = 𝐁𝟏 𝐍º_𝐜𝐢𝐠𝐚𝐫𝐫𝐢𝐥𝐥𝐨𝐬 + 𝐁𝟐 𝐆𝐫𝐚𝐬𝐚𝐬_𝐒𝐚𝐭𝐮𝐫𝐚𝐝𝐚𝐬 + 𝐁𝟎 ;
B)Radicales_Libres ′ = B1 Nº_cigarrillos + B2 Grasas_Saturadas;
C) Radicales_Libres ′ = Nº_cigarrillos + Grasas_Saturadas + B0 .

10- En un modelo de regresión múltiple, el cálculo de las correlaciones de orden cero: A) implica el
cálculo de la regresión entre las variables independientes y, posteriormente, la extracción de los
residuos; B) no nos permite saber qué parte de la varianza de la VD es capaz de explicar
independientemente cada una de las VI’s; C) nos permite hallar relaciones bivariadas puras.

Sujetos X Y
1 6 8
SITUACIÓN 5. Un psicólogo escolar considera que la 2 4 3
comprensión lectora es un elemento que juega un papel 3 7 8
fundamental en el éxito académico de los estudiantes. Para 4 3 4
comprobar su hipótesis, selecciona aleatoriamente un grupo 5 5 4
de 16 estudiantes de 4º de la ESO a los que aplica un test de 6 9 10
comprensión lectora (X). A continuación, y en coordinación 7 7 7
con el profesor de ciencias sociales, se les aplica una prueba 8 4 5
sobre un tema de historia (Y) que acaban de estudiar, 9 2 4
10 5 2
consistiendo dicha prueba en una serie de preguntas sobre un
11 8 7
texto básico que tienen que leer y que está relacionado con el 12 9 9
tema estudiado. 13 10 8
14 6 6
15 3 5
16 1 3

En primer lugar, vamos a calcular varianzas de X e Y, coeficiente de correlación de Pearson y los


coeficientes de la recta de regresión.

-7-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

Sujetos X Y X2 Y2 XY
1 6 8 36 64 48
∑ 𝑋2 ∑ 𝑌2
2 4 3 16 9 12 𝑆𝑥2 = 𝑛
− 𝑋̅ 2 = 6,621; 𝑆𝑦2 = 𝑛
− 𝑌̅ 2 = 5,402
3 7 8 49 64 56
4 3 4 9 16 12 𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌
5 5 4 25 16 20 𝑟𝑥𝑦 = = 0,822
6 9 10 81 100 90 √[𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 ][𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ]
7 7 7 49 49 49
8 4 5 16 25 20
9 2 4 4 16 8 𝒓𝟐𝒙𝒚 = 𝟎, 𝟖𝟐𝟐𝟐 = 𝟎, 𝟔𝟕𝟔
10 5 2 25 4 10
11 8 7 64 49 56 𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 𝑆𝑦
𝐵= 2 2
= 𝑟𝑥𝑦 = 0,743
12 9 9 81 81 81 𝑛 ∑ 𝑋 − (∑ 𝑋) 𝑆𝑥
13 10 8 100 64 80
14 6 6 36 36 36
15 3 5 9 25 15
𝐵0 = 𝑌̅ − 𝐵𝑋̅ = 1,681
16 1 3 1 9 3
Sumas 89 93 601 627 596

1- Con el fin de analizar la relación entre la comprensión lectora y el rendimiento en la prueba de


historia, ¿qué tipo de análisis es el más adecuado para una investigación de este tipo?: A) análisis
de varianza con dos factores completamente aletorizados; B) análisis de correlación/regresión; C)
análisis de la varianza de un factor.
2- ¿Cuál es el coeficiente de correlación de Pearson entre X e Y? A) 0,676; B) 0,324; C) 0,822.
3- La recta de regresión que mejor se ajusta a los datos es: Y´= 0,256 + 0,482X; B) Y´= 2,354 + 0,529X;
C) Y´= 1,681 + 0,743X
4- El valor de la suma de cuadrados de la regresión es: A) 27,991; B) 86,438; C) 58,447.
La suma de cuadrados total es: 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = ∑(𝑌 − 𝑌̅)2
Conociendo 𝑆𝑦2 podemos calcularla: 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 𝑛 ∙ 𝑆𝑦2 = 16 ∙ 5,402 = 86,4375

También podemos calcular 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 con la fórmula utilizada en los temas de ANOVA:
(∑ 𝑌𝑖 )2 932
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑌𝑖2 − = [𝑌] − [𝑇] = 627 − = 86,4375
𝑛 16
2
Dado que el coeficiente de determinación es igual a: 𝑟𝑥𝑦 = 0,676, la suma de cuadrados debida a
2
la regresión es: 𝑆𝐶𝑅𝑒𝑔 = 𝑟𝑥𝑦 ∙ 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 0,676 ∙ 86,4375 = 58,447

Completamos la tabla de ANOVA para la regresión lineal:

FV SC gl MC F
Regres. 58,447 1 58,447 29,233
Residual 27,991 14 1,999
Total 86,438 15

-8-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

5- La proporción de variabilidad de Y explicada por la variabilidad en X, es: A) 0,676; B) 0,822; C)


0,324.
6- El valor del estadístico F para el contraste de la regresión es: A) 31,578; B) 29,233; C) 25,821.
7- La probabilidad asociada al estadístico F para el contraste de la regresión es 0,0001, de ello puede
deducirse que: A) para un nivel de significación de 0,01 NO existe relación entre X e Y; B) para un
nivel de significación de 0,01 existe relación entre X e Y; C) para un nivel de significación de 0,05
existe relación entre X e Y, pero no para un nivel de significación de 0,01.
8- El valor más aproximado del estadístico de contraste para la pendiente de regresión es: A) 5,407;
B) 1,996; C) 0,743.

𝐹 = 𝑇 2 → 𝑇 = √𝐹 = √29,233 = 5,407
9- Para un nivel de significación de 0,05, los límites del intervalo de confianza para la pendiente de la
regresión son: A) (-0,125; 3,487); B) (-0,125; 1,037); C) (0,448; 1,037)

2
𝑆𝑦 1 − 𝑟𝑥𝑦 2,324 1 − 0,676
𝐸𝑚𝑎𝑥 = 𝑡𝑛−2;1−𝛼⁄2 𝜎𝐵 = 𝑡𝑛−2;1−𝛼⁄2 √ = 2,145 √ = 0,2947
𝑆𝑥 𝑛 − 2 2,573 16 − 2

1,037
0,743 ± 0,2947 → {
0,448

10- Teniendo en cuenta los límites del intervalo de confianza obtenido para la pendiente de la
regresión, podemos decir que, a un nivel de significación de 0,05: A) se acepta la hipótesis
alternativa según la cual existe relación entre X e Y, ya que el intervalo de confianza no incluye
el valor cero; B) se acepta la hipótesis nula según la cual no existe relación entre X e Y, ya que el
intervalo de confianza incluye el valor cero; C) se acepta la hipótesis nula según la cual no existe
relación entre X e Y, ya que el intervalo de confianza no incluye el valor cero.

SITUACIÓN 6. El artículo “Efecto de la temperatura sobre el pH de la leche” (Journal of Dairy


Research, 1988, 277-280) informó de un estudio en el que se utilizaron 5 temperaturas diferentes
(medidas en grados centígrados) en condiciones experimentales controladas en una granja y se
midió el pH de la leche obtenida para cada temperatura. La ecuación de regresión calculada fue
𝑌 ′ = 0,65 + 0,22𝑋. El objetivo era predecir el pH de la leche (Y) a partir de la temperatura (X).
Utilice un 𝛼 = 0,05. Además se sabe que: 𝑆𝑌 = 1,87 y 𝑆𝑋 = 7,90.

1- La ecuación genérica de regresión de Y sobre X, 𝑌 = 𝑎 + 𝑏 𝑋 + 𝜖 , es una relación: A)


probabilística ya que depende de la cantidad aleatoria 𝝐; B) funcional cúbica ya que existen tres
componentes aditivos en la ecuación; C) determinista ya que el valor de Y está completamente
determinado por el valor de X.

2- La distribución del error en la ecuación de regresión lineal simple 𝑌 = 𝑎 + 𝑏 𝑋 + 𝜖 tiene una


media igual a: A) 𝑌̅; B) 𝑋̅ ; C) 0.

-9-
Diseños de investigación y análisis de datos. Soluciones ejercicios Tema 8

3- En regresión lineal simple, se asume que la desviación típica del error en la ecuación 𝑌 = 𝑎 +
𝑏 𝑋 + 𝜖 : A) es igual a la unidad; B) es la misma para cada valor particular de X; C) es igual a 0.

4- El estadístico para poner a prueba la significación del coeficiente de correlación entre el pH y la


temperatura vale aproximadamente: A) 3,91; B) 4,36; C) 1,32.

𝑆𝑦 1,87
𝐵 = 𝑟𝑥𝑦 → 0,22 = 𝑟𝑥𝑦 → 𝑟𝑥𝑦 = 0,929
𝑆𝑥 7,90

𝑟𝑥𝑦 √𝑛 − 2 0,929√5 − 2
𝑡𝑛−2 = = = 4,36
√1 − 2
𝑟𝑥𝑦 √1 − 0,9292

5- El estadístico de la Tabla del Anova para poner a prueba si la Regresión como fuente de variación
es significativa vale aproximadamente: A) 19,0; B) 1,2; C) 2,1.

𝑡 2 = 𝐹 → 𝐹 = 4,362 = 19,01

6- El contraste de hipótesis para determinar si la pendiente de la recta de regresión es significativa


es: A) bilateral; B) unilateral derecho; C) unilateral izquierdo.

7- El intervalo de confianza para contrastar la pendiente vale: A) (0’38, 0’06); B) (-0’15, +0’15); C) (-
0’32, -0’15).

2
𝑆𝑦 1 − 𝑟𝑥𝑦 1,87 1 − 0,9292 0,38
𝐵 ± 𝑡1−𝛼⁄ ( √ ) → 0,22 ± 3,182 ∙ √ →{
2,𝑛−2 𝑆𝑥 𝑛 − 2 7,90 5−2 0,06

8- El coeficiente de correlación semiparcial entre el pH y la temperatura: A) coincide con el


coeficiente de regresión estandarizado; B) no tiene sentido calcularlo ya que estamos en una
situación de regresión simple; C) coincide con el coeficiente de determinación.

-10-
RECOPILACIÓN EXÁMENES de 2011 a 2020 con respuestas marcadas
"DISEÑOS DE INVESTIGACIÓN y ANÁLISIS DE DATOS "- 2º CURSO
Yogui del Pirineo

Código asignatura Nombre asignatura


62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
27/05/2015
Curso Virtual
Febrero 2011 (1ª Semana – Tipo A)
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A

SITUACIÓN 1. Para contrastar la hipótesis de si la edad media de inicio en el consumo de


alcohol de los jóvenes de una determinada comunidad es más tardía que la media de la
población general establecida en 13 años, un investigador utiliza una muestra de 25 jóvenes
encontrando que la edad media en su comunidad es de 14 años con una desviación típica
insesgada de 2,8. Asumimos que la variable edad de inicio en el consumo de alcohol se
distribuye normalmente en la población.

Las hipótesis que planteamos son:

Los datos de la muestra:

1- Para contrastar la hipótesis del investigador aplicaríamos un contraste: A)


paramétrico; B) no paramétrico; C) bilateral.

Trabajamos con una variable con un nivel de medida de razón y suponemos que la
distribución en la población es normal, por lo que el contraste es paramétrico, por otro
lado el contraste es unilateral derecho, luego las opciones B) y C) no son correctas.

2- Si a medida que aumenta el tamaño de la muestra tanto la varianza de la distribución


de probabilidad de un estimador como su sesgo tiende a cero, decimos que el
estimador es: A) suficiente; B) consistente; C) sesgado.

La respuesta correcta es B). Página 34 del libro de texto.

3- A la probabilidad de rechazar H0 cuando es falsa se la denomina: A) error tipo I; B) nivel


de confianza; C) potencia del contraste.

La respuesta correcta es C. Página 61 del libro de texto.

4- A partir de la información de la muestra utilizada el intervalo de confianza más


aproximado para la varianza poblacional con un nivel de confianza del 95% es: A) 5,70–
14,41; B) 4,77– 15,17; C) 5,23– 15,13.

1
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A

5- El estadístico de contraste para poner a prueba la media es: A) 2,102; B) 1,78; C) 1,59.

6- Conforme a los objetivos del investigador y un “alfa”= 0’05, la máxima diferencia que
puede producirse por simple azar, si H0 es cierta, entre la media observada en la
muestra y la media planteada en la hipótesis nula, expresado en unidades de
desviación típica es: A) 2,064; B) 1,711; C) 2,79.

El enunciado se refiere al valor crítico. Buscando en la tabla “t” de Student para 24 g.l.
y NC = 95%, observamos que la respuesta correcta es B.

7- La interpretación de los resultados obtenidos es que la edad media de inicio en el


consumo de alcohol de los jóvenes de la comunidad: A) es más tardía que la media
general con un nivel de confianza del 95%; B) es más tardía que la media general con
un nivel de confianza del 99%; C) no es más tardía que la media general con un nivel de
confianza del 95%.

La respuesta A) es correcta . La respuesta B) no es correcta, porque el


resultado obtenido en la muestra no es significativo al nivel de confianza del 99%
.

SITUACIÓN 2. Se pretende comprobar si los profesionales que llevan menos de cinco años en
una empresa (Grupo 1) poseen mayores aspiraciones que las personas que llevan cinco o más
años (Grupo 2). Para ello se entrevista a 32 personas que llevan menos de cinco años y a otras
32 personas que llevan cinco o más años, todas ellas elegidas al azar. Los resultados mostraron
que dentro del primer grupo se identificó a 18 personas con altas aspiraciones, mientras que
en el segundo grupo se identificaron a 14 personas con altas aspiraciones. Nivel de confianza
95%.

2
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A

Las hipótesis que planteamos son:

Las proporciones para cada muestra y la proporción ponderada son:

8- La hipótesis alternativa es: A) H1 : π 1 − π 2 ≠ 0 ; B) H1 : π 1 − π 2 < 0 ; C)


H1 : π 1 − π 2 > 0

La respuesta correcta es C)

9- El valor del estadístico de contraste es: A) 0,5; B) 1; C) 2.

10- El valor crítico es igual a: A) 1,64; B) 1,96; C) 2,33.

Buscando en la tabla de curva normal la puntuación típica que supera el 95% de las
observaciones, comprobamos que la respuesta correcta es A).

11- El nivel p-crítico es igual a: A) 0,1587; B) 0’3174; C) 0’8413.

En las tablas observamos que la probabilidad de encontrar valores inferiores al


estadístico de contraste ( ) es igual a 0’8413, por lo que la probabilidad de
encontrar valores más extremos que el estadístico de contraste es igual a:
.

12- La decisión correcta es: A) Rechazar la hipótesis nula porque el nivel p-crítico es menor
que el nivel de significación; B) Mantener la hipótesis nula porque el estadístico de
contraste es menor que el valor crítico; C) ninguna de las anteriores es correcta.

3
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A

13- A un nivel de confianza del 95% concluimos que: A) los profesionales que llevan menos
de cinco años trabajando poseen mayores aspiraciones que el grupo que lleva
trabajando 5 o más años; B) los profesionales que llevan 5 o más años trabajando
poseen mayores aspiraciones que el grupo que lleva menos de 5 años; C) no existen
diferencias en cuanto a las aspiraciones profesionales entre los dos grupos.

En la muestra observamos que la proporción de sujetos con altas aspiraciones es


superior entre aquellos que llevan menos de cinco años trabajando, pero las diferencias
no han resultado significativas, luego, con un nivel de confianza del 95%, la respuesta
correcta es C).

14- En un caso práctico en el que utilizamos un contraste de hipótesis para dos medias en
muestras independientes, lo más habitual es que las varianzas poblacionales sean: A)
conocidas; B) desconocidas; C) ninguna de las anteriores es correcta.

La respuesta correcta es B). Página 144 del libro de texto.

15- Para aplicar el test de Wilcoxon, además de que la variable dependiente esté medida a
nivel ordinal, también se requiere: A) no son necesarios más supuestos; B) la
distribución de las diferencias de los rangos ha de ser simétrica; C) la distribución de
las diferencias ha de ser normal.

La respuesta correcta es B). Página 181 del libro de texto.

SITUACIÓN 3: Con el objetivo de mejorar la función hepática, un investigador medico está


interesado en la tasa máxima de síntesis de urea en pacientes con cirrosis que experimentaron
una operación estándar (bypass no selectivo), un bypass selectivo para pacientes con una
síntesis de urea menor de 40 (grupo selectivo I) y un bypass selectivo para pacientes con una
síntesis de urea superior a 40 (grupo selectivo II). Cada uno de los tres grupos (bypass no
selectivo, bypass selectivo Grupo I y bypass selectivo grupo II) estuvo compuesto por 6
pacientes. Sabemos que:

SS A =SC Factor = 160.44 y que SS S / A = SCSujetos / Factor = SC Error = 710.66 .

Tenemos más de dos muestras, por lo que aplicamos un Análisis de la Varianza de un


factor. Ordenando los datos y completando los cálculos:

4
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A

FV SC g.l. MC F F tabla
Entre niveles 160,44 I-1 = 3-1 = 2 80,22
Dentro de niveles 710,66 N-I = 18-3 = 15 47,377 1,693 3,682
Total N-1 = 17

16- La hipótesis nula es:

A) H 0 : µ bypass _ selectivo = µ bypass _ no _ selectivo ( I ) ≠ µ bypass _ no _ selectivo ( II )


B) H 0 : µbypass _ no _ selectivo = µbypass _ selectivo ( I ) = µbypass _ selectivo ( II )
C) H 0 : µ bypass _ selectivo ≠ µ bypass _ no _ selectivo ( I ) = µ bypass _ no _ selectivo ( II )

La respuesta correcta es B). Por otro lado, es la única posible, pues es la única, entre las
tres opciones que postula la igualdad de las tres medias.

17- ¿Qué supuestos debo verificar que se cumplen en este caso para aplicar el ANOVA? A)
las observaciones se distribuyen según la distribución F en los tres grupos; B) las
varianzas de los tres grupos deben ser similares; C) la distribución de las puntuaciones
es asimétrica en los tres grupos.

La respuesta correcta es B). Página 229 del libro de texto,

18- Los grados de libertad del estadístico F de contraste para evaluar el efecto del “tipo de
operación médica” valen: A) (15, 3); B) (2, 15); C) (2, 18).

La respuesta correcta es B). Por ejemplo, página 213 del libro de texto.

19- El estadístico de contraste F para evaluar el efecto del “tipo de operación médica” vale
aproximadamente: A) 1.693; B) 3.295; C) 0.392.

La respuesta correcta es A).

20- Si trabajamos a un nivel de confianza del 95%, el valor crítico para contrastar la F del
“tipo de operación médica” valdrá: A) 1.693; B) 3.682; C) 2.695.

Buscando en la tabla F de Fisher con 2 y 15 grados de libertad, comprobamos que la


respuesta correcta es B).

SITUACIÓN 4. En un colegio se estudia la relación que puede existir entre la calificación global
de de los estudiantes al final del curso (Y) y la obtenida en el curso anterior (X). Efectuado un
análisis de regresión, con una muestra de estudiantes, la prueba para determinar la
significación del modelo de regresión ajustado es la siguiente:

5
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A

SC GL MC F Prob.

Regresión 28,097 1 28,097 V W

Residual 23,778 6 T

Total U

Fácilmente deducimos los datos que nos faltan en la tabla anterior:

La tabla con todos los cálculos queda:

FV SC g.l. MC F
Regresión 28,097 1 28,097
Residual 23,778 6 3,963 7,0898
Total 51,875 7 7,4107

21- ¿Cuál fue el tamaño de la muestra elegida?: A) 6; B) 7; C) 8.

Dado que los grados de libertad totales son , el tamaño de la muestra es:

22- ¿Cuál es la varianza muestral insesgada de la calificación de los estudiantes (Y) al final
del curso?: A) 51,875; B) 7,411; C) 3,397.

La varianza muestral insesgada coincide con la media cuadrática total. La respuesta


correcta es B).

23- ¿Qué proporción de la varianza de Y es explicada por la varianza de X?: A) 0,736; B)


0,542; C) No hay datos suficientes para calcularlo.

De la tabla deducimos fácilmente el coeficiente de determinación:

6
Diseños de Investigación y Análisis de Datos. Febrero 2011. Primera Semana, modelo A

24- Con un nivel de confianza del 95%, ¿cuál es el valor de la F teórica, por encima del cual
se debería rechazar la hipótesis de que no hay relación lineal significativa entre X e Y?:
A) 5,987; B) 5,59; C) 6,608.

Buscando en las tablas de F de Fisher con 1 y 6 grados de libertad, comprobamos que la


respuesta correcta es A).

25- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y
los errores están correlacionados; B) las distribuciones condicionadas de los errores
deben de tener una distribución normal; C) No deben estar relacionadas la variables
predictora y la variable dependiente o criterio.

La respuesta correcta es B). Página 343 del libro de texto.

7
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
24/06/2013
Foro Asignatura
Febrero 2011 (2ª Semana – Tipo D)
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D

A continuación se presentan 4 situaciones. Cada situación viene seguida por una


serie de preguntas referidas a la misma así como de preguntas teóricas generales.

SITUACIÓN 1: La empresa SND's de sondeos electorales ha pronosticado que el nivel de apoyo


que recibirá el partido X en las próximas elecciones será del 40%. Desde el propio partido X se
promueve un nuevo sondeo con el fin de contrastar la veracidad de esta afirmación. Se elige al
azar una muestra aleatoria de 400 personas, con derecho a voto, de los cuales 128 manifiestan
su intención de votar al partido X.

1- Con un nivel de confianza del 95%, el intervalo de confianza aproximado de la proporción


de personas que votarán al partido X, es: A) 0,2743-0,3657; B) 0,352-0,424; C) 0,318-0,322.

La proporción en la muestra es:

Al nivel de confianza del 95%, las puntuaciones típicas son:


2- La hipótesis alternativa es; A) ; B) ; C) .

El contraste es bilateral porque el enunciado no especifica si el partido X espera unos


resultados inferiores o superiores a los obtenidos por la empresas SND’s. Simplemente, el
partido X pretende contrastar la veracidad de los datos pronosticados por SND’s.

3- El estadístico de contraste es: A) -3,43; B) -3,266; C) -6,67.

√ √

4- Con un nivel de confianza del 99%, si los dirigentes del partido X considerasen que Ia
proporción de apoyos no alcanza el valor pronosticado por la empresa SND's, el valor crítico
para rechazar la hipótesis nula, es: A) -2,58; B) 1,64; C) -2,33.

Buscando en la tabla de curva normal, en un contraste bilateral y al nivel de confianza del


99%, los valores críticos son . Como el estadístico de contraste es negativo, el valor
crítico para rechazar la hipótesis nula es -2,58.

-1-
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D

5- Para un contraste bilateral con un nivel de significación de 0,01, la conclusión es: A)


Rechazar la hipótesis nula con un nivel de significación del 0,01; B) No hay evidencias para
rechazar la hipótesis nula con un nivel de significación 0,05; C) No hay evidencias para
rechazar la hipótesis nula con un nivel de significación 0,01.

Rechazamos la hipótesis nula al nivel de confianza del 99% porque el estadístico de


contraste es menor que el valor crítico , luego la opción A es correcta,
siendo las opciones B y C claramente incorrectas.

6- A medida que aumenta el tamaño de la muestra, la distribución muestral de la proporción


se aproxima a una distribución: A) Normal; B) Binomial; C) con grados de libertad.

Pregunta teórica. Página 30 del libro de texto.

7- La siguiente afirmación: "La precisión del intervalo de confianza aumenta al aumentar el


tamaño de la muestra" es: A) falsa; B) verdadera para la media y la proporción y falsa para
la varianza; C) siempre verdadera.

A medida que aumenta el tamaño de la muestra, menor es el error típico, y cuanto menor es
el error típico, mayor la precisión del intervalo de confianza. Página 45 del libro de texto.

8- Entre dos estimadores de un mismo parámetro poblacional, es más eficiente aquel: A) cuya
distribución tenga menos variabilidad; B) que se concentra en un rango cada vez más
estrecho alrededor de su media a medida que aumenta el tamaño de la muestra; C) que
utiliza toda la Información muestral relacionada con el parámetro.

Pregunta teórica. Página 33 del libro de texto.

SITUACIÓN 2. En un estudio cuyo objeto es evaluar el efecto de la música clásica sobre la


capacidad de concentración disponemos de 62 sujetos con los que formamos de manera
aleatoria dos grupos de 31 sujetos cada uno. Al primero de ellos (Grupo 1) se le sometió a
una prueba de concentración escuchando música clásica y al segundo (Grupo 2) se le
sometió a la misma prueba en condiciones normales de silencio. La puntuación media para
el Grupo 1 fue de 86 puntos con una cuasivarianza igual a 150. El Grupo 2 obtuvo una
media aritmética igual a 80 puntos y una cuasivarianza igual a 129. Sabiendo que la variable
dependiente está medida en una escala de intervalo, asumiendo varianzas poblacionales
iguales y con un nivel de confianza del 95% ¿podemos afirmar que la media en
concentración es superior para el grupo que escuchó música clásica?

9- El tamaño del efecto: A) depende del tamaño muestral; B) es independiente del tamaño
muestral; C) si es grande, necesariamente obtenemos resultados significativos.

Página 156 del libro de texto.

-2-
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D

10- Si trabajamos con dos grupos siendo los tamaños de las muestras: n1 = 30 y n2 =35,
sabemos que: A) se trata de un contraste paramétrico; B) las muestras están relacionadas;
C) las muestras son independientes.

La opción A es incorrecta porque el uso de un contraste paramétrico o no paramétrico no


depende exclusivamente del tamaño de la muestra. Si las muestras son relacionadas, cada
puntuación en una muestra tiene su pareja en la otra, por lo que en este caso n1 = n2 y por lo
tanto la opción B tampoco es correcta.

11- La hipótesis nula es: A) ; B) ; C) .

Queremos comprobar si la media es superior para el Grupo 1 (música clásica) que para el
Grupo 2 (silencio), luego la hipótesis alternativa es . La hipótesis nula, por lo
tanto, es la especificada en la opción A.

12- El valor del estadístico de contraste es, aproximadamente: A) 1,671; B) 2; C) 0,508.

̅ ̅

̂ ̂ √ ( )
√ ( )

13- El tamaño del efecto es Igual a: A) 1,671; B) 2; C) 0,508.

̅ ̅

̂ ̂ √

14- El valor crítico es igual a: A) 1,671; B) 2; C) 0,508.

El contraste es unilateral derecho. Buscando en las tablas T de Student para 60 grados de


libertad la puntuación que supera una proporción igual a 0,95,
comprobamos que la respuesta correcta es A.

15- El nivel p-crítico es igual a: A) entre 0,05 y 0,10; B) entre 0,05 y 0,95; C) 0,025.

Observamos en la tabla T de Student con 60 grados de libertad, que la puntuación T = 2


(estadístico de contraste) deja por debajo de sí una proporción igual a 0,975, luego el nivel
p-crítico es igual a:

16- Rechazamos la hipótesis nula porque: A) el nivel de significación es menor que el nivel
p-crítico; B) el estadístico de contraste es mayor que el valor crítico; C) no rechazamos la
hipótesis nula.

Claramente la opción correcta es B. La opción A es falsa porque si el nivel de significación es


menor que el nivel crítico mantenemos la hipótesis nula.

-3-
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D

SITUACIÓN 3. Un agrónomo desea conocer el efecto que sobre el rendimiento de una variedad
de trigo tiene la adición de 3 tipos diferentes de fosfatos al terreno. Para ello parcela un
terreno en 12 áreas del mismo tamaño y trata cada cuatro parcelas con un tipo distinto de
fosfato (A, B o C). A continuación siembra trigo en cada uno de ellos y, después de la
recolección, mide la cantidad de trigo producida por cada superficie (en hectólitros por
hectárea o hl/ha). La Tabla 1 muestra el rendimiento obtenido en función del tipo de
fosfato añadido.

Fosfato A 48 49 50 49
Fosfato B 47 49 48 48
Fosfato C 49 51 50 50

Sabemos que:

Ordenando los datos que tenemos en una tabla:

SC gl MC F
Entre niveles 8 I-1=2 8/2=4
Dentro niveles 6 N-I=9 6/9=0,67
Total 8+6=14 N-1=11

17- La hipótesis nula es A) ; B)


; C)

La hipótesis nula ha de postular la igualdad de las medias en todos los niveles, luego la
opción correcta es B.

18- Los grados de libertad del estadístico F de contraste valen: A) (3,9); B) (2,11); C) (2,9).

Como comprobamos en la tabla de ANOVA, la opción correcta es C.

19- El estadístico de contraste para evaluar la significatividad del “Tipo de Fosfato” vale
aproximadamente: A) 6; B) 3.295; C) 0.392.

Como comprobamos en la tabla de ANOVA, la opción correcta es A.

20- Se trata de un diseño: A) de una muestra con 12 observaciones; B) de un factor con


tres niveles (tipo de fosfato); C) de un factor (parcela de terreno) con cuatro niveles.

Claramente la opción correcta es B.

-4-
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D

SITUACIÓN 4. En un colegio se estudia la relación que puede existir entre la calificación global
de los estudiantes al final de curso (Y) y la obtenida el curso anterior (X). Efectuado un
análisis de regresión, con una muestra de estudiantes, la prueba para determinar la
significación del modelo de regresión ajustado es la siguiente:

SC gl MC F Prob.
Regresión 42,734 1 42,734
Residual U V W 17,345 #
Total 64,909 10

Deducimos fácilmente los datos que nos faltan en la tabla:

; ; ⁄ ⁄

La tabla completa queda:

SC gl MC F
Regresión 42,734 1 42,734
Residual 22,175 9 2,4639 17,345
Total 64,909 10

21- Uno de los supuestos básicos del análisis de regresión simple es: A) los pronósticos y
los errores son independientes; B) las distribuciones condicionadas de los errores deben de
tener una distribución uniforme; C) no deben estar relacionadas las variables predictora y la
variable dependiente o criterio.

Página 343 del libro de texto.

22- ¿Aproximadamente cuál es el coeficiente de correlación de Pearson entre X e Y? A)


0,787; B) 0,97; C) 0,811.

El cociente entre la suma de cuadrados de la regresión y la suma de cuadrados total es el


coeficiente de determinación, luego su raíz cuadrada será el coeficiente de correlación de
Pearson.

23- ¿Aproximadamente, cuál es la varianza muestral insesgada de los errores del modelo
de regresión? A) 2,217; B) 4,273; C) 2,464.

La varianza muestral insesgada de los errores del modelo de regresión coincide con la media
cuadrática residual.

-5-
Diseños de Investigación y Análisis de Datos. Febrero 2011. Modelo D

24- ¿Con un nivel de confianza del 95%, cuál es el valor de la F teórica, por encima del cual
se debería rechazar la hipótesis de que hay no relación lineal significativa entre Y y X?; A)
5,117; B) 5,59; C) 6,608.

Buscando en las tablas F de Fisher para 1 y 9 grados de libertad, comprobamos que la


respuesta correcta es A.

25- ¿Cuál es el error típico del modelo de regresión? A) 2,464; B) 1,57; C) 1,665.


√ √

-6-
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
24/06/2013
Foro Asignatura
Septiembre 2011 (Original – TipoA)
Diseños de investigación y Análisis de Datos. Septiembre 2011, soluciones al modelo A.

A continuación se presentan 3 situaciones. Cada situación viene seguida por una serie de preguntas referidas a la
misma y de preguntas teóricas generales.

SITUACIÓN 1: “La formación alcanzada por la población adulta española ha mejorado, de forma continua, en los últimos
10 años. Desde 1998 el porcentaje de españoles de 25 a 64 años que poseen estudios superiores a los obligatorios ha
pasado de 33% al 51% en 2008. En la misma proporción ha disminuido, por tanto, el porcentaje de españoles que sólo
poseen estudios obligatorios, que ha pasado del 67% en 1998 al 49% en 2008” (Panorama de la Educación. Informe
OCDE 2010). Suponga que usted quiere estudiar si estos datos son los que realmente existen en su Comunidad, para lo
que utiliza una muestra aleatoria de 900 adultos con edades comprendidas entre 25 y 64 años, encontrando que 378 de
ellos tienen solo los estudios obligatorios.

Los datos de los que partimos son:

Estudios superiores a Muestra


Estudios obligatorios
los obligatorios
1998 33% 67%

2008 51% 49% 378 personas con estudios obligatorios

Proporción de personas en la muestra con estudios obligatorios:

1.- Si decide trabajar con un nivel de confianza del 95% y se establece el error máximo de estimación en el 3%, ¿cuál
debe ser el tamaño de la muestra?: A) 1040; B) 544; C) 789.

El error máximo viene dado por la expresión:

( )

Despejando “n” de la ecuación anterior, obtenemos:


( )

2.- El tamaño de la muestra que se requiere para estimar la proporción poblacional con un nivel de confianza
previamente fijado: A) aumenta cuando aumenta el error en la estimación; B) aumenta cuando disminuye el error en la
estimación; C) no depende del error en la estimación.

Simplemente observando la fórmula con la que obtenemos el tamaño de la muestra concluimos que la respuesta
correcta es “B”.

-1-
3.- Sean “X” e “Y” dos estimadores de un mismo parámetro, si la distribución de probabilidad de “X” tiene menor
variabilidad que “Y”: A) el estimador “Y” es más eficiente; B) el estimador “X” es más eficiente; C) el estimador “X” es
más suficiente.

Pregunta teórica. Página 33 del libro de texto

4.- Trabajando con un nivel de confianza del 95%, el intervalo de confianza de la proporción de adultos de su Comunidad
que solo tienen estudios obligatorios, se encuentra entre: A) 0,378 y 0,462; B) 0,388 y 0,452; C) 0,376 y 0,461.

( )

√ √ {

5.- El nivel de confianza se refiere a: A) La probabilidad de que el parámetro se encuentre dentro de un intervalo de
confianza; B) El valor inverso del error típico; C) La probabilidad de que el estadístico se encuentre dentro de la
distribución muestral del parámetro.

Pregunta teórica. Tema 1 del libro de texto.

6.- Si el investigador quiere confirmar que la proporción de adultos de su Comunidad que solo tienen los estudios
obligatorios es significativamente inferior que el indicador de España en 2008, la hipótesis alternativa es: A) H1: π< 0,49;
B) H1: π> 0,49; C) H1: π≤ 0,42.

La respuesta correcta es “A”, puesto que las hipótesis que debemos plantear son:

7.- Si el investigador cree que la proporción de adultos que solo tienen los estudios obligatorios es inferior que el
indicador de España en 2008, el estadístico de contraste y el nivel p-crítico para analizar si la diferencia es
estadísticamente significativa es: A) 3,34 (p=0,0008); B) -4,2 (p<0,0002); C) -2,33 (p=0,0198);


8.- Respecto a la hipótesis del investigador analizada en las preguntas anteriores, el investigador concluye que la
proporción de adultos que solo tienen estudios obligatorios en su Comunidad, es: A) inferior a la del resto de España
con un nivel de significación de 0,01; B) la misma que la del resto de España con un nivel de significación de 0,05; C)
superior a la del resto de España con un nivel de significación de 0,01.

Obviamente, la respuesta correcta es “A”.

9.- A la probabilidad de rechazar la hipótesis nula cuando es falsa se le denomina: A) nivel de confianza; B) potencia del
contraste; C) nivel p-crítico.

Pregunta teórica. Página 61 del libro de texto.

SITUACIÓN 2: En una tarea sobre decisión léxica con estímulos visuales en la que se miden tiempos de reacción, un
investigador dispone de una muestra aleatoria de 26 sujetos. Utiliza dos grupos de palabras y parte de la hipótesis de
que los tiempos de reacción serán más cortos ante palabras de alta frecuencia léxica (aquellas que utilizamos más

-2-
frecuentemente en el lenguaje, Grupo 1) que ante palabras de baja frecuencia léxica (Grupo 2). Tras realizar el
experimento observa que el tiempo de reacción medio para el Grupo 1 fue igual a 612,04 ms, mientras que para el
Grupo 2 fue igual a 645 ms, siendo la cuasivarianza de las diferencias igual a 6656 ms2. Asumiendo que se cumplen los
supuestos para realizar un contraste paramétrico, conteste a las siguientes cuestiones:

10.- Para comprobar si la diferencia entre dos medias es significativa, calculamos: A) el estadístico de contraste; B) el
tamaño del efecto; C) las dos opciones anteriores son verdaderas.

Pregunta teórica. Página 156 del libro de texto.

11.- El nivel de medida de la variable dependiente es: A) ordinal; B) de intervalo; C) de razón.

La variable dependiente es el tiempo de reacción, cuyo nivel de medida es de razón.

12.- La hipótesis nula es: A) ; B) ; C) .

La respuesta correcta es “A”, debemos de plantear un contraste de hipótesis sobre dos medias para dos
muestras relacionadas, siendo las hipótesis:

13.- La hipótesis alternativa es: A) ; B) ; C) .

14.- El valor absoluto del estadístico de contraste es: A) 1,708; B) 2,06; C) 2,485.

La respuesta correcta es “B”. El estadístico de contraste es:

̅ ̅
̂
√ √

15.- Para un nivel de confianza del 95%, el valor absoluto del valor crítico es: A) 1,708; B) 2,06; C) 2,485.

Acudiendo a la tabla t de Student, observamos que la respuesta correcta es “A”.

16.- El valor del nivel p-crítico es: A) 0,05; B) 0,025; C) 0,01.

Acudiendo a la tabla t de Student, observamos que la respuesta correcta es “B”.

17.- El resultado del experimento: A) no es significativo; B) es significativo al nivel de confianza del 95%; C) es
significativo al 95% y al 99%.

La respuesta correcta es “B”, puesto que los resultados son significativos para el nivel de confianza del 95%
( ) pero no son significativos al nivel de confianza del 99% ( ).

SITUACIÓN 3. Un investigador sospecha que los tiempos de coagulación de la sangre difieren en función del tipo de
dieta. Para ello, ha realizado un experimento donde ha formado varios grupos de ratones, sometiendo a cada grupo a
distintos tipos de dietas. Tras analizar los datos mediante un ANOVA, parte de los siguientes resultados:

-3-
Fuentes Sumas Grados Medias
F
de variación de cuadrados de libertad cuadráticas
Entre niveles 228 3
Dentro de niveles 112 20
Total 340 23

Conociendo los grados de libertad, deducimos el número de niveles, número de sujetos en cada nivel y número total
de sujetos:

Completamos la tabla de ANOVA, que queda:

F.V. S.C. g.l. M.C. F


Entre grupos 228 3 228/3 = 76
76/5,6 = 13,57
Error 112 20 112/20 = 5,6
Total 340 23

18.- Asumiendo un diseño equilibrado, ¿cuántos animales utilizó por grupo? A) 6; B) 4; C) 5.

La respuesta correcta es “A”.

19.- ¿Cuántos niveles tiene el factor “Tipo de dieta”? A) 6; B) 4; C) 3.

La respuesta correcta es “B”.

20.- La hipótesis nula planteada en este diseño es: A) para todo ; B) para todo ; C)
.

Pregunta teórica. Página 208 del libro de texto.

21.- El valor de la F para el factor “Tipo de dieta” fue: A) 8,660; B) 2,380; C) 13,57.

La respuesta correcta es “C”.

22.- Siendo   0.05 , el valor de la F crítica para el factor “Tipo de dieta” fue: A) 3,098; B) 2,380; C) 4,938.

Para un nivel de confianza del 95%, mirando en las tablas F de Fisher para 3 y 20 grados de libertad, observamos
que la F crítica es: 3,098, luego la alternativa correcta es “A”.

23.- ¿Tendremos que realizar comparaciones a posteriori? A) Sí; B) No porque tenemos más de 2 niveles del factor; C)
No porque las comparaciones a posteriori solo se aplican en diseños intrasujetos.

Tendremos que hacer comparaciones “a posteriori” porque hemos rechazado la hipótesis nula que planteaba la
igualdad entre las medias ( ).

24.- Con un nivel de confianza del 95%, ¿Cuál será el valor mínimo de la diferencia entre dos medias cualesquiera en
este experimento para que resulten significativas según Tukey ( 0,05)? A) 12,39; B) 0,59; C) 3,83.

-4-
√ √

Luego la respuesta correcta es “C”.

25.- Cuando se aplica un Análisis de la Varianza de un factor, las varianzas de los grupos a comparar deben de cumplir el
supuesto de: A) complementariedad y exhaustividad; B) homocedasticidad; C) independencia.

Pregunta teórica. Página 232.

-5-
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
24/06/2013
Foro Asignatura
Febrero 2012 (2ª Semana – Tipos C y D)
Diseños de Investigación y Análisis de Datos

Grado en Psicología

Material permitido
permitido: CÓDIGO CARRERA 6201
Formulario sin anotaciones y CÓDIGO ASIGNATURA 2054
Calculadora científica no
programable FEBRERO DE 2012 (2º semana)

FÓRMULA DE CORRECIÓN = DURACIÓN: 2 HORAS


ACIERTOS-(ERRORES/2)
(ERRORES/2)
EXAMEN MODELO C

MODELO C RESUELTO

A continuación se presentan 3 situaciones. Cada situación viene seguida por una serie de preguntas referidas a la
misma.

El Centro de Investigaciones Sociológicas (CIS) realiza constantes estudios sobre la ideología e intención de voto de los
españoles. Uno de los ítems que incluye en sus cuestionarios es el de la “identificación ideológica para lo que se le pide
ntificación ideológica”,
al entrevistado que se ubique ideológicamente en una escala de 1 a 10 (donde 1 significa extrema izquierda y 10 extrema
derecha). En su última encuesta a la población española la media aritmética obtenida par paraa la variable identificación
ideológica fue de un 4,86. Un psicólogo social interesado en estudiar esta temática en su localidad selecciona una
muestra aleatoria formada por 31 sujetos a los que aplica el ítem de identificación ideológica, obteniendo una media
m de
5,40 y una cuasi-desviación
desviación típica de 1,2. Con esta información, responda a las siguientes preguntas: preguntas

1. Con un nivel de confianza del 95%, el tamaño de la muestra necesario para que el error de estimación de la media en
la escala de Identificación ideológica no supere 0,2 puntos, es: a) 150; b) 102; c) 138.
Respuesta:
Aplicamos la fórmula para el cálculo del tamaño muestral necesario para obtener un error de estimación menor o
igual a uno prefijado (en nuestro caso E = 0.2) del estadístico media conociendo la cuasi-desviación
desviación típica muestral
( S n −1 = 1.2 ) y que el valor de α = 0.05 yya que el Nivel de Confianza es del 95%.. Aplicamos la fórmula desconocida la
varianza poblacional para muestras pequeñas ( α / 2 t31−1 = 2.042 ):
2
(α / 2 tn −1 ) 2 ( 2.042)
n = S n2−1 = 1 . 2 = 150.112
E2 0 .2 2
El valor obtenido debe truncarse al natural más cercano (1 (150). Luego la opción correcta: A.
2. Con un nivel de confianza del 95%, el intervalo de confianza aproximado para la media en la escala de identificación
ideológica de los residentes en su localidad es: A) 4,98 - 5,82; B) 5,03 – 5,76; C) 4,952 – 5,847
7.
Respuesta:
Desconocemos la varianza poblacional y si utilizamos la cuasivarianza (ya que es el valor muestral que nos
proporcionan) deberemos aplicar las fórmulas:
S n −1 1 .2 1 .2
li = X − t
n −1 α / 2 = 5.40 − − 2.042 = 5.40 − (2.042 ) = 4.9599
n 31 31
S 1 .2 1 .2
ls = X + n −1 t1−α / 2 n −1 = 5.40 + 2.042 = 5.40 + (2.042 ) = 5.8401
n 31 31
Opción correcta: C.

Sabiendo que el psicólogo sospecha que la población de su localidad es más conservadora que la población general,

3. De acuerdo a los objetivos del psicólogo, la hipótesis nula es: A) H0: μ ≤ 4,86; B) H0: μ < 4,86; C) H0: μ > 4,86.
Solución:
Si el psicólogo “sospecha” que en su localidad, la tendencia política es más conservadora que en la población general,
significa que esta es la hipótesis alternativa, es decir, la hipótesis alternativa es unilateral:
H1 : µ poblacion > 4.86
Luego la hipótesis alternativa es la complementaria:
H 0 : µ poblacion ≤ 4.86
Observamos que de las opciones que nos proporcionan para la hipótesis nula, solo una tiene el signo “igual”. Esto es
un índice añadido al razonamiento anterior que nos indica cuál es la correcta.
Opción correcta: A.

4. El procedimiento que aplicaría para probar la hipótesis del psicólogo, es: A) la Prueba Z; B) la prueba t con n-1 grados
de libertad; C) la prueba Chi cuadrado con n-1 grados de libertad.
Solución:
Tenemos un contraste de medias con una única muestra de 31 sujetos y de la población no conocemos la varianza.
Luego debemos utilizar como estadístico de contraste la prueba t con n-1 grados de libertad.
La prueba Z sería correcta si conociéramos la varianza poblacional.
Opción correcta: B.
5. El estadístico de contraste para la hipótesis del psicólogo es: A) 2,352; B) 1,697; C) 2,5.
Solución:
X − µ0 5.40 − 4.86
t= = = 2.50549
S n −1 1.2
n 31
Opción correcta: C.
6. Si el psicólogo fija un nivel de significación de 0,05 el valor crítico para tomar una decisión respecto a la hipótesis nula
es: A) 1, 697; B) 1,96; C) 2,042.
Solución:
Buscamos en las tablas con n-1 = 30 y α / 2 = 0.025 (recordemos que la hipótesis del psicólogo era unilateral), luego
buscamos en la tabla con 0.975, es decir 1 – 0.025:
Opción correcta: C.
7. Bajo el supuesto de que la H0 es verdadera, la probabilidad de obtener una muestra con una media tan alejada o más
de 5,39 es: A) p > 0,10; B) p < 0,001; C) p < 0,01.
Solución:
Nos están preguntando qué sucedería si, siendo H0 cierta, cuál es la probabilidad de obtener una media muestral igual
a 5.39 o superior (más extrema). Si realizamos el cálculo de la t con este nuevo valor:
X − µ0 5.39 − 4.86
t= = = 2.4591
S n −1 1.2
n 31
Podemos observar en las tablas de la t (con 30 g.l.) que la p sería:

El valor de t = 2.457 (el más cercano en la tabla a 2.4591) deja por debajo de sí el 0.990 del área de la distribución y
por encima de sí el 1-0.990 = 0.01. Luego la opción correcta es la C.
8. Con los datos originales obtenidos en nuestra muestra, la decisión que toma respecto a la hipótesis nula es: A)
Rechazarla porque, bajo el supuesto de que fuera cierta, la probabilidad de obtener una muestra con una media de
5,40 o superior es muy pequeña; B) Mantenerla porque el valor absoluto del estadístico de contraste es menor que el
valor absoluto del valor crítico; C) No se puede rechazar la hipótesis nula.
Solución:
Al indicarnos que está hablando de los datos originales, se está refiriendo a los datos proporcionados en el enunciado
del problema (para diferenciarlo claramente del enunciado del ejercicio anterior). Recordemos que la t obtenida fue
de 2.50549 y trabajando unilateralmente con un α = 0.05 , la t crítica sería 2.042, luego
t empírica > tcrítica
2.50 > 2.04
Luego el valor obtenido cae en la zona de rechazo de H0. La opción correcta en que se especifica este rechazo es la A.
Opción correcta: A.

Un psicólogo quiere comprobar si los alumnos de primero de grado (Grupo 1) y los de cuarto de grado (Grupo 2) difieren
en la variable “autoestima”. Tras seleccionar dos muestras aleatorias de igual tamaño ( n1 = n2 = 31 ) aplica a ambas un
test de autoestima. Los resultados fueron: Yˆ1 = 26, Sˆ12 = 64 para el Grupo 1 y Yˆ2 = 20, Sˆ22 = 60 para el
Grupo 2. Como el psicólogo no sabe si las varianzas poblacionales son iguales o diferentes, decide realizar un contraste
de hipótesis sobre dichas varianzas. Asumiendo un nivel de confianza del 99%, conteste a las siguientes cuestiones:

σ12 σ12 σ12


9. La hipótesis alternativa para el contraste sobre las varianzas es: A) H1 : ≠ 1 ; B) H1 : < 1 ; C) H1 : >1.
σ 22 σ 22 σ 22
Solución:
Disponemos de dos grupos independientes (primero y cuarto de grado). La afirmación de la hipótesis en el enunciado
no señala ningún sentido a la hipótesis, por lo que la asumimos bilateral. En este caso, se asume que la varianza
poblacional del primer grupo tanto puede ser superior que inferior a la del segundo grupo. Por lo tanto se está
admitiendo (hipótesis alternativa) que el cociente entre ambas igual puede ser superior a 1 o inferior a 1.
Opción correcta: A.

10. El estadístico de contraste para el contraste sobre las varianzas es igual a: A) 1,067; B) 2,386; C) 2,009.
Solución:
El estadístico de contraste es una razón F:
Sˆ12 64
F= = = 1.06667
Sˆ22 60
Opción correcta: A.

11. Tras realizar el contraste de hipótesis sobre las varianzas, el psicólogo asume que: A) las varianzas poblacionales son
diferentes porque el estadístico de contraste es mayor que el valor crítico superior; B) las varianzas poblacionales
son iguales porque el estadístico de contraste se encuentra comprendido entre los dos valores críticos que
buscamos en las tablas F; C) las varianzas poblacionales son iguales porque el nivel crítico es menor que el nivel de
significación.
Solución:
Para responder a esta pregunta necesitamos conocer el valor de la F crítica con 31-1 = 30 y 31-1 = 30 grados de
libertad en el numerador y denominador, respectivamente. Según las tablas (con un NC = 0.99 bilateral, α = 0.01 ,
significa que debemos utilizar la tabla del 0.995):

El valor obtenido es de 2.628. Por consiguiente, podemos afirmar que la F empírica (1.067) es inferior a la F crítica
superior. Debemos recordar que al ser un contraste bilateral, también tenemos un valor de F crítica inferior.
Sabemos que, por la distribución de la F, este valor de F crítica inferior cumple que es más pequeño que la unidad,
por lo que podríamos responder directamente a la pregunta. No obstante, para asegurarnos podemos calcularlo
utilizando la fórmula de la propiedad recíproca de la distribución F:
1
Fn1 −1, n2 −1, α / 2 =
Fn2 −1, n1 −1, 1−α / 2
La tarea se simplifica ya que los grados de libertad del numerador y del denominador son idénticos y por tanto,
intercambiables. Si queremos hallar la F que deja por debajo de sí un área de 0.01 la encontraremos como:
1 1 1
Fgl1 = 30, gl2 = 30, 0.01 / 2 = = = = 0.380518
Fgl2 = 30, gl1 = 30,1− 0.01 / 2 F30,30 , 0.995 2.628
Con este cálculo podemos afirmar que el valor de la F empírica se encuentra en la región de aceptación (o no rechazo)
de H0. El valor de la probabilidad de la F empírica (nivel crítico p) es mayor que el nivel de significación ( α = 0.01), es
decir, p > α .
La opción C es incorrecta porque afirma justamente lo inverso, es decir, que p < α .
La opción A es incorrecta ya que el estadístico de contraste (1.066) no es mayor que el valor crítico superior, sino
inferior.
La opción B es correcta ya que p > α y no podemos rechazar la H0.

12. La hipótesis alternativa en el caso del contraste para dos medias es: A) H1 : µ1 < µ2 ; B) H1 : µ1 > µ2 ; C) H1 : µ1 ≠ µ2
Solución:
Seguimos manteniendo el contraste bilateral, por consiguiente las opciones A y B son incorrectas. La opción correcta
es la C ya que es la hipótesis alternativa para un contraste bilateral de medias en dos grupos independientes.
Opción correcta: C.
13. El estadístico de contraste en el caso del contraste sobre las medias es igual a: A) 3; B) 2,66; C) -2,66.
Solución:
El estadístico a aplicar sería el correspondiente a desconocidas las varianzas poblacionales y supuestas iguales (según
hemos obtenido en el ejercicio 11):
Y1 − Y2 26 − 20
T= = =3
(n1 − 1) Sˆ12 + (n2 − 1) Sˆ22  1 1  30 ⋅ 64 + 30 ⋅ 60  1 1
 +   + 
n1 + n2 − 2  n1 n2  31 + 31 − 2  31 31 

Opción correcta: A.

14. Los valores críticos en el contraste sobre las medias es igual a: A) -3 y +3; B) -2,66 y +2,66 C) 0,005 y 0,995.
Solución:
Los valores críticos de la t con n1+n2-2 = 31+31-2=60 grados de libertad y α = 0.01 bilateral (luego buscamos en las
tablas 1-(0.01/2) = 1 – 0.005= 0.995) son:

Opción correcta: B.
15. El nivel crítico en el caso del contraste sobre las medias es igual a: A) está comprendido entre 0,025 y 0,05; B) es igual
a 0,025; C) es menor que 0,01.
Solución:
El nivel crítico se corresponde con la probabilidad de la T empírica (que hemos obtenido antes y es igual a 3). Si
buscamos en las tablas para 60 grados de libertad observaremos que no aparece, luego este valor de probabilidad es
inferior a 1 – 0.995 = 0.005. Solo la opción C contempla esta posibilidad al indicar que “es menor que 0.01”.
Opción correcta: C.
16. En un contraste sobre dos proporciones con muestras relacionadas, cuál de los siguientes estadísticos es insensible a
la dirección del cambio producido: A) Chi cuadrado de la prueba de McNemar; B) el estadístico Z; C) no es correcta
ninguna de las opciones anteriores.
Solución:
En el desarrollo del Tema 4, se explicita y muestra numéricamente que la prueba de McNemar es insensible a la
dirección del cambio (pags. 11-13). Opción correcta A.

La Tabla 1 muestra los rendimientos (en hectólitros por hectárea o hl/ha) de trigo cultivado en un tipo particular de suelo
tratado con los fertilizantes A, B o C. El experimentador dispuso de 12 áreas de terreno del mismo tamaño y asignó
aleatoriamente 4 de ellas a cada tipo de fertilizante. Trabaje con un α = 0.05 sabiendo que SCfertilizante = 8 y
SCS/fertilizante= 6.

Tabla 1
Fertilizante
A B C
48 47 49
49 49 51
50 48 50
49 48 50

17. Se trata de un diseño factorial: A) 3x4 intersujetos; B) de 1 factor con tres niveles; C) de 1 factor con tres niveles
intrasujetos.
Solución:
Se trata de un diseño inter-sujetos (en este caso, inter-terrenos) ya que cada parcela (cada “sujeto”) solo fue
sometido a un nivel del factor (Tipo de fertilizante). El único factor manipulado (Fertilizante) se manipuló a tres
niveles (tipo de fertilizante: A, B o C). Luego se trata de un diseño de un factor con tres niveles.
Opción correcta B.
18. El diseño presentado es: A) de efectos fijos; B) desequilibrado ; C) las dos opciones anteriores son incorrectas.
Solución:
Se trata de un diseño de efectos fijos. No puede ser desequilibrado ya que hay 4 terrenos o parcelas para cada tipo de
fertilizante (lo cual indicaría que es equilibrado). Solo nos interesan estos fertilizantes (A, B y C), ningún otro.
Opción correcta: A.
19. El modelo estadístico que podemos aplicar a estos datos es: A) Yij = µ + α i + ε ij ;
1
B) E ( MCint er ) =σ2 + niα i2 ; C) Yij = µ + α i + (αε ) ij + ε ij .
( I − 1)

Solución Correcta: A.
La opción B no es un modelo sino la expresión del valor esperado de la Media Cuadrática Inter. La expresión C es
incorrecta ya que asume la interacción entre los errores y los niveles del tratamiento. La opción correcta es la A ya
que expresa cada puntuación de la variable dependiente (Yij) como la suma de tres componentes: una media global
común ( µ ), el efecto del factor del terreno concreto del que estemos hablando ( α i ) y un error aleatorio ( ε ij ).
20. El rendimiento medio para los diferentes tratamientos es: A) {49, 48, 50}; B) {196, 192, 200}; C) {2/3, 2/3, 2/3}.
Solución:
Para obtener el rendimiento medio para los diferentes tratamientos simplemente calculamos la media de cada
fertilizante:

Fertilizante
A B C
48 47 49
49 49 51
50 48 50
49 48 50
Media 49 48 50
Luego la opción correcta es la A. La opción B es incorrecta porque expresa no un valor medio sino el rendimiento total
(la suma).
21. La variación entre tratamientos vale: A) 4; B) 8; C) 14.
Solución:
Con los datos proporcionados en el enunciado podemos construir la Tabla del Anova (modelo de un factor de efectos
fijos):

Fuentes de variación SC g.l. MC F


Factor (A) 8 I-1=3-1=2 8/2=4 4/0.6667=5.9997
Sujetos (S) 6 N-I=12-3=9 6/9=0.6667
T 14 N-1=12-1=11
Luego la opción correcta es A.

22. La variación dentro de los tratamientos vale aproximadamente: A) 5/3; B) 4/3; C) 2/3.
Solución:
La tabla anterior nos indica que la solución correcta es 6/9. Si no aproximamos, podemos obtener el valor pedido
reduciendo la razón 6/9 a:
6
6 3 2
= =
9 9 3
3
Luego la opción correcta es C.
23. El tipo de fertilizante ha resultado significativo: A) Sí, porque la MCIntra es superior en, aproximadamente, 6 veces a la
MCInter; B) No, porque la SCintra es casi igual a la SCinter indicando que la variabilidad asociada al tratamiento es casi
idéntica a la del error; C) Sí, porque la F obtenida (5.9999) es superior al valor crítico ( 0.05 F2,9 = 4,256 ).
Solución:
Para saber si la F obtenida es significativa, debemos buscar en la tabla de la F el valor crítico:

Hemos obtenido una F de 5.999 (aproximadamente 6) y el valor crítico de F es 4.256. Como 5.999 > 4.256, el valor de
la F obtenido cae en la zona de rechazo de H0.
Opción correcta: C.
La opción A es incorrecta porque la comparación entre las medias cuadráticas del factor y del error no es suficiente
para declarar un efecto significativo. Es necesario compararlo también con la F crítica.
24. ¿Entre qué niveles podemos asegurar que existen diferencias según CR de Scheffé? A) sólo entre los niveles B y C; B)
Sólo entre los niveles A y C; C) sólo entre los niveles A y C.
Solución:
Aplicamos la fórmula de la CR de Scheffé (como nos piden asegurar entre qué niveles existen diferencias, ponemos
los coeficientes típicos para la comparación entre dos niveles dejando el tercero sin incluir):
 I  c2   6  12 ( −1) 2 0 2 
CRScheffé = ( I − 1) F( k −1), gl _ error MCerror  ∑  i   = (3 − 1) 4.256  + +  = 1.68444
 i =1  ni   9  4 4 4
Ahora realizamos las diferencias (en valor absoluto) entre las tres medias:
A − B = 49 − 48 = 1
A − C = 49 − 50 = 1
B − C = 48 − 50 = 2
Solamente la tercera diferencia (los fertilizantes B y C) obtiene un valor superior a la CR de Scheffé. Luego las
diferencias se encuentran entre B y C.
Opción correcta: A.
25. El diseño presentado no permite evaluar la interacción: A) porque el factor manipulado (tipo de fertilizante) no puede
interaccionar con ningún otro factor; B) porque tal interacción no ha sido incluida en el modelo; C) porque sólo existe
un factor manipulado y la interacción siempre se predica, como mínimo, de dos factores.
Solución:
La opción correcta es la C: solo si hubiéramos manipulado dos factores podríamos poner a prueba el efecto de
interacción. La opción A es incorrecta porque no sabemos si el factor manipulado interacciona con alguna otra
variable, podría ser pero como no hemos introducido ninguna otra variable en el diseño, es una cuestión que
tenemos que dejar en el aire. Por otro lado, la opción B es incorrecta porque introducir el efecto de interacción
cuando solo tenemos un factor no tiene sentido alguno.
PLANTILLA DE RESPUESTAS CORRECTAS PARA EL MODELO D

Número de cuestión Opción correcta


1 A
2 A
3 B
4 C
5 A
6 B
7 C
8 A
9 A
10 C
11 A
12 B
13 C
14 C
15 C
16 A
17 B
18 A
19 A
20 A
21 A
22 C
23 C
24 A
25 C
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
24/06/2013
Foro Asignatura
Septiembre 2012 (Original – TipoA)
Modelo A. Septiembre 2102 Calificación = (0,4 x Aciertos) – (0,2 x Errores)

SITUACIÓN 1: El “Síndrome Jubilación” es la situación que experimentan ciertas personas ante esta nueva etapa
vital con manifestaciones somáticas, psíquicas y sociales negativas que afectan la calidad de vida del jubilado.
Un estudio publicado por el GIE (Grupo de Investigación del Envejecimiento) mediante una encuesta realizada
en el 2006 utilizando una muestra de jubilados con edad media de 77,6 años y desviación típica de 8,79 años
encuentra que las manifestaciones psíquicas más frecuentes eran la ansiedad (82%), el pesimismo (13,3%) y la
depresión (4,7%) y que para el 32% de los expertos consultados el apoyo psicológico constituye la estrategia de
intervención más adecuada para superar estos estados. Suponga que usted quiere estudiar la situación de los
jubilados de su localidad respecto a este "síndrome", para lo que utiliza una muestra aleatoria de 362 jubilados,
con una edad media de 71,2 años y una desviación típica de 12,5 y de los cuales, el 59,8% presenta signos de
ansiedad, el 35% pesimismo y el 5,2% depresión.

Datos del enunciado:


Proporción de:
Apoyo psicológico como
Edad Ansiedad Pesimismo Depresión
Mejor estrategia
Estudio GIE ̅
0,82 0,133 0,047 0,32
Encuesta del ̅
Investigador 0,598 0,35 0,052 -

1.- Utilizando los datos del GIE y con un nivel de confianza del 95%: si le dicen que el intervalo de confianza de la
proporción de jubilados con manifestaciones de depresión, es un valor comprendido entre 0,0387 (3,87%) y 0,0553
(5,53%), ¿Cuál es el tamaño más aproximado de la muestra que se ha utilizado?: A) 1348; B) 2500; C) 3481.

Conociendo los límites superior e inferior del intervalo de confianza, deducimos fácilmente el error máximo:

El tamaño de la muestra será igual a:


( ) ( )

2.- Utilizando los datos de su estudio y con un nivel de confianza del 95%, la edad media de los jubilados de su
localidad es un valor comprendido, aproximadamente, entre: A) 69,9 y 72,5 años; B) 69,5 y 72,9 años; C) 70,2 y 73,1
años.

( )

3.- Con los datos de su estudio y un nivel de confianza del 99%, el intervalo de confianza para la proporción de
jubilados con manifestaciones psíquicas de ansiedad, es: A) 0,557 y 0,639; B) 0,547 y 0,648; C) 0,531 y 0,664.

( )
√ ( )

1
4.- Si desea comprobar que la proporción de jubilados de su localidad con manifestaciones psíquicas de pesimismo
es significativamente mayor que el valor 0,133 facilitado por el GIE en el 2006, ¿cuál es, aproximadamente, el valor
del estadístico de contraste que obtendría?: A) 8,77; B) 10,3; C) 12,18.

√ ( ) √ ( )

5.- Utilizando la información de su trabajo, si desea comprobar que la proporción de jubilados de su localidad con
manifestaciones psíquicas de pesimismo es significativamente mayor que el valor 0,133 facilitado por el GIE en el
2006, el nivel crítico que obtienes: A) es menor que 0,0002; B) es mayor que 0,001; C) depende del nivel de
confianza.
El estadístico de contraste es un valor muy extremo (z = 12,158). El valor máximo que podemos consultar en las
tablas de curva normal es z = 3,59, que deja por encima de sí una proporción: p = 0,0002

6.- En un contraste de hipótesis, el valor crítico representa: A) la probabilidad de rechazar la hipótesis nula siendo
verdadera; B) la máxima diferencia que cabe esperar entre el valor teórico formulado en la hipótesis nula y el
valor que encontramos en nuestros datos para esa hipótesis; C) la probabilidad de que siendo cierta la hipótesis
nula encontremos unos resultados como los observados en la muestra o más extremos.

7.- ¿Cuál de las siguientes afirmaciones referidas a la hipótesis nula es FALSA?: A) se asume como provisionalmente
verdadera; B) es la hipótesis a contrastar; C) su valor depende de los datos obtenidos en la muestra.

8.- Indique en cuál de las siguientes situaciones se hace uso de la estadística inferencial: A) Un estudio de la Agencia
Tributaria que detalla los ingresos medios de la población activa por sectores profesionales; B) Un informe del
Centro de Investigaciones Sociológicas reflejando cómo sería la composición del Congreso de los Diputados si se
realizarán hoy las elecciones; C) Un análisis presentado por el Ministerio de Educación sobre las notas de
selectividad, por Comunidades Autónomas, de los estudiantes presentados en la pasada convocatoria ordinaria.

SITUACIÓN 2: El equipo docente de una determinada asignatura quiere comprobar la eficacia de un material
docente nuevo respecto al utilizado en convocatorias anteriores. Selecciona una muestra aleatoria de 64 alumnos,
con los que forma dos grupos de igual tamaño también al azar. A los sujetos del Grupo 1 les proporciona en nuevo
material, mientras que los del Grupo 2 trabajan con el material antiguo. El equipo docente tiene la hipótesis de que
con el nuevo material las notas serán más elevadas. Tras el examen de fin de curso los alumnos del Grupo 1
obtienen una nota media igual a 7, con una cuasivarianza igual a 15, mientras que para el Grupo 2 la media es igual a
5,2 y la cuasivarianza igual a 17.

Tenemos dos muestras independientes con los siguientes datos:


Grupo 1. Material nuevo: ̅ ̂

Grupo 2. Material Antiguo: ̅ ̂

9- Si con un nivel de confianza del 95% realizamos un contraste de hipótesis para comprobar si las varianzas
poblacionales son iguales o diferentes, aceptaremos: A) la hipótesis nula; B) la hipótesis alternativa; C) No podemos
saber qué cuasivarianza hay que poner en el numerador del estadístico de contraste.

2
̂
̂

Para un nivel de confianza del 95%, el valor que nos ofrece la tabla F para 30 grados de libertad en el numerador y 30
grados de libertad en el denominador (los más próximos a 31) es igual a 1,841, luego los valores críticos son:

Dado que F = 0,88 se encuentra comprendido entre los valores críticos, aceptamos la hipótesis nula, por lo que
podemos suponer que las varianzas son iguales.

10.- Si realizamos un contraste de hipótesis sobre las medias para comprobar la hipótesis del equipo docente, el
estadístico de contraste vale: A) 2; B) 1,8; C) 1,67.

̅ ̅

( )̂ ( )̂ √ ( )
√ ( )

11.- El tamaño del efecto es igual a: A) 1,8; B) 0,90; C) 0,45.

̅ ̅

( )̂ ( )̂ √

12.- Con un nivel de confianza del 95%, suponiendo que la hipótesis nula sobre el contraste de medias es cierta, la
probabilidad de obtener un valor igual o superior al estadístico de contraste que hemos obtenido: A) se encuentra
comprendida entre 0,01 y 0,025; B) se encuentra comprendida entre 0,025 y 0,05; C) es igual a 0,05.
Nos piden calcular el nivel crítico. Buscando en las tablas para 60 grados de libertad (los más próximos a 62),
observamos que el estadístico de contraste obtenido (T =1,8), se encuentra comprendido entre los valores 1,671 y 2,
que dejan por encima de sí las probabilidades: 0,05 y 0,025.

13.- Si trabajamos con un nivel de confianza del 95%, la probabilidad de rechazar la hipótesis nula suponiendo que
es cierta es igual a: A) se encuentra comprendida entre 0,01 y 0,025; B) es igual a 0,05; C) es igual a 0,95.
Nos preguntan por el nivel de significación, la respuesta correcta es B.

14.- Tomando de las tablas el valor más próximo para los grados de libertad, el intervalo de confianza para la
diferencia de medias, para un nivel de confianza del 95% viene definido por los valores: A) 0,2 y 3,8; B) -0,2 y -3,8; C)
-0,2 y 3,8.

( )̂ ( )̂
(̅ ̅) ⁄
√ ( ) ( )

3
15.- El estadístico de contraste obtenido para contrastar la hipótesis del equipo docente: A) no es significativo; B) Es
significativo al nivel de confianza del 99%; C) es significativo al nivel de confianza del 95%.
El contraste que hemos de aplicar es unilateral derecho y el estadístico de contraste es: T = 1,8. Este valor supera al
valor crítico t = 1,671 (NC = 95%), pero no supera al valor crítico t = 2 (NC=99%), luego la respuesta correcta es C.

SITUACIÓN 3: Los siguientes datos relacionan el número de cigarrillos diarios (X) consumidos con el número de radicales libres
(Y) localizados en los pulmones de 8 individuos:

2 2
Sujeto X Y XY X Y
1 0 94 0 0 8836
2 10 144 1440 100 20736
3 14 182 2548 196 33124
4 5 120 600 25 14400
5 18 240 4320 324 57600
6 20 234 4680 400 54756
7 30 321 9630 900 103041
8 40 400 16000 1600 160000
Sumatorio 137 1735 39218 3545 452493
Des. Típica 12,24 97,60
rxy = 0,99
16.- La ecuación de regresión en puntuaciones tipificadas que relaciona el número de cigarrillos con el número de
radicales libres viene dada por la expresión: A) ZY  2.1 Z X ; B) ZY  1.5  Z X ; C) ZY  0.99  Z X
La respuesta correcta es C. El propio enunciado nos proporciona el valor del coeficiente de correlación de Pearson.

17.- La ecuación de regresión en puntuaciones tipificadas que relaciona X e Y: A) tiene un único parámetro; B) tiene
como parámetro el mismo valor que la ecuación de regresión en puntuaciones diferenciales; C) tiene dos
parámetros: la pendiente y el punto de corte con la ordenada.

18.- La pendiente de la ecuación de regresión para predecir Y a partir de X en puntuaciones directas vale: A) -3.32; B)
7.92; C) 0.99.

19.- En regresión lineal por mínimos cuadrados se dice que la recta de regresión es una estimación insesgada debido
a que: A) se calculan los valores de pendiente y punto de corte con la ordenada tales que hacen mínimo el error al
cuadrado; B) cuantifica el incremento que se produce en la estimación de la variable dependiente (Y’) cuando la
independiente (X) aumenta en una unidad; C) los valores esperados de los estimadores coinciden con los
parámetros que estiman.

20.- Sabiendo que el punto de corte con la ordenada (B0) vale 81.09, a un sujeto que fume 0 cigarrillos le
pronosticaremos un número de radicales libres en pulmones igual a: A) 7.93; B) 81.09; C) 0.

21.- Conociendo la recta de regresión de mínimos cuadrados de Y sobre X podemos calcular Y’. La correlación de
estas puntuaciones predichas (Y’) con los errores (Y-Y’) vale: A) 0; B) lo mismo que la pendiente; C) lo mismo que el
coeficiente de alienación.

4
22.- Si queremos poner a prueba la hipótesis H 0 :   0 mediante el estadístico de contraste F obtendríamos un
valor aproximado de: A) 594.00; B) 295.51; C) 1.00.

( ) ( ) ( ) ( )

23.- El error típico de la distribución muestral de la pendiente vale, aproximadamente: A) 0.12; B) 7.97; C) 0.46.

√ √

24.- Si en la Situación 3 incluyéramos también la cantidad de grasas saturadas ingeridas a la semana para predecir el
número de radicales libres, el modelo de estimación lineal sería:
A) ;
B) ;
C) .

25.- En un modelo de regresión múltiple, el cálculo de las correlaciones de orden cero: A) implica el cálculo de la
regresión entre las variables independientes y, posteriormente, la extracción de los residuos; B) no nos permite
saber qué parte de la varianza de la VD es capaz de explicar independientemente cada una de las VI’s; C) nos
permite hallar relaciones bivariadas puras.

5
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
27/05/2015
Curso Virtual
Febrero 2013 (1ª Semana – Tipo A)
Diseños de investigación y análisis de datos. Soluciones examen febrero 2012. Modelo A

SITUACIÓN 1. Un sociólogo sabe, por investigaciones anteriores, que el sueldo medio de la población de
hombres en el trabajo T es igual a 1500 euros mensuales. Extrae una muestra aleatoria de 160 mujeres que
desempeñan el trabajo T, observando que el sueldo medio en dicha muestra es igual a 1400 euros
mensuales con una cuasivarianza igual a 64000. Quiere comprobar si el sueldo medio de las mujeres es
inferior al de los hombres. Nivel de confianza 95%.

1- Para comprobar la hipótesis del sociólogo, ¿se ha de asumir que la variable dependiente se distribuye
normalmente en la población? A) Sí, necesariamente si se utiliza un contraste paramétrico; B) No, porque el
tamaño de la muestra es grande; C) No, porque la variable dependiente está medida en una escala de
razón.

2- La hipótesis alternativa es: A) ; B) ; C)

Las hipótesis que se han de plantear son:

3- El estadístico de contraste es igual a: A) ; B) ; C) – .

√ √

4- Si el sueldo medio de las mujeres es igual a la media poblacional de los hombres, la probabilidad de que en la
muestra el sueldo medio de las mujeres sea igual o inferior de 1400 euros mensuales es: A) menor que
; B) ; C) .

Dado que los grados de libertad son superiores a 100 consultamos la tabla de curva normal, donde
observamos que la puntuación deja por debajo de sí una proporción igual a 0,0002

5- ¿Mantiene el sociólogo la hipótesis nula? A) Sí, porque el estadístico de contraste es inferior al valor crítico;
B) No, porque “alfa” es menor que la probabilidad de rechazar H0 verdadera; C) No, porque el nivel crítico
es menor que el error de tipo I.

6- Sobre el sueldo medio de mujeres y hombres, el sociólogo concluye: A) Es el mismo; B) Es menor en la


población de hombres; C) es menor en la población de mujeres.

7- Cuál de las siguientes distribuciones de probabilidad NO es simétrica en torno a cero: A) la normal tipificada;
B) Chi cuadrado; C) T de Student.

8- El error típico de la media es: A) el error que sumamos y restamos a la media aritmética para calcular el
intervalo de confianza; B) la desviación típica de la distribución muestral de la media; C) el error que
cometemos si rechazamos una hipótesis nula verdadera.

9- Cuál de los siguientes estimadores sobre la tendencia central de una distribución es suficiente: A) la
mediana; B) la media aritmética; C) la moda.

-1-
Diseños de investigación y análisis de datos. Soluciones examen febrero 2012. Modelo A

SITUACIÓN 2. El Barómetro del CIS de septiembre de 2011 señala que a la pregunta: ¿Cuál es el principal
problema que existe actualmente en España?, respondieron 468 jóvenes con edades comprendidas entre 25
y 34 años, de los cuales el 57,3% señalaban “el paro”; el 19,2% indicaban “los problemas de índole
económica” y para el 9,4% el principal problema era “la clase política y los partidos políticos”. En el mismo
mes del 2012 ese rango de edad estaba compuesto por 480 jóvenes de de los cuales a la misma pregunta,
216 señalaban “el paro”, 114 se pronunciaban por “los problemas de índole económico” y 63 señalaban a “la
clase política y los partidos políticos” como el principal problema.

Los datos de la Situación 2 son:

Problemas
Paro Clase política
económicos

2011

2012

10- Si queremos analizar los cambios producidos en la opinión de los jóvenes sobre el principal problema que
existe actualmente en España en septiembre de 2012 en comparación a los del mismo mes de 2011, el
diseño que utilizamos es: A) de dos muestras independientes; B) de dos muestras relacionadas; C) de una
muestra.

11- Para analizar si la consideración de “la clase política y los partidos políticos” como principal problema ha
aumentado significativamente en el 2012 respecto al año anterior, el valor absoluto del estadístico de
contraste que se obtiene es, aproximadamente: A) 0,69; B) 1,81; C) 2,74.

√ ( )( )

√ ( )( )

12- El nivel crítico para tomar una decisión respecto a la hipótesis nula de que “la consideración del paro como
principal problema de los jóvenes no ha variado significativamente en el 2012 respecto al 2011” vale,
aproximadamente: A) p=0,0002; B) p<0,0004; C) p>0,0002.

Las hipótesis que se deben de plantear sobre el paro y el estadístico de contraste son:

√ ( )( )

√ ( )( )

Consultando las tablas de curva normal, observamos que la mayor puntuación que podemos consultar
es: , que deja por encima de sí una proporción igual a: . Como el contraste es bilateral,
multiplicamos por dos esta probabilidad, por lo que el nivel crítico:

-2-
Diseños de investigación y análisis de datos. Soluciones examen febrero 2012. Modelo A

Imagine por un momento que tuviera usted acceso a la muestra de los 480 jóvenes encuestados en
septiembre del 2012 para volverles a realizar la misma pregunta y analizar los cambios de opinión sobre la
consideración del paro como principal problema. Encuentra que ahora son 233 los que siguen
considerando el paro como el problema principal y que de los 216 que en septiembre lo señalaban como
el problema principal ahora son 193 los que siguen manteniendo la misma opinión.

El contraste es sobre dos proporciones con muestras relacionadas. En primer lugar construimos la tabla
correspondiente con los datos del enunciado (en negrita) deduciendo fácilmente el resto.

2012
Paro Otros problemas
Paro 193 233
Ahora
Otros problemas 224 247
216 264 480

13- En esta nueva situación, el análisis de datos se realizaría sobre un diseño: A) de una muestra; B) de dos
muestras relacionadas; C) de dos muestras independientes.

14- Bajo esta nueva situación, el valor absoluto del estadístico de contraste Z vale, aproximadamente: A) 1,52; B)
2,14; C) 3,2.

√ √

15- El valor crítico para tomar una decisión respecto a la hipótesis nula depende: A) del nivel de confianza que
se establezca; B) de los grados de libertad de la distribución muestral de la diferencia de proporciones; C) de
si se conoce o no la varianza poblacional de las diferencias.

16- El valor más aproximado del nivel crítico del estadístico de contraste obtenido en esta situación es: A) menor
que 0,01; B) 0,129; C) 0,032.

Consultando las tablas de curva normal, observamos que la probabilidad de obtener puntuaciones más
extremas que z = 2,14 es igual a 0,0162. Dado que el contraste es bilateral, el nivel crítico es igual a:

17- La interpretación de sus análisis le permitiría afirmar que: “La valoración de paro como principal problema
que existe actualmente en España….: A) no ha variado en estos meses transcurridos con un nivel de
significación del 0,05; B) ha variado en estos meses transcurridos con un nivel de significación del 0,01; C) ha
variado en estos meses con una seguridad del 96,8%.

Dado que el nivel crítico es igual a: 0,0324, el resultado obtenido es significativo hasta un nivel de confianza
igual a:

-3-
Diseños de investigación y análisis de datos. Soluciones examen febrero 2012. Modelo A

SITUACIÓN 3. En la Tabla 1 se presentan los datos referidos a las tasas de criminalidad de distintas ciudades
americanas. Las ciudades están clasificadas según su especialización funcional: ciudades industriales, de
servicio o administrativas. Nivel de confianza: 95%.
Tipo de ciudad
Industrial Servicios Administrativa
4,3 5,1 12,5
2,8 6,2 3,1
12,3 1,8 1,6
16,3 9,5 6,2
5,9 4,1 3,8
7,8 3,6 7,1
9,1 11,2 11,4
10,2 3,3 1,9
∑ 68,7 44,8 47,6

∑ 725,81 324,04 405,28

En primer lugar elaboramos la tabla de ANOVA.


[ ]

[ ] [ ]

F.V. S.C. g.l. M.C. F


Intergrupo 42,678 2 21,339 1,354
Intragrupo 331,069 21 15,765
Total 373,746 23 16,250

18- Si no se cumpliese el supuesto de normalidad de las tres subpoblaciones de ciudades deberíamos realizar un
contraste: A) de regresión lineal; B) no paramétrico; C) de medias independientes dos a dos.

19- La hipótesis alternativa en esta situación postula: A) que la media de las tasas de criminalidad son idénticas
entre los tres tipos de ciudades; B) que los tres tipos de ciudades tienen tasas de criminalidad diferente; C)
que existen, al menos, dos tipos de ciudades cuyas tasas de criminalidad difieren.

20- Se trata de un diseño: A) de dos factores de medidas independientes 3x8; B) de un factor de medidas
independientes con tres niveles; C) de un factor de medidas dependientes con tres niveles.

21- El valor de SCinter vale aproximadamente: A) 42,7; B) 39,9; C) 33,3.

22- El valor de SCintra vale aproximadamente: A) 20,0; B) 0,05; C) 331,1.

23- El valor del estadístico de contraste vale aproximadamente: A) 1,01; B) 10,1; C) 1,35.

24- El valor más aproximado de la F crítica que sirve como punto de separación para rechazar, o no, la H0 vale: A)
2,932; B) 2,339; C) 3,493.

Consultamos la tabla F para un nivel de confianza con 2 y 20 grados de libertad (los más próximos a 2 y 21) y
comprobamos que la respuesta correcta es C.

25- Según el análisis de esta situación, debemos: A) rechazar H0 con un nivel de confianza del 95%; B) no
rechazar H0; C) rechazar H0 con cualquier nivel de confianza.

-4-
Código asignatura Nombre asignatura
62012054 Diseños de Investigación y Análisis de Datos
Fecha alta y origen Convocatoria
27/05/2015
Curso Virtual
Febrero 2013 (2ª Semana – Tipo C)
Modelo C. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y calculadora científica no programable

A continuación se presentan 3 situaciones. Cada situación viene seguida por una serie de preguntas referidas a la
misma.

SITUACIÓN 1. Una preocupación creciente de los empresarios es el tiempo que los empleados dedican a actividades
como navegar por Internet o enviar e-mails a los amigos durante las horas de trabajo. Supongamos que el director de
una gran empresa desea determinar si la cantidad promedio de tiempo perdido durante un día de trabajo de 8 horas en
sus empleados es mayor que el valor informado por el anterior trabajo (120 minutos). En una muestra aleatoria de 26
empleados, se determinó que el promedio de tiempo perdido fue igual a 126 minutos con una varianza igual a 225.
Asumiendo que la variable dependiente se distribuye normalmente en la población y con un nivel de confianza 95%:

1- Se ha de suponer que la variable dependiente en la población se distribuye normalmente, porque: A) Es un supuesto que
siempre es necesario; B) porque la muestra es pequeña; C) porque el contraste es acerca de una media aritmética.
Respuesta: Como no nos han indicado la varianza poblacional y n < 30 tenemos que asumir la normalidad de la variable
en la población para poder aplicar el contraste de medias. Opción B.

2- La hipótesis nula es: A)  :   ; B)  :


 126; C)  :
 126.
Respuesta: es un contraste unilateral ya que el director plantea inicialmente que el tiempo perdido por sus empleados
es mayor que el determinado anteriormente. Luego está indicando una direccionalidad en su hipótesis y su hipótesis (la
razón por la que ha hecho este estudio) es la hipótesis alternativa; esta  :   120, en consecuencia, la hipótesis
nula es su complementaria:  :    incluyendo el signo igual (recuérdese que la hipótesis nula siempre es la que
lleva el signo igual). Opción A.

3- El valor del estadístico de contraste es: A) 1,708; B) 2; C) 2,390.


Respuesta:

4- Suponiendo que  es cierta, la probabilidad de que los empleados de la empresa dediquen 126 o más minutos diarios a
navegar por Internet o enviar e-mails a sus amigos es igual a: A) 0,95; B) 0,05; C) se encuentra entre ,   , .
Respuesta: como X = 126 es el valor que hemos obtenido en la media muestral, nos están pidiendo la probabilidad
asociada a este valor. Buscamos en las tablas de la distribución t con 25 grados de libertad.
Observamos que un valor t=2 no aparece exactamente en las tablas, luego solo podemos estimar entre qué valores de
probabilidad se encuentra: como t = 2 se encuentra entre t=1.708 y t=2.060, su probabilidad se encontrará entre la de
estos mismos valores, es decir entre p = 1-0.950 = 0.05 y p = 1-0.975 = 0.025.
Opción correcta: C.
5- El número de horas que los empleados de la empresa dedican a navegar por Internet o enviar e-mails a sus amigos
oscila en la población entre los valores: A) ,   , ; B) 120,876  131,124; C) 118,545  133,455.
Respuesta: nos están pidiendo el intervalo de confianza al 95%. Aplicamos la fórmula después de calcular la cuasi-
desviación típica:

No hace falta calcular la cuasivarianza ya que en el formulario los alumnos tienen las fórmulas con la varianza, y así los
cálculos salen exactos. No obstante, presentamos los cálculos con el procedimiento (más costoso) de calcular la
cuasivarianza y luego su raíz cuadrada para mostrar que también con este procedimiento los cálculos son correcos.

y su cuasidesviación típica es, aproximadamente, 15.30. Sabiendo por las tablas que  !"$# %  .'() % 2.060, *uego:

La opción correcta es la A.
6- Los valores del intervalo de confianza para la varianza son: A) 132,01 y 556,10; B) 132,01 y 445,98; C) 143,92 y 445,89.
Respuesta:
# #
Sabiendo por las tablas que + .'() % 40.6465 y que + . #) % 13.1197

Opción correcta: C.
7- En un contraste de hipótesis sobre la media aritmética, el valor absoluto del valor crítico: A) es el mismo en un contraste
unilateral izquierdo y un contraste unilateral derecho; B) es el mismo en un contraste bilateral y unilateral derecho; C)
es el mismo en un contraste bilateral y unilateral izquierdo.
Respuesta:
A
8- La potencia de un contraste de hipótesis será mayor: A) a medida que aumenta el tamaño de la muestra; B) a medida
que disminuye el tamaño de la muestra; C) siempre es la misma suponiendo que H1 es verdadera.
Respuesta: la potencia depende de una manera importantísima del tamaño muestral ya que a medida que n aumenta, la
muestra se va pareciendo más a la población. Esto significa que la opción B es absolutamente incorrecta. La opción B
también es incorrecta por la misma razón. Opción válida A.

9- Las curvas de potencia permiten localizar la potencia de un contraste en función de: A) el tamaño de la población y de la
muestra; B) el valor de H1 y el tamaño de la muestra; C) el tamaño de la población y el valor de H1.

Respuesta: Opción B (véase gráfica 2.13 del capítulo 2, página 19).

SITUACIÓN 2. El Barómetro del CIS de septiembre de 2011 señala que a la pregunta: ¿Cuál es el principal problema que
existe actualmente en España?, respondieron 468 jóvenes con edades comprendidas entre 25 y 34 años, de los cuales el
57,3% señalaban “el paro”, el 19,2% indicaban “los problemas de índole económica” y para el 9,4% el principal problema
era “la clase política y los partidos políticos”. En el mismo mes del 2012 ese rango de edad estaba compuesto por 480
jóvenes de los cuales a la misma pregunta, 216 señalaban “el paro”, 114 se pronunciaban por “los problemas de índole
económico” y 63 señalaban a “la clase política y los partidos políticos” como el principal problema. Nivel de confianza:
95%.

Si se quiere comprobar la hipótesis de que la percepción del paro como principal problema ha disminuido en 2012
respecto de 2011 en un porcentaje del 5%.

10- La hipótesis nula es: A)  : ,# - ,# #  0; B)  : ,# - ,# #  0; C)  : . - .  , .


Respuesta:
La hipótesis alternativa es que la percepción del paro, como principal problema, ha disminuido. Luego el investigador (el
CIS) espera que la proporción de sujetos que en 2012 indican que el paro es el principal problema sea menor en 2012
que en 2011 y, además, en un porcentaje igual o inferior al 5%. Como las alternativas nos plantean, no la hipótesis
alternativa sino la nula, la alternativa correcta es la C.
11- El valor absoluto del estadístico de contraste es aproximadamente: A) 2,26; B) 3,77; C) 1,64.
Respuesta:
opción correcta A.
12- Si la hipótesis alternativa es falsa, la probabilidad de obtener unos resultados como los observados, o más extremos es:
A) 0,05; B) 0,0238; C) 0,0119.
Respuesta: nos están pidiendo el valor de “p” o nivel crítico para el estadístico calculado en la pregunta anterior
(teniendo en cuenta que el contraste es unilateral). Buscando en las tablas encontramos la p asociada a Z = 2.26.

Luego el valor pedido es 1-0.9881 = 0.0119. Opción correcta C.

13- Respecto a la hipótesis nula: A) se rechaza porque el estadístico de contraste y el valor crítico son iguales; B) se rechaza
con un nivel de confianza del 95%; C) se rechaza con un nivel de confianza del 99%.
Respuesta:
la opción A es falsa porque el estadístico de contraste vale 2.26 mientras que el valor crítico (para un alpha unilateral de
0.05) es 1.65. Luego no son iguales.
La opción C es correcta ya que 2.26 > 1.65; o expresado en términos de las probabilidades 0.0119 < 0.05.
La opción C es incorrecta ya que al 99% unilateral, el valor crítico vale 2.33 pero el estadístico de contraste en este aso es
menor que el valor crítico (2.26 < 2.33); luego al 99% no se rechazaría H0. La opción C es falsa.

Si se quiere comprobar la hipótesis de que la percepción de los problemas de índole económica es la misma en 2011 y
en 2012:

14- Hipótesis alternativa es: A)  : ,# - ,# #  0; B)  : . - . / ; C)  : ,# - ,# #  0.


Respuesta:
Ahora la formulación de la hipótesis es bilateral por lo que se admite que la proporción entre 2011 y 2012 pueda ser o
superior o inferior a 0. La única alternativa correcta es la B.
15- El valor absoluto del estadístico de contraste es: A) 1,64; B) 1.70; C) 1,96.
Respuesta:
Ahora nos encontramos ante un contraste de proporciones de muestras independientes en donde D = 0. Luego primero
calculamos P (sabiendo que p1 = 0.192, n1 = 468, n2 = 480 y p2 = 114/480 = 0.2375):

Y con este valor podemos calcular el estadístico de contraste:


16- El nivel crítico es igual aproximadamente a: A) 0,05; B) 0,09; C) 0,95.
Respuesta:
Nos están pidiendo la probabilidad asociada al estadístico Z = 1.70 (considerando que es bilateral). Buscando en las
tablas de la curva normal encontramos:

Luego vale p = 2 (1-0.9554) = 2 x 0.0446 = 0.0892.


17- Respecto a la hipótesis nula: A) se rechaza porque el valor crítico es menor que el nivel de significación; B) se mantiene
porque el estadístico de contraste es menor que el valor crítico; C) se rechaza incluso con un nivel de confianza del
99,9%.

Respuesta: a un nivel de confianza del 95%, 0.09 > 0.025 por lo que no podemos rechazar H0 ya que el estadístico de
contraste (1.70) es menor que el valor crítico (que sería según las tablas +/- 1.96), es decir, 1.70 < 1.96. Se encuentra en
la región de aceptación de H0.

SITUACIÓN 3. El artículo “Efecto de la temperatura sobre el pH de la leche” (Journal of Dairy Research, 1988, 277-280)
informó de un estudio en el que se utilizaron 5 temperaturas diferentes (medidas en grados centígrados) en condiciones
experimentales controladas en una granja y se midió el pH de la leche obtenida para cada temperatura. La ecuación de
regresión calculada fue 0 1 % 0,65 2 0,223. El objetivo era predecir el pH de la leche (Y) a partir de la temperatura (X).
Utilice un 4 % 0,05. Además se sabe que: 56 % 1,87 y 57 % 7,90.

18- La ecuación genérica de regresión de Y sobre X, 0 % 8 2 9 3 2 : , es una relación: A) probabilística ya que depende de
la cantidad aleatoria ;; B) funcional cúbica ya que existen tres componentes aditivos en la ecuación; C) determinista ya
que el valor de Y está completamente determinado por el valor de X.
Respuesta:
La relación es probabilística ya que aunque los dos primeros términos de la relación lineal sean deterministas, se asume
que el error (;) no lo es. Por consiguiente para cada valor de X, la parte 8 2 9 3 nos proporciona un valor determinista
pero al cual se le añade un valor aleatorio (;). La opción B es errónea porque la relación no es cúbica (para ello, X tendría
que estar elevado al cubo) y no, como dice el enunciado, el que hayan tres componentes aditivos. La opción C es
errónea por lo que hemos indicado en la opción A.
19- La distribución del error en la ecuación de regresión lineal simple 0 % 8 2 9 3 2 : tiene una media igual a: A) 0< ;B) 3< ;
C) 0.
Respuesta:
La opción de respuesta es C ya que es un supuesto del modelo de regresión lineal simple.
20- En regresión lineal simple, se asume que la desviación típica del error en la ecuación 0 % 8 2 9 3 2 : : A) es igual a la
unidad; B) es la misma para cada valor particular de X; C) es igual a 0.

Respuesta:
Este es otro de los supuestos del análisis de regresión simple: los errores se distribuyen con media igual a 0 y con la
misma varianza para los distintos valores de X. Luego la opción correcta es B. La opción A es incorrecta porque no se
asume que los errores sean puntuaciones típicas; la opción C es incorrecta porque si el error tuviese desviación típica (o
varianza) igual a 0, no existiría como tal error.

21- El estadístico para poner a prueba la significación del coeficiente de correlación entre el pH y la temperatura vale
aproximadamente: A) 3,91; B) 4,36; C) 1,32.
Respuesta:
El estadístico solicitado es una t que viene dada por la fórmula:

Para su cálculo tendremos que calcular previamente el coeficiente de correlación. Como nos proporcionan las
desviaciones típicas de X e Y (7,90 y 1,87 respectivamente) así como la pendiente (0,22), podemos utilizar la fórmula:

despejando el coeficiente de correlación. Luego:

Y por consiguiente el estadístico buscado considerando que tenemos 5 datos (los cinco valores de temperatura
manipulados) es:

Opción correcta B.

22- El estadístico de la Tabla del Anova para poner a prueba si la Regresión como fuente de variación es significativa vale
aproximadamente: A) 19,0; B) 1,2; C) 2,1.

Respuesta:
Primera forma de hacerlo:

La otra forma de hacerlo es mucho más sencilla ya que disponemos del estadístico t y sabemos que t2 = F, luego:

Opción correcta A.
23- El contraste de hipótesis para determinar si la pendiente de la recta de regresión es significativa es: A) bilateral; B)
unilateral derecho; C) unilateral izquierdo.
Respuesta: en el apartado sobre regresión, no se plantea que los contrastes sean unilaterales, por lo que será bilateral.
Opción correcta A.
24- El intervalo de confianza para contrastar la pendiente vale aproximadamente: A) (0’38, 0’06); B) (-0’15, +0’15); C) (-0’32,
-0’15).
Respuesta:
Sabiendo que t con 5-2=3 grados de libertad y 0.975 vale 3.182, aplicamos la ecuación:

El resultado es 0.38 y 0.06 aproximadamente.


Los cálculos se podrían haber obviado ya que la opción A plantea que el coeficiente de correlación incluye al valor 0 lo
cual no es cierto ya que el contraste para la regresión ha sido lo suficientemente elevado (F=19) para descartar que no
haya relación entre temperatura y pH de la leche. La opción C es incorrecta porque plantea que el intervalo de confianza
¡no incluye al valor 0.22 que hemos obtenido muestralmente! (Esto también se aplica a la opción de respuesta B).

25- El coeficiente de correlación semiparcial entre el pH y la temperatura: A) coincide con el coeficiente de regresión
estandarizado; B) no tiene sentido calcularlo ya que estamos en una situación de regresión simple; C) coincide con el
coeficiente de determinación.
Respuesta: la opción correcta es la B ya que el coeficiente de correlación semi-parcial pretende calcular la correlación
entre dos variables eliminando el influjo de una tercera… pero aquí solo tenemos dos variables lo que hace absurdo su
cálculo.
Modelo D
Las preguntas y situaciones del modelo D son idénticas a las del modelo C con algunas variaciones en el orden. Por
consiguiente sólo incluimos la plantilla de este modelo:

Nº de pregunta Respuesta correcta


1 A
2 A
3 B
4 B
5 A
6 B
7 C
8 A
9 C
10 C
11 A
12 C
13 B
14 B
15 B
16 B
17 B
18 B
19 A
20 A
21 A
22 B
23 A
24 C
25 B
Modelo A. Soluciones. Septiembre 2013.

SITUACIÓN 1. Chaves y Noguera (2008) estudiaron la inserción laboral de los titulados en Psicología de cinco
promociones consecutivas (desde 2002 hasta 2006). Entre aquellos sujetos que estaban trabajando 6 meses después
de finalizar sus estudios, el 81% son mujeres, el 31% accedieron al trabajo mediante contactos personales y el 54%
trabajaban a jornada completa. Suponiendo que el número de titulados que trabajaban 6 meses después de finalizar
sus estudios es igual a 400.

1- Con un nivel de confianza del 99%, los límites del intervalo de confianza para la proporción de mujeres tituladas
en psicología que estaban trabajando 6 meses después de finalizar sus estudios, son: A) 0,76 y 0,86; B) 0,70 y
0,92; C) 0,80 y 0,82

√ {

2- Si se quiere comprobar que la proporción de titulados que trabajan a jornada completa es distinta de los que
trabajan a media jornada, la hipótesis alternativa que se ha de plantear es: A) ; B) ; C)

3- Si se quiere comprobar que la proporción de titulados que trabajan a jornada completa es distinta de los que
trabajan a media jornada, el valor del estadístico de contraste es aproximadamente igual a: A) 2,33; B) 2,58; C)
1,6.

√ ( ) √

4- Si se quiere comprobar que la proporción de titulados que trabajan a jornada completa es distinta de los que
trabajan a media jornada, el nivel crítico es aproximadamente igual a: A) 2,58; B) 0,05; C) 0,1096.

En la tabla de curva normal comprobamos que la probabilidad de encontrar valores superiores a: es igual
a . Como el contraste es bilateral:

5- Si se quiere comprobar que la proporción de titulados que trabajan a jornada completa es distinta de los que
trabajan a media jornada, con un nivel de confianza del , concluimos que: A) La proporción de sujetos que
trabajan a media jornada no difiere significativamente de la proporción de sujetos que lo hacen a jornada
completa, B) en la población es superior la proporción de sujetos que trabajan a jornada completa; C) en la
población son diferentes ambas proporciones.

6- Con un nivel de confianza del 99%, ¿cuál debería ser el tamaño de la muestra para estimar con un error máximo
de 0,02 la proporción de titulados que accedieron al trabajo mediante contactos personales? A) 570; B) 2054; C)
3560.


( )

-1-
7- Trabajando con una muestra aleatoria de 100 observaciones extraídas de una población con varianza igual a 16,
planteamos un contraste sobre la media con: . Si fijamos un nivel de confianza del 99%, rechazaremos
la hipótesis nula si: A) la media de la muestra es superior a 10,66; B) la media de la muestra es superior a
10,932; C) necesitamos conocer la media muestral para determinar a partir de qué valor rechazaremos la
hipótesis nula.

̅ ̅
̅

8- En un contraste de hipótesis sobre una media, si es cierta la hipótesis alternativa pero no se detecta en el
contraste estadístico, se comete un error: A) de tipo II; B) de tipo I; C) igual al nivel crítico.

9- La potencia del contraste es igual a: A) probabilidad de aceptar la hipótesis nula siendo cierta; B) probabilidad de
rechazar la hipótesis nula siendo falsa; C) probabilidad de rechazar la hipótesis alternativa siendo verdadera.

SITUACIÓN 2. Uno de los mejores indicadores de la salud psicológica es el auto-concepto (Esnaola, Goñi y Madariaga
2008) que hace referencia a la idea u opinión que cada persona tiene de sí misma. En una investigación realizada por
Esnaola y Revuelta (2009) con una muestra de 300 jóvenes de la Comunidad Autónoma de Cantabria y País Vasco se
analizan las relaciones entre la actividad física y el auto-concepto. La edad media fue de 18,64 años y la desviación
típica igual a 3,51 años. Por sus respuestas a un cuestionario sobre prácticas físico-deportivas el 69% fueron
clasificados como activos frente al resto que fueron clasificados como inactivos. En la escala de auto-concepto físico,
la media y desviación típica insesgada de los inactivos fue de 22,41 y 4,1 respectivamente y en el grupo de activos,
de 23,7 y 4,83. Y en la escala de auto-concepto general, la media y desviación típica insesgada de los inactivos fue de
23,76 y 3,6 respectivamente y en el grupo de activos, de 25,51 y 3,4.

Datos del enunciado:

Muestra total: ̅

Escalas de autoconcepto:

̅ ̂
Activos 23,70 4,83
Físico
Inactivos 22,41 4,10
Activos 25,51 3,40 207
General
Inactivos 23,76 3,60 93

10- El análisis de las diferencias entre las puntuaciones obtenidas por los sujetos activos en las escalas de auto-
concepto físico y auto-concepto general se realizaría mediante un contraste de diferencia de medias entre: A)
muestras independientes con varianzas poblacionales desconocidas pero supuestas iguales; B) muestras
independientes con varianzas poblacionales desconocidas pero supuestas distintas; C) muestras relacionadas.

11- La comparación de los resultados obtenidos por los jóvenes activos e inactivos en la escala de auto-concepto
físico se realiza mediante un contraste: A) de dos muestras relacionadas con varianzas desconocidas; B) no
paramétrico para muestras independientes; C) de dos muestras independientes con varianzas poblacionales
desconocidas.

12- El investigador sospecha que el auto-concepto físico es mayor para los sujetos activos que para los inactivos. Con
un nivel de confianza del 95%, el valor absoluto del estadístico de contraste que obtiene en el contraste de esta
hipótesis es, aproximadamente: A) 4,37; B) 3,21; C) 2,24.
̅ ̅

( )̂ ( )̂ √ ( )
√ ( )

-2-
13- El investigador sospecha que el auto-concepto físico es mayor para los sujetos activos que para los inactivos. Del
estadístico de contraste obtenido, se desprende que: A) Los sujetos físicamente activos se perciben mejor en la
escala de auto-concepto físico que los sujetos inactivos (p<0,01); B) Los sujetos físicamente activos se perciben
mejor en la escala de auto-concepto físico que los sujetos inactivos (p<0,05); C) Los sujetos físicamente activos
no se perciben mejor en la escala de auto-concepto físico que los sujetos inactivos (p>0,05).

Dado que los grados de libertad son superiores a 100, acudimos a la tabla de curva normal para calcular el nivel
crítico: (con un programa informático observaríamos que el nivel crítico es: ). Por lo tanto,
el resultado es significativo para un nivel de confianza del 95% ( ), pero no lo es para un nivel de
confianza del 99% ( )

14- Con los datos de la investigación de Esnaola y Revuelta en la escala de auto-concepto físico, el índice “d” de
Cohen para analizar el tamaño del efecto vale, aproximadamente: A) 0,55; B) 0,28; C) 0,64.

|̅ ̅|

( )̂ ( )̂ √

15- La importancia o relevancia práctica de la diferencia entre las medias obtenidas por los sujetos activos e inactivos
en la escala de auto-concepto físico se interpreta a partir de: A) la magnitud del estadístico de contraste; B) el
valor del nivel crítico p; C) el estadístico d de Cohen.

16- Si el investigador quiere comprobar que los sujetos activos tienen un auto-concepto general mayor que los
sujetos inactivos, la hipótesis nula a contrastar que formularía es: A) B)
; C)

17- Las pruebas no paramétricas se utilizan en diseños en los que se trabaja con: A) Muestras no representativas de la
población objetivo del estudio; B) Muestras pequeñas o variables que no alcanzan el nivel de medida de
intervalo o razón; C) Variables medidas con escala de intervalo que provienen de poblaciones con distribución
poblacional desconocida.

SITUACIÓN 3. El artículo ”Growth hormone and sex steroid administration in healthy aged women and men” (Journal
of the American Medical Association, 2002, 2282-2292) describe un experimento para evaluar el efecto de cuatro
tratamientos en varias características corporales. En este experimento doble-ciego, 57 mujeres de 65 años o más se
asignaron al azar a uno de los siguientes tratamientos: (1) hormona del desarrollo placebo y esteroide placebo (P+P);
(2) hormona del desarrollo placebo y el esteroide estradiol (P+S); (3) hormona del desarrollo y esteroide placebo
(G+P) y (4) hormona del desarrollo y esteroide estradiol (G+S). Se midió el cambio en la grasa corporal durante un
periodo de 26 semanas después del tratamiento. Los investigadores informaron que el factor manipulado fue
significativo [F(3, 53) = 10,48, MCintra = 1,92]. Utilice un .

18- La hipótesis nula planteada en el estudio es: A) ; B) ; C)


.

19- Los cuatro niveles del factor se manipularon de tal forma que: A) cada sujeto pasó por todas las condiciones; B)
cada sujeto pasó por una única condición; C) todos los sujetos recibían algún tratamiento diferente del placebo.

20- La suma de cuadrados inter-sujetos fue igual a: A) 60,36; B) 101,76; C) 162,12

-3-
En la siguiente tabla de ANOVA se representan en negrita los valores proporcionados por el enunciado, de los que
fácilmente deducimos el resto.

FV SC g.l. MC F
Inter 3
Intra 53 1,92 10,48
Total 56

21- El cociente obtenido entre la media cuadrática inter-sujetos y la media cuadrática intra-sujetos, indica que: A) no
pudo rechazarse la hipótesis nula; B) el cambio medio en la grasa corporal es el mismo para los cuatro
tratamientos; C) el factor manipulado resultó significativo.

22- La Suma de Cuadrados inter-sujetos representa: A) la suma de las desviaciones al cuadrado de cada una de las
puntuaciones en relación a la media global; B) la variabilidad medida de forma separada dentro de cada muestra
y luego combinándola para todas las muestras; C) la variabilidad que puede explicarse, en cierto grado, por las
diferencias entre las medias de cada condición en relación a la media global.

23- El valor F obtenido en una Tabla del Anova es: A) el cociente entre dos estimaciones insesgadas de las varianzas
poblacionales; B) el resultado de dividir la Suma de Cuadrados entre-sujetos y sus grados de libertad; C) una
distribución de probabilidad.

24- El experimento es de efectos fijos porque: A) las cuatro condiciones utilizadas se han extraído al azar de entre
todas las condiciones posibles; B) solo interesan las cuatro condiciones manipuladas; C) en cada condición se
han mantenido fijas las condiciones durante todo el experimento.

25- Asumiendo la siguiente ordenación P+P, P+S, G+P, G+S, de las condiciones, si los investigadores hubiesen deseado
poner a prueba la existencia de diferencias entre el grupo bajo la condición (P+P) y el grupo bajo la condición
(G+S), los coeficientes que necesitaría utilizar en el contraste, son: A) (1, 0, 0, -1); B) (½, 0, ½, -1) ; C) (2, 0, 0, -1).

-4-
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS
Enero/febrero 2014. Código asignatura: 62012054
MODELO A DURACION: 2 HORAS
Material: Formulario, Tablas y calculadora no programable
Calificación= (0,4 x Aciertos) - (0,2 x Errores)

No debe entregar los enunciados

SITUACIÓN 1. Un psicólogo educacional interesado en estudiar el estilo educativo utilizado por los padres,
dispone de una muestra de 200 familias, observando que 40 de ellas aplican un estilo autoritario que prioriza
el cumplimiento de las normas, 100 emplean un estilo equilibrado, que a pesar de mantener valores altos en
exigencias y control, adapta las estrategias educativas a cada situación concreta, y el resto de las familias
utilizan un estilo permisivo, con poca consistencia en las normas y un elevado grado de sobreprotección.
Nivel de confianza 95%.

1- El error típico para la proporción de familias que utilizan un estilo permisivo, es: A) 0,05; B) 0,0324; C) 0,01.

La proporción de familias que utilizan un sistema permisivo es: , luego:

( )
√ √

2- A partir de los datos obtenidos en la muestra, la proporción poblacional de familias que utilizan un sistema
permisivo es un valor comprendido entre: A) 0,2164; 0,3836; B) 0,2365; 0,3635; C) 0,1934; 0,4066

3- Si el psicólogo quiere comprobar que la proporción de familias que utilizan un sistema permisivo es distinta
de 0,25, ¿Cuál es la hipótesis nula? A) ; B) )

Las hipótesis que se han de plantear son:

4- El psicólogo quiere comprobar que la proporción de familias que utilizan un sistema permisivo es distinta de
0,25. La conclusión a la que llega es: A) mantener la hipótesis nula; B) rechazar la hipótesis nula; C) rechazar
la hipótesis nula porque la proporción en la muestra se aleja mucho de la proporción postulada por la
hipótesis nula.

Para comprobar esta hipótesis el estadístico de contraste es:

-1-
√ ( ) √

Dado que el estadístico de contrate se encuentra entre los valores críticos, , se


mantiene la hipótesis nula.

5- El psicólogo quiere comprobar que la proporción de familias que utilizan un sistema equilibrado es distinta
de 0,5. Con los datos de la muestra, la conclusión a la que llega es: A) rechazar la hipótesis nula; B) mantener
la hipótesis nula; C) no puede llegar a una conclusión, porque el estadístico de contraste es igual a cero.

Las hipótesis a plantear son:

La proporción de familias que utilizan un sistema equilibrado es: , luego no sería ni siquiera
necesario realizar el contraste de hipótesis, dado que la proporción de la muestra es igual que la hipótesis
nula. Efectivamente:

√ ( ) √

6- Si el psicólogo quiere comprobar que la proporción de familias que utilizan un sistema equilibrado es distinta
de 0,5 ¿Cuál es el nivel crítico?: A) uno; B) cero; C) no se puede calcular.

La distribución normal tipificada tiene por media cero, luego la probabilidad de obtener un valor más
extremo es 0,5, y como el contraste es bilateral, multiplicamos por dos esta probabilidad.

7- Al aumentar el tamaño de la muestra, el intervalo de confianza: A) permanece inalterado; B) es más ancho;


C) es más estrecho.

8- Suponiendo que es cierta, ¿Cuál de las siguientes probabilidades está asociada al estadístico de
contraste?: A) la probabilidad de rechazarla; B) la probabilidad de encontrar valores más extremos que el
valor crítico; C) la probabilidad de encontrar valores iguales a los obtenidos en la muestra, o más
extremos.

SITUACIÓN 2. “El Programa Internacional para la Evaluación de la Competencia de los Adultos del 2013
(PIAAC, por su sigla en Inglés) sitúa a España en los últimos puestos entre los países de la OCDE, solo por
encima de Italia, en comprensión lectora. Los españoles examinados de entre 15 y 65 años obtuvieron en
comprensión lectora una media igual a 252 puntos, 21 por debajo de la media de la OCDE y 19 por debajo de
la media de la UE. Entre sus conclusiones destaca la estrecha relación entre los niveles de comprensión
lectora de los adultos y sus posibilidades de encontrar trabajo”. Imagine que, ante estos resultados, usted
desea corroborar si el nivel de comprensión lectora de los jóvenes con empleo es significativamente mayor
que la de los jóvenes desempleados. Para ello, selecciona una muestra de 182 jóvenes de su localidad con

-2-
edades comprendidas entre 25 y 34 años, de los que el 33,5% están en situación de desempleo, y les aplica
la misma prueba. La media y desviación típica insesgada de los desempleados es de 251 y 115,
respectivamente, frente a 289 y 92 de los que tienen empleo. Establezca un nivel de significación de 0,05.

Los datos del problema son:


España OCDE UE

Media 252 252 + 21 = 273 252 + 19 = 271

Para la muestra en la localidad del investigador:


Cuasidesviación
Media n
típica

Con empleo

Desempleados 251 115

9- En función de sus objetivos, ¿cuál de las siguientes hipótesis está correctamente formulada?: A)
B) C)

10- El estadístico de contraste para comprobar si las dos muestras provienen de poblaciones con la misma
varianza es: A) 1,562; B) 1,391; C) 2,031.

̂
̂

11- El nivel crítico que corresponde al estadístico de contraste sobre la igualdad de las varianzas poblacionales
es: A) p < 0,01; B) p < 0,0025; C) p < 0,05.
En la distribución F con y grados de libertad figuran los valores 1,53 que deja
por debajo una probabilidad de 0,975 (y por encima de 0,025) y el valor 1,656 que deja por debajo una
probabilidad de 0,99 y por encima de 0,01.

-3-
Dado que el contraste es bilateral, hay que multiplicar por dos las probabilidades obtenidas en las tablas,
luego, finalmente:

12- El análisis de datos que utilizará en su estudio es el que corresponde a: A) una muestra con varianza
poblacional desconocida; B) dos muestras independientes extraídas de dos poblaciones con la misma
varianza; C) dos muestras independientes extraídas de dos poblaciones con varianzas distintas.

13- El error típico de la distribución muestral de la diferencia de medias es: A) 17,8; B) 15,74; C) 16,94.
Habiendo rechazado la de igualdad de varianzas, el error típico de la distribución muestral, es:

̂ ̂
̅ ̅ √ √

14- El valor absoluto del estadístico de contraste y el nivel crítico p para tomar una decisión respecto a su Ho,
son, aproximadamente: A) 2,24 (p > 0,05); B) 2,41 (p < 0,005); C) 2,24 (p < 0,025).
La distribución muestral de la diferencia de medias en muestras extraídas de poblaciones con varianzas
distintas es la distribución t de Student:
(̅ ̅) ( ) ( )
̅ ̅

Los grados de libertad, aplicando la corrección de Welch, son:

̂ ̂
( ) ( )

̂ ̂ ( ⁄ ) ( ⁄ )
( ⁄ ) ( ⁄ )

En la distribución t con 100 gl (los más próximos a 99), el estadístico se encuentra entre los valores
1,984 y 2,364 que dejan por encima una probabilidad de 0,025 y 0,01, respectivamente. Por tanto, al valor
le corresponde un nivel mayor que 0,01 y menor que 0,025.

15- Si quiere contrastar la hipótesis de que la proporción de empleados entre los jóvenes de su localidad supera
en más de quince puntos porcentuales a la proporción de desempleados, el estadístico de contraste es, en
valor absoluto: A) 2,43; B) 4,22; C) 3,47.

( ) ( ) ( ) ( )
√ √

( ) ( )

16- Si optase por utilizar muestras más grandes y suponiendo que se mantienen los mismos estadísticos
obtenidos en estas muestras, ¿cuál de las siguientes consecuencias se producirían?: A) aumentaría el

-4-
tamaño del efecto; B) aumentaría la probabilidad de rechazar la hipótesis nula; C) disminuiría la potencia
del contraste.

SITUACIÓN 3. En un estudio de Psiconeuroinmunología, se investigó si suplementar la dieta con ácidos


Omega-3 tenía efectos beneficiosos en las personas que ya disfrutaban de una dieta equilibrada (Daruna, J.
H., 2004). Como se sospechaba que la edad podría afectar a los resultados, se escogieron dos grupos de
adultos y dos grupos de personas mayores. En cada edad, la mitad de las personas sirvieron de control (no se
les proporcionaba Omega-3) y la otra mitad tomaba una cápsula de aceite Omega-3 tres veces al día durante
2 meses. El total de sujetos fueron 64 y el diseño fue equilibrado. Se realizó un ANOVA con dos factores
(Edad y Grupo) utilizando como variable dependiente la diferencia en la concentración en sangre de la
proteína c-reactiva (CRP) antes y después de aplicar el tratamiento [CRPantes – CRPdespués] (también para el
grupo control). Los resultados indicaron que sólo la interacción entre los factores fue significativa (F(1; 60) =
7,302, MCS/AB = 0,321, p < 0,05) mientras que las Fs de Edad (1,802) y del Grupo (1,390) no lo fueron.

En primer lugar, completamos la tabla de ANOVA con los datos del enunciado (en rojo y negrita):
FV SC gl MC F
A (Edad) 0,578 1 0,578 1,802
B (Grupo) 0,446 1 0,446 1,390
AxB 2,344 1 2,344 7,302
Intra 19,26 60 0,321
Total 22,629 63

17- Como tenemos un diseño equilibrado, esto significa que: A) los niveles elegidos son los únicos que nos
interesan; B) el número de sujetos en cada combinación de Edad y Grupo es de 16; C) los niveles elegidos
se han escogido al azar de entre todos los posibles.

Son 64 personas las que forman parte del experimento, como tenemos cuatro combinaciones de
tratamientos, en cada una de ellas hay 16 personas.

18- El número de razones básicas que tenemos que calcular en este diseño, para realizar la tabla de ANOVA, son:
A) 2; B) 4; C) 5.

Las razones básicas que hay que calcular son: [A], [B], [AB], [Y] y [T]

19- Si asumimos que una mayor CRP indica un mejor sistema inmune, y que tomar Omega-3 aumenta la
concentración de proteína c-reactiva entonces: A) no pueden producirse puntuaciones negativas en la
variable dependiente; B) según H0, las puntuaciones de la variable dependiente fluctuarán alrededor de la
unidad; C) para los sujetos que toman Omega-3, la mayor parte de las puntuaciones en la variable
dependiente serán negativas.

20- La H1 para el factor Grupo (control vs. experimental) es: A) ; B)


; C) .

-5-
21- Los grados de libertad de la F para el factor Edad serán: A) (1, 60); B) (2, 60) C) 60.

22- El valor de la SC de los sujetos dentro de los tratamientos (S/AB o, lo que es lo mismo, del error) es
(aproximadamente): A) 19,26; B) 2,34; C) 0,321.

23- El valor de la SCtotal es aproximadamente: A) 22,63; B) 19,26; C) 41,89.

24- Como la interacción resultó significativa, se aplicó un test de efectos simples. Los resultados indicaron que
sólo las personas mayores que tomaron Omega-3 obtuvieron puntuaciones menores en la variable
dependiente respecto a los otros tres grupos. Esto significa que: A) sólo los jóvenes se beneficiaron de tomar
Omega -3; B) suplementar una dieta ya de por sí equilibrada es beneficioso para las personas mayores; C)
tomar Omega -3 no es beneficioso ni para jóvenes ni para mayores.

25- En esta situación deberíamos realizar el análisis de los efectos simples considerando: A) dos fuentes de
variación; B) cuatro fuentes de variación; C) tres fuentes de variación.

-6-
DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS
Enero/febrero 2014. MODELO C
Calificación= (0,4 x Aciertos) - (0,2 x Errores)

SITUACIÓN 1. “PIAAC (Programme for International Assessment of Adult Skills) es un estudio internacional
que mide las destrezas cognitivas básicas que permite a las personas adultas participar en la vida social y
económica del siglo XXI y también las habilidades laborales básicas que exige su puesto de trabajo. En su
último estudio realizado en el año 2013 comparando los resultados de 23 países de la OCDE muestra que los
adultos españoles de entre 16 y 65 obtuvieron en matemáticas el último puesto, con una media de 246
puntos, 23 por debajo de la media de la OCDE y 22 por debajo de la media de la UE. Entre sus conclusiones
destaca que los jóvenes españoles puntúan mucho más alto que los mayores y están más cerca de la media
de la OCDE y que la tasa de paro de los españoles con competencias matemáticas en los niveles inferiores es
tres veces superior de la que están en los niveles superiores”. Imagine que usted aplica la misma prueba a una
muestra representativa de 121 jóvenes de su localidad con edades comprendidas entre 16 y 34 años
obteniendo una media de 252 puntos con una desviación típica insesgada de 77 puntos, siendo la proporción
de jóvenes desempleados del 28,5%.
Datos del enunciado:
España OCDE UE Sus datos
Media 246 269 268 252
Cuasi-desvTipica 77
Tamaño muestra 121

1- Utilizando los datos de su estudio y con un nivel de confianza del 95%, el intervalo de confianza de la media
de la población de los jóvenes españoles en competencias matemáticas: A) no se puede calcular porque
desconocemos el tamaño de la muestra general; B) es un valor comprendido entre 238,3 y 265,7; C) es un
valor comprendido entre 240,5 y 263,5.


√ √

̅ {

2- Si su interés es comprobar que la media de los jóvenes españoles es significativamente inferior que la media
general de los adultos de la UE, la hipótesis nula a contrastar es: A) B) C)
.

Las hipótesis que se han de plantear son:

-1-
3- El estadístico de contraste para comprobar que la media de los jóvenes españoles es inferior a la media
general de los adultos de la UE es: A) 2,6; B) – 2,678 C) -2,29.

̅ ̅
̅
⁄ ⁄
√ √

4- El nivel crítico p asociado al estadístico de contraste para comprobar que la media de los jóvenes españoles
es inferior a la media general de los adultos de la OCDE es: A) p=0,0110; B) p=0,0220; C) p<0,01.

̅ ̅
̅
⁄ ⁄
√ √

Dado que trabajamos con más de 100 grados de libertad, acudimos a la tabla de curva normal, observando
que el nivel crítico es aproximadamente: p = 0,0075.

5- Un nivel crítico p = 0,0254 asociado a un estadístico de contraste indica que: A) la probabilidad de que la Ho
sea verdadera vale 0,0254; B) no podemos rechazar la Ho con un nivel de confianza del 99%; C) el error de
aceptar una hipótesis nula que es verdadera es de 0,0254.

El nivel crítico p representa la probabilidad de que siendo cierta la Ho, encontremos unos datos muestrales
como los obtenidos en nuestra investigación o más extremos. Se utiliza como criterio de decisión respecto a
la Ho de forma que se rechaza la hipótesis nula si p es menor que el nivel de significación y no se rechaza en
caso contrario. Por tanto, al ser el valor de p=0,0254 mayor que el nivel de significación establecido en 0,01,
la respuesta correcta es la B.

6- Con un nivel de confianza del 95%, el error máximo de estimación de la varianza poblacional de los jóvenes
españoles de su localidad es, aproximadamente: A) 2928; B) 1494; C) 19,4.

Al tratarse de una muestra grande, la distribución muestral de la varianza, chi-cuadrado, se aproxima a la


normal, siendo el error máximo de estimación:


√ √

7- A partir de los datos de su estudio, y con un nivel de confianza del 95%, ¿entre que valores estimaría la
proporción jóvenes desempleados en su localidad?: A) 0,179 y 0,391 B) 0,217 y 0,352; C) 0,205 y 0,365.

( ) ( )

√ √

-2-
8- Si queremos estimar la varianza poblacional con un error máximo de estimación que no supere los 200
puntos, ¿cuál debería ser, aproximadamente, el tamaño de la muestra que deberíamos utilizar con un nivel
de confianza del 95%?: A) 11388; B) 6752; C) 5673.

SITUACIÓN 2. En una muestra de 64 mujeres que fueron sometidas a mastectomía se midió la autoestima
mediante la escala de Rosenberg, obteniéndose una media igual a 22 puntos y una cuasivarianza igual a 56.
Tras un tratamiento psicológico sobre manejo de estrés y habilidades de afrontamiento personal, se observa
la misma variabilidad (cuasivarianza igual a 56), siendo ahora la puntuación media en autoestima igual a 27
puntos. La cuasivarianza de las diferencias entre las puntuaciones “antes” y “después” del tratamiento fue
igual a 100. Por otro lado, en otra muestra de 64 mujeres, que no han sido sometidas a ninguna
intervención quirúrgica y que presentan unas características similares a las de la muestra anterior en las
variables edad, estado civil, profesión y nivel de estudios, la media en la escala de autoestima de Rosenberg
fue igual a 28,25 con cuasivarianza igual a 44. Con estos datos se pretende dar respuesta a las siguientes
preguntas: 1º) ¿es eficaz el tratamiento psicológico?, es decir ¿logra que las puntuaciones en autoestima se
incrementen después del mismo? 2º) ¿Es inferior la puntuación media en autoestima en la primera muestra
antes del tratamiento respecto de la puntuación media de la segunda muestra? 3º) ¿Es igual la media en
autoestima en la primera muestra después del tratamiento, respecto a la puntuación media de la segunda
muestra? Nivel de confianza 99%.

Los datos del enunciado son:

Media Cuasivarianza n

Muestra 1 ̅ ̅ ̂ ̂ 64 ̂

Muestra 2 ̅ ̂ 64

Sobre la primera pregunta, conteste a las siguientes cuestiones:

9- La hipótesis nula es: A) ; B) ; C)

Las hipótesis que se han de plantear son:

10- El valor absoluto del estadístico de contraste es: A) 2,39; B) 2,66; C) 4.

11- La probabilidad de encontrar un valor igual o más extremo que el estadístico de contraste es: A) menor que
0,005; B) 0,01; C) 0,05.

-3-
Consultando la tabla t de Student para 60 grados libertad (los más próximos a: n – 1 = 63), observamos que
el estadístico de contraste es más extremo que la puntuación -2,66, por lo que la respuesta es A.

12- A partir de los resultados obtenidos en el estudio podríamos decir que: A) el tratamiento psicológico no es
eficaz; B) el tratamiento psicológico es eficaz; C) se debería incrementar el tamaño de la muestra porque el
tamaño del efecto no es muy elevado.

Sobre la segunda pregunta, conteste a las siguientes cuestiones:

13- El valor absoluto del estadístico de contraste es igual a: A) 2,33; B) 2,56; C) 5.

√ ( )

14- Los resultados obtenidos indican que la media en autoestima en la primera muestra antes del tratamiento
es: A) inferior a la media en autoestima de la segunda muestra; B) superior a la media en autoestima de la
segunda muestra; C) inferior a la media en autoestima de la segunda muestra a un nivel de confianza del
95%, pero no a un nivel de confianza del 99%.

Sobre la tercera pregunta, conteste a las siguientes cuestiones:

15- El valor absoluto del estadístico de contraste es igual a: A) 1; B) 3; C) 5.

√ ( )

16- Los resultados indican que la media en autoestima de la primera muestra después del tratamiento es: A)
menor que la media en autoestima de la segunda muestra; B) igual que la media en autoestima de la
segunda muestra; C) distinta de la media en autoestima de la segunda muestra

SITUACIÓN 3. El artículo “¿Cómo comen hombres y mujeres después de la exposición a información textual e
imágenes de cuerpos ideales?” (Communication Research, 2006, 507-529) describe un experimento en el que
74 varones fueron asignados al azar a uno de cuatro tratamientos: 1) visionado de hombres musculosos y en
forma; 2) visionado de hombres musculosos y en forma acompañados por información textual relacionada
con la dieta y el ejercicio físico; 3) visionado de hombres musculosos y en forma acompañados por
información textual no relacionada con la dieta y el ejercicio físico; 4) a un cuarto grupo (control) no se les
presentó nada. Posteriormente los participantes fueron enviados a otra sala para completar un cuestionario.
En esta sala había cuencos con galletas (pretzels) que el participante podía comer a voluntad. Un ayudante
de investigación registró cuantas galletas consumió cada participante mientras completaba el cuestionario.
El investigador informó que el efecto del tratamiento sobre el consumo de galletas fue significativo [F(3, 70)
= 5’273, MCe = 10’264, p = 0’002].

-4-
Con los datos del enunciado (rojo y negrita en la tabla) completamos la tabla de ANOVA.

FV SC gl MC F
Inter 162,366 3 54,122 5,273
Intra 718,480 70 10,264
Total 880,846 74 - 1 = 73

17- La hipótesis que se pone a prueba en este análisis es que: A) la varianza poblacional de la variable
dependiente es igual en los 4 grupos; B) la media poblacional de la variable dependiente es idéntica en los
4 grupos; C) que la homocedasticidad se cumple en estos datos.

18- Un supuesto necesario para poder llevar a cabo el análisis de los datos de este experimento es que: A) la
hipótesis nula debe ser siempre bilateral; B) la variable dependiente tiene que ser continua; C) la escala de
medida debe ser de intervalo o razón.

19- Si hubiésemos aplicado pruebas T de Student para grupos independientes, deberíamos haber realizado: A)
un ANOVA; B) una regresión lineal; C) 6 tests.

20- Nos encontramos ante un modelo de efectos: A) equilibrados; B) fijos; C) aleatorios.

21- El estimador de la varianza intergrupos vale, aproximadamente: A) 718,515; B) 10,264; C) 54,121.

22- El valor de la F crítica para un Nivel de Confianza del 99% es: A) igual a 4,126; B) menor que 4,126; C) al ser
un contraste bilateral, mayor que 4,729.

El valor más aproximado que podemos consultar en las tablas es para 1 y 60 grados de libertad, que es igual
a 4,126. Como los grados de libertad del denominador (73) son mayores que 60, el valor crítico será menor
que 4,126

23- La suma de cuadrados total vale, aproximadamente: A) 718,48; B) 54,12; C) 880,85.

24- Si el investigador quisiera comparar los tres primeros niveles vs el nivel del grupo de control debería utilizar
un vector de coeficientes igual a: A) ( ); B) ( ); C) ( ).

25- El cálculo de la interacción entre el consumo de galletas y el tratamiento: A) tiene los mismos grados de
libertad que el efecto del tratamiento; B) tiene la misma media cuadrática del error que el efecto del
tratamiento; C) no tiene sentido.

-5-
Modelo A. Septiembre 2014. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y cualquier tipo de calculadora
en la que no se pueda introducir texto

SITUACIÓN 1: “Uno de los componentes de la crianza es la consistencia interparental, es decir, el grado de


coincidencia o similitud que padres y madres muestran en las diferentes prácticas educativas”. En un estudio
realizado por Rodríguez, Del Barrio y Carrasco (2009) se analizan las manifestaciones emocionales de los
hijos en relación con la inconsistencia interparental, mostrando que los hijos procedentes de hogares
inconsistentes manifiestan más conductas depresivas que los hijos de hogares consistentes. Imagine que un
investigador utiliza una muestra de 120 jóvenes de entre 8 y 17 años. El porcentaje de jóvenes que proceden
de hogares inconsistentes fue del 34,17%, a los que se aplicó un cuestionario de depresión, obteniéndose
una media de 4,3 y desviación típica 3,5. Por investigaciones anteriores se sabe que la media y desviación
típica de los hijos procedentes de hogares inconsistentes es de 4,9 y 3,2, respectivamente.

1. El error típico de la media representa: A) la máxima diferencia que cabe esperar por simple azar entre la
media obtenida en la muestra y la media de la población formulada en la 𝐻0 ; B) la desviación típica de la
distribución muestral de la media; C) el error que se comete al estimar la media poblacional a partir de
la media de la muestra.

2. Utilizando únicamente los datos de la muestra y fijando un nivel de confianza del 95%, el intervalo de
confianza en el que estimamos que se encontrará la media del cuestionario de depresión para la
población de jóvenes de familias inconsistentes es un valor comprendido entre: A) 3,21; 5,38; B) 3,65;
4,95; C) 3,18; 5,42.

La distribución muestral de la diferencia de medias que provienen de poblaciones con varianzas


desconocidas es la distribución t de Student con n-1 gl. Sobre una muestra de 120 sujetos, el 34,17%
(n=41) provienen de familias inconsistentes. Conocemos la media de la muestra y su desviación típica.

𝑆𝑛 3,5 3,18
𝐼𝐶 = 𝑌̅ ± 𝐸𝑚𝑎𝑥 = 𝑌̅ ± 𝑡1−𝛼⁄2 = 4,3 ± 2,021 →{
√𝑛 − 1 √41 − 1 5,418

3. Con un nivel de confianza del 99%, el intervalo de confianza de la proporción de hijos provenientes de
familias inconsistentes, es: A) 0,231; 0,453; B) 0,196; 0,487; C) 0,151; 0,533.

𝑝 (1 − 𝑝) 0,3417 (1 − 0,3417) 0,230


𝑝 ± 𝑍1−𝛼⁄2 √ = 0,3417 ± 2,58√ →{
𝑛 120
0,453

4. Si el investigador desea contrastar la hipótesis de que la varianza del cuestionario de depresión para la
población de jóvenes que provienen de familias inconsistentes es significativamente distinto del
obtenido en las investigaciones anteriores, el estadístico de contraste que obtendría es: A) 34,27; B)
49,05; C) 20,55.
2
𝑛 𝑆𝑛2 41 ∙ 3,52
𝑋 = 2 = = 49,048
𝜎𝑜 3,22

5. El nivel crítico p asociado al estadístico de contraste de la varianza poblacional es: A) 𝒑 > 𝟎, 𝟎𝟓; B)
𝑝 < 0,01; C) 𝑝 < 0,05.

En la distribución chi-cuadrado con 40 gl, el valor 49,047 se encuentra entre los valores 29,05 y 51,805
que dejan por debajo probabilidades de 0,1 y 0,9. Por tanto, la probabilidad de encontrar valores tan
extremos o más que 49,047 es, para un contraste bilateral, mayor de 0,05 (el nivel de significación más
alto que suele utilizarse en la investigación psicológica).

6. A la luz de estos resultados el investigador concluye que, la varianza del cuestionario de depresión para
la población de su investigación: A) No difiere significativamente del obtenido en investigaciones
anteriores ( 𝒑 > 𝟎, 𝟎𝟓 ); B) Difiere significativamente del obtenido en investigaciones anteriores
(𝑝 < 0,01); C) Difiere significativamente con un nivel de confianza del 95%.

7. El máximo error que el investigador está dispuesto a admitir para rechazar una hipótesis nula que es
verdadera, recibe el nombre de: A) Potencia del contraste; B) Error tipo II; C) Nivel de significación.

8. A medida que aumenta el tamaño de la muestra, aumenta también: A) La potencia del contraste; B) La
amplitud del intervalo de confianza; C) El error tipo II.
SITUACIÓN 2: “Uno de los componentes de la crianza es la consistencia interparental, es decir, el grado de
coincidencia o similitud que padres y madres muestran en las diferentes prácticas educativas”. En un estudio
realizado por Rodríguez, Del Barrio y Carrasco (2009) se analizan las manifestaciones emocionales de los
hijos en relación con la inconsistencia interparental, mostrando que los hijos procedentes de hogares
inconsistentes manifiestan más conductas depresivas que los hijos de hogares consistentes. Un investigador
que desea replicar estas conclusiones, utiliza una muestra aleatoria de 120 jóvenes de los que los que el 35%
provienen de hogares inconsistentes (Grupo 1) frente al resto que provienen de hogares consistentes (Grupo
2). Todos los sujetos responden a un cuestionario para medir respuestas emocionales de agresividad. Las
medias y cuasi-desviaciones típicas del grupo 1 son 11,9 y 3,2 y para el grupo 2 son 10,7 y 2,9
respectivamente.

9. El diseño que utiliza el investigador es: A) De dos muestras independientes; B) De dos muestras
relacionadas; C) Intrasujetos pre-test post-test.

10. Para contrastar si las muestras provienen de poblaciones con la misma varianza, aplicaría la prueba: A) t
de Student porque se desconocen las varianzas poblacionales; B) F de Snedecor; C) Chi-cuadrado para
muestras independientes.

11. El estadístico de contraste sobre la igualdad de varianzas vale, aproximadamente: A) 1,49; B) 1,22; C)
0,92.

𝑆̂𝐺1
2
3,22
𝐹= 2 = = 1,217
𝑆̂𝐺2 2,92

12. Con un nivel de confianza del 99%, el valor crítico superior más aproximado que podemos encontrar en
las tablas para rechazar la 𝐻0 de igualdad de las varianzas poblacionales en un contraste bilateral, es: A)
2,079; B) 1,936; C) 1,744.

Si el investigador quiere comprobar que la respuesta emocional de agresividad en los jóvenes de familias
inconsistentes es mayor que la de jóvenes de familias consistentes.

13. La hipótesis nula que formula es: A) H0 : μG1 > μG2 ; B) H0 : μG1 − μG2 ≥ O; C) 𝐇𝟎 : 𝛍𝐆𝟐 ≥ 𝛍𝐆𝟏

14. Asumiendo que se cumple el supuesto de igualdad de varianzas, el estadístico de contraste que obtiene,
es: A) 2,08; B) -3,21; C) 0,39.
(𝑌̅𝑔1 − 𝑌̅𝑔2 ) − (𝜇𝑔1 − 𝜇𝑔2 ) (11,9 − 10,7) − 0
𝑇= = = 2,08
2 2
(𝑛 − 1)𝑆̂12 + (𝑛𝑔2 − 1)𝑆̂22 1 1 √(42 − 1)3,2 + (78 − 1)2,9 ( 1 + 1 )
√ 𝑔1 ( + ) 42 + 78 − 2 42 78
𝑛𝑔1 + 𝑛𝑔2 − 2 𝑛𝑔1 𝑛𝑔2

15. El nivel crítico p asociado al estadístico de contraste es: A) 𝑝 > 0,05; B) 𝑝 < 0,01; C) 𝒑 < 𝟎, 𝟎𝟓.

16. Con los resultados obtenidos, el investigador concluye que: La respuesta emocional de agresividad en los
jóvenes de familias inconsistentes….: A) no difiere de la de jóvenes de familias consistentes; B) es
significativamente mayor que la de los jóvenes de familias consistentes (𝑝 < 0,01); C) es
significativamente mayor que la de los jóvenes de familias consistentes (𝒑 < 𝟎, 𝟎𝟓).

SITUACIÓN 3: En un estudio publicado por García, Navas, Cuadrado, y Molero (2003) con el título:
"Inmigración y prejuicio: Actitudes de una muestra de adolescentes almerienses" se analiza la imagen que los
adolescentes de una zona, con alta recepción de trabajadores extranjeros, tienen acerca de los inmigrantes.
Entre sus resultados se indica que existen diferencias significativas en la imagen de los inmigrantes en
función del sexo y de la edad de los adolescentes, siendo más bajas para las chicas y para los de mayor edad.
Imagine que desea comprobar si estas diferencias existen también en otras zonas donde la recepción de
inmigrantes es menor. Para ello, selecciona una muestra de 20 adolescentes con edades comprendidas entre
14 y 16 años de los que el 50% son chicas. La mitad son de 2º de la ESO y el resto de 4º de la ESO. Todos ellos
responden a la Escala de Racismo Moderno de McConahay y cols. (1981). Se asume que los datos cumplen
los supuestos necesarios para realizar el análisis estadístico correspondiente. Representando por A la
variable sexo y por B la variable edad se obtienen los siguientes resultados parciales: 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 70,55;
𝑀𝐶𝐼𝑛𝑡𝑟𝑎 = 1,525; [𝑌] = 1303; [𝐴] = 1240,9; [𝐵] = 1243,7.
Se trata de una ANOVA de dos factores (sexo y edad) con dos niveles en cada factor. Hay 10 chicas, 5 de 2º y
otras 5 de 4º de la ESO. Y los mismo para los chicos, por lo que se trata de un diseño equilibrado con 5 sujetos
en cada nivel del factor. Con los datos del enunciado vamos completando la siguiente tabla del ANOVA:

FV SC GL MC F F CRIT P
A (SEXO) a-1= 1
B (EDAD) b-1= 1
AB (a-1)(b-1)=1
ERROR 16x1,525= 24,40 ab(n-1)= 16 1,525
TOTAL 70,55 n-1= 19

𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = [𝑌] − [𝑇] → 70,55 = 1303 − [𝑇] → [𝑇] = 1303 − 70,55 = 1232,45

𝑆𝐶𝑖𝑛𝑡𝑟𝑎 𝑆𝐶𝑖𝑛𝑡𝑟𝑎
𝑀𝐶𝐼𝑛𝑡𝑟𝑎 = → 1,525 = → 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 1,525 ∙ 16 = 24,40
𝑎𝑏(𝑛 − 1) 16

𝑆𝐶𝐴 = [𝐴] − [𝑇] = 1240 − 1232,45 = 8,45

𝑆𝐶𝐵 = [𝐵] − [𝑇] = 1243,7 − 1232,45 = 11,25

𝑆𝐶𝐴𝐵 = 𝑆𝐶𝑇 − (𝑆𝐶𝐴 + 𝑆𝐶𝐵 + 𝑆𝐶𝐸𝑟𝑟𝑜𝑟 ) = 70,55 − (8,45 + 11,25 + 24,49) = 26,45

FV SC GL MC F F CRIT (95%) P
A (SEXO) 8,45 1 8,45 5,5409 4,4939 0,03169
B (EDAD) 11,25 1 11,25 7,377 4,4939 0,01526
AB 26,45 1 26,45 17,3442 4,4939 0,00073
ERROR 24,40 16 1,525
TOTAL 70,55 19

17. ¿Cuál o cuáles son las variables independientes?: A) el sexo y la edad; B) los datos registrados con la
Escala de Racismo Moderno; C) solo la edad.

18. El diseño de este trabajo es: A) de dos grupos independientes; B) factorial 2x2 efectos fijos; C) ANOVA
mixto de dos factores de efectos aleatorios.

19. Sin considerar las condiciones y supuestos que, según el enunciado, cumplen los datos, ¿Cuántos
contrastes de hipótesis formularía en su trabajo?: A) Una; B) Dos; C) Tres.

20. Con los datos obtenidos, el estadístico de contraste para analizar si la imagen de los inmigrantes es la
misma para los jóvenes de 2º y 4º de la ESO, es: A) 5,54; B) 7,38; C) 4,49.

21. Con los datos obtenidos, el estadístico de contraste para analizar si la imagen de los inmigrantes es la
misma para los chicos que para las chicas, es: A) 5,541; B) 7,38; C) 4,49.
22. Con un nivel de confianza del 95%, el valor crítico para tomar una decisión respecto a si la edad genera
diferencias en las puntuaciones en la escala de racismo, es: A) 5,54; B) 7,38; C) 4,49.

23. El nivel crítico p asociado al estadístico de contraste para tomar una decisión respecto a si la edad
genera diferencias en las puntuaciones en la escala de racismo, es: A) 𝑝 < 0,01; B) 𝒑 < 𝟎, 𝟎𝟓; C)
𝑝 > 0,05.

24. El estadístico de contraste para analizar la influencia del sexo para los diferentes niveles de la edad, es:
A) 4,49; B) 5,54; C) 17,34.

25. A partir del análisis de la interacción entre el sexo y la edad, ¿cuál de las siguientes afirmaciones es
correcta?: Con un nivel de confianza del 99% podemos afirmar que la imagen de los inmigrantes para los
chicos y chicas: A) es diferente para los dos grupos de edad; B) es el mismo con independencia de la
edad; C) es el mismo para cada uno de los grupos de edad.
Modelo A. Febrero 2015. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y cualquier tipo de calculadora en
la que no se pueda introducir texto

SITUACIÓN 1. Sandin et al. (2013) investigan sobre la asociación entre la sensibilidad al asco y los
síntomas de hipocondría y ansiedad hacia la salud, obteniendo asociaciones significativas entre la
sensibilidad al asco y los síntomas hipocondríacos. Concluyen, mediante un análisis de regresión
múltiple, que ciertas dimensiones del asco, predicen los síntomas hipocondríacos evaluados 10 meses
después. Emplearon una muestra de 424 estudiantes universitarios, de los cuales 312 eran mujeres; la
media de edad fue de 37,3 años, con una cuasi-desviación típica de 9,1 años. (Nivel de confianza,
95%).

1- La edad media de la población de la que se ha extraído la muestra está comprendida,


aproximadamente, entre los valores:
A) 36,43; 38,17
B) 36,16; 38,44
C) 36,08; 38,54

𝑆𝑛−1 9,1
𝑁𝐶 = 0,95 → 𝑡𝑛−1;1−𝛼⁄2 = 𝑡423;0,975 ≈ 𝑧0,975 = 1,96 𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 1,96 == 0,866
√𝑛 √423

𝑌̅ ± 𝐸𝑚𝑎𝑥 → 37,3 ± 0,866 → (36,43; 38,17)

2- La varianza de la población de la que se ha extraído la muestra, para la variable edad, está


comprendida, aproximadamente, entre los valores:
A) 68 y 97
B) 72 y 94
C) 60 y 106

2 2
𝐸𝑚𝑎𝑥 = 𝑧1−𝛼⁄2 𝑆 2 √ = 1,96 ∙ 9,12 √ = 11,15 𝑆 2 ± 𝐸𝑚𝑎𝑥 → 9,12 ± 11,15 → (72; 94)
𝑛 424

Queremos comprobar si en la población de la que fue extraída la muestra, es igual el número de


hombres y mujeres.

3- La hipótesis nula es:


A) 𝐻0 : 𝜇1 = 𝜇2
B) 𝐻0 : 𝜋 ≠ 0,5
C) 𝑯𝟎 : 𝝅 = 𝟎, 𝟓

La opción A es incorrecta porque plantea la igualdad de dos medias poblacionales. La opción B es


incorrecta porque corresponde a la hipótesis alternativa. La opción A es correcta porque si es igual el
número de hombres y de mujeres en la población: 𝜋𝐻𝑜𝑚𝑏𝑟𝑒𝑠 = 𝜋𝑀𝑢𝑗𝑒𝑟𝑒𝑠 = 0,5

1
4- El valor absoluto del estadístico de contraste vale, aproximadamente:
A) 1,96
B) 9,71
C) 1,64

𝑝 − 𝜋0 0,7358 − 0,5
312 𝑍= = = 9,71
𝑝𝑀𝑢𝑗𝑒𝑟𝑒𝑠 = = 0,7358
424 √𝜋0 (1 − 𝜋0 ) √0,5 ∙ 0,5
𝑛 424

5- Si el número de hombres y mujeres es el mismo en la población, la probabilidad de obtener unos


datos como los observados en la muestra es:
A) 0,01
B) 0,05
C) menor que 0,0004

6- Las curvas de potencia, permiten localizar la potencia de un contraste en función de:


A) el valor de 𝑯𝟏 y el tamaño de la muestra
B) los valores de 𝐻0 y 𝐻1
C) el nivel de significación y la potencia del contraste

7- El intervalo de confianza es más estrecho a medida que:


A) aumenta el tamaño de la muestra
B) aumenta el nivel de confianza
C) aumenta el error típico del estadístico

8- Suponiendo que existieran dos estadísticos insesgados, consistentes y suficientes para estimar la
misma característica poblacional, la mejor elección es utilizar el estadístico:
A) con la desviación típica más pequeña
B) con la desviación típica más grande
C) cualquiera de ellos, dado que ambos gozan de las mismas propiedades.

SITUACIÓN 2. Cuadra-Peralta et al. (2010) estudian la efectividad de la psicoterapia positiva en una


muestra de pacientes diagnosticados con depresión, para lo que utilizan como variable dependiente
el inventario de depresión de Beck (mayor puntuación, mayor depresión).

En una muestra de ocho sujetos miden los síntomas depresivos antes y después de una terapia
basada en la psicología positiva. Antes de la terapia la media en depresión fue igual a 20,50 y la
cuasidesviación típica igual a 7,46, y después de la terapia la media fue de 13,75 y la cuasidesviación
típica igual a 7,53, siendo la cuasivarianza de las diferencias igual a 27,353. Por otro lado, Cuadra-
Peralta et al. (2010) comparan los resultados de estos ocho sujetos después de la terapia con otra
muestra de diez sujetos a los que se aplicó un tipo de terapia tradicional, obteniendo en este caso una
media igual a 18,30 y una cuasidesviación típica igual a 6,46.

Supongamos que estamos interesados en comprobar: 1º) si existen diferencias significativas antes y
después de la terapia basada en la psicología positiva y 2º) si existen diferencias significativas entre la
terapia basada en la psicología positiva y la terapia tradicional. Para ello se decide utilizar contrastes
paramétricos con un nivel de confianza del 95%.
2
(Recuerde que en un contraste sobre dos medias con varianzas desconocidas pero supuestas iguales:
𝑔. 𝑙. = 𝑛1 + 𝑛2 − 2)

Los datos del problema son:

Cuasi des Cuasi Var


n Media
típica diferencias
Antes 20,5 7,46
Psicología positiva 8 27,353
Después 13,75 7,53
Terapia tradicional 10 18,3 6,46

9- El valor absoluto del estadístico de contraste para comprobar si existen diferencias antes y después de
aplicar la terapia basada en la psicología positiva vale, aproximadamente:
A) 3,65
B) 1,849
C) 2,365
𝑌̅1 − 𝑌̅2 20,5 − 13,75
𝑇= = = 3,65
̂2
√𝑆𝑑 √27,353
𝑛 8

10- El valor absoluto del valor crítico para comprobar si existen diferencias antes y después de aplicar la
terapia basada en la psicología positiva vale, aproximadamente:
A) 1,895
B) 2,365
C) 2,998

Buscando en las tablas t de Student para 7 g.l. y NC = 95% en un contraste bilateral, la opción correcta
es B.

11- El nivel crítico para comprobar si existen diferencias antes y después de aplicar la terapia basada en la
psicología positiva vale, aproximadamente:
A) 𝒑 < 𝟎, 𝟎𝟏
B) 𝑝 > 0,01
C) 𝑝 = 0,01

12- Suponiendo varianzas homogéneas, el valor absoluto del estadístico de contraste para comprobar si
existen diferencias entre las dos terapias aplicadas vale, aproximadamente:
A) 3,65
B) 3,29
C) 1,38

3
𝑌̅1 − 𝑌̅2 13,75 − 18,3
𝑇= = = −1,38
2 2
(𝑛 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 1 1 √7 ∙ 7,53 + 9 ∙ 6,46 (1 + 1 )
√ 1 (𝑛 + 𝑛 ) 8 + 10 − 2 8 10
𝑛1 + 𝑛2 − 2 1 2

13- Suponiendo varianzas homogéneas, el valor absoluto del valor crítico para comprobar si existen
diferencias entre las dos terapias aplicadas vale, aproximadamente:
A) 2,583
B) 1,746
C) 2,120

Para un contraste bilateral y 16 g.l. con un nivel de confianza del 95%, la opción correcta es C.

14- Suponiendo varianzas homogéneas, y con el objetivo de comparar la magnitud de las diferencias
entre las dos terapias aplicadas, el tamaño del efecto vale aproximadamente:
A) 1,38
B) 0,65
C) 2,12

|𝑌̅1 − 𝑌̅2 | |13,75 − 18,3|


𝑑= = = 0,65
2 2
(𝑛 − 1)𝑆̂12+ (𝑛2 − 1)𝑆̂22 √7 ∙ 7,53 + 9 ∙ 6,46
√ 1 8 + 10 − 2
𝑛1 + 𝑛2 − 2

15- Los resultados obtenidos indican que:


A) la terapia basada en la psicología positiva es eficaz y muestra mejores resultados que la terapia
tradicional
B) la terapia basada en la psicología positiva es eficaz, pero no muestra mejores resultados que la
terapia tradicional
C) la terapia basada en la psicología positiva no es eficaz, siendo preferible la terapia tradicional

16- Para comparar la eficacia de la terapia basada en la psicología positiva con la terapia tradicional:
A) sería recomendable replicar el estudio con una muestra mayor, dado que el tamaño del efecto es
moderado y la muestra pequeña
B) no es necesario realizar más estudios, porque los resultados de Cuadra-Peralta et al. (2010) son
concluyentes
C) no es necesario realizar más estudios porque el tamaño del efecto es muy pequeño.

4
SITUACIÓN 3. Un investigador desea estudiar la relación entre la sensibilidad al Asco y los miedos,
actitudes y creencias asociados a la psicopatología de la hipocondría. Para ello utiliza como variable
independiente la Escala Multidimensional de Sensibilidad al Asco (EMA; Sandín et al., 2013), y como
variable dependiente la Escala de Actitudes hacia la Enfermedad (IAS; Kellner, 1986). Supongamos,
que en una muestra de 102 sujetos se ha obtenido un coeficiente de correlación entre EMA y IAS igual
a 0,6.

17- Para comprobar si el coeficiente de correlación obtenido es significativo, la hipótesis alternativa que
se ha de plantear es:
A) 𝐻1 : 𝜌 ≥ 0
B) 𝑯𝟏 : 𝝆 ≠ 𝟎
C) 𝐻1 : 𝜌 < 0

18- Para comprobar si el coeficiente de correlación obtenido es significativo, el estadístico de contraste


vale, aproximadamente:
A) 7,5
B) -7,5
C) las opciones A y B son correctas.

𝑟𝑥𝑦 √𝑛 − 2 0,6√102 − 2
𝑇= = = 7,5
2
√1 − 𝑟𝑥𝑦 √1 − 0,62

19- Tomando 𝛼 = 0,05, si queremos comprobar si el coeficiente de correlación obtenido es significativo,


el valor absoluto del valor crítico es igual a:
A) 1,66
B) 1,984
C) 2,364

Con 100 g.l., NC = 95% y contraste bilateral, el valor que obtenemos de las tablas t de Student,
coincide con la opción B.

20- Tras realizar el contraste de hipótesis sobre el coeficiente de correlación, el nivel crítico vale,
aproximadamente:
A) 𝑝 = 0,025
B) 𝑝 = 0,05
C) 𝒑 < 𝟎, 𝟎𝟏

21- La proporción de varianza asociada entre EMA e IAS es igual a:


A) 0,64
B) 0,36
C) Faltan datos en el enunciado para calcularla

2
𝑟𝑥𝑦 = 0,62 = 0,36

5
22- Los resultados obtenidos indican que la relación entre EMA e IAS:
A) Es significativa para un nivel de confianza del 99%
B) es significativa a un nivel de confianza del 95%, pero no a un nivel de confianza del 99%
C) no es significativa

23- Si queremos utilizar la escala EMA para predecir las puntuaciones en la escala IAS:
A) No tiene sentido, dado que la relación entre EMA e IAS es muy baja
B) Tiene sentido, porque obtendríamos un estadístico de contraste significativo para la pendiente
de la recta de regresión
C) Faltan datos en el enunciado para comprobar si el estadístico de contrate es significativo

24- En el caso de la regresión lineal simple, el signo del coeficiente de correlación y de la pendiente de la
recta de regresión:
A) son opuestos
B) son independientes
C) son iguales

25- Uno de los supuestos básicos del análisis de regresión simple es:
A) los pronósticos y los errores son independientes
B) las distribuciones condicionadas de los errores deben de tener una distribución uniforme
C) no deben estar relacionadas las variables predictora y la variable dependiente o criterio

6
Modelo C. Febrero 2015. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y cualquier tipo de
calculadora en la que no se pueda introducir texto

SITUACIÓN 1. Valero (1999) aplicó un test de ansiedad ante los exámenes a una amplia muestra de
estudiantes universitarios justo antes de realizar el examen final de la asignatura “X”, obteniendo una
media igual a 55 (a mayor puntuación mayor ansiedad). Para disminuir el nivel de ansiedad antes de los
exámenes, un profesor de la asignatura “X” enseña técnicas de relajación a una muestra aleatoria de 49
alumnos, obteniendo una media en ansiedad antes del examen de la asignatura “X” igual a 50 con una
cuasidesviación típica igual 10 (NC= 99%).

1- La hipótesis nula del profesor es:


A) 𝐻0 = 50
B) 𝑯𝟎 ≥ 𝟓𝟓
C) 𝐻0 ≤ 55

2- El valor del estadístico de contraste es:


A) -3,5
B) -2,403
C) -2,009
𝑌̅ − 𝜇0 50 − 55
𝑇= = = −3,5
𝑆𝑛−1 10
√𝑛 √49

3- El valor crítico es, aproximadamente:


A) -3,5
B) -2,403
C) -2,009

Para 50 g.l. (los más próximos en las tablas a: n = 49 – 1 = 48) y un NC = 99% para un contraste
unilateral, la opción correcta es B.

4- Suponiendo que la relajación no es efectiva para rebajar el nivel de ansiedad antes del examen de la
asignatura “X”, la probabilidad de obtener una media de 50 puntos o inferior con una muestra de 49
alumnos vale:
A) p = 0,01
B) p > 0,05
C) p < 0,005

La puntuación más extrema que podemos consultar en las tablas para 50 g.l. es -2,678, que deja por
debajo una proporción igual a 0,005, luego el nivel crítico es: p < 0,005

1
5- Tras examinar los resultados obtenidos, el profesor concluye:
A) las técnicas de relajación disminuyen la puntuación media en ansiedad ante el examen de la
asignatura “X”
B) las técnicas de relajación no disminuyen la ansiedad ante el examen de la asignatura “X”
C) el profesor ha de tomar una muestra más grande, porque los resultados no son concluyentes

6- La varianza poblacional se encontrará comprendida entre los valores:


A) 67,208 y 148,343
B) 63,030 y 161,580
C) 60,385 y 171,486

2
(𝑛 − 1)𝑆𝑛−1 48 ∙ 102 2
(𝑛 − 1)𝑆𝑛−1 48 ∙ 102
𝑙𝑖 = 2 = = 60,385 𝑙𝑠 = 2 = = 171,486
𝜒𝑛−1;1−𝛼⁄ 79,49 𝜒𝑛−1; 𝛼⁄ 27,9907
2 2

7- El término “error típico” se refiere a:


A) la desviación típica de la distribución muestral del estadístico
B) el error máximo que estamos dispuestos a admitir en un contraste de hipótesis
C) el estimador insesgado de la desviación típica poblacional

8- En un contraste de hipótesis se plantea la siguiente hipótesis nula: 𝐻0 : 𝜇 = 10. Si queremos calcular la


potencia del contraste para una media poblacional igual a 12, la hipótesis alternativa ha de ser:
A) 𝐻1 : 𝜇 > 12
B) 𝐻1 : 𝜇 < 12
C) 𝑯𝟏 : 𝝁 = 𝟏𝟐

9- Al aumentar el tamaño de la muestra:


A) disminuye la probabilidad de rechazar 𝐻0 cierta
B) disminuye la probabilidad de rechazar 𝐻1 cierta
C) disminuyen el error de tipo I y tipo II, por lo que las opciones A y B son correctas.

Al aumentar el tamaño de la muestra, disminuyen tanto la probabilidad de rechazar H0 cierta, como la


probabilidad de rechazar H1 cierta, por lo que las tres alternativas son correctas.

2
SITUACIÓN 2: En un trabajo publicado en la Revista de Psicopatología y Psicología Clínica (Vol 13; Nº 1)
por Sanjuán, P; Pérez-García, A; Rueda, B y Ruiz, M.A (2008) se estudia -en una muestra de mujeres
universitarias- la relación entre el estilo atribucional y los síntomas depresivos, señalando que el estilo
atribucional negativo constituye un factor de vulnerabilidad para desarrollar malestar psicológico o
emociones negativas. Imagine que usted dispone de una muestra de varones a los que pasa el
Cuestionario de Estilo Atribucional y los divide, según la puntuación obtenida, en dos grupos: positivos o
negativos. Posteriormente les administra una Escala de Afecto Negativo (EAN). Los 31 varones clasificados
como positivos obtienen en la Escala EAN una media de 14,5 puntos y desviación típica insesgada de 4,5 y
los 41 varones clasificados como negativos obtienen una media de 17 con una cuasi-desviación típica de
6. Con estos datos, responda a las siguientes preguntas:
(Recuerde que en un contraste sobre dos medias con varianzas desconocidas pero supuestas iguales:
(𝑔. 𝑙. = 𝑛1 + 𝑛2 − 2).

10- Si quiere comparar el afecto negativo en los varones según su estilo atribucional positivo o negativo,
el diseño que utilizaría en su trabajo es de:
A) una muestra de varones extraída de dos poblaciones independientes
B) dos muestras independientes de varones extraídas de poblaciones con varianzas desconocidas
C) intrasujetos antes-después

11- Si desea comprobar que los varones clasificados como positivos o negativos provienen de
poblaciones con la misma varianza, ¿cuál de las siguientes hipótesis está correctamente formulada?:
2 2
A) 𝐻1 : 𝜎𝑃𝑜𝑠 = 𝜎𝑛𝑒𝑔
2 2
B) 𝐻0 : 𝜎𝑃𝑜𝑠 ≠ 𝜎𝑛𝑒𝑔
C) 𝑯𝟏 : 𝝈𝟐𝑷𝒐𝒔 ≠ 𝝈𝟐𝒏𝒆𝒈

12- El estadístico para contrastar la hipótesis de que los varones clasificados como positivos o negativos
provienen de poblaciones con la misma varianza, vale:
A) 1,33
B) 1,78
C) 0,667
𝑆̂12 62
𝐹= 2= = 1,78
𝑆̂2 4,52

13- El nivel crítico p para tomar una decisión respecto la hipótesis de que los varones clasificados como
positivos y los clasificados como negativos provienen de poblaciones con la misma varianza, vale:
A) p < 0,025
B) p < 0,05
C) p > 0,05

3
Para los siguientes pasos establece un nivel de confianza del 95% y desea comprobar si los varones con
estilo atribucional negativo tienen puntuaciones significativamente más altas en la escala EAN que los
varones con estilo atribucional positivo. Con esta finalidad:

14- El estadístico de contraste que aplicaría es:


A) t de Student para dos muestras independientes provenientes de poblaciones con varianzas
desconocidas pero supuestas iguales
B) t de Student para dos muestras independientes provenientes de poblaciones con varianzas
desconocidas pero supuestas distintas
C) Z para dos muestras grandes e independientes.

15- El estadístico de contraste para su hipótesis es, en valor absoluto:


A) 1,85
B) 2,12
C) 1,942

𝑌̅1 − 𝑌̅2 14,5 − 17


𝑇= = = −1,942
2 2
(𝑛 − 1)𝑆̂12 + (𝑛2 − 1)𝑆̂22 1 1 √30 ∙ 4,5 + 40 ∙ 6 ( 1 + 1 )
√ 1 (𝑛 + 𝑛 ) 31 + 41 − 2 31 41
𝑛1 + 𝑛2 − 2 1 2

16- El nivel crítico p asociado al estadístico de contraste obtenido, es:


A) p < 0,01
B) p > 0,05
C) p < 0,05

17- A partir de los resultados obtenidos en su trabajo concluye que entre los varones con estilo
atribucional positivo y negativo respecto a sus puntuaciones en la Escala de AN:
A) no existen diferencias significativas con un nivel de significación del 5%
B) existen diferencias significativas con un nivel de significación del 1%
C) existen diferencias significativas con un nivel de significación del 5%.

SITUACIÓN 3.- Un psicólogo industrial ha realizado una investigación para conocer el efecto del tabaco
sobre el rendimiento laboral bajo diferentes condiciones de iluminación en una gran compañía industrial.
Para ello, seleccionó una muestra aleatoria de 15 trabajadores de género masculino de cada uno de tres
grupos distintos: no fumadores, fumadores moderados y fumadores intensos (más de 20 cigarrillos al día).
Cada muestra se dividió en tres grupos, o sub-muestras, con idéntico número de sujetos y cada sub-
muestra se asignó aleatoriamente a tres ambientes de trabajo con diferentes niveles de luz. Se registró el
tiempo para completar una tarea de ensamblado estándar (en minutos).
Los resultados de las SC fueron 84,90 para el factor “Grupo de fumadores”; 298,07 para el factor
“Condiciones de iluminación” y 2,81 para la interacción. La SC total fue de 445,03. Utilice un nivel de
confianza del 95%.

4
Se elabora la tabla de ANOVA (los datos proporcionados por el enunciado se muestran en negrita)

FV SC gl MC F
FUMA 84,9 2 42,45 25,79
LUZ 298,07 2 149,04 90,55
INTER. 2,81 4 0,70 0,43
ERROR 59,25 36 1,65
TOTAL 445,03 44 10,11

18- Tal como está diseñado el experimento se trata de un modelo de:


A) ANOVA bifactorial de medidas repetidas
B) ANOVA de dos factores de muestras independientes
C) ANOVA de dos factores con muestras relacionadas

19- ¿De cuántas variables independientes consta el experimento?


A) 3
B) 2
C) 6

20- La variable dependiente en este experimento fue:


A) nº de cigarrillos/día
B) los niveles de luz
C) el tiempo en minutos

21- La F crítica para evaluar si es significativa la interacción vale, aproximadamente:


A) 2,69
B) 3,22
C) 5,19

22- Cuál de los siguientes valores se aproxima más al valor de estadístico de contraste para el efecto
interacción:
A) 0,7025
B) 0,427
C) 1,646

23- Una vez comprobado el efecto de la interacción, ¿cuál de los siguientes valores se aproxima más
al valor de estadístico de contraste para el efecto “condiciones de iluminación”?:
A) 25,79
B) 90,54
C) 96,06

5
Al no ser significativa, la suma de cuadrados de la interacción pasa a formar parte de la suma de
cuadrados de error. La tabla de ANOVA queda:

FV SC gl MC F
FUMA 84,9 2 42,45 25,79
LUZ 298,07 2 149,04 96,06
ERROR 62,06 40 1,55
TOTAL 445,03 44 10,11

24- Si consideramos evaluar si el hecho de fumar versus no fumar es significativo, deberíamos utilizar
un contraste a posteriori con un conjunto de coeficientes igual a:
A) {1, -1, 0}
B) {1, 0, -1}
C) {-1, ½, ½ }

25- La conclusión de este experimento debería indicar que


A) solo el factor “Grupo de fumadores” ha resultado significativo
B) los factores principales no han resultado significativos pero sí la interacción
C) los dos factores principales han resultado significativos pero no así la interacción

6
Modelo A. Septiembre 2015. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto.

SITUACIÓN 1. Para diferenciar entre los mayores sanos y los que presentan deterioro cognitivo (DC) se emplean
habitualmente pruebas de memoria. Entre éstas, el fenómeno de la punta de la lengua (PDL) constituye una de las
quejas subjetivas de memoria más frecuentes en las personas mayores. Se caracteriza por la dificultad para recordar
palabras conocidas, acompañada de la sensación de que su recuerdo puede ser inminente y se presenta,
especialmente, en tareas de recuperación de nombres propios (Facal, Juncos, Álvarez, Pereiro y Díaz, 2006).

Imagine que usted tiene acceso a un Centro asistencial de día para personas mayores que atiende a una muestra de
90 personas mayores de 70 años. De ellos el 30% presentan DC, a los cuales se presenta una pila de 30 fotografías
de alta calidad, de personajes famosos representativos de diferentes ámbitos y épocas. Para esta muestra de
mayores con DC, la frecuencia media de PDL fue de 18,5 con una desviación típica insesgada de 3,8.

Los datos de los que partimos son:

Muestra inicial: 𝑛 = 90 𝑝𝐷𝐶 = 0,30

Sujetos con deterioro cognitivo (DC): 𝑛 = 27; 𝑌� = 18,5; 𝑆𝑛−1 = 3,8

1- Con un nivel de confianza del 95%, la frecuencia media de PDL en la población de mayores de 70 años con DC es
un valor comprendido, aproximadamente, entre:
A) 17 y 20
B) 17,07 y 19,93
C) 16,45 y 20,53

𝑆𝑛−1 𝑆𝑛−1 3,8


𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼�2 𝜎𝑌� = 𝑡𝑛−1;1−𝛼�2 = 𝑡26,0,975 = 2,056 = 1,50
√𝑛 √𝑛 √27

20
𝑌� ± 𝐸𝑚𝑎𝑥 → 18,5 ± 1,50 → �
17

2- Si decide trabajar con un nivel de confianza del 95% para estimar la frecuencia media de PDL en la población con
un error máximo de estimación de 2 puntos, el tamaño de la muestra que debe utilizar sería:
A) Mayor que la utilizada en su trabajo
B) Menor que la utilizada en su trabajo
C) Igual que la utilizada en su trabajo

Como podemos comprobar en la solución de la pregunta nº 1, para un tamaño de la muestra: 𝑛 = 27, el error
máximo es igual a 1,5. Puede observarse en la fórmula que cuanto mayor sea el tamaño de la muestra, n, menor
será el Emax. Por tanto, para un error máximo mayor, el tamaño de la muestra será menor. Efectivamente:

2
𝑡𝑛−1;1− 𝛼� 2,0562
2 2
𝑛= 𝑆𝑛−1 2 = 3,82 = 15,26
𝐸𝑚𝑎𝑥 22

3- Si quisiera demostrar que la frecuencia media de PDL obtenida en su muestra de mayores de 70 años con DC es
significativamente mayor que 13,2, que es la obtenida en la población general de mayores entre de entre 60 y 69
años, aplicaría el estadístico:
A) Z para una muestra
B) T de Student para una muestra
1
C) Z para dos muestras independientes

Se trataría de un contraste de hipótesis sobre una media con varianza poblacional desconocida, luego hay que
aplicar la T de Student para una muestra

4- Si desea comprobar que la proporción de mayores de 70 años que presentan deterior cognitivo (DC) es
significativamente mayor del 25% establecido para la población general, la hipótesis nula que formularía es:
A) 𝜋 > 0,25
B) 𝜋 ≥ 0,25
C) 𝝅 ≤ 𝟎, 𝟐𝟓

Las hipótesis a plantear son:


𝐻0 : 𝜋 ≤ 0,25
𝐻1 : 𝜋 > 0,25

5- Si desea comprobar que la proporción de mayores de 70 años que presentan deterior cognitivo (DC) es
significativamente mayor del 25% establecido para la población general, el estadístico y nivel crítico que
obtendría son:
A) 𝑍 = 1,031 𝑦 𝑝 = 0,1515
B) 𝒁 = 𝟏, 𝟎𝟗𝟓 𝒚 𝒑 > 0,05
C) 𝑍 = 0,590 𝑦 𝑝 < 0,05

𝑝 − 𝜋0 0,30 − 0,25 El nivel crítico p correspondiente al estadístico de


𝑍= = = 1,095
contraste Z=1,095 se puede buscar en la tabla y es
�𝜋0 (1 − 𝜋0 ) �0,25 ∙ 0,75 p=0,1368 que es mayor que el nivel de significación
𝑛 90
0,05.

6- Si el intervalo de confianza para la proporción de mayores de 70 años que presentan DC está definido por los
valores 0,127 y 0,473, ¿Cuánto vale el error máximo de estimación?:
A) 0,173
B) 0,346
C) No se puede determinar porque se desconoce el nivel de confianza utilizado

De acuerdo con el enunciado:


𝑙𝑠 = 𝑝 + 𝐸𝑚𝑎𝑥 0,473 = 0,3 + 𝐸𝑚𝑎𝑥
�→
𝑙𝑖 = 𝑝 − 𝐸𝑚𝑎𝑥 0,127 = 0,3 − 𝐸𝑚𝑎𝑥

Por lo que fácilmente se deduce que: 𝐸𝑚𝑎𝑥 = 0,173

7- Con un nivel de confianza del 99%, el intervalo de confianza de la cuasi-desviación típica de la frecuencia media
de PDL que presentan los mayores de 70 años con DC, se encuentra definido por los valores:
A) 8,95 y 27,12
B) 7,77 y 33,64
C) 2,79 y 5,8

Se calcula el intervalo de confianza para la varianza, y se extrae la raíz cuadrada de los valores obtenidos.
2
2
(𝑛 − 1)𝑆𝑛−1 26 ∙ 3.82
𝑙𝑠 = 2 = = 33,64 → �33,64 = 5,8
𝜒𝑛−1; 𝛼� 11,1602
2

2
(𝑛 − 1)𝑆𝑛−1 26 ∙ 3.82
𝑙𝑖 = 2 = = 7,77 → �7,77 → 2,79
𝜒𝑛−1;1− 𝛼� 48,2899
2

8- En alguna de las preguntas anteriores encontrará la respuesta a la siguiente: ¿qué decisión tomaría respecto a la
hipótesis de que la desviación típica insesgada de la frecuencia media de PDL para la población general de
mayores de 70 años con DC es de 5 puntos?:
A) Rechazarla porque se encuentra fuera del intervalo de confianza (𝑝 < 0,05)
B) No se podría rechazar porque se encuentra dentro del intervalo de confianza (𝒑 > 0,01)
C) Rechazarla porque se encuentra fuera del intervalo de confianza (𝑝 < 0,01)

Como se puede apreciar en la solución de la pregunta anterior, 5 se encuentra comprendido entre los valores que
definen el intervalo de confianza para la desviación típica insesgada, luego la respuesta correcta es B.

SITUACIÓN 2. En un trabajo publicado por García, Gómez y Canto (2001) se analizan las diferencias de género ante
situaciones desencadenantes de celos, encontrando que las mujeres presentan mayor malestar que los hombres ante
la infidelidad emocional (pérdida de atención, cuidado y protección que la pareja dirige hacia otra persona), no
existiendo diferencias significativas ante la infidelidad sexual, que es la que más celos e ira genera tanto en hombres
como en mujeres.
Imagine que está usted interesado en comprobar si estos resultados se mantienen en la actualidad para los hombres
y mujeres de su localidad. Selecciona una muestra de 140 personas con relación de pareja estable, de las que un 60%
son mujeres. Todos los participantes contemplan un escenario de infidelidad y posteriormente responden a un
cuestionario de reacciones emocionales que proporciona datos en la escala de celos ante la infidelidad emocional (E)
y ante la infidelidad sexual (S). Los resultados obtenidos son los siguientes: en la escala E la media de los hombres es
12 y la de las mujeres 14, y sus varianzas insesgadas 16 y 20,25, respectivamente, siendo el error típico de la
diferencia de medias 0,743. Con estos datos, y fijando un nivel de confianza de 0,95, responda a las siguientes
preguntas:

Los datos facilitados en el enunciado son:


Cuasi. Var.
Media n
insegada
Hombres 12 16,000 56 𝜎𝑌�1−𝑌�2 = 0,743
Mujeres 14 20,250 84

9- Si quisiéramos comprobar que no existen diferencias significativas entre hombres (H) y mujeres (M) ante la
infidelidad sexual, formularíamos la siguiente hipótesis nula:
A) 𝛍𝐇 = 𝛍𝐌
B) µH ≠ µM
C) 𝜇𝐻 ≤ 𝜇𝑀

Las hipótesis a plantear son:


𝐻0 : µH = µM
𝐻1 : µH ≠ µM

10- Con los datos del enunciado, si quisiéramos comprobar que los hombres presentan mayor malestar ante la
infidelidad sexual que ante la infidelidad emocional utilizaríamos un diseño de:
A) Dos muestras independientes con varianzas poblacionales conocidas
B) Dos muestras relacionadas
C) Una sola muestra “pre-pos”

3
Se pretende comparar las puntuaciones del mismo grupo de personas (hombres) en dos condiciones diferentes,
luego la respuesta es B.

11- Con los datos del enunciado, si quisiéramos comprobar que las mujeres presentan mayor malestar que los
hombres ante la infidelidad emocional, utilizaríamos el estadístico:
A) Z para muestras relacionadas
B) t para muestras independientes
C) F para dos muestras independientes

En este caso se pretenden comparar las medias de diferentes grupos (hombres y mujeres) en la misma variable,
siendo desconocidas las variables poblacionales, luego la respuesta correcta es B.

12- Con un nivel de confianza de 95%, el intervalo de confianza en el que se encontrará la diferencia de medias entre
mujeres y hombres, en la escala E, (𝜇𝑀𝑢𝑗 − 𝜇𝐻𝑜𝑚 ), es, aproximadamente:
A) 0,54 y 3,45
B) 13,03 y 14,96
C) -0,08 y 3,91

En este caso hay que trabajar con dos muestras independientes.

𝐸𝑚𝑎𝑥 = 𝑡𝑛1+𝑛2 −2;1−𝛼�2 𝜎𝑌�1−𝑌�2

Dado que: 𝑔. 𝑙. = 𝑛1 + 𝑛2 − 2 = 56 + 84 − 2 = 138, 𝑡𝑛1+𝑛2 −2;1−𝛼�2 = 𝑡138,0,975 ≈ 𝑧0,975 = 1,96

𝐸𝑚𝑎𝑥 = 1,96 ∙ 0,743 = 1,46

3,46
(𝑌�1 − 𝑌�2 ) ± 𝐸𝑚𝑎𝑥 → (14 − 12) ± 1,45 → �
0,54

13- Sin necesidad de nuevos cálculos de los realizados hasta el momento, ¿Qué decisión tomaría respecto a la
hipótesis nula 𝐻𝑜 : 𝜇𝑀𝑢𝑗 = 𝜇𝐻𝑜𝑚 en la escala E?:
A) No existen evidencias suficientes para rechazarla (𝑝 > 0,05)
B) Rechazarla porque el intervalo de confianza no cubre la diferencia “nula” entre las dos medias poblacionales
(𝒑 < 0,05)
C) Falta información adicional para tomar una decisión

Como podemos comprobar en los cálculos de la solución de la pregunta anterior, la diferencia nula
�𝜇𝑀𝑢𝑗 − 𝜇𝐻𝑜𝑚 = 0� NO está incluida entre los límites del intervalo de confianza, por lo que se rechaza la
hipótesis nula.

14- El estadístico d de Cohen de la diferencia entre hombres y mujeres en la escala E, vale:


A) 0,62
B) 0,54
C) 0,46

|𝑌�1 − 𝑌�2 | |14 − 12|


𝑑= = = 0,46
(𝑛 − 1)𝑆̂12 + (𝑛2 − 1)𝑆̂22 �55 ∙ 16 + 93 ∙ 20,25
� 1 138
𝑛1 + 𝑛2 − 2

15- Suponiendo que el estadístico de Cohen para esta situación valiese 𝑑 = 0,62 indicaría que:
A) El 62% de las mujeres tiene una reacción de celos superior a la media de los hombres
B) El 73,24% de las mujeres tiene una reacción de celos superior a la media de los hombres
C) El 26,76% de las mujeres tiene una reacción de celos superior a la media de los hombres
4
Acudiendo a la tabla de curva normal, la proporción correspondiente a 𝑧 = 0,62 es igual a 0,2679, siendo la
probabilidad complementaria de este valor: 1 − 0,2679 = 0,7324. Dado que la media de las mujeres es superior
a la de los hombres, este valor indica que, el 73,24% de las mujeres tiene una reacción de celos superior a la
media de los hombres.

16- El estadístico d de Cohen:


A) Se aplica para contrastes no paramétricos de diferencia de proporciones
B) Analiza la relevancia de la diferencia de medias entre dos muestras independientes
C) Su valor depende del tamaño de las muestras

17- ¿Cuál de las siguientes gráficas es la que mejor reflejaría los resultados del trabajo original de García y Col.
(2001)?

A) B) C)

La respuesta correcta es A, donde se aprecia que las mujeres obtienen una media superior que los hombres ante
“infidelidad emocional” siendo muy parecidas las medias de hombres y mujeres ante la “infidelidad sexual” que es la
que más celos e ira genera tanto en hombres como en mujeres.

SITUACIÓN 3: En un estudio, en residencias de la tercera edad, sobre el efecto que tenían dos terapias
ocupacionales diferentes sobre las interacciones entre los residentes, se eligieron al azar 24 participantes, ocho de
cada una de tres instituciones semejantes, elegidas, también al azar, entre las de una comunidad autónoma del
Estado. Uno de los centros se utilizó como grupo control y en él no se realizó ninguna terapia (residencia A), en las
otras dos se probaron las terapias (una en la residencia B y otra en la residencia C). Se desea averiguar si hay
diferencias, en la media de interacciones entre los residentes, en las tres residencias. Se ha comprobado que la
distribución de la variable dependiente es normal y que las varianzas son homogéneas.
Media de interacciones diarias entre los residentes: Residencia A: 5,45; Residencia B: 7,275; Residencia C: 6,55

18- Se trata de muestras:


A) Apareadas
B) Relacionadas
C) Independientes

5
19- Cuántos grados de libertad se asocian al estadístico de contraste (señale el más aproximado):
A) 2 y 21
B) 3 y 23
C) 2 y 24

Se trata de un ANOVA de un factor con tres niveles. Los grados de libertad intergrupos son a-1=2, siendo “a” el
número de niveles del factor a=3. Y los grados de libertad intragrupos son N-a=21, siendo N=24 y a=3.

20- El valor del estadístico de contraste fue 6,21; conociendo este dato, ¿se debe rechazar la 𝐻0 ?
A) Sí (con alfa 0,005)
B) Sí (con alfa 0,05)
C) No (con alfa 0,01)

Acudiendo a la tabla F de Fisher para 2 y 20 grados de libertad (los más próximos) obtenemos los valores:

𝐹0,995 = 6,986, 𝐹0,99 = 5,849, 𝐹0,95 = 3,493

Por lo que el resultado obtenido es significativo para 𝛼 = 0,01, pero no para 𝛼 = 0,005, luego la respuesta
correcta es B.

21- Según el diseño y el resto de información que se describe en el enunciado, la correcta formulación de la hipótesis
alternativa, es:
A) 𝜇𝐴 ≠ 𝜇𝐵 ≠ 𝜇𝐶
B) 𝝁𝑨 ≠ 𝝁𝑩 ≠ 𝝁𝑪 (al menos para una µ𝒊 )
C) 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶 (al menos para una µ𝑖 )

22- Sabiendo que 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 36,345 y 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 22,835; ¿cuál es el valor de 𝑀𝐶𝐼𝑛𝑡𝑒𝑟 ? (señale el más aproximado):
A) 1,09
B) 13,51
C) 6,76

A partir de estos datos ya conocidos: 𝑁 = 24; 𝑎 = 3; 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 22,835; 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 36,345; 𝐹 = 6,21

Podemos completar la tabla de ANOVA:

FV SC gl MC F
Inter 13,510 2 6,755 6,21
Intra 22,835 21 1,087
Total 36,345 23
(Los datos representados en color rojo se obtienen a partir de los
datos proporcionados en el examen)

23- Sabiendo que 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 36,345 y 𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = 22,835. Para realizar comparaciones entre pares de medias, ¿cuál
es el valor más aproximado de 𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 ?:
A) 1,78 (alfa 0,01)
B) 1,37 (alfa 0,01)
C) 1,78 (alfa 0,05)
𝑐2
𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 = �(𝑎 − 1) ∙ 𝐹(1−𝛼),(𝑎−1),(𝑁−𝑎) �𝑀𝐶𝐼𝑛𝑡𝑟𝑎 �� � 𝑖 �𝑛𝑖 ��

2
Para 𝛼 = 0,05: 𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 = √2 ∙ 3,493�1,087 ∙ = 1,378
8

6
2
Para 𝛼 = 0,01: 𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 = �2 ∙ 5,849�1,087 ∙ = 1,783
8

24- Si se hubiera rechazado la hipótesis nula y el estadístico para realizar las comparaciones múltiples, nos hubiese
dado un valor de 1,3 (con alfa 0,05); ¿entre qué grupos se encuentran diferencias estadísticamente
significativas?:
A) Residencia A y residencia B
B) Residencia A y residencia C
C) Residencia B y residencia C

|𝑌�𝐴 − 𝑌�𝐵 | = |5,45 − 7,275| = 1,825 > 1,3 → 𝐻1

|𝑌�𝐴 − 𝑌�𝐶 | = |5,45 − 6,550| = 1,100 < 1,3 → 𝐻0

|𝑌�𝐵 − 𝑌�𝐶 | = |7,275 − 6,55| = 0,725 < 1,3 → 𝐻0

25- En el análisis de varianza, cada nivel del factor es:


A) Una categoría de las variables dependientes
B) Cada una de las variables independiente
C) Una categoría de las variables independientes

7
Modelo A. Febrero 2016. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y cualquier tipo de calculadora en la
que no se pueda introducir texto

SITUACIÓN 1. Olivares y García-López (1998) desarrollaron un programa de tratamiento cognitivo-conductual para


adolescentes con fobia social generalizada. Imagine que usted dispone de una muestra de 32 adolescentes que padecen
fobia social generalizada de los que 24 son de género femenino, y quiere comprobar la eficacia del método propuesto por
Olivares y García-López (1998). Para ello forma dos grupos de forma aleatoria de 16 sujetos cada uno de ellos. En el Grupo
A utiliza el programa de Olivares y García-López (1998), utilizando el Grupo B como grupo control, al que no se aplica
tratamiento alguno. Para medir el grado de fobia social utiliza un inventario diseñado específicamente para este fin (IFS).
A mayor puntuación en este inventario, mayor fobia social.

Antes de aplicar el tratamiento se obtiene para el Grupo A una media en IFS igual a 10 y cuasidesviación típica igual a 3,
mientras que en el Grupo B la media es igual a 9,5 y la cuasidesviación típica igual a 3,5. Después de aplicar el tratamiento
en el Grupo A la media y cuasidesviación típica son 4 y 3,2, respectivamente. Para el Grupo B en el post-test se obtiene
una media igual a 9,25 con una cuasidesviación típica igual a 3,25.

Considerando a todos los sujetos de la muestra inicial, el investigador quiere comprobar si en la población de la
que se ha extraído esta muestra, la proporción de adolescentes de sexo femenino es superior a 0,6.

1- La hipótesis alternativa es:


A) 𝜋𝑀𝑢𝑗𝑒𝑟 < 0,6
B) 𝝅𝑴𝒖𝒋𝒆𝒓 > 𝟎, 𝟔
C) 𝜋𝑀𝑢𝑗𝑒𝑟 ≥ 0,6

Las hipótesis a plantear son:


𝐻0 : 𝜋 ≤ 0,6
𝐻1 : 𝜋 > 0,6

2- El valor absoluto del estadístico de contraste es, aproximadamente:


A) 2,33
B) 1,64
C) 1,73

𝑝 − 𝜋0 0,75 − 0,6
𝑍= = = 1,73
√𝑝(1 − 𝑝) √0,6(1 − 0,6)
𝑛 32

3- El nivel crítico del estadístico de contraste es:


A) 0,0418
B) 0,9582
C) Menor que 0,01

𝑇𝑎𝑏𝑙𝑎 𝑐𝑢𝑟𝑣𝑎 𝑛𝑜𝑟𝑚𝑎𝑙


𝑍 = 1,73 → 𝑝 = 0,0418

1
Queremos comprobar si existen diferencias estadísticamente significativas entre las puntuaciones medias del
IFS entre el Grupo A y el Grupo B antes de aplicar el tratamiento.

Antes de aplicar el tratamiento, los datos son:

Media Cuasi desviación típica


Grupo A 10 3
Grupo B 9,5 3,5

4- Si previamente se aplica un contraste de hipótesis sobre las varianzas poblacionales para decidir si se asumen
iguales o diferentes, el nivel crítico que se obtiene en este contraste es:
A) 𝒑 > 𝟎, 𝟏𝟎
B) 𝑝 < 0,10
C) 𝑝 = 0,10

Para decidir si se asumen varianzas poblacionales iguales o diferentes:

𝐻0 : 𝜎𝐴2 = 𝜎𝐵2
𝜎𝐵2 3,52
𝐻1 : 𝜎𝐴2 ≠ 𝜎𝐵2 𝐹= = 2 = 1,36
𝜎𝐴2 3

Los grados de libertad son: 𝑛1 − 1 = 15 𝑦 𝑛2 − 1 = 15. En la tabla los más próximos son 10 y 15, o bien 20
y 15. En el primer caso: 𝑓0,90;10;15 = 2,059 y en el segundo: 𝑓0,90;20;15 = 1,924. En cualquier caso, el
estadístico de contraste (𝐹 = 1,36) es inferior a ambas puntuaciones, y al ser el contraste bilateral el nivel
crítico es superior a 0,20.

5- Suponiendo que las medias poblacionales son iguales en los Grupos A y B, en el contraste de medias la
probabilidad de obtener un resultado como el observado en nuestros datos o más extremo, es:
A) 𝒑 > 𝟎, 𝟏𝟎
B) 𝑝 < 0,10
C) 𝑝 = 0,10

Tenemos que calcular el nivel crítico, es decir, la probabilidad de obtener un resultado igual o más extremo
que el observado en los datos suponiendo que es cierta la hipótesis nula, que en este caso especifica que las
medias poblacionales son iguales en los Grupos A y B.

El estadístico de contraste para comprobar si existen diferencias significativas entre las puntuaciones medias
del IFS entre el Grupo A y el Grupo B antes de aplicar el tratamiento:

𝑌̅1 − 𝑌̅2 10 − 9,5


𝑇= = = 0,434
2 2
(𝑛 − 1)𝑆̂12 + (𝑛2 − 1)𝑆̂22 1 1 √15 ∙ 3 + 15 ∙ 3,5 ( 1 + 1 )
√ 1 (𝑛 + 𝑛 ) 30 16 16
𝑛1 + 𝑛2 − 2 1 2

Acudiendo a la tabla t de Student para 30 grados de libertad, observamos que el estadístico de contraste se
encuentra entre las puntuaciones 0,389 y 0,53, que dejan por encima de sí las probabilidades 0,35 y 0,30
respectivamente. Como el contraste es bilateral, el nivel crítico se encuentra entre: 0,60 < 𝑝 < 0,70.

2
Queremos comprobar si después de aplicar el tratamiento la puntuación media del IFS en el Grupo A es
inferior a la puntuación media del Grupo B en el post-test (asuma varianzas poblacionales iguales).

Después de aplicar el tratamiento, los datos son:

Media Cuasi desviación típica


Grupo A 4 3,2
Grupo B 9,25 3,25

6- El tamaño del efecto vale, aproximadamente:


A) 4,6
B) 0,8
C) 1,63

|𝑌̅1 − 𝑌̅2 | |4 − 9,25|


𝑑= = = 1,63
2 2
(𝑛 − 1)𝑆̂12 + (𝑛2 − 1)𝑆̂22 √15 ∙ 3,2 + 15 ∙ 3,25
√ 1 30
𝑛1 + 𝑛2 − 2

7- El valor absoluto del estadístico de contraste vale, aproximadamente:


A) 2,042
B) 1,697
C) 4,60

𝑌̅1 − 𝑌̅2 4 − 9,25


𝑇= = = 4,60
(𝑛 − 1)𝑆̂12 + (𝑛2 − 1)𝑆̂22 1 √15 ∙ 3,22 + 15 ∙ 3,252 1 1
√ 1 1 ( + )
(𝑛 + 𝑛 ) 30 16 16
𝑛1 + 𝑛2 − 2 1 2

8- Los resultados obtenidos indican que:


A) El tratamiento propuesto por Olivares y García-López (1998) no tiene ningún efecto sobre la fobia social en
adolescentes.
B) El tratamiento propuesto por Olivares y García-López (1998) disminuye la puntuación media en la escala de
fobia social (𝜶 = 𝟎, 𝟎𝟏).
C) El tratamiento propuesto por Olivares y García-López (1998) aumenta la puntuación media en la escala de
fobia social (𝛼 = 0,01).
9- El valor complementario de la probabilidad de cometer un error de tipo II se denomina:
A) Nivel de confianza.
B) Potencia del contraste.
C) Nivel crítico.
10- Al calcular intervalos confidenciales para una media poblacional, a medida que aumenta el tamaño de la muestra:
A) Aumenta el error máximo.
B) Disminuye el error típico.
C) Aumenta la cuasivarianza muestral.

3
SITUACIÓN 2. Olivares y García-López (1998) desarrollaron un programa de tratamiento cognitivo-conductual para
adolescentes con fobia social generalizada. Imagine que ahora usted sólo dispone de una muestra de 6 adolescentes
que padecen fobia social generalizada. Para medir el grado de fobia social utiliza un inventario diseñado
específicamente para este fin (IFS). Se aplica el cuestionario IFS antes del tratamiento propuesto por Olivares y
García-López (1998) a estos 6 sujetos, y posteriormente se realizan dos seguimientos, uno a los 6 meses y otro a los
12 meses de finalizar la aplicación del tratamiento, para evaluar el mantenimiento o no de los resultados. Trabaje a
un nivel de confianza del 95%

Conociendo las siguientes sumas de cuadrados: 𝑆𝐶𝐴 = 148,11; 𝑆𝐶𝐸𝑟𝑟𝑜𝑟 = 19,22 y 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 174,94, y asumiendo
que se cumplen los supuestos pertinentes para ese diseño:

Se trata de un ANOVA de medidas repetidas con un factor y tres niveles. Con los datos aportados en el
enunciado podemos completar la tabla de ANOVA. En la siguiente tabla se representan en color negro los
datos aportados por el problema.

FV SC gl MC F
A 148,11 2 74,06 38,53
S 7,61 5 1,52
Error 19,22 10 1,92
Total 174,94 17

11- Se trata de un diseño:


A) De dos factores con muestras independientes.
B) De un factor con muestras independientes.
C) De un factor con muestras relacionadas.
12- La media cuadrática correspondiente a la variabilidad de los sujetos vale, aproximadamente:
A) 74,06
B) 1,52
C) No tiene sentido porque el diseño es de muestras independientes
13- Los grados de libertad correspondientes al estadístico de contraste son:
A) 2 y 5
B) 2 y 10
C) 2 y 17
14- El valor del estadístico de contraste es, aproximadamente:
A) 38,53
B) 5,786
C) 8,434
15- El valor crítico es, aproximadamente:
A) 7,559
B) 2,924
C) 4,103

Al nivel de confianza del 95% para 2 y 10 grados de libertad, el valor crítico es igual a: 𝑓 = 4,103

4
16- Con los resultados obtenidos:
A) Se mantiene la hipótesis nula para 𝛼 = 0,05.
B) Se rechaza la hipótesis nula para 𝛼 = 0,05 pero no para 𝛼 = 0,01.
C) Se rechaza la hipótesis nula para 𝜶 = 𝟎, 𝟎𝟏.

17- En los diseños intra-sujetos se considera que la varianza de error viene dada por:
A) El factor manipulado.
B) Los sujetos.
C) La interacción entre el factor manipulado y los sujetos.

SITUACIÓN 3. A continuación se muestra la recta de regresión por mínimos cuadrados que mejor ajusta los datos y el
Anova de la regresión lineal entre el Volumen de los cilindros y la potencia del motor en ocho automóviles (Honda
Civic, Toyota Prius, VS Golf, VS Beetle, Toyota Corolla, VW Jetta, Mini Cooper y Toyota Yaris). Se asume que se
cumplen todos los supuestos para este tipo de análisis.

F.V. S.C. g.l. M.C. F


Regresión 4927,03 1 4927,03 5,303
𝑃𝑜𝑡𝑒𝑛𝑐𝑖𝑎′ = −15,45 + 65,17(𝑉𝑜𝑙𝑢𝑚𝑒𝑛)
Residual 5574,84 6
Total 10501,87 7

18- ¿Qué significa la pendiente obtenida en este contexto?


A) Que un cambio de -15,48 unidades en la potencia provoca un cambio de 1 unidad en el volumen.
B) Que un cambio de 65,17 unidades en el volumen provoca un cambio de -15,45 unidades en la potencia.
C) Que un cambio en el volumen del cilindro del coche de 1 unidad provoca un cambio en la potencia de 65,17
unidades.
19- El intercepto de la recta de regresión muestral en esta situación vale:
A) -15,45
B) 65,17
C) 0
20- ¿Tiene sentido interpretar el intercepto en esta situación?
A) Sí porque la tabla del Anova nos indica que la regresión es significativa a un nivel de confianza del 95%.
B) Sí ya que es el valor predicho para la potencia del coche cuando el volumen de los cilindros vale 0.
C) No porque la potencia de un coche no puede ser negativa.
21- ¿Aproximadamente, qué valor predeciría para la potencia de un coche que tuviese un volumen en sus cilindros de
2,2 cm3?
A) 127,92
B) 62,75
C) 114,89
22- La Media Cuadrática del residuo vale, aproximadamente.
A) 5574,84
B) 929,14
C) 4927,03

5
23- Determine al 95% de nivel de confianza (unilateral) si la regresión resultó significativa.
A) No porque el nivel crítico de la F obtenida es superior a 0,05.
B) Sí porque el estadístico de contraste es menor que el valor crítico.
C) Sí porque el nivel crítico de F vale 0,001.

24- Uno de los supuestos básicos del análisis de regresión simple es:
A) Los pronósticos y los errores son independientes.
B) Las distribuciones condicionadas de los errores deben de tener una distribución uniforme.
C) No deben estar relacionadas las variables predictora y la variable dependiente o criterio.

25- Los coeficientes de correlación parcial y semiparcial son semejantes en que:


A) No son medidas de asociación.
B) No son correlaciones de orden cero.
C) No eliminan el influjo de otras variables independientes.

6
Modelo C. Febrero 2016. No debe entregar los enunciados
Fórmula de corrección: Aciertos – (Errores / 2)
Material permitido: Formulario de cualquier curso académico sin anotaciones y cualquier tipo de calculadora en la
que no se pueda introducir texto

SITUACIÓN 1. Los pensamientos automáticos (también denominados autodiálogos) constituyen un nivel de


funcionamiento cognitivo que hacen referencia a la forma como la persona percibe y construye su mundo y se
emplean para evaluar la vulnerabilidad cognitiva ante determinados trastornos psicológicos como la depresión. Un
estudio publicado en Ansiedad y Estrés por Calvete (2005) confirma una mayor presencia en las mujeres de
pensamientos que expresan una visión negativa de sí mismas, autoculpa, rechazos por parte de los demás y
desesperanza (autodiálogos negativos). Esta mayor presencia de pensamientos automáticos negativos contribuye a
explicar las diferencias de género en depresión.

Imagine que usted dispone de una muestra de 121 mujeres y 151 hombres que responden a una Escala de
Depresión (ED) obteniendo una puntuación media de 19,2 y una desviación típica insesgada de 9,5 para las mujeres
y de 16,8 y 8,5 respectivamente para los hombres. Además en un 18% de las mujeres presentan un predominio de
los autodiálogos negativos frente al 9% de los hombres.

Datos del problema.

Proporción
𝑛 𝑌̅ 𝑆̂ Autodiálogos
negativos
Mujeres (M) 121 19,2 9,5 0,18
Hombres (H) 151 16,8 8,5

1- Si desea determinar el intervalo de confianza para la varianza poblacional de la escala de depresión (ED) para
hombres, deberá asumir que la distribución muestral de la varianza es:
A) F de Fisher.
B) Chi-cuadrado.
C) T de Student.

2- El intervalo de confianza de la proporción de mujeres que presentan un predominio de los autodiálogos


negativos en la población general, con un nivel de confianza del 95%, es, aproximadamente:
A) 0,112 y 0,248
B) 0,09 y 0,267
C) 0,198 y 0,297

𝑇𝑎𝑏𝑙𝑎 𝑑𝑒 𝑐𝑢𝑟𝑣𝑎 𝑛𝑜𝑟𝑚𝑎𝑙


𝑁𝐶 = 0,95 → 𝑧1−𝛼⁄2 = 1,96

𝑝(1 − 𝑝) 0,18(1 − 0,18)


𝐸𝑚𝑎𝑥 = 𝑧1−𝛼⁄2 𝜎𝑃 = √ = 1,96√ = 0,0685
𝑛 121

0,248
𝑝 ± 𝐸𝑚𝑎𝑥 → 0,18 ± 0,0685 → {
0,112
1
3- Si quiere contrastar la hipótesis de que en la población el porcentaje de mujeres sintomáticas con predominio de
autodiálogos negativos es mayor del 10%, la hipótesis nula que formula es:
A) 𝜋 = 0,10
B) 𝝅 ≤ 𝟎, 𝟏𝟎
C) 𝜋 ≥ 0,10

4- El estadístico de contraste para la hipótesis nula de que el porcentaje de mujeres sintomáticas con predominio
de autodiálogos negativos es mayor del 10%, es, aproximadamente:
A) 2,93
B) 3,14
C) 1,74

𝑝 − 𝜋0 0,18 − 0,10
𝑍= = = 2,93
√𝜋0 (1 − 𝜋0 ) √0,10(1 − 0,10)
𝑛 121

5- Si desea comprobar que las muestras de hombres (H) y mujeres (M) provienen de poblaciones con la misma
varianza en la Escala de Depresión (ED), la hipótesis nula que formularía es:
A) 𝜎𝐻2 ≥ 𝜎𝑀
2

B) 𝜎𝐻2 ≤ 𝜎𝑀
2

𝝈𝟐
C) 𝝈𝟐𝑯 = 𝟏
𝑴

6- Si desea comprobar que las muestras de hombres y mujeres provienen de poblaciones con la misma varianza en
la Escala de Depresión (ED), el estadístico que obtiene y su valor crítico son, aproximadamente:
A) 2,19; p=0,05
B) 0,97; p<0,10
C) 1,25; p>0,10

𝑆̂12 9,52 𝑇𝑎𝑏𝑙𝑎 𝐹 𝑑𝑒 𝐹𝑖𝑠ℎ𝑒𝑟


𝐹= = = 1,25 → 𝑝 > 0,10
𝑆̂2 8,5
2 2

Hay una errata en el enunciado, se debería pedir el “nivel” crítico en vez del “valor” crítico.

7- Si desea comprobar que las mujeres obtienen puntuaciones más altas que los varones en la Escala de Depresión
(ED) el estadístico de contraste que obtiene en valor absoluto, vale, aproximadamente:
A) 2,20
B) 2
C) 0,26

𝑌̅1 − 𝑌̅2 19,2 − 16,8


𝑇= = = 2,20
2 2
(𝑛 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 1 1 √120 ∙ 9,5 + 150 ∙ 8,5 ( 1 + 1 )
√ 1 (𝑛 + 𝑛 ) 270 121 151
𝑛1 + 𝑛2 − 2 1 2

2
8- Si con los datos de su investigación el estadístico d de Cohen toma el valor 0,27 podría afirmar que:
A) El 60,64% de los hombres superan la media de depresión de las mujeres.
B) El 60,64% de las mujeres superan la media de depresión de los hombres.
C) El 27% de los hombres están por debajo de la media de depresión de las mujeres.

𝑡𝑎𝑏𝑙𝑎 𝑑𝑒 𝑐𝑢𝑟𝑣𝑎 𝑛𝑜𝑟𝑚𝑎𝑙


𝑧 = 0,27 → 𝑝 = 0,6064

9- Se llama error típico de un estadístico a la desviación típica de :


A) El parámetro poblacional.
B) La distribución muestral del estadístico.
C) La distribución de la muestra.

10- Cuál de los siguientes estimadores para la media poblacional de una distribución es suficiente:
A) La mediana.
B) La media aritmética.
C) La moda.

SITUACIÓN 2: El director de una escuela de ajedrez está interesado en identificar la mejor estrategia de control de la
atención (durante las partidas) para entrenar a los alumnos en la utilización de la más adecuada. Se han estudiado
tres estrategias: centrarse en estímulos internos (A), centrarse en estímulos externos (B) y hacer una parada de
pensamiento (C). El control de la atención se ha medido mediante una variable fisiológica (variaciones en la actividad
eléctrica de la piel). Se seleccionó una muestra aleatoria compuesta por 45 jugadores de ajedrez, que se asignaron al
azar a una de las tres condiciones experimentales. Se obtuvieron los siguientes resultados:

Estrategia 𝑛 Media D. Típica


A 15 37,53 11,17 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 6783,46
B 15 34 8,8
C 15 47,73 12,18 𝑀𝐶𝐸𝑟𝑟𝑜𝑟 = 125,2
Total 45 39,75 12,11

Tras realizar todas las comprobaciones necesarias se concluyó que las observaciones eran independientes, las
distribuciones normales y las varianzas homogéneas.

Se trata de un ANOVA de un factor (estrategia de control de la atención) con tres niveles, siendo el
modelo equilibrado (𝑛1 = 𝑛2 = 𝑛3 = 15)

Con los datos del enunciado se puede completar la tabla de ANOVA.

FV SC gl MC F
Inter 1525,06 2 762,53 6,09
Intra 5258,4 42 125,2
Total 6783,46 44

3
11- Se trata de un diseño:
A) Con tres grupos no equilibrados.
B) Con muestras relacionadas.
C) Con muestras independientes.

12- La variable independiente de este experimento es:


A) Las variaciones de la actividad eléctrica de la piel.
B) El tipo de estrategia de control de la atención.
C) El que los sujetos sean jugadores de ajedrez.

13- Teniendo en cuenta la técnica apropiada para resolver este diseño, cuál sería el valor de los grados de libertad
del denominador del estadístico de contraste:
A) 42
B) 44
C) 28

14- La técnica de análisis de datos adecuada para probar la hipótesis del investigador es:
A) ANOVA de un factor con muestras independientes.
B) ANOVA bifactorial.
C) ANOVA de medidas repetidas.

15- Cuál es el valor más aproximado de la 𝑆𝐶𝑖𝑛𝑡𝑒𝑟 :


A) 5258,4
B) 762,53
C) 1525,06

16- Suponiendo que el cálculo del estadístico de contraste arrojó un valor igual a 6,09, con este dato:
A) No podemos tomar ninguna decisión respecto a la hipótesis de igualdad de medias.
B) Podemos rechazar la hipótesis de igualdad de medias (NC = 95%).
C) No podemos rechazar la hipótesis de igualdad de las medias (NC = 95%).

Consultando la tabla F de Fisher para 𝑛1 = 2 𝑦 𝑛2 = 30 grados de libertad (los más próximos):

𝑓0,95;2;30 = 3,316

Dado que: 6,09 > 3,316, se rechaza la hipótesis nula para un nivel de confianza del 95%

17- El valor crítico para rechazar 𝐻0 con 𝛼 = 0,01 vale:


A) 4,18
B) 5,39
C) 2,4

Consultando la tabla F de Fisher para 𝑛1 = 2 𝑦 𝑛2 = 30 grados de libertad (los más próximos):

𝑓0,99;2;30 = 5,39

4
18- Suponiendo que NO se rechazara la 𝐻0 , entre qué grupos sería conveniente realizar comparaciones:
A) Entre ninguno.
B) Entre los grupos B y C que son los que presentan la máxima diferencia en sus resultados.
C) Entre los grupos A, B y C

SITUACIÓN 3. Un estudio publicado en Acción Psicológica por Ramírez-Lucas, Ferrando, y Sainz (2015), analiza la
influencia de la inteligencia emocional (IE) de los padres y el desarrollo emocional de sus hijos escolarizados en el 2º
ciclo de educación infantil, indicando que los padres con mayor IE tienden a mostrar un estilo más democrático que
autoritario que, a su vez, influye positivamente en la IE de los niños.

Imagine que usted desea corroborar estos resultados con escolares de bachillerato para lo que dispone de
una muestra de 82 niños y sus respectivos padres que responden a un cuestionario de IE para adultos (IEA) y a un
segundo cuestionario de Estilos Parentales (EP), que valora el estilo parental que varía desde autoritario a
democrático sobre una única escala de intervalo. Por su parte, los hijos responden a un Inventario de IE para
Escolares (IEE), obteniendo los resultados que se muestran en las siguientes tablas.

Correlaciones
Media Varianza
EP IEA IEE
EP 2,9 0,9
EP - 0,65 0,42
IEA 2,7 1,1
IEA - 0,56
IEE 3,1 1,3
IEE -

19- El 31,36% de la variabilidad de la IE de los Escolares (IEE) se explica por:


A) Los estilos parentales EP
B) la IE de los padres.
C) una combinación lineal de los estilos parentales y la IE de los padres.

Elevando al cuadrado los coeficientes de correlación proporcionados en el enunciado, obtenemos los siguientes
coeficientes de determinación:

EP IEA IEE
EP 0,4225 0,1764
IEA 0,3136
IEE

20- Si quisiéramos pronosticar la puntuación de IE de los hijos (IEE) a partir de la IE de sus padres (IEA), la pendiente
de la ecuación de regresión es:
A) 0,609
B) 0,662
C) 0,515

5
𝑆𝑦 √1,3
𝐵 = 𝑟𝑥𝑦 = 0,56 = 0,609
𝑆𝑥 √1,1

21- Con los datos de su investigación, la puntuación en la escala de IEE que pronosticamos para un estudiante cuyos
padres obtienen una puntuación de 3,1 puntos en la escala de IEA es:
A) 3,02
B) 3,34
C) Faltan datos para su cálculo.

𝐵0 = 𝑌̅ − 𝐵𝑋̅ = 3,1 − 0,609 ∙ 2,7 = 1,456

𝑌´ = 1,456 + 0,609 ∙ 3,1 = 3,34

22- Considerando que la IE de los Escolares (IEE) se puede predecir a partir de la IE de los padres y de los Estilos
Parentales (EP), la correlación semiparcial entre las variables IEA e IEE representa la contribución de la IE de los
padres sobre la IE de los hijos habiendo eliminado:
A) de la variable IEE la influencia de EP.
B) de la variable IEA la influencia de EP.
C) tanto de IEE como de IEA la influencia de EP.

23- Si en la ecuación de regresión para pronosticar la IE de los hijos (IEE) a partir de la IE de los padres (IEA) y su
Estilo Parental (EP) se obtuviese un coeficiente de determinación de 0,3969 podríamos afirmar que el 39,69% de
la varianza en la IE de los hijos (IEE) se debe a:
A) La IE de sus padres (IEA).
B) Al Estilo Parental (EP) de los padres.
C) Una combinación lineal de la IE y el EP de los padres.

24- La correlación entre la IE de los hijos (IEE) y IE de padres (IEA) eliminando de ésta la influencia del estilo parental
(EP) es, aproximadamente:
A) 0,56
B) 0,32
C) 0,38
𝑟𝑦1 − 𝑟𝑦2 𝑟12 𝑟𝐼𝐸𝐸;𝐼𝐸𝐴 − 𝑟𝐼𝐸𝐸;𝐸𝑃 𝑟𝐼𝐸𝐴;𝐸𝑃 0,56 − 0,65 ∙ 0,42
𝑠𝑟1 = = = = 0,38
√1 − 𝑟122 √1 2
2
√1 − 𝑟𝐼𝐸𝐴;𝐸𝑃 − 0,65

25- El valor del estadístico para contrastar la hipótesis de significación de la correlación lineal simple entre la IE de
los padres (IEA) y su estilo parental (EP) es, aproximadamente:
A) 6,05
B) 7,65
C) 4,14

𝑟𝑥𝑦 √𝑛 − 2 0,65√82 − 2
𝑇= = = 7,65
√1 − 2
𝑟𝑥𝑦 √1 − 0,652

6
Modelo A. Septiembre de 2016. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto

SITUACIÓN 1. Tras aplicar un programa de tratamiento del hábito de fumar a un grupo de 100 fumadores (50
hombres y 50 mujeres), 65 de ellos dejan de fumar (30 hombres y 35 mujeres). La edad media de la muestra
fue de 40 años con una cuasidesviación típica igual a 6.

1) El intervalo de confianza de la media poblacional de la variable edad, para un nivel de confianza del 99%, es
un valor comprendido entre:
A) 39,88 y 40,12
B) 38,42 y 41,58
C) 36,01 y 40,08

𝑆𝑛−1 6
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 𝑡99;0,995 = 2,626 = 1,575
√𝑛 √100

41,58
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 40 ± 1,5756 → {
38,42

Antes del tratamiento, el terapeuta informa a los sujetos que espera lograr que más de la mitad de ellos
dejen de fumar. Tras aplicar la terapia, y para comprobar si se cumplen las expectativas del terapeuta:

2) La hipótesis nula que se ha de plantear es:


A) 𝜋𝑁𝑜 𝑓𝑢𝑚𝑎𝑑𝑜𝑟𝑒𝑠 = 0,5
B) 𝜋𝑁𝑜 𝑓𝑢𝑚𝑎𝑑𝑜𝑟𝑒𝑠 ≥ 0,5
C) 𝝅𝑵𝒐 𝒇𝒖𝒎𝒂𝒅𝒐𝒓𝒆𝒔 ≤ 𝟎, 𝟓

3) El valor absoluto del estadístico de contraste es, aproximadamente:


A) 3,00
B) 2,17
C) 4,31
𝑝 − 𝜋0 0,65 − 0,50
𝑍= = =3
√𝜋0 (1 − 𝜋0 ) √0,50 ∙ 0,50
𝑛 100

4) Asumiendo que tras la terapia la proporción de fumadores en la población es igual a 0,5, la probabilidad de
obtener un estadístico de contraste como el observado, o más extremo, es igual a:
A) 0,05
B) 0,95
C) 0,0013

𝑇𝑎𝑏𝑙𝑎 𝑑𝑒 𝑐𝑢𝑟𝑣𝑎 𝑛𝑜𝑟𝑚𝑎𝑙


𝑍 =3→ 𝑝 = 0,0013

5) Según el resultado obtenido:


A) No se rechaza la hipótesis nula, ya que aproximadamente la mitad de los sujetos no han dejado de fumar.
-1-
B) Rechazamos la hipótesis nula para 𝛼 = 0,05 pero no para 𝛼 = 0,01
C) Rechazamos la hipótesis nula para 𝜶 = 𝟎, 𝟎𝟏

Para comprobar si en la población son iguales las proporciones de hombres y mujeres que dejan de fumar,
realizamos otro contraste de hipótesis. En relación a éste:

6) El valor absoluto del estadístico de contraste vale, aproximadamente:


A) 1,96
B) 1,05
C) 1,64
𝑛1 𝑝1 + 𝑛2 𝑝2 65
𝑃= = = 0,65
𝑛1 + 𝑛2 100

35 30
𝑝1 − 𝑝2 −
𝑍= = 50 50 = 1,05
1 1
√𝑃(1 − 𝑃) ( + ) √0,65(1 − 0,65) ( 1 + 1 )
𝑛1 𝑛2 50 50

7) El nivel crítico vale, aproximadamente:


A) 0,1469
B) 0,2938
C) 0,05
𝑇𝑎𝑏𝑙𝑎 𝑑𝑒 𝑐𝑢𝑟𝑣𝑎 𝑛𝑜𝑟𝑚𝑎𝑙
𝑍 = 1,05 → 0,1468

Al ser el contraste bilateral: 𝑝 = 0,1468 ∙ 2 = 0,2938

8) Con un nivel de confianza del 95%, la conclusión sobre las proporciones de hombres y mujeres que dejan de
fumar es que:
A) No podemos rechazar la hipótesis de que ambas proporciones sean iguales en la población.
B) La proporción poblacional de hombres que dejan de fumar es superior a la de mujeres.
C) La proporción poblacional de mujeres que dejan de fumar es superior a la de hombres.

9) En un contraste de hipótesis sobre dos medias en el que el tamaño del efecto es moderado:
A) El estadístico de contraste puede ser significativo o no, dependiendo del tamaño de la muestra.
B) El estadístico de contraste siempre será significativo para 𝛼 = 0,05
C) El estadístico de contraste siempre será significativo para 𝛼 = 0,01

10) A la probabilidad de rechazar una hipótesis nula falsa se le denomina:


A) Nivel de confianza.
B) Potencia del contraste.
C) Beta.

SITUACIÓN 2. Para comparar la eficacia de tres métodos de enseñanza se dispone de una muestra de 9 sujetos,
que se asignan aleatoriamente a cada uno de los tres métodos (𝑎1 , 𝑎2 𝑦 𝑎3 ), obteniéndose los siguientes
resultados:

-2-
𝑎1 𝑎2 𝑎3 𝑎12 𝑎22 𝑎32
3 4 6 9 16 36
2 3 4 4 9 16
1 2 5 1 4 25
Ʃ 6 9 15 14 29 77

Se asume que estos datos cumplen los supuestos necesarios para aplicar el correspondiente análisis.

Se trata de un ANOVA para un factor con muestras independientes con tres niveles (𝑎 = 3) y un modelo
equilibrado (𝑛 = 3)

302 62 92 152
𝑻 = 6 + 9 + 15 = 30; [𝑻] = = 100; [𝒀] = 14 + 29 + 77 = 120; [𝑨] = + + = 114
9 3 3 3

FV SC gl MC F
Inter 14 2 7

Intra 6 6 1 7

Total 20 8

11) Se trata de un diseño:


A) De dos factores con muestras independientes.
B) De un factor con muestras independientes.
C) De un factor con muestras relacionadas.

12) Los grados de libertad correspondientes al estadístico de contraste son:


A) 2 y 6
B) 2 y 8
C) 6 y 8

13) El valor del estadístico de contraste es aproximadamente igual a:


A) 4,12
B) 11,70
C) 7,00

14) Para un nivel de confianza del 95%, el valor crítico es aproximadamente igual a:
A) 5,143
B) 7,260
C) 10,92

15) El resultado obtenido:


A) Es significativo para un nivel de confianza del 99%
B) Es significativo para un nivel de confianza del 95%, pero no lo es para un nivel de confianza del 99%
C) No es significativo para los niveles de confianza de 95 y 99%
-3-
16) Para un nivel de confianza del 95%, el valor 𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 para realizar comparaciones múltiples dos a dos, es
igual a:
A) 3,82
B) 2,00
C) 2,62

𝑐2 2
𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 = √(𝑎 − 1) ∙ 𝐹(1−𝛼),(𝑎−1),(𝑁−𝑎) √𝑀𝐶𝐼𝑛𝑡𝑟𝑎 [∑ ( 𝑖 ⁄𝑛𝑖 )] = √(3 − 1) ∙ 5,143 ∙ 1 ∙ = 2,619
3

17) En un ANOVA de dos factores, cuando la interacción no es significativa:


A) Es preciso rehacer el análisis focalizándolo sólo sobre los efectos principales.
B) Disminuye la suma de cuadrados de error.
C) Las opciones A y B son ciertas.

SITUACIÓN 3. El estilo atributivo interno ante situaciones negativas hace referencia a la tendencia persistente
de algunas personas a atribuir a sus propias características personales internas (torpeza, incapacidad,
irresponsabilidad, etc) el origen causal de las diferentes situaciones negativas o fracasos que experimentan a lo
largo del tiempo (suspender un examen, amonestación, separación, etc.) lo que les hace más propensas a
experimentar síntomas depresivos, cuando tienen que enfrentarse a situaciones similares. En un trabajo
publicado en la Revista de Psicopatología y Psicología Clínica por Sanjuán, Pérez-García, Rueda y Ruiz (2008) se
señala que, en una muestra de mujeres universitarias, los síntomas depresivos pierden su asociación con el
estilo atribucional cuando se controla el efecto de los síntomas de ansiedad.

Imagine que usted dispone de una muestra de 62 varones que responden a tres cuestionarios para medir el
estilo atribucional (E), los síntomas de Ansiedad (A) y Depresión (D) ante situaciones negativas, siendo sus
desviaciones típicas 12,5, 3,2 y 3,5 respectivamente. También obtiene las siguientes correlaciones simples
entre las puntuaciones del cuestionario de Estilo atribucional (E) y los de Ansiedad (A) y Depresión (D):
𝑟𝐸𝐴 = 0,26, 𝑟𝐸𝐷 = 0,32, 𝑟𝐷𝐴 = 0,39.

18) La correlación entre el estilo atribucional (E) y la ansiedad (A):


A) No es significativa, en ningún caso.
B) Es significativa con p < 0,05.
C) Es significativa con p < 0,01.

𝑟𝑥𝑦 √𝑛 − 2 0,26√62 − 2 𝑇𝑎𝑏𝑙𝑎 𝑇 𝑑𝑒 𝑆𝑡𝑢𝑑𝑒𝑛𝑡 (60 𝑔.𝑙.)


𝑇= = = 2,086 → 0,02 < 𝑝 < 0,05
2
√1 − 𝑟𝑥𝑦 √1 − 0,262

19) ¿Qué porcentaje de la variabilidad de las puntuaciones en el cuestionario de estilo atribucional (E) se debe
a la depresión:
A) 10,24%
B) 67,6%
-4-
C) 1,02%

2
𝑟𝐸𝐷 = 0,322 = 0,1024 → 10,24%

20) Si queremos medir la relación entre el estilo atribucional (E), y la ansiedad, (A), eliminando de ambas
variables la influencia de la depresión (D), debemos calcular:
A) La correlación múltiple de E con A y D.
B) La correlación parcial entre E y A.
C) La correlación semiparcial entre A y E.

21) ¿Qué porcentaje de la variabilidad del estilo atribucional queda sin explicar por la depresión y la ansiedad?:
A) 64,8%
B) 12,4%
C) 87,6%

2 2
2
𝑟𝑦1 + 𝑟𝑦2 − 2𝑟𝑦1 𝑟𝑦2 𝑟12 0,262 + 0,322 − 2 ∙ 0,26 ∙ 0,32 ∙ 0,39
𝑅𝑦.12 = = = 0,124
1 − 𝑟212 1 − 0,392

1 − 0,124 = 0,876 → 87,6%

22) En puntuaciones directas, los coeficientes de regresión para pronosticar las puntuaciones del estilo
atribucional en función de la depresión y la ansiedad son, respectivamente:
A) 0,26 y 0,16
B) 0,92 y 0,62
C) 0,15 y 0,39

𝑟𝐸𝐷 − 𝑟𝐸𝐴 𝑟𝐴𝐷 0,32 − 0,26 ∙ 0,39 𝑆𝐸 12,5


𝛽𝐷 = 2 = = 0,26; 𝐵𝐷 = 𝛽1 = 0,26 = 0,92
1 − 𝑟𝐴𝐷 1 − 0,392 𝑆𝐷 3,5

𝑟𝐸𝐴 − 𝑟𝐸𝐷 𝑟𝐴𝐷 0,26 − 0,32 ∙ 0,39 𝑆𝐸 12,5


𝛽𝐴 = 2 = = 0,16 ; 𝐵𝐴 = 𝛽1 = 0,16 = 0,62
1 − 𝑟𝐴𝐷 1 − 0,392 𝑆𝐴 3,2

23) La ordenada en el origen de la ecuación de regresión en puntuaciones diferenciales de la variable E en


función de las variables D y A:
A) Es el mismo que en puntuaciones directas.
B) Siempre vale cero.
C) Su valor depende de las medias de cada variable.

24) Para determinar qué parte de la variabilidad del estilo atribucional (E) se debe exclusivamente a la
depresión (D) debemos calcular:
A) El coeficiente de determinación múltiple.
B) El cuadrado del coeficiente de correlación parcial.
C) El coeficiente de correlación semiparcial.

25) ¿Qué representa el coeficiente de determinación múltiple ajustado?:


A) Es una estimación insesgada de la correlación poblacional al cuadrado.
-5-
B) La proporción de varianza de Y que se ajusta a la varianza de X.
C) Es el que se obtiene mediante al ajuste mínimo cuadrático.

-6-
Modelo C. Septiembre de 2016. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir
texto

SITUACIÓN 1. En un estudio de Paredes y Moreno (2015) publicado en la Revista de Psicología Clínica con niños
y adolescentes, se analizan y comparan las competencias lingüísticas en los niveles morfológicos y pragmáticos
del lenguaje entre menores con trastornos específicos del lenguaje (TEL) y aquellos con sintomatología
hiperactiva-atencional (TDAH), encontrando diferencias significativas en los niveles de análisis morfológico y
pragmático, siendo el grupo con sintomatología hiperactiva-atencional el que presenta mayores dificultades a
nivel pragmático del lenguaje (su uso en distintas situaciones de comunicación e interacción social).

Imagine que dispone de una muestra de 42 niños de entre 6 y 11 años de los que 26 presentan trastorno
específico del lenguaje (TEL) y el resto sintomatología de trastorno por déficit de atención con hiperactividad
(TDAH). A todos ellos se les administra la Batería de Lenguaje Objetiva y Criterial, BLOC, cuyas puntuaciones se
distribuyen normalmente en la población, para evaluar las diferentes áreas básicas del lenguaje. En el nivel
pragmático del BLOC se obtuvieron los resultados que se muestran en la tabla (puntuaciones más bajas indican
competencias lingüísticas más bajas y mayor dificultad).

Medias Desviaciones típicas insesgadas


TDAH 26 11
TEL 49 16

1) Con un nivel de confianza del 95%, el intervalo de confianza de la media poblacional de los niños con TDAH
en la batería BLOC, es un valor comprendido, aproximadamente, entre:
A) 20,7 y 31,4
B) 22,1 y 29,9
C) 20,1 y 31,9
𝑆𝑛−1 11 11
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 = 𝑡16−1;0,975 = 2,131 = 5,86
√𝑛 √16 √16
31,86
𝑌̅ ± 𝐸𝑚𝑎𝑥 → 23 ± 5,86 → {
20,14

2) Con un nivel de confianza del 95%, el intervalo de confianza para la varianza poblacional de las puntuaciones
en la batería BLOC de los niños con trastornos específicos del lenguaje (TEL), es:
A) 157,5 y 487,8
B) 136,4 y 608,4
C) 13,12 y 40,6

2
(𝑛 − 1)𝑆𝑛−1 (26 − 1)162 2
(𝑛 − 1)𝑆𝑛−1 (26 − 1)162
𝑙𝑖 = 2 = = 157,455 𝑙𝑠 = 2 = = 487,816
𝜒𝑛−1;1−𝛼⁄ 40,6465 𝜒𝑛−1;𝛼⁄ 13,1197
2 2

3) En un contraste de hipótesis bilateral sobre una media poblacional, ¿puede utilizarse el intervalo de
confianza para contrastar dicha hipótesis?

-1-
A) Sí, y se rechaza 𝑯𝟎 cuando el valor formulado en la 𝑯𝟎 se encuentra fuera del intervalo de confianza.
B) Sí, y se rechaza 𝐻0 cuando el estadístico de contraste se encuentra fuera del intervalo de confianza.
C) El intervalo de confianza no aporta información para rechazar o no 𝐻0

4) Si quisiéramos comparar las competencias lingüísticas medias en los niveles morfológicos y pragmáticos de
los niños con TEL, aplicaríamos:
A) La prueba Z para dos muestras independientes.
B) La prueba Z para dos muestras relacionadas.
C) La prueba T para muestras relacionadas.

5) Si a partir de los datos de la muestra de niños con TDAH quisiéramos comprobar que la varianza poblacional
de las puntuaciones en la batería BLOC es mayor de 500 puntos, la hipótesis nula que formulamos es:
A) 𝜎 2 ≥ 500
B) 𝜎 2 = 0
C) 𝝈𝟐 ≤ 𝟓𝟎𝟎

Si quisiéramos corroborar los resultados obtenidos por Paredes y Moreno (2015) respecto a que el grupo con
sintomatología hiperactiva-atencional (TDAH) es el que presenta mayores dificultades (puntuaciones más bajas
en la batería BLOC) a nivel pragmático respecto a los niños con sintomatología TEL:

6) La hipótesis nula que formularemos es:


A) 𝑯𝑻𝑫𝑨𝑯 ≥ 𝑯𝑻𝑬𝑳
B) 𝐻𝑇𝐷𝐴𝐻 = 𝐻𝑇𝐸𝐿
C) 𝐻𝑇𝐷𝐴𝐻 ≤ 𝐻𝑇𝐸𝐿

7) Para poner a prueba la hipótesis de la pregunta anterior, y asumiendo la homogeneidad de las varianzas
poblacionales, el valor absoluto del estadístico de contraste, y su nivel crítico p, valen aproximadamente:
A) 5,05 (p < 0,01)
B) 2,42 (0,01 < p < 0,05)
C) 3,27 (p > 0,01)

𝑌̅1 − 𝑌̅2 26 − 49 𝑇𝑎𝑏𝑙𝑎 𝑇


𝑇= = = −5,05 → 𝑝 < 0,005
2 2
(𝑛 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 1 1 √(16 − 1)11 + (26 − 1)16 ( 1 + 1 )
√ 1 (𝑛 + 𝑛 ) 16 + 26 − 2 16 26
𝑛1 + 𝑛2 − 2 1 2

8) Con los resultados obtenidos en las preguntas anteriores, se concluye que entre los dos grupos de niños:
A) No existen diferencias significativas.
B) El grupo con TDAH presenta mayores dificultades a nivel pragmático del lenguaje para 𝑵𝑪 = 𝟗𝟗%
C) El grupo con TEL presenta mayores dificultades a nivel pragmático del lenguaje para 𝑁𝐶 = 95%

9) La probabilidad de rechazar una hipótesis nula que es verdadera, recibe el nombre de:
A) Potencia del contraste.
B) Error tipo II.
C) Nivel de significación.

10) El nivel crítico p, representa la probabilidad:


A) De rechazar la hipótesis nula cuando es cierta.
B) De rechazar la hipótesis alternativa si es cierta.
-2-
C) De obtener unos datos como los observados o más extremos siendo cierta la hipótesis nula.

SITUACIÓN 2. Utilizando una muestra de 18 sujetos, se pretende comprobar la eficacia de 3 métodos de


enseñanza (𝑎1 , 𝑎2 𝑦 𝑎3 ) y la realización o no de prácticas (𝑏1 𝑦 𝑏2 ), para lo que se asignan aleatoriamente los
sujetos de la muestra a cada una de las combinaciones posibles de tratamientos (método de enseñanza x
realización de prácticas). Se asume que los datos cumplen los supuestos necesarios. Conociendo las siguientes
razones básicas: [𝐴𝐵] = 753; [𝑌] = 763 𝑦 [𝑇] = 612,5 y los datos de la matriz AB.

Matriz AB
𝑎1 𝑎2 𝑎3
Con prácticas (𝑏1 ) 15 24 30
Sin prácticas (𝑏2 ) 6 9 21

Se trata de un diseño de dos factores con muestras independientes, donde:


𝑎 = 3; 𝑏 = 2; 𝑛 = 3 𝑦 𝑁 = 18

Conociendo la matriz AB, obtenemos fácilmente [A] y [B]:

𝑎1 𝑎2 𝑎3 212 + 332 + 512


[𝐴] = = 688,5
𝑏1 15 24 30 69 3∙2
𝑏2 6 9 21 36
692 + 362
21 33 51 105 [𝐵] = = 673
3∙3

A continuación calculamos las sumas de cuadrados:


𝑆𝐶𝐴 = [𝐴] − [𝑇] = 688,5 − 612,5 = 76 𝑆𝐶𝐵 = [𝐵] − [𝑇] = 673 − 612,5 = 60,5
𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = [𝑌] − [𝐴𝐵] = 763 − 753 = 10 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = [𝑌] − [𝑇] = 763 − 612,5 = 150,5

𝑆𝐶𝐴𝐵 = [𝐴𝐵] − [𝐵] − [𝐴] + [𝑇] = 753 − 688,5 − 617 + 612,5 = 4

Finalmente construimos la tabla de ANOVA:

FV SC g.l. MC F p F tabla
A 76,00 2 38,00 45,600 0,0000 3,885
B 60,50 1 60,50 72,600 0,0000 4,747
A×B 4,00 2 2,00 2,400 0,1328 3,885
Intra 10,00 12 0,83
Total 150,50 17 8,85

11) Se trata de un diseño:


A) De dos factores con muestras independientes.
B) De un factor con muestras independientes.
C) De un factor con muestras relacionadas.
-3-
12) Los grados de libertad para el estadístico de contraste correspondientes a la interacción, son:
A) 1 y 12
B) 2 y 12
C) 12 y 17

13) El número de efectos simples es igual a:


A) 4
B) 5
C) 6

14) Tras realizar el ANOVA, se observa que:


A) No es significativa la interacción, pero sí existen diferencias significativas entre los métodos de
enseñanza y entre la realización o no de prácticas.
B) Los tres estadísticos de contraste son significativos.
C) Ningún estadístico de contraste es significativo.

15) Para 𝛼 = 0,01, respecto a la realización o no de prácticas:


A) Se acepta 𝐻0 , los resultados son iguales realizando o no prácticas.
B) Se rechaza 𝑯𝟎 , los resultados son mejores (mayores puntuaciones) con prácticas.
C) Es necesario aplicar la prueba de Scheffé para comprobar si los resultados fueron mejor con prácticas.

16) En un ANOVA de un factor con más de dos muestras independientes, ¿utilizaría la prueba t de Student para
realizar comparaciones múltiples dos a dos?:
A) Sí, porque es la mejor opción.
B) No porque se incrementa la probabilidad de aceptar 𝐻0 siendo falsa.
C) No porque se incrementa la probabilidad de rechazar 𝑯𝟎 siendo verdadera.

17) En un ANOVA de medidas repetidas de un factor, la variabilidad total observada en la variable dependiente
se descompone en tres componentes, los dos primeros corresponden a la variabilidad del factor que
estamos manipulando y la variabilidad de los sujetos. El tercer componente hace referencia a:
A) La variabilidad de la interacción entre el factor y los sujetos.
B) Las desviaciones de las puntuaciones de los sujetos respecto a la combinación de tratamientos.
C) Ninguna de las opciones anteriores es correcta.

SITUACIÓN 3. Se aplica un programa de tratamiento del hábito de fumar a un único sujeto durante siete
semanas (𝑛 = 7). Se desea pronosticar el número de cigarros fumados (Y) en función del número de semana
de tratamiento (X). A partir de los siguientes sumatorios: ∑ 𝑋 = 28; ∑ 𝑌 = 98; ∑ 𝑋𝑌 = 338; ∑ 𝑋 2 =
140; ∑ 𝑌 2 = 1484.
18) El coeficiente de correlación de Pearson entre X e Y vale, aproximadamente:
A) 0,930
B) – 0,93033
C) – 𝟎, 𝟗𝟔𝟒

𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 7 ∙ 338 − 28 ∙ 98
𝑟𝑥𝑦 = = = −0,964
√[𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 ][𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ] √(7 ∙ 140 − 282 )(7 ∙ 1484 − 982 )
-4-
19) El estadístico de contraste y el nivel crítico para comprobar si la relación entre X e Y es significativa valen,
aproximadamente:
A) 𝑇 = 8,14 (𝑝 > 0,01)
B) 𝑇 = −2,73 (𝑝 < 0,02)
C) 𝑻 = −𝟖, 𝟏𝟒 (𝒑 < 𝟎, 𝟎𝟏)

𝑟𝑥𝑦 √𝑛 − 2 −0,964√7 − 2
𝑇= = = −8,14
√1 − 2
𝑟𝑥𝑦 √1 − 0,9642

20) La ecuación de regresión de Y sobre X obtenida es:


A) 𝑌´ = −0,964𝑋
B) 𝑌´ = −0,93𝑋
C) 𝒀´ = 𝟐𝟏, 𝟕𝟏 − 𝟏, 𝟗𝟑𝑿

𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 7 ∙ 338 − 28 ∙ 98
𝐵= = = −1,93
𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 7 ∙ 140 − 282

𝐵0 = 𝑌̅ − 𝐵𝑋̅ = 14 − (−1,93)7 = 21,71

21) Según la ecuación de regresión obtenida, por cada dos semanas de tratamiento, el número de cigarros
fumados disminuirá en, aproximadamente:
A) 4 cigarros
B) 2 cigarros
C) Dependerá de la semana en cuestión.

Por cada semana de tratamiento el número de cigarros fumados disminuye en 1,93, luego en dos
semanas: 1,93 ∙ 2 = 3,86 ≈ 4

22) Según la ecuación de regresión obtenida, el número de semanas necesario para que el sujeto deje de
fumar (𝑌 ′ = 0) es:
A) 8 semanas.
B) Entre 8 y 9 semanas.
C) Entre 11 y 12 semanas.

0 = 21,71 − 1,93𝑋 → 𝑋 = 11,25

23) Para que sean válidas las inferencias que sobre la variable dependiente se hagan con la recta de regresión,
las varianzas de las distribuciones de los errores, condicionadas a los diferentes valores de la variable
independiente deben de cumplir el supuesto de:
A) Heterocedasticidad.
B) Homocedasticidad.
C) Uniformidad.

24) Para la regresión lineal simple se obtienen dos coeficientes, ordenada en el origen (𝐵0) y pendiente (𝐵).
Generalmente, estaremos más interesados en interpretar:
-5-
A) 𝐵0
B) 𝑩
C) Depende de la magnitud del coeficiente de correlación de Pearson.

25) Con dos variables independientes (𝑋1 ; 𝑋2) y una variable dependiente (𝑌), el coeficiente de correlación
parcial entre 𝑋1 e 𝑌, representa:
A) La relación entre 𝑌 y 𝑋1 eliminando el influjo de 𝑋2 sobre la variable dependiente.
B) La relación entre 𝒀 y 𝑿𝟏 eliminando el influjo de 𝑿𝟐 sobre la variable dependiente y sobre 𝑿𝟏 .
C) La relación entre 𝑌 y 𝑋2 eliminando el influjo de 𝑋1 sobre la variable dependiente y sobre 𝑋2.

-6-
Modelo A. Enero de 2017. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y calculadora en la que no se pueda introducir texto

SITUACIÓN 1.Aliri, Garaigordobil y Martínez-Valderrey (2013) publican un trabajo en el que se analizan las
diferencias en actitudes sexistas en función del tipo de colegio. Para ello utilizan una muestra de adolescentes de 11 a
17 años de la ESO escolarizados en distintos centros educativos de Guipúzcoa (Guipuzkoa) de los que el 40,3%
estudiaban en colegios privados religiosos y el resto en colegios no religiosos (públicos o privados). Sus resultados
indican que los chicos que estudian en colegios religiosos son más sexistas que los que estudian en colegios no
religiosos, mientras que en las chicas no aparecen estas diferencias.

Usted desea comprobar si estos resultados también se producen en su localidad, para lo que selecciona una
muestra de 300 adolescentes, de los que el 47% son chicos y de estos 61 estudian en colegios religiosos (CR). A todos
se les pasa el Inventario de Sexismo Ambivalente para adolescentes(ISA), en el que a mayor puntuación mayor
sexismo. Los chicos de colegios religiosos (CR) obtienen una media de 3,9 con una desviación típica insesgada de
0,75 mientras que los chicos de colegios no religiosos (CNR) tienen una media de 3,4 y desviación típica insesgada de
0,84.

1) Con los datos de su trabajo, el valor del estadístico de contraste sobre la igualdad de varianzas entre los chicos de
colegios no religiosos (CNR) y los chicos de colegios religiosos (CR) es, aproximadamente:
A) 1,25
B) 1,67
C) 0,68

Sobre la muestra de 300 adolescentes, el número de chicos es igual a: 𝑛𝑛º 𝑐𝑐ℎ𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 = 300 × 0,47 = 141

Dado que 61 chicos estudian en colegios religiosos, el número de chicos que estudian en colegios no religiosos es
iguala a: 141 − 61 = 80

Tenemos por lo tanto dos muestras independientes (para los chicos) con los siguientes datos:

n Media Cuasi D. típica


Colegios religiosos (CR) 61 3,9 0,75
Colegios no religiosos (CNR) 80 3,4 0,84

El estadístico de contraste sobre igualdad de varianzas entre los chicos de colegios no religiosos y los chicos de
colegios religiosos es:

𝑆𝑆̂𝐶𝐶𝐶𝐶𝐶𝐶
2
0,842
𝐹𝐹 = = = 1,254
𝑆𝑆̂𝐶𝐶𝐶𝐶
2 0,752

2) El nivel crítico p, para tomar una decisión respecto a la hipótesis de igualdad de varianzas es:
A) 𝑝𝑝 < 0,10
B) 𝒑𝒑 > 0,10
C) 𝑝𝑝 < 0,05

-1-
Tenemos 79 y 60 g.l. siendo los más próximos en las tablas: 60 y 60 g.l. Observamos que en dichas tablas que:
𝑓𝑓60;60;0,90 = 1,395, y como el contraste es bilateral, multiplicamos por dos la probabilidad de las tablas, con lo que:
𝑝𝑝 > 0,20.

3) Si en el trabajo original de Aliri et al. (2013)utilizaron una muestra de 1.440 adolescentes para responder al ISA,
¿entre que valores se encontrará la proporción poblacional de adolescentes escolarizados en colegios no
religiosos, con un nivel de confianza del 95%?:
A) 36,9% - 41,4%
B) 57,2% - 62,2%
C) 37,8% - 42,8%

En la muestra del estudio de Aliri, el 40,3% estudian en colegios religiosos, por lo que la proporción de
adolescentes escolarizados en colegios no religiosos, es:

𝑝𝑝 = 1 − 0,403 = 0,597

Y el error máximo de estimación, con un nivel de confianza del 95%, es:

𝑝𝑝(1 − 𝑝𝑝) 0,597 ∙ (1 − 0,597)


𝐸𝐸𝑚𝑚𝑚𝑚𝑚𝑚 = 𝑧𝑧1−𝛼𝛼�2 𝜎𝜎𝑃𝑃 = 𝑧𝑧1−𝛼𝛼�2 𝜎𝜎𝑃𝑃 = � 𝑛𝑛 = 1,96� = 0,0253
1440

Por lo que el intervalo de confianza, resulta: 𝑝𝑝 ± Emax : 0,597 ± 0,025 = ( 0,572 ; 0,622)

Lo que indica que la proporción poblacional de adolescentes escolarizados en colegios no religiosos se


encuentra, expresado en términos de porcentaje, entre el 57,2% y el 62,2%

4) Si su hipótesis es que los chicos de colegios religiosos son más sexistas que los de colegios públicos, la hipótesis
nula a contrastar, es:
A) 𝜇𝜇𝐶𝐶𝐶𝐶 = 𝜇𝜇𝐶𝐶𝐶𝐶𝐶𝐶
B) 𝜇𝜇𝐶𝐶𝐶𝐶 ≥ 𝜇𝜇𝐶𝐶𝐶𝐶𝐶𝐶
C) 𝝁𝝁𝑪𝑪𝑪𝑪 ≤ 𝝁𝝁𝑪𝑪𝑪𝑪𝑪𝑪

Si su hipótesis es que los chicos de colegios religiosos son más sexistas, se está indicando la dirección de la
diferencia 𝜇𝜇𝐶𝐶𝐶𝐶 > 𝜇𝜇𝐶𝐶𝐶𝐶𝐶𝐶 . Esta sería la hipótesis alternativa. La hipótesis nula es la complementaria que siempre
incluye el signo "igual". Las hipótesis que se han de plantear son:

𝐻𝐻0 : 𝜇𝜇𝐶𝐶𝐶𝐶 ≤ 𝜇𝜇𝐶𝐶𝐶𝐶𝐶𝐶

𝐻𝐻1 : 𝜇𝜇𝐶𝐶𝐶𝐶 > 𝜇𝜇𝐶𝐶𝐶𝐶𝐶𝐶

5) Para contrastar la hipótesis anterior, la analizaría bajo las condiciones de un diseño de:

-2-
A) Dos muestras independientes provenientes de poblaciones con la misma varianza.
B) Dos muestras relacionadas, porque son estudiantes, adolescentes y de la ESO.
C) Dos muestras independientes provenientes de poblaciones con varianzas distintas.

6) Con los resultados obtenidos en su trabajo, el valor absoluto del estadístico de contraste vale, aproximadamente:
A) 3,67
B) 2,6
C) 1,64

El estadístico de contraste para dos muestras independientes que provienen de poblaciones con varianzas
desconocidas pero iguales, es:

𝑌𝑌�1 − 𝑌𝑌�2 3,9 − 3,4


𝑇𝑇 = = = 3,666
(𝑛𝑛 1 −1)𝑆𝑆̂12 +(𝑛𝑛 2 −1)𝑆𝑆̂22 1 1 60∙0,84 2 +79∙0,75 2 1 1
� � + � � � + �
𝑛𝑛 1 +𝑛𝑛 2 −2 𝑛𝑛 1 𝑛𝑛 2 61+80−2 61 80

7) El estadístico d de Cohen resultante de sus datos es, aproximadamente:


A) 0,68
B) 0,59
C) 0,62

|𝑌𝑌�1 − 𝑌𝑌�2 | |3,9 − 3,4|


𝑑𝑑 = = = 0,623
(𝑛𝑛 1 −1)𝑆𝑆̂12 +(𝑛𝑛 2 −1)𝑆𝑆̂22 60∙0,84 2 +79∙0,75 2
� �
𝑛𝑛 1 +𝑛𝑛 2 −2 61+80−2

8) Si el valor del estadístico de Cohen, obtenido a partir de sus datos, fuera 0,65, ¿Cuál de las siguientes
afirmaciones es FALSA?:
A) El 65% de los chicos escolarizados en CR muestran unas actitudes sexistas superiores a la media de los chicos
escolarizados en CNR.
B) El 74,22% de los chicos escolarizados en CR muestran unas actitudes sexistas superiores a la media de los
chicos escolarizados en CNR.
C) El 74,22% de los chicos escolarizados en CNR muestran unas actitudes sexistas inferiores a la media de los
chicos escolarizados en CR.

A partir de la puntuación d=0,65 y consultando las tablas de la distribución normal, se observa que las
alternativas B y C, son ciertas y se representan en la siguiente figura:
B) C)

9) La distribución muestral de cualquier estadístico obtenido de una muestra aleatoria es:


A) Insesgada.
B) Un parámetro.
C) Una variable aleatoria.

-3-
10) La potencia del contraste se puede expresar simbólicamente como:
A) 𝑃𝑃(𝐻𝐻0 = 𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 | 𝐻𝐻0 = 𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓𝑓)
B) 𝑃𝑃(𝐻𝐻0 = 𝑟𝑟𝑟𝑟𝑟𝑟ℎ𝑎𝑎𝑎𝑎𝑎𝑎𝑎𝑎 | 𝐻𝐻0 = 𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐𝑐)
C) 𝑷𝑷(𝑯𝑯𝟎𝟎 = 𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓𝒓 | 𝑯𝑯𝟎𝟎 = 𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇𝒇)
La potencia del contraste es una decisión correcta que corresponde a la probabilidad de rechazar una Ho cuando es
FALSA:

SITUACIÓN 2.Aliri, Garaigordobil y Martínez-Valderrey (2013) publican un trabajo en el que se analizan las
diferencias en actitudes sexistas en función del tipo de colegio. Para ello utilizan una muestra de adolescentes de 11 a
17 años de la ESO escolarizados en distintos centros educativos de Guipúzcoa (Guipuzkoa) de los que el 40,3%
estudiaban en colegios privados religiosos y el resto en colegios no religiosos. Sus resultados indican que los chicos
que estudian en colegios religiosos son más sexistas que los que estudian en colegios no religiosos, mientras que en
las chicas no aparecen estas diferencias.

11) En este trabajo, las variables independientes son:


A) El tipo de colegio y las actitudes sexistas.
B) Las actitudes sexistas y el sexo.
C) El tipo de colegio y el sexo.

12) Los resultados indican que:


A) Existe interacción entre el tipo de colegio y el sexo.
B) No existe interacción de la variable independiente sobre la variable dependiente.
C) No es posible hacer referencia a ningún tipo de interacción.

Existe interacción cuando los efectos de una VI son diferentes para cada uno de los niveles de la otra variable
independiente. Y esto es lo que se refleja al señalar que " Sus resultados indican que los chicos que estudian en
colegios religiosos son más sexistas que los que estudian en colegios no religiosos, mientras que en las chicas no
aparecen estas diferencias".

13) El análisis de los resultados de este trabajo se realiza desde la estrategia de un diseño:
A) Unifactorial de muestras independientes.
B) Factorial 2x2.
C) De regresión con dos variables independientes o predictoras.

Dos variables independientes (tipo de colegio y sexo) con dos niveles en cada una (religiosos vs no religiosos, y chico
vs chica)

Posteriormente usted desea comprobar si estos resultados también se producen en su localidad, para lo que
selecciona una muestra de 300 adolescentes, de los que el 53% son chicas y de estas 61 estudian en colegios
privados religiosos (PRR), 29 en colegios privados no religiosos (PRN) y el resto en colegios públicos no religiosos
(PUN). Todas ellas responden alInventario de Sexismo Ambivalente para adolescentes(ISA) obteniendo los siguientes
resultados en el análisis: 𝑆𝑆𝑆𝑆𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 = 672 y 𝑀𝑀𝑀𝑀𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼 = 14. Se cumplen los supuestos necesarios para comprobar si el
tipo de colegio influye en las actitudes sexistas de las chicas.

-4-
Se utiliza una muestra de 300 adolescentes de los que el 53% son chicas. Y de estas sabemos cuántas están
escolarizadas en colegios privados religiosos (PRR), privados no religiosos (PRN) y públicos no religiosos (PUN). Se
pide comprobar si el tipo de colegio influye en las actitudes sexistas de las chicas. Se trata, por tanto, de un ANOVA
de un factor con tres niveles (PRR, PRN y PUN) siendo el N referido a las chicas: 𝑁𝑁 = 0,53 ∙ 300 = 159. Los datos
aportados en el enunciado son:

FV SC gl MC F
Inter 𝑎𝑎 − 1 = 3 − 1 = 2 14
Intra
Total 672 𝑁𝑁 − 1 = 159 − 1 = 158

Completamos la tabla de ANOVA:

FV SC gl MC F
Inter 2 ∙ 14 = 28 2 14
644� 14
Intra 672 − 28 = 644 158 − 2 = 156 156 = 4,128 = 3,391
4,128
Total 672 158

14) Los datos los analiza mediante:


A) Un ANOVA con tres factores: PRR, PRN y PUN.
B) Un ANOVA unifactorial de efectos fijos.
C) Un ANOVA unifactorial de efectos aleatorios.

Un factor que corresponde al tipo de colegio con tres niveles PRR, PRN y PUN.

15) El estadístico de contraste que obtiene es, aproximadamente:


A) 3,4
B) 6,5
C) 5,7

16) La interpretación de los resultados obtenidos en su análisis es:


A) No existen diferencias significativas en las chicas (𝑝𝑝 > 0,05).
B) Existen diferencias significativas con un nivel de significación de 0,05 pero no con 0,01 (𝟎𝟎, 𝟎𝟎𝟎𝟎 < 𝑝𝑝 < 0,05).
C) Las diferencias son significativas (𝑝𝑝 < 0,001).

Consultamos las tablas de F con 2 y 120 gl (el valor más aproximado a 158 gl) y figuran los siguientes:
F= 3,072 que deja a su izquierda una probabilidad
de 0,95 y a su derecha de 0,05

F= 4,787 que deja a su izquierda una probabilidad


de 0,99 y a su derecha de 0,01.

El estadístico de contraste F=3,391 se encuentra


entre ambos valores críticos por lo que el nivel
crítico p es mayor que 0,01 y menor que 0,05.

-5-
17) Si desea comprobar que la media de las chicas de colegios privados religiosos es igual que la media de las chicas
de los otros dos colegios, ¿cuál de las siguientes sería su hipótesis nula?:
A) μ𝑃𝑃𝑃𝑃𝑃𝑃 = μ𝑃𝑃𝑃𝑃𝑃𝑃 + μ𝑃𝑃𝑃𝑃𝑃𝑃
B) (2) μ𝑃𝑃𝑃𝑃𝑃𝑃 + (1) μ𝑃𝑃𝑃𝑃𝑃𝑃 + (1) μ𝑃𝑃𝑃𝑃𝑃𝑃 = 0
C) (𝟏𝟏)𝛍𝛍𝑷𝑷𝑷𝑷𝑷𝑷 + (𝟏𝟏)𝛍𝛍𝑷𝑷𝑷𝑷𝑷𝑷 + (−𝟐𝟐)𝛍𝛍𝑷𝑷𝑷𝑷𝑷𝑷 = 𝟎𝟎

La Ho es: "la media de las chicas de colegios privados religiosos es igual que la media de las chicas de los otros
dos colegios", es decir:

μPRN + μPUN
H0 : μ𝑃𝑃𝑃𝑃𝑃𝑃 = → (2)μ𝑃𝑃𝑃𝑃𝑃𝑃 = (1)μ𝑃𝑃𝑃𝑃𝑃𝑃 + (1)μ𝑃𝑃𝑃𝑃𝑃𝑃
2
que se puede expresar de varias formas, alterando el orden de los sumandos, como:

H0 : (2)μ𝑃𝑃𝑃𝑃𝑃𝑃 − (1)μ𝑃𝑃𝑃𝑃𝑃𝑃 − (1)μ𝑃𝑃𝑃𝑃𝑃𝑃 = 0

𝐇𝐇𝟎𝟎 : (𝟏𝟏)𝛍𝛍𝑷𝑷𝑷𝑷𝑷𝑷 + (𝟏𝟏)𝛍𝛍𝑷𝑷𝑷𝑷𝑷𝑷 + (−𝟐𝟐)𝛍𝛍𝑷𝑷𝑷𝑷𝑷𝑷 = 𝟎𝟎

H0 : (1)μ𝑃𝑃𝑃𝑃𝑃𝑃 + (−2)μ𝑃𝑃𝑃𝑃𝑃𝑃 + (1)μ𝑃𝑃𝑃𝑃𝑃𝑃 = 0

Pero en cualquier caso, la alternativa correcta es la C)

18) El valor crítico para rechazar o no la hipótesis nula formulada en la pregunta anterior, se obtiene.
A) En la tabla de la distribución t con 𝑁𝑁 − 1 g.l.
B) En la tabla de la distribución F con 𝑛𝑛1 − 1 y 𝑛𝑛2 − 1 g.l.
C) A partir del rango mínimo de Scheffé.

La pregunta anterior (la nº 17) hace referencia a lo que se conocen como contrastes "a posteriori", "post hoc",
comparaciones múltiples o no planificados y, como se indica en la página 176 del texto:

19) En un modelo de ANOVA de efectos aleatorios:


A) El investigador establece como niveles del factor sólo aquellos en los que está interesado en estudiar.
B) Se considera que los “i” niveles del factor son una muestra aleatoria de todos los posibles niveles.
C) Todos los modelos de ANOVA son de efectos aleatorios.

La alternativa A) hace referencia al modelo de efectos fijos mientras que la alternativa B) hace referencia al
modelo de efectos aleatorios que se describen en el tema 5 epígrafes 5.3 y 5.5. La alternativa C) es falsa.

SITUACIÓN 3. García, Alvarado y Jiménez (2000) estudian la capacidad de la regresión lineal para predecir el
rendimiento académico, utilizando una muestra de 175 universitarios de primero de psicología, encontrando que el
rendimiento previo (RP)y la participación (P) son buenos predictores del rendimiento académico (R), obteniendo un
coeficiente de determinación múltiple igual 0,42 y el siguiente modelo de regresión:

𝑅𝑅´ = 2,52 + 0,82 ∙ 𝑅𝑅𝑅𝑅 + 1,13 ∙ 𝑃𝑃

-6-
Imagine que usted dispone de una muestra de 25 estudiantes de psicología para los que obtiene un coeficiente de
correlación de Pearson entre R y RP igual a 0,45, y el siguiente modelo de estimación:

𝑅𝑅´ = 1,5 + 0,75 ∙ 𝑃𝑃


20) En el trabajo de García, Alvarado y Jiménez (2000), la proporción de varianza de R explicada por las dos variables
independientes es igual a:
A) 0,67
B) 0,42
C) 0,20
El coeficiente de determinación se interpreta en términos de % de varianza común o explicada de la VI debida a la
VD. En consecuencia si la correlación es 0,45 el coeficiente de determinación es 0,452= 0,2025 (20,25%). El
20,25% de la varianza (variabilidad) de la variable R se debe a la variación en la variable P.

21) El modelo obtenido por García, Alvarado y Jiménez (2000) pronostica, para un sujeto cuya participación es nula y
cuyo rendimiento previo es igual a 7 puntos, una puntuación en rendimiento académico igual a:
A) 6,62
B) 5,80
C) 8,26

Utilizando la ecuación de regresión para RP=7 y P=0, el pronóstico en R es:

𝑅𝑅´ = 2,52 + 0,82 ∙ 𝑅𝑅𝑅𝑅 + 1,13 ∙ 𝑃𝑃 = 2,52 + 0,82 ∙ 7 + 1,13 ∙ 0 = 8,26

22) Para la muestra de 25 sujetos de la que usted dispone, se desea contrastar si la relación entre R y RP es
significativa. En este caso, se obtiene un estadístico de contraste aproximadamente igual a:
A) 2,42
B) 3,02
C) 1,48

Las hipótesis son:

𝐻𝐻0 : 𝜌𝜌𝑥𝑥𝑥𝑥 = 0
𝐻𝐻1 : 𝜌𝜌𝑥𝑥𝑥𝑥 ≠ 0

Y el estadístico de contraste:
𝑟𝑟𝑥𝑥𝑥𝑥 √𝑛𝑛 − 2 0,45√25 − 2
𝑇𝑇 = = = 2,417
�1 − 2
𝑟𝑟𝑥𝑥𝑥𝑥 �1 − 0,452

23) Para la muestra de 25 sujetos de la que usted dispone, la conclusión sobre el contraste de la pregunta anterior es:
A) La relación entre R y RP no es significativa para un nivel de confianza del 95% (0,10 < 𝑝𝑝 < 0,20).
B) La relación entre R y RP es significativa para un nivel de confianza del 99% (𝑝𝑝 < 0,01).
C) La relación entre R y RP es significativa para un nivel de confianza del 95% (𝟎𝟎, 𝟎𝟎𝟎𝟎 < 𝑝𝑝 < 0,05).

-7-
En la tabla de la distribución T con n-2= 25-2= 23 gl los valores
más aproximados al estadístico de contraste obtenido
(T=2,417) son 2,069 -que deja a su derecha una probabilidad
de 0,025- y 2,5 -que deja a su izquierda una probabilidad de
0,01. Por tanto, el estadístico de contraste, que se encuentra
entre los dos, deja una probabilidad mayor que 0,01 y menor
que 0,025.

24) Con la muestra de 25 sujetos de la que usted dispone, si un sujeto obtiene una puntuación en RP igual a la media
de dicha variable, su puntuación típica pronosticada en la variable R es igual a:
A) Cero.
B) Uno.
C) No disponemos de datos suficientes.
Si la puntuación X es igual a su media , entonces la puntuación típica Z es:

X−� X 0
𝑍𝑍 = = =0
Sx Sx
Y la puntuación típica pronosticada, es:
𝑍𝑍𝑌𝑌 = 𝑟𝑟𝑋𝑋𝑋𝑋 . 𝑍𝑍𝑋𝑋 = 𝑟𝑟𝑋𝑋𝑋𝑋 . 0 = 0

25) Los supuestos necesarios para realizar inferencias sobre correlación y regresión, incluyen:
A) Heterocedasticidad para las varianzas de las distribuciones condicionadas de los errores.
B) Independencia entre los valores estimados Y´ y los errores de estimación ε.
C) Independencia entre los valores de la variable independiente X y los valores estimados Y´.

Puede consultarse el epígrafe 8.3.3. sobre inferencias en la correlación y regresión para comprobar que la
alternativa correcta es la B).

-8-
Modelo C. Febrero de 2017. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y calculadora en la que no se pueda introducir texto

SITUACIÓN 1. García y García (2002) estudian variables biográficas, de aptitudes y de personalidad con el fin de
pronosticar la inserción laboral en el sector de la construcción. Utilizan una muestra de 86 alumnos que finalizan
cursos de formación profesional. La edad media de la muestra es de 23,4 años con una cuasidesviación típica de 5,6
y 75 sujetos han obtenido un nivel de estudios de graduado escolar.

Usted está interesado en estudiar la misma problemática del trabajo de García y García (2002), para lo que dispone
de una muestra de 100 sujetos cuya edad media es de 21,5 años con una cuasivarianza de 65. El 90% de la muestra
tiene un nivel de graduado escolar.

Por otro lado, usted sospecha que en los años transcurridos desde el trabajo de García y García han cambiado las
características de los sujetos que realizan cursos de formación profesional, de manera que en la actualidad dichos
sujetos presentan una edad media menor, mayor varianza en esta variable y una proporción superior de sujetos con
un nivel de estudios de graduado escolar.

1) Con los datos de los que usted dispone, con un nivel de confianza del 95% ¿entre qué valores se encontrará la
proporción poblacional de sujetos que tiene un nivel de estudios de graduado escolar? (realice los cálculos
tomando cuatro decimales).
A) (0,851; 0,949)
B) (0,841; 0,959)
C) (0,823; 0,977)

𝑝 = 0,90; 𝑛 = 100; 𝑁𝐶 = 0,95 → 𝑧1−𝛼⁄2 = 1,96

0,90 ∙ 0,10
𝐸𝑚𝑎𝑥 = 𝑧1−𝛼⁄2 𝜎𝑝 = 1,96 ∙ √ = 0,0588
100

0,9588
𝑝 ± 𝐸𝑚𝑎𝑥 → 0,90 ± 0,0588 → {
0,8412

Para comprobar si la proporción de sujetos con un nivel de estudios de graduado escolar es superior en los
datos de los que usted dispone (Grupo 1) respecto a la de los datos de García y García (Grupo 2)

Los datos son:

DATOS DE LAS MUESTRAS


Usted (Grupo 1) García (Grupo 2)
Nº sujetos con graduado escolar 90 75
n 100 86
p 0,900 0,872

-1-
2) La hipótesis nula es:
A) 𝜋1 − 𝜋2 = 0
B) 𝜋1 − 𝜋2 ≥ 0
C) 𝝅𝟏 − 𝝅𝟐 ≤ 𝟎

Solución:
Como se pude observar en el enunciado, el investigador plantea como hipótesis alternativa que 𝜋1 > 𝜋2 ,
entonces para la hipótesis nula tendremos que:
𝐻0 : 𝜋1 ≤ 𝜋2
𝐻0 : 𝜋1 − 𝜋2 ≤ 0
La opción correcta es la C.

3) El valor del estadístico es, aproximadamente:


A) 𝒁 = 𝟎, 𝟔𝟎
B) 𝑍 = 1,64
C) 𝑍 = 1,45

Solución:
Es un contraste de dos proporciones de muestras independientes, asumiendo que D = 0, luego los cálculos son:
𝑛1 𝑝1 + 𝑛2 𝑝2 100 ∙ 0,9 + 86 ∙ 0,872
𝑃= = = 0,887
𝑛1 + 𝑛2 100 + 86

𝑝1 − 𝑝2 0,9 − 0,872
𝑍= = = 0,60
1 1
√𝑃(1 − 𝑃) ( + ) √0,887(1 − 0,887) ( 1 + 1 )
𝑛1 𝑛2 100 86
Opción correcta A.

4) El nivel crítico es, aproximadamente:


A) 0,05
B) 0,0735
C) 0,2743

Solución:
El contraste es unilateral izquierdo. Acudiendo a la
tabla de curva normal, observamos que la
probabilidad de encontrar una puntuación más
extrema (superior en este caso) a: 𝑍 = 0,60 es:
𝑝 = 1 − 0,7257 = 0,2743

5) Tras realizar el contraste de hipótesis se concluye que:


A) Existen diferencias significativas con un nivel de confianza del 99%.
B) Existen diferencias significativas con un nivel de confianza del 95%, pero no para un nivel de confianza del 99%.
C) No existen diferencias significativas para los niveles de confianza más usuales en psicología.

-2-
Solución:
Dado que: 𝑝 > 0,05 concluimos que no existen diferencias significativas para un 𝑁𝐶 = 95%.

Para comprobar si en los datos que usted obtiene es superior la varianza y menor la media respecto de los
datos de García y García:

Los datos son:

DATOS DE LAS MUESTRAS


Usted García
n 100 86
Media 21,500 23,400
Cuasi var. 65,000
Cuasi D. típ. 5,600

6) El estadístico de contraste y el nivel crítico para comprobar la hipótesis sobre las varianzas son,
aproximadamente:
A) 𝟐, 𝟎𝟕𝟑 (𝒑 < 𝟎, 𝟎𝟏)
B) 1,348 (𝑝 = 0,10)
C) 1,612 (𝑝 < 0,05)

Solución: Es un contraste de varianzas de muestras


independientes con 100 y 86 grados de libertad.
65
𝐹= = 2,073 (𝑝 < 0,01)
5,62
Si buscamos en las tablas de la F con los grados de
libertad más aproximados, obtenemos que para NC =
0.99, el valor de la 𝐹 = 1,726. Como el valor
obtenido es superior a este, podemos asegurar que
𝑝 < 0,01.

7) El estadístico de contraste y el nivel crítico (los grados de libertad son mayores que 100) para comprobar la
hipótesis sobre las medias son, aproximadamente:
A) −3,17 (𝑝 = 0,0008)
B) −2,14 (𝑝 = 0,0162)
C) −𝟏, 𝟖𝟗 (𝒑 = 𝟎, 𝟎𝟐𝟗𝟒)

Solución:
Se trata de un contraste unilateral sobre las medias de dos grupos independientes habiendo verificado previamente
que las varianzas son diferentes (ejercicio 6).

𝑌̅1 − 𝑌̅2 21,5 − 23,4 𝑔.𝑙.>100→𝑇𝑎𝑏𝑙𝑎 𝑑𝑒 𝑐𝑢𝑟𝑣𝑎 𝑛𝑜𝑟𝑚𝑎𝑙


𝑇= = = −1,89 → (𝑝 = 0,0294)
2
𝑆̂ 2 𝑆̂ 2 √ 65 + 5,6
√ 1+ 2 100 86
𝑛1 𝑛2

Hemos utilizado la tabla de la curva normal ya que los g.l. son mayores que 100 como se puede comprobar:
-3-
8) Tras el análisis estadístico sobre las diferencias sobre varianzas y medias se concluye (𝑁𝐶 = 95%), que en los
datos de los que usted dispone:
A) La varianza es mayor y la media es menor que en los datos de García.
B) La varianza es menor y la media es menor que en los datos de García.
C) La varianza es menor y la media es mayor que en los datos de García.

Solución: en los apartados anteriores se ha podido verificar que se rechazó la hipótesis de varianzas iguales ( p <
0,01) así como la hipótesis de medias iguales (p < 0,05). Luego podemos afirmar que la varianza del grupo 1 es
mayor que la varianza del grupo 2 y que la media del grupo 1 es menor que la media del grupo 2. La opción
correcta es la A.

Preguntas teóricas
9) El tamaño del efecto:
A) Es mayor a medida que aumenta el tamaño de las muestras.
B) Es mayor cuanto menor sea la diferencia de medias en valor absoluto entre los grupos experimental y control.
C) No depende del tamaño muestral.
Solución:
A diferencia de lo que sucede con los estadísticos de contraste, la magnitud del tamaño del efecto no depende
del tamaño muestral. La opción A contradice esta afirmación. La opción B es errónea porque, según la fórmula de
la d de Cohen, la diferencia de las medias entre el grupo experimental y control está en el numerador. Por tanto,
cuanto mayor sea esta diferencia, mayor será d; cuanto menor sea esta diferencia, menor será d.

10) La distribución muestral de la proporción sigue el modelo de probabilidad:


A) Binomial.
B) T de Student.
C) Chi cuadrado.

SITUACIÓN 2. Un investigador desea conocer el efecto del aprendizaje musical sobre la memoria de trabajo (MT) en
distintas fases de la vida. Para ello escoge a 30 personas que, por su edad, las agrupa en tres categorías: 10 son
jóvenes, 10 maduros y 10 jubilados. De cada grupo, la mitad tienen competencias musicales y la otra mitad no. En
cada uno de ellos mide la memoria de trabajo (MT) mediante el número de aciertos en la tarea de bloques de Corsi.
En su informe indica que se obtienen resultados significativos, debidos tanto a la Edad como a la interacción Edad x
Competencia Musical (F = 8,22 y F = 6,54, respectivamente utilizando un 𝛼 = 0,05) pero no así para la Competencia
Musical (F = 2,44). Respecto a la edad no se encontraron diferencias significativas para MT en el grupo de jóvenes
debida a la Competencia Musical, pero sí se observan diferencias en los otros dos grupos de edad, y siempre a favor
de personas con competencia musical.

-4-
El diseño es de dos factores independientes. Edad con tres niveles: Jóvenes, Maduros y Jubilados (𝑎 = 3) y
Competencia Musical (CM) con dos niveles (𝑏 = 2). El número total de sujetos es 𝑁 = 30 y el número de personas
para cada combinación de tratamientos 𝑛 = 5.

Ordenando los datos que aporta el enunciado en la tabla de ANOVA:

FV SC gl MC F
Edad 𝑎 −1 = 2 8,22
CM 𝑏−1 = 1 2,44
Edad x CM (𝑎 − 1)(𝑏 − 1) = 2 6,54
Error 𝑎𝑏(𝑛 − 1) = 24
Total 𝑁 − 1 = 29

11) El diseño que ha utilizado el investigador es:


A) De un factor de medidas repetidas (edad).
B) De un factor de medidas independientes (competencia musical).
C) de dos factores independientes 3x2.

12) El valor de la F crítica que separa la región de aceptación de la región de rechazo para contrastar el efecto del
factor principal Competencia Musical vale aproximadamente:
A) 19,446
B) 4,351
C) 1,095

Solución:
El valor de las tablas F de Fisher para 𝛼 = 0,05 y con 1 y 20 grados de libertad (los más próximos a 1 y 24 grados
de libertad), es 4,351.

13) Sabiendo que 𝑀𝐶𝐸𝑟𝑟𝑜𝑟 = 112,3, la SC para la edad vale:


A) 1846,21
B) 522,09
C) 32,5

Solución:

Con el dato que aporta el enunciado de esta pregunta, completamos la tabla de ANOVA. Conociendo la
𝑀𝐶𝐸𝑟𝑟𝑜𝑟 comenzamos calculando el resto de las medias cuadráticas.

FV SC gl MC F
Edad 2 112,3 ∙ 8,22 = 923,106 8,22
Grupo 1 112,3 ∙ 2,44 = 274,012 2,44
Edad x Grupo 2 112,3 ∙ 6,54 = 734,442 6,54
Error 24 112,3
Total 29

A continuación, calculamos las sumas de cuadrados.

-5-
FV SC gl MC F
Edad 923,106 ∙ 2 = 𝟏𝟖𝟒𝟔, 𝟐𝟏𝟐 2 923,106 8,22
CM 274,012 ∗ 1 = 274,012 1 274,012 2,44
Edad x CM 734,442 ∗ 2 = 1468,884 2 734,442 6,54
Error 112,3 ∙ 24 = 2695,2 24 112,3
Total 29

El valor de la SC para la edad es 1.846,212. Opción correcta A.

14) La competencia musical:


A) Se ha demostrado significativa como factor principal.
B) No ha tenido ningún efecto.
C) Ha tenido un efecto en combinación con la edad.

Solución:

Como se indica en el enunciado, “En su informe indica que se obtienen resultados significativos, debidos tanto a la
Edad como a la interacción Edad x Competencia Musical” siendo F=6,54.

15) La interacción obtenida puede interpretarse como que:


A) La diferencia entre sujetos con competencia y sin competencia musical en la variable MT se incrementó
significativamente con la edad.
B) La edad disminuyó la actuación en MT.
C) Los sujetos con y sin competencia musical se diferenciaron significativamente en MT.

Solución:
La única afirmación compatible con el enunciado es la A, ya que se refiere a una interacción. Las otras dos opciones
son factores principales, y por lo tanto no predican nada de la interacción.

16) Para analizar la interacción mediante efectos simples podemos comparar:


A) La ejecución en MT entre jóvenes y maduros, entre jóvenes y mayores y entre maduros y mayores.
B) Los grupos de competencia musical vs. no competencia musical para cada nivel de edad.
C) La ejecución en MT entre sujetos con y sin competencia musical.

Solución: un análisis de efectos simples consiste en evaluar las diferencias entre niveles de un factor para diferentes
niveles del otro. En este caso podríamos:
a) realizar un análisis para el factor “competencia musical” para los jóvenes, otro diferente para los maduros y otro
para los jubilados, o bien
b) realizar un análisis de la edad en el grupo de sujetos con competencia musical (primer nivel de la variable
“competencia musical”) y otro diferente para el grupo de sujetos sin competencia musical (segundo nivel de la
variable “competencia musical”).
Vemos que la opción B es la única que hace referencia a alguna de estas posibilidades. Las opciones A y C sólo hacen
referencia a comparaciones para analizar los efectos principales de la edad o la competencia musical.

17) La posibilidad de analizar interacciones es:


A) Una de las razones por las que se recomienda el Anova frente a las comparaciones dos a dos de muestras
(dependientes o independientes).
B) Es problemática porque incrementa el error Tipo I.
C) Es difícil porque no se conoce la distribución muestral de las F´s en esta situación.

-6-
Solución:

Las opciones B y C son falsas. La opción correcta es la A ya que el Anova nos permite detectar interacciones (v.g., una
interacción entre elementos activos de un fármaco puede ser dañina y su detección es importante).

18) Por lo que se indica en el enunciado, cuando se han realizado las comparaciones de la interacción por efectos
simples, no se ha encontrado como significativa la diferencia en el grupo de:
A) Jóvenes.
B) Maduros.
C) Jubilados.

Solución: en el enunciado se ha indicado claramente que en este análisis de la interacción, la diferencia entre sujetos
con y sin competencia musical no es significativa en MT para los jóvenes.

19) En los Anovas el contraste es unilateral derecho porque:


A) La distribución F no tiene valores inferiores a 0.
B) Establecemos hipótesis sobre las varianzas poblacionales y estas son siempre positivas.
C) Dada la lógica del Anova, la posibilidad de encontrar valores de F inferiores a la unidad es poco probable.

SITUACIÓN 3. En un trabajo de Schlaug sobre el efecto cerebral del entrenamiento musical (tocar un instrumento),
se midió en 20 adultos la edad (en años) en que iniciaron el entrenamiento musical y el tamaño cerebral medio (en
mm) del giro precentral (zona cerebral del córtex motor primario). Se realizó un análisis de regresión de los datos
utilizando el tamaño como variable dependiente y la edad de inicio como variable independiente, del que se dispone
de los siguientes datos:

∑ 𝑋 = 123; ∑ 𝑋 2 = 825; ∑ 𝑌 = 753 ∑ 𝑌 2 = 28631; ∑ 𝑋𝑌 = 4558

20) El punto de corte con la ordenada vale, aproximadamente:


A) 32,15
B) 44,19
C) 12,05
Solución:
𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 20 ∙ 4558 − 123 ∙ 753
𝐵= = = −1,064
𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 20 ∙ 825 − 1232

𝐵0 = 𝑌̅ − 𝐵𝑋̅ = 37,65 − (−1,064) ∗ 6,15 = 44,19

21) Por cada año más tarde que se inicie el entrenamiento musical, se estima que en promedio el tamaño del giro
precentral medido en la edad adulta disminuirá, aproximadamente:
A) 5 mm
B) 2,52 mm
C) -1,06 mm

Solución:
Nos están preguntando por la pendiente de la recta de regresión. La hemos calculado en el apartado anterior y valía
-1,064 mm aproximadamente.

-7-
22) El estadístico de contraste para comprobar si es significativo el coeficiente de correlación de Pearson, vale,
aproximadamente:
A) -2,62
B) 1,05
C) -0,25
Solución:

𝑛 ∑ 𝑋𝑌 − ∑ 𝑋 ∑ 𝑌 20 ∙ 4558 − 123 ∙ 753


𝑟𝑥𝑦 = = = −0,526
√[𝑛 ∑ 𝑋 2 − (∑ 𝑋)2 ][𝑛 ∑ 𝑌 2 − (∑ 𝑌)2 ] √[20 ∙ 825 − 1232 ][20 ∙ 28631 − 7532 ]

𝑟𝑥𝑦 √𝑛 − 2 −0,526√20 − 2
𝑇= = = −2,62
2
√1 − 𝑟𝑥𝑦 √1 − (−0,526)2

23) Para el estadístico de contraste de la pregunta anterior:


A) Se rechaza la hipótesis nula para un nivel de confianza del 99.
B) Se rechaza la hipótesis nula para un nivel de confianza del 95% pero no para un nivel de confianza del 99%.
C) Se mantiene la hipótesis nula.

Solución:
Para un contraste bilateral, los valores críticos de
la distribución T de Student con 18 g.l. y para unos
niveles de significación de 0,05 y 0,01 son,
respectivamente: -2,10 y -2,878. El estadístico de
contraste obtenido se encuentra entre ambos valores,
por lo que se rechaza la Ho con un nivel de confianza
de 0,95 pero no con un nivel de confianza de 0,99. Esto
indica que la correlación es significativa ( p < 0,05).

24) En una situación de correlación múltiple, la correlación semi-parcial entre X1 e Y:


A) Ha eliminado el influjo que X1 tiene sobre X2
B) Ha eliminado el influjo que X2 tiene sobre X1
C) Ha eliminado el influjo que X2 tiene sobre Y

Solución: Nos piden la correlación semi-parcial entre X1 e Y habiendo eliminado el influjo del resto de variables
independientes (VI´s) sobre la X1. Como solamente tenemos como otra variable independiente X2, significa que
debemos eliminar el influjo de X2 sobre X1 (ver página 264, “… para saber qué parte de la VD explica cada VI al
margen de las otras VI´s, para así poder determinar el influjo único que esa VI tiene sobre la VD. Esta relación
entre cada VI y la VD habiendo eliminado el influjo del resto de las VI´s sobre cada VI es lo que se llama Coeficiente
de correlación semiparcial”).

25) Una condición para contrastar los coeficientes de regresión es:


A) Que 𝛽 = 0.
B) Que las puntuaciones de la variable independiente sean normales.
C) Que las puntuaciones de la variable dependiente condicionadas a cada valor de la variable independiente
sean normales.
-8-
Solución:
La opción A es claramente incorrecta ya que representa
una hipótesis más que una condición. La opción B es
incorrecta porque hace referencia a la variable
INDEPENDIENTE, es decir, la predictora. La única opción
correcta es la C ya que hace referencia a las
puntuaciones de la variable dependiente
CONDICIONADAS a las puntuaciones de la variable
independiente.

-9-
Modelo A. Septiembre de 2017. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto

SITUACIÓN 1: En un trabajo de Bueheler y O'Brien publicado en el Journal of Family Psychology (2011) se analizó el
bienestar de la madre ante conflictos de conciliación entre trabajo y familia, señalando que las madres con trabajos a
tiempo parcial manifiestan tener mejor estado de salud en general y menos síntomas de depresión que las madres no
trabajadoras, mientras que entre las madres con trabajos a tiempo parcial y las que trabajaban la jornada completa no se
encontraron diferencias ni en salud ni en síntomas depresivos.

Imagine que usted dispone de una muestra de 110 madres, de las que 60 trabajan a tiempo competo (C) y el resto a tiempo
parcial (P). Todas ellas responden a la Escala de Bienestar Emocional (E) de Zigmond y Snaith (1983), en la que a mayor
puntuación mayor bienestar. La media y la varianza insesgada para las mujeres del grupo C son 35 y 121, respectivamente,
y para las mujeres del grupo P son 46 y 81, respectivamente. Por otra parte, de las 60 mujeres que trabajan a tiempo
completo, 45 obtienen bajas puntuaciones en la escala E frente a las 23 de las mujeres que trabajan a tiempo parcial.
Trabaje con un 𝛼 = 0,05.

Los datos de los que disponemos son:

Escala de bienestar emocional (E)


Puntuaciones Puntuaciones
n Media Cuas. Var.
bajas Altas
Tiempo
60 35 121 45 15
completo (C)
Tiempo
50 46 81 23 27
parcial (P)
Total 110 - - 68 42

1. Para comprobar si existen diferencias significativas respecto al bienestar emocional medio entre madres trabajadoras
a tiempo completo y a tiempo parcial, se apoyaría en un diseño de dos muestras independientes provenientes de
poblaciones con varianzas:
A) desconocidas pero supuestas iguales.
B) conocidas y supuestas iguales.
C) desconocidas pero supuestas distintas.

Las varianzas poblacionales son desconocidas. Podemos plantear un contraste de hipótesis sobre las varianzas
poblacionales para decidir si se consideran desconocidas pero iguales o desconocidas pero distintas.

𝐻0 : 𝜎𝐶2 = 𝜎𝑃2
𝑆̂𝐶2 121
𝐹= = = 1,49
𝐻1 : 𝜎𝐶2 ≠ 𝜎𝑃2 𝑆̂𝑃2 81

Mirando en la tabla F de Fisher para 60 y 60 g.l. (los más próximos a 59 y 49), comprobamos que el estadístico de
contraste no es significativo para un nivel de confianza del 95% (𝑓0,95;60;50 = 1,534), por lo que suponemos que las
varianzas poblacionales son iguales.

-1-
2. Si desea comprobar que la proporción de madres que manifiestan peor estado de bienestar emocional es mayor en
aquellas con trabajo a tiempo completo que en las que trabajan a tiempo parcial, la hipótesis nula que formularía, es:
A) 𝝅𝑪 ≤ 𝝅𝑷
B) 𝜋𝐶 = 𝜋𝑃
C) 𝜋𝐶 ≥ 𝜋𝑃

𝐻0 : 𝜋𝐶 ≤ 𝜋𝑃
Las hipótesis que se han de plantear son: {
𝐻1 : 𝜋𝐶 > 𝜋𝑃

3. El estadístico de contraste (en valor absoluto) para evaluar la hipótesis de la anterior pregunta vale aproximadamente:
A) 2,37
B) 1,83
C) 3,12

45 + 23 68
𝑃= = = 0,62
110 110

45 23
𝑍= 60 − 50 =
0,75 − 0,46
= 3,12 → 𝑝 = 0,0009
0,0929
√0,62 ∙ 0,38 ( 1 + 1 )
60 50

4. Si para el contraste de su hipótesis hubiese obtenido un estadístico de contraste de 2,82, entonces el nivel crítico 𝑝
valdría:
A) 0,9976
B) 0,0048
C) 0,0024
𝑇𝑎𝑏𝑙𝑎 𝑑𝑒 𝑐𝑢𝑟𝑣𝑎 𝑛𝑜𝑟𝑚𝑎𝑙
𝑍 = 2,82 → 𝑝 = 0,0024

5. La probabilidad de obtener unos resultados como los observados en la muestra o más extremos bajo el supuesto de
una hipótesis nula verdadera recibe el nombre de:
A) Nivel de significación
B) Nivel crítico p
C) Potencia del contraste

6. El estadístico de contraste en valor absoluto para analizar si la media del bienestar emocional de las madres con
jornada a tiempo parcial es significativamente mayor que la media de las que trabajan a jornada completa es,
aproximadamente:
A) 5,66
B) 7,59
C) 4,65

𝑌̅𝑃 − 𝑌̅𝐶 46 − 35 11
𝑇= = = = 5,66
1,942
(𝑛 ̂ 2 (𝑛 ̂2 √49 ∙ 81 + 59 ∙ 121 ( 1 + 1 )
√ 𝑃 − 1)𝑆1 + 𝐶 − 1)𝑆2 ( 1 + 1 ) 108 50 60
𝑛𝑃 + 𝑛𝐶 − 2 𝑛𝑃 𝑛𝐶

-2-
7. Si con los datos de su trabajo obtuviera un estadístico de Cohen que tomase el valor 𝑑 = 0,25, la conclusión global
resultante sería que:
A) La diferencia no es significativa ya que poco más de la mitad de las mujeres con jornada a tiempo completo tienen
valores por debajo de la media de las mujeres a tiempo parcial.
B) Existen diferencias significativas, pero poco importantes, ya que solo el 60% de las mujeres con jornada a tiempo
parcial superan la media del bienestar emocional de las mujeres con jornada completa.
C) Existen diferencias significativas muy importantes que indican que, aproximadamente, el 60% de las mujeres con
jornada a tiempo parcial superan la media del bienestar emocional de las mujeres con jornada completa.

8. Señale cuál de las siguientes es la variable independiente del trabajo de Buehler y O'Brien:
A) La situación laboral.
B) El trabajo y la familia.
C) La salud y los síntomas depresivos.

Situación 2: El director de una escuela de ajedrez está interesado en identificar la mejor estrategia de control de la
atención para entrenar a los alumnos de su centro. Se han estudiado tres estrategias: centrarse en estímulos internos
(condición A), centrarse en estímulos externos (condición B) y hacer una parada de pensamiento (condición C). El control
de la atención se ha operativizado mediante la variación de la conductividad eléctrica de la piel (medida en microSiemens
o 𝜇𝑆). Se seleccionó una muestra aleatoria compuesta por 45 jugadores de ajedrez que se asignaron al azar a cada una de
las tres condiciones experimentales. Se obtuvieron los siguientes resultados descriptivos:

Condición experimental N Media Desviación típica


A 15 37,53 11,17
B 15 34,00 8,8 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 6.783,46 y
C 15 47,73 12,18 𝑀𝐶𝐸𝑟𝑟𝑜𝑟 = 125,2.
Total 45 39,75 12,11

Tras realizar todas las comprobaciones necesarias se concluyó que las observaciones eran independientes, las
distribuciones normales y las varianzas homogéneas.

Se trata de un diseño con un factor con tres grupos equilibrados (𝑎 = 3; 𝑛1 = 𝑛2 = 𝑛3 = 15) con muestras
independientes. Con los datos proporcionados en el enunciado tenemos:

FV SC gl MC F
Inter 2
Intra 42 125,2
Total 6.783,46 44

Fácilmente se completa la tabla de ANOVA, calculando en primer lugar suma de cuadrados de error.

FV SC gl MC F
Inter 2
Intra 𝟒𝟐 ∙ 𝟏𝟐𝟓, 𝟐 = 𝟓. 𝟐𝟓𝟖, 𝟒𝟎 42 125,2
Total 6.783,46 44

A continuación se calcula la suma de cuadrados intergrupo.

-3-
FV SC gl MC F
Inter 𝟔. 𝟕𝟖𝟑, 𝟒𝟔 − 𝟓. 𝟐𝟓𝟖, 𝟒𝟎 = 𝟏. 𝟓𝟐𝟓, 𝟎𝟔 2
Intra 5.258,40 42 125,2
Total 6.783,46 44

Por último, se calculan la media cuadrática intergrupo y el estadístico de contraste.

FV SC gl MC F
Inter 1.525,06 2 762,53
6,09
Intra 5.258,40 42 125,20
Total 6.783,46 44

9.- Se trata de un diseño factorial:


A) con tres grupos equilibrados.
B) con grupos dependientes.
C) de dos factores con interacción.

10.- La variable independiente de este experimento es:


A) las variaciones de la conductividad eléctrica de la piel.
B) el tipo de estrategia de control de la atención que se entrena.
C) el que los participantes sean jugadores de ajedrez.

11.- Teniendo en cuenta la técnica apropiada para resolver este diseño, ¿cuál sería el valor de los grados de libertad del
denominador del estadístico de contraste?
A) 42
B) 44
C) 28

12.- El tipo de análisis adecuado para probar la hipótesis del investigador es:
A) Anova de un factor con muestras independientes.
B) un Anova de dos factores.
C) un Anova de un factor de medidas repetidas.

13.- ¿Cuál es el valor más aproximado de la 𝑆𝐶𝐼𝑛𝑡𝑒𝑟 :


A) 5.258,4
B) 762,53
C) 1.525,06

14.- Calcule el estadístico de contraste y determine cuál de las opciones es correcta:


A) no podemos tomar ninguna decisión respecto a la hipótesis de igualdad de medias.
B) podemos rechazar la hipótesis de igualdad de las medias (nivel de confianza 95%).
C) no podemos rechazar la hipótesis de igualdad de las medias (nivel de confianza 95%).

El estadístico de contraste vale: 𝐹 = 6,09. Buscamos en la tabla F de Fisher con los grados de libertad más
próximos para alfa = 0,05: 𝐹0,95;2;42 ≈ 𝐹0,95;2;30 = 3,316. Dado que: 6,09 > 3,316 → 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻0

-4-
15.- El valor crítico para rechazar H0 con un 𝛼 = 0,01 vale, aproximadamente:
A) 3,1
B) 5,4
C) 2,4

Se busca en la tabla F de Fisher el valor más próximo: 𝐹0,99;2;42 ≈ 𝐹0,99;2;30 = 5,39

16.- Suponiendo que no se rechazara la H0, ¿entre qué grupos sería conveniente realizar comparaciones?
A) Entre ninguno.
B) Entre los grupos B y C que son los que presentan la máxima diferencia en sus resultados.
C) Entre los Grupos A, B y C.

Situación 3: En un estudio de Kenrick y Keefe (1992) sobre las diferencias de género en las estrategias reproductivas en
humanos, se midió la diferencia de edad existente en 1.511 matrimonios muestreados en la isla de Poro (Filipinas) desde
1913 a 1939 bajo la hipótesis de que los hombres prefieren esposas más jóvenes que ellos y que esta tendencia se
intensifica con la edad del hombre. Para cada edad del hombre se calculó una media de diferencias de edad con la mujer,
haciendo que el número de parejas de datos para realizar la regresión fuese de N = 6. El análisis de regresión realizado
generó los siguientes datos:

La variable dependiente Y se calculó como


“Edad de la mujer – Edad del hombre”.

Ecuación de regresión:
𝑌’ = −1,523 – 0,280 𝑋
Bondad del ajuste:
𝐹(1, 4) = 11,896, 𝑀𝐶𝑟𝑒𝑠𝑖𝑑𝑢𝑜 = 11,533

Figura 1

17.- La hipótesis nula que se pone a prueba con esta elección de variables será:
A) 𝛽0 = 0
B) 𝜌 = 0
C) 𝜷 ≥ 𝟎

𝐻0 : 𝛽 ≥ 0
Las hipótesis que se han de plantear son: {
𝐻1 : 𝛽 < 0

18.- El número de parejas en este estudio (tamaño muestral para cada valor de Xi):
A) diferirá para cada uno de los seis grupos de edad del hombre por razones biológicas.
B) no parece suficientemente grande para hacer un estudio como este.
C) dependerá del error típico de la distribución muestral del estadístico, el cual está en proporción directa al tamaño de la
muestra.

-5-
19.- El punto de corte con la ordenada en este estudio:
A) Es una diferencia positiva de edades entre el hombre y la mujer.
B) No se puede calcular matemáticamente porque exige que el hombre tenga cero años (recién nacido).
C) No tiene sentido excepto si los indígenas de Poro emparejan a los niños al nacer.

20.- La Figura 1 muestra las medias de las diferencias de edades condicionada a la edad del hombre. Con los datos
proporcionados en la Figura:
A) no podemos saber si los datos son homocedásticos y normales.
B) no podemos saber si los datos están determinados o alienados.
C) podemos tener una idea aproximada del intervalo de confianza de Y para cada valor de Xi.

21.- El valor crítico al 95% de confianza para contrastar si existe relación lineal entre X e Y mediante el Anova vale
aproximadamente:
A) 𝟕, 𝟕𝟎𝟗
B) 11,896
C) −1,96

Buscando en las tablas F de Fisher: 𝑓0,95;1;4 = 7,709

22.- En la tabla del Anova para contrastar si existe relación lineal entre X e Y, el valor de la MCregresión vale
aproximadamente:
A) 46,133
B) 183,33
C) 137,2

Con los datos del enunciado:

FV SC gl MC F
Regresión 1
11,896
Error 4 11,533
Total 5

Calculamos 𝑀𝐶𝑅𝑒𝑔. y 𝑆𝐶𝐸𝑟𝑟𝑜𝑟

FV SC gl MC F
Regresión 1 𝟏𝟏, 𝟓𝟑𝟑 ∙ 𝟏𝟏, 𝟖𝟗𝟔 = 𝟏𝟑𝟕, 𝟏𝟗𝟕
11,896
Error 𝟒 ∙ 𝟏𝟏, 𝟓𝟑𝟑 = 𝟒𝟔, 𝟏𝟑𝟐 4 11,533
Total 5

Completamos la tabla de ANOVA:

FV SC gl MC F
Regresión 137,197 1 137,197
11,896
Error 46,132 4 11,533
Total 183,329 5

23.- El análisis indica que el intervalo de confianza al 95% para B0 se encuentra entre -10,311 y 7,245 mientras que para B
se encuentra entre -0,505 y -0,055. Sabiendo esto podemos afirmar que:
A) Ni B0 ni B son significativos.
B) 𝑩𝟎 no es significativo mientras que 𝑩 sí lo es.
C) 𝐵 no es significativo mientras que 𝐵0 sí lo es.
-6-
24.- En esta situación, el coeficiente de correlación de Pearson entre X e Y:
A) será positivo ya que coincide en el signo con B.
B) será negativo.
C) no es adecuado calcularlo porque la Figura 1 muestra que los datos no son lineales.

25.- Si otro investigador re-analiza estos datos modificando el cálculo de la variable dependiente Y para que sea “Edad del
hombre – Edad de la mujer”, entonces:
A) cambiaría el valor de la correlación en valor absoluto entre X e Y.
B) cambiarán los valores de la Tabla del Anova que evalúa si existe relación lineal entre X e Y.
C) habría que modificar la hipótesis alternativa porque ahora la pendiente esperada sería positiva.

-7-
Modelo C. Septiembre de 2017. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto

Situación 1. Aunque la pérdida de la memoria es uno de los aspectos definitorios de la enfermedad de Alzheimer (EA),
algunos estudios sobre las emociones suscitadas por la música en pacientes con Alzheimer han mostrado que estos
pacientes parecen tener preservada la capacidad de reconocer la emoción (felicidad, tranquilidad, tristeza o miedo) que
transmite la música (v.g., Drapeau et al., 2009) y, por lo tanto, parecen tener preservada la memoria musical.

Imagine que usted también defiende teóricamente la idea de que la memoria musical se mantiene incluso en pacientes
con EA pero quiere responder empíricamente a los críticos de la misma que plantean que los estudios originales no
utilizaron ningún grupo de control. Para ello, ha realizado un estudio en el que ha medido el número de aciertos (sobre
100 estímulos) en el reconocimiento de la emoción musical (presentando estímulos de cada tipo de emoción básica) en
un grupo de sujetos con EA (𝑛 = 20; 𝑌̅𝐸𝐴 = 75, 𝑆̂𝐸𝐴 = 15 ) y en un grupo de personas mayores (𝑛 = 25; 𝑌̅𝐷𝐶𝐿 =
80, 𝑆̂𝐷𝐶𝐿 = 5 ) con Deterioro Cognitivo Leve (DCL). Asumimos que las varianzas poblaciones difieren entre EA y DCL, y
adoptamos un 𝛼 = 0.05.

1.- La variable dependiente es:


A) una variable discreta medida en una escala de razón.
B) una escala tipo Likert.
C) dicotómica ya que en cada ensayo el sujeto acierta o falla.

Solución: la variable dependiente es el número de aciertos sobre 100 estímulos. Luego es una variable discreta que
puede adoptar los valores 0, 1, 2, …, 99, 100. Al admitir el valor 0 es una escala de razón.

2.- El diseño utilizado es:


A) un contraste de más de dos grupos.
B) un contraste de dos medias independientes.
C) un contraste de dos varianzas dependientes.

Solución: Se ha utilizado de dos grupos, enfermos de Alzheimer y mayores con DCL. Luego es un contraste con dos grupos
independientes (o se padece EA o DCL, no ambos). Además, como en el enunciado refieren que interesa contrastar la
media de reconocimiento de la emoción en ambos grupos, no es un contraste de varianzas. Luego es un contrsete de dos
medias independientes.

3.- La hipótesis nula que plantea es:


A) 𝐻0 : 𝜇𝐸𝐴 − 𝜇𝐷𝐶𝐿 ≠ 0.
B) 𝐻0 : 𝜇𝐸𝐴 > 𝜇𝐷𝐶𝐿 ó 𝜇𝐸𝐴 < 𝜇𝐷𝐶𝐿 .
C) 𝑯𝟎 : 𝝁𝑬𝑨 − 𝝁𝑫𝑪𝑳 = 𝟎.

Solución: La hipótesis nula es la que tiene el signo igual (el grupo de pacientes no afecta a los resultados). En este caso,
que la diferencia de medias en la variable dependiente es 0. Esto significa que el contraste es bilateral.

4.- El valor del estadístico de contraste vale para poner a prueba esta hipótesis vale aproximadamente:
A) −𝟏, 𝟒𝟑
B) −2,53
C) 0,32

Solución: Se trata de un contraste de dos medias independientes asumiendo varianzas poblacionales diferentes. Luego:
5.- El valor crítico, expresado como valor absoluto, vale aproximadamente:
A) 𝟐, 𝟎𝟕𝟒
B) 1,960
C) 1,061

Solución: Tenemos que calcular los grados de libertad de esta situación:

Y ahora podemos buscar en la tabla de la t de Student con 22 grados de libertad y 1-(0.05/2) = 0.975. Las tablas nos
proporcionan el valor de 2.074.

6.- El nivel crítico se encuentra entre los valores:


A) 0,01 y 0,05.
B) 0,05 y 0,10.
C) 0,10 y 0,20.

Solución: El nivel crítico es el valor el valor de la probabilidad para nuestro estadístico de contraste (T = -1,428, bilateral).
Si observamos en la tabla de la distribución T de Student en la fila gl = 22, encontramos:

0.90 … 0.95
… … …
Gl = 22 1.321 … 1.717

Si lo expresamos en términos de las t´s negativas tendremos:

1-0.90 = 0.10 … 1-0.95 = 0.05


… … …
Gl = 22 -1.321 -1.428 -1.717

Luego el valor de p para t = -1.428, se encuentra entre 0.10 y 0.05. Como es un contraste bilateral, multiplicamos ambos
valores por 2, obtenido que el nivel crítico de t = -1.428 se encuentra entre 2*0.10 = 0.20 y 2*0.05 = 0.10. Por lo que la
opción correcta es la C.

7.- El tamaño del efecto:


A) se puede clasificar en tres categorías según Cohen.
B) depende del tamaño muestral.
C) es una diferencia de medias no estandarizada.

Solución: sabemos que el tamaño del efecto no depende del tamaño muestral (es su principal diferencia con respecto a
los estadísticos de contraste) y consiste en una diferencia de medias estandarizada. Luego las opciones B y C son
incorrectas. Por otro lado, Cohen proporcionó una clasificación general de los tamaños del efecto (según la d de Cohen)
en tres categorías, baja, media y alta, con unos puntos de referencia subjetivos. Luego la opción correcta es la A.

8.- El investigador informó que, en su estudio, 1 − 𝛽 = 0,6. Esto significa que:


A) la probabilidad de no rechazar H0 siendo falsa vale 0,6.
B) la probabilidad de rechazar H0 siendo falsa vale 0,6.
C) la probabilidad de no rechazar H0 siendo verdadera vale 0,40.

Solución: El valor de 1 − 𝛽 es la potencia de un contraste. La potencia es la probabilidad de rechazar una hipótesis nula
cuando es falsa. Luego, la opción correcta es la B.

9.- Una de las posibles razones por las que podría no haberse rechazado H0 es:
A) los DCL y los EA tienen en la población un nivel de memoria musical distinto.
B) el bajo tamaño muestral.
C) que el tamaño del efecto era muy elevado.

Solución: la opción A no hace referencia a los factores que impactan sobre el estadístico de contraste (sea cierta o falsa la
información). Solamente las opciones B y C tienen un papel relevante para el contraste estadístico realmente efectuado.
De estas opciones, la C es incorrecta porque si el tamaño del efecto es muy elevado, con pocos sujetos habría resultado
significativo. La única explicación válida sería que el tamaño muestral utilizado es bajo.

Situación 2. Cawson y cols. (1974) analizaron los niveles de cortisol en sangre en tres grupos de gestantes que nacieron
entre las 38 y las 42 semanas de gestación. El grupo 1 se estudió antes del inicio del parto, el grupo 2 fue estudiado
durante parto inducido y el grupo 3 se compuso de gestantes que nacieron espontáneamente y a los que se les midió el
cortisol después del parto. Los autores deseaban saber si estos datos proporcionaban evidencia que indicara una media
diferente en los niveles de cortisol entre las tres poblaciones representadas. En la Tabla 1 se presentan las puntuaciones
de cortisol en los tres grupos.

Grupo 1 262 307 211 323 454 339 304 154 287 356
Grupo 2 465 501 455 355 468 362
Grupo 3 343 772 207 1.048 838 687
Tabla 1

10.- La variable dependiente es:


A) el tiempo de gestación.
B) si el parto fue natural o inducido.
C) los niveles de cortisol en sangre.

Solución: la variable que se ha medido antes del parto, durante o después del parto, ha sido la concentración de la
hormona cortisol en sangre.

11.- La variable dependiente es una variable:


A) continua.
B) discreta.
C) nominal.

Solución: Es una variable continua que puede medirse en términos de porcentajes. No es discreta porque entre dos
valores cualesquiera de concentración se pueden medir, teóricamente, valores intermedios. No admite categorías
nominales.

12.- El diseño del estudio fue:


A) de dos factores con tres niveles independientes e interacción.
B) de un factor de tres grupos independientes no equilibrado.
C) de un factor de tres grupos dependientes equilibrado.

Solución: Tenemos tres grupos (G1, G2 y G3) independientes entre sí y el número de participantes es distinto en cada
grupo. Por lo tanto son tres grupos independientes no equilibrado. No podemos hablar de interacción porque no hay dos
factores.

13.- El tipo de análisis adecuado para probar la hipótesis del investigador es:
A) un Anova de un factor con muestras independientes.
B) un Anova de dos factores con interacción.
C) un Anova de medidas repetidas.

Solución: Al disponer de tres niveles de un factor nominal (Grupo) con una variable dependiente cuantitativa, la técnica
apropiada es un Anova. Solamente tenemos un factor (el Grupo) y las muestras son independientes.

14.- Teniendo en cuenta la técnica apropiada para resolver este diseño, ¿cuál sería el valor de los grados de libertad del
denominador del estadístico de contraste?
A) 19
B) 21
C) 41

Solución: Los grados de libertad de la razón F en un anova de muestras independientes es 𝑁 − 𝑎, siendo 𝑁 el total de
participantes y 𝑎 el número de niveles del factor. Sabemos que 𝑁 = 𝑛𝑎1 + 𝑛𝑎2 + 𝑛𝑎3 = 10 + 6 + 6 = 22 y que 𝑎 = 3.
Luego 𝑁 − 𝑎 = 22 − 3 = 19.

15- El valor crítico para rechazar H0 con un 𝛼 = 0,01 vale:


A) 𝟓, 𝟗𝟐𝟔
B) 2,606
C) 3,522

Solución: Tenemos que buscar en la tabla de la F con 𝑎 − 1 y 𝑁 − 𝑎 grados de libertad. Esto es 𝐹(2, 19) = 5.926 en la
tabla para 1 − 0.01 = 0.99.

16.- Sabiendo que la 𝑆𝐶 𝑇𝑜𝑡𝑎𝑙 = 458.032,097 y la 𝑀𝐶𝐸𝑟𝑟𝑜𝑟 = 13.462,225 ¿cuál es el valor más aproximado de la 𝑆𝐶𝐼𝑛𝑡𝑒𝑟 ?
A) 229.016,048
B) 𝟐𝟎𝟐. 𝟐𝟓𝟎, 𝟎𝟎𝟎
C) 1.036.814,364

Solución: Tenemos que completar la tabla del Anova con los datos proporcionados en el enunciado y los ya conocidos
(los grados de libertad). Estos son:

FV SC Gl MC F
Inter a-1 = 2
Intra N-a = 19 13.462,225
Total 458.032,097

Luego:

FV SC Gl MC F
Inter 202.250 a-1 = 2 101.125 7,51176
Intra 255.782 N-a = 19 13.462,225
Total 458.032,097

El valor solicitado es 202250.

17.- Con los datos de la pregunta anterior ¿cuál es el valor más aproximado del estadístico de contraste?
A) 𝟕, 𝟓
B) 8,3
C) 0,79

Solución: En la tabla anterior vemos que el valor de la F empírica es 7,51176. Luego el valor más aproximado es 7,5.

Situación 3. Un estudio de Beltrán, Valor y Expósito (2015) de título "El perdón ante transgresiones en las relaciones
interpersonales" analiza, mediante un análisis de regresión, las variables que predicen el perdón en una relación de
pareja, tanto en hombres como en mujeres. Utilizando una muestra de estudiantes de la Universidad de Granada
señalan, entre sus conclusiones, que la baja capacidad imaginativa para ponerse en situaciones ficticias (empatía), en el
caso de los hombres, y la mayor dependencia emocional, en el caso de las mujeres, son las variables que predicen un
menor perdón y mayor motivación de venganza hacia la pareja.

Para el caso de las mujeres, usted desea verificar si estas conclusiones se mantienen también en su localidad. Para ello,
utiliza una muestra de 27 mujeres que habían sufrido algún tipo de transgresión en su relación de pareja y que responden
a dos cuestionarios, uno para medir la gravedad de la transgresión (T) y otro la dependencia emocional (D) obteniendo
los siguientes resultados: 𝐶𝑜𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 (𝑇, 𝐷) = 25; desviación típica (T): 𝑆𝑇 = 7; desviación típica (D): 𝑆𝐷 = 5; 𝑇̅ =
35; 𝐷̅ = 20.
18.- El porcentaje de varianza explicada en la variable "gravedad de la transgresión" (T) a partir de la dependencia
emocional (D) es aproximadamente:
A) 71,4%
B) 39,98%
C) 51,02%
Solución: el porcentaje de varianza explicada de una variable Y a partir de otra variable X en el análisis de regresión viene
dado por el cuadrado del coeficiente de correlación entre ambas:
2
𝑆𝑋𝑌 2 25 2
𝑟𝑋𝑌 =( ) =( ) = 0.5102
𝑆𝑋 𝑆𝑌 7∙5
luego en términos porcentuales es el 51,02%.

19.- La correlación entre las variables "gravedad de la transgresión" y "dependencia emocional":


A) es tan pequeña que puede explicarse por el azar.
B) es significativa (𝒑 < 𝟎, 𝟎𝟏).
C) No es significativa con un 𝛼 de 0,01 pero sí con un 𝛼 de 0,05.

Solución: Nos están preguntando por la significatividad de la correlación entre T y D. La correlación vale 25 / (7 ∙ 5) =
5/7 = 0.71.
Las opciones de respuesta pivotan en relación a si es significativa o no. Para saberlo, debemos calcular el estadístico de
contraste y evaluar si es significativo al 0.01 y al 0.05:
𝑟𝑇𝐷 √𝑁 − 2 0.71√27 − 2
𝑇= = ≈ 5.041
√1 − 𝑟𝑇𝐷2 √1 − 0.712
El valor crítico con 25 grados de libertad vale (según tablas) vale
g.l. … 0.95 0.975
…. … … …
25 … 1.708 2.060
… … … …

Luego una T de 5.041 > 2.060 > 1.708 es altamente significativa (con un nivel crítico inferior a 0.01).

20.- ¿Cuál es, aproximadamente, el valor de la pendiente de la ecuación de regresión para predecir la gravedad de la
transgresión (T) a partir de la dependencia emocional (D)?:
A) 1
B) 0,02
C) 0,5
Solución:
𝑆𝑌 7
𝐵 = 𝑟𝑋𝑌 = 0.71 ≈ 0.994
𝑆𝑋 5
Que, aproximadamente, vale la unidad.

21.- En el análisis de la regresión, el error típico es:


A) La diferencia entre la puntuación observada en un sujeto y la puntuación pronosticada.
B) La desviación típica de las puntuaciones pronosticadas.
C) La desviación típica de los errores de pronóstico.

Solución: por definición, el error típico es la desviación típica de los errores de pronóstico. La opción A es incorrecta
porque define el error de pronóstico para un sujeto, mientras que la opción B hace referencia a Sx de la variable
dependiente pronosticada (T’) en este caso.

22.- En el análisis de regresión de la "gravedad de la transgresión" (T) en función de la “dependencia emocional” (D), el
coeficiente de alienación corresponde a:
A) La variabilidad de la trasgresión debida o explicada por la dependencia emocional.
B) La variabilidad de la dependencia emocional asociada a otras variables diferentes a la transgresión.
C) La variabilidad de la transgresión debida a otras variables distintas a la dependencia emocional.
Solución: El coeficiente de alienación, por definición, es el complemento del coeficiente de determinación, es decir
2
1 − 𝑟𝑇𝐷 , luego es la variabilidad de la transgresión (T) debida a otras variables distintas de la dependencia emocional (D),
ya que la variabilidad debida a D ya se ha visto explicada por la ecuación de regresión de T sobre D.
23.- ¿Cuál de las siguientes gráficas representa la condición de homocedasticidad que deben cumplir los datos para
realizar el análisis de regresión lineal?
A) B) C)

Solución: La única gráfica que mantiene la misma variabilidad en todos los valores de la variable predictora X es la C. En la
gráfica A la variabilidad es mayor en valore bajos de X mientras que en la variable B es superior en valores superiores de
X.

24.- Para una mujer que obtiene en el cuestionario de dependencia emocional (D), una puntuación de 4 puntos por
encima de la media, la puntuación pronosticada en "gravedad de la transgresión" (T), es de:
A) 39
B) 19
C) 4
Solución: Calculamos primero el punto de corte con la ordenada:
𝐵0 = 𝑇̅ − 0.994 𝐷
̅ = 35 − 0.994 ∙ 20 = 15.12

Ahora, como conocemos la pendiente, podemos calcular el valor para un sujeto que tenga como valor de D
𝐷𝑠𝑢𝑗𝑒𝑡𝑜 = 𝐷 ̅ + 4 = 24

Y aplicándo la ecuación de regresión:


𝑇𝑖 = 15.12 + 0.994 ∙ 24 = 38.976
Que, aproximadamente, es 39.

25.- La varianza de los errores de pronóstico vale, aproximadamente:


A) 4,9
B) 24
C) 8,65
Solución: calculamos la desviación típica de los errores

𝑠𝑒 = 𝑆𝑇 √1 − 𝑟 2 = 7√1 − 0.712 = 4.92941


El cuadrado de este valor es 24.29 que aproximadamente vale 24.
Modelo A. ENERO de 2018. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto

SITUACIÓN 1.Profesionales de la American Psychological Association, que han estudiado la influencia de los
videojuegos de contenido violento en los jóvenes, señalan la aparición de un mayor número de comportamientos y
actitudes agresivas después de utilizar videojuegos interactivos de contenido violento.
Imagine que quiere corroborar esta afirmación, para lo que diseña una investigación en la que utiliza dos
muestras de niños varones de 7 a 12 años que responden a la Escala de Agresión Física Verbal (AFV) (Caprara y
Pastorelli, 1993). Esta escala proporciona puntuaciones en cuatro dimensiones: agresividad física, verbal, ira y
hostilidad, de forma que a mayor puntuación mayor intensidad en la dimensión evaluada. Un grupo de 41 de estos
jóvenes eran usuarios habituales de videojuegos en red con alto contenido hostil obteniendo, en la dimensión de
agresividad física, una media de 32,6 con una desviación típica insesgada de 7,8. Otro grupo de 61 jóvenes, no
usuarios de videojuegos violentos obtuvieron en la misma escala una media de 29,5 y desviación típica insesgada de
6,3.Con esta información, responda a las siguientes preguntas:
1 –Para el contraste de diferencias de medias en la dimensión de agresividad física entre jóvenes usuarios de
videojuegos con contenido violento respecto a los que no son usuarios de esta modalidad de videojuegos, aplicaría la
prueba:
A) T de diferencias de medias asumiendo varianzas iguales (𝑭𝑭 = 𝟏𝟏, 𝟓𝟓𝟓𝟓; 𝒑𝒑 > 0,05).
B) T de diferencias de medias asumiendo varianzas distintas (𝐹𝐹 = 0,63; 𝑝𝑝 < 0,05).
C) Z de diferencias de medias asumiendo varianzas iguales (𝐹𝐹 = 1,53; 𝑝𝑝 < 0,01).

Para decidir si se suponen varianzas poblacionales iguales o distintas, se plantean las hipótesis:

2 2
𝐻𝐻0 : 𝜎𝜎𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈 = 𝜎𝜎𝑁𝑁𝑁𝑁 𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢

2 2
𝐻𝐻1 : 𝜎𝜎𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈 ≠ 𝜎𝜎𝑁𝑁𝑁𝑁 𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢
El estadístico de contraste es:

𝑆𝑆̂𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈𝑈
2
7,82
𝐹𝐹 = = = 1,533
𝑆𝑆̂𝑁𝑁𝑁𝑁
2
𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢𝑢 6,32

Para un contraste bilateral y NC = 95% el estadístico de contraste es: 𝐹𝐹0,975;40;60 = 1,744

Dado que: 1,533 < 1,744, se mantiene la hipótesis nula y se consideran varianzas poblacionales desconocidas
pero iguales.

2 –Los límites del intervalo de confianza para la desviación típica poblacional de las puntuaciones en la dimensión de
agresión física de los jóvenes usuarios de videojuegos violentos, valen, aproximadamente (𝑁𝑁𝑁𝑁 = 0,95):
A) 41y99,60
B) 6,04 y 10,84
C) 6,40 y9,98
(𝑛𝑛 − 1)𝑆𝑆𝑛𝑛−12 (𝑛𝑛 − 1)𝑆𝑆𝑛𝑛−12
2
< 𝜎𝜎 <
𝜒𝜒𝑛𝑛2−1;1−𝛼𝛼�2 𝜒𝜒𝑛𝑛2−1;𝛼𝛼�2

(41 − 1)7,82 (41 − 1)7,82


< 𝜎𝜎2 <
59,3417 24,4330

41,01 < 𝜎𝜎2 < 99,6 → 𝟔𝟔, 𝟒𝟒 < 𝜎𝜎 < 9,98

1
3–Para contrastar la influencia nociva del contenido de los videojuegos: Violento (V) vs No Violento (NV), sobre la
agresividad física, la hipótesis nula que formularía, es:
A) 𝐻𝐻0 : 𝜇𝜇𝑉𝑉 – 𝜇𝜇𝑁𝑁𝑁𝑁 ≥ 0
B) 𝑯𝑯𝟎𝟎 : 𝝁𝝁𝑽𝑽 – 𝝁𝝁𝑵𝑵𝑵𝑵 ≤ 𝟎𝟎
C) 𝐻𝐻0 : 𝜇𝜇𝑉𝑉 – 𝜇𝜇𝑁𝑁𝑁𝑁 = 0

Contrastar la hipótesis sobre la influencia nociva de los videojuegos de contenidos violentos sobre la
agresividad física, supone que la media en la escala AFV será mayor para los que utilizan videojuegos con
contenido violento respecto a los que contemplan videojuegos no violentos, es decir: 𝜇𝜇𝑉𝑉 > 𝜇𝜇𝑁𝑁𝑁𝑁 ; de otra
forma, que 𝜇𝜇𝑉𝑉 – 𝜇𝜇𝑁𝑁𝑁𝑁 > 0. La hipótesis complementaria a esta, dirá por tanto, que no existe tal influencia
nociva o, en otras palabras, que 𝜇𝜇𝑉𝑉 – 𝜇𝜇𝑁𝑁𝑁𝑁 ≤ 0 que corresponde a la hipótesis nula de esta situación.
4 –El valor del estadístico de contraste para la hipótesis de la pregunta anterior, es, aproximadamente:
A) 1,53
B) 2,21
C) 0,44

𝑌𝑌�1 − 𝑌𝑌�2 32,6 − 29,5


𝑇𝑇 = = = 2,212
(𝑛𝑛 1 −1)𝑆𝑆̂12 +(𝑛𝑛 2 −1)𝑆𝑆̂22 1 1 40∙7,82 +60∙6,32 1 1
� �𝑛𝑛 + 𝑛𝑛 � � �41 + 61 �
𝑛𝑛 1 +𝑛𝑛 2 −2 1 2 41+61−2

5 –Con un nivel de confianza de 0,95 ¿Se podría rechazar 𝐻𝐻0 ?:


A) Sí, porque el nivel crítico 𝒑𝒑es menor que el nivel de significación.
B) No, porque el estadístico de contraste no supera la máxima diferencia que cabe esperar por simple azar-
C) Sí, porque el nivel crítico 𝑝𝑝 es mayor que 𝛼𝛼.

Consultando las tablas T de Student para: 𝑛𝑛1 + 𝑛𝑛2 − 2 = 100 𝑔𝑔. 𝑙𝑙., observamos que el estadístico de contraste se
encuentra entre las puntuaciones: 1,984 y 2,364, que dejan por encima unas proporciones respectivamente: 0,025
y 0,01, luego el nivel crítico: 0,01 < 𝑝𝑝 < 0,025.

6 – El tamaño del efecto de jugar a videojuegos violentos en relación a no jugar a los mismos, es aproximadamente
igual a:
A) 1,53
B) 2,21
C) 0,44
|𝑌𝑌�1 − 𝑌𝑌�2 | |32,6 − 29,5|
𝑑𝑑 = = 0,447
(𝑛𝑛 1 −1)𝑆𝑆̂12 +(𝑛𝑛 2 −1)𝑆𝑆̂22 40∙7,82 +60∙6,32
� �
𝑛𝑛 1 +𝑛𝑛 2 −2 41+61−2

Imagine que los 41 jóvenes usuarios de videojuegos con contenidos violentos asisten a un programa deapoyo para
el reconocimiento y control de estas emociones negativas y mejora de la empatía. Al finalizar el programa se observa
que, de los 25 que antes de comenzar las sesiones obtenían puntuaciones por encima de la mediana en la escala AFV,
ahora 15 puntuaban por debajo de la mediana al terminar las sesiones. Y que después de terminar las sesiones, eran
un total de 19 jóvenes los que puntuaban por encima de la mediana. Con estos datos y estableciendo un nivel de
confianza del 95%, responda a las siguientes preguntas:

2
Construimos la tabla de contingencia (en negrita los datos que se obtienen directamente del enunciado).
Después
> 𝑀𝑀𝑀𝑀 < 𝑀𝑀𝑀𝑀
> 𝑀𝑀𝑀𝑀 𝑎𝑎 = 10 𝒃𝒃 = 𝟏𝟏𝟏𝟏 25
Antes
< 𝑀𝑀𝑀𝑀 𝑐𝑐 = 9 𝑑𝑑 = 7 16
19 22 41

7– El valor absoluto del estadístico de contraste (Z) para comprobar si el programa de apoyo ha sido eficaz para
disminuir las manifestaciones de conductas agresivas, vale, aproximadamente:
A) 0,25
B) 1,22
C) 2,11
𝑏𝑏 − 𝑐𝑐 15 − 9
𝑍𝑍 = = = 1,22
√𝑏𝑏 + 𝑐𝑐 √15 + 9
8– El nivel crítico 𝑝𝑝 para tomar una decisión respecto a si el programa de apoyo tiene algún efecto sobre la aparición
de conductas agresivas, vale, aproximadamente:
A) 𝑝𝑝 < 0,05
B) 0,05 < 𝑝𝑝 < 0,01
C) 𝒑𝒑 = 𝟎𝟎, 𝟏𝟏𝟏𝟏
En la tabla de curva normal se calcula la probabilidad de obtener valores superiores a 𝑍𝑍 = 1,22, que es: 𝑝𝑝 = 0,1112.

SITUACIÓN 2: Algunos trabajos que analizan la influencia de los videojuegos y películas sobre el desarrollo de
conductas antisociales y violentas (citados en Tejeiro, Pelegrina del Rio, M y Gómez Vallecillo, 2009) coinciden en
señalar la aparición de un mayor número de comportamientos y actitudes agresivas después de utilizar videojuegos
interactivos de contenido violento. Otros autores coinciden en señalar que el efecto nocivo de estos videojuegos de
contenidos violentos no es superior al que pueden ejercer las películas violentas vistas por TV y que las chicas
muestran más manifestaciones agresivas que los chicos después de haber estado jugando con videojuegos de
contenido violento.
Imagine que usted está interesado en comprobar si la diferencia en conductas agresivas debidas al sexo
(Factor A) es la misma para diferentes grupos de actividades (Factor B), distinguiendo entre: películas de contenido
violento (b1); videojuegos interactivos sin contenido violento(b2) y videojuegos interactivos con contenido violento
(b3). Para cada una de las combinaciones de tratamientos (Grupo de actividad y género), selecciona una muestra de 10
participantes, obteniendo los siguientes datos: 𝑆𝑆𝑆𝑆𝐴𝐴 = 1,07;[𝑌𝑌] = 2704;[𝑇𝑇] = 2509,07; [𝐵𝐵] = 2584,3; [𝐴𝐴𝐴𝐴] =
2590.
Asumiendo que se cumplen los supuestos necesarios y estableciendo un nivel de significación de 0,05 responda a las
preguntas siguientes:
Se trata de un diseño con dos factores: Sexo (a = 2) y Tipo de actividad (b = 3) donde n = 10.
Las sumas de cuadrados son:

Razones básicas Sumas de cuadrados

𝑆𝑆𝑆𝑆𝐴𝐴 = 1,07

[𝐵𝐵] = 2584,3 𝑆𝑆𝑆𝑆𝐵𝐵 = [𝐵𝐵] − [𝑇𝑇] = 2584,3 − 2509,07 = 75,23

[𝐴𝐴𝐴𝐴] = 2590 𝑆𝑆𝑆𝑆𝐴𝐴𝐴𝐴 = 194,93 − 1,07 − 75,23 − 114

[𝑌𝑌] = 2704 𝑆𝑆𝑆𝑆𝐼𝐼𝐼𝐼𝐼𝐼 𝑟𝑟𝑟𝑟 = [𝑌𝑌] − [𝐴𝐴𝐴𝐴] = 2704 − 2590 = 114

[𝑇𝑇] = 2509,07 𝑆𝑆𝑆𝑆𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 = [𝑌𝑌] − [𝑇𝑇] = 2704 − 2509,07 = 194,93

3
La tabla de ANOVA:

Valor crítico
FV SC g.l. MC F (tabla)
A 1,07 1 1,070 0,507 4,001
B 75,23 2 37,615 17,818 3,150
AxB 4,63 2 2,315 1,097
Error 114 54 2,111
Total 194,93 59

9–El diseño de su trabajo es:


A) Intragrupos de dos factores
B) Intergrupos para el factor A e intragrupos para el factor B
C) Factorial equilibrado 2x3.
10–¿Hay algún efecto principal en este diseño?
A) No, los efectos principales solo se presentan en el ANOVA de un factor.
B) Sí, uno: el sexo del que dependen el tipo de actividad.
C) Sí, dos: el sexo y el tipo de actividad.
11–El estadístico de contraste para analizar si el tipo de actividad interactúa con el sexo, vale, aproximadamente:
A) 0,22
B) 7,92
C) 1,097
12–Suponiendo que la interacción no fuese significativa, ¿cuál sería, aproximadamente, el valor del estadístico de
contraste para la hipótesis nula de quelas medias poblacionales son iguales en los diferentes grupos de actividades?
A) 7,92
B) 0,49
C) 17,76
Como la interacción no es significativa, la suma de cuadrados de la interacción pasa a formar parte de la suma de
cuadrados de error. También se suman a los grados de libertad de error los asignados previamente a la interacción. La
tabla de ANOVA queda:

FV SC g.l. MC F
A 1,07 1 1,070 0,505
B 75,23 2 37,615 17,756
Error 118,63 56 2,118
Total 194,93 59

13–Con un nivel de confianza de 0,95 el valor crítico más aproximado para tomar una decisión respecto a la hipótesis
de interacción, es:
A) 4,46
B) 3,15
C) 19,49

4
14–A partir de los resultados de su estudio las diferencias observadas para el factor “tipo de actividad”, son:
A) Es necesario realizar comparaciones múltiples.
B) Significativas para 0,01.
C) No significativas.
15–Considerando globalmente los resultados de su estudio, se podría concluir que:
A) Existen diferencias significativas en las conductas agresivas de chicos y chicas generadas por los distintos tipos
de actividad.
B) Existe alguna diferencia significativa en el factor “tipo de actividad” con independencia del sexo.
C) No existen diferencias significativas en las conductas agresivas de chicos y chicas ni entre los distintos tipos de
actividad.

SITUACIÓN 3.La falta de actividad física es un factor clave para explicar la prevalencia actual del sobrepeso y la
obesidad entre jóvenes y adultos. En este contexto, un estudio investigó la relación natural existente entre la actividad
física (AF) medida con un podómetro y el índice de masa corporal (IMC) entre estudiantes de secundaria. La actividad
física se contabilizó mediante el número de pasos por día (expresado en miles) que registró el podómetro para cada
alumno en su actividad cotidiana durante una semana. El IMC se midió en Kg/m2. Se realizó un análisis de regresión
para predecir el IMC a partir del AF en 100 participantes. Los resultados que los autores informaron fueron los
siguientes:

- La recta de regresión por mínimos cuadrados obtenida: 𝐼𝐼𝐼𝐼𝐼𝐼’ = 29,58 – 0,65 × 𝐴𝐴𝐴𝐴.
- El ajuste de la regresión proporcionó los siguientes resultados: 𝐹𝐹(1; 98) = 17,10; 𝑀𝑀𝑀𝑀𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 = 13,36; 𝑝𝑝 < 0,01
con una 𝑅𝑅 = 0,38 y un error típico de la pendiente igual a 0,16.

16– Un participante que no pueda dar ningún paso (v.g., porque esté en silla de ruedas) tendrá un IMC predicho de:
A) 29,58 Kg/m2
B) 0 ya que, efectivamente, no ha dado ningún paso.
C) 30 pasos aproximadamente.

𝐼𝐼𝐼𝐼𝐼𝐼’ = 29,58 – 0,65 × 𝐴𝐴𝐴𝐴 = 29,58 – 0,65 × 0 = 29,58

17– Si observamos un valor de IMC de 22,8 Kg/m2 en un AF = 9,5 ¿Cuánto valdrá el residuo?
A) 0 ya que en el ajuste por mínimos cuadrados el sumatorio de los errores es cero.
B) 23,05 Kg/m2
C) -0,605 Kg/m2

El residuo es, en general: 𝑌𝑌 − 𝑌𝑌´. En este caso, para un sujeto con AF =22,8:

22,8 − (29,58 − 0,65 ∙ 9,5) = 22,8 − 23,405 = −0,605

18– Dado que el modelo de regresión es significativo a un 𝛼𝛼 = 0,05, podemos afirmar que:
A) La actividad física depende causalmente del IMC con una 𝑝𝑝 < 0,01;
B) La manipulación de la actividad física realizada en el experimento permite predecir el resultado del IMC;
C) La medición de la actividad física, medida mediante el número de pasos, permite predecir el valor del IMC.

19– El estadístico de contraste para poner a prueba la significatividad del coeficiente de correlación entre el AF y el
IMC vale aproximadamente:
A) 4,07
B) 0,38
C) 0,14 que es la proporción de la varianza del IMC explicada por la varianza del AF.

𝑟𝑟𝑥𝑥𝑥𝑥 √𝑛𝑛 − 2 0,38 ∙ √100 − 2


𝑇𝑇 = = = 4,07
�1 − 𝑟𝑟𝑥𝑥2𝑥𝑥 �(1 − 0,382 )

5
20– El intervalo de confianza de la pendiente de la recta de regresión a un 𝛼𝛼 = 0,05 vale aproximadamente:
A) [-0,33; -0,97]
B) [-1,98; 1,98]
C) [-0,33; 0,22]

𝐵𝐵 ± 𝑡𝑡𝑛𝑛 −2;1−𝛼𝛼�2 𝜎𝜎𝐵𝐵

−0,33
−0,65 ± 1,984 ∙ 0,16 → �
−0,97

21– La Media Cuadrática del Anova que evalúa si existe relación lineal entre AF y IMC vale aproximadamente:
A) 1309,28
B) 228,46
C) 1537,74

𝑀𝑀𝐶𝐶𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ó𝑛𝑛 𝑀𝑀𝑀𝑀𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ó𝑛𝑛


𝐹𝐹 = → 17,10 = → 𝑀𝑀𝑀𝑀𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅𝑅 ó𝑛𝑛 = 228,46
𝑀𝑀𝑀𝑀𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 13,36

22– La ecuación de regresión expresada en puntuaciones diferenciales es:


A) 𝐼𝐼𝐼𝐼𝐼𝐼’ = 29,58 ∙ 𝐴𝐴𝐴𝐴
B) 𝒊𝒊𝒊𝒊𝒊𝒊’ = 𝟎𝟎, 𝟔𝟔𝟔𝟔 ∙ 𝒑𝒑𝒑𝒑

C) 𝑍𝑍𝐼𝐼𝐼𝐼𝐼𝐼 = 0,65 ∙ 𝑍𝑍𝐴𝐴𝐴𝐴

Preguntas teóricas

23 – En un contraste de hipótesis sobre dos medias para muestras independientes y con independencia de los
resultados obtenidos, ¿cuál de las siguientes afirmaciones es cierta?:
A) Si utilizásemos muestras más grandes aumentaría el valor del estadístico de contraste y con ello la
probabilidad de rechazar la hipótesis nula, aunque no cambiaría el tamaño del efecto.
B) Si disminuimos el tamaño de la muestra disminuiría el valor del estadístico de contraste y la significación de la
diferencia, además del tamaño del efecto.
C) Aumentando el tamaño de la muestra se consigue un efecto mayor pero no afecta al estadístico de contraste
sobre la significación de las diferencias.
24 – Se denomina parámetro al índice calculado con los datos de la:
A) Muestra.
B) Población.
C) Distribución.

25 - La evaluación de los supuestos de un modelo de regresión:


A) Debería realizarse como paso previo y como requisito al proceso inferencial.
B) Es innecesaria ya que el ajuste es muy bueno y, por consiguiente, el modelo debe ser lineal.
C) Permite identificar si la relación entre PA y IMC es, o no, lineal.

6
Modelo C. ENERO de 2018. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto

SITUACIÓN 1. Ofman, Pereyra-Girardi, Cófreces y Stefani (2014) estudiaron las diferencias de género en el
afrontamiento de la hipertensión arterial. Utilizaron para ello el Cuestionario sobre Modos de Afrontamiento (Ways of
CopingQuestionnaire). En dicho cuestionario, entre otras estrategias de afrontamiento,se mide la resolución
planificada de problemas (RPP), que consiste en desarrollar tácticas para enfrentarse al problema, intentando alterar la
situación desde una planificación analítica. Cuanto más elevadas son las puntuaciones en RPP mayor es el uso de esta
estrategia.Ofman et al. (2014) encontraron diferencias significativas en el uso de RPP en función del género,
puntuando los varones más alto que las mujeres.

Imagine que usted dispone de una muestra de 200 personas con una edad media de 57 años y desviación típica
de 8 años. La mitad de ellos son hombres, para los cuales la puntuación media en RPP es de 3,4 con una
cuasidesviación típica de 0,8. El grupo de mujeres presenta la misma variabilidad que los varones y una puntuación
media de 3,2. (𝛼𝛼 = 0,05).

1 – El intervalo de confianza para la media aritmética de la edad poblacional en la muestra total, se encuentra,
aproximadamente entre los valores:
A) 55,89 y 58,11
B) 55 y 60.
C) 54,81 y59,22

Solución:
Disponemos los datos proporcionados para facilitarnos la resolución del problema:

Muestra total Varones Mujeres


N = 200 N = 100 N=100
𝑋𝑋�𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 = 57 ������
𝑅𝑅𝑅𝑅𝑅𝑅 = 3,4 ������
𝑅𝑅𝑅𝑅𝑅𝑅 = 3,2
𝑆𝑆𝐸𝐸𝐸𝐸𝐸𝐸𝐸𝐸 = 8 𝑆𝑆̂𝑅𝑅𝑅𝑅𝑅𝑅 = 0,8 𝑆𝑆̂𝑅𝑅𝑅𝑅𝑅𝑅 = 0,8

Aplicamos la fórmula del IC para el valor de la media de edad de la muestra total:


𝑆𝑆𝑛𝑛
𝑌𝑌� ± 𝑡𝑡𝑛𝑛 −1;1−𝛼𝛼�2 � �
√𝑛𝑛 − 1

8 58,11
57 ± 1,96 ∙ → 57 ± 1,11 → �
√200 − 1 55,89
2 – Al contrastar si las varianzas poblacionales entre hombres y mujeres son iguales para la variable RPP, se obtienen
un estadístico de contraste y un nivel crítico, aproximadamente:

A) 𝐹𝐹 = 1,352 (𝑝𝑝 = 0,05)


B) 𝑭𝑭 = 𝟏𝟏 (𝒑𝒑 > 0,20)
C) 𝐹𝐹 = 1 (𝑝𝑝 < 0,20)

-1-
Solución:
Como nos han indicado que las cuasidesviaciones típicas son idénticas entre ambas muestras (hombres y mujeres),
el estadístico F sería igual a la unidad.

𝑆𝑆̂12 0,82
𝐹𝐹 = = =1
𝑆𝑆̂22 0,82

Para determinar qué nivel crítico es apropiado, debemos considerar que los grados de libertad son 99 y 99 (aunque
tendremos que aproximar a los g.l. más aproximados, en este caso, 120). Luego consultando en las tablas de la F
para diversos valores de P encontramos:

Tabla 0,90 (p = 0,10)  1,265


Tabla 0,95 (p = 0,05)  1,352
Tabla 0,975 (p = 0,025)  1,433
Tabla 0,99 (p = 0,01)  1,533

Observamos que una F = 1,265 deja por encima de sí una p = 0,10, luego una F = 1, al ser inferior a 1,265 deja por
encima de sí un valor superior a 0,10. Como en el caso del contraste de varianzas debemos utilizar un contraste
bilateral tenemos que multiplicarlo por 2 (0,10 x 2 = 0,20). La única opción correcta es, entonces, la B.

3 – En función de los resultados de la pregunta anterior, se puede asumir que:


A) Las varianzas poblacionales para RPP son diferentes para hombres y mujeres.
B) Las varianzas poblacionales para RPP son iguales para hombres y mujeres.
C) Las varianzas poblaciones para RPP son normales para hombres y mujeres.

Solución:
tal y como se indica directamente en el enunciado y el resultado inferencial del estadístico F obtenido en la pregunta
anterior, la opción correcta es la B. La opción C es irrelevante ya que se refiere al tipo de distribución de la variable
RPP.

4 – Para contrastar si los resultados de su muestra replican los resultados de Ofman et al. (2014), la hipótesis nula que
se debe plantear es:
A) 𝐻𝐻0 : 𝜇𝜇𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 = 𝜇𝜇𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀
B) 𝐻𝐻0 : 𝜇𝜇𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 ≥ 𝜇𝜇𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀
C) 𝑯𝑯𝟎𝟎 : 𝝁𝝁𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯𝑯 ≤ 𝝁𝝁𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴𝑴

Solución:

Ofman et al. (2014) encontraron que los varones puntuaban más alto que las mujeres (𝜇𝜇𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻𝐻 > 𝜇𝜇𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀 ). Como
nuestro objetivo es replicar este resultado de Ofman, la hipótesis que tenemos que poner a prueba sin favorecer la
hipótesis en la que creemos (que los resultados que vamos a obtener en nuestra muestra van a replicar los obtenidos
por Ofman, esta es nuestra hipótesis) es aquella que plantea su complementaria: que la media de RPP en varones será
inferior o igual al de las mujeres.

5 – El estadístico de contraste para contrastar la hipótesis de la pregunta anterior, vale, aproximadamente:


A) 𝑇𝑇 = 1,12
B) 𝑇𝑇 = 1,37
C) 𝑻𝑻 = 𝟏𝟏, 𝟕𝟕𝟕𝟕

-2-
Solución:
aplicamos un contraste de medias para grupos independientes asumiendo varianzas iguales y desconocidas:

𝑌𝑌�1 − 𝑌𝑌�2 3,4 − 3,2


𝑇𝑇 = = = 1,77
(𝑛𝑛 1 −1)𝑆𝑆̂12 +(𝑛𝑛 2 −1)𝑆𝑆̂22 1 1 99∙0,82 +99∙0,82 1 1
� � + � � � + �
𝑛𝑛 1 +𝑛𝑛 2 −2 𝑛𝑛 1 𝑛𝑛 2 100+100−2 100 100

6 – El nivel crítico asociado al estadístico de contraste de la pregunta anterior, se encuentra entre los valores:
A) 𝟎𝟎, 𝟎𝟎𝟎𝟎𝟎𝟎 < 𝑝𝑝 < 0,05
B) 0,10 < 𝑝𝑝 < 0,15
C) 0,05 < 𝑝𝑝 < 0,10
Solución:

Acudimos a la tabla de curva normal dado que contamos con más de 100 g.l., donde observamos que para una z =
1,77, la p correspondiente es𝑝𝑝 = 1 − 0,9616 = 0,0384que es un valor que se encuentra entre 0,05 y 0,025.

7 – Los resultados obtenidos en su muestra:


A) Replican los resultados de Ofman et al. (2014), si bien hay que tener en cuenta que el tamaño del efecto es
pequeño según la clasificación de Cohen.
B) Replican los resultados de Ofman et al. (2014), siendo, además muy grande el tamaño del efecto obtenido
según la clasificación de Cohen.
C) No replican los resultados de Ofman et al. (2014).

Solución: debido a que hemos rechazado la hipótesis de que la media en hombres sea superior a la de las mujeres,
nuestros resultados van en la línea de Ofman et al. 82014) y calculando el tamaño del efecto se muestra que es
pequeño en la clasificación de Cohen.

|𝑌𝑌�1 − 𝑌𝑌�2 | 3,4 − 3,2


𝑑𝑑 = = = 0,25
(𝑛𝑛 1 −1)𝑆𝑆̂12 +(𝑛𝑛 2 −1)𝑆𝑆̂22 99∙0,82 +99∙0,82
� �
𝑛𝑛 1 +𝑛𝑛 2 −2 100+100−2

La respuesta correcta es A. Los resultados replican los obtenidos por Ofman et al. (2014) el tamaño del efecto es
pequeño.

8 – Para aplicar un contraste paramétrico a los datos de su muestra:


A) Tanto la variable dependiente como la independiente han de ser cuantitativas (de intervalo o razón).
B) La variable dependiente ha de ser cuantitativa (de intervalo o razón).
C) La variable independiente ha de ser cuantitativa (de intervalo o razón).

Solución:

Uno de los criterios para aplicar los tests paramétricos es que la VD sea cuantitativa. En el caso de la VI no hay nada
específico para la distinción entre paramétrico y no paramétrico. La opción correcta es la B.

SITUACIÓN 2. Un profesor está interesado en comparar la eficacia de tres métodos de enseñanza (M1, M2 y M3) sobre
el aprendizaje académico. Como sospecha que el Cociente Intelectual (CI) también afecta a este aprendizaje, también
manipula a los participantes en función del CI (Alto y Bajo). Dispone de una muestra de 9 sujetos con un CI “Alto” y 9
sujetos con CI “Bajo”. Para cada grupo de CI, asigna, aleatoriamente, a 3 sujetos a cada uno de los métodos de
enseñanza. Sabiendo que:[𝑌𝑌] = 811;[𝐴𝐴𝐴𝐴] = 801 y conociendo los valores de la matriz AB:

-3-
M1 M2 M3
Alto 15 24 30 69
Bajo 6 15 21 42
21 39 51 111

Solución:
La muestra está formada por 18 sujetos, 9 con CI alto y otros 9 con CI bajo. Cada uno de estos 9 sujetos se reparten
entre los tres métodos de enseñanza, con lo que n= 3. Por tanto, el diseño es de dos factores con muestras
independientes: Método de enseñanza (𝑎𝑎 = 3) y CI (𝑏𝑏 = 2), y cada una de las condiciones experimentales con 𝑛𝑛 = 3.

Las razones básicas y sumas de cuadrados son:

Razones básicas Sumas de cuadrados

212 + 392 + 512


[𝐴𝐴] = = 760,5 𝑆𝑆𝑆𝑆𝐴𝐴 = [𝐴𝐴] − [𝑇𝑇] = 760,5 − 684,5 = 76
2∙3

692 + 422
[𝐵𝐵] = = 725 𝑆𝑆𝑆𝑆𝐵𝐵 = [𝐵𝐵] − [𝑇𝑇] = 725 − 684,5 = 40,5
3∙3

[𝐴𝐴𝐴𝐴] = 801 𝑆𝑆𝑆𝑆𝐴𝐴𝐴𝐴 = [𝐴𝐴𝐴𝐴] − [𝐵𝐵] − [𝐴𝐴] + [𝑇𝑇] = 801 − 760,5 − 725 + 684,5 = 0

[𝑌𝑌] = 811 𝑆𝑆𝑆𝑆𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼𝐼 = [𝑌𝑌] − [𝐴𝐴𝐴𝐴] = 811 − 801 = 10

1112
[𝑇𝑇] = = 684,5 𝑆𝑆𝑆𝑆𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇𝑇 = [𝑌𝑌] − [𝑇𝑇] = 811 − 684,5 = 126,50
18

A continuación, se construye la tabla de ANOVA con esta información, lo cual nos permitirá contestar casi
directamente las cuestiones posteriores.

FV SC g.l. MC F p F tabla
A 76,00 2 38,00 45,600 0,0000 3,885
B 40,50 1 40,50 48,600 0,0000 4,747
A×B 0,00 2 0,00 0,000 1,0000 3,885
Intra 10,00 12 0,83
Total 126,50 17 7,44

9–Se trata de un diseño:


A) De un factor con muestras independientes.
B) De un factor con muestras relacionadas.
C) De dos factores con muestras independientes.

Dos factores: los tres métodos de enseñanza y el CI de dos niveles, alto y bajo.

10 – El estadístico de contraste para el factor “Método de enseñanza” vale:


A) 76
B) 38
C) 45,6

-4-
11 – El estadístico de contraste para el factor “CI”, vale:
A) 48,60
B) 40,50
C) 4,747

12 – El estadístico de contraste para la interacción, vale:


A) Cero.
B) Uno.
C) 3,885

13 – Para 𝛼𝛼 = 0,05, el valor crítico para comprobar si existe interacción es igual a:


A) 5,096
B) 3,885
C) 6,927

Solución: para resolver esta cuestión hemos de ver en las tablas de 0,95, el valor correspondiente de F para 2 y 12
grados de libertad. Este valor resulta valer 3,885.

14 – Los resultados revelan diferencias significativas:


A) Para los factores “Método de enseñanza” y “CI” pero no para la interacción.
B) Para la interacción pero no para los factores “Método de enseñanza” y “CI”.
C) Observaremos diferencias significativas o no, dependiendo del nivel de confianza adoptado.

15 – Lo más apropiado en este caso, teniendo en cuenta el resultado obtenido para la interacción, es buscar en las
tablas el valor crítico para el factor “Método de enseñanza” con los siguientes grados de libertad:
A) 2 y 12
B) 2 y 14
C) 1 y 12

Solución: como la interacción no ha resultado significativa, lo que haremos será incluir la interacción en el término de
error, incrementando de esta forma los grados de libertad del término “intra” en 2 unidades. Lo cual hace que los
niveles de libertad sean 2 y 14.

SITUACIÓN 3.García-Jiménez, Alvarado-Izquierdo y Jiménez-Blanco (2000) estudiaron la capacidad de la regresión


lineal múltiple en la predicción del rendimiento académico, encontrando que el rendimiento previo es un buen
predictor del rendimiento futuro, teniendo también un peso importante el grado de participación del alumno en clase.
Se desea estudiar en qué medida estas variables son capaces de predecir el rendimiento en alumnos de la UNED en la
asignatura de Diseños de Investigación. Para ello se dispone de las puntuaciones de una muestra de 18 estudiantes en
las siguientes variables: X1 (nota en la asignatura de primero Introducción al Análisis de Datos), X2 (participación en los
foros) e Y (nota en el examen presencial en Diseños de Investigación). Conociendo los siguientes datos y tomando
𝛼𝛼 = 0,05:

Matriz de correlaciones
X1 X2 Y Varianzas
X1 - 0,658 0,361 X1 2,917
X2 - 0,028 X2 1,930
Y - Y 3,090

16 – La pendiente de la ecuación de regresión lineal simple de Y sobre X1 vale, aproximadamente:


A) 0,36
B) 3,49
-5-
C) 0,37

Solución: En esta situación no disponemos de los datos directos, pero sí disponemos de los valores de correlación y
desviaciones típicas. Por consiguiente, calculamos la pendiente mediante:

𝑆𝑆𝑦𝑦 √3,090
𝐵𝐵 = 𝑟𝑟𝑥𝑥𝑥𝑥 = 0,361 ∙ = 0,37
𝑆𝑆𝑥𝑥 √2,917

17 – El estadístico de contraste para comprobar si es significativo el coeficiente de correlación de Pearson entre X1 e Y,


vale, aproximadamente:
A) 1,10
B) 1,84
C) 1,55

Solución:

𝑟𝑟𝑥𝑥𝑥𝑥 √𝑛𝑛 − 2 0,361√18 − 2


𝑇𝑇 = = = 1,55
2
�1 − 𝑟𝑟𝑥𝑥𝑥𝑥 �1 − 0,3612

18 – El nivel crítico asociado al estadístico de contraste de la pregunta anterior se encuentra, aproximadamente, entre
los valores:
A) 𝟎𝟎, 𝟏𝟏𝟏𝟏 < 𝑝𝑝 < 0,20
B) 0,20 < 𝑝𝑝 < 0,30
C) 0,05 < 𝑝𝑝 < 0,10
Solución:
Buscamos en las tablas de la T con 18-2 = 16 grados de libertad. Encontramos que el valor T = 1,55 se encuentra entre
los valores 1,337 y 1,746, los cuales dejan por encima de sí 1-0,900 y 1-0,95 respectivamente (es decir, 0,10 y 0,05).
Como el contraste de la correlación debe considerarse bilateral, estos valores debemos multiplicarlos por dos. Esto nos
deja que la p de T = 1,5 se encuentra entre 0,20 y 0,10.

19 – En función de los resultados obtenidos podemos concluir que la relación entre X1 e Y:


A) Es significativa para NC = 99%
B) Es significativa para NC =95% pero no para NC = 99%
C) No es significativa para NC = 95%

Solución: al 0,05 el valor de % = 1,55 no resulta significativo. Por consiguiente, tampoco lo es para 0,01.

20 –La proporción de varianza del rendimiento en Diseños de Investigación explicada por el rendimiento en
Introducción al Análisis de Datos y la participación en los foros conjuntamente, vale, aproximadamente:
A) 0,13
B) 0,21
C) 0,46

Solución: Nos están preguntando por el coeficiente de determinación múltiple de X1 y X2 para predecir Y.
Aplicamos la fórmula:

2 2
2
𝑟𝑟𝑦𝑦1 + 𝑟𝑟𝑦𝑦2 − 2𝑟𝑟𝑦𝑦1 𝑟𝑟𝑦𝑦2 𝑟𝑟12 0,3612 + 0,0282 − 2 ∙ 0,361 ∙ 0,028 ∙ 0,658
𝑅𝑅𝑦𝑦.12 = = = 0,208
1 − 𝑟𝑟212 1 − 0,6582
-6-
21 – El coeficiente de correlación entre las variables X2 e Y eliminando de ambas el influjo de X1 vale,
aproximadamente:
A) 0,028
B) - 0,30
C) 0,30

Solución: Nos están preguntando por el coeficiente de correlación parcial (eliminamos el influjo de X1 tanto de X2
como de Y, luego es parcial):
𝑟𝑟𝑦𝑦2 − 𝑟𝑟𝑦𝑦1 𝑟𝑟12 0,028 − 0,361 ∙ 0,658
𝑝𝑝𝑝𝑝2 = = = −0,30
��1 2
− 𝑟𝑟𝑦𝑦1 2)
�(1 − 𝑟𝑟12 �(1 − 0,3612 )(1 − 0,6582 )

Preguntas teóricas

22 – Cuál de los siguientes estimadores de su correspondiente parámetro poblacionalNO es insesgado:


A) La media aritmética.
B) La varianza.
C) La proporción.

Solución:
La varianza muestral no es un estadístico insesgado de la varianza poblacional mientras que la media aritmética y la
proporción sí lo son.

23 – La probabilidad de mantener una hipótesis nula falsa se denomina:


A) 𝛼𝛼
B) 𝜷𝜷
C) 1 − 𝛽𝛽
Solución:
Nos están preguntado por el error tipo II que es Beta.

24 – Cuando al realizar un ANOVA un investigador no está interesado en comprobar las diferencias entre todas las
medias y sabe de antemano que comparaciones le interesan, se denomina a las comparaciones múltiples que ha de
realizar:
A) “a priori”.
B) “a posteriori”.
C) “post hoc”.

Solución: las comparaciones a posteriori se utilizan cuando el investigador no establece a priori las comparaciones a
realizar y solo lo hace después de ejecutado el experimento. Por el contrario, cuando sí conoce estos contrastes antes
de realizar el estudio, se denominan “a priori”.

25 – Al realizar inferencias sobre correlación y regresión, el supuesto de homocedasticidad se refiere a:


A) La normalidad de las distribuciones condicionadas en Y para cada valor de X.
B) La independencia en Y de los valores estimados condicionados para cada valor de X.
C) La igualdad de varianzas de las distribuciones de los errores condicionadas a cada valor de X.

-7-
Solución: el supuesto de homocedasticidad hace referencia a la igualdad de varianzas en las distribuciones de los
errores condicionadas a cada valor de X (no a la normalidad ni a la independencia entre valores de Y).

-8-
Modelo A. Septiembre de 2018. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se
pueda introducir texto.

SITUACIÓN 1.Un estudio reciente de Vizoso, Vegay Fernández (2018) analiza las actitudes negativas
hacia las personas con sobrepeso y su relación con otras variables como el género, el nivel de
estudios y la edad encontrando que en una muestra de estudiantes con edades comprendidas
entre 12 y 24 años, las estudiantes presentaban menor antipatía hacia la obesidad, pero más miedo
a engordar que los estudiantes y que los estudiantes de mayor edad y mayor nivel educativo
mostraron una actitud menos negativa hacia la obesidad que ellas.

Imagine que está usted interesado en continuar con el estudio de la tolerancia hacia la obesidad
utilizando una muestra de 300 personas de la población general de entre 20 y 65 años de edad que
responden al cuestionario de Antifat Attitudes Scale, adaptado al español por Magallares y Morales
(2014). Los ítems del cuestionario proporcionan puntuaciones en tres dimensiones: Antipatía hacia
las personas obesas (A), Miedo a la gordura (M) y Voluntad para controlar el peso (V). En la escala A
se obtienen los siguientes valores para las medias y desviaciones típicas de los hombres y mujeres,
así como el tamaño de la muestra (n) de hombres y mujeres.

Hombres Mujeres
Media 2,1 1,8
Cuasi-desviación típica 0,85 0,87
n 180 120

1- Si queremos estimar la varianza poblacional de las puntuaciones de las mujeres en la escala A


con un error máximo de estimación que no supere los 0,15 puntos y con un nivel de confianza de
0,95, ¿cuál debería ser, aproximadamente, el tamaño de la muestra que deberíamos utilizar?
A) 1565;
B) 256;
C) 196.
2
(𝑍𝛼⁄ ) 1,962
2
𝑛 = 2 𝑆4 = 2 𝑥 0,874 = 195,63 ≈ 196
𝐸2 0,152

2- La distribución muestral del estadístico para contrastar si las varianzas poblacionales de las
puntuaciones en la escala A de hombres y mujeres son iguales se distribuye según la:
A) Normal;
B) T de Student con (180+120-2) grados de libertad;
C) F de Snedecor.
El contraste de hipótesis sobre igualdad de varianzas poblacionales en los diseños de dos muestras
independientes, se realiza con el estadístico F que tiene una distribución F (Tema 3, epígrafe 3.5,
pág 108).

3- Con un nivel de confianza del 95%, el intervalo de confianza de la media poblacional de los
hombres en la escala de “Antipatía hacia las personas obesas” es, aproximadamente:
A) 1,97 y 2,224;
B) 1,93 y 2,27;
C) 2,01 y 2,18.
𝑆𝑛−1 0,85
𝐼𝐶 = 𝑌̅ ± 𝑍1−𝛼⁄ = 2,1 ± 1,96 = 2,1 ± 0,124 → (1,97; 2,224)
2 √𝑛 √180

4- Si el intervalo de confianza de la media poblacional de las mujeres en la escala A es un valor


comprendido entre 1,594 y 2,006, el nivel de confianza utilizado ha sido del:
A) 90%;
B) 95%;
C) 99%.

La amplitud de este intervalo es 2,006-1,594=0,412. El error máximo de estimación corresponde a


la mitad de este intervalo, y es: 0,412/2= 0,206. Por tanto, solo hay que conocer el valor de Z en la
siguiente expresión:

𝑆𝑛−1 0,87
𝐸𝑚𝑎𝑥 = 𝑍1−𝛼⁄ → 0,206 = 𝑍1−𝛼⁄ = 𝑍1−𝛼⁄ 0,0797 →
2 √𝑛 2 √120 2
0,206
𝑍1−𝛼⁄ = = 2,58
2 0,0797

Y el valor de Z=2,58 es el que corresponde a un nivel de confianza del 99%.

5- Si, como concluye el estudio original de Vizoso y cols. (2018), quiere comprobar que las
estudiantes (simbolizadas como M), presentaban menor antipatía hacia la obesidad que los
estudiantes (simbolizados como H), ¿cuál de las siguientes hipótesis estaría correctamente
formulada?
A) 𝐻1 : 𝜇𝑀 > 𝜇𝐻 ;
B) 𝐻0 : 𝜇𝑀 ≤ 𝜇𝐻 ;
C) 𝑯𝟏 : 𝝁𝑴 < 𝝁𝑯

En este caso, la hipótesis nula (de no diferencia o diferencia nula) diría que "las estudiantes
(simbolizadas como M), presentaban igual antipatía o mayor hacia la obesidad que los estudiantes (H)" por
lo que su hipótesis alternativa es la que corresponde a la opción C).
6- El estadístico de contraste para comprobar la hipótesis de que las estudiantes presentan menor
Antipatía (A) hacia la obesidad que los estudiantes es, en valor absoluto:
A) 2,75;
B) 2,96;
C) 0,32.
El estadístico de contraste, es:

𝑌̅1 − 𝑌̅2 1,8 − 2,1


𝑇= = = 2,97 (𝑝 < 0,01)
(𝑛1 −1)𝑆̂12 +(𝑛2 −1)𝑆̂22 1 1 119×0,872 +179×0,852 1 1
√ ( + ) √ ( + )
𝑛1 +𝑛2 −2 𝑛1 𝑛2 120+180−2 1201 180

7- Para rechazar la hipótesis nula, el nivel crítico p tiene que ser:


A) mayor que el nivel de significación;
B) menor que el nivel de significación;
C) fuera de la zona delimitada por los valores críticos de la distribución muestral.

8- A partir de la interpretación del estadístico d del tamaño del efecto, ¿cuál de las siguientes
afirmaciones es la CORRECTA?:
A) Casi el 64% de las mujeres obtienen puntuaciones por encima de la media de los hombres en la
escala A de antipatía hacia la obesidad;
B) El 36,32% de los hombres obtienen puntuaciones en la escala A de antipatía hacia la obesidad
que no alcanza la media de las mujeres;
C) El 34,96% de las mujeres obtienen puntuaciones que superan la media de los hombres en la
escala A de antipatía hacia la obesidad.

|𝑌̅𝑀 − 𝑌̅𝐻 |
𝐷= =
(𝑛1 −1)𝑆̂12 +(𝑛2 −1)𝑆̂22

𝑛1 +𝑛2 −2
1,8 − 2,1
= 0,3496
119×0,872 +179×0,852

120+180−2

9- Cuando la hipótesis alternativa marca el sentido de una diferencia, nos encontramos ante:
A) un contraste unilateral;
B) un contraste bilateral;
C) situaciones que requieren necesariamente utilizar dos o más muestras.

SITUACIÓN 2. El Equipo Docente de Diseños de Investigación quiere comprobar si existen


diferencias significativas entre las puntuaciones medias obtenidas en las PECS por los estudiantes
de distintos Centros Asociados de la UNED. Para ello, selecciona aleatoriamente muestras de
estudiantes seleccionados de tres centros asociados específicos obteniendo los siguientes
resultados: 𝑛1 = 6; 𝑛2 = 8 𝑦 𝑛3 = 5; 𝑇 = 181; [𝑌] = 1733 𝑦 [𝐴] = 1724,3. Suponiendo que se
cumplen los supuestos necesarios:

𝑇2 1812
[𝑇] = = = 1724,26
𝑁 6+8+5

𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = [𝑌] − [𝑇] = 1733 − 1724,26 = 8,74


𝑆𝐶𝐼𝑛𝑡𝑒𝑟 = [𝐴] − [𝑇] = 1724,3 − 1724,26 = 0,04
𝑆𝐶𝐼𝑛𝑡𝑟𝑎 = [𝑌] − [𝐴] = 1733 − 1724,3 = 8,7

FV SC GL MC F
Inter 0,04 3-1 = 2 0,02 0,0367
Intra 8,7 19-3 = 16 0,544
Total 8,74 19-1 = 18

10- Se trata de un diseño:


A) Factorial
B) Un factor de efectos fijos
C) Un factor de efectos aleatorios

11- La hipótesis nula es:


A) 𝑯𝟎 : 𝝁𝟏 = 𝝁𝟐 = 𝝁𝟑
B)𝐻0 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 (al menos para un par de 𝜇𝑖 )
C) 𝐻1 : 𝜇1 = 𝜇2 = 𝜇3

12- El valor de la media cuadrática intragrupo vale, aproximadamente:


A) 771,65
B) 1543,3
C) 0,544

13- El valor del estadístico de contraste vale, aproximadamente:


A) 0,034
B) 3,4
C) 6,23

14- Para un nivel de confianza del 99%, el valor crítico vale, aproximadamente:
A) 0,034
B) 3,4
C) 6,23

El valor de la distribución F con 2 y 16 grados de libertado, y con una probabilidad de 0,99, es 6,23.
15- Los resultados obtenidos:
A) Son significativos para un nivel de confianza del 99%.
B) Son significativos para NC = 95% pero no para NC = 99%
C) No son significativos.

16- Al interpretar los resultados encontramos que:


A) Las diferencias entre las medias son muy pequeñas, pero los resultados son claramente
significativos porque existe muy poca variabilidad intragrupo.
B) Las diferencias entre las medias son muy grandes, como podemos deducir al comparar el
estadístico de contraste con el valor crítico.
C) Las diferencias entre las medias son muy pequeñas, y por lo tanto no se obtienen
resultados significativos.

17- Si quisiéramos comparar la media del examen presencial con la combinación de las medias de
las dos PECS, los coeficientes del contraste serían:
A) 2; -1; -1
B) 1; -1; 2
C) 2;1; 1
La hipótesis nula es:
𝝁𝒑𝟏 + 𝝁𝒑𝟐
𝑯𝟎 : 𝝁𝒆𝒙 = → 𝟐 𝝁𝒆𝒙 = 𝝁𝒑𝟏 + 𝝁𝒑𝟐𝟑 → 𝟐 𝝁𝒆𝒙 − (𝟏)𝝁𝒑𝟏 − (𝟏)𝝁𝒑𝟐𝟑 = 𝟎
𝟐

SITUACIÓN 3:Las costumbres y modas de la sociedad actual, divulgados también por los medios de
comunicación, promueven el rechazo ante algunas características físicas como la obesidad que, a su
vez, constituye uno de los principales motivos de acoso escolar (bullying) entre los jóvenes. En un
reciente estudio realizado en la Universidad de León por Vizoso, Vega y Fernández (2018), se aplicó
el cuestionario de Antifat Attitudes Scale, adaptada al español por Magallares y Morales (2014), a
una muestra de estudiantes con edades comprendidas entre los 12 y los 24 años, de los que 180
eran chicos y 129 chicas. Este cuestionario proporciona puntuaciones en tres subescalas: Antipatía
hacia las personas obesas (A), Miedo a la Gordura (M) y Voluntad para controlar el peso (V) que,
junto con la edad (E) obtuvieron los coeficientes de correlación que se muestran en la siguiente
tabla, junto con las desviaciones típicas:

A M V E
A 0,26 0,38 -0,21
M O,16 -0,05
V 0,20
Desv. típica 0,9 1,68 1,34 2,6

18. El estadístico de contraste para analizar la significación de la correlación entre la edad (E), y la
voluntad para controlar el peso (V), es en valor absoluto aproximadamente:
A) 2,72;
B) 3,58;
C) 2,3.

𝑟𝐴𝐸 √𝑛 − 2 0,20 √309 − 2


𝑇= = = 3,576 ≅ 3,58
√1 − 2 √1 − 0,202
𝑟𝐴𝐸

19. El porcentaje de la variabilidad explicado por las puntuaciones en la escala de Antipatía (A)
hacia las personas obesas a partir de la edad (E), es:
A) del 21%;
B) del 4,41%;
C) No se puede determinar por tratarse de una correlación negativa.

2
𝑟𝐴𝐸 = −0,21 → 𝑟𝐴𝐸 = −0,212 = 0,0441 → 4,41%

20. La correlación entre el miedo a la gordura (M) y la voluntad para controlar el peso (V):
A) es tan pequeña que no puede ser significativa;
B) es significativa con un 𝛼 = 0.05 pero no con un 𝛼 = 0.01;
C) es significativa con 𝜶 = 𝟎. 𝟎𝟏.

𝑟𝑀𝑉 √𝑛 − 2 0,16 √309 − 2


𝑇= = = 2,84 (𝑝 = 0,0023 < 0,01)
√1 − 2 √1 − 0,162
𝑟𝑀𝑉

21. A partir de los resultados de la tabla podemos concluir que:


A) a mayor edad (E) disminuye de forma significativa la antipatía (A) hacia las personas
obesas;
B) el miedo a la gordura(M) disminuye de forma significativa con la edad (E);
C) La edad (E) no correlaciona significativamente con la voluntad (V) para controlar el peso.
22. La correlación entre la Antipatía (A) hacia las personas obesas y el Miedo (M) a la gordura es
0,26. Si quisiéramos calcular cuánto vale esta correlación eliminando de ambas variables el
efecto de la edad, calcularemos la correlación:
A) semi-parcial entre A y M eliminando el efecto de E;
B) parcial entre M y A eliminando el efecto de E;
C) lineal ajustada entre A y E, eliminando el efecto de M.

23. La ecuación de regresión múltiple en puntuaciones directas y diferenciales tienen:


A) la misma ordenada y diferentes coeficientes de regresión;
B) distintas ordenadas pero los mismos coeficientes de regresión;
C) distintas ordenadas y distintos coeficientes de regresión.

En puntuaciones diferenciales, la ecuación de regresión pasa por el origen de coordenadas


̅ 𝑌̅), pero conservando la misma pendiente que en puntuaciones
definidos por los puntos (𝑋;
directas.

24. La correlación entre la Antipatía ante la obesidad (A) y la Voluntad para controlar el peso (V)
eliminando de esta última la influencia de la edad (E), vale aproximadamente:
A) 0,34;
B) -0,29;
C) 0,43.

A (Y) V (X1) E (X2)


A (Y)
V X1) 0,38
E (X2) -0,21 0,20

𝑟𝑌 𝑋1 − 𝑟𝑌 𝑋2 𝑟𝑋1 𝑋2 0,38 − [−0,21 ∙ (0,20)]


𝑠𝑟1 = = = 0,44
√1 − 𝑟𝑋21 𝑋2 √1 − 0,202
25. En el análisis de regresión múltiple (que podríamos obtener para estimar la Antipatía ante las
personas obesas -A- a partir de la Edad -E-, el miedo a la gordura -M- y la Voluntad para
controlar el peso -V-) el coeficiente de determinación:
A) aumenta a medida que aumenta el error típico de estimación;
B) es el complementario al coeficiente de alienación;
C) representa la proporción de varianza de la variable dependiente no explicada por el conjunto
de variables dependientes.

Tanto para el análisis de correlación bivariada como multivariada, el coeficiente de


determinación es el cuadrado del coeficiente de correlación y representa la proporción de
variabilidad de la variable dependiente, Y, que puede explicarse a partir de la, o las, variables
independietentes, X.
2
2
𝑆𝑌´ 𝑆𝑌2 + 𝑆𝐸2 𝑆𝐸2
𝑟𝑋𝑌 = 2 = =1− 2
𝑆𝑌 𝑆𝑌2 𝑆𝑌
Su complementario corresponde al coeficiente de alienación que representa la proporción de
varianza de la variable dependiente, Y, no explicada por la, o las, variables independientes.
A partir de las fórmulas anteriores, puede deducirse que a medida que disminuye la varianza de
los errores aumenta el coeficiente de determinación, y viceversa.
Modelo A. ENERO_FEBRERO de 2019. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir
texto

SITUACIÓN 1: Santiago, Lupiáñez, Pérez y Funes (2007) diseñaron un experimento para analizar si el tiempo se
organiza sobre la dimensión espacial izquierda-derecha. Para ello, presentaron verbos en la pantalla del ordenador a
los participantes, quienes debían juzgar rápidamente si estaban en pasado o en futuro. Un grupo de participantes
(Grupo A) debían responder “pasado” apretando la tecla de la izquierda y “futuro” apretando la tecla de la derecha y
el otro (Grupo B) se les asignaba las teclas de respuesta a la inversa: “pasado” con la tecla derecha y “futuro” con la
tecla izquierda.

Imagine que en este trabajo participaron 100 personas que fueron distribuidos al azar y a partes iguales entre las dos
condiciones experimentales, obteniendo que la media y desviación típica del tiempo de reacción (TR) de los sujetos
del grupo A fueron 250 mseg y 30 mseg y en el grupo B de 262 mseg y 35 mseg, respectivamente. Con esta
información responda a las siguientes preguntas:

1.- En este trabajo se utiliza un diseño de:


A) Un factor con cuatro niveles.
B) Dos muestras independientes.
C) Dos muestras relacionadas con asignación aleatoria.

2.- Considerando exclusivamente a los participantes del grupo A, el intervalo de confianza del tiempo medio de
reacción, con un nivel de confianza de 0,95, es aproximadamente:
A) [228,77; 271,23]
B) [252,05; 268,70]
C) [241,39; 258,61]

𝑆𝑛 30
𝑡𝑛−1;1−𝛼⁄2 = 𝑡49;0,975 ≈ 𝑡50;0,975 = 2,009 𝜎𝑌̅ = = = 4,286
√𝑛 − 1 √50 − 1
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 𝜎𝑌̅ = 2,009 ∙ 4,286 = 8,611 𝐼𝐶 = 𝑌̅ ± 𝐸𝑚𝑎𝑥 → 250 ± 8,611 → [241,39; 258,61]

3.- Si el objetivo del trabajo es medir los TR para comprobar que la percepción del tiempo se organiza sobre la
dimensión espacial izquierda-derecha, ¿cuál de las siguientes formulaciones de la hipótesis alternativa H1 refleja
mejor este objetivo?:
A) 𝜇𝐺𝑟𝑢𝑝𝑜 𝐴 − 𝜇𝐺𝑟𝑢𝑝𝑜 𝐵 ≠ 0
B) 𝝁𝑮𝒓𝒖𝒑𝒐 𝑨 < 𝝁𝑮𝒓𝒖𝒑𝒐 𝑩
C) 𝜇𝐺𝑟𝑢𝑝𝑜 𝐵 < 𝜇𝐺𝑟𝑢𝑝𝑜 𝐴

4.- El estadístico de contraste de la hipótesis de igualdad de varianzas en los TR de los dos grupos de participantes y
su nivel crítico aproximadamente valen:
A) 𝑭 = 𝟏, 𝟑𝟔; 𝒑 > 𝟎, 𝟎𝟓
B) 𝐹 = 1,36; 𝑝 < 0,05
C) 𝐹 = 0,73; 𝑝 < 0,05

En el enunciado nos proporciona las desviaciones típicas. Las cuasivarianzas son:

302 ∙ 50 352 ∙ 50
𝑆̂12 = = 918,367 𝑆̂22 = = 1250
49 49

Situando la cuasivarianza mayor en el numerador:


𝑆̂12 1250
𝐹= 2= = 1,36
𝑆̂2 918,367
(Nota: en este caso, al ser 𝑛1 = 𝑛2 obtenemos el mismo valor para F si introducimos las varianzas en lugar de las
cuasivarianzas)

Acudiendo a la tabla F de Fisher con 50 y 60 grados de libertad (los más próximos a 49 y 49), observamos que la
puntuación 1,413 deja por encima de sí una proporción igual a 0,10, Dado que el estadístico de contraste
(𝐹 = 1,36) es menor que dicha puntuación, el nivel crítico es superior a 0,10 (𝑝 > 0,10), por lo que no es
significativo.

5.- Considerando la situación 1, la distribución muestral del estadístico de contraste que debe aplicar para contrastar
si el tiempo medio se organiza sobre la dimensión espacial izquierda-derecha, es:
A) F de Fisher.
B) T de Student.
C) Chi-cuadrado asumiendo varianzas iguales.

6.- El estadístico para el contraste de la hipótesis de que el tiempo medio se organiza sobre la dimensión espacial
izquierda-derecha, vale aproximadamente:
A) -1,82
B) 2,13
C) 1,09

𝑌̅1 − 𝑌̅2 250 − 262


𝑇= = = −1,82
(𝑛 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 1 1 √49 ∙ 918,367 + 49 ∙ 1250 ( 1 + 1 )
√ 1 (𝑛 + 𝑛 ) 98 50 50
𝑛1 + 𝑛2 − 2 1 2

7.- El nivel crítico p para tomar una decisión respecto a la 𝐻0 es:


A) p < 0,01
B) p > 0,05
C) 0,01 < p < 0,05

Acudiendo a la tabla T de Student para 100 grados de libertad (los más próximos a 98), observamos que la
puntuación 1,82 se encuentra comprendida entre 1,66 y 1,984, que dejan por encima de si, respetivamente, las
probabilidades: 0,05 y 0,025, luego la respuesta correcta es C.

8.- Siendo la 𝐻0 falsa, la probabilidad de no tener evidencias suficientes para rechazarla corresponde al:
A) Error tipo I con una probabilidad “alfa”.
B) Error tipo II con una probabilidad “beta”.
C) nivel de significación p.

9.- Si el estadístico d de Cohen hubiera sido 𝑑 = 0,55 ¿Cuál de las siguientes afirmaciones es VERDADERA?
A) El 70,88% de participantes del grupo B reaccionan con más rapidez que los del grupo A.
B) El 55% de participantes del grupo B tienen un TR más rápido que los del grupo A
C) El 70,88% de participantes del grupo B tienen un TR más lento que los del grupo A.

Acudiendo a la tabla de curva normal, para 𝑍 = 0,55, obtenemos una probabilidad igual a 0,7088 y las siguientes
posibles interpretaciones:

El 70,88% de participantes del grupo A tienen un TR más rápido que los del grupo B.
El 29,12% de participantes del grupo A tienen un TR más lento que los del grupo B.

Y sus complementarias

El 70,88% de participantes del grupo B tienen un TR más lento que los del grupo A.

El 29,12% de participantes del grupo B tienen un TR mas rápido que los del grupo B.

SITUACIÓN 2: La tabla 2 muestra datos hipotéticos sobre la evaluación subjetiva del grado de efectividad de tres
métodos para tratar las migrañas, siendo el primero un grupo placebo. La eficacia de cada método ha sido evaluada
por una muestra diferente de individuos que padecían jaqueca (a mayor valor, mayor efectividad subjetiva del
método). En el apartado de resultados, el experimentador ha proporcionado la siguiente tabla:

Método 1 Método 2 Método 3


(grupo placebo)
5 6 8
4 6 7
3 7 6
3 8 8
4 4 7
5 5
3 8
4 5
8
2
𝐹(2, 20) = 8,729, 𝑀𝐶𝑒𝑟𝑟𝑜𝑟 = 2,129. Medias Intervalo de
confianza al 95%
Método 1 4,10 [3,138; 5,062]
Método 2 6,125 [5,049; 7,201]
Método 3 7,200 [5,839; 8,561]

El enunciado nos proporciona datos que podemos introducir en la tabla de ANOVA:

FV SC gl MC F
Inter 8,729
Intra 20 2,129
Total

También sabemos que: 𝑛1 = 10; 𝑛2 = 8; 𝑛3 = 5 → 𝑁 = 23, por lo que podemos calcular los grados de libertad
para la media cuadrática intergrupo y total y completar fácilmente los datos que nos faltan de la tabla de ANOVA:

FV SC gl MC F
Inter 37,168 2 18,584 8,729
Intra 42,580 20 2,129
Total 79,748 22

10.- Se trata de un diseño:


A) aleatorio desequilibrado;
B) de tres factores desequilibrados con un único nivel (tipo de método);
C) de medidas independientes desequilibrado de efectos fijos;
11.- Debido a que este diseño se analiza mediante un Análisis de Varianza, la hipótesis nula que debemos plantear
es:
A) 𝐻1 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 al menos para un par de 𝜇𝑖
B) 𝐻0 : 𝜎12 = 𝜎22 = 𝜎32
C) 𝑯𝟎 : 𝝁𝟏 = 𝝁𝟐 = 𝝁𝟑

12.-La suma de cuadrados para el factor Método vale aproximadamente:


A) 0,329;
B) 37,164;
C) 15032;

13.- Sabiendo que las barras verticales son los intervalos de confianza, la gráfica que representa apropiadamente
estos datos es:

A) B) C)

14.- El nivel crítico de la F obtenida:


A) está entre 0,025 y 0,05;
B) es inferior a 0,01;
C) está entre 0,01 y 0,025;

Acudiendo a la tabla F de Fisher comprobamos que el nivel crítico es menor que 0,01.

15.- El número de efectos simples a verificar:


A) es de 3;
B) es de 9 ya que tenemos tres niveles y, por tanto, las comparaciones dos a dos serán 32 = 9;
C) no tiene sentido realizar comparaciones de efectos simples en un diseño de un único factor;

16- El valor de la razón básica [A] vale:


A) 389,999;
B) 98392,2;
C) 727,425;

Calculando la suma de las puntuaciones para cada uno de los niveles:

𝐴2𝑖 412 492 362


[𝐴] = ∑ ( )= + + = 727,425
𝑛𝑖 10 8 5

17.- Si queremos realizar la comparación múltiple a posteriori entre el grupo de control y los métodos 2 y 3
considerados como un único grupo, los coeficientes a utilizar para realizar este contraste serán:
A) 𝑐1 = 2, 𝑐2 = −2, 𝑐3 = −2
B) 𝑐1 = −, 𝑐2 = 2, 𝑐3 = 2
C) 𝒄𝟏 = 𝟐, 𝒄𝟐 = −𝟏, 𝒄𝟑 = −𝟏
𝜇2 +𝜇3
La hipótesis sería: 𝜇1 = 2
Y de aquí, la siguiente expresión:

2 𝜇1 = 1 𝜇2 + 1 𝜇3 que da lugar a la ecuación: 2 𝜇1 − 1 𝜇2 − 1 𝜇3 = 0


18.- Si queremos realizar la comparación múltiple a posteriori entre el grupo de control y los métodos 1 y 2
considerados como un único grupo el valor del estadístico de contraste valdrá (𝛼 = 0′01):
A) 4,249;
B) 0,725;
C) 5,849;

𝑐2 22 −12 −12
∑ ( 𝑖 ⁄𝑛𝑖 ) = + + = 0,725
10 8 5

𝑐2
𝐶𝑅𝑆𝑐ℎ𝑒𝑓𝑓𝑒 = √(𝑎 − 1) ∙ 𝐹(1−𝛼),(𝑎−1),(𝑁−𝑎) √𝑀𝐶𝐼𝑛𝑡𝑟𝑎 [∑ ( 𝑖 ⁄𝑛𝑖 )] = √2 ∙ 5,849 ∙ 2,129 ∙ 0,725 = 4,249

19.- En un diseño 2x2, ¿cuál de las siguientes gráficas no muestra una interacción?

A) B) C)

SITUACION 3: Un estudio de Beltrán, Valor y Expósito (2015) sobre "El perdón ante transgresiones en las relaciones
interpersonales" analiza, mediante un análisis de regresión, las variables que predicen el perdón tanto en hombres
como en mujeres. En el caso de las mujeres encuentran que el coeficiente de la pendiente de regresión entre la
dependencia emocional, como variable predictora, X1, sobre el sentimiento de venganza, Y, es de 0,245 (t = 2,42; p =
0,017).

Imagine que realiza un estudio similar con una muestra de 52 varones que contemplan un cortometraje de un
escenario de infidelidad protagonizado por una mujer. Posteriormente, responden a un cuestionario que
proporciona puntuaciones sobre tres escalas, en las que la dependencia, (D) y el malestar personal, (M), actúan
como variables predictoras del sentimiento de venganza, (V). En la siguiente tabla se muestran correlaciones y
desviaciones típicas de las tres variables:

VENGANZA DEPENDENCIA MALESTAR


Y=V
X1 = D 0,28
X2 = M 0,34 0,11
Desv. típica 1,5 1,7 2,1

A partir de los datos de su estudio:

20.- ¿Qué porcentaje de la variabilidad del sentimiento de venganza, V, se debe o puede explicarse por el malestar
personal, M?
A) 11,56%
B) 7,84%
C) 34%

2
𝑟𝑉𝑀 = 0,342 = 0,1156 → 11,56%
21.- El estadístico de contraste para poner a prueba la hipótesis de que la correlación entre el sentimiento de
venganza, V, y la dependencia, D, es significativamente distinta de cero, vale:
A) 2,06.
B) 2,55.
C) 0,78.

𝑟𝑥𝑦 √𝑛 − 2 0,28√50
𝑇= = = 2,06
√1 − 2
𝑟𝑥𝑦 √1 − 0,282

22.- La pendiente de la ecuación de regresión en puntuaciones directas para estimar el sentimiento de venganza, Y, a
partir del malestar personal, X2, es:
A) 0,2428.
B) 0,2167.
C) 0,2939.

𝑆𝑦 1,5
𝐵 = 𝑟𝑥𝑦 = 0,34 = 0,2428
𝑆𝑥 2,1

23.- A un 𝑁𝐶 = 0,95, la pendiente de la ecuación de regresión en puntuaciones directas para estimar el


sentimiento de venganza, Y, a partir del malestar personal será un valor comprendido entre:
A) 0,0519 y 0,4336.
B) 0,11 y 0,334.
C) -0,024 y 0,457.

2
𝑆𝑦 1 − 𝑟𝑥𝑦 1,5 1 − 0,342
𝐸𝑚𝑎𝑥 = 𝑡𝑛−2;1−𝛼⁄2 𝜎𝐵 = 𝑡𝑛−2;1−𝛼⁄2 √ = 2,009 ∙ √ = 0,19085
𝑆𝑥 𝑛 − 2 2,1 50

𝐵 ± 𝐸𝑚𝑎𝑥 → 0,2428 ± 0,19085 → (0,0519; 0,4336)

24.- En el análisis de regresión, ¿cuál de las siguientes afirmaciones es VERDADERA?


A) El coeficiente de determinación múltiple obtenido en la muestra, R2, es un estimador sesgado del coeficiente
de determinación múltiple en la población.
B) El estadístico para el contraste de significación del coeficiente de correlación es independiente del tamaño de
la muestra.
C) La pendiente de la ecuación de regresión es distinta cuando se obtiene a partir de las puntuaciones directas
que a partir de las puntuaciones diferenciales.

25.- A partir de los resultados obtenidos por Beltrán et al. (2015) con la muestra de mujeres, y estableciendo un nivel
de confianza del 95%, podemos concluir que:
A) Cuanto mayor es la dependencia emocional menor es el sentimiento de venganza.
B) Cuanto menor es la dependencia emocional menor es el sentimiento de venganza.
C) La dependencia emocional no es un predictor del sentimiento de venganza.
Modelo C. ENERO de 2019. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir texto

SITUACIÓN 1. Ortega, Ramírez y Chamorro (2015) aplican un programa basado en la Psicología Positiva para
aumentar el bienestar de personas mayores, concluyendo que dicho programa permite mejorar la calidad de vida en
los ancianos. Imagine que usted dispone de una muestra de 30 personas institucionalizadas con una edad media de
85 años y una cuasidesviación típica de 5 años a las que aplica el programa propuesto por Ortega et al. (2015),
midiendo la felicidad subjetiva antes y después del tratamiento mediante la Escala de Felicidad Subjetiva (EFS) de
Lyubomisky y Lepper (1999). El objetivo del tratamiento consiste en incrementar la felicidad subjetiva. La media en la
variable dependiente (felicidad subjetiva) antes del tratamiento fue igual a 4 y después del tratamiento igual a 5,
siendo la cuasivarianza de las diferencias igual a 2.

1- Tomando 𝛼 = 0,05, los límites del intervalo de confianza para la media poblacional de la edad valen,
aproximadamente:
A) 81,8 y 88,2
B) 83,13 y 86,87
C) 79,64 y 90,36

𝑆𝑛−1 5
𝐸𝑚𝑎𝑥 = 𝑡𝑛−1;1−𝛼⁄2 𝜎𝑌̅ = 𝑡𝑛−1;1−𝛼⁄2 = 2,045 ∙ = 1,867
√𝑛 √30

𝑌̅ ± 𝐸𝑚𝑎𝑥 → 85 ± 1,867 → (83,13; 86,67)

2- Tomando 𝛼 = 0,05, los límites del intervalo de confianza para la varianza poblacional de la edad valen,
aproximadamente:
A) 15,857 y 45,180
B) 3,98 y 6,72
C) 20,21 y 30,42
2
(𝑛 − 1)𝑆𝑛−1 29 ∙ 25
𝑙𝑖 = 2 = = 15,857
𝜒𝑛−1;1−𝛼⁄2 45,7223

2
(𝑛 − 1)𝑆𝑛−1 29 ∙ 25
𝑙𝑠 = 2 = = 45,180
𝜒𝑛−1;𝛼⁄2 16,0471

3- Para comprobar si el tratamiento ha sido eficaz, la hipótesis alternativa que se ha de plantear es:
A) 𝐻1 : 𝜇𝐴𝑛𝑡𝑒𝑠 − 𝜇𝐷𝑒𝑠𝑝𝑢é𝑠 > 0
B) 𝐻1 : 𝜇𝐴𝑛𝑡𝑒𝑠 − 𝜇𝐷𝑒𝑠𝑝𝑢é𝑠 ≠ 0
C) 𝑯𝟏 : 𝝁𝑨𝒏𝒕𝒆𝒔 − 𝝁𝑫𝒆𝒔𝒑𝒖é𝒔 < 𝟎

4- El estadístico de contraste obtenido al poner a prueba la hipótesis de la pregunta anterior vale,


aproximadamente:
A) -3,873
B) 3,502
C) 0,95
𝑌̅1 −𝑌̅2 4−5
𝑇= ̂2
= = −3,873
𝑆 2
√ 𝑑 √
𝑛 30

-1-
5- El nivel crítico asociado al estadístico de contraste de la pregunta anterior vale, aproximadamente:
A) 𝒑 < 𝟎, 𝟎𝟎𝟓
B) 𝑝 = 0,005
C) 𝑝 > 0,005

Acudiendo a la tabla T de Student para 29 grados de libertad, vemos que la puntuación 2,756 deja por encima de
si una probabilidad igual a 0,005. Dado que el estadístico de contraste es más extremo que dicha puntuación, la
respuesta correta es A.

6- De acuerdo con los resultados obtenidos:


A) Se mantiene la hipótesis nula para 𝛼 = 0,01 dado que 𝑝 < 𝛼
B) Se rechaza la hipótesis nula para 𝜶 = 𝟎, 𝟎𝟏 dado que 𝒑 < 𝜶
C) Se rechaza la hipótesis nula para 𝛼 = 0,01 dado que 𝑝 > 𝛼

7- La conclusión que se puede extraer sobre el programa basado en la Psicología Cognitiva, en este experimento,
es:
A) No incrementa la felicidad subjetiva en las personas mayores institucionalizadas.
B) Los resultados no son concluyentes dado que el estadístico de contraste es mayor que el valor crítico.
C) Incrementa la felicidad subjetiva en las personas mayores institucionalizadas.

SITUACIÓN 2. Vizoso, Vega y Fernández (2018) estudian las actitudes negativas hacia la obesidad en jóvenes
españoles. Utilizando la Antifat Attitudes Scale (AFA, Crandall, 1997; adaptada al español por Magallares y Morales,
2014), encuentran que las estudiantes presentaban menor antipatía hacia la obesidad y que los estudiantes de mayor
edad y con mayor nivel educativo, mostraron una actitud menos negativa hacia la obesidad.

Imagine, que usted está interesado en estudiar si existen diferencias en cuanto a las actitudes negativas hacia la
obesidad en personas mayores en función del género y el nivel educativo. Dispone de una muestra de 48 personas
con una edad media de 50 años, 24 de ellos con un nivel educativo “bajo” y 24 con un nivel educativo “alto”. En cada
uno de los grupos en función del nivel educativo, 12 personas son hombres y 12 mujeres. Conociendo los valores de la
matriz AB:

a1 (bajo) a2 (alto)
b1 (hombres) 42 37
b2 (mujeres) 39 23

Y sabiendo que: [A] = 423,38; [B] = 420,21; [Y] = 527; [AB] = 431,92:

Calculando las sumas marginales del la matriz AB, se puede calcular la razón básica [T], que es la única no
proporcionada en el enunciado:

a1 (bajo) a2 (alto)
b1 (hombres) 42 37 79
b2 (mujeres) 39 23 62
81 60 141

1412
[𝑇] = = 44,1875
48
-2-
A continuación elaboramos la tablas de ANOVA:

FV SC gl MC F Ftabla
A 9,1925 1 9,1925 4,2540 4,0617
B 6,0225 1 6,0225 2,7870 4,0617
AxB 2,5175 1 2,5175 1,1650 4,0617
Error 95,08 44 2,1609
Total 112,8125 47

8- Se trata de un diseño:
A) De un factor con muestras independientes.
B) De un factor con muestras relacionadas.
C) De dos factores con muestras independientes.

9- La hipótesis alternativa para el factor A (nivel educativo) es:


A) 𝐻1 : 𝜇𝐵𝑎𝑗𝑜 < 𝜇𝐴𝑙𝑡𝑜
B) 𝑯𝟏 : 𝝁𝑩𝒂𝒋𝒐 ≠ 𝝁𝑨𝒍𝒕𝒐
C) 𝐻1 : 𝜇𝐵𝑎𝑗𝑜 > 𝜇𝐴𝑙𝑡𝑜

10- El estadístico de contraste para el factor “nivel educativo” vale, aproximadamente:


A) 4,25
B) 9,19
C) 4,06

11- El estadístico de contraste para el factor “género” vale, aproximadamente:


A) 6,02
B) 2,78
C) 3,77

12- El estadístico de contraste para la interacción vale, aproximadamente:


A) 2,52
B) 1,17
C) 9,19

13- Sobre los grados de libertad de los estadísticos de contraste de esta situación:
A) Son iguales para el factor A, el factor B y la interacción.
B) Son iguales para el factor A y el factor B porque tienen el mismo número de niveles y distintos para la
interacción
C) La suma de los grados de libertad de A, B y la interacción es igual al número total de sujetos menos uno.

14- Para un nivel de confianza del 95% y tomando el valor más próximo que podemos consultar en las tablas, se
encuentran diferencias significativas para:
A) Solo para la interacción.
B) Solo para el factor A (nivel educativo).
C) Solo para el factor B (género).

SITUACIÓN 3. Un estudio citado en Wilcox (2009) investigó si los niveles de radiación solar (NRS medidos en calorías
por día) pueden predecir las tasas de cáncer de pecho (TCP) medidas en 24 ciudades de los Estados Unidos. Los

-3-
autores proporcionaron los siguientes índices estadísticos: 𝑟𝑇𝐶𝑃,𝑁𝑅𝑆 = −0’801, 𝐹(1, 22) = 39’40, 𝑀𝐶𝑒 = 5’362,
𝑇𝐶𝑃’ = 39’99 – 0,036 × 𝑁𝑅𝑆.

15- El análisis estadístico realizado fue:


A) Un Anova de medidas independientes.
B) Una regresión lineal simple.
C) Un Anova de medidas dependientes.

16- La proporción de la variabilidad de la tasa de cáncer de pecho que puede imputarse a la variabilidad de la
radiación solar vale:
A) 0’392
B) 0’642
C) 0,005

Si 𝑟𝑇𝐶𝑃,𝑁𝑅𝑆 = −0’801 entonces 𝑟 2 = 0,6416

17- Si el nivel de radiación solar existente en una ciudad fuese de cero (hipotéticamente, una ciudad que estuviese
siempre a oscuras), la tasa de cáncer de pecho pronosticada valdría aproximadamente:
A) 39’99
B) 2’289
C) -0’80

Utilizando la ecuación de regresión el valor de la TSP para NRS=0 es 𝑇𝐶𝑃’ = 39’99 – 0,036 × 0 = 39,99

18- Sabiendo que STCP = 3’783 y SNRS = 85’01, el valor del estadístico de contraste para poner a prueba la significación
de la pendiente de regresión vale aproximadamente:
A) 𝐹 = 39’40
B) 𝑻 = − 𝟔, 𝟑
C) 𝑇 = 3’02

𝐵−0 −0,036
𝑇= = = −6,3
2 3,783 √1 − 0,6416
𝑆𝑦 √1 − 𝑟𝑥𝑦
𝑆𝑥 𝑛 − 2 85,01 24 − 2

19- Dos índices de bondad de ajuste apropiados para esta situación son:
A) El Error Típico (𝑆̂𝐸𝑟𝑟𝑜𝑟 ) y el coeficiente de alienación ajustado (𝑅 2).
B) 𝑹𝟐 y el Error Típico (𝑺 ̂𝑬𝒓𝒓𝒐𝒓).
C) 𝑟 𝑇𝐶𝑃′ ,𝜖 y el coeficiente de alienación (1 − 𝑅 2).

20- En regresión múltiple se utilizar R2 ajustado en lugar de R2 porque:


A) R2 es un estimador insesgado de 𝜌2 .
B) Tenemos que considerar el número de observaciones y el número de variables dependientes para mejorar la
consistencia del estadístico
C) El segundo es un estimador sesgado de 𝝆𝟐

21- El coeficiente de correlación parcial es:


A) Una correlación entre residuos.
B) Una correlación de orden cero.
C) Una correlación que depende del influjo de las otras variables existentes en el modelo.

-4-
Preguntas teóricas:

22- En un contraste de hipótesis sobre una media, si incrementamos el tamaño muestral:


A) Disminuye la potencia del contraste.
B) Aumenta β.
C) Las dos opciones anteriores son falsas.

23- En todo contraste de hipótesis, para que podamos rechazar 𝐻0 el nivel crítico p tiene que:
A) Ser mayor que el nivel de significación α.
B) Ser menor que el nivel de significación α.
C) Ser mayor o menor que α dependiendo de si el contraste es unilateral derecho o izquierdo.

24- En un contraste sobre dos medias, si la magnitud del efecto es grande:


A) Necesariamente la diferencia entre las dos medias muestrales es significativa.
B) El tamaño de las muestras es grande.
C) La diferencia puede ser significativa o no dependiendo del tamaño de las muestras.

25- Al método de ajuste de una recta de regresión, se le conoce como:


A) Ajuste por mínimos cuadrados.
B) Ajuste por máxima verosimilitud.
C) Ajuste de la varianza del error.

-5-
Modelo A. SEPTIEMBRE de 2019. No debe entregar los enunciados
Fórmula de corrección: Aciertos x 0,4 - Errores x 0,2
Material permitido: Formulario sin anotaciones y cualquier tipo de calculadora en la que no se pueda introducir
texto

SITUACIÓN 1: El craving se refiere al deseo intenso por el consumo de un tipo de droga que ya se ha consumido
previamente y constituye un factor esencial en el éxito terapéutico para el tratamiento de las adicciones. Esta
temática fue abordada en un Trabajo Fin de Grado (TFG) presentado por un estudiante en la convocatoria de junio
de 2019. En su proyecto propone seleccionar una muestra de 60 adictos a la cocaína que cumpliesen determinados
criterios de inclusión para participar en el trabajo con los que forma dos grupos de igual tamaño que asigna a dos
tipos de tratamiento: Terapia Cognitivo Conductual (TCC) e Intervención Basada en Mindfulness, (IBM). Una vez
terminado el tratamiento, todos los sujetos responderían a la versión abreviada en español del Cocaine Craving
Questionnaire-Now (CCQ-N10) de Tejero, Trujols y Siñol (2003) para obtener una medida global de la intensidad del
craving a la cocaína, en el que a mayor puntuación mayor intensidad. Transcurridos tres meses se registraron el
número de sujetos que tuvieron alguna recaída en cada uno de los grupos. Imagine que se obtienen los resultados
que se muestran en la siguiente tabla:

TCC IBM
𝑌̅ 52,15 53,85
𝑆𝑛−1 6,3 6,9
Recaídas 8 12

1.- ¿Cómo es la distribución muestral de la proporción de recaídas obtenidas en todas las posibles muestras del
mismo tipo y tamaño extraídas de una determinada población de adictos a la cocaína?.
A) Binomial, pero se aproxima a la normal si las muestras son grandes;
B) Siempre normal;
C) T de Student, pero se aproxima a la normal si las muestras son grandes.

La distribución muestral de la proporción es una distribución normal que se aproxima a la normal a medida que
aumenta el tamaño de la muestra. (Tema 1, página 11 del texto)

2. Con un nivel de confianza del 95%, ¿cuál debería ser el tamaño necesario, aproximadamente, de la muestra para
estimar la proporción poblacional de los sujetos que tienen recaídas y sometidos a terapia contra el craving con un
error máximo que no supere el 5%?:
A) 95;
B) 369;
C) 341.

De los 60 sujetos, 20 (8+12) tuvieron alguna recaída durante los tres meses siguientes. Esto supone una proporción
del 33,33%. Por tanto, el tamaño de la muestra necesario para estimar la proporción poblacional de los sujetos que
tienen con un error máximo que no supere el 5%, es:

𝑍2 1,962
𝑛 = 𝑝 (1 − 𝑝) = 0,333 ∗ (1 − 0,333) ∗ = 341,47
𝐸2 0,052

Diseños de Investigación y Análisis de datos. Facultad de Psicología. UNED. -1-


3.- Si el investigador desea contrastar la hipótesis de que la varianza del Cocaine Craving Questionnaire-Now (CCQ-
N10) administrado después de pasar por la Intervención Basada en Mindfulness, es menor de 50 puntos, el
estadístico de contraste que obtiene es:
A) 27,61; Siendo las hipótesis nula y alternativa:
B) 56,18;
C) 46,83. 𝐻𝑜 : 𝜎 2 ≥ 50
𝐻1 ; 𝜎 2 < 50

El estadístico de contraste es:


2
(𝑛 − 1) 𝑆𝑛−1 (30 − 1) 6,92
𝜒2 = = = 27,61
𝜎2 50

4.- Si el psicólogo quiere comprobar que la proporción de recaídas tras la Intervención Basada en Mindfulness es
significativamente inferior al 50%, la hipótesis nula que formula es:
A) 𝑃𝐼𝐵𝑀 ≤ 0,50
B) 𝝅𝑰𝑩𝑴 ≥ 𝟎, 𝟓𝟎 Se trata de un contraste unilateral sobre la proporción poblacional y las hipótesis nulas y
C) 𝜋𝐼𝐵𝑀 = 0,50 alternativa son, respectivamente:

𝐻𝑜 : Π ≥ 0,50
𝐻1 ; Π < 0,50

5.- Si el psicólogo quiere comprobar que la proporción de recaídas tras la Intervención Basada en Mindfulness es
significativamente inferior a 0,5, el estadístico de contraste y su nivel crítico p, valen:

A) 1,1; p= 0,2733; Siendo la proporción de recaídas tras la intervención basada en IBM, del 40%
B) -1,1; p= 0,2733; (12/30), el estadístico de contraste es:
C) -1,1; p= 0,1357.
𝑝−Π 0,40 − 0,50
𝑍= = = −1,09
𝜎𝑝 0,50 𝑥 0,50

30

Buscamos en la tabla de la distribución normal el valor crítico p que corresponde a P(Z<= -1,1) = 0,1357

6.- El análisis de datos que el psicólogo aplicaría para comprobar que la intensidad al craving es menor después de la
Terapia Cognitivo Conductual que con la Intervención Basada en Mindfulness es:
A) Un contraste de hipótesis unilateral de diferencia de medias para muestras independientes;
B) Un contraste de hipótesis de diferencia de proporciones para muestras independientes;
C) Un contraste de hipótesis bilateral de diferencia de medias para muestras independientes.

Diseños de Investigación y Análisis de datos. Facultad de Psicología. UNED. -2-


7.- Con referencia a la pregunta anterior, el estadístico de contraste que se obtiene, en valor absoluto es,
aproximadamente:
A) 1,41; El investigador quiere comprobar que la intensidad al craving es menor después de la
B) 1; Terapia Cognitivo Conductual que con la Intervención Basada en Mindfulness aplicadas a
C) 2,92. dos muestras distintas de sujetos adictos, para lo que formula una hipótesis unilateral
(derecha o izquierdo según cómo se escriban las hipótesis). En este caso:

𝐻𝑜 : 𝜇 𝑇𝐶𝐶 ≥ 𝜇𝐼𝐵𝑀 → 𝜇𝑇𝐶𝐶 − 𝜇𝐼𝐵𝑀 ≥ 0


𝐻1 ; 𝜇 𝑇𝐶𝐶 < 𝜇𝐼𝐵𝑀 → 𝜇𝑇𝐶𝐶 − 𝜇𝐼𝐵𝑀 < 0

Antes de aplicar el estadístico de contraste para dos muestras independientes hay que saber si estas provienen de
poblaciones con la misma varianza, aplicando la prueba F:

𝑆̂12 6,92
𝐹= = = 1,19 𝑝 > 0,05
𝑆̂22 6,32

En la distribución F, con 29 (30-1) en el numerador y 29 gl en el denominador y un nivel de confianza de 0,95 el valor


crítico es 1,649. Como el estadístico obtenido (1,19) es menor que el valor crítico, no podemos rechazar la Ho de
varianzas poblacionales iguales. Por tanto, aplicamos el contraste t de Student para dos muestras independientes
que provienen de poblaciones con la misma varianza.

(𝑌̅𝑇𝐶𝐶 − 𝑌̅𝐼𝐵𝑀 ) − (𝜇𝑇𝐶𝐶 − 𝜇𝐼𝐵𝑀 ) (52,15 − 53,85) − 0


𝑇= = = −1
2 2
(𝑛 − 1)𝑆̂12
+ (𝑛2 − 1)𝑆̂22 1 1 √29 ∙ 6,3 + 29 ∙ 6,9 ( 1 + 1 )
√ 1 ( + ) 30 + 30 − 2 30 30
𝑛1 + 𝑛2 − 2 𝑛1 𝑛2

8.- El nivel crítico 𝑝 para el contraste de hipótesis anterior es:


A) 𝑝 < 0,01
B) 0,01 < 𝑝 < 0,05
C) 𝒑 > 𝟎, 𝟎𝟓

Buscamos en la tabla t con 58 gl (30+30-2), el valor más próximo a t= 1, que son o 0,848 o 1,045.

El valor t=1 se encuentra entre estos dos valores, los cuales dejan a su izquierda una probabilidad de 0.800 y 0,85,
respectivamente, por lo que a su derecha dejarán una probabilidad de 0,20 y 0,15. Como la distribución t es
simétrica, para la puntuación t=-1 el nivel crítico p corresponde a la probabilidad correspondiente a su izquierda que
es un valor comprendido entre 0,15 y 0,20. En consecuencia, el nivel crítico p asociado al estadístico t= -1, es p >
0,05. Como el nivel crítico p es mayor que cualquiera de los niveles de significación habitualmente utilizados (0,05 o
0,01) no tenemos evidencias suficientes para rechazar la Ho, lo que indica que no existen diferencias significativas
entre estas dos terapias para el tratamiento del craving.

Diseños de Investigación y Análisis de datos. Facultad de Psicología. UNED. -3-


9.- Si para la hipótesis anterior, el tamaño del efecto medido por el estadístico de Cohen fuera 0,26, estos resultados
indicarían que:
A) La diferencia es significativa porque el 39,74% de los tratados con TCC están por debajo de la media de los
tratados con IBM;
B) La diferencia es significativa porque el 60,26% de los tratados con IBM están por debajo de la media de los
tratados con TCC;
C) La diferencia no es significativa, pero el 39,74% de los tratados con IBM están por debajo de la media de los
tratados con TCC.

Como consecuencia de la pregunta anterior, la conclusión es que la diferencia no es significativa (t= -1; p >0,05). Por
otro lado, la puntuación d=0,26 cuantifica la distancia tipificada entre las medias de los dos tratamientos. En la
distribución normal una puntuación 0,26 deja a su izquierda una probabilidad de 0,6026 (60,26%) lo que significa
que hay un 60,26% de sujetos tratados con TCC que quedan por debajo de la media de los sujetos tratados con IBM.
Pero observando la gráfica, también se puede decir que:

El 39,74% de los tratados con TCC están por encima de la media de los tratados con IBM
El 60,26% de los tratados con IBM están por encima de la media de los tratados con TCC
El 39,74% de los tratados con IBM están por debajo de la media de los tratados con TCC, que corresponde a la
alternativa C).

SITUACION 2. Un TFG presentado por una estudiante en la convocatoria de junio 2019 de este curso académico
planteaba el análisis de la influencia del estilo de liderazgo (Transformacional frente al Autocrático) y el género del
líder sobre determinadas variables de los empleados, como la satisfacción laboral (SL), rendimiento (RE) y sentido de
pertenencia o compromiso de los empleados con su trabajo (SP). Para el registro de estas variables se proponían
varios cuestionarios, como el Utrecht Work Engagement (UWES) desarrollado por Schaufeli & Bakker (2003) que
valora un estado mental positivo asociado con la satisfacción laboral -donde a mayor puntuación mayor satisfacción-
y al que responden todos y cada uno de los 15 empleados pertenecientes a cada condición, obteniendo los
siguientes datos: SC(Estilo liderazgo)= 10; SC(Género)= 38; SC(Intra)= 45; SC(Total)= 314. Asumiendo que se cumplen
los supuestos necesarios para el contraste de hipótesis, responda a las siguientes preguntas:

10.- El diseño que utiliza el investigador es:


A) De dos muestras independientes;
B) De un factor de efectos fijos para muestras independientes;
C) Factorial (2x2).

En el estudio se consideran dos variables independientes (el estilo de liderazgo y el género) y cada una de ellas tiene
dos niveles: transformacional y autocrático, para el estilo de liderazgo y hombres y mujeres, para el género.

Diseños de Investigación y Análisis de datos. Facultad de Psicología. UNED. -4-


11.- ¿Cuantas hipótesis formularía en este diseño?
A) Dos;
B) Tres; Una para la influencia del estilo de liderazgo, otra para la influencia del género y la tercera para
C) Cuatro. la interacción de estos dos factores.

12.- Si desea dar respuesta a la pregunta: ¿El estilo de liderazgo influye en la satisfacción laboral de los empleados?,
la hipótesis nula que formularía es:
A) 𝜇 𝑇𝑅𝐴≥ 𝜇𝐴𝑈𝑇
̅ ̅𝑇𝑅𝐴
B) 𝑌𝐴𝑈𝑇 = 𝑌
Al no indicarse en qué sentido (favorable o desfavorable; positivo o negativo, etc)
puede actuar esta influencia, se formula un contraste bilateral.
C) 𝝁𝑻𝑹𝑨 = 𝝁𝑨𝑼𝑻

13.- El estadístico de contraste que se obtiene para el análisis de la influencia del género del líder sobre la
satisfacción laboral de los empleados es, aproximadamente:
A) 47,3;
B) 27,5; Con los datos del enunciado, señalados en rojo, completamos la tabla para obtener los
C) 12,5. estadísticos de contraste para las tres hipótesis, siendo la debida a la influencia del género
la de la alternativa A).

FV SC GL MC F
LIDER 10 1 10,00 12,44
GENERO 38 1 38,00 47,29
INTERACCION 221 1 221,00 275,02
INTRA 45 56 0,80
TOTAL 314 59 5,32

14.-A partir de los resultados obtenidos ¿existen diferencias significativas en la satisfacción de los empleados con un
líder autocrático o transformacional en función del género del líder?:
A) Sí porque el estadístico es, aproximadamente: 𝑭 = 𝟐𝟕𝟓, 𝟎𝟐; 𝒑 < 𝟎, 𝟎𝟏;
B) No porque el estadístico de contraste es, aproximadamente: 𝐹 = 12,5; 𝑝 > 0,05;
C) Sí porque el nivel crítico p para el factor género es mayor que el nivel de significación.

Buscamos en la tabla de F, los valores que corresponden a los grados de libertad del numerador y denominador del
estadístico F:
𝑀𝐶(𝑙𝑖𝑑𝑒𝑟𝑎𝑧𝑔𝑜)
𝐹=
𝑀𝐶(𝐼𝑛𝑡𝑟𝑎)
Estos g.l son 1 y 56, respectivamente.

En la tabla de F con 1 y 60 gl (el más próximo a los 56) el valor más alto de F que encontramos es 8,495 que deja a su
izquierda una probabilidad de 0,995 siendo entonces el nivel crítico para este valor de p=0,005. Como el estadístico
de contraste obtenido (F=12,44) es mayor que el de la tabla (8,495) el nivel crítico p para F=12,44 es p< 0,005, que es
también menor que 0,01.

15.- El nivel crítico p para tomar una decisión sobre la hipótesis de que el estilo de liderazgo afecta a la satisfacción
laboral del empleado de forma diferencial cuando el líder es hombre o mujer, es:
A) 𝒑 < 𝟎, 𝟎𝟏
B) 𝑝 > 0,05 Siguiendo el mismo razonamiento que en la pregunta anterior, el nivel crítico p
C) 0,01 < 𝑝 < 0,05 se busca en la tabla de la distribución F.

Diseños de Investigación y Análisis de datos. Facultad de Psicología. UNED. -5-


16.- Si se encuentran diferencias significativas en la satisfacción laboral debidas al estilo de liderazgo el paso
siguiente sería:
A) Realizar contrastes a posteriori con los coeficientes (1; -1; 0; 0) para establecer entre que niveles se producen
estas diferencias;
B) No se requiere contrastes a posteriori en un diseño factorial (2x2);
C) Una prueba t de Student entre las medias de los dos grupos.

Los contraste a posteriori solo tienen sentido cuando el factor tiene tres o más niveles, en cuyo caso, para encontrar
diferencias significativas hay que realizar todas las comparaciones dos a dos para determinar entre cuáles de estos
niveles del factor existen diferencias.

17.- Con independencia de los resultados cuantitativos obtenidos, ¿cuál de las siguientes gráficas indicaría que no
sería significativa la interacción entre el género y el estilo de liderazgo?:

A) B) C)

En las gráficas A) y B) la influencia del estilo de liderazgo tiene un efecto diferencial en los hombres respecto a las
mujeres, lo que indica la existencia de interacción.
En la gráfica A) hay poca influencia del estilo de liderazgo en los hombres y sin embargo tiene más influencia en las
mujeres.
En la gráfica B) hay menor influencia de los dos estilos de liderazgo en las mujeres y un efecto mucho mayor en los
hombres.
En la gráfica C) no parece que exista interacción ya que el estilo de liderazgo afecta de igual manera a hombres y
mujeres, y ambos grupos obtienen puntuaciones más altas bajo un líder autocrático que transformacional.

18- En cualquier análisis de varianza se debe cumplir que:


A) El factor o los factores deben ser siempre de naturaleza cuantitativa;
B) La media cuadrática total es igual a la suma de las medias cuadráticas de cada fuente de variabilidad;
C) La suma de cuadrados total es igual a la suma de cuadrados de cada fuente de variabilidad.

SITUACIÓN 3: El craving se refiere al deseo intenso por el consumo de un tipo de droga que ya se ha consumido
previamente y constituye un factor esencial en el éxito terapéutico para el tratamiento de las adicciones. Esta
temática fue abordada en un Trabajo Fin de Grado (TFG) presentado por un estudiante en la convocatoria de junio
de 2019. En su proyecto propone seleccionar una muestra de 10 adictos a la cocaína que cumpliesen determinados
criterios de inclusión para participar en el trabajo y a los que aplica una Intervención Basada en Mindfulness. Una vez
terminado el tratamiento, todos los sujetos responderían a la versión abreviada en español del Cocaine Craving
Questionnaire-Now (CCQ-N10) de Tejero, Trujols y Siñol (2003) para obtener una medida global de la intensidad del
craving a la cocaína (Y) junto con otros cuestionarios para el registro de conflictos interpersonales, (X1) y autocontrol,
(X2). Se conocen las desviaciones típicas de las tres variables, que figuran en la siguiente tabla, siendo la correlación
entre el craving y el autocontrol de -0,65.

Diseños de Investigación y Análisis de datos. Facultad de Psicología. UNED. -6-


Cuestionarios Y X1 X2
Desviación típica 1,1 1,64 1,88

19.- El estadístico de contraste, y su nivel crítico p, para comprobar la significación de la relación entre el craving y el
autocontrol valen aproximadamente:
A) 2,55; 𝑝 < 0,01
B) −𝟐, 𝟒𝟐; 𝒑 < 𝟎, 𝟎𝟓 Las hipótesis y el estadístico de contraste para la hipótesis de significación de un
C) −1,87; 𝑝 < 0,05 coeficiente de correlación, son:

𝐻𝑜 : ρ𝑋𝑌 = 0
𝐻1 ; ρ𝑋𝑌 ≠ 0
Y el estadístico de contraste:

𝑟𝑋𝑌 √𝑛 − 2 −0,65 √10 − 2


𝑇= = = −2,42
2
√1 − 𝑟𝑋𝑌 √1 − (−0,65)2

En la distribución t con 8 gl (10-2), la probabilidad de obtener valores tan extremos como -2,42 o más, es p < 0,025:

20.- Sabiendo que los conflictos interpersonales explican el 30% de la varianza de las respuestas en el Cocaine
Craving Questionnaire-Now, el coeficiente de correlación entre estas dos variables, sin tener en cuenta el signo, es
aproximadamente:
A) 0,450; Si el coeficiente de determinación (r2) es 0,30, el coeficiente de correlación entre ambas
B) 0,485; variables es:
C) 0,548. 2
𝑟𝑋𝑌 = √𝑟𝑋𝑌 = √0,30 = 0,5477

21.- La pendiente de la ecuación de regresión para pronosticar la intensidad del craving exclusivamente a partir de
las puntuaciones de autocontrol como variable predictora, es aproximadamente:
A) 0,36;
B) -0,38; Si representamos el craving por Y y el autocontrol por X, sabemos por el enunciado que
C) -1,11. rxy=-0,65 y la pendiente para pronosticar Y a partir de X, es:

𝑆𝑦 1,1
𝑏 = 𝑟𝑋𝑌 = −0,65 = −0,38
𝑆𝑥 1,88

22.- Para una persona que obtiene 9 puntos en el cuestionario de autocontrol, cuya media es de 7 puntos, ¿cuál
sería, aproximadamente, su puntuación diferencial pronosticada para la intensidad del craving?:
A) − 0,44
B) − 𝟎, 𝟕𝟔 La ecuación de regresión en puntuaciones diferenciales es:
C) + 0,70
𝑌 ′ = 𝐵𝑥𝑖 = 𝐵 (𝑋 − 𝑋̅) = −0,38 (9 − 7) = −0,76

Diseños de Investigación y Análisis de datos. Facultad de Psicología. UNED. -7-


23.- Si quisiéramos conocer la correlación entre el craving y el autocontrol eliminando de esta la influencia de los
conflictos personales, deberíamos calcular el coeficiente de correlación:
A) Semiparcial;
B) Múltiple; De las dos variables: craving y autocontrol, hay que eliminar del autocontrol la
C) Parcial. influencia de los conflictos personales, para lo que se calcularía el coeficiente de
correlación semiparcial.

24.- ¿Qué supuestos básicos deben cumplir las puntuaciones del Análisis de regresión y el ANOVA para que sus
inferencias sean válidas?:
A) Independencia, normalidad y homocedasticidad;
B) Sólo normalidad y homocedasticidad;
C) Ninguna, salvo que la variable dependiente sea de naturaleza cuantitativa.

25.- En el análisis de regresión múltiple aplicado a esta situación, el coeficiente de determinación nos informaría de:
A) El porcentaje de cumplimiento de los supuestos básicos para la validez de los pronósticos;
B) La aportación del autocontrol sobre los conflictos interpersonales para pronosticar el craving;
C) La proporción de varianza de la intensidad del craving que se explica por el autocontrol y los conflictos
personales de los sujetos de la muestra.

Diseños de Investigación y Análisis de datos. Facultad de Psicología. UNED. -8-


Plantilla provisional para los exámenes de Diseños de Investigación y Análisis de Datos en la
convocatoria de Febrero 2020

Nº pregunta Modelo A Modelo B Modelo C Modelo D


1 C A A B
2 A C C B
3 A B C A
4 B C B C
5 C B B A
6 C A A C
7 C B B A
8 A C A B
9 B A C A
10 C A B A
11 B A B C
12 C A C A
13 A B B C
14 C A B C
15 B C C A
16 B C A B
17 B A A B
18 C B A B
19 B A C B
20 A B B C
21 B A A B
22 A B A B
23 B C B A
24 A A C A
25 B C B C
EXAMEN SEPTIEMBRE 2020 - AVEX

1. Se aplica una terapia para eliminar una determinada fobia a una muestra de 100 personas,
siendo efectiva en 60 casos. El estadístico de contraste para comprobar que la proporción de
personas que supera la fobia es mas de la mitad, es igual a:
A. 1,96
B. 2
C. 2,33

2. Cual de las siguientes distribuciones de probabilidad NO es simétrica en torno a 0


A. Chi cuadrado
B. La normal tipificada
C. T de Student

3. En un grupo de 31 estudiantes, se obtienen las puntuaciones de un test de ansiedad antes


de un examen de la asignatura X. A continuación, realizan un curso sobre técnicas de
relajación y se vuelve a pasar el test de ansiedad antes del siguiente examen de la asignatura
X. El valor del estadístico de contraste fue T= -2,75, podemos afirmas que:
A. Las técnicas de relajación no disminuyen la ansiedad dado que p>0,005
B. Las técnicas de relajación disminuyen la ansiedad dado que p=0,005
C. Las técnicas de relajación no disminuyen la ansiedad dado que p<0,01

4. En un experimento sobre atención en el que participan 61 personas, el promedio de letras


recordadas es igual a 10 con una cuasivarianza igual a 15,25. El intervalo de confianza para el
promedio de palabras bien recordadas al nivel de confianza del 95%, se encuentra entre los
valores:
A. 8,27 y 11,73
B. 9 y 11
C. 7,67 y 12,33

5. El nivel de confianza se refiere a:


A. El valor inverso del error típico
B. La probabilidad de que el parámetro se encuentre dentro de un intervalo de confianza
C. La probabilidad de que el estadístico se encuentre dentro de la distribución muestral del
parámetro

6. Se aplica una terapia para eliminar una determinada fobia a una muestra de 100 personas,
siendo efectiva en 60 casos. Para comprobar que se recuperan mas de la mitad, la hipótesis
alternativa que se ha de plantear es:
A. πRecuperados > 0,5
B. πRecuperados < 0,5
C. πRecuperados ≠ 0,5

7. El máximo error que el investigador esta dispuesto a admitir para rechazar una hipótesis
nula que es verdadera, se llama:
A. Nivel critico
B. Nivel de confianza
C. Nivel de significación
8. En un experimento unifactorial inter-sujetos con 4 niveles y 5 sujetos en cada grupo, hemos
realizado el contraste de la CRScheffé entre el primer grupo y los tres restantes mediante los
coeficientes {-3, 1,1,1}. Las medias de los 4 niveles valen respectivamente 5,2; 3,3; 6,0 y
10,1. ¿Cuál será el valor de la diferencia encontrada en nuestros datos para poner a prueba
ese contraste?
A. 0,52
B. -1,5
C. 3,8

9. ¿Qué modelo de ANOVA incluye, en los supuestos necesarios para poder aplicarlo, la
igualdad de covarianzas entre todos los niveles de un factor?
A. ANOVA de un factor para muestras independientes
B. ANOVA de dos factores para muestras independientes
C. ANOVA de un factor para muestras relacionadas

10. El cometido del análisis de varianzas es:


A. Discernir que variabilidad corresponde al factor estudiado y cual al error experimental
B. Maximizar los efectos del factor estudiado
C. Minimizar el error experimental

12. En un diseño de un factor con 4 niveles y 5 sujetos por grupo, tenemos una SCtotal=22,09 y
una SCintra=10,55, ¿aproximadamente cuando vale la F del factor?
A. 2,21
B. 5,83
C. 3,09
13. Hemos realizado un mismo estudio de un único factor con 3 niveles, pero en un caso de
diseño intrasujeto y en otro intersujeto. Nos han informado de que las medias cuadráticas
del error son diferentes (3,45 y 6,98) pero no nos han indicado cual pertenece al diseño intra
o al diseño inter.
A. Las medias cuadráticas del error, aunque diferentes por variar el diseño, no deben diferir
estadísticamente entre sí (p>0,5), ya que se corresponden con un mismo factor
B. No es posible realizar un estudio manipulando el mismo factor pero con diseños intra e
inter-sujetos.
C. Lo mas probable es que MCe=3,45 pertenezca al diseño intrasujeto y MCe=6,98 al
intersujeto ya que los primeros tienen MCe inferiores

14. En el análisis de varianza unifactorial, cada nivel de factor es:


A. Cada una de las variables independientes
B. Una categoría de las variables dependientes
C. Una categoría de la variable independiente
15. Un estudio realizado con profesionales de la salud publica analiza la relación de la calidad de
vida laboral (L) con la supervisión (S) y la remuneración (R), encontrando que la supervisión
(S) y la remuneración (R), explican un 35% y un 44%, respectivamente, de la varianza de la
calidad de la vida laboral (L), siendo la correlación entre las dos variables predictoras de
0.30. Asumiendo que todas las relaciones son directas, ¿qué parte de la variabilidad de la
calidad de la vida laboral (L) se debe a la combinación de las dos variables predictoras
supervisión y remuneración?
A. 79%
B. 60,9%
C. 39,5%

16. Conforme rxy se aproxima al valor rxy=-1, la cantidad de error en un análisis de regresión:
A. Se mantiene constante
B. Se incrementa
C. Disminuye

17. Un estudio realizado con 122 profesionales de la salud publica analiza la relación de la
calidad de la vida laboral (L) con la remuneración (R), encontrando que la suma de
cuadrados de las puntuaciones en la variable dependiente calidad de vida es de 700 puntos y
la media cuadrática residual de 5,6 puntos. El estadístico de contraste para la significación
de la regresión simple es aproximadamente:
A. 5
B. 4,2
C. 6,85

18. ¿Qué representa el coeficiente de determinación múltiple ajustado?


A. La proporción de varianza Y que se ajusta a la varianza de X
B. Es una estimación insesgada de la correlación poblacional al cuadrado
C. Es el que se obtiene mediante el ajuste mínimo cuadrático
19. En el caso de regresión lineal múltiple, el signo del coeficiente de correlación y el de la
pendiente de la recta de regresión son:
A. Opuestos
B. Iguales
C. Independientes

20. Un estudio realizado con una muestra representativa de 30 profesionales de la salud publica
encuentra que la remuneración explica el 24% de la varianza de la calidad de vida laboral. El
valor absoluto estadístico del estadístico de contraste para (esta pregunta no la he
encontrado entera)

A. 3,63
B. 1,31
C. 2,97

RECOPILACIÓN EXÁMENES 2011 a 2020 con respuestas marcadas

"DISEÑOS DE INVESTIGACIÓN Y ANÁLISIS DE DATOS " - 2º curso

Yogui del Pirineo

También podría gustarte