ESTADÍSTICA I - Merged

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 225

ESTADÍSTICA I

Doble Grado en Economía financiera y actuarial + Economía


Turno tarde; Aulario III, aula 207
Campus de Móstoles

PATIÑO SÁNCHEZ, ALICIA


[email protected]
TEMA 4: ESTIMACIÓN POR INTERVALOS.

1.- De una población que tiene una varianza de 11, se extrae una muestra por m.a.s. de
tamaño “36” y media 5. Apartado I.- Obtener una estimación de la media poblacional
mediante intervalos con un nivel de confianza del 90%. Apartado II.- Idem suponiendo
tamaño “360”.
Solución:
Apartado I.
El intervalo de confianza que se puede obtener está condicionado por la falta de
información sobre la población.
Dado que el parámetro desconocido es la media poblacional se puede plantear un
intervalo tipo Chebychev.
 V (ξ ) V (ξ ) 
Px − ≤θ ≤ x +  ≥ 1−α
 α ·n α ·n 

Sustituyendo los valores que suministra el enunciado se tiene


 11 11 
P 5 − ≤ E (ξ ) ≤ 5 +  ≥ 1 − 0,1
 0,1· 36 0,1· 36 
Realizando las operaciones se llega al resultado final: P[3,252 ≤ E (ξ ) ≤ 6,748] ≥ 0,9
Evidentemente el intervalo no tiene probabilidad de 0,9 sino probabilidad mayor o
igual a 0,9.
Apartado II.
Dado que el tamaño muestral es muy grande (mayor que 100) es posible suponer un
comportamiento de la media muestral normal aplicando el TCL.
Se puede, entonces, utilizar la expresión siguiente.
 σ σ 
Px − zα ≤ µ ≤ x + zα  ≈ 1 − α
 n 2 n 2
Sustituyendo los valores que suministra el enunciado se tiene
 11 11 
P 5 − ·1,645 ≤ E (ξ ) ≤ 5 + ·1,645 ≈ 1 − 0,1
 360 360 

P[4,712 ≤ µ = E (ξ ) ≤ 5,288] ≈ 0,9

2.- De una población de piezas producidas en grandes cantidades se toma una muestra
por m.a.s. de tamaño “144” y se pesan todas las piezas de la muestra obteniéndose un
peso medio de 2 gramos y una desviación típica de 0,6. Se desea calcular el intervalo de
confianza para el peso medio poblacional con un nivel de confianza del 99% según
distintos supuestos:
I. No se sabe nada sobre la población de partida y se considera que la muestra es
pequeña.
II. Suponiendo población Normal.
III- Suponiendo población Normal y considerando iguales varianza muestral y
poblacional.
Solución:
El intervalo de confianza que se puede obtener en el supuesto I está condicionado por
la falta de información sobre la población.
Dado que el parámetro desconocido es la media poblacional se puede plantear un
intervalo tipo Chebychev.
 V (ξ ) V (ξ ) 
Px − ≤θ ≤ x +  ≥ 1−α
 α ·n α ·n 

Sustituyendo los valores que suministra el enunciado (e igualando varianza poblacional


y muestral) se tiene
 0,36 0,36 
P 2 − ≤ E (ξ ) ≤ 2 +  ≥ 1 − 0,01
 0,01·144 0,01·144 
Realizando las operaciones se llega al resultado final: P[1,5 ≤ E (ξ ) ≤ 2,5] ≥ 0,99
Evidentemente el intervalo no tiene probabilidad de 0,99 sino probabilidad mayor o
igual a 0,99.
El intervalo de confianza que se puede obtener en el supuesto II puede construirse
mediante el método pivote ya que se conoce la distribución poblacional.
Dado que el parámetro desconocido es la media poblacional un buen estadístico
puntual de partida es la media muestral. Además, como es población normal y no se
conoce varianza poblacional el pivote o cantidad pivotal más adecuada es

T ( X ,θ = µ ) =
(X − µ ) = (X − µ ) ≡ t (n - 1)
S n −1 n Sn n −1

Con el pivote se llega al intervalo

 S S   Sn Sn 
P  x − n −1 tα 2 ≤ µ ≤ x + n −1 tα 2  = Px − tα 2 ≤ µ ≤ x + tα 2  = 1 − α
 n n   n −1 n −1 
con [ ]
P t (n − 1) > tα 2 = α
2

Sustituyendo los valores que suministra el enunciado y el punto de corte obtenido en


tablas estadísticas se tiene

 0,6 0,6 
P 2 − 2,61 ≤ µ ≤ 2 + 2,61 = 0,99
 144 − 1 144 − 1 
con P[t (144 − 1) > t 0, 005 ] = 0,005 → t 0,005 = 2,61
tablas

Realizando las operaciones se llega al resultado final:


P[1,869 ≤ θ = E (ξ ) = µ ≤ 2,131] = 0,99
El intervalo de confianza que se puede obtener en el supuesto III puede construirse
mediante el método pivote ya que se conoce la distribución poblacional.
Dado que el parámetro desconocido es la media poblacional un buen estadístico
puntual de partida es la media muestral. Además, como es población normal y se
conoce varianza poblacional (valor 0,36), el pivote o cantidad pivotal más adecuada es

X −µ
T ( X ,θ = µ ) = ≡ N(0,1)
σ n

2
Con el pivote se llega al intervalo

 σ σ 
Px − zα ≤ µ ≤ x + zα  = 1 − α
 n 2 n 2
con P  N (0;1) > zα  = α
 2
 2

Sustituyendo los valores que suministra el enunciado y el punto de corte obtenido en


tablas estadísticas se tiene
 0,6 0,6 
P 2 − 2,576 ≤ θ = µ ≤ 2 + 2,576 = 0,99
 144 144 
con P[N (0,1) > z 0, 005 ] = 0,005 tablas
→ z 0,005 = 2,576

Realizando las operaciones se llega al resultado final:

P[1,8712 ≤ θ = E (ξ ) = µ ≤ 2,1288] = 0,99


Se debe entender que los intervalos cambian según cambia la información disponible
(más información implica intervalos menos amplios, esto es, más precisos).

3.- De una población en una gran ciudad se desea saber las personas que poseen ya un
ordenador. Para ello se encuesta a 1000 individuos, de ellos sólo 300 tienen ordenador.
Se desea conocer mediante una estimación por intervalos, con significación 0,05, la
proporción de la población que tiene ordenador. Posteriormente, se decide estimar dicha
proporción con precisión 0,02 y significación 0,01, y se plantea qué tamaño muestral
sería el necesario.
Solución:
El intervalo de confianza que se puede obtener puede construirse mediante el método
pivote ya que se conoce la distribución poblacional, binomial. Además, dado que la
muestra es muy grande se puede proceder a la aproximación normal.
Dado que el parámetro desconocido es la proporción poblacional un buen estadístico
puntual de partida es la proporción muestral. El pivote o cantidad pivotal más
adecuada es
P* − p
T ( X ; p) = →
d
N (0,1)
p 1− p
* *
( )
n

Con el pivote se llega al intervalo

 p * (1 − p * ) * p * (1 − p * ) 
P  p * − zα / 2 ; p + zα / 2  = 1−α con P  N (0;1) > zα  = α
 n n   2
 2

3
Sustituyendo los valores que suministra el enunciado y el punto de corte obtenido en
tablas estadísticas se tiene P[N (0;1) > z ] = 0,025 tablas
→ z = 1,96
0 , 025 0 , 025

 0,3(1 − 0,3) 0,3(1 − 0,3) 


P 0,3 − 1,96 ≤ θ = p ≤ 0,3 + 1,96  = 1 − 0,05
 1000 1000 

Realizando las operaciones se llega al resultado final:

P[0,2716 ≤ θ = E (ξ ) = p ≤ 0,3284] = 0,95

Para el cálculo que se pide posteriormente hay que entender la relación existente, en
este intervalo, entre precisión, confianza y tamaño:

p * (1 − p * ) ( z ) 2 p * (1 − p * )
radio → precisión → e = zα / 2 ⇒ n = α /2
n e2
Realizando las operaciones se llega al tamaño muestral que cumple las
especificaciones deseadas:
( zα / 2 ) 2 p * (1 − p * ) ( z 0, 005 ) ·0,3(1 − 0,3) (2,576) 2 ·0,3(1 − 0,3)
2

n= = = = 3.483,78
e2 (0,02) 2 (0,02) 2

Como los tamaños muestrales deben ser números enteros, para garantizar las
condiciones especificadas se necesita un tamaño de 3.484 (número de individuos a
encuestar para obtener resultados con precisión 0,02 y confianza del 99%).
Por otra parte si no tuviéramos una estimación de la proporción poblacional mediante
la proporción muestral o quisésemos ser conservadores utilizaríamos el valor 0,5 como
proporción poblacional (dado que lleva a la máxima varianza poblacional). En ese
caso qudaría:
( z α / 2 ) 2 π (1 − π ) ( z 0,005 ) 2 ·0,5(1 − 0,5) (2,576) 2 ·0,5(1 − 0,5)
n= = = = 4.147,36 → 4.148
e2 (0,02) 2 (0,02) 2

4
4.- En una población considerada normal se extrae una muestra por m.a.s. de tamaño
dieciséis, donde:
∑ x i = 50 ∑
x i 2 = 170
Establecer un intervalo de confianza del 95% para la media y la varianza poblacional.

El intervalo de confianza para la media poblacional que se puede obtener puede


construirse mediante el método pivote ya que se conoce la distribución poblacional.
Dado que el parámetro desconocido es la media poblacional un buen estadístico
puntual de partida es la media muestral. Además, como es población normal y no se
conoce varianza poblacional el pivote o cantidad pivotal más adecuada es

T ( X ,θ = µ ) =
(X − µ ) = (X − µ ) ≡ t (n - 1)
S n −1 n S n n − 1
Con el pivote se llega al intervalo

 S S   Sn Sn 
P  x − n −1 tα 2 ≤ µ ≤ x + n −1 tα 2  = Px − tα 2 ≤ µ ≤ x + tα 2  = 1 − α
 n n   n −1 n −1 
[
con P t (n − 1) > tα 2 = α
2
]
Calculando los valores muestrales y el punto de corte obtenido en tablas estadísticas se
tiene
 0,927 0,927 
P 3,125 − 2,131 ≤ µ ≤ 3,125 + 2,131 = 0,95
 16 − 1 16 − 1 
con [ ]
P t (16 − 1) > t 0,025 = 0,025 tablas
→ t 0,025 = 2,131

Realizando las operaciones se llega al resultado final:


P[2,615 ≤ θ = E (ξ ) = µ ≤ 3,635] = 0,95

El intervalo de confianza para la varianza poblacional que se puede obtener puede


construirse mediante el método pivote ya que se conoce la distribución poblacional.
Dado que el parámetro desconocido es la varianza poblacional un buen estadístico
puntual de partida es lavarianza muestral. Además, como es población normal y no se
conoce media poblacional el pivote o cantidad pivotal más adecuada es
n·S n2
T ( X ,θ = σ 2 ) = ≡ χ n2−1
σ 2

Con el pivote se llega al intervalo


 n·S 2 n·S 2 
P 2 n ≤ θ = σ 2 ≤ 2 n  = 1 − α
 χ n −1,α / 2 χ n −1,1−α / 2 
Calculando los valores muestrales y los puntos de corte se tiene
16·0,859 16·0,859 
P ≤σ 2 ≤ = 0,95
 27 ,5 6,26 
Realizando las operaciones se llega al resultado final:
P[0,5 ≤ θ = V (ξ ) ≤ 2,2] = 0,95

5
5.-Se desea analizar el número de minutos que dedica a preparar la clase cada profesor
(variante considerada normal) por cada sesión de clase que imparte a sus alumnos, el
estudio es de ámbito nacional. Para la asignatura de “Estadística Empresarial” se
pregunta a 25 profesores seleccionados por m.a.s. y se tiene una media de 200 minutos,
por estudios anteriores se admite una desviación típica poblacional de 40 minutos. Para
la asignatura de “Derecho Mercantil” se pregunta a 50 profesores seleccionados por
m.a.s. y se tiene una media de 100 minutos, por estudios anteriores se admite una
desviación típica poblacional de 20 minutos.
a) Elaborar un intervalo de confianza al 95% para la diferencia de medias de tiempos de
preparación (entre “Estadística Empresarial” y “Derecho Mercantil”). Plantear pivote e
intervalo de confianza, obtener los valores del intervalo y comentar interpretación.
b) Si quisiéramos un nivel de confianza del 99%, un radio de intervalo (error) de 10, y
los tamaños muestrales en las dos muestras con la misma proporción entre ellos (doble
número de profesores de derecho que de profesores de estadística en las muestras),
¿cuál sería ese tamaño muestral necesario en cada muestra?.
c) Intentar probar con un contrastar con nivel de significación del 5% si existe una
diferencia superior a 100 minutos entre el tiempo que dedica a preparar la clase cada
profesor (entre “Estadística Empresarial” y “Derecho Mercantil”) por término medio.
Se deben plantear las hipótesis, indicar el estadístico de contraste, la región crítica, el
valor experimental del estadístico, la decisión (comentar/intepretar) y el p-valor
(comentar/intepretar).

6
7
6.-Se intenta conocer el perfil de la población de personas que trabajan en un
determinado sector económico. Para ello se realiza una encuesta detallada a 10 personas
seleccionadas por m.a.s. de entre la población de personas que no van a votar. Se trata
de obtener resultados con un nivel de confianza del 95% sobre los ingresos medios
mensuales poblacionales mediante intervalo de confianza.
a) Elaborar un intervalo de confianza sobre los ingresos medios mensuales
poblacionales al 95% a partir de una m.a.s. de tamaño 10 suponiendo que sólo se
dispone de la siguiente información: media muestral 900 euros y desviación típica
poblacional 40 euros.
b) Elaborar un intervalo de confianza sobre los ingresos medios mensuales
poblacionales al 95% a partir de una m.a.s. de tamaño 10 suponiendo que sólo se
dispone de la siguiente información: la población respecto al nivel de ingresos
mensuales es normal, la media muestral es 900 euros y la desviación típica muestral es
36 euros.
c) Elaborar un intervalo de confianza sobre los ingresos medios mensuales
poblacionales al 95% a partir de una m.a.s. de tamaño 10 suponiendo que sólo se
dispone de la siguiente información: la población respecto al nivel de ingresos
mensuales es normal, la media muestral es 900 euros y la desviación típica poblacional
es 38 euros.
d) Comentar por qué varían los resultados anteriores (valores de los intervalos) y en
qué sentido según pasamos del apartado “a)” al “b)” y al “c)”.

8
7.- Un determinado país “desconocido” tiene unas elecciones próximamente. Un partido
político muy preocupado por la posible abstención, intenta comprobar el cambio en el
porcentaje de personas con intención de “ir a votar” antes y después de una etapa de
campaña electoral. Se recogen los datos obtenidos mediante encuestas (selección de
elementos por m.a.s.) antes y después de la mencionada etapa de campaña electoral
sobre deseo de “ir a votar”, las dos muestras se consideran independientes entre sí.
Antes Después
Tamaño de la muestra 1.000 1.000
Sí, votará 780 800
No va a votar 220 200
a) Elaborar un intervalo de confianza al 95% para la diferencia de proporciones de
personas de la población (antes y después) que “No van a votar”. Plantear pivote e
intervalo de confianza, obtener los valores del intervalo y comentar interpretación.
b) Si quisiéramos un nivel de confianza del 99%, un radio de intervalo de 0,01,
considerar variabilidad máxima e iguales tamaños muestrales en las dos muestras, ¿cuál
sería ese tamaño muestral necesario e igual en cada muestra?.
c) Contrastar con nivel de significación del 5% si existe o no cambios en la proporción
poblacional que “no va a votar” (antes y después de la campaña) en base a las dos
muestras recogidas: se deben plantear las hipótesis, indicar el estadístico de contraste, la
región crítica, la decisión, y el p-valor comentado.

9
8.- Se intenta conocer el perfil de la población de personas que no van a votar. Para ello
se realiza una encuesta detallada a 10 personas seleccionadas por m.a.s. de entre la
población de personas que no van a votar. Se trata de obtener resultados con un nivel de
confianza del 95% sobre los ingresos medios mensuales poblacionales mediante
intervalo de confianza.
a) Elaborar un intervalo de confianza sobre los ingresos medios mensuales
poblacionales al 95% a partir de una m.a.s. de tamaño 10 suponiendo que sólo se
dispone de la siguiente información: media muestral 500 euros y desviación típica
poblacional 40 euros.
b) Elaborar un intervalo de confianza sobre los ingresos medios mensuales
poblacionales al 95% a partir de una m.a.s. de tamaño 10 suponiendo que sólo se
dispone de la siguiente información: la población respecto al nivel de ingresos
mensuales es normal, la media muestral es 500 euros y la desviación típica muestral es
36 euros.
c) Elaborar un intervalo de confianza sobre los ingresos medios mensuales
poblacionales al 95% a partir de una m.a.s. de tamaño 10 suponiendo que sólo se
dispone de la siguiente información: la población respecto al nivel de ingresos
mensuales es normal, la media muestral es 500 euros y la desviación típica poblacional
es 38 euros.
d) Comentar por qué varían los resultados anteriores (valores de los intervalos) y en
qué sentido según pasamos del apartado “a)” al “b)” y al “c)”.

10
9.- Un determinado país “desconocido” tiene unas elecciones próximamente. Un partido
político muy preocupado por la posible abstención, intenta comprobar el porcentaje de
personas con intención de “ir a votar”. Se recogen los datos obtenidos mediante
encuesta (selección de elementos por m.a.s.) sobre deseo de “ir a votar”.
Nº de personas
Tamaño de la muestra 1.000
Sí, votará 800
No va a votar 200
a) Elaborar un intervalo de confianza al 95% para la proporción de personas de la
población que “No van a votar”. Plantear pivote e intervalo de confianza, obtener los
valores del intervalo y comentar interpretación.
b) Si quisiéramos un nivel de confianza del 99%, un radio de intervalo de 0,01, y
considerar variabilidad máxima, ¿cuál sería el tamaño muestral necesario?.
c) Intentar probar mediante un contraste, con nivel de significación del 5%, que el
porcentaje de personas de la población que “No van a votar” es superior al 15%. Se
deben plantear las hipótesis, indicar el estadístico de contraste, la región crítica, el valor
experimental del estadístico, la decisión, y el p-valor comentado.

11
10.- Se plantea estimar el incremento (diferencia) que una campaña publicitaria ha
supuesto en la proporción de personas de la población que tiene la intención de comprar
un determinado dispositivo electrónico. Para ello, se realizarán dos encuestas (justo
antes y justo después de la campaña publicitaria). Las muestras serán por m.a.s., de gran
tamaño e independientes entre ellas. No obstante, se desean iguales tamaños muestrales
en ambas muestras independientes. Se desea un nivel de confianza al 95%.
a) Obtener el tamaño muestral que garantice un error de muestreo máximo absoluto de
0,04 en el intervalo de confianza.
b) Hallar el intervalo de confianza si los datos que realmente se recogen son: para la
encuesta antes de la campaña publicitaria hay 1000 personas encuestadas de las que 400
tienen intención de comprar; y para la encuesta después de la campaña publicitaria hay
900 personas encuestadas de las que 400 tienen intención de comprar. Se decide llegar a
un nivel de confianza del 99%.
c) Con los datos del apartado anterior se considera un nivel de confianza del 60%,
recalcular el intervalo y comentar el significado de los resultados (comparar con el
apartado anterior).

12
11.- Se plantea obtener mediante intervalo de confianza al 95% la diferencia entre las
notas (en media) de cierta asignatura en dos poblaciones diferentes (X e Y). Se supone
que las notas siguen siempre una distribución normal con varianzas 4 y 3
respectivamente. Se admite la independencia, pero aunque las muestras son
independientes se decide tomar tamaños muestrales iguales para las dos muestras (una
en cada población).
a) Obtener el tamaño muestral que garantice un error de muestreo máximo absoluto de
0,4 en el intervalo de confianza.
b) Hallar el intervalo de confianza si los datos que realmente se recogen son por m.a.s.
son 100 y 50 respectivamente:
100 50

∑x
i =1
i = 650 ; ∑ yi = 350 .
i =1
c) Con los datos del apartado anterior se considera un nivel de confianza del 80%,
recalcular el intervalo y comentar los resultados (comparar con el apartado anterior).

13
12.- Una empresa desarrolla un nuevo método para fabricar cierto componente para
aviación, el peso es la variable más importante. Antes de iniciar producción a gran
escala comprueba el peso de diez componentes obtenidos con el nuevo proceso. Se
admite que son m.a.s.. Los datos recogidos son:
10 10

∑ xi = 30 ; ∑ xi2 = 100 .
i =1 i =1
a) Obtener el intervalo de confianza para la media de la variable “peso” en la población,
suponiendo población normal y considerando un nivel de confianza del 95%.
b) Con un nivel de confianza del 95%, obtener el intervalo de confianza para la media
de la variable “peso” en la población, suponiendo población normal y varianza
poblacional igual a uno.
c) Obtener el intervalo de confianza para la media de la variable “peso” en la población,
suponiendo desconocido el modelo poblacional y pero conocida la varianza poblacional
e igual a uno. Garantizar un nivel de confianza de al menos el 95%.
d) Suponiendo normalidad, contrastar para un α=0,01 la hipótesis referida a que la
varianza poblacional es igual a uno y hallar el p-valor.

14
13.- Se plantea estimar el incremento que la primera semana de una campaña electoral
ha supuesto en la proporción de personas de la población que tiene la intención de votar
al partido político VAD (Verdad Aunque Duela). Para ello, se realizarán dos encuestas
(justo antes y justo después de la primera semana de campaña electoral). Las muestras
serán por m.a.s. e independientes entre ellas. No obstante, se desean iguales tamaños
muestrales en ambas muestras independientes. Además, se desea un nivel de confianza
al 95%.
a) Obtener el tamaño muestral que garantice un error de muestreo máximo absoluto de
0,04 en el intervalo de confianza.
b) Hallar el intervalo de confianza si los datos que realmente se recogen son: para la
encuesta antes de la primera semana hay 1000 personas encuestadas de las que 400
tienen intención de votar al VAD; y para la encuesta después de la primera semana hay
900 personas encuestadas de las que 400 tienen intención de votar al VAD. Se mantiene
el nivel de confianza al 95%.
c) Con los datos del apartado anterior se considera un nivel de confianza del 60%,
recalcular el intervalo y comentar el significado de los resultados (comparar con el
apartado anterior).

14.- Se desea analizar el número de minutos que dedica a preparar la clase cada profesor
(variante considerada normal) por cada sesión de clase que imparte a sus alumnos, el
estudio es de ámbito nacional. Para la asignatura de “Estadística Empresarial” se
pregunta a 25 profesores seleccionados por m.a.s. y se tiene una media de 200 minutos,
por estudios anteriores se admite una desviación típica poblacional de 40 minutos. Para
la asignatura de “Derecho Mercantil” se pregunta a 50 profesores seleccionados por
m.a.s. y se tiene una media de 100 minutos, por estudios anteriores se admite una
desviación típica poblacional de 20 minutos.
a) Elaborar un intervalo de confianza al 95% para la diferencia de medias de tiempos de
preparación (entre “Estadística Empresarial” y “Derecho Mercantil”). Plantear pivote e
intervalo de confianza, obtener los valores del intervalo y comentar interpretación.
b) Si quisiéramos un nivel de confianza del 99%, un radio de intervalo (error) de 10, y
los tamaños muestrales en las dos muestras con la misma proporción entre ellos (doble
número de profesores de derecho que de profesores de estadística en las muestras),
¿cuál sería ese tamaño muestral necesario en cada muestra?.
c) Intentar probar con un contrastar con nivel de significación del 5% si existe una
diferencia superior a 100 minutos entre el tiempo que dedica a preparar la clase cada
profesor (entre “Estadística Empresarial” y “Derecho Mercantil”) por término medio.

15
Se deben plantear las hipótesis, indicar el estadístico de contraste, la región crítica, el
valor experimental del estadístico, la decisión (comentar/intepretar) y el p-valor
(comentar/intepretar).

15.-Se intenta conocer el número de horas totales estudiadas al mes por los estudiantes
universitarios (incluyendo asistencia a clase, tutorías y horas de estudio) de Economía y
Empresa. Para ello se realiza una encuesta detallada a 10 estudiantes seleccionadas por
m.a.s. de entre la población total. Se trata de obtener resultados con un nivel de
confianza del 95% sobre el número medio de horas totales estudiadas al mes mediante
intervalo de confianza.
a) Elaborar un intervalo de confianza sobre el número medio de horas estudiadas
mensualmente al 95% a partir de una m.a.s. de tamaño 10 suponiendo que sólo se
dispone de la siguiente información: media muestral 160 horas y desviación típica
poblacional 40 horas.
b) Elaborar un intervalo de confianza sobre el número medio de horas estudiadas
mensualmente al 95% a partir de una m.a.s. de una m.a.s. de tamaño 10 suponiendo que
sólo se dispone de la siguiente información: la población respecto al número de horas

16
estudiadas al mes es normal, la media muestral es 160 horas y la desviación típica
muestral es 36 horas.
c) Elaborar un intervalo de confianza sobre el número medio de horas estudiadas
mensualmente al 95% a partir de una m.a.s. de una m.a.s. de tamaño 10 suponiendo que
sólo se dispone de la siguiente información: la población respecto al número de horas
estudiadas al mes es normal, la media muestral es 160 horas y la desviación típica
poblacional es 38 horas.
d) Comentar por qué varían los resultados anteriores (valores de los intervalos) y en
qué sentido según pasamos del apartado “a)” al “b)” y al “c)”.

16.-Se intenta conocer el perfil de la población de personas que no van a votar. Para ello
se realiza una encuesta detallada a 10 personas seleccionadas por m.a.s. de entre la
población de personas que no van a votar. Se trata de obtener resultados con un nivel de
confianza del 95% sobre los ingresos medios mensuales poblacionales mediante
intervalo de confianza.
a) Elaborar un intervalo de confianza sobre los ingresos medios mensuales
poblacionales al 95% a partir de una m.a.s. de tamaño 10 suponiendo que sólo se
dispone de la siguiente información: media muestral 500 euros y desviación típica
poblacional 40 euros.
b) Elaborar un intervalo de confianza sobre los ingresos medios mensuales
poblacionales al 95% a partir de una m.a.s. de tamaño 10 suponiendo que sólo se
dispone de la siguiente información: la población respecto al nivel de ingresos
mensuales es normal, la media muestral es 500 euros y la desviación típica muestral es
36 euros.
c) Elaborar un intervalo de confianza sobre los ingresos medios mensuales
poblacionales al 95% a partir de una m.a.s. de tamaño 10 suponiendo que sólo se

17
dispone de la siguiente información: la población respecto al nivel de ingresos
mensuales es normal, la media muestral es 500 euros y la desviación típica poblacional
es 38 euros.
d) Comentar por qué varían los resultados anteriores (valores de los intervalos) y en
qué sentido según pasamos del apartado “a)” al “b)” y al “c)”.

17.- Un experto afirma que la mayoría de los estudiantes de bachillerato es favorable a


eliminar la selectividad. Para obtener información se ha tomado una m.a.s. de 1000
individuos, resultando que 490 se declaran favorables a este tipo de medida.
a) Hallar un intervalo de confianza que informe sobre la proporción de individuos en la
población que están a favor de esta medida con un nivel de confianza del 95%.
Comentar las conclusiones respecto al problema planteado.
b) Completar el análisis realizando contraste paramétrico unilateral al 5% y obtener el
p-valor. Comentar los resultados y las consecuencias de cambiar la hipótesis nula.

18
19
20
PROBLEMA A RESOLVER EN TEMA 4.
(OBLIGATORIO)

Se analiza la percepción de calidad de un producto/marca. Preocupa que los resultados no sean estables y
se quiere estudiar la variabilidad. Para tener una base objetiva se realiza y estudia una encuesta a 20
personas seleccionados por m.a.s. que deben puntuar de 0 a 100 según sus “sensaciones” sobre calidad
percibida. Se supone comportamiento normal en las puntuaciones. Los resultados son:
∑xi=1600 y ∑xi2=129800.
a) Elaborar un intervalo de confianza al 95% para la varianza poblacional asociada a la puntuación sobre
calidad percibida por los usuarios. Plantear pivote con comportamiento e intervalo de confianza a aplicar,
obtener los valores del intervalo.
Se sigue estudiando la percepción de calidad de ese producto/marca antes de plantearse su comprar.
Preocupa que los resultados no sean estables y se recurre ahora a un estudio parecido al anterior pero de
hace tres años. Era una encuesta a 20 personas que debían puntuar de 0 a 100 según sus “sensaciones”.
Los resultados son:
∑yi=1620 y ∑yi2=133200.
(suponer normalidad, independencia y varianza poblacional igual a 100 en ambos casos o estudios para
compararlos).
b) Elaborar un intervalo de confianza al 95% para la diferencia de medias poblacionales asociadas a la
puntuación sobre calidad percibida por los usuarios. Plantear pivote e intervalo de confianza, obtener los
valores del intervalo e interpretar si cambios.
TEMA 5: PROBLEMAS C.H.P.

1.-En una población Normal de desviación típica 10 se cree que la media será 40. Se
desea contrastar esta hipótesis a un nivel de significación del 10%. Para esto, se extrae
una m.a.s. de tamaño 25 cuya media muestral es 41. Realizar el contraste y obtener el p-
valor.

Solución:
2.- En una población Normal se cree que la varianza será 16. Se desea contrastar esta
hipótesis a un nivel de significación del 5%. Para esto, se extrae una m.a.s. de tamaño
17 cuya varianza muestral es 9. Realizar el contraste y obtener el p-valor.

Solución:

2
3.- El dueño de un local comercial sostiene que más de un 20% de su clientela evalúa
positivamente la atención que brinda su personal. Para validar dicha afirmación, el
dueño le pregunta a una muestra de 140 clientes cómo evalúa la atención que brinda su
personal, encontrando que 35 de ellos evalúa positivamente la atención. Realizar un
contraste, decidiendo con un α = 5%.

Solución:

3
4.- La demanda de un artículo se comporta como N(200,20). Se plantea desarrollar una
completa y costosa campaña publicitaria para aumentar las ventas. Se decidirá realizarla
si se consigue elevar la venta media a más de 250 unidades. Para obtener información
de los posibles resultados se aplica la campaña en pruebas a 35 clientes, seleccionados
al azar, que pasan a adquirir una media de 260 unidades. Como hay problemas
financieros, se fija el nivel de significación en el 1%. ¿Qué decisión y con qué
credibilidad se tomará?.

Solución:

4
5.-Los últimos sondeos electorales realizados hace dos meses dan el 25% del voto a
una determinada opción. Posteriormente, tras campaña electoral, se pregunta a 500
personas. De ellas, el 22% se inclinan hacia esa opción. ¿Hay cambios significativos en
la intención de voto? Al 5% se podría decir que ha bajado la intención de voto.

Solución primera pregunta (¿Hay cambios significativos en la intención de voto?):

5
Solución segunda pregunta (Al 5% se podría decir que ha bajado la intención de voto):

6.- La duración media de unas bombillas sigue una distribución de Poison. Se plantea el
siguiente contraste: H0: λ = 160 H1 : λ < 160 . Para resolverlo se toma una m.a.s.
n=100 y una región crítica de la forma RC = {x < k }
Determinar el valor de k para que el tamaño del test sea del 1%.
Obtener la potencia del contraste para λ=158 y para λ=155
Si la media muestral es 157,46 ¿Qué haremos?

Solución:
a) 0,01 = P ( ETI ) = P (m.a.s. ∈ RC / H 0 Cierta) = P( x < k / λ = 160) = P ( N (160, 1,6 ) < k )
K=157,057 RC = {x < 157,057}

b)
Pot (158) = 1 − β (158) = P( x < 157,057 / λ = 158) = P( N (158, 1,58 ) < 157,057) = 0,2265
Pot(155) = 1 − β (155) = P( x < 157,057 / λ = 155) = P( N (155, 1,55 ) < 157,057) = 0,9507

c) No rechazamos H0

6
7.- Una empresa de distribución de combustibles desea conocer la opinión de los
consumidores respecto a las características más valoradas. Se realiza una encuesta a
1000 usuarios seleccionados mediante m.a.s. para comprobar si realmente se conoce la
situación del mercado.
Inicialmente se analiza el factor precio.
La empresa, antes de recoger los datos, supone que menos del 40% de los clientes
cambiarían de gasolinera por pequeños cambios de precios. El razonamiento es que el
coste y tiempo de desplazamiento no compensan los ahorros.
En la encuesta, los resultados son que 420 usuarios cambiarían de gasolinera ante
pequeños cambios de precios.
a) Contrastar al 5% la hipótesis planteada por la empresa. Obtener el p-valor.
b) Complementar el análisis obteniendo el intervalo de confianza al 5% de nivel de
significación para la proporción poblacional de usuarios que cambiarían de gasolinera
por pequeños cambios de precios.

Solución:

7
8.- Se hace un envío de paquetes de pasta, de las que se afirma que el peso medio es de
1000gr. Examinada una muestra de 5 paquetes se han obtenido los siguientes pesos:
995, 992, 1005, 998 y 1000.
¿Puede mantenerse la hipótesis de que el peso medio es 1000gr. con un nivel de
significación α = 5% suponiendo normalidad en la población?
Contraste bilateral y p-valor
Contraste unilateral más lógico dada la situación planteada, obteniendo también el p-
valor

Solución:

8
9.- En una población N(µ;3) se desea contrastar, con un nivel de significación del cinco
por ciento, la hipótesis nula H0: µ =5 frente a una hipótesis alternativa H1: µ <5. Para
ello se dispone de una m.a.s. de tamaño dieciséis cuya media muestral es 4'8. Hallar la
región crítica, adoptar la decisión (rechazar o aceptar la hipótesis nula), y valorarla
mediante el “p” valor.

Solución:

9
10.- Un experto afirma que la proporción de personas partidarias de bajar un 10 % la
remuneración a todos los empleados públicos sin excepción ni diferenciación (policías,
médicos, profesores, etc.) es mayor del 50%. Si esto fuera así (ambiente popular
favorable) se tomaría la medida a nivel político. Para comprobar si la población tiene la
opinión que expone el experto, se ha tomado una m.a.s. de 1000 personas resultando
que 480, en efecto, se declaran favorables a este tipo de medida. Se pide:
a) Hallar un intervalo de confianza que informe sobre la proporción de individuos que
están a favor de esta medida con un nivel de confianza del 95%. Comentar las
conclusiones respecto al problema planteado.
b) Efectuar el contraste de hipótesis que se llevaría a cabo para admitir o no la conjetura
del experto para un α = 5%. Calcular el p-valor. Comentar las conclusiones respecto al
problema planteado.

Solución:

10
11.- En una determinada población se sospecha que la capacidad matemática tiene un
comportamiento especial. Para poder confirmar esta hipótesis se pasa un complicado
examen a 10 personas seleccionadas a azar por m.a.s. con los siguientes resultados:
suma de todas las notas es 1.100 y suma de todas las notas elevadas al cuadrado es
130.000. El comportamiento de la puntuación sigue una distribución normal.
a) Puede mantenerse la hipótesis habitual consistente en que la puntuación media de la
población se mantiene igual o por debajo de 100, tomando un nivel de significación del
5%. Hallar p-valor y comentar.
b) Puede mantenerse la hipótesis habitual consistente en que la varianza de la
puntuación en la población se mantiene igual o por encima de 1000, tomando un nivel
de significación del 5%. Hallar p-valor y comentar.

Solución:

12.- En un determinado país “desconocido” se van a repetir unas elecciones. Para


intentar plantear la nueva campaña electoral y anticipar el resultado del voto se realiza
una encuesta con los siguientes resultados sobre posicionamiento ideológico (de
derechas, de izquierdas o no definido) e intención de voto (hacia partido A, B, C o D).

Partido A Partido B Partido C Partido D


De derechas 200 40 10 50
De izquierdas 20 120 160 100
No definido 80 100 50 70

a) Intentar probar que el porcentaje de “no definidos” ideológicamente es superior al


20%. Plantear hipótesis, estadístico de contraste, región crítica si consideramos un nivel
de significación del 5%, decisión, y p-valor comentado.
b) Analizar, empleando un contraste no paramétrico, si el voto se repartirá según el
modelo de las elecciones anteriores: 30% asociado al partido A, 30% para el B, 20%
para el C, 20% para el D. Plantear hipótesis, estadístico de contraste, región crítica si
consideramos un nivel de significación del 5%, decisión, y p-valor comentado.

11
c) Estudiar si existe independencia entre “posicionamiento ideológico” e “intención de
voto”: se deben plantear las hipótesis, indicar el estadístico de contraste y la región
crítica con nivel de significación del 10% (no hallar el valor experimental).

12
13.- Otro estudio analiza la capacidad intelectual de los dirigentes políticos mediante la
variable puntuación asociada a una prueba (se sospecha tiene un comportamiento
especial). Para poder confirmar esta hipótesis se pasa una complicada prueba a 10
sujetos de la “clase política” seleccionados al azar por m.a.s. con los siguientes
resultados:
10 10

x i = 1200 ; x 2
i = 157050 .
i =1 i =1
Para resolver el problema considerar que el comportamiento de la puntuación sigue una
distribución normal.
a) Puede mantenerse la hipótesis habitual consistente en que la puntuación media de la
población se mantiene igual o por debajo de 100, tomando un nivel de significación del
1%. Plantear hipótesis, estadístico de contraste, región crítica, decisión, y p-valor.
b) Complementar el apartado anterior “a” obteniendo un intervalo de confianza para la
media poblacional al 99% de confianza. Comentar resultados “a” y “b”.
c) Puede mantenerse la hipótesis habitual consistente en que la varianza de la
puntuación en la población se mantiene igual o por debajo de 1000, tomando un nivel
de significación del 5%. Plantear hipótesis, estadístico de contraste, región crítica,
decisión, y p-valor.
d) Complementar el apartado anterior “c” obteniendo un intervalo de confianza para la
varianza poblacional al 95% de confianza. Comentar resultados “c” y “d”.

13
14.- Un estudio analiza el consumo de agua por habitante y día (admitiendo de partida
un comportamiento normal). Se cree que es igual en Jaén y en Cádiz. Para poder
estudiar esta hipótesis y contrastarla al 4%, se toman dos muestras independientes por
m.a.s. de tamaño 400 y 200 con medias de 16 y 15 litros sobre individuos de cada una
de estas provincias. Suponer desviaciones típicas de 40 y 20 litros respectivamente.
Valorar la credibilidad de la hipótesis nula.

14
15.- Se desea analizar el resultado de una campaña publicitaria mediante el estudio de
dos muestras independientes obtenidas por m.a.s. justo antes y poco después de las
medidas publicitarias comentadas. El resultado se resume en este cuadro:
Antes de la campaña Después de la campaña
Conoce el producto 20 40
No conoce el producto 200 120
Comentar un posible incremento del 25% al 5% de significación suponiendo un
contraste bilateral y un contraste unilateral.

15
16.- Se analiza la percepción de calidad de un producto/marca. Preocupa que los
resultados no sean estables y se quiere estudiar la variabilidad. Para tener una base
objetiva se realiza y estudia una encuesta a 20 personas seleccionados por m.a.s. que
deben puntuar de 0 a 100 según sus “sensaciones” sobre calidad percibida. Se supone
comportamiento normal en las puntuaciones. Los resultados son:
∑xi=1600 y ∑xi2=129800.
a) Elaborar un intervalo de confianza al 95% para la varianza poblacional asociada a la
puntuación sobre calidad percibida por los usuarios. Plantear pivote con
comportamiento e intervalo de confianza a aplicar, obtener los valores del intervalo.
b) Intentar “probar” utilizando un contraste que la variabilidad medida con la varianza
poblacional estará por debajo de 100 (plantear hipótesis de forma adecuada al objetivo
buscado, indicar estadístico de contraste con su comportamiento según hipótesis nula,
hallar valor empírico del estadístico, plantear y calcular el p-valor e indicar las
conclusiones).

16
17.- Se sigue estudiando la percepción de calidad de ese producto/marca antes de
plantearse su comprar. Preocupa que los resultados no sean estables y se recurre ahora a
un estudio parecido al anterior pero de hace tres años. Era una encuesta a 20 personas
que debían puntuar de 0 a 100 según sus “sensaciones”. Los resultados son:
∑yi=1620 y ∑yi2=133200.
(suponer normalidad, independencia y varianza poblacional igual a 100 en ambos casos
o estudios para compararlos, ya que población y encuesta de la pregunta 1 se compara
con población y encuesta de la pregunta 2 en los apartados 2a y 2b).
a) Elaborar un intervalo de confianza al 95% para la diferencia de medias poblacionales
asociadas a la puntuación sobre calidad percibida por los usuarios. Plantear pivote e
intervalo de confianza, obtener los valores del intervalo e interpretar si cambios.
b) Intentar analizar utilizando un contraste para la diferencia de medias si esta es o no
diferente a cero (plantear hipótesis de forma adecuada, indicar estadístico de contraste
con su comportamiento según hipótesis nula, hallar valor empírico del estadístico,
calcular el p-valor e indicar las conclusiones).

17
18.- En un determinado país “desconocido” se quiere saber la opinión sobre el “aborto”
y su relación con la ideología política. Para intentar conocer la situación se realiza una
encuesta con los siguientes resultados sobre posicionamiento ideológico (de derechas,
de izquierdas o no definido) y opinión sobre “aborto” (sí, no, duda).

Aborto SI Aborto NO Duda


De derechas 100 200 100
De izquierdas 100 100 100
No definido 100 100 100

a) Intentar probar que el porcentaje (o proporción) de “Duda” respecto opinión sobre el


“aborto” es inferior al 30% (o 0,3). Plantear hipótesis, estadístico de contraste, región
crítica si consideramos un nivel de significación del 5%, decisión, y p-valor comentado.

b) Analizar si el voto se repartirá o ajustará según el siguiente modelo de probabilidad:


0,3 asociado a “Aborto SI”, 0,5 asociado a “Aborto NO”, y 0,2 asociado a “Duda”.
Plantear hipótesis, estadístico de contraste, región crítica si consideramos un nivel de
significación del 5%, decisión, y p-valor. Comentar y justificar los resultados.

c) Contrastar con nivel de significación del 5% si existe independencia entre


“posicionamiento ideológico” (ideología política) y opinión sobre el “aborto”: se deben
plantear hipótesis, estadístico de contraste, región crítica si consideramos un nivel de
significación del 5%, decisión, y p-valor comentado.

18
19
19.- Otro estudio analiza la calidad de la asistencia sanitaria dada en un determinado
hospital. Cada individuo puntúa de 0 a 100 según su opinión. Se toma una m.a.s. de
tamaño 10, con los siguientes resultados:
10 10

 xi = 400 ;  xi2 = 20000 .


i =1 i =1

Para resolver el problema considerar que el comportamiento poblacional sobre la


puntuación sigue una distribución normal.

a) Puede mantenerse la hipótesis habitual consistente en que la puntuación media de la


población se mantiene igual o por encima de 90, tomando un nivel de significación del
5%. Plantear hipótesis, estadístico de contraste, región crítica, decisión, y p-valor.

b) Complementar el apartado anterior “a” obteniendo un intervalo de confianza para la


media poblacional al 95% de confianza. Comentar resultados “a” y “b”.

c) Puede mantenerse la hipótesis habitual consistente en que la varianza de la


puntuación en la población se mantiene igual o por debajo de 400, tomando un nivel de
significación del 5%. Plantear hipótesis, estadístico de contraste, región crítica,
decisión, y p-valor.

d) Complementar el apartado anterior “c” obteniendo un intervalo de confianza para la


varianza poblacional al 95% de confianza. Comentar resultados “c” y “d”.

20
21
20.- Dado el importante número de indecisos en una importante cuestión política, se
decide investigar el tema, e intentar diferenciar si existen diferencias significativas entre
hombres y mujeres con el fin de plantear “campañas informativas”. Se hace una nueva
encuesta, los resultados son:
Total encuestados Dudosos sobre “cuestión política”
Hombres 200 20
Mujeres 500 60
a) Plantear un intervalo de confianza al 95 % para estudiar la diferente proporción (en la
población) de “dudosos” entre hombres y mujeres. Indicar estimación puntual,
estadístico pivote, intervalo de confianza que se debe aplicar, valores concretos del
intervalo de confianza e interpretación.
b) Contrastar con nivel de significación del 5% para intentar “probar” que las mujeres
dudan más que los hombres: se deben plantear las hipótesis, indicar el estadístico de
contraste, la región crítica, hallar el valor experimental, tomar una decisión, obtener el
p-valor, y comentar los resultados.

22
21.- Dado el importante número de indecisos en una importante cuestión política, se
decide investigar el tema, e intentar diferenciar si existen diferencias significativas entre
hombres y mujeres con el fin de plantear “campañas informativas”. Se hace una nueva
encuesta, los resultados son:
Total encuestados Dudosos sobre “cuestión política”
Hombres 200 20
Mujeres 400 80
a) Plantear un intervalo de confianza al 95 % para estudiar la diferente proporción de
“dudosos” entre hombres y mujeres. Indicar estimación puntual, estadístico pivote,
intervalo de confianza que se debe aplicar, valores concretos del intervalo de confianza
e interpretación.
b) Contrastar con nivel de significación del 1% si se admitiría la hipótesis habitual
referida a que las mujeres dudan más que los hombres: se deben plantear las hipótesis,
indicar el estadístico de contraste, la región crítica, hallar el valor experimental, tomar
una decisión, valor experimental, obtener el p-valor, y comentar los resultados.

23
22.- Otro estudio analiza la confianza que la población tiene en sus dirigentes políticos
medida mediante la variable puntuación otorgada entre 0 y 100 (se sospecha se dará una
puntuación baja). La puntuación poblacional se admite sigue un modelo normal. Para
poder confirmar esta hipótesis se pasa una encuesta a 10 sujetos seleccionados al azar
por m.a.s. de entre toda la población. Se tienen los siguientes resultados:
10 10

 xi = 200 ;  xi2 = 8000 .


i =1 i =1

Para resolver el problema considerar que el comportamiento de la puntuación sigue una


distribución normal.

a) Intentar probar que la puntuación media que da la población a los políticos está por
debajo de 30 puntos, tomando un nivel de significación del 5%. Plantear hipótesis,
estadístico de contraste, región crítica, valor experimental, decisión, y p-valor.

b) Complementar el apartado anterior “a” obteniendo un intervalo de confianza para la


media poblacional al 95% de confianza. Comentar resultados “a” y “b”.

c) Puede mantenerse la hipótesis habitual consistente en que la varianza de la


puntuación en la población se mantiene igual o por debajo de 400, tomando un nivel de
significación del 1%. Plantear hipótesis, estadístico de contraste, región crítica, valor
experimental, decisión, y p-valor.

d) Complementar el apartado anterior “c” obteniendo un intervalo de confianza para la


varianza poblacional al 99% de confianza. Comentar resultados “c” y “d”.

24
25
23.- Dos profesores imparten clases de la misma asignatura en dos campus diferentes A y B
pertenecientes a la misma universidad. Con el objeto de estudiar el rendimiento académico de los
estudiantes en los dos campus se observan las notas medias de 100 alumnos del campus A y las
de otros 100 alumnos del campus B, obteniendo notas medias muestrales de 8,6 y 7,8 con
cuasivarianzas muestrales de 6,25 y 4 respectivamente. Suponiendo normalidad en las
poblaciones y asimilando las cuasivarianzas muestrales a las varianzas poblacionales, se desea
comprobar si se puede asegurar que las notas medias de ambos colectivos son coincidentes.
a) Efectuar el contraste de hipótesis pertinente con un α = 5%: plantear las hipótesis, el
estadístico de prueba, la región crítica, la decisión tomada, el valor experimental y a
continuación calcule el p-valor.
b) Complementar el análisis mediante un intervalo de confianza.

26
24.- Un determinado país “desconocido” tiene unas elecciones próximamente. Un
partido político muy preocupado por la posible abstención, intenta comprobar el cambio
en el porcentaje de personas con intención de “ir a votar” antes y después de una etapa
de campaña electoral. Se recogen los datos obtenidos mediante encuestas (selección de
elementos por m.a.s.) antes y después de la mencionada etapa de campaña electoral
sobre deseo de “ir a votar”, las dos muestras se consideran independientes entre sí.
Antes Después
Tamaño muestra 1.000 1.000
Sí, votará 780 800
No va a votar 220 200
a) Elaborar un intervalo de confianza al 95% para la diferencia de proporciones de
personas de la población (antes y después) que “No van a votar”. Plantear pivote e
intervalo de confianza, obtener los valores del intervalo y comentar interpretación.
b) Si quisiéramos un nivel de confianza del 99%, un radio de intervalo de 0,01,
considerar variabilidad máxima e iguales tamaños muestrales en las dos muestras, ¿cuál
sería ese tamaño muestral necesario e igual en cada muestra?
c) Contrastar con nivel de significación del 5% si existen o no cambios en la proporción
poblacional que “no va a votar” (antes y después de la campaña) en base a las dos
muestras recogidas: se deben plantear las hipótesis, indicar el estadístico de contraste, la
región crítica, la decisión, y el p-valor comentado.

27

También podría gustarte