Texto Base de La Unidad 1
Texto Base de La Unidad 1
Texto Base de La Unidad 1
Distribución muestral,
estimaciones e
intervalos de confianza
Introducción
Objetivo de la unidad
CONTENIDO
La distribución normal......................................................................................................................... 3
1. Ejemplos de distribuciones normales ..................................................................................... 3
2. Gráfica de la distribución normal ............................................................................................ 4
3. Características de la distribución normal ................................................................................ 5
La distribución normal estándar ......................................................................................................... 5
1. Puntuaciones Z ........................................................................................................................ 6
2. La regla empírica ..................................................................................................................... 7
3. Distribución normal tipificada ................................................................................................. 8
4. Manejo de la tabla de distribución normal estándar ............................................................ 10
El teorema del límite central ............................................................................................................. 12
1. Propiedades del teorema del límite central.......................................................................... 12
La estimación..................................................................................................................................... 13
1. Estimación puntual ............................................................................................................ 15
2. Estimación por intervalos ...................................................................................................... 17
Estimación de la media de una población mediante intervalos de confianza .................................. 19
1. Estimación de intervalos para muestras grandes ................................................................. 20
2. Estimación de la diferencia entre dos medias poblacionales ............................................... 26
Estimación de una proporción poblacional....................................................................................... 28
1. Estimación puntual de una proporción ................................................................................. 29
2. Estimación por intervalo de confianza de una proporción ................................................... 31
REFERENCIAS BIBLIOGRÁFICAS ......................................................................................................... 34
3
La distribución normal
La distribución normal es una distribución de probabilidad continua cuya gráfica
tiene forma de campana y es simétrica respecto a su media. En estadística, la
distribución normal sirve para modelizar fenómenos de características muy
diferentes, por eso es tan importante esta distribución.
Normalmente, los conjuntos de datos que siguen una distribución normal tienen
un gran número de observaciones y tratan de temas muy generales. A
continuación, puedes ver varios ejemplos de muestras estadísticas que
típicamente se pueden modelar con una distribución normal.
- La estatura de los alumnos de un curso.
- El coeficiente intelectual de los trabajadores de una empresa.
- El número de piezas defectuosas producidas en una fábrica durante un día.
4
Una vez hemos visto en qué consiste la distribución normal y varios ejemplos de
este tipo de distribución de probabilidad, vamos a ver cómo es su gráfica para
entender mejor el concepto.
Ejemplo
Supongamos que X ~ N (5, 6). Esto dice que X es una variable aleatoria
normalmente distribuida, con media μ = 5 y desviación típica σ = 6. Supongamos
que x =17. Entonces:
𝑥−𝜇 17−5
𝑍= = = 2
𝜎 6
Esto significa que x = 17 está dos desviaciones típicas (2σ) por encima o a la
derecha de la media μ = 5.
𝑥−𝜇 1−5
Supongamos ahora que x = 1. Entonces: 𝑍 = = = −0,67
𝜎 6
Esto significa que x = 1 está 0,67 desviaciones típicas (–0,67σ) por debajo o a la
izquierda de la media μ = 5
7
Es rentable, ya que es más barato que los métodos tradicionales, como las
encuestas, y no requiere tanto tiempo ni recursos para realizar el estudio. Otra
ventaja es que puede utilizarse para muestrear una variedad de poblaciones,
incluyendo grupos que son difíciles o imposibles de encuestar, lo cual hace que
los costes y los recursos utilizados sean muy eficientes.
8
Por simetría cambiamos los dos valores negativos a positivos y calculamos sus
probabilidades.
El teorema central del límite tiene una serie de propiedades de gran utilidad en
el ámbito estadístico y probabilístico. Las principales son:
- Si el tamaño de la muestra es suficientemente grande, la distribución de las
medias muestrales seguirá aproximadamente una distribución normal. El
TLC considera una muestra como grande cuando el tamaño de la misma
13
La estimación
Ante las limitaciones que presenta la estimación puntual se puede hacer uso de
otro método de estimación, la estimación por intervalos, éste es un
procedimiento alternativo cuando la estimación puntual no es capaz de
proporcionar información eficiente para describir el comportamiento de una
característica de la población.
Existe una gama de fenómenos donde la estimación puntual cuenta con ciertos
inconvenientes, por lo que es preferible utilizar intervalos para realizar una
estimación apropiada de los parámetros. En el caso de la estimación por
intervalos de la media poblacional se utiliza la información contenida en una
muestra de la que se obtienen dos valores numéricos que definen un rango
donde se encuentra la media poblacional.
pues su nivel de confianza señala qué tan posible o qué tan probable es que el
parámetro poblacional se encuentre incluido dentro del rango definido.
Como se ha señalado uno de los métodos para estimar la media de una población
es a través de intervalos de confianza.
Existen dos fórmulas para poder estimar la media de una población a través de
intervalos de confianza y el uso de cada una de ellas depende del caso que se
examine. En este caso abordaremos el método generalmente utilizado cuando se
dispone de muestras grandes, es decir, para aquellas muestras compuestas de 30
o más datos. Este método también puede ser utilizado para muestras menores a
30 datos, siempre y cuando se tenga pleno conocimiento que la distribución de
los datos de la población sea normal y que se conozca el valor de la varianza
poblacional o de la desviación estándar poblacional.
20
Además, se presentará un método para estimar la diferencia que existe entre las
medias poblacionales de dos conjuntos de datos distintos. Este método ofrece
grandes ventajas cuando se desea conocer si existen diferencias significativas en
la forma en que se concentran los datos de dos poblaciones distintas.
Observa que ambas fórmulas proporcionan dos valores que definen un intervalo
en el que se encuentra contenida la verdadera media poblacional, con un nivel
de confianza que se traduce en la probabilidad de que la media poblacional se
encuentre dentro de nuestro intervalo de confianza. El intervalo de confianza
también puede expresarse como:
Observa que el intervalo se encuentra acotado por los dos valores resultantes. Al
valor que se encuentra en la parte izquierda del intervalo se le conoce como la
cota inferior, la cual señala el valor mínimo que puede adquirir la media
poblacional. Al valor que se encuentra en la parte derecha de la fórmula se le
conoce como la cota superior, la cual señala el valor máximo que puede adquirir
la media de la población.
Los elementos que conforman el intervalo de confianza son:
x̅ = Media de la muestra
Z ∝/2 = Es el valor de Z situado bajo la curva normal estandarizada.
𝜎/√𝑛 = 𝐸𝑠 𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 𝑒𝑠𝑡á𝑛𝑑𝑎𝑟 𝑑𝑒 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
El nivel de confianza sirve para determinar el valor de 𝑍 ∝/2. Para esto, uno
determina un nivel de confianza considerable, por ejemplo, 90%, 95%, 98% o
22
Esto quiere decir que, si se está trabajando con un nivel de confianza de (1 – ∝)%
= 90%, el valor de 𝑍 ∝/2 que se debe utilizar en la fórmula del intervalo de
confianza es 1.645. Lo mismo sucede para los niveles de confianza de 95%, 98%
y de 99%, cuyos valores de 𝑍 ∝/2 son 1.96, 2.326 y 2.576, respectivamente.
Recuerda que este método de estimación está basado en el teorema central del
límite, el cual permite asegurar que, al extraer una muestra grande para realizar
inferencias sobre el comportamiento de la población, la media muestral tiene una
distribución normal, sin importar cómo sea la distribución original de los datos de
la población. En ese sentido, el error que se puede cometer al utilizar a 𝑥̅ como
estimador de será de una magnitud aproximada al valor de 𝐸 = [𝑍 ∝/2][𝜎/√𝑛] , al
que se le conoce como el error máximo de la estimación.
Ahora bien, recordemos que el valor Z señala a qué distancia se encuentra alejado
un valor específico de la media de una distribución. La relación que existe entre
dos valores de Z y el porcentaje de datos de la población que se encuentra
incluido entre esos dos valores de Z, (1 – ∝)%, viene dado por:
La fórmula anterior establece que la variable aleatoria “Z” puede adquirir un valor
comprendido en el intervalo que va de – Z ∝/2 a Z∝/2, con una probabilidad de
1 –∝ , o un porcentaje de (1 – ∝)% de los valores de una población.
24
Cabe señalar que este método también puede ser utilizado para estimar
intervalos de confianza para muestras pequeñas menores a 30 datos, siempre y
cuando se tenga pleno conocimiento de que la distribución de los datos de la
población sea normal y que se conozca el valor de la varianza poblacional o de la
desviación estándar poblacional.
25
Ejemplo:
Una máquina de refrescos está ajustada de tal manera que la cantidad de líquido
despachada se distribuye aproximadamente en forma normal con una desviación
estándar igual a 0.15 litros. Si se toma una muestra de 25 refrescos cuya media
fue de 2.25 litros, ¿cuál sería el intervalo de confianza de 95% para la media de
todos los refrescos que sirva esta máquina?
Si tenemos un nivel de confianza de 95%, el valor que tomará Z ∝/2 (de acuerdo
con la tabla de nivel de confianza) es de 1.96, por lo que los datos que utilicemos
en la fórmula del intervalo de confianza son:
n = 25
𝑥̅ = 2.25
𝑍 ∝/2 = 1.96
𝜎 = 0.15
Existen casos en los que es necesario estimar la diferencia entre dos medias, con
la finalidad de comparar dos poblaciones, por ejemplo:
- Cuando se requiere comparar la productividad de los empleados de dos
sucursales bancarias.
- En los casos en que se quiere hacer una comparación entre los niveles
salariales de dos empresas.
- Cuando un inversionista quiere comparar el rendimiento de dos carteras
distintas de instrumentos de inversión.
- Cuando se desea comparar el rating o nivel de audiencia de dos
programas de televisión transmitidos a la misma hora en diferentes canales.
- En situaciones donde se quiere conocer los gustos y preferencias sobre un
refresco, haciendo publicidad en dos ciudades diferentes.
Ejemplo:
Una empresa de alimentos realizó un experimento para comparar dos dietas para
adelgazar: 1 y 2. Se seleccionan al azar dos grupos de 36 personas con
sobrepeso, el primer grupo se somete a la dieta 1 y el otro a la dieta 2. Se observa
que durante un determinado número de días el promedio de pérdida de peso y
las desviaciones estándar de ambos grupos son las siguientes: 𝑥1 = 21.3; S1 =
2.6; 𝑥2 = 13.4; S2 = 1.9 ¿Cuál es el intervalo de 95% de confianza para la diferencia
entre las pérdidas de peso promedio de las dos dietas?
Por tanto, la diferencia entre las pérdidas de peso promedio de las dos dietas se
encuentra en un intervalo comprendido de 6.848 a 8.952. En este caso, tanto la
cota inferior como la cota superior son positivas, lo que refleja que el promedio
de pérdida de peso de la dieta 1 siempre es mayor que el de la dieta 2. Por esta
razón se puede aseverar que la dieta 1 tiene mayor efectividad que la dieta 2.
Donde:
p̂: proporción de los éxitos observados en la muestra.
X: número de éxitos que se puede obtener de la muestra.
n: tamaño de la muestra
30
Ejemplo:
Una empresa desea determinar la proporción de empleados que toma cursos de
capacitación los sábados. La empresa elige en forma aleatoria una muestra de 80
empleados, de los cuales 62 toman cursos de capacitación los sábados.
Datos
n = 80
X = 62
Por lo tanto, a partir de la muestra tomada, la empresa puede concluir que, 77.5%
de la población de empleados toma cursos de capacitación los sábados. El
porcentaje de empleados que no toma cursos de capacitación se puede obtener
a partir de:
Sin embargo, este método de estimación no resulta muy atractivo ante las
limitaciones que se observan en todo tipo de estimadores puntuales; por
ejemplo, su resultado varía de muestra en muestra y no proporciona una medida
de referencia que permita conocer cuánto le podemos tener confianza al
resultado obtenido de la estimación puntual.
El teorema central del límite señala que, si se tiene una variable con distribución
binomial X que representa el número de éxitos que se pueden obtener en una
32
muestra, con una distribución muestral del estadístico p̂, en las que cada una de
las posibles muestras tiene un tamaño n lo suficientemente grande de tal manera
que n multiplicada por el estadístico p̂ sea mayor o igual a 5, n p̂ 5, y multiplicada
por el estadístico q̂ también sea mayor o igual a 5, n
q̂ 5, entonces la distribución muestral del estadístico p̂ tendrá una distribución
normal.
Ejemplo:
El departamento de recursos humanos de una empresa tiene interés en conocer
el porcentaje de trabajadores que tienen estudios de bachillerato, para esto
seleccionó una muestra de 200 trabajadores y detectó que 114 tienen al menos
estudios de bachillerato. Con un nivel de confianza de 90%, ¿cuál es el intervalo
para la proporción de trabajadores que tienen estudios de bachillerato?
q̂ = 1 − p̂ = 1 − 0.57 = 0.43
REFERENCIAS
BIBLIOGRÁFICAS
https://openstax.org/books/introducci%C3%B3n-estad%C3%ADstica-
empresarial/pages/6-1-la-distribucion-normal-estandar
https://www.probabilidadyestadistica.net/distribucion-normal/
https://www.studysmarter.es/resumenes/matematicas/estadistica-y-
probabilidad/distribucion-normal/
vadenumeros.es. (10 de mayo de 2023). Ejemplo uso tabla normal estándar. Obtenido
de https://www.vadenumeros.es/sociales/manejo-tabla-normal.htm