Estadística Inferencial
Estadística Inferencial
Estadística Inferencial
1
UNIDAD 3. ESTIMACIÓN DE PARÁMETROS.
Los dos tipos de problemas que resuelven las técnicas estadísticas son: estimación y
contraste de hipótesis. En ambos casos se trata de generalizar la información obtenida en
una muestra a una población. Estas técnicas exigen que la muestra sea aleatoria. En la
práctica rara vez se dispone de muestras aleatorias, por la tanto la situación habitual es la
que se esquematiza en la figura
Entre la muestra con la que se trabaja y la población de interés, o población diana, aparece
la denominada población de muestreo: población (la mayor parte de las veces no definida
con precisión) de la cual nuestra muestra es una muestra aleatoria. En consecuencia la
generalización está amenazada por dos posibles tipos de errores: error aleatorio que es el
que las técnicas estadísticas permiten cuantificar y críticamente dependiente del tamaño
muestral, pero también de la variabilidad de la variable a estudiar y el error sistemático que
tiene que ver con la diferencia entre la población de muestreo y la población diana y que
sólo puede ser controlado por el diseño del estudio.
En un problema de estimación hay que tener una idea de la magnitud a estimar y del
error aceptable.
En un contraste de hipótesis hay que saber el tamaño del efecto que se quiere ver.
2. ESTIMACIÓN.
2
También podemos utilizar el alcance de la muestra como un estimador del alcance de la
población.
Cuando hemos observado un valor numérico específico de nuestro estimador, nos referimos
a ese valor como una estimación. Una estimación es un valor específico observado de una
estadística. Hacemos una estimación si tomamos una muestra y calculamos el valor que
toma nuestro estimador en esa muestra.
Conceptos.
Estimador eficiente: estimador con un menor error estándar que algún otro
estimador del parámetro de la población, esto es, cuanto más pequeño sea el error
estándar de un estimador, más eficiente será ese estimador.
3
Intervalo de confianza: intervalo de valores que tiene designada una probabilidad
de que incluya el valor real del parámetro de la población.
3. TIPOS DE ESTIMADORES.
Una estimación puntual, es sólo u número que se utiliza para estimar un parámetro
de población desconocido. Una estimación puntual a menudo resulta insuficiente,
debido a que sólo tiene dos opciones: es correcta o está equivocada.
Es decir, consiste en un solo estadístico muestral que se usa para estimar el valor verdadero
de un parámetro de una población que es desconocido. Por ejemplo, la media muestral x es
un estimador puntual de la media poblacional µ y la proporción muestral pˆ es un estimador
puntual de la verdadera proporción poblacional p.
Cuando usamos una estimación puntual, sabemos que aunque usemos un método bueno de
estimación es prácticamente improbable que el valor de la estimación coincida con el
verdadero valor del parámetro, así que sería conveniente acompañar nuestra estimación con
alguna medida que nos permitiera expresar la cercanía del estimador al parámetro. Una
solución a ello no los brindan los estimadores por Intervalos de Confianza.
Esta estimación indica el error de dos maneras: por la extensión del intervalo y por la
probabilidad de obtener el verdadero parámetro de la población que se encuentra dentro del
intervalo.
4
Imparcialidad. Se refiere al hecho de que una media de muestra es un estimador no
sesgado de una media de población, porque la media de distribución de muestreo de
las medias de muestras tomadas de la misma población es igual a la media de la
población misma. Podemos decir que una estadística es un estimador imparcial (o
no sesgado) si, en promedio, tiende a tomar valores que están por encima del
parámetro de la población y la misma extensión con la que tiende a asumir valores
por debajo del parámetro de población que se está estimando.
5
Se llama intervalo de confianza en estadística a un par de números entre los cuales se
estima que estará cierto valor desconocido con una determinada probabilidad de acierto.
Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de
una muestra, y el valor desconocido es un parámetro poblacional.
6. INTERPRETACIÓN DE (1- α)
Los valores que se suelen utilizar para el nivel de confianza son el 95%, 99% y 99,9%, que
se corresponden con valores α de 0,05 y 0,01 respectivamente.
Valor α
También llamado nivel de significación. Es la probabilidad (en tanto por uno) de fallar en
nuestra estimación, esto es, la diferencia entre la certeza (1) y el nivel de confianza (1-α).
Por ejemplo, en una estimación con un nivel de confianza del 95%, el valor α es (100-
95)/100 = 0,05
6
7. INTERVALO DE CONFIANZA PARA LA MEDIA DE UNA POBLACIÓN, 2
CONOCIDA
Supongamos que disponemos de una población en la que tenemos una v.a. con distribución
con σ conocida (de estudios previos, por ejemplo). Obtenemos una muestra de tamaño n y
deseamos estimar la media µ de la población.
El estimador puntual de la misma es la media muestral cuya distribución muestral es
conocida
La cantidad
7
Despejando la media muestral y la varianza
Que verifica las condiciones de la definición.
Así, el intervalo de confianza para la media puede escribirse como
En la práctica, de todos los posibles valores de tenemos uno sólo y por tanto un único
intervalo de todos los posibles para distintas muestras
La importancia del intervalo de confianza para la estimación está en el hecho de que el
intervalo contiene información sobre el estimador puntual (valor central del intervalo) y
sobre el posible error en la estimación a través de la dispersión y de la distribución muestral
del estimador. Obsérvese que el error en la estimación está directamente relacionado con la
distribución muestral del estimador y con la varianza poblacional, e inversamente
relacionado con el tamaño muestral.
El gráfico siguiente ilustra la interpretación del nivel de confianza para el intervalo de
confianza para la media de una distribución normal con varianza conocida. Para los
distintos posibles valores de la media, representados mediante su distribución muestral,
obtenemos distintos intervalos de confianza. La mayor parte incluye al verdadero valor del
parámetro, pero el resto no. Concretamente el 95% lo incluye y el 5% no, si el nivel de
confianza es del 95%.
En la práctica disponemos de una única repetición del experimento, y por tanto de un único
intervalo de confianza, el señalado en negro en el gráfico, por ejemplo. Confiamos en que
nuestro intervalo sea de la mayoría que con tiene al verdadero valor objetivo aunque no
tenemos la seguridad de que sea así, tenemos concretamente un riesgo del 5% de
equivocarnos.
8
8. ERROR DE ESTIMACIÓN.
Cuando se mide una cantidad, ya sea directa o indirectamente, la medida que se obtiene no
es necesariamente el valor exacto de tal medida, ya que el resultado obtenido estará
afectado por errores debidos a la multiplicidad de factores. Algo en apariencia tan sencillo
como cronometrar el período de oscilación de un péndulo simple, sufrirá errores debidos a
la precisión del cronómetro, los reflejos del cronometrador, las corrientes de aire, el número
de medidas efectuadas ... errores que se propagarán a cualquier cantidad derivada de ésta
que queramos determinar, como por ejemplo velocidad o aceleración.
En estos casos es necesario estimar el error cometido al efectuar una medida o serie de
medidas. El conjunto de reglas matemáticas dedicado a su estudio se conoce como teoría de
9
errores, y resulta imprescindible en el análisis de un conjunto de datos experimentales en
cuanto a la fiabilidad de estas mediciones.
Siempre que tomamos una muestra, perdemos algo de información útil con respecto a la
población. El error de muestre se puede controlar si seleccionamos una muestra cuyo
tamaño sea el adecuado. En general, cuanta más precisión se quiera, más grande será el
tamaño de la muestra necesaria.
Los datos que tenemos que incluir en la fórmula para calcular el número de sujetos
necesarios en la muestra (N) son:
Zα/2: valor de Z correspondiente al riesgo α fijado. El riesgo α fijado suele ser 0,05 y
Zα/2 de 1,96.
s2: Varianza de la distribución de la variable cuantitativa que se supone que existe
en la población.
i: Precisión con que se desea estimar el parámetro (2i es la amplitud del intervalo de
confianza).
Su fórmula es: n = ( ZS / E ) 2
10
Si n es grande y p no está próximo a 0 ó 1 (np ³ 5) X es aproximadamente normal con
muestral), que es también aproximadamente normal, con error típico dado por
en consecuencia, un IC para p al 100(1 - a)% será
Obsérvese que para construirlo, ¡se necesita conocer p!. Si n es grande (>30) se pueden
substituir p y q por sus estimadores sin mucho error, en cualquier caso como pq £ 0,25 si se
substituye pq por 0,25 se obtiene un intervalo más conservador (más grande).
Donde
11
: z correspondiente al nivel de confianza elegido
e: error máximo
N: tamaño de la población
Donde tα/2 es el valor t con v = n - 1 grados de libertad, que deja un área de σ/2 a la derecha.
Se hace una distinción entre los casos de σ conocida y σ desconocida al calcular las
estimaciones del intervalo de confianza. Se debe enfatizar que para el primer caso se utiliza
el teorema del límite central, mientras que para σ desconocida se hace uso de la distribución
muestral de la variable aleatoria t. Sin embargo, el uso de la distribución t se basa en la
premisa de que el muestreo se realiza de una distribución normal.
Con mucha frecuencia los estadísticos recomiendan que aun cuando la normalidad no se
pueda suponer, con σ desconocida y n 30, s puede reemplazar a σ y se puede utilizar el
intervalo de confianza:
12
CONCLUSIÓN
Un estimador es un valor que puede calcularse a partir de los datos muestrales y que
proporciona información sobre el valor del parámetro. Por ejemplo la media muestral es un
estimador de la media poblacional, la proporción observada en la muestra es un estimador
de la proporción en la población.
Una estimación es puntual cuando se obtiene un sólo valor para el parámetro. Los
estimadores más probables en este caso son los estadísticos obtenidos en la muestra, aunque
es necesario cuantificar el riesgo que se asume al considerarlos. Recordemos que la
distribución muestral indica la distribución de los valores que tomará el estimador al
seleccionar distintas muestras de la población. Las dos medidas fundamentales de esta
distribución son la media que indica el valor promedio del estimador y la desviación típica,
también denominada error típico de estimación, que indica la desviación promedio que
podemos esperar entre el estimador y el valor del parámetro.
Más útil es la estimación por intervalos en la que calculamos dos valores entre los que se
encontrará el parámetro, con un nivel de confianza fijado de antemano.
Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene
al parámetro que se está estimando.
13
BIBLIOGRAFÍA
http://www.itch.edu.mx/academic/industrial/estadistica1/cap03.html
http://www.stadcenterecuador.com/contenidos/estadistica-inferencial.html?q=contenidos
%2Festadistica-inferencial.html&showall=1
http://es.wikipedia.org/wiki/Intervalo_de_confianza
http://es.wikipedia.org/wiki/Estimaci%C3%B3n_estad%C3%ADstica
http://escuela.med.puc.cl/recursos/recepidem/EPIANAL9.HTM
http://www.hrc.es/bioest/esti_medias.html
14