Inferencia Estadística

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 12

INFERENCIA ESTADÍSTICA

La inferencia estadística es el conjunto de métodos y técnicas que


permiten inducir, a partir de la información empírica proporcionada
por una muestra, cual es el comportamiento de una determinada
población con un riesgo de error medible en términos de
probabilidad.

Los métodos paramétricos de la inferencia estadística se pueden


dividir, básicamente, en dos: métodos de estimación de parámetros
y métodos de contraste de hipótesis. Ambos métodos se basan en el
conocimiento teórico de la distribución de probabilidad del
estadístico muestral que se utiliza como estimador de un parámetro.

La estimación de parámetros consiste en asignar un valor concreto


al parámetro o parámetros que caracterizan la distribución de
probabilidad de la población. Cuando se estima un parámetro
poblacional, aunque el estimador que se utiliza posea todas las
propiedades deseables, se comete un error de estimación que es la
diferencia entre la estimación y el verdadero valor del parámetro.
El error de estimación es desconocido por lo cual es imposible saber
en cada caso cual ha sido la magnitud o el signo del error; para
valorar el grado de precisión asociado con una estimación puntual
se parte de dicha estimación para construir un intervalo de
confianza. En síntesis, un intervalo de confianza está formado por
un conjunto de valores numéricos tal que la probabilidad de que éste
contenga al verdadero valor del parámetro puede fijarse tan grande
como se quiera. Esta probabilidad se denomina grado de confianza
del intervalo, y la amplitud deéste constituye una medida del grado
de precisión con el que se estima el parámetro.

Los métodos de contraste de hipótesis tienen como objetivo


comprobar si determinado supuesto referido a un parámetro
poblacional, o a parámetros análogos de dos o más poblaciones, es
compatible con la evidencia empírica contenida en la muestra. Los
supuestos que se establecen respecto a los parámetros se llaman
hipótesis paramétricas. Para cualquier hipótesis paramétrica, el
contraste se basa en establecer un criterio de decisión, que depende
en cada caso de la naturaleza de la población, de la distribución de
probabilidad del estimador de dicho parámetro y del control que se
desea fijar a priori sobre la probabilidad de rechazar la hipótesis
contrastada en el caso de ser ésta cierta.

En todo contraste intervienen dos hipótesis. La hipótesis nula (Ho)


es aquella que recoge el supuesto de que el parámetro toma un valor
determinado y es la que soporta la carga de la prueba. La decisión
de rechazar la hipótesis nula, que en principio se considera cierta,
está en función de que sea o no compatible con la evidencia
empírica contenida en la muestra. El contraste clásico permite
controlar a priori la probabilidad de cometer el error de rechazar la
hipótesis nula siendo ésta cierta; dicha probabilidad se llama nivel
de significación del contraste ( ) y suele fijarse en el 1%, 5% o
10%.

La proposición contraria a la hipótesis nula recibe el nombre de


hipótesis alternativa (H1) y suele presentar un cierto grado de
indefinición: si la hipótesis alternativa se formula simplemente
como 'la hipótesis nula no es cierta', el contraste es bilateral o a dos
colas; por el contrario cuando se indica el sentido de la diferencia,
el contraste es unilateral o a una sola cola.

Las hipótesis nula y alternativa son dos enunciados mutuamente


excluyentes acerca de una población. Una prueba de hipótesis utiliza
los datos de la muestra para determinar si se puede rechazar la
hipótesis nula.
Hipótesis nula (H0)
La hipótesis nula indica que un parámetro de población (tal
como la media, la desviación estándar, etc.) es igual a un valor
hipotético. La hipótesis nula suele ser una afirmación inicial
que se basa en análisis previos o en conocimiento
especializado.
Hipótesis alternativa (H1)
La hipótesis alternativa indica que un parámetro de población
es más pequeño, más grande o diferente del valor hipotético de
la hipótesis nula. La hipótesis alternativa es lo que usted podría
pensar que es cierto o espera probar que es cierto.

Ejemplo
Se sabe que la desviación típica de las notas de cierto
examen de Matemáticas es 2,4. Para una muestra de 36
estudiantes se obtuvo una nota media de 5,6. ¿Sirven
estos datos para confirmar la hipótesis de que la nota
media del examen fue de 6, con un nivel de confian za del
95%?

1. Enunciamos las hipótesis nula y alternativa:

H0 : μ = 6 La nota media no ha variado.


H1 : μ ≠ 6 La nota media ha variado.

2. Zona de aceptación

Para α = 0.05, le corresponde un valor crítico: z α / 2 =


1.96.

Determinamos el intervalo de confianza para la media:

(6-1,96 · 0,4 ; 6+1,96 · 0,4) = (5,22 ; 6,78)

3. Verificación.

Valor obtenido de la media de la muestra: 5,6 .

4. Decisión

Aceptamos la hipótesis nula H 0 , con un nivel de


significación del 5%.

____
Cuando investigamos en psicología, dentro de la estadística
inferencial encontramos dos conceptos importantes: el error tipo I y
error tipo II. Estos surgen cuando estamos realizando pruebas de
hipótesis con una hipótesis nula y una hipótesis alternativa.
En este artículo veremos qué son exactamente, cuándo los
cometemos, cómo los calculamos y cómo podemos reducirlos.

Error tipo I (α)

El error tipo I, también llamado alfa (α), se comete al rechazar la


hipótesis nula (H0) siendo esta verdadera. Así, la probabilidad de
cometer un error de tipo I es α, que es el nivel de significación que
hemos establecido para nuestra prueba de hipótesis.
Si por ejemplo el α que habíamos establecido es de 0.05, esto
indicaría que estamos dispuestos a aceptar una probabilidad del 5%
de equivocarnos al rechazar la hipótesis nula.

2.4. Error tipo II (β)

El error tipo II o beta (β), se comete al aceptar la hipótesis nula (H0)


siendo esta falsa. Es decir, la probabilidad de cometer un error tipo
II es beta (β), y depende de la potencia de la prueba (1-β).
Para reducir el riesgo de cometer un error tipo II, podemos optar por
asegurarnos de que la prueba tiene suficiente potencia. Para ello,
deberemos asegurarnos de que el tamaño de la muestra es lo
suficientemente grande como para detectar una diferencia cuando
ésta realmente exista.
Ejemplo

Ejemplo :

Se ha comprobado que el tiempo de espera ( en minutos ) hasta ser


atendido, en cierto servicio de urgencias, sigue un modelo normal
de probabilidad.
A partir de una muestra de 100 personas que fueron atendidas en
dicho servicio, se ha calculado un tiempo medio de espera
de 14,25 minutos y una desviación típica de 2,5 minutos.
¿Podríamos afirmar, con un nivel de significación del 5 % que el
tiempo medio de espera, en este servicio de urgencias, no es de 15
minutos?
1. Se formula la hipótesis nula H0 y la hipótesis
alternativa H1.

Hipótesis nula : H0 : μ = 15
Hipótesis alternativa : H1 : μ ≠ 15
Puesto que nuestra hipótesis nula está formulada en forma de
igualdad, tenemos un contraste bilateral.

2. Identificamos la distribución de probabilidad y el


tamaño de la muestra.

Por el enunciado sabemos que la población sigue una


distribución normal. Tomamos una muestra de tamaño n = 100
con una media μ = 14,25 y desviación típìca σ = 2,5. La
muestra se distribuye :

3. Construimos las regiones de aceptación y rechazo.

Construimos nuestra región de aceptación a partir de un nivel


de significación α = 0,05. Como es un contraste bilateral,
emplearemos zα/2 :
4. Calcular el estadistíco de contraste y verificar la
hipótesis.

Nuestro estadístico de contraste es el tiempo de media de


espera en urgencias, μ = 14,25.

En este caso, 14,25 ∉ ( 14,51 ; 15,49 ).

Nuestro estadístico de contraste no pertenece a la región de


aceptación.

5. Interpretación de la decisión.

Como nuestro estadístico de contraste no pertenece a la región


de aceptación, rechazamos la hipótesis nula.
Por lo tanto, no podemos afirmar que el tiempo medio de
espera sea de 15 minutos.

Hemos rechazado la hipótesis nula por no poder afirmar que el


tiempo medio de espera sea de 15 minutos, pero podemos
estar equivocados. De ser así, estariamos cometiendo un error
de tipo I.

Si la muestra seleccionada hubiera tenido un tiempo medio de


espera de 14,52 minutos (apenas 16 segundos
más) hubieramnos aceptado la hipótesis nula. En caso de
equivocación, estariamos comentiendo un error de tipo II.

Se utiliza una prueba de una muestra para probar una afirmación con
respecto a una media de una población única.
El tamaño de la muestra de una muestra estadística es el número de
observaciones que la componen.
El tamaño de la muestra normalmente es representado por "n" y
siempre es un número entero positivo. No se puede hablar de ningún
tamaño exacto de la muestra, ya que puede variar dependiendiendo
de los diferentes marcos de investigación. Sin embargo, si todo lo
demás es igual, una muestra de tamaño grande brinda mayor
precisión en las estimaciones de las diversas propiedades de la
población.

Para determinar el tamaño adecuado de las muestras es necesario


seguir los tres criterios:

1. Nivel de precisión
El nivel de precisión, también llamado error de muestreo, es el rango
en donde se estima que está el valor real de la población. Este rango
se expresa en puntos porcentuales. Por lo tanto, si un investigador
descubre que el 70% de los agricultores de la muestra han adoptado
una tecnología recomendada con una tasa de precisión de ~+mn~
5%, el investigador puede concluir que entre el 65% y el 75% de los
agricultores de la población han adoptado la nueva tecnología.
2. Nivel de confianza
El intervalo de confianza es la medida estadística del número de
veces de cada 100 que se espera que los resultados se encuentren
dentro de un rango específico.
Por ejemplo, un intervalo de confianza de 90% significa que los
resultados de una acción probablemente cubrirán las expectativas el
90% de las veces.

La idea básica descripta en el Teorema del límite central es que


cuando una población se muestrea muchas veces, el valor promedio
de un atributo obtenido es igual al valor real de la población. En
otras palabras, si un intervalo de confianza es del 95%, significa que
95 de 100 muestras tendrán el valor real de la población dentro del
rango de precisión.

3. Grado de variabilidad
Dependiendo de la población objetivo y los atributos a considerar, el
grado de variabilidad varía considerablemente. Cuanto más
heterogénea sea una población, mayor deberá ser el tamaño de la
muestra para obtener un nivel óptimo de precisión. Ten en cuenta
que una proporción de 55% indica un nivel más alto de variabilidad
que un 10% o un 80%. Esto se debe a que 10% y 80% significa que
una gran mayoría no posee o posee el atributo en cuestión.
Existen muchos enfoques para determinar el tamaño de la muestra,
incluyendo el uso de un censo en el caso de poblaciones más
pequeñas, el uso de tablas publicadas, imitar un tamaño de muestra
de estudios similares y aplicar fórmulas para calcular un tamaño de
la muestra.
Bibliografias
Botella, J. Sueró, M. Ximénez, C. (2012). Análisis de datos en
psicología I. Madrid: Pirámide.

Katherine (2008) Estadística Inferencial.


ESTADISTICA INFERENCIAL.
Autor: PEÑA TORBAY, GUSTAVO. Editorial: ISBN:
9789802446100. Año de Publicación: 2009. Materia:
ESTADISTICA.

También podría gustarte