Tema 11-12 Inferencia Estadistica Ccss II
Tema 11-12 Inferencia Estadistica Ccss II
Tema 11-12 Inferencia Estadistica Ccss II
Inferencia Estadstica.
1. INTRODUCCIN
La Estadstica es, en la actualidad, la disciplina cientfica ms utilizada y estudiada en diversos campos del conocimiento como ingeniera, medicina, economa, sociologa, biologa. Adems de unos mnimos conocimientos estadsticos, es necesario conocer herramientas imprescindibles en la toma de decisiones relativas a determinadas poblaciones basndose en la informacin obtenida por una muestra. Es precisamente a esta cuestin a lo que se dedica esta unidad y que se basa en una rama de la Estadstica llamada Estadstica Inferencial, a establecer conclusiones sobre determinados parmetros poblacionales utilizando la informacin obtenida por una muestra representativa. Cuando una investigacin estadstica va referida a un conjunto, coleccin o colectivo de elementos, este colectivo se llama poblacin. Cuando una poblacin es muy grande, no suele hacerse una observacin exhaustiva, sino que se estudia una parte de la misma llamada muestra, para obtener conclusiones acerca de la poblacin. Esta muestra debe ser elegida debidamente para obtener resultados vlidos para toda la poblacin.
Curva de la distribucin N ( , )
El rea del recinto determinado por la funcin y el eje de las abscisas es igual a 1. La curva normal es simtrica respecto al eje que pasa por x = , por tanto deja un rea igual a 05 a la izquierda de y otra igual a 05 a la derecha de . El rea bajo la curva entre dos abscisas cualesquiera a y b representa la probabilidad de que la variable tome un valor comprendido entre esas dos abscisas ( P (a < X < b) ) Para poder calcular probabilidades en una distribucin Normal es necesario saber calcular el rea bajo la curva de su funcin densidad entre dos valores cualesquiera.
Como todas las distribuciones normales tienen propiedades comunes respecto de sus parmetros, se puede reducir una de ellas a cualquier otra mediante un cambio de variable que ajuste los parmetros de ambas. Por tanto basta tener las tablas de una nica distribucin normal para poder calcular probabilidades de otra. Se han elaborado las tablas de la funcin de distribucin de la ms sencilla que es la distribucin N(0,1), es decir, la que tiene media 0 y desviacin tpica 1. LA TABLA DE LA N(0,1) (ESTA EN LA HOJA FINAL) Para buscar en la tabla miramos las unidades y dcimas en la columna de la izquierda y las centenas en la fila de arriba. Veamos los siguientes ejemplos ( mirar la tabla N(0,1)):
P(Z a)
P(Z a) = 1 P(Z a)
A veces tendremos que determinar en una distribucin N(0,1) el valor de z /2 conocida la probabilidad. En este caso basta con buscar en la tabla N(0,1) el valor de la probabilidad, localizando su fila y su columna correspondientes. Pero sucede que la probabilidad no siempre est en la tabla; cuando esto ocurre hacemos una interpolacin.
P ( z z /2 ) = 0, 7324
Mirar en TABLA N(0,1) En las cuadriculas de color blanco y ver a que valor corresponden
z /2 = 0, 62
3. Intervalos de confianza.
En una poblacin cuya distribucin es conocida pero desconocemos algn parmetro, podemos estimar dicho parmetro a partir de una muestra representativa. Un estimador es un valor que puede calcularse a partir de los datos mustrales y que proporciona informacin sobre el valor del parmetro. Por ejemplo la media muestral es un estimador de la media poblacional, la proporcin observada en la muestra es un estimador de la proporcin en la poblacin. Una estimacin es puntual cuando se obtiene un slo valor para el parmetro. Los estimadores ms probables en este caso son los estadsticos obtenidos en la muestra, aunque
es necesario cuantificar el riesgo que se asume al considerarlos. Recordemos que la distribucin muestral indica la distribucin de los valores que tomar el estimador al seleccionar distintas muestras de la poblacin. Las dos medidas fundamentales de esta distribucin son la media que indica el valor promedio del estimador y la desviacin tpica, tambin denominada error tpico de estimacin, que indica la desviacin promedio que podemos esperar entre el estimador y el valor del parmetro.
Ms til es la estimacin por intervalos en la que calculamos dos valores entre los que se encontrar el parmetro, con un nivel de confianza fijado de antemano.
Llamamos Intervalo de confianza al intervalo que con un cierto nivel de confianza, contiene al parmetro que se est estimando.
Nivel de confianza es la "probabilidad" de que el intervalo calculado contenga al verdadero valor del parmetro. Se indica por 1 y habitualmente se da en porcentaje (1- )100%. Hablamos de nivel de confianza y no de probabilidad ya que una vez extrada la muestra, el intervalo de confianza contendr al verdadero valor del parmetro o no, lo que sabemos es que si repitisemos el proceso con muchas muestras podramos afirmar que el (1- )% de los intervalos as construidos contendra al verdadero valor del parmetro. recibe el nombre de nivel de significacin.
z / 2
z /2
, x + z /2 x z /2 n n
x = media muestral = desviacin tpica donde n = tamao de la muestra z = valor crtico ( se calcula mirando la tabla N(0,1) /2
Ejemplo: Las estaturas de una muestra aleatoria de 50 estudiantes tienen una media de 1745 cm, y se conoce que la desviacin tpica de la variable estatura es de 69 cm. Calcula un intervalo de confianza del 95% para la estatura media de todos los estudiantes. Solucin El intervalo de confianza de la media poblacional es x z /2
, x + z /2
x = 174 '5 cm 6 '9 6 '9 = 6 '9 cm (174 '5 1'96 ,174 '5 + 1'96 ) I .C (172 '59 , 176 ' 41) 50 50 n = 50 estudiantes z = 1'96 ( mirar abajo) /2
A un nivel de confianza del 95% le corresponde un z / 2 = 1'96
P ( z z /2 ) = 0,975
z /2 = 1'96
Teorema central del lmite: si una muestra aleatoria de tamao n procede de una poblacin con media y desviacin tpica , entonces en el caso de que el tamao de la muestra sea lo suficientemente grande ( n>30), la media muestral x tiene una distribucin normal de media y desviacin tpica
,esto es:
X N ( ,
3.2
Se quiere estudiar la proporcin p de una poblacin que tiene una cierta caracterstica; por ejemplo, tener o no tener carnet de conducir, ser rubio o no, etc. Para estudiar la proporcin de la poblacin se eligen k muestras distintas de tamao n y se obtienen valores para las proporciones muestrales.