Academia.eduAcademia.edu

APUNTE 3 PROBABILIDAD Y DISTRIBUCIONES

PROBABILIDADES Experimento aleatorio: Es aquel en el cual se conocen todos los resultados posibles, pero una vez ocurrido uno de ellos no se sabe cuál será el resultado de la próxima aparición.

PROBABILIDAD Y DISTRIBUCIONES DE PROBABILIDAD Inacap Sede Apoquindo Docente: Ismael Valdivia Z. PROBABILIDADES Experimento aleatorio: Es aquel en el cual se conocen todos los resultados posibles, pero una vez ocurrido uno de ellos no se sabe cuál será el resultado de la próxima aparición. Ejemplos: Lanzar un dado Lanzar una moneda Presentarse de candidato a una elección Seleccionar un artículo de un proceso productivo Espacio muestral:  Conjunto de todos los resultados posibles de un experimento aleatorio Sucesos o eventos: (A, B, C,......., Z) Subconjunto del espacio muestral Ejemplo: Consideremos el experimento aleatorio  : lanzamiento de un dado a) Escribe el espacio muestral b) Determina los siguientes sucesos: A: Resulta número par B: Se obtiene puntaje primo C: Resulta puntaje mayor a cinco D: Se obtiene cuadrados perfectos E: Resulta múltiplo de tres Definición Clásica de probabilidad (Laplace) La probabilidad de un evento es la razón entre el número de casos (sucesos favorables) y el número total de casos (sucesos posibles), siempre que nada obligue a creer que algunos de estos sucesos deben tener preferencia respecto a los demás, lo que hace que todos sean igualmente posibles. P( A)  número de casos favorables al evento número de casos posibles A 1 Principios de probabilidad ¿La probabilidad de un evento cualquiera está comprendida entre? ¿La probabilidad de un evento imposible es? ¿La probabilidad de un evento seguro es? Si todos los elementos del espacio muestral son igualmente probables, entonces la probabilidad de cada uno es: ¿Cuál es el valor de la suma de la probabilidades de todos los eventos del espacio muestral? Ejercicios de probabilidades 1. Calcula las siguientes probabilidades en cada caso: a) Si en el premio de la lotería de 32 números, 7 son los premiados. ¿Cuál es la probabilidad de que una persona que tenga un billete gane un premio? b) Se lanza un dado. ¿Cuál es la probabilidad que se obtenga puntaje mayor a cuatro? c) Una moneda se lanza en dos ocasiones. Calcula la probabilidad de obtener al menos un sello 2 2. Considera la siguiente tabla ACTIVIDAD PROFESIONAL NO PROFESIONAL TOTAL SEXO HOMBRE 26 44 70 MUJER 14 16 30 TOTAL 40 60 100 Calcula la probabilidad que al elegir un miembro del grupo: a) sea hombre b) sea mujer c) sea profesional d) no sea profesional e) sea hombre profesional f) sea mujer profesional g) sea hombre no profesional h) sea hombre o profesional i) sea mujer o profesional Para reflexionar: Acá va un problema. Supongamos que usted y yo tenemos algo para dirimir. Por ejemplo, hay un par de entradas para ver una muy buena obra de teatro y queremos decidir quién de los dos puede ir con su pareja. No tenemos una moneda, pero hay una urna que contiene tres bolitas: dos son de color blanco (B) y una de color rojo (R). Ahora, tengo las dos preguntas. Yo le sugiero que usted meta la mano en la urna (sin mirar) y saque dos bolitas. Si son del mismo color, gana usted. Si son distintas, gano yo. ¿Le parece que es justa la división? Es decir, ¿le parece que los dos tenemos 50% de posibilidades de quedarnos con las entradas? Si su respuesta fuera que sí, explíqueme las razones. En el caso de que supusiera que no y yo le dijera que usted puede agregar una bolita de alguno de los dos colores para incluirla en la urna, ¿de qué color la elegiría para que los porcentajes (ahora) fueran iguales? 3 VARIABLES ALEATORIAS DISCRETAS Es posible combinar las ideas de probabilidad y frecuencias para obtener distribuciones de probabilidad que se parecen bastante a las distribuciones de frecuencias relativas, la diferencia más importante entre las distribuciones de probabilidad y las de frecuencia relativa, es que las distribuciones de probabilidad son probabilidades teóricas (modelo), mientras que las distribuciones de frecuencias relativas son probabilidades empíricas (muestras). Sabemos que los espacios muestrales no son necesariamente numéricos. Cuando por ejemplo lanzamos una moneda tres veces, podemos registrar un resultado como cara-cara-sello o “ccs”. En estadística, sin embargo nos interesan los resultados numéricos, tal como el número de caras al lanzar una moneda tres veces. Ejemplo. Se tiene el experimento de lanzar una moneda tres veces. Sea la variable aleatoria: � = ú � � a) ¿Cuál es el conjunto de resultados posibles? b) Confeccionar la distribución de probabilidad: Resultados X (número de caras) Espacio Muestral Probabilidad Total 4 c) Representar gráficamente la distribución. Definición: Una variable aleatoria es un número que depende del resultado aleatorio de un experimento. Una variable aleatoria es una regla que asigna un valor numérico (sólo uno) a cada punto en el espacio muestral de un experimento aleatorio. Nota: normalmente se usan letras mayúsculas, y del final de abecedario, (X, Y, o Z) para denotar variables aleatorias. Ejemplo. Suponga que se aplicará una encuesta a los estudiantes de INACAP donde se preguntará por el número de cursos inscritos este semestre. Identifique la variable aleatoria de interés y enumere sus valores posibles. Variables aleatorias discretas Si la variable aleatoria es discreta la describimos según su distribución de probabilidades, que consiste en una lista de valores posibles de la variable y la proporción de veces que esperamos que ocurran. 5 La distribución de probabilidades de una variable aleatoria discreta X es una función (tabla o regla), denotada por p(x) o P [X=x], que asigna una probabilidad a cada valor posible de la variable aleatoria X. Propiedades de una función de distribución, los valores de las probabilidades están entre 0 y 1 para todo x Ejemplo. Modelo para el número de cuadernos en mochilas de estudiantes. Sea X una variable aleatoria que representa el número de cuadernos que llevan en la mochila los estudiantes de esta universidad: a) Describa la forma de la distribución 6 b) ¿Qué proporción de estudiantes llevan 3 o menos cuadernos (X ≤ 3)? c) ¿Qué proporción de estudiantes llevan más s de 2 cuadernos (X > 2)? d) ¿Qué proporción de estudiantes llevan entre 2,1 y 2,8 cuadernos (2,1 < X < 2,8)? e) ¿Qué proporción de estudiantes llevan entre 1 y 2 cuadernos? Ejercicio. Tamaño familiar Sea X el número de personas de hogares en el censo 2002 a) ¿Cuánto debe ser la probabilidad de que el tamaño familiar sea de 7 y más personas para que esta sea una distribución de probabilidades discreta legítima? b) Muestre gráficamente la distribución de probabilidades. 7 d) ¿Cuál es la probabilidad de que un hogar elegido al azar tenga un tamaño familiar de más de 5 personas? c) ¿Cuál es la probabilidad de que un hogar elegido al azar tenga un tamaño familiar de no más de 2 personas? e) ¿Cuál es P (2<X<4)? Media y desviación estándar de una variable aleatoria discreta: Si X es una variable aleatoria discreta que toma valores x1, x2, ... xk, con probabilidad p1, p2,... pk, entonces la media o el valor esperado de X está dado por: La varianza de X está dada por: Y la desviación estándar de X está dada por: 8 Ejercicio. Ingreso por cobre. En la tabla distribución de probabilidades que se presenta a continuación, se detalla los ingresos mensuales obtenidos por el cobre, expresado en miles de millones de pesos y la probabilidad asociada a cada monto. X p(x) $ 64 0,111 $ 172 0,278 $ 281 0,222 $ 390 0,167 $ 499 0,139 $ 608 0,083 a) ¿Cuál es la probabilidad de en un mes, obtener un monto de ingresos de $499? b) ¿Cuál es la probabilidad de en un mes, obtener un monto de ingresos menor a 281? c) ¿Cuál es la probabilidad de en un mes, obtener un monto de ingresos entre $172 y $499 (inclusive)? d) Calcule los valores esperados de los ingresos obtenidos por la exportación de cobre (� ± � , entonces, la esperanza o media es: 9 Distribución Binomial Cada ensayo de una distribución binomial termina en sólo un de dos resultados mutuamente excluyentes, uno de los cuales se identifica como éxito y el otro como fracaso, proviene de un ensayo Bernoulli. Sin embargo, se advierte que estos términos no tienen ninguna connotación de “bueno” o “malo”.  La probabilidad de éxito, p, para cada resultado permanece constante en un ensayo al siguiente, al igual que lo hace la de fracaso (1-p).  La probabilidad de éxito es independiente en cada ensayo  El experimento puede repetirse muchas veces La probabilidad de que de n número de individuos o unidades, un x número dado se obtiene mediante la siguiente expresión: Donde: n: tamaño de la muestra p: probabilidad de éxito q: probabilidad de fracaso = − La media y desviación estándar para esta distribución son: Media o valor esperado: � = ∗ Desviación estándar: � = √ La variación esperada en referencia al promedio es � ± � Ejemplo. Consideremos la siguiente situación, un funcionario de un municipio ha descubierto que el 10% de los proyectos no cuenta con la documentación completa. Se solicita al funcionario determinar la probabilidad de que en 20 proyectos seleccionados de manera aleatoria, 5 de los proyectos no cuenten con la documentación. También obtener el número esperado (media) de proyectos que no tengan la documentación completa y su variabilidad. Y además, determinar la probabilidad de que menos de tres proyectos en la muestra no cuenten con la documentación completa. 10 Variable: Recorrido: Parámetros: Ejemplo. En el último censo realizado el año 2012, la población de 5 años o más con un nivel educacional profesional (cursa actualmente o titulado), alcanza la cifra de 2.312.205 personas de un total de 15.429.759 personas, esto equivale a una proporción de 0,1499. En base a una muestra aleatoria de 35 personas ¿Cuál es la probabilidad de que en la muestra encontremos más de 4 personas con nivel profesional? Variable: Recorrido: Parámetros: 11 Ejercicios. 1. Consideremos la siguiente situación: un gerente de crédito de una empresa ha descubierto que el 10% de los usuarios de tarjeta no paga el monto completo de la deuda durante un mes dado. Desea determinar la probabilidad de que 20 cuentas seleccionadas de manera aleatoria, 5 de las cuentas no sean pagadas. Además, determine la probabilidad de que menos de tres personas no tengan la cuenta pagada. 2. De acuerdo con una información, el 40% de los estudiantes trabaja durante el verano para ganar dinero para la educación correspondiente al siguiente período. Si 7 estudiantes se seleccionan de forma aleatoria. ¿Cuál es la probabilidad de que a) 5 tengan trabajo en el verano? b) Ninguno trabaje? c) Todos trabajen? d) Más de tres trabajen? e) entre 2 y 4 trabajen (inclusive)? 3. Una de las medidas de control de calidad de un amortiguador para automóvil, es probarlo en los baches de la avenida Tobalaba, se encontró que el 20% de los amortiguadores sometidos a la prueba presentaban fuga de aceite y por lo tanto están defectuosos. Si se instalan 20 de estos amortiguadores, hallar la probabilidad de que, a) 4 estén defectuosos, b) más de 5 estén defectuosos. C) de 3 a 6 amortiguadores estén defectuosos. Distribución Hipergeométrica Si se selecciona una muestra sin reemplazo de una población finita y contiene una proporción relativamente grande de la población, de manera que la probabilidad de éxito sea perceptiblemente alterada de una selección a la siguiente, debe utilizarse la distribución Hipergeométrica. Si la población es pequeña y ocurre el muestreo sin reemplazo, la probabilidad de éxito variará. Si la probabilidad de un éxito no es constante, se ajusta a una distribución hipergeométrica. La función de probabilidad para la distribución es: Donde: N: es el tamaño de la población r: es el número de éxitos en la población n: es el tamaño de la muestra x: es el número de éxitos en la muestra 12 Ejemplo. 1. Supongamos que en un establo de caballos de carrera hay 10 caballos, y cuatro de ellos presentan una enfermedad. ¿Cuál es la probabilidad de seleccionar una muestra de 3 en la cual 2 caballos tengan la enfermedad? Variable: Recorrido: Parámetros: Ejemplo. Un fabricante de automóviles compra bombas de gasolina a una compañía que las fabrica bajo normas específicas de calidad. El fabricante recibe un lote de 100 bombas de gasolina para automóvil, selecciona cinco al azar y las prueba, si encuentra que a lo más una es defectuosa acepta el pedido, hallar la probabilidad de que lote sea rechazado si en realidad contiene 7 bombas defectuosas. Variable: Recorrido: Parámetros: 13 Ejercicios 1. En un examen de matemáticas en la cual se presentan 32 estudiantes se sospecha que hay tres suplantadores, el jefe de la academia decide tomar seis credenciales al azar para verificar la autenticidad de estas. ¿Cuál es la probabilidad de que se encuentren, a) a lo más dos suplantadores, b) dos suplantadores? 2. Se estima que 20 de cada 50 personas residentes en la delegación Iztacalco están en contra del cobro del nuevo impuesto para la adquisición de vehículo usados. Se entrevista a 15 personas y se les pide su opinión, ¿Cuál es la probabilidad de que a lo más 7 no estén a favor del nuevo impuesto? Distribución de Poisson Una variable aleatoria en la medición de la frecuencia relativa de un evento sobre alguna unidad de tiempo o espacio es la distribución de Poisson. Con frecuencia se utiliza para describir el número de llegadas de clientes por hora, número de accidentes industriales en cada mes, número de fallas en una línea eléctrica, y otras. Mide la probabilidad de un evento aleatorio sobre algún intervalo de tiempo o espacio. Son necesarios dos supuestos para la aplicación de la distribución.  La probabilidad de ocurrencia del evento es constante para dos intervalos de tiempo o espacio  La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro intervalo cualquiera La función de probabilidad de Poisson puede expresarse como: Donde: : es el número de veces que ocurre el evento �: es el número de ocurrencias promedio por unidad de tiempo Ejemplo. 14 Un profesor de estadística anima a sus estudiantes a consultar al Ayudante si tienen alguna pregunta mientras se preparan para una prueba. Parece que la llegada de estudiantes a la oficina del Ayudante tiene un promedio de 5,2 estudiantes cada 20 minutos. El profesor está preocupado porque si muchos estudiantes necesitan los servicios del Ayudante, puede resultar un problema de congestión. El Ayudante debe determinar la probabilidad de que cuatro estudiantes lleguen durante cualquier intervalo de 20 minutos, lo cual podría causar el problema de congestión. Si la probabilidad excede 0,20, se contratará un segundo Ayudante. ¿Es necesario hacer tal contratación? Ejemplo. Fallas en el sistema. Durante un día de trabajo típico de 8 horas, los computadores utilizados para vigilar el enfriamiento en la producción de neumáticos señala que la temperatura no se mantiene de forma apropiada en 30 oportunidades. El director ejecutivo, está por hacer una inspección de la planta durante 30 minutos. a) ¿cuál es la probabilidad de que esté allí cuando se active la señal de falla en dos ocaciones? b) ¿cuál es la probabilidad de que esté allí cuando se active la señal de falla en más de una ocación? 15 Ejercicios. 1. Supongamos que está interesado en la probabilidad de que exactamente 5 clientes lleguen durante la siguiente hora laboral. La observación simple de las últimas 80 horas ha demostrado que 800 clientes han entrado al negocio. 2. Considerado los datos del ejercicio anterior ¿Cuál es la probabilidad de que lleguen dos o menos personas? Y ¿Cuál es la probabilidad de que lleguen más de tres personas? 16 Ejercicios Distribuciones de Probabilidad Discretas 1.- Suponga que el número de autos que pasan por una estación de lavado un domingo asoleado entre las 4 y las 6 de la tarde tiene la siguiente distribución de probabilidades: a) complete la distribución de probabilidades. b) ¿cuál es la probabilidad de que al menos 6 autos van a pasar entre las 4 y las 6 de la tarde? c) ¿Cuál es el valor esperado de autos que pasan por la estación los domingos asoleados (E(X))? 2.- El número de camiones que llega durante una hora a una bodega sigue la distribución de probabilidad dada en la tabla: a) Determine e interprete el número esperado de camiones que llegan a la bodega durante una hora. b) Determine e interprete la varianza y desviación estándar de esta v.a. c) Calcule e interprete P ( x < 4). d) Calcule e interprete P( 1 < x < 4). e) Grafique la función de cuantía de esta variable aleatoria. 3. Todos los días se seleccionan, de manera aleatoria, 15 unidades de un proceso de manufactura con el propósito de verificar el porcentaje de unidades defectuosas en la producción. Con base en la información pasada, la probabilidad de tener una unidad defectuosa es de 0,05. La gerencia ha decido detener la producción cada vez que una muestra de 15 unidades tenga dos o más defectuosas. ¿Cuál es la probabilidad de que, en cualquier día se detenga la producción? 4. Un proceso de fabricación utilizado para hacer artefactos plásticos presenta una tasa de defectos de 5 por cada 100 unidades. Las unidades se envían a los distribuidores en lotes de 200. Si la probabilidad de que más de 3 salgan defectuosos supera el 30%, usted planea detener la fabricación. En base a la información decida. 5. Según una empresa, el 40% de los automóviles que circulan en la ciudad de Santiago contaminan el ambiente eliminando más cantidad de monóxido de carbono del permitido. Una comisión Municipal examina 10 automóviles. ¿Cuál es la probabilidad de que encuentre por lo menos dos infractores? 17 6. De acuerdo con una investigación, 1/3 de las empresas de un cierto país dan a sus empleados cuatro semanas de vacaciones después de 15 años de servicio. Encuentre la probabilidad de que entre las 6 compañías investigadas al azar, el número de ellas que les dan cuatro semanas de vacaciones de verano después de 15 años de servicio es: a) b) entre 2 y 5, menos de 3. 7. De acuerdo con un estudio publicado por un grupo de sociólogos, aproximadamente el 60% de los adictos al Valium, lo tomaron por primera vez debido a problemas psicológicos. Encuentre la probabilidad de los siguientes 8 adictos entrevistados a) b) exactamente 3 hayan comenzado a tomarlos debido a problemas psicológicos. al menos 5 de ellos comenzaran a tomarlos por problemas que no fueron psicológicos. 8. Un ingeniero de control de tráfico reporta que 75% de los vehículos que pasa por un punto de verificación tienen patentes del país. ¿Cuál es la probabilidad de que más de 4 de los siguientes 9 vehículos no sean del país? 9. Una fábrica observa que, en promedio, el 20% de las tuercas producidas por una máquina son defectuosas. Si se toman 10 tuercas al azar, hallar la probabilidad de que (a) exactamente 2 sean defectuosas, (b) 2 o más sean defectuosas y (c) más de 5 sean defectuosas. 10. La probabilidad de que un estudiante que ingresa a la Universidad se titule es de 0.4. Hallar la probabilidad de que entre 5 estudiantes elegidos al azar: (a) ninguno se titule, (b) al menos uno se titule y (c) todos se titulen. 11. Un agente de seguros contrata 5 pólizas con personas de la misma edad y de buena salud. Según las tablas en uso, la probabilidad de que un hombre de esa edad esté vivo dentro de treinta años es 2/3. Hallar la probabilidad de que dentro de treinta años vivan: (a) los 5, (b) al menos 3, (c) sólo 2 y (d) al menos uno. 12. Una encuesta de corretaje reporta que 30% de los inversionistas individuales, ha utilizado a un corredor de descuento; esto es, uno que no cobra las comisiones completas. En una muestra seleccionada al azar de nueve inversionistas, ¿Cuál es la probabilidad de que: a) exactamente dos de los individuos de la muestra hayan utilizado a un corredor de descuento? b) Exactamente cuatro de ellos hayan utilizado a un corredor de ese tipo? c) Ninguno haya recurrido a un corredor de descuento 18 13. Como subgerente de una empresa de materias primas, usted debe contratar 10 personas entre 30 candidatos, 22 de los cuales tienen títulos universitarios ¿cuál es la probabilidad de que 5 de los que usted contrate tengan un título? 14. De los 15 altos ejecutivos de un negocio de importaciones y exportaciones, se seleccionan 12 para ser enviados a un viaje para estudiar un nuevo proceso de producción. Ocho de los ejecutivos ya tienen algo de entrenamiento en el proceso. ¿Cuál es la probabilidad de que 5 de los enviados tengan algo de conocimiento sobre el proceso? 15. En un caso en Kansas City, tres mujeres entablaron una demanda en contra de una empresa, por discriminación. De las nueve personas que eran elegibles para un ascenso, cuatro eran mujeres. Tres de las nueve personas recibieron el ascenso; pero sólo una de ellas era mujer. Las tres otras mujeres elegibles demandaron. Una consideración importante en el caso, unida con la probabilidad de que las tres personas que recibieron ascenso sólo una mujer fueran seleccionadas por casualidad. Es decir, si el género no era un factor, ¿Cuál es la probabilidad de que no más que uno de los ascensos fuera designado mujer? Se puede concluir que existió discriminación. 16. Una compañía de pavimentación obtuvo un contrato para hacer mantenimiento de las vías. En las vías recientemente pavimentadas demostraron un promedio de dos defectos por Km, después de haber sido utilizadas durante un año. a) ¿Cuál es la probabilidad de que se presenten tres defectos en cualquier Km de las vías después de haber tenido tráfico durante un año? b) ¿Cuál es la probabilidad de que se presenten menos tres defectos en cualquier Km de las vías después de haber tenido tráfico durante un año? c) ¿Cuál es la probabilidad de que se presenten tres o más defectos en cualquier Km de las vías después de haber tenido tráfico durante un año? 17. A un computador de la oficina principal de una compañía llegan llamadas a un promedio de dos por minuto. Si el operador está distraído por un minuto, cuál es la probabilidad de que el número de llamadas no respondidas sea: i) Cero ii) Por lo menos una iii) Entre tres y cinco, inclusive 18. ¿Cuáles serían las probabilidades si el operador se distrae por 4 minutos? 19 VARIABLES ALEATORIAS CONTINUAS Sea X una variable aleatoria continua, es decir, asigna valores de los números reales, a los elementos del espacio muestral, se da como característica importante en este caso que la variable puede tomar infinitos valores, y además la probabilidad representa el área bajo la curva que genera la función de probabilidad, por lo tanto, el área bajo la curva en un punto del eje de los Reales, exactamente en un solo punto del eje, es cero. Por lo tanto la probabilidad de que X tome valores específicos es cero. La Distribución de probabilidad para una variable aleatoria X continua, se llama Función de Densidad de Probabilidad (f.d.p): f(x), y representa P(a  X  b) , es decir el área bajo la curva entre a y b. P(a  X  b)   f ( X )dx b a La distribución exponencial: La distribución de Poisson es una distribución discreta que mide el número de ocurrencias sobre algún intervalo de tiempo o espacio. Describe por ejemplo, el número de clientes que pueden llegar durante un determinado tiempo. Por el contrario la distribución exponencial es una distribución continua. Mide el paso del tiempo entre tales ocurrencias. Mientras que la distribución de Poisson describe las tasas de llegadas dentro de algún período dado, la distribución exponencial estima el lapso entre tales arribos. Si el número de ocurrencias tiene distribución Poisson, el lapso entre las ocurrencias estará distribuido exponencialmente. La probabilidad de que el lapso sea menor o igual a cierta cantidad x es: P X Donde: x: es el lapso de tiempo µ: es la tasa promedio de ocurrencia x = − e−μ∙x La distribución de la variable aleatoria exponencial se muestra en la figura siguiente, es una curva descendente, indica que con el paso del tiempo x aumenta y la probabilidad disminuye. 20 Por ejemplo: la probabilidad de que pasen 30 minutos entre ocurrencias excede la probabilidad de que pasen 40 minutos. Esto se debe a que siempre deben pasar 30 minutos antes que pasen 40. Ejemplo. 1. Una compañía programa sus taxis para que lleguen al aeropuerto local en una distribución de Poisson con una tasa promedio de llegada de 12 por hora. Usted acaba de aterrizar en el aeropuerto. ¿Cuál es la probabilidad de que usted tenga que esperar máximo 5 minutos para conseguir un taxi? Distribución Uniforme Es una distribución en la cual las probabilidades de todos los resultados son las mismas. Por ejemplo el experimento de lanzar un dado (1/6). La figura siguiente muestra una distribución uniforme en la cual todos los resultados sobre el rango son igualmente probables, desde el mínimo a hasta el máximo b. 21 La media o valor esperado de una distribución uniforme está en la mitad de camino entre sus puntos extremos, así: + =�= La varianza es: � = − 2 El área total bajo la curva, como en el caso de todas las distribuciones de probabilidad es 1. Entonces: � Donde − es el ancho o rango de la distribución. La probabilidad de: Ejemplo. � = − = − − Suponga que los contenidos de las latas de 160 grs. de fruta producidas por Del Monte oscila entre 145 y 175 grs. y se ajusta a una distribución uniforme. Obtenga la media y la altura. Además, se desea saber cuál es la probabilidad de que una lata pese entre 160 y 172 grs. 22 Distribución Normal Existe una distribución de frecuencias teórica llamada distribución normal, que puede considerarse como modelo adecuado para la distribución de un gran número de variables en el campo biológico.  Notación: X media ~ N (  ,  ) se lee: X es una variable aleatoria continua con distribución Normal, con y desviación estándar  . La función densidad de una variable aleatoria Normal está dada por: f ( x)  2 1 e  x     2 2 2 , -   x  , -     ,   0 Punto de inflexión    Características:  Su gráfico semeja una campana simétrica, cuyas colas se extienden hacia el infinito tanto en dirección negativa como en la positiva.  El promedio, la mediana y la moda de la distribución tienen el mismo valor.  La distribución queda completamente definida por el promedio y la desviación estándar. El promedio nos informa sobre la posición o ubicación de la distribución en el eje horizontal y la desviación estándar refleja la dispersión de los valores con respecto al promedio. 23 Distribución #3: Normal con media 80 Desviación estándar 5 Distribución #1: Normal con media 50 Desviación estándar 10 20 30 40 Distribución #2: Normal con media 80 Desviación estándar 10 50 60 70 80 90 100 Los puntajes del test de inteligencia para niños WISC (Weschler Intelligence Scale for Children) siguen una distribución Normal con media 100 y desviación estándar de 15 (http://nicologic.free.fr/FAQ.htm). Nos interesa saber ¿qué proporción de niños tendrán un CI menor que 130? Cálculo de áreas de una Distribución Normal: Definición: Si X ~ N ( ,  ) , la variable normal estandarizada es: Z  X   y tiene distribución Normal con media cero y varianza igual a uno: Z ~ N (0,1) Para cualquier distribución Normal se cumple que:    68,3% de las observaciones se encontrarán a una desviación estándar de la media 95,4% de las observaciones se encontrarán a dos desviaciones estándar de la media 99,7% de las observaciones se encontrarán a tres desviaciones estándar de la media Aunque teóricamente la distribución llega a - y a +, en la práctica es muy raro encontrar valores a más de 3 desviaciones estándar del promedio. 24 Ejemplo. Uso tabla distribución Normal estándar ∼� , : a) Calcula el área que se encuentra a la izquierda de z = 1,56 b) Calcula el área que se encuentra a la derecha de z = 1,09 (complemento) c) Calcula el área que se encuentra a la izquierda de z = -0,89 (complemento) d) Encuentre el área (probabilidad) de la distribución Normal estándar entre z = 0 y z =2,32 ∼� , que se encuentra e) Encuentre el área (probabilidad) de la distribución Normal estándar entre z = -2,07 y z =1,96 ∼� , que se encuentra 25 Ejemplo. De acuerdo a los resultados de la Encuesta Suplementaria de Ingresos 2010-2011 dada a conocer por el Instituto Nacional de Estadísticas (INE), el ingreso medio mensual per cápita de los ocupados es de $ 360.300 con una variación típica $ 55.200. a) ¿Cuál es la probabilidad de seleccionar una persona al azar y que su ingreso se encuentre entre $ 300.00 y $ 450.000 pesos? b) ¿Cuál es la probabilidad de seleccionar una persona al azar y que su ingreso sea $ 490.000 o más? c) Determine el monto del ingreso para definir al quinto quintil de los ocupados (acumula el 80% de la distribución) 26 Ejercicio. La pirámide poblacional de nuestro país presenta un promedio poblacional de � = , años y una desviación estándar de � = , , si consideramos que nuestro país presenta un distribución Normal en la edad ¿Cuáles sería los valores para los cuartiles? Ejercicios Distribuciones de Probabilidad Continuas 1.- los aviones llegan al aeropuerto, en proporción de dos por hora. Tomará una hora en reparar una rampa utilizada para desembarcar pasajeros. ¿Cuál es la probabilidad de que un avión llegue mientras que la rampa esté en reparación? 2.- El computador principal de una universidad queda fuera de servicio tres veces por semana. Un profesor debe completar un proyecto esta semana requiere del computador. ¿Cuál es la probabilidad de que el computador esté fuera de servicio toda la semana? 3.- En el ejercicio 2, ¿cuál es la probabilidad de que el computador esté fuera de línea por cualquier período de dos semamas? 27 4.- Durante un día de trabajo típico de 8 horas, los computadores utilizados para vigilar el enfriamiento en la producción de neumáticos señala que la temperatura no se mantiene de forma apropiada en 30 oportunidades. El director ejecutivo, está por hacer una inspección de la planta durante 30 minutos. ¿cuál es la probabilidad de que esté allí cuando se active la señal de falla? 5. Una compañía produce fertilizantes para césped, este tipo de fertilizante se vende en bolsas con un peso distribuido uniforme, con media de 25 kg. y un rango de 2,4 kg. Un cliente requiere 25 kg. exactos de fertilizante, pero duda si comprar sólo una bolsa. También tiene la curiosidad sobre la probabilidad de comprar una bolsa con más de 25,5 kg. 6. Generalmente, a un estudiante le toma entre 1,2 y 1,7 horas hacer su tares de estadística. Los tiempos están distribuidos de manera uniforme. ¿Qué tan probable es que termine a tiempo para reunirse son sus amigos en 1,4 horas? 7. El tiempo requerido para conseguir una pista en un local de bowling oscila entre 23,5 y 40,5 minutos. Si la probabilidad de que usted tenga que esperar más de 30 minutos excede del 60%, usted piensa jugar golf. Que decide usted. 8. Debido a que decidió jugar golf, usted aprende que el tiempo promedio para jugar 18 hoyos en esta cancha es de 4,2 horas. La persona que completó este trayecto más rápidamente lo hizo en 2,9 horas. ¿Cuál es la probabilidad de que usted termine antes de 4 horas? N 100, 15 9. Suponga que definimos a X como los puntajes de CI del test de inteligencia WISC, con distribución a) ¿Qué proporción de niños tendrá un CI menor a 85? b) ¿Qué proporción de niños tendrá un CI mayor a 85? c) ¿Qué proporción de niños tendrá un CI entre 85 y 115? 10. Continuando con el modelo N 100, 15 para el puntaje de CI para niños, considere la siguiente pregunta: ¿Qué puntaje de CI debe tener un niño para ubicarse entre el 1% con más alto puntaje? 11. El tiempo que demoran los nadadores de 100 metros estilo libre sigue una normal con media 55 segundos y desviación estándar de 5 segundos. a) Los organizadores de un campeonato deciden dar certificados a todos los nadadores que terminen antes de 49 segundos. Si hay 50 nadadores en los 100 metros mariposa, ¿cuántos certificados se necesitarán? 28 b) ¿Con qué tiempo debe terminar un nadador para estar entre el 2% más rápido de la distribución de tiempos? 12. Sea X es N 3, 2 : a) b) c) d) Muestre gráficamente esta distribución en particular Encuentre el rango entre cuartiles de la distribución Encuentre P( X  3) Encuentre P( X  3) 13. Una fábrica produce pistones cuyos diámetros se encuentran adecuadamente clasificados por una distribución normal con un diámetro promedio de 5 cm y una desviación estándar de 0,001 cm. Para que un pistón sirva su diámetro debe encontrarse entre 4,998 y 5,002 cm. Si el diámetro del pistón es menor que 4,998 se desecha; si es mayor de 5,002 el pistón puede reprocesarse. Determinar: a) b) c) ¿Qué % de pistones servirá? ¿Qué % será desechado? ¿Qué % será reprocesado? 14. Se sabe que en primavera las enfermedades respiratorias se distribuyen normalmente con una media de 500 personas y una desviación estándar de 40 personas en una ciudad determinada. Hallar la probabilidad que en esa ciudad entre 280 y 380 personas se contagien con la enfermedad en primavera. 15. En un estudio de conejos se observó durante 5 minutos un número de peleas con una desviación estándar igual a 3,3. Si se supone que las peleas se distribuyen normalmente y además se sabe que a lo más en 15 peleas se obtienen un 89% de las peleas. Hallar el número medio de peleas en las familias de conejos. 16. El proceso de empaque de una compañía productora de cereales para el desayuno ha sido ajustado para que cada paquete contenga un promedio de 13,0 onzas de cereal. La desviación estándar de peso neto es de 0,1 oz, y se sabe que la distribución es normal, determine: a) La probabilidad de que un paquete elegido al azar contenga entre 13,0 y 13,2 oz de cereal. b) ¿Cuál es la probabilidad de que el peso del cereal exceda de 13,25 oz? c) ¿Cuál es la probabilidad de que el peso del cereal se halle entre 12,9 y 13,1 oz? 29 Ejercicios Propuestos (con solución): 1. Estudiemos el modelo para el número de cuadernos en las mochilas de estudiantes. Sea X una variable aleatoria que representa el número de cuadernos que llevan los estudiantes de esta Universidad: x P(x) a) b) c) d) e) 0 0,5 1 0,2 2 0,2 3 0,1 Describir la forma de la distribución, de manera gráfica. ¿Qué proporción de estudiantes llevan 3 o menos libros? ¿Qué proporción de estudiantes llevan más de 2 libros? ¿Qué proporción de estudiantes llevan entre 2,1 y 2,8 libros? ¿Qué proporción de estudiantes llevan entre 1 y 2 libros (inclusive)? 2. En un estudio de reconocimiento de la marca Sony se entrevistaron grupos de cuatro consumidores. Si x es el número de personas en el grupo que reconocen la marca Sony entonces x puede ser 0, 1, 2, 3 o 4, y las probabilidades correspondientes son 0,0016; 0,0250; 0,1746; 0,3892 y 0,4096. ¿Será infrecuente seleccionar al azar a cuatro consumidores y descubrir que ninguno de ellos reconoce la marca Sony? ¿Cuál es la cantidad esperada de personas que reconocen la marca? � 3. Determine si = con x= 1, 2, 3, 4 es una función de probabilidad. Verifique las propiedades que debe cumplir. Uno de los requisitos de una distribución de probabilidad es que la suma de las probabilidades debe ser 1 (se permite una pequeña cantidad de variación por errores de redondeo). ¿Cuál es la justificación de este requisito? 4. En el informe del Mapa Socioeconómico de Chile elaborado por Adimark aparece la distribución de número de bienes en el hogar (Ducha + TV color + Refrigerador + Lavadora + Calefont + Microondas + TV Cable o Satelital + PC + Internet + Vehículo) X P(x) a) b) c) d) e) f) 0 0,038 1 0,057 2 0,056 3 0,091 4 0,152 5 0,189 6 0,150 7 0,103 8 0,072 9 0,051 10 0,042 ¿Cuál es la probabilidad de encontrar un hogar con menos de 4 bienes? ¿Cuál es la probabilidad de encontrar un hogar con más de 7 bienes? ¿Cuál es la probabilidad de encontrar un hogar con 5 o más y menos de 9? Calcule el valor esperado de la variable aleatoria de interés, interprete el resultado. Obtenga la variabilidad. Represente gráficamente la distribución. 5. En la tabla distribución de probabilidades que se presenta a continuación, se detalla número de artículos con fallas, en un embarque de 10.000 unidades de ese producto electrónico importado desde China y la probabilidad respectiva. 30 N° de artículos con falla Probabilidad 3 0,111 4 0,278 5 0,222 6 0,167 7 0,139 8 0,083 Determine el intervalo de los ingresos esperados (�±. � . 6. Un trabador asigna un beneficio de carácter vitalicio a cinco personas. Según las tablas actuales, la probabilidad de que una persona en estas condiciones viva 30 años o más es 2/3. Hállese la probabilidad de que, transcurridos 30 años, vivan: a) b) c) d) Las cinco personas. Al menos tres personas. Exactamente dos personas. Menos de dos personas. 7. En un sector de la ciudad de Santiago, se han otorgado subsidios de agua con anterioridad alcanzando a un 25% de la población, si se extrae una muestra aleatoria de 10 familias. a) ¿Cuál es la probabilidad de que exactamente en tres familias hayan recibido el subsidio? b) ¿Cuál es la probabilidad de que por lo menos una familia haya recibido el subsidio? 8. El IPEC de abril muestra que se mantiene el buen ánimo de los consumidores. Este resultado, además, se ubica como uno de los niveles más altos de los últimos 16 años, señala que el 59,4%, de los chilenos considera que nuestro país presenta actualmente una situación económica buena. Determine la probabilidad de en una muestra de 30 personas entre 13 y 15, consideren una “buena situación económica” nacional. 9. Al analizar los impactos de las bombas V-1 en la Segunda Guerra Mundial, el sur de Londres se subdividió en 576 regiones, cada una con área de 0,25 km2. En total, 535 bombas impactaron el área combinada de 576 regiones. Si se selecciona al azar una región, calcule la probabilidad de que haya sido impactada en dos ocasiones o menos. 10. El número promedio de goles de un equipo de fútbol de Inacap durante el primer tiempo de un partido de futbol es 1,67. Calcule la probabilidad de que pasen 2 goles en ese tiempo. 11. Un asistente comercial atiende en promedio a 5 personas por hora. ¿Cuál es la probabilidad de que en una determinada hora atienda a más de 7 personas? Además, calcule la desviación estándar. 12. Una compañía “asegura” la vida de 5000 personas mayores de 50 años. La probabilidad de que una persona de 50 años muera en un determinado año es de 0,001. ¿Cuál es la probabilidad de que la compañía pague 4 indemnizaciones en un determinado año? 13. Calcular las probabilidades de la variable aleatoria , con una distribución normal ~� , 31 a) b) c) d) e) f) � , � > , � � , � , � − , , − , 14. Si � es una variable aleatoria distribuida normalmente con media 80 y desviación estándar 10, calcular las siguientes probabilidades a) b) c) d) e) f) � P P P P P X X> X <X< X> X 15. Los administrativos de la municipalidad de Rioseco ganan en promedio un sueldo líquido de $650.000 mensuales, con una desviación estándar de $100.000, que se distribuye de forma Normal. Calcular la probabilidad de que un empleado elegido aleatoriamente gane: a) b) c) d) e) f) g) h) i) j) k) l) Un sueldo mayor a $850.000 Un sueldo de $750.000 Un sueldo superior a $450.000 Un sueldo entre $550.000 y $950.000 Un sueldo inferior a $650.000 � �> . � � . � . � . � . <�< . ¿Cuál es el monto de sueldo que concentra el primer quintil? ¿Cuál es el monto de sueldo que concentra el 10% de suelos más altos? ¿Cuáles son los valores que concentran el 50% en torno a la media? 16. En una ciudad se estima que la temperatura máxima en el mes de abril sigue una distribución normal, con media 23° y desviación típica 5°.Calcular el número de días del mes en los que se espera alcanzar máximas entre 21° y 27°. (Considere un mes=30 días). 17. La media de los pesos de 500 estudiantes de primero a cuarto medio es 70 kilogramos y la desviación típica 5,5 kilógramos. Suponiendo que los pesos se distribuyen normalmente. Construir la siguiente clasificación y determinar el número de estudiantes que pertenecen a cada uno de las categorías para determinar el gasto en un plan de salud: 32 Bajo peso: menos de 61,2 kilogramos Peso normal: entre 61,2 y 77,2 kilogramos Sobre peso: más de 77,2 kilogramos El plan de salud que desea desarrollar una institución de ayuda tiene los siguientes costos, debe invertir $50.000 por cada estudiante en categoría bajo peso para su recuperación y $ 90.000 por cada estudiante con sobre peso. El departamento de asistencia social cuenta con $5.000.000 de presupuesto destinado a este colegio. ¿Es suficiente el monto para activar el plan? 18. Se supone que los resultados de un examen siguen una distribución normal con media 78 y varianza 36. Se pide: a) ¿Cuál es la probabilidad de que una persona que se presenta el examen obtenga una calificación superior a 72? b) Si se sabe que con 64 puntos un estudiante obtiene nota de aprobación. Calcule la proporción de estudiantes que tienen puntuaciones que exceden por lo menos en cinco puntos de la puntuación que marca la frontera entre aprobado y no aprobado. 19. Los puntajes de una prueba de concentración tienen una puntuación que sigue una distribución normal, con media 100 y desviación típica 15. Determinar el porcentaje de población que obtendría un puntaje entre 95 y 110. 20. Se supone que el nivel de colesterol de los enfermos de un hospital sigue una distribución normal con una media de 179,1 mg/dL y una desviación estándar de 28,2 mg/dL. a) Calcule el porcentaje de enfermos con un nivel de colesterol inferior a 169 mg/dL. b) ¿Cuál será el valor del nivel de colesterol a partir del cual se encuentra el 10% de los enfermos del hospital con los niveles más altos? 21. El tiempo que demoran los nadadores de 100 metros estilo libre sigue una normal con media 55 segundos y desviación estándar de 5 segundos. a) Los organizadores de un campeonato deciden dar certificados a todos los nadadores que terminen antes de 49 segundos. Si hay 50 nadadores en los 100 metros mariposa, ¿cuántos certificados se necesitarán? b) ¿Con qué tiempo debe terminar un nadador para estar entre el 2% más rápido de la distribución de tiempos? 33 Soluciones 1. a) P(x) 0,6 0,4 P(x) 0,2 0 0 b) c) d) e) 1 2 3 , , 2. x p(x) 0 0,0016 1 0,025 2 0,1746 3 0,3892 4 0,4096 Es improbable la situación planteada (0,0016), La esperanza es 3,18 personas. 3. Si la suma es 1, es una propiedad de las probabilidades, la suma de todos los sucesos debe ser igual a 1, es decir el evento seguro o espacio muestral. 4. a) b) c) d) e) f) , , , = , . á = , 34 P(x) 0,2 0,15 0,1 P(x) 0,05 0 0 5. 6. [ , ; , ] 9. 10. 11. 12. 13. 14. a) b) c) d) a) b) 7. 8. 1 , 2 3 4 5 6 7 8 9 10 , , , , , , , , , , a) b) c) d) e) f) a) b) c) d) e) f) , , , . . . , , , , , , 35 g) , h) , i) , j) , k) , l) , m) , n) , o) , p) $ q) $ r) $ 15. . . . $ . 16. 0,4436*30= 13,308 días 17. 18. Bajo 27, Normal 425, Sobre 48; No es suficiente, el necesario es 5.670.000 a) , b) , 19. 20. 21. , a) , b) , a) 6 certificados b) 44,7 segundos 36