Unidad 4 - Es

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 96

UNIDAD 4

VARIABLES
ALEATORIAS Y
DISTRIBUCIONES DE
PROBABILIDAD

Docente: Mgtr. Vilma Duchi F.


VARIABLES ALEATORIAS

Se llama variable aleatoria a toda función que asocia


a cada elemento del espacio muestral, un número
real.

Se utilizan letras mayúsculas para designar las


variables aleatoria: X, Y, Z; y sus respectivas letras
minúsculas para los valores concretos de las
mismas: x, y, z.
VARIABLES ALEATORIAS
los experimentos aleatorios son tales que los resultados a que dan lugar pueden ser de naturaleza cualitativa o
cuantitativa. así por ejemplo, serían resultados cualitativos los derivados de los siguientes experimentos aleatorios:

• El lanzamiento de una moneda: cara o cruz.

• La calidad de las piezas fabricadas en una planta: buenas o defectuosas.

•La preferencia de una persona sobre tres tipos de coches: prefiere el coche a, el coche B o el coche c, etc.

otros ejemplos de experimentos aleatorios cuyos resultados son cuantitativos serían:

• el número de accidentes de automóvil en una ciudad en un mes dado.

• el número de clientes que llegan a un comercio durante una hora.

• el número de errores detectados en la contabilidad de una empresa.

• la suma de los puntos que aparecen cuando se lanzan simultáneamente dos dados, etc.
VARIABLES ALEATORIAS DISCRETAS: son aquellas que solo pueden
tener un valor entero (fijo) no son susceptibles de dividirse o asumir un
valor entre dos valores fijos. Ejemplo: Número de consultas diarias Es la
que solo puede tomar una cantidad numerable de valores o
valores específicos.

VARIABLES ALEATORIAS CONTINUAS: son aquellas que pueden


tomar un número infinito de valores dentro de un rango determinado.
Ejemplo: El peso de una persona podría ser 80.5; 80.52; 80,525,…
dependiendo de la precisión de la báscula, otro ejemplo podría ser la
distancia recorrida en km desde las viviendas de las comunidades hasta el
centro de salud más cercano.
ACTIVIDAD
Clasificar como discretas o continuas las siguientes variables
aleatorias:

 nº de páginas de un libro
 tiempo que tarda en fundirse una bombilla
 nº de preguntas en una clase de una hora
 cantidad de agua consumida en un mes
DISTRIBUCIÓN DE
PROBABILIDAD
EJEMPLO 1
Si el experimento consiste en lanzar un dado.

Analizamos el espacio muestral que sería:

La probabilidad de obtener cada uno de los


resultados del experimento (elementos del
espacio muestral) es 1/6
EJEMPLO 2
EJEMPLO 2
Distribución de Probabilidad Discreta.

 
La distribución binomial es una generalización de la
distribución de Bernulli.
Ejemplos:
- Al nacer un bebé puede ser varón o mujer.
- Un equipo de baloncesto puede ganar o perder.
- En un test psicotécnico hay peguntas de verdadero o falso,
es decir sólo hay dos alternativas.
- Un tratamiento médico, como por ejemplo la vacuna de la
gripe A,    puede ser efectivo o inefectivo.
- El objetivo de ventas al año de coches en un concesionario
se puede o no lograr
Probabilidad de éxito

Para conocer la probabilidad de “éxito” es necesario calcular las posibles combinaciones


de la variable, y multiplicarlas por las probabilidades de cada suceso:
Ejemplo
 Hay que tomar en cuenta que siempre la probabilidad debe
estar en un rango de 0 a 1.
Distribución de Poisson
 
Requisitos para que sea variable de
Poisson
 Sucesos aleatorios
 Los sucesos que ocurren en un intervalos dado
deben de ser independientes. Ejemplo
probabilidad que un estudiante se contagie con
gripe. Este caso es dependiente y no se aplicara la
distribución de poisson. En el ejercicio anterior
son totalmente independientes pero si estudiamos
de enfermedades contagiosas son dependientes.
ACTIVIDAD EN CLASE
 Resolver los siguientes problemas aplicando
la distribución binomial y la distribución de
poisson según sea el caso.
Si un banco recibe en promedio 6 cheques sin
fondo por día, ¿cuáles son las probabilidades de
que reciba, a) cuatro cheques sin fondo en un día
dado, b) 10 cheques sin fondos en cualquiera de
dos días consecutivos?
ejercicios

En la inspección de hojalata producida por un


proceso electrolítico continuo, se identifican 0.2
imperfecciones en promedio por minuto.
Determine las probabilidades de identificar a)
una imperfección en 3 minutos, b) al menos dos
imperfecciones en 5 minutos, c) cuando más una
imperfección en 15 minutos.
DISTRIBUCIÓN DE VARIABLES ALEATORIAS
CONTINUAS
DISTRIBUCIÓN DE PROBABILIDAD NORMAL

 Se utiliza en variables aleatorias continuas como:


 Caracteres morfológicos de individuos (personas, animales,
plantas,…) de una especie (tallas, pesos, diámetros, perímetros,
…)
 Caracteres sociológicos, por ejemplo; consumo de cierto
producto por un mismo grupo de individuos, puntuaciones de
examen, …
 Caracteres fisiológicos, por ejemplo: efecto de una misma dosis
de un fármaco.
DISTRIBUCIÓN DE VARIABLES ALEATORIAS
CONTINUAS
La distribución de probabilidad normal y su correspondiente curva normal tiene las
siguientes características:

● 1. La curva normal es acampanada y presenta un solo pico en el centro de la


distribución. La media aritmética, la mediana y la moda de la distribución son
iguales y están localizadas en el pico. De esta forma, la mitad del área bajo la
curva se encuentra por arriba de este punto central, y la otra mitad por abajo.
● 2. La distribución de probabilidad normal es simétrica con respecto a su media. Si
se corta la curva normal verticalmente en ese valor central, ambas mitades serán
como imágenes en el espejo.
● 3. La curva normal decrece uniformemente en ambas direcciones a partir del
valor central. Es asintótica, esto significa que la curva se acerca cada vez al eje X,
pero en realidad nunca llega a tocarlo. Esto es, los puntos extremos de la curva se
extienden indefinidamente en ambas direcciones
Ejemplo: Distinción entre una muestra de una
distribución muestral y de
una población
actividad
Distribución de probabilidad normal o estándar
ACTIVIDADES
ACTIVIDADES
PROBLEMAS
DISTRIBUCIÓN DE POISSON
APLICACIÓN DE LA DISTRIBUCIÓN BINOMIAL, POISSON Y NORMAL
EN EXCEL

La probabilidad de que un satélite, después de colocarlo en órbita, funcione de manera


adecuada es de 0.45. Supóngase que 5 de estos se colocan en órbita y operan de manera
independiente.
a. ¿Cuál es la probabilidad de que exactamente 3 funciones adecuadamente?
b. Al menos 3 funcionen correctamente.
c. Cuando mucho 3 funcionen correctamente
d. La mayoría funcione correctamente.
Distribución de Poisson

Supongamos que en el cruce transitado en el control Sur ocurren de manera aleatoria e


independiente 2 accidentes por Semana, Determine:
a. La probabilidad de que ocurran 3 accidentes por semana
b. La Probabilidad de que ocurran 4 accidentes por semana
c. La probabilidad de que ocurran cuando mucho 5 accidentes por semana.
Distribución Normal
actividad

Si un banco recibe en promedio 6 cheques sin


fondo por día, ¿cuáles son las probabilidades de
que reciba, a) cuatro cheques sin fondo en un día
dado, b) 10 cheques sin fondos en cualquiera de
dos días consecutivos?
Problemas para determinar entre 0 y z
● Calcula la probabilidad de que unas cajas de cereales pesen
entre 283 y 285,5 gramos, considere que el peso de la caja tiene
una distribución normal con una media de 283 gramos y una
desviación estándar de 1,6g.
Problemas Propuestos

El ingreso medio semanal de un supervisor de turno de la


industria de vidrio tiene una distribución normal, con una media
de 1000 y una desviación estándar de $100 ¿Cuál es la
probabilidad de seleccionar a un supervisor cuyo ingreso sea
menor a $790?.
Actividad en Clase
Área bajo la Curva

El área total bajo cualquier curva normal representa el 100% de la probabilidad


relacionada con dicha variable. Además, como la curva es simétrica respecto a su
media, la probabilidad de obtener un valor menor que la media es del 50%
Calcular el área bajo la curva de
Área bajo la Curva

Las tres áreas de distribución normal más utilizadas son las siguientes:
● 1. Aproximadamente 68% del área bajo la curva normal está entre la media
más uno y menos una desviaciones estándar, y se expresa μ ±⁡1σ
● 2. Alrededor de 95% del áreas bajo la curva normal está entre la media más
dos y menos dos desviaciones estándar, lo que se expresa μ ±⁡2σ
● 3. Prácticamente toda el área bajo la curva norma está entre la media y tres
desviaciones estándar (a uno y otro lados del centro), es decir μ ±⁡3σ
REGLA EMPÍRICA O
REGLA 68/ 95/99,7
Es muy útil en las distribuciones simétricas puesto que
nos permite hacer el cálculo en el recorrido de la
variable a partir de la media y la desviación estándar.
REPRESENTACIÓN GRÁFICA

El 68% se encuentran a mas o menos una


desviación estándar de la media ……..
EJEMPLOS:

SE TOMA UNA MUESTRA DE POBLACIÓN DE NOTAS DE 0


A 20 Y SE HA OBTENIDO COMO MEDIDAS DE RECUMEN
LA MEDIA ARITMÉTICA Y COMO MEDIDA DE DISPECIÓN
LA DESVIACIÓN ESTÁNDAR.
PARA UNA MUESTRA FUE

APLIQUE LA REGLA Y ENCUETRE El PORCENTAJE DE


LOS VALORES EN LOS QUE SE ENCUENTRAN LOS
DATOS.
EJERCICIOS EN CLASE

Una maquina embotelladora de refrescos llena automáticamente envases con bebidas gaseosas. se sabe que la
distribución de las botellas se comporta como campana y además, el contenido promedio de las botellas es 375cc
con õ= 4,3 cc 
 la directora de producción desea saber con mayor exactitud entre que rangos de llenado estan quedando las
botellas de bebida.

aplicando la regla empírica, determina los siguientes valores: 

(x-s, x+s)
(x-2s, x+2s)
(x-3s, x+3s)
¿Para qué sirve la Regla Empírica?
https://calculo.cc/temas/temas_estadistica/muestreo/problemas/prob_tama.html
¿Para qué sirve la Regla Empírica?

● La regla empírica es una manera rápida y práctica de analizar datos


estadísticos, siendo cada vez más confiable en la medida en que la
distribución se acerca a la simetría.
● Su utilidad depende del campo en que se use y de las preguntas
que se presenten. Es muy útil saber que es casi improbable la
ocurrencia de valores de tres desviaciones estándar por debajo o
por encima de la media, incluso para las variables de distribución
no normal, al menos el 88.8% de los casos está en el intervalo de
tres sigma.
APLICACIÓN

1. En una reserva de fauna silvestre se estima que hay un promedio


de 16.000 conejos con una desviación estándar de 500 conejos. Si se
desconoce la distribución de la variable ‘número de conejos en la
reserva’, ¿es posible estimar cuál es la probabilidad de que la
población de conejos esté entre 15.000 y 17.000 conejos?
APLICACIÓN

2. El peso promedio de niños de un año en un país se distribuye


normalmente con una media de 10 kilogramos y una desviación
estándar de aproximadamente 1 kilogramo.
a) Estimar el porcentaje de niños de un año en el país que tienen un
peso promedio entre 8 y 12 kilogramos.
b) b) ¿Cuál es la probabilidad de hallar un niño de un año de 7
kilogramos o menos de peso?
c) Si la población del país alcanza 50 millones de habitantes y los
niños de 1 año representan el 1% de la población del país,
¿Cuántos niños de un año tendrán un peso entre 9 y 11
kilogramos?
APLICACIÓN

● De una muestra de 50 alumnos que presentaron un determinado examen, los


resultados se presentan en la siguiente tabla: Utilice la regla empírica para representar
los diferentes porcentajes
ACTIVIDAD
Haga uso de la regla empírica para representar el porcentajes de valores de la
siguiente tabla:
TEORMA DEL LIMITE CENTRAL

2. Si se cumple el teorema de limite central, a continuación se exponen


algunos definiciones de diferentes autores
Se cumple, cuando independientemente de la población de origen, la distribución de la
medias aleatorias se aproxima a una distribución normal a medida que el tamaño de la
muestra crece .( Bencardino,321:2.000)

Al hacerse lo bastante grande el tamaño de la muestra la distribución de muestreo de


la media puede aproximarse mediante la distribución normal. Esto es cierto no importa
la forma de la distribución de los valores individuales de la población.

Para la mayoría de distribuciones de la población, sin importar la forma , la


distribución de muestreo de la media tendrá una distribución aproximadamente normal
si se seleccionan muestras de al menos 30 observaciones.(Berenson y Levine:
1996:329)
TEORMA DEL LIMITE CENTRAL
1.4.DISTIBUCION DE MUESTREO

El termino distribución muestral se refiere


a la función de probabilidad (o de densidad de probabilidad) de un estadístico.
Por tanto, una distribución muestral puede quedar definida como una distribución
teórica que asigna una probabilidad concreta a cada uno de los valores que
puede tomar un estadístico en todas las muestras del mismo tamaño que es
posible extraer de una determinada población.
(Pardo Merino 2002)

Histograma
30

UNA MUESTRA ALEATORIA DE TAMAÑO n 20

DE UNA POBLACIÓN ƒ(x), ES UNA


COLECCIÓN DE n VARIABLES ALEATORIAS
10

F re c u e n c ia
Desv. típ. = ,65

INDEPENDIENTES X1, X2,….,Xn TENIENDO


Media = 4,11

0 N = 109,00
2,50 3,00 3,50 4,00 4,50 5,00 5,50 6,00

CADA UNA LA MISMA DISTRIBUCIÓN


2,75 3,25 3,75 4,25 4,75 5,25 5,75

Log(10) de POBLAC

POBLACIONAL ƒ(x).
1.4.DISTIBUCION DE
1 MUESTREO

 PARAMETRO ES UNA PROPIEDAD DESCRIPTIVA DE LA POBLACIÓN.

ESTADÍSTICO
 ES UNA PROPIEDAD DESCRIPTIVA DE LA MUESTRA.

 ES UNA FUNCIÓN DE LAS OBSERVACIONES MUESTRALES.

 TODO ESTADÍSTICO ES EN SI, UNA VARIABLE ALEATORIA.

Una Distribución de muestreo es una función de


probabilidad de un estadístico
DISTIBUCION DE MUESTREO

PARAMETRO ESTADÍSTICO

μ Media
X
σ2 Varianza S2
σ Desviación S
Estándar
P p
Proporción
INFERENCIA
2.Estimación. Definición

La estimación es un proceso de utilizar datos muéstrales para estimar los


valores de parámetros desconocidos de una población. Esencialmente,
cualquier características de la población se pueden estimar a partir de una
muestra al azar.
 
Debemos hacer la distinción entre estimador y estimaciones.
Cualquier estadística de muestra que se utiliza para estimar un parámetro de la
población se conoce como estimador, es decir, un estimador es una
estadística de muestra utilizada para estimar un parámetro de la población. La
media de la muestra x puede ser un estimador de la media de la población.
 
Una estimación es un valor especifico observado de una estadística. Hacemos
una estimación si tomamos una muestra y calculamos el valor que toma el
estimador en esa muestra.

Por ejemplo, se toma la lectura media en kilometraje a partir de una muestra de


taxis en servicio, el valor obtenido es de 160.000 kilómetros.
Estimador: lectura media del recorrido en kilometraje
Estimación: 160.000 kilómetros recorridos en promedio por taxis
2.Estimación.
Criterios para Seleccionar un Buen Estimador

Podemos evaluar la calidad de una estadística como un buen estimador mediante el uso de cuatro
criterios:
a. Imparcialidad.
El termino Imparcialidad se refiere al hecho de que una media de muestra es un estimador
no sesgado de la media de la población porque la media de la distribución de muestreo de
las medias de muestra tomadas de una población es igual a la media de la población
misma.

b.     Eficiencia.
Se refiere al tamaño del error estándar de la estadística. Si comparamos dos estadísticas de
una muestra del mismo tamaño y tratamos de decidir cual de ellas es un mejor estimador
más eficiente, escogeríamos la que tuviera el menor error estándar o la menor desviación
estándar de la distribución de muestreo.
 
c.     Coherencia.
Una estadística es un estimador coherente de un parámetro de la población si al aumentar el
tamaño de la muestra, se tiene la certeza de que el valor de la estadística se aproxima
bastante al valor del parámetro de la población.
 
d.     Suficiente.
Un estimador es suficiente si utiliza una cantidad de la información contenida en la muestra
que ningún otro estimador podría extraer información adicional de la muestra sobre el
parámetro de la población que se está estimando.
2.1. Tipos de Estimación

Podemos hacer dos tipos de


estimaciones concernientes a una
población:
 Estimación Puntual
 Estimación por intervalos
Tipos de Estimación

a. Estimación Puntual
 
La estimación puntual es un solo número que se utiliza para estimar un
parámetro de la población desconocido.
 
Los valores estadísticos muéstrales se utilizan como estimadores de los
parámetros de la población. Así, la media de la muestra se utiliza como
estimación del valor de la media de la población; la desviaron Estándar de la
muestra se emplea como una estimación de la desviación estándar de la
población. , la cual se expresa:
Tipos de Estimación 30
Histograma

20

F r e c u e n c ia
10

Desv. típ. = ,65

b. Estimación de intervalos
Media = 4,11
0 N = 109,00
2,50 3,00 3,50 4,00 4,50 5,00 5,50 6,00
2,75 3,25 3,75 4,25 4,75 5,25 5,75

Log(10) de POBLAC

Una estimación de intervalo es un conjunto de valores entre dos extremos dados


que se utiliza para estimar un parámetro. Esta estimación indica el error de dos
maneras por la extensión del intervalo y por la probabilidad de obtener el
verdadero valor de la población que se encuentra dentro del intervalo. Es decir,
estas estimaciones proporcionan un intervalo de los valores posibles para el
parámetro de la población.
 
La estimación por intervalo de un parámetro poblacional(  ) es un intervalo de la
forma

 inferior     superior, donde  inferior y  superior depende del valor del


estadístico  para una muestra particular y también de la distribución
muestral

El intervalo de estimación indica, por su longitud, la precisión de la estimación


puntual.
 
 
2.1. Tipos de Estimación

A partir de la distribución muestral de la estimación de cualquier parámetro ( será posible


determinar valores  inferior y  superior tales que la

P (  inferior ≤  ≤  superior ) = 1 -

Donde
 1 - se denomina intervalo de confianza o grado de confianza, el cual proporciona unos
intervalos de valores, centrado en el valor estadístico de la muestra, en el cual
supuestamente se ubica el parámetro de la población, con un riesgo de error.

 , se denomina nivel de significación, indica la porción que se encuentra en los extremos


de la distribución que están fuera del intervalo de confianza, el nivel de riesgo. Los valores
van comprendido 0 <  < 1.

 ,
 inferior ≤  ≤  superior son los puntos extremos o limites de confianza inferior
y superior. De tal manera que cuando  = 0.05, se tiene un intervalo de confianza del
95% y cuando  = 0.01, se tiene una seguridad de que 99% en el intervalo dado que
contiene el parámetro desconocido.
3. Tipos de Estimación
La estimación de intervalo es un método que nos permite no sólo encontrar la
mejor estimación del valor de un parámetro, sino también el probable grado de
error en la estimación. Lo que implica que nos proporciona en rango de valores
posibles de un parámetro.

Cada intervalo de confianza incluye o no al verdadero valor del parámetro que se


estima, el nivel de confianza (1-), nos indica que en el limite, el (1-) de los
intervalos así construidos incluyen el valor poblacional. Por ejemplo, la
interpretación del intervalo de confianza, sería:

Una estimación de intervalo de confianza de 95%, nos indica como si


se tomaran todas las muestras posibles del mismo tamaño, n, 95% de
ellas incluirían el valor de la media real en alguna parte del intervalo
alrededor de sus medias de muestras, y solamente el 5% de ellas no
están incluidas.(Berenson y Levine,1996:346)
2.3. Estimación De La Media De La Población cuando no
se conoce la Desviación Estándar poblacional .

¨    

Por lo general se desconoce la desviación estándar real de la población, por lo tanto los
cálculos de los intervalos de confianza se deben basar en la Distribución T de Student, su
origen se remonta a principios del siglo XX, fue William S. Gosset el que planteo esta
distribución, empleado de una cervecería en Irlanda, puesto que no se les permitía publicar
investigaciones con los nombres propios adopta un seudónimo de Student.
 
Si la variable X esta distribuida en forma normal, entonces el estadístico es
2.3. Estimación De La Media De La Población cuando no
se conoce la Desviación Estándar poblacional .

¨    
Propiedades de la distribución t de
Figura N° 3 Student
Distribución t’student
 Tiene forma de campana y es simétrica, al igual que la
distribución normal. Sin embargo, la distribución t tiene
mas área en las colas y menos en el centro. Debido a que
se usa S en vez de . (Ver la Figura Nº 3)
¨    
 La distribución t es bastante sensible con respecto al
tamaño de la muestra, sin embargo esta sensibilidad
disminuye en el caso de tamaños muéstrales grandes.

 La distribución t presenta un área ( probabilidad) mayor


en los extremos que la distribución normal. Esto significa,
para un nivel de confianza dado, el valor t será un poco
mayor que el correspondiente a Z.

 El aspecto interesante de la distribución t es que no es


t’student una de tipo estandarizado, en caso de cada tamaño de la
muestra existe una distribución t diferente,
Normal ¨    
Hay una tabla para los valores t al igual que para los
valores z, para utilizarla debemos conocer el nivel de
confianza y los grados de libertad.
Estimación De La Media De La Población cuando no se
conoce la Desviación Estándar poblacional .

Figua N°4
gl Valores distribución t’student
.001 .01 .025. .05 ...... .10

1
2
.24
. 2.064
29

PRUEBA DE LA HIPÓTESIS
ELEMENTOS DE UNA PRUEBA DE HIPÓTESIS
EJERCICIOS

TEOREMA DEL LÍMITE CENTRAL


EJERCICIOS

PRUEBA DE LA HIPOTESIS
ACTIVIDAD

Una empresa de mensajería que opera en la ciudad tarda una media


de 35 minutos en llevar un paquete, con una desviación típica de 8
minutos. Supongamos que durante el día de hoy han repartido 200
paquetes. a) ¿Cuál es la probabilidad de que la media de los tiempos
de entrega de hoy esté entre 30 y 35 minutos?. b) ¿Cuál es la
probabilidad de que, en total, para los doscientos paquetes hayan
estado más de 115 horas?.
PRUEBA DE LA HIÓTESIS
PRUEBA DE LA HIÓTESIS

También podría gustarte