Clase 6 PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 35

Clase 6: Distribuciones Binomial e Hipergeométrica.

Aproximación binomial de la hipergeométrica

Lina Marı́a Acosta Avena*


ASESORIAS: LUNES DE 4:00 pm - 6:00 pm. VIERNES DE
9:00 am - 11:00 am, B43-103
Escuela de Estadı́stica
Universidad Nacional de Colombia, Sede Medellin
[email protected]
*
Estudiante de la Maestrı́a en Ciencias Estadı́stica

Estadı́stica I.

1
INTRODUCCIÓN

Algunas de las distribuciones de probabilidad discretas más usadas, se basan


en un tipo especial de experimento aleatorio, donde el resultado es la ocur-
rencia o no ocurrencia de un evento de interés; por ejemplo, el resultado de
un tratamiento aplicado a un paciente puede ser favorable o no. El investi-
gador puede estar interesado entonces en determinar que tan favorable es el
tratamiento.

Estadı́stica I.

2
INTRODUCCIÓN

Sin pérdida de generalidad, llámese “éxito” a la ocurrencia del evento y “fra-


caso” a su no ocurrencia. La probabilidad de que ocurra el evento de interés
(probabilidad de éxito) es usualmente denotada p y la del fracaso 1 − p.
La variable aleatoria de interés en este caso es X : número de éxitos obtenidos.
Claramente el rango de X será AX = {0, 1}, donde 1 corresponde a el éxito y
0 corresponde a el fracaso.
Este tipo de experimentos se conoce como ensayo Bernoulli.

Estadı́stica I.

3
INTRODUCCIÓN

Para calcular la distribución de probabilidad de X , se debe calcular la proba-


bilidad asociada a cada valor de X . Ası́,

p(0) = P(X = 0) = 1 − p p(1) = P(X = 1) = p


luego,
(
px(1 − p)1−x , x = 0, 1
p(x) =
0 , e.o.c.
Esta distribución se conoce como Bernoulli.
Cuando una variable aleatoria X sigue una distribución Bernoulli, se denotada
X ∼ B(p)

Estadı́stica I.

4
INTRODUCCIÓN

Propiedades de la distribución Bernoulli:


Sea X ∼ B(p)

1. E[X] = p
Dm:
1
E[X] = ∑ xp(x) , por definición de valor esperado
x=0
= 0p(0) + 1p(1)
= 0(1 − p) + 1(p)
=p

Estadı́stica I.

5
INTRODUCCIÓN

2. Var[X] = p(1 − p)
Dm:
1
E[X 2] = ∑ x2 p(x) , por definición de valor esperado
x=0
= 02 p(0) + 12 p(1)
= 0(1 − p) + 1(p)
=p
Ahora,

Var[X] = E[X 2] − (E[X])2 , por propiedad de varianza


= p − p2
= p(1 − p)

Estadı́stica I.

6
INTRODUCCIÓN

Considere ahora un experimento aleatorio que consiste en repetir un ensayo


Bernoulli n veces y cada uno de éstos es independiente de todos los demás.
Sea X la variable aleatoria que representa el número de éxitos en los n en-
sayos. Supónga que el interés está en determinar la probabilidad de obtener
exactamente X = x éxitos durante los n ensayos.

Para obtener la función de probabilidad de este experimento, se debe de-


terminar la probabilidad de tener, x éxitos y n − x fracasos, en los n ensayos.
Note que uno de los supuestos de este experimento es que los n ensayos son
independientes, de manera que:

Estadı́stica I.

7
INTRODUCCIÓN

Estadı́stica I.

8
INTRODUCCIÓN

Ahora bien, ¿de cuántas formas se pueden escoger los éxitos en los n en-
sayos?.
Cómo no importa el orden de selección, se escogen de la siguiente forma
 
n n!
=
x x!(n − x)!
Por lo tanto, la función de probabilidad del experimento considerado es
( 
n x n−x ; x = 0, 1, . . . , n ; 0 ≤ p ≤ 1
x p (1 − p)
p(x) =
0 ; e.o.c.

Estadı́stica I.

9
DISTRIBUCIÓN BINOMIAL

Definición:
Sea X una variable aleatoria que representa el número de éxitos en n ensayos
y p la probabilidad de éxitos en cualquiera de éstos. Se dice entonces que
X tiene una distribución binomial (X ∼ b(n, p)) con función de masa de
probabilidad
( 
n x
x p (1 − p)n−x ; x = 0, 1, . . . , n ; 0 ≤ p ≤ 1
p(x, n, p) =
0 ; e.o.c.
El interés está en determinar la probabilidad de obtener exactamente X = x
éxitos durante los n ensayos.
Los parámetros de la distribución binomial son n y p.
La distribución Bernoulli es un caso particular de la distribución binomial, cuan-
do n = 1.

Estadı́stica I.

10
DISTRIBUCIÓN BINOMIAL

Caracterı́sticas de un proceso binomial: Los experimentos que


tienen este tipo de distribución tienen las siguientes caracterı́sticas

(a) El experimento consta de n pruebas idénticas e idependientes, esto es,


el resultado obtenido en cada prueba es independiente de los resultados
obtenidos anteriormente.

(b) Cada prueba tiene dos posibles resultados: “éxito” y “fracaso”.

(c) La probabilidad de éxito (p) es constante (no varı́a de una prueba a otra)
en las n pruebas.

Estadı́stica I.

11
DISTRIBUCIÓN BINOMIAL

(d) La variable de interés es X : número de éxitos en los n ensayos, y su ran-


go es AX = {0, 1, 2, . . . , n}.

Definición:
La probabilidad de que una variable aleatoria X binomial sea menor o igual a
un valor especı́fico x, se determina por la función de distribución acumula-
da
x n
F(x; n, p) = P(X ≤ x) = ∑ pi(1 − p)n−i
i=0 i
La distribución binomial se ha tabulado de manera extensa para distintos val-
ores de n y p.

Estadı́stica I.

12
DISTRIBUCIÓN BINOMIAL

Propiedades de la distribución binomial:


Sea X ∼ b(n, p)

n
n x
1. ∑ x p (1 − p)
n−x = 1
x=0
Dm: Por el teorema del binomio se sabe que
n n 
(a + b)n = ∑ p j (1 − p)n− j
j=0 j
Haciendo a = p, b = (1 − p) y j = x tenemos que
n n 
∑ px(1 − p)n−x = [p + (1 − p)]n = [p + 1 − p]n = 1n = 1
x=0 x

2. E[X] = np
Estadı́stica I.

13
DISTRIBUCIÓN BINOMIAL

3. Var[X] = np(1 − p) = npq

Ejemplo 1
Suponga que la probabilidad de tener una unidad defectuosa en una lı́nea
de ensamble es de 0,05. Si se seleccionan 20 unidades aleatoriamente con
reemplazo.

(a) ¿Cuál es la probabilidad de que dos sean defectuosas?

(b) ¿Cuál es la probabilidad de que a lo más dos unidades estén defectu-


osas?

Estadı́stica I.

14
DISTRIBUCIÓN BINOMIAL

(c) ¿Cuál es la probabilidad de que por lo menos 2 unidades estén defectu-


osas?

Sln:
Sea X : número de unidades defectuosas, X ∼ b(n = 20, p = 0,05)
(
20 x (0,95)n−x
x (0,05) ; x = 0, 1, . . . , 20
p(x) =
0 ; e.o.c.

Estadı́stica I.

15
DISTRIBUCIÓN BINOMIAL

20
(a) P(X = 2) = 2 (0,05)2(0,95)20−2 = 0,1887

(b) P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2)

20 0 20−0 20 1 20−1 20


= 0 (0,05) (0,95) + 1 (0,05) (0,95) + 2 (0,05)2(0,95)20−2

= 0,03585 + 0,3774 + 0,1887 = 0,9245

(c) P(X ≥ 2) = 1 − P(X < 2) = 1 − P(X ≤ 1)


= 1 − P(X = 0) − P(X = 1) = 0,2642

Estadı́stica I.

16
DISTRIBUCIÓN BINOMIAL

Ejemplo 2
Un examen de opción múltiple contiene 10 preguntas. Cada pregunta tiene
cuatro opciones de las cuales sólo una es la correcta. El examen se aprueba si
se responden correctamente al menos seis preguntas. Si el estudiante adivina
las respuestas, conteste las siguientes preguntas:

(a) ¿Cuál es la probabilidad de aprobar el examen?

(b) Si el estudiante adivina al menos tres de las preguntas, ¿Cuál es la prob-


abilidad de reprobar el examen?

(c) Halle E[X] y Var[X]

Estadı́stica I.

17
DISTRIBUCIÓN BINOMIAL

Sln:
Sea X : número de preguntas con respuesta correcta, X ∼ b(10, 1/4)
(
10 x (3/4)10−x
x (1/4) ; x = 0, 1, . . . , 10
p(x) =
0 ; e.o.c.

(a)

P(X ≥ 6) = P(X = 6) + P(X = 7) + P(X = 8) + P(X = 9) + P(X = 10)


= 0,0162 + 0,0031 + 0,0004 + 0,00002861 + 0,00000095
= 0,01973
Otra forma (usando la tabla)
5
10
P(X ≥ 6) = 1−P(X ≤ 5) = 1− ∑ x
x (1/4) (3/4)
10−x = 1−0,9803 =
x=0
0,01970

Estadı́stica I.

18
DISTRIBUCIÓN BINOMIAL

(b)
P(3 ≤ X < 6)
P(X < 6|X ≥ 3) =
P(X ≥ 3)
P(3 ≤ X ≤ 5)
=
1 − P(X ≤ 2)
= 0,9585

(c)
 
1
E[X] = np = 10 = 2,5
4
  
1 1
Var[X] = np(1 − p) = 10 1− = 1,875
4 4

Estadı́stica I.

19
DISTRIBUCIÓN BINOMIAL

Ahora supongamos que una población finita tiene N elementos, cada uno de
los cuales tiene una de dos caracterı́sticas diferentes, digamos k elementos
tienen la caracterı́stica de interés y el resto (N − k) no la tienen. Supónga
además que se seleccionan al azar y sin reemplazo n de estos elementos.
Sea X la variable aleatoria que representa el número de elementos que tienen
la caracterı́stica de interés en los n seleccionados. Gráficamente esto es

Estadı́stica I.

20
DISTRIBUCIÓN BINOMIAL

Estadı́stica I.

21
DISTRIBUCIÓN BINOMIAL

Note que como la selección es sin reemplazo, la probabilidad de cada ensayo


no es constante.
Ahora bien el número de formas distintas en las que se pueden seleccionar n
N k
objetos de los N es n , la selección de x elementos de los k es x , por lo
N−k
cual la seleccion de n − x de N − k es n−x .
Entonces

k N−k
 (x)( n−x ) ; x = 0, 1, . . . , min(n, k)

p(x) = (Nn )
0

; e.o.c.

Estadı́stica I.

22
DISTRIBUCIÓN HIPERGEOMÉTRICA

Definición:
Suponga que una población finita tiene N elementos, cada uno de los cuales
tiene una de dos caracterı́sticas diferentes que se denominan “éxito” y “fraca-
so”; suponga que k se consideran éxitos y N − k fracasos. Se toman al azar y
sin remplazo n de estos elementos; considere la v.a X : Número de éxitos en
la muestra de tamaño n. Entonces, la función de distribución de probabilidad
para X está dada por

k N−k
 (x)( n−x ) ; x = 0, 1, . . . , min(n, k)

p(x) = (Nn )
0

; e.o.c.
Esta función de probabilidad se conoce como Distribución Hipergeométrica.
Se denotará X ∼ hip(N, K, n), sus parámetros son N, k, n

Estadı́stica I.

23
DISTRIBUCIÓN HIPERGEOMÉTRICA

Caracterı́sticas de un proceso hipergeométrico:


Los experimentos que tienen este tipo de distribución tienen las siguientes
caracterı́sticas

(a) Se esperan dos tipos de resultados (éxitos y fracasos).

(b) Cada ensayo o repetición del experimento no es independiente de los


demas.

(c) Las probabilidades asociadas a cada uno de los resultados no son con-
stantes.

Estadı́stica I.

24
DISTRIBUCIÓN HIPERGEOMÉTRICA

Definición:
La distribución acumulada de la distribución hipergeométrica está definida por

xk N−i
F(x; N, k, n) = P(X ≤ x) = ∑ i n−i
N
i=0 n
La distribución hipergeométrica se ha tabulado de manera extensa para dis-
tintos valores de sus parámetros.

Estadı́stica I.

25
DISTRIBUCIÓN HIPERGEOMÉTRICA

Propiedades de la distribución hipergeométrica:


Sea X ∼ hip(N, K, n)

n (k)(N−k)
1. ∑ x Nn−x = 1
x=0 ( n )

2. E[X] = n Nk

3. Var[X] = n k2 (N − K) N−1
N−n
N

Estadı́stica I.

26
DISTRIBUCIÓN HIPERGEOMÉTRICA

Ejemplo 3
Suponga que se tienen 50 representantes de cierto estado a una convención
polı́tica Nacional, de los cuales 30 apoyan al candidato A y 20 al candidato
B. Si seleccionan aleatoriamente 5 representantes ¿cuál es la probabilidad de
que, entre estos cinco, por lo menos dos apoyen al candidato A?.
Sln:
Sea X : número de representantes que apoya al candidato A.
Esta variable parece ser ser binomial, pero tenga en cuenta que cuando se
selecciona a un representante y se le pregunta a favor de qué candidato está,
éste no vuelve a ser selccionado. Esto nos indica que no existe independencia
en la selección de un representante y el siguiente, ası́ las probabilidades no
son constantes, y por lo tanto X ∼ hip(N = 50, k = 30, n = 5)

Estadı́stica I.

27
DISTRIBUCIÓN HIPERGEOMÉTRICA

Luego,

30 50−30
 ( x )( 5−x ) ; x = 0, 1, 2, 3, 4, 5.

p(x) = (50
5)
0

; e.o.c.
Ahora
(30
0 )(20
5 ) (30)(20 )
P(X ≥ 2) = 1−P(X < 2) = 1−P(X = 0)−P(X = 1) = 1− 50 − 50 4 1
(5) (5)
= 0,924081

Estadı́stica I.

28
DISTRIBUCIÓN HIPERGEOMÉTRICA

n cuando N es muy grande, es decir N >>>>>>


Ahora veamos ¿qué sucede con N
n?.
n va ser muy pequeño y las
La respuesta a esta pregunta es que el cociente N
probabilidades condicionales son aproximadamente “constantes”, ası́ que en
ocasiones el cálculo de probabilidades en estos casos puede ser aproximado
usando la distribucón binomial.

Estadı́stica I.

29
APROXIMACIÓN BINOMIAL DE LA HIPERGEOMÉTRICA

Proposición
Sea X ∼ hip(N, k, n).
n < 0,1 o N−n ≈ 1, entonces
Si N N−1

lı́m p(x, N, k, n) = p(x, n, p)


N→∞
es decir
k N−k  
x n−x n x n−x
N
≈ p (1 − p)
x

n
Entonces, la hipergeométrica tiende a la binomial con parámetros n y p = Nk

Estadı́stica I.

30
APROXIMACIÓN BINOMIAL DE LA HIPERGEOMÉTRICA

Ejemplo 4
Un geólogo ha recolectado 500 especı́menes de roca basáltica y 500 de gran-
ito. Se instruye a un asistente de laboratorio para que seleccione al azar 5
de los especimenes para analizarlos. La variable aleatoria de interés es X :
número de especı́menes de basalto en la muestra para análisis. Calcule la
probabilidad de P(X = 5 ∨ X = 0).

Estadı́stica I.

31
APROXIMACIÓN BINOMIAL DE LA HIPERGEOMÉTRICA

Sln:
(500 )(500 ) (500 )(500 )
P(X = 5 ∨ X = 0) = 1000 + 1000 5 = 0,0309 + 0,0309 = 0,061875
5 0 0
( 5 ) ( 5 )
Ahora defina los siguientes eventos:
Bi : la i-ésima roca extraı́da es de basalto i = 1, 2, 3, 4, 5.
Observe que:

500 = 1 = 0,5 P(B |B ) = 499 = 0,4995


P(B1) = 1000 2 2 1 999

498 = 0,4990 P(B |B ∩ B ∩ B ) = 497 = 0,4985


P(B3|B1 ∩ B2) = 998 4 1 2 3 997

496 = 0,4980
P(B5|B1 ∩ B2 ∩ B3 ∩ B4) = 996

Estadı́stica I.

32
APROXIMACIÓN BINOMIAL DE LA HIPERGEOMÉTRICA

Observe que en este caso la probabilidad de seleccionar una roca de basalto


en cada repetición es casi constante, ası́ que podemos usar la aproximación
500 = 1
a la binomial, tomando n = n = 5 y p = Nk = 1000 2
Ası́
5 1 5 1 0 5 1 0 1 5
       
P(X = 5 ∨ X = 0) = 5 2 1 = 0,0625
2 + 0 2 2 = 16
Note que la aproximación es bastante buena.

Estadı́stica I.

33
EJERCICIOS

1. Sea X una variable aleatoria binomial con parámetros n y p = 31 . Deter-


mine el entero n tal que P(X ≥ 1) ≥ 0,85.
Rta n = 5

2. Un fabricante asegura que sólo el 1 % de su producción total se encuentra


defectuosa. Suponga que se ordenan 1000 artı́culos y se seleccionan 25
al azar para inspeccionarlos. Si el fabricante se encuentra en lo correcto,
¿cuál es la probabilidad de observar dos o más artı́culos defectuosos en
la muestra?
Rta 0,0258

Estadı́stica I.

34
EJERCICIOS

3. Un geólogo ha recolectado 10 especimenes de roca basáltica y 10 de


granito. Se instruye a un asistente de laboratorio para que seleccione al
azar 6 de los especimenes para analizarlos.

(a) ¿Cuál es la p.m.f. para el número de especimenes de basalto selec-


cionados para analizarlos?

(b) ¿Cuál es la probabilidad de que todos los especimenes de la muestra


sean de una de los dos tipos de roca seleccionados para análisis?
Rta 0,01084

(c) ¿Cuál es la probabilidad de que la cantidad de especimenes de gran-


ito seleccionados para su análisis esté a menos de una desviación
estándar de la media? Rta 0,85913

Estadı́stica I.

35

También podría gustarte