Trabajo de Probabilidades

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 23

Eventos Dependientes

La ocurrencia de un evento influye en la ocurrencia de otro evento.


Si un proyecto se empieza tarde otro proyecto que dependa del
mismo requerirá tiempo adicional. Si los eventos son dependientes,
entonces, por definición, se debe considerar el primer evento al
determinar la probabilidad del segundo.

Es decir, la probabilidad del evento B depende de la condición que


A ya haya ocurrido. Se necesita del principio de probabilidad
condicional. La
P (A n B) = P(A) X P(B lA)
probabilidad de
los eventos conjuntos A y B es:

Aunque el uso de una tabla puede simplificar los cálculos de


probabilidad, existen ejemplos en los cuales es muy diftcilla creación
de una tabla, por tanto se requiere el uso de fórmulas. El siguiente
ejemplo ilustra este caso.

El gerente de créditos de Dollar- Wise Department Store recolecta


datos.sobre 100 de sus clientes. De los 60 hombres, 40 tienen
tarjetas de crédito (C ). De las 4(} mujeresr'Sfl tienen tarjeta de
crédito (C). Diez de los hombres tienen saldos vencidos (B), mientras
que 15 de las mujeres tienen saldos vencidos (8). El gerente de
crédito desea determinar la probabilidad de que un cliente
seleccionado al azar sea:

a. Una mujer con tarjeta de crédito.

b. Una mujer con un saldo.

c. Un hombre sin un saldo.


1
d. Un hombre con un saldo.

Solución

Crear una tabla de probabilidad es difícil ya que existen tres


factores: género, tarjeta de crédito y saldo en la tarjeta. El uso de la
fórmula previa sea quizá el modelo preferido, como se muestra a
continuación:
.
í
a. P(W n C) = P(W) x P(C I W). Claramente P(W) = 40/100. Además,
de las 40 muje re \ 30 tienen tarjetas de crédito. Por tanto,
dado que el cliente es una mujer, la probabilidad de que
tenga una tarjeta de crédito es P(C I W) = 30/40.
Entonces: P(W n C) = P(W) x P(C I W) = (40/100) X (30/40)
=0.30

b. P(WnB) ==P(W) xP(B I W ). De las 40 mujeres, 15 tienen saldos.


Dado que el cliente es una mujer, la probabilidad de que
tenga un saldo es de 15/40. De manera que P(W n B) =
P(W) x P(B I W )= (40/100)(15/40) =0.15.

c. P(MnB) = P(M) x P(B IM). Debido a que 50 de los 60 hombres


no tienen saldos, P(B I M )= 50/60. Entonces, P(M
nB) = P(M)
x P(B I M) = (60/100).(50/60) = 0.50.

d. P(MnB):=P(M) x P(B I M). De los 60 hombres, 10 tienen


saldos. P(B IM) = 10/60. Así, P(MnB) = P(M) x P(B 1M) =(60/100)
(10/60)= 0.10.

2
Interpretación

Pueden determinarse las probabilidades de otros eventos


conjuntos que ayudarían al gerente de crédito a determinar las
políticas de la tienda y a incrementar las ventas.
La Distribución Normal

La distribución normal fue reconocida por primera vez por el


francés Abraham de Moivre (1667-1754). Posteriormente, Carl
Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y
formuló la ecuación de la curva; de ahí que también se la conozca,
más comúnmente, como la "campana de Gauss". La distribución de
una variable normal está completamente determinada por dos
parámetros, su media y su desviación estándar. Lo cual
determina la curva en forma de campana. Así, se dice que una
característica sigue una distribución normal de media y varianza.

Al igual que ocurría con un histograma, en el que el área de cada


rectángulo es proporcional al número de datos en el rango de
valores correspondiente si, en el eje horizontal se levantan
perpendiculares en dos puntos a y b, el área bajo la curva delimitada
por esas líneas indica la probabilidad de que la variable de interés,
X, tome un valor cualquiera en ese intervalo. Puesto que la curva
alcanza su mayor altura en torno a la media, mientras que sus
"ramas" se extienden asintóticamente hacia los ejes, cuando una
variable siga una distribución normal, será mucho más probable
observar un dato cercano al valor medio que uno que se encuentre
muy alejado de éste.

Importancia de la Distribución Normal

• Existen numerosas variables que parecen seguir una forma


similar a la distribución normal (pesos, alturas, coeficientes
3
intelectuales, calificaciones en exámenes, entre otros.)
• La distribución muestral de muchos estadígrafos muestrales
como la media tienen una distribución aproximadamente
normal e independiente de la configuración de la población, si
los datos son suficientemente numerosos.
• Es una excelente aproximación a otras distribuciones
muestrales como la de Poisson y Binomial, por
ejemplo.Propiedades de la distribución normal.

Propiedades de la Distribución Normal

La distribución normal posee ciertas propiedades importantes que


conviene destacar:
I. Tiene una única moda, que coincide con su media y su
mediana.
II. La curva normal es asintótica al eje de abscisas. Por ello,
cualquier valor entre – infinito y + infinito es teóricamente
posible. El área total bajo la curva es, por tanto, igual a 1.
III. Es simétrica con respecto a su media. Según esto, para este
tipo de variables existe una probabilidad de un 50% de
observar un dato mayor que la media, y un 50% de observar un
dato menor.
IV. La distancia entre la línea trazada en la media y el punto de
inflexión de la curva es igual a una desviación típica. Cuanto
mayor sea, más aplanada será la curva de la densidad.
V. El área bajo la curva comprendida entre los valores situados
aproximadamente a dos desviaciones estándar de la media es
igual a 0.95. En concreto, existe un 95% de posibilidades de
observar un valor comprendido en el intervalo .
VI. La forma de la campana de Gauss depende de los parámetros
media y desviación estándar. La media indica la posición de la
campana, de modo que para diferentes valores de la gráfica es
desplazada a lo largo del eje horizontal. Por otra parte, la
4
desviación estándar determina el grado de apuntamiento de la
curva. Cuanto mayor sea el valor, más se dispersarán los datos
en torno a la media y la curva será más plana. Un valor pequeño
de este parámetro indica, por tanto, una gran probabilidad de
obtener datos cercanos al valor medio de la distribución.

Como se deduce de este último apartado, no existe una única


distribución normal, sino una familia de distribuciones con una
forma común, diferenciadas por los valores de su media y su
varianza. De entre todas ellas, la más utilizada es la distribución
normal estándar, que corresponde a una distribución de media 0 y
varianza 1. La curva normal o campana de Gauss se concibe
como un histograma donde el número de intervalos aumenta de
forma indefinida, disminuyendo progresivamente su amplitud.

Esta propiedad resulta especialmente interesante en la práctica,


ya que para una distribución N (0,1) existen tablas publicadas a
partir de las que se puede obtener de modo sencillo la probabilidad
de observar un dato menor o igual a un cierto valor z, y que
permitirán resolver preguntas de probabilidad acerca del
comportamiento de variables de las que se sabe o se asume que
siguen una distribución aproximadamente normal. La distribución
normal es una distribución continua (no discreta). Se utiliza para
reflejar la distribución de variables tales como estaturas, pesos,
distancias y otras medidas que son divisibles infinitamente. Tales
variables continuas generalmente son el resultado de la medida.

Asi pues, tiene muchas y muy importantes propiedades, como, por


ejemplo:

• La altura máxima la alcanza en el punto central, cuyo valor


(valor máximo) se sitúa en la media de la distribución.
• La curva es simétrica con respecto al eje vertical que pasa por la
media.
• En cualquier distribución normal, la media, la moda y la mediana
5
tienen el mismo valor.

0
-3 -2 -1 0
1 2 3

Dependiendo de la media y de la desviación típica existen


infinitas curvas normales pero todas ellas equivalentes. Sin
embargo, la distribución con la que habitualmente se trabaja en la
normal típica, es aquella que tiene de media 0 y de desviación típica
1.

La Función Normal

Es una curva lisa, de forma acampanada y unimodal como se


presenta en la siguiente figura:

Se dice que una variable x numérica de experimentación con


media aritmética probabilística µx y desviación estándar
probabilística positiva σx sigue una distribución normal o es una
variable normal si tiene definida una función densidad de
probabilidad dada por:

6
2
1  x −µ x 
−  
1 2 σ x
fn( x ) = e 
σ x 2π

En las fórmulas anteriores intervienen las siguientes constantes:

π Aproximadamente 3.141592

e Aproximadamente 2.718281

σx Parámetro desviación estándar probabilística de x (variables


normales diferentes pueden tener distintas desviaciones
estándar probabilísticas, pero para cada variable normal, su
desviación estándar probabilística es constante).

µx Parámetro media aritmética de probabilística de x (variables


normales diferentes pueden tener distinta medias aritméticas
probabilísticas, pero para cada variable normal su media
aritmética probabilística es constante).

Distribución Normal Estandar o Tipificada

Una variable de experimentación es estándar o tipificada si su


media aritmética probabilística es cero (0) y su desviación estándar
probabilística es uno (1). Si una variable de experimentación x es
normal y tipificada, su función de densidad de probabilidad se
denomina normal estándar o normal tipificada y se ajusta a la
fórmula:

x2
1 −
fnt ( x) = e 2

Curva Normal Tipificada

7
Con el fín de suprimir la individualidad de cada una de las
distribuciones señaladas gráficamente, se convierte a la curva
normal, en un modelo matemático con características fijas y
definidas y así se hace posible el cálculo de probabilidades. Este
proceso se conoce con el nombre de tipificación de la curva normal.
Para lo cual se supone:

a) La media o promedio de la población es cero µ =0

b) La desviación estándar igual a uno

c) La variable independiente x, se transforma en un valor z.

-3 -2 -1 0 1 2 3

Desviación normal estándar

Fórmulas de cálculo se reproducen a continuación como las fórmulas:

x − µx a − µx
z≡ za =
σx σx

Característica de la curva normal tipificada

8
a) Es simétrica respecto a su media (50% a la derecha y 50% a la
izquierda de la media)

b) El área encerrada es 1 o 100%

c) La media, mediana y moda son iguales.

Ejemplos de los casos más frecuentes del cálculo de probabilidades de intervalos.

9
= P ( z < −a ) + P ( z > b)

. - a b

Calculos de Área bajo la curva normal

La curva normal representa un histograma en el que el intervalo


es infinitamente pequeño. Al igual que en el histograma, para
averiguar la proporción de elementos que obtienen puntaciones
inferiores o superiores a una dada, bastará con saber la proporción
del área de la parte referida.
Cuando utilizamos “z” hacemos comparables todas las
puntuaciones. Cuando tenemos una “z” sabemos el área que ocupa
10
expresada en porcentajes. Para ello, hay que buscar el valor de “z”
en la tabla anexa (áreas bajo la curva normal).

Para su cálculo, en todos los casos los casos que se ilustran a


continuación, seguiremos el siguiente proceso:

1º Dibujar la curva con una distribución normal.


2º Representar los datos que tenemos en la curva normal.
3º Calcular la puntuación típica “z”.
4º Establecer el valor del porcentaje de “z”, en la tabla anexa.

Caso 1: Cálculo del número de individuos que quedan por


encima y por debajo de una puntuación directa

Dado un test que nos ofrece una Media de 50 y una Desviación


típica de 6 y suponiendo que la muestra se distribuye normalmente,
debemos averiguar las frecuencias en % por encima y por debajo
del valor X1= 60. ¿Cuál es el número de individuos en % que quedan
por encima y por debajo de la puntuación?

X 1= 6

50

X = 50 1,6

Hallamos el valor Z asociado a la puntuación directa según la


fórmula de cálculo:

X 1− X 60 -
= 1,67
50
z = =
s 6

Buscamos esa Z en la tabla anexa y localizamos el área:

11
1,67 0,4525 que en % es igual a 45,25% de los individuos. Es el
número de sujetos que hay entre la Χ y la Z=1,67. (la parte
rayada). Si al 45,25% de los casos le sumamos el 50%

obtenemos el 95,25%, deduciendo que la puntuación

obtenida por el sujeto se encuentra por encima del 95,25% de

los casos y por debajo del 4,75% (100%-95,25%).

Caso 2: Cálculo del número de individuos


comprendidos entre dos puntuaciones directas

Teniendo en cuenta los siguientes datos: Media=50,


Desviación Típica=6, X1=45, X2=35, averiguar el porcentaje de
individuos que tienen puntuaciones comprendidas entre X1 y X2.

X 1= 4

X 2= 35

-2.5 -0.8
X = 50

Hallamos los valores Z asociados a cada puntuación directa


según la fórmula de cálculo y
buscamos las áreas asociadas en la tabla
pertinente:

z = X 1− X =
-5
1
s = - 0. 83
6

z = X 2− X -15
2 s
= = - 2. 5
6

12
Para calcular el número de sujetos entre las dos puntuaciones
hay que restar los dos
porcentajes obtenidos:

49,38% - 29,67% = 19, 71 %

29,67%

49,38%

13
Caso 3: Cálculo de una puntuación directa a partir de
un área determinada

¿Cuál es la puntuación que deja por debajo el 75 % de los casos


teniendo en cuenta los siguientes datos: Media=59, Desviación
típica: 6?

75
%

X =
50

Como el 75% de los casos no se puede buscar en la tabla de las


áreas, buscamos el 25%
(dado que son valores simétricos) que, aproximadamente, es
24,86. Esto es igual a Z=0,67.
Despejando:

0,67 X 1− 5
=
6

X1 - 50 =
0,67 (6) X1 -
50 = 4,02
X1= 4,02 + 50 = 54,02

Caso 4: Cálculo de las puntuaciones directas que


comprenden un área determinada

Averiguar las puntuaciones que hay que obtener a ambos lados


de la media para que el área comprendida entre ambos puntos,
contenga al 50% de los casos, sabiendo que la Media es 50 y la
Desviación Típica 6.

25% 25%
X =
50
Buscamos el 25% en la tabla de áreas bajo la curva normal
que, aproximadamente, es
24,86 %, cuyo valor asociado de Z es 0,67.

Despejando en la fórmula de cálculo de las puntuaciones Z


obtendremos las puntuaciones directas:

X1 - 50 = 0,67 (6)
X1 - 50 = 4,02
X1= 4,02 + 50 = 54,02 por encima

---------------------

X2 - 50 = - 0,67 (6)
X2 - 50 = - 4,02
X2= - 4,02 + 50 = 45,98 por debajo

Caso 5: Cálculo del área comprendía por encima y por


debajo de una puntuación directa

Hallar la probabilidad en porcentaje (%) de que un valor escogido


al azar sea inferior a X1=
60, conociendo los siguientes datos: Media=50, Desviación típica=6.

45,25%
X 1 = 60
50

X = 50
60 –5 = 1,67 45,25 %
z=
6
La probabilidad es: 50% + 45,25% = 95,25%
Caso 6: Cálculo de un área comprendida entre dos
puntuaciones directas

Hallar la probabilidad en porcentaje (%) de que un individuo


escogido al azar obtenga una puntuación comprendida entre X1 y
X2, teniendo en cuenta los siguientes datos: Media=50,
Desviación típica=6, X1=39 y X2=62.

- 1,83 X = 50 2

Hallamos:

z
1 39 - 50 -11
= = = - 1.83 46,64%
s 6

12
z = 62 − 50 = = 2 47,72%
s

Para calcular el número de sujetos entre las dos puntuaciones


hay que:
46,64% + 47,72% = 94,36 %

14
Introducción a las medidas de forma: asimetría y curtosis

Además de las medidas de tendencia central y dispersión, se


utilizan otros dos tipos de medidas que nos ayudarán a
describir mejor las variables: la asimetría y la curtosis.

El índice de asimetría representa el grado en el que los datos


de una distribución de frecuencias se reparten por encima y por
debajo de la tendencia central. La distribución normal es
simétrica y tiene un valor de asimetría igual a 0. Una distribución
que tenga una asimetría positiva significativa tiene una cola
derecha larga.

Una distribución que tenga una asimetría negativa significativa


tiene una cola izquierda larga. Como regla aproximada, un valor
de la asimetría mayor que el doble de su error típico se asume
que indica una desviación de la simetría.

Índices:
X - Mo
As
= SX

(Q -Q) − (Q -Q
2 )
As = 3 2 1

Q 3 -Q 1

As = z =
3 ∑( X i
− 3 X)
3
n⋅ S
X

15
A B C

X 0 1 2 3 4 5 6

Interpretación:

A. Si As > 0: Asimetría positiva


B. Si As = 0: Simetría
C. Si As < 0: Asimetría negativa

Su valor es cero cuando la distribución es simétrica, positivo


cuando existe asimetría a la derecha y negativo cuando existe
asimetría a la izquierda.

El índice de curtosis representa el grado de apuntamiento de


una distribución de frecuencias. Para una distribución normal, el
valor del estadístico de curtosis es 0 y diremos que ésta es
mesocúrtica. Una curtosis positiva indica que las observaciones se
concentran más y presentan colas más largas que las de una
distribución normal, así como su apuntamiento; se trata de una
distribución leptocúrtica. Una curtosis negativa indica que las
observaciones se agrupan menos y presentan colas más cortas,
siendo la distribución platicúrtica.

Índice de curtosis:

g2 =
∑(xi − X)4ni −3
ns4

Miden la mayor o menor cantidad de datos que se agrupan en


torno a la moda. Se definen 3 tipos de distribuciones según su
grado de curtosis:

También podría gustarte