Apunte Teoría de Probabilidad

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 13

TEORIA DE LA PROBABILIDAD – APUNTE DE CLASE

Hemos tratado ya el aspecto de la Estadística relacionado con el procesamiento de datos. A partir de


ahora consideraremos aquel aspecto de la estadística que trata sobre la toma de decisiones frente a
incertidumbre.
En la mayoría de los problemas de ingeniería hay que tomar decisiones en base a experimentos. Un
experimento especifica exactamente que ensayos o pruebas han de realizarse y qué ha de observarse. Estos
ensayos, que llevan a resultados u observaciones, generalmente se repiten varias veces bajo condiciones
uniformes o constantes. Aun cuando se tiene gran cuidado de mantener las condiciones del experimento tan
uniformes como sea posible, las observaciones individuales muestran una variabilidad intrínseca que no puede
eliminarse. Por ejemplo, si un químico realiza varias veces un análisis bajo las mismas condiciones y obtiene
diferentes mediciones, ello indica la existencia de un elemento de aleatoriedad en el procedimiento experimental.
Esta variabilidad inherente (en las mediciones) se conoce frecuentemente como error experimental, que es un
nombre conveniente para una fuente de variación no controlada.
Por eso, en todo tipo de experimentos repetidos efectuados bajo condiciones controladas, los resultados
de las repeticiones individuales varían; por lo tanto los resultados de cualquier repetición no pueden predecirse
con exactitud.
En vez de ignorar esta variabilidad o tratarla cualitativamente, puede incorporarse a un modelo
matemático del fenómeno físico que se está estudiando. Este modelo generalmente es una descripción
matemática simplificada del proceso. Sin embargo, hay que notar que este "modelo matemático" puede no ser
representativo del fenómeno físico verdadero puesto que, por necesidad, puede haber sido una sobre
simplificación del proceso verdadero.
En lo que sigue trataremos conceptos que proporcionan el fundamento para incluir la variabilidad
inherente en el modelo matemático.
En general los especialistas en estadística utilizan la palabra experimento para describir cualquier
proceso que genere datos.
En la teoría de la probabilidad el término experimento se usa para describir virtualmente cualquier
proceso cuyos resultados no se conocen de antemano con certeza. EXPERIMENTOS o FENOMENOS o
PROCESOS ALEATORIOS
Un fenómeno ó proceso aleatorio es todo proceso o fenómeno que presenta las tres características siguientes:
1ª Son susceptibles de repetirse o reiterarse un gran número de veces bajo las mismas condiciones de partida,
2ª a pesar de ello, el resultado de cada repetición del proceso, en general no es siempre el mismo sino que varía
de una manera irregular que no se puede prever o predecir.
3ª Si después de repetir el proceso un gran número “n” de veces, se registra el número “f” de veces que se
presenta uno cualquiera pero bien determinado de los resultados posibles, se observa que el cociente f/n llamado
frecuencia relativa del resultado considerado, queda sensiblemente constante cuando se reitera la secuencia de
n observaciones del fenómeno.
En otras palabras y de una manera más general, supongamos una primera secuencia de n 1 repeticiones del
proceso, luego una segunda de n2 repeticiones y así sucesivamente, hasta llegar a una k-ésima secuencia de
nk repeticiones del proceso. Si para las sucesivas secuencias de reiteraciones del experimento registramos las
veces f1, f2, ..., fk que se ha presentado el resultado en consideración, constataremos que bajo la condición que
los números n1, n2,..., nk sean suficientemente grandes, todos los cocientes f1/n1, f2/n2, ..., fk/nk son sensiblemente
iguales.
El hecho empírico descrito se llama estabilidad estadística.
Ejemplo: El tiro a cara o sello de una moneda configura un ejemplo típico de fenómeno aleatorio.
En efecto, es inmediato que la experiencia se puede repetir tanta veces como se quiera bajo condiciones que
reproduzcan lo más fielmente posible las condiciones iniciales del primer tiro. En segundo lugar si el resultado
de la primera experiencia fue cara, por mucho que nos esforcemos para reproducir con exactitud las condiciones
del primer tiro, no nos será posible anticipar para cada tiro si el resultado a obtenerse será cara o sello. Esta
imposibilidad de predecir el resultado de cada tiro es consecuencia de nuestra incapacidad para conocer de
manera completa los múltiples factores que determinan el resultado final de la experiencia.
Finalmente a pesar de esta circunstancia, si la moneda con la cual se experimenta es regular o simétrica, una
larga experiencia de numerosos experimentadores enseña que la frecuencia relativa de las caras y también de
los sellos, difiere muy poco de ½, bajo la hipótesis que el número de pruebas o experimentos sea suficientemente
grande.
Así por ejemplo, el naturista Buffon en la segunda mitad del siglo XVIII y el estadístico inglés Karl Pearson a
comienzos del siglo XX obtuvieron los resultados que se consignan en el siguiente cuadro
Nº de tiros Nº de caras Frecuencia relativa
Buffon 4040 2048 0,5080
Pearson 12000 6019 0,5016
Pearson 24000 12012 0,5005

TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -1


Resultados análogos se obtienen al experimentar con un dado regular. En largas secuencias de tiros, la
frecuencia de cada uno de los seis resultados posibles es sensiblemente igual a 1/6.
Aunque los resultados de cualquier experimento dado no pueden predecirse con exactitud, es posible
caracterizar el conjunto de todos los resultados posibles del experimento.
ESPACIO MUESTRAL
Se llama ESPACIO MUESTRAL al conjunto de todos los resultados posibles de un experimento
estadístico y se lo representa con el símbolo "S". Los elementos del Espacio Muestral que representan los
posibles resultados del experimento se indican con "s" y se los llama simplemente puntos muestrales.
Debida a esta interpretación, el lenguaje y los conceptos de teoría de conjuntos proporcionan un contexto
natural para el desarrollo de la teoría de la probabilidad.
Ejemplo 1: Consideremos el tiempo de vida en años de determinado componente electrónico. De un grupo de componentes
producidos bajo condiciones similares, se coloca uno bajo prueba en un ambiente similar al diseñado para su uso y se prueba
hasta que falle. Puesto que la vida del componente puede ser cualquier número no negativo, el espacio muestral S consiste
en todos los puntos s que están en el intervalo [0,), es decir
S={s/s0 }
OBSERVACION: En este punto puede ser útil comentar la diferencia entre un espacio muestral matemáticamente “idealizado”
y uno realizable de manera experimental. Desde un punto de vista práctico hay que reconocer que la vida de un componente
electrónico no puede ser infinita, tampoco los instrumentos de medición pueden registrar valores continuos. Sin embargo
como se indicó, el modelo matemático es solo una aproximación del fenómeno físico a estudiarse. En los ejemplos, estas
aproximaciones generalmente no deforman los resultados.
En virtud de los comentarios anteriores, varios de los espacios muestrales descritos son ideales (espacio muestral
matemáticamente idealizado). En todas las situaciones subsiguientes, el espacio muestral considerado será el que resulte
más conveniente en términos matemáticos. En la mayoría de los problemas no habrá muchas dudas en cuanto a la elección
apropiada del espacio muestral.
Si en vez de probar un componente, el experimento consiste en escoger dos de los componentes anteriores, el espacio
muestral S está dado por
S = { (x1,x2) / x1 > 0, x2 > 0 },
donde x1 indica el tiempo de vida (tiempo de falla) del componente electrónico designado como número 1 y x2 indica el tiempo
de vida del componente designado como número 2.
De modo similar, si una muestra de 5 componentes se prueban hasta que fallen, el espacio muestral S está dado por
S = { (x1, x2, x3, x4, x5 ) / xi  0 , i = 1,2,3,4,5 } donde xi , indica el tiempo de vida de la i-ésima componente. Un
resultado posible del experimento es s = (x1, x2, x3, x4, x5 ) = (4, 6, 4, 3, 5).
Ejemplo 2: Consideremos el experimento que consiste en lanzar un dado y observar que cara queda hacia arriba. Antes de
arrojarse el dado, no podemos predecir con certeza el valor de la cara del dado, pero puede registrarse el conjunto de todos
los resultados posibles del experimento, S.
S = { 1, 2, 3, 4, 5, 6 }
Si se lanzan dos dados, cada dado puede tomar un nº del 1 al 6 inclusive. Luego el espacio muestral será
S = { (x1, x2) / 1 x1 6, 1 x2 6 }
Si un solo dado se lanza dos veces, el espacio muestral es el mismo que el anterior, solo que x1 indica ahora el valor obtenido
en el primer lanzamiento y x2 indica el valor del segundo.
Ejemplo 3: Consideremos el experimento que consiste en arrojar una moneda y observar el lado hacia arriba (se presenta
este ejemplo para ilustrar el hecho que el espacio muestral no tiene que consistir necesariamente en un conjunto de números).
En este caso S = { C, S }
Ejemplo 4: Consideremos el experimento que consiste en arrojar una moneda cuatro veces y se cuenta el número total de
caras obtenidas. En este caso S = { 0, 1, 2, 3, 4}
Ejemplo 5: Consideremos el experimento que consiste en arrojar una moneda cuatro veces y se observa la sucesión de caras
y sellos obtenidos. En este caso S puede representarse de la siguiente manera
S = { a1 a2 a3 a4 / ai = C o S, ai resultado del i-ésimo lanzamiento}
Ejemplo 6: Se fabrican artículos en una línea de producción y se cuenta el número de artículos defectuosos producidos en
un período de 24 horas.
TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -2
S = {0, 1, 2, ,..., N}, donde N es el número máximo de artículos que se pudo producir en 24 horas.
Ejemplo 7: El ala de un avión se arma con un gran número de remaches. Se cuenta el Nº de remaches defectuosos.
S = {0, 1, 2, ,..., M}, donde M es el número de remaches instalados.
Ejemplo 8: Se lanza un proyectil. Después de un tiempo determinado t, se anotan las tres componentes de la velocidad vx,
vy y v z.
S = { (vx , vy , vz.) / vx, vy y vz son números reales}
Ejemplo 9: Se observa un proyectil recién lanzado, en tiempos t1, t2, ...,tn .En cada oportunidad se anota la altura del proyectil
sobre el suelo.
S = { (h1, h2, ... , hn ) / hi  0 , i = 1, 2, ... , n }
Ejemplo 10: Medir la resistencia a la tensión de una barra de acero.
S={s/s0 }
Ejemplo 11: Un termómetro marca la temperatura continuamente en un período de 24 horas. En un sitio y una fecha
señalados, “leer” dicho termómetro.
Este espacio muestral es uno de los más importantes que aquí se consideran. Prácticamente debemos suponer que la
temperatura en cierta localidad específica nunca puede subir o bajar con relación a ciertos valores, digamos M y m. Fuera
de esta restricción, debemos admitir la posibilidad de que aparezca cualquier gráfica con determinadas características. Es
posible que esta no tenga saltos ( esto es, representará una función continua). Además, la gráfica tendrá ciertas
características de suavidad que pueden resumirse en forma matemática al decir que la gráfica representa una función
diferenciable. Así, finalmente podemos enunciar que el espacio muestral es
S = { f / f es una función diferenciable, que satisface m  f( t )  M , para toda t }
Ejemplo 12: Se seleccionan en forma aleatoria 3 artículos
de un proceso de manufactura. Se examina cada uno de
ellos y se les clasifica como defectuoso D, o no defectuoso
N.
Para enlistar los elementos del espacio muestral,
de tal manera que se registre la mayor información, se
construyó el diagrama de árbol siguiente

S = { DDD, DDN, DND, DNN, NDD, NDN, NND, NNN}

Ejemplo 13: En un lote de 10 artículos hay 3 defectuosos. Se elige un artículo después de otro (sin sustituir el artículo elegido
hasta que se obtiene el último artículo defectuoso. Se cuenta el número total de artículos sacados del lote.
S = { 3, 4, 5, 6, 7, 8, 9, 10}
NOTA: En experimentos aleatorios que implican la selección de artículos de un lote, es necesario indicar si el
artículo seleccionado será colocado de nuevo, o no, en el lote antes de seleccionar el siguiente. Por ejemplo, si
el lote contiene tres artículos {a, b, c } y el experimento consiste en seleccionar dos de ellos sin reemplazo (sin
reposición), entonces el espacio muestral puede representarse como S1 = {ab, ac, ba, bc, ca, cb }. Sin embargo,
si los artículos se devuelven al lote antes de seleccionar el siguiente, el muestreo se denomina con reemplazo
(con reposición). En este caso los resultados posibles son S2 = { aa, ab, ac, ba, bb, bc, ca, cb, cc }
SUCESOS O EVENTOS
En cualquier experimento dado quizás interese más el hecho de que ocurran ciertos sucesos que el
resultado de un elemento específico del espacio muestral. Por ejemplo podría ser interesante el suceso A que
consiste en obtener un número par si se lanza un dado. Esto sucederá si el resultado es un elemento del
subconjunto A = {2, 4, 6} del espacio muestral S del ejemplo 2. En el ejemplo 6 podría ser más interesante el
suceso B “el número de artículos defectuoso es mayor que 1”. Esto ocurriría si el resultado fuera un elemento
del subconjunto B = {DDN, DND, NDD, DDD} del espacio muestral S.

TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -3


A cada suceso se le asigna una colección de puntos muestrales, que constituyen un subconjunto del
espacio muestral.
DEFINICION:
Un SUCESO (O EVENTO) es un subconjunto del espacio muestral.

Si S = { s1, s2, ..., sn } los sucesos { s1 } ,{ s2 }, ... ,{ sn } (subconjuntos unitarios de S) se llaman sucesos
elementales (ó eventos simples).

EJEMPLO 14: Dado el espacio muestral S = {s / s > 0 }, donde s es la vida en años de determinado componente electrónico,
entonces el suceso A de que el componente se dañe antes del final del quinto año es el subconjunto
A = {s / 0  s  5 }.
Es posible que un suceso sea un subconjunto que incluya al espacio muestral en su totalidad, o que sea
el subconjunto vacío. Por ejemplo, si B = {s / s es un divisor par de 7}, entonces B =  dado que los únicos
divisores posibles de 7 son los números impares 1 y 7.
Diremos que se ha presentado el suceso A si y solo si el resultado s obtenido al efectuar el experimento
pertenece al conjunto A. Si en cambio s no pertenece a A se dice que no se ha presentado o no ha ocurrido
el suceso A. La no presentación de A equivale a la presentación de Ac llamado SUCESO COMPLEMENTARIO.
CONSECUENCIAS INMEDIATAS DE LA DEFINICION DE SUCESO
Del hecho que, de acuerdo a su definición, un suceso no es otra cosa que un subconjunto del espacio
muestral, se deduce que toda proposición relativa a sucesos se traduce en una correspondiente proposición
relativa a conjuntos.
IGUALDAD DE SUCESOS: Dos sucesos A y B se dicen iguales si la presentación de uno cualquiera de ellos
trae como consecuencia la presentación automática del otro.
Por ejemplo si S = {(x1, x2) / 1 x1  6, 1 x2  6 } es el espacio muestral asociado el experimento que consiste en arrojar
dos dados y sean los sucesos: A "la suma de los puntos de los dos dados es un Nº par" y B "los puntos obtenidos en ambos
dados tienen la misma paridad". Luego los sucesos A y B son iguales.
POR LO MENOS UNO DE DOS SUCESOS A Y B SE HA PRESENTADO: En términos de conjuntos, esto
significa que realizado el experimento, el resultado s obtenido pertenece al conjunto A, al B o a ambos a la vez;
esto es s pertenece al conjunto unión A U B.
LOS DOS SUCESOS A Y B SE HAN PRESENTADO SIMULTANEAMENTE: El suceso consistente en la
presentación simultánea de los sucesos A y B se denomina suceso intersección y se representa por A  B.
(Notaciones: A  B es lo mismo que A B)
LOS SUCESOS A Y B SON INCOMPATIBLES O MUTUAMENTE EXCLUYENTES: En términos de conjuntos
esta proposición significa que A  B = .
SE HA PRESENTADO A PERO NO B: Al efectuar la experiencia, el resultado s logrado pertenece a A pero no
a B o lo que es lo mismo pertenece simultáneamente a A y Bc , por consiguiente el suceso que consiste en la
presentación de A y en la no presentación de B es el suceso A  Bc y se denomina suceso diferencia A - B = A
 Bc.
LA PRESENTACION DE A IMPLICA LA PRESENTACION DE B : Esta afirmación significa en términos de
conjuntos que A  B.
CONTEO DE PUNTOS MUESTRALES
Uno de los problemas que los estadísticos deben considerar e intentar evaluar, es el elemento de aleatoriedad
que se asocia con la ocurrencia de ciertos sucesos cuando se lleva a cabo un experimento. Estos problemas
pertenecen al campo de la probabilidad, que estudiaremos a continuación. En muchos casos debe tenerse la
capacidad de resolver un problema de probabilidad mediante el conteo del número de puntos en el espacio
muestral sin necesidad de especificar cada uno de sus elementos. Frecuentemente se hace referencia al principio
fundamental del conteo llamado también regla de la multiplicación.
REGLA DE LA MULTIPLICACION
Si una actividad puede realizarse en k pasos sucesivos y si el paso 1 puede realizarse de n 1 formas, y si para
cada una de éstas formas el paso 2 puede realizarse de n2 formas, y si para cada una de las dos primeras se
puede efectuar un 3er paso en n3 formas diferentes, y así sucesivamente, entonces el número de actividades
posibles es n1  n2 ... nk .

TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -4


En el ejemplo 13 si la selección es sin reposición el primer artículo puede elegirse de 3 maneras, mientras que
el segundo artículo solo de 2 maneras. Luego los dos artículos pueden seleccionarse de 3  2 = 6 maneras,
esto es #S1 = 3  2 = 6.
Si la selección es con reposición el primer artículo puede elegirse de 3 maneras y el segundo artículo también
de 3 maneras. Luego los dos artículos pueden seleccionarse de 3  3 = 9 maneras, esto es #S2 = 3  3 = 9.
Determinar el número de puntos muestrales del espacio muestral del ejemplo 7.

INTRODUCCION A LA TEORIA DE LA PROBABILIDAD


Vamos a considerar ahora aquellos experimentos para los cuales el espacio muestral S, contiene un número
finito de elementos.
Es decir que S se puede escribir como S = { s1, s2, ..., sn}
La probabilidad de la ocurrencia de un evento que resulta de un experimento estadístico se evalúa
por medio de un conjunto de números reales llamados pesos o probabilidades que van de 0 a 1. Para
todo punto en el espacio muestral asignamos una probabilidad tal que la suma de todas las
probabilidades es 1. Si se tiene razón para creer que es bastante probable que ocurra cierto punto muestral
cuando se lleva a cabo el experimento, la probabilidad que se le asigne debería ser cercana a 1. Por el contrario
se le asignará una probabilidad cercana a 0 a un punto muestral que no es probable que ocurra.
A cada uno de los eventos elementales {si} asignamos un número pi = P{si},llamado la probabilidad de {si} que
satisface las condiciones siguientes:
a) pi  0, i = 1, 2, …, n
b) p1 + p2 + … + pn = 1
Esto es, a cada punto del espacio muestral se le asigna una probabilidad tal que la suma de todas las
probabilidades sea igual a 1.
Para encontrar la probabilidad de un evento A se suman todas las probabilidades asignadas a los
puntos muestrales de A.
Ejemplo: Se carga un dado de tal manera que un número par tiene el doble de posibilidades de presentarse que un número
impar. Si A es el suceso en el que se obtiene un número menor que 4 en un solo lanzamiento, halle P(A).
El espacio muestral asociado al experimento es S = { 1, 2, 3, 4, 5, 6 }. Se le asigna una probabilidad de w a cada número
impar y de 2w a cada número par. Dado que la suma de las probabilidades de todos los sucesos elementales debe ser 1
P({1}) + P({2}) + P({3}) + P({4}) + P({5}) + P({6}) = 1
Entonces w + 2w + w + 2w + w + 2w =1,
de lo que resulta w = 1/9
Dado que A = {1, 2, 3}, su probabilidad P(A) = P({1}) + P({2}) + P({3})
P(A) = 1/9 + 2/9 + 1/9 = 4/9
RESULTADOS IGUALMENTE PROBABLES
La suposición que más comúnmente se hace para espacios muestrales finitos es que todos los resultados son
igualmente probables. De ninguna manera esta suposición puede darse como un hecho; debe justificarse con
cuidado. Hay muchos experimentos para los cuales se garantiza tal suposición (por ejemplo en experimentos
tales como lanzar una moneda o un dado, todos los puntos muestrales tienen la misma probabilidad de
presentarse), pero también hay muchas situaciones experimentales en las cuales sería un error hacer tal
suposición (por ejemplo, sería muy poco realista suponer que es tan probable no recibir llamadas telefónicas en
una central entra la 1AM y las 2AM como entre las 5PM y las 6PM).
Si los n resultados son igualmente probables, se deduce que cada p i = 1 / n. Porque la condición p1 + p2 +
… + pn = 1 se convierte en n∙pi = 1 para toda i. Luego pi = 1 / n.
Para esta situación particular Laplace propuso la siguiente definición de probabilidad

DEFINICIÓN CLASICA DE PROBABILIDAD

Sea  un experimento aleatorio con un espacio muestral S finito, esto es


S = {s1, s2, s3, ... , sn }
Admitamos que todos los resultados posibles del experimento son “igualmente posibles” Sea finalmente A un
suceso con un número m de puntos muestrales. Bajo estas hipótesis precedentes, definimos como probabilidad
P(A) del suceso A al cociente m/n.
m
Esto es P(A) =
n

TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -5


Tal es la versión moderna de la definición clásica de probabilidad enunciada por Laplace en los siguientes
términos: “Probabilidad de un suceso es el cociente entre el número de casos favorables a su presentación y el
número total de casos posibles siempre que estos sean igualmente posibles.”
Los casos se dicen igualmente posibles si no existe ninguna razón que nos induzca a pensar que alguno de ellos
deba tener lugar con preferencia a los demás.
Los casos favorables de la definición de Laplace son todos aquellos para los cuales la realización de  conduzca
a un resultado s que pertenece al suceso A considerado. Por consiguiente son tantos como puntos muestrales
tiene A y los casos posibles son tantos como puntos muestrales tiene S.
De acuerdo con la definición (1), P(S) = 1 , P() = 0
Lanzamiento de dados
Ejemplo: Se lanza un dado y se supone que todos los resultados son igualmente probables. Luego el espacio muestral será
el del ejemplo 2. Nos interesa evaluar la probabilidad de que se presente un número mayor que 5. El evento de interés es
entonces A = {5, 6} y su probabilidad será
P( A ) = # A  2  1
#S 6 3
Ejemplo: Considérese un experimento que consiste en el lanzamiento de un dado equilibrado dos veces y nos interesa
evaluar la probabilidad de que la suma de los dos números sea mayor que 10. Denotemos con B tal evento.
Para evaluar P(B) un análisis del problema podría ser de la manera siguiente. El espacio muestral es S = {2, 3, 4, 5, 6, 7, 8,
9, 10, 11, 12 } donde cada uno de los resultados representa la suma de los dos dados y B = { 11, 12 }
No podemos aplicar la definición de Laplace para calcular la P(B) pues todos los resultados posibles no son igualmente
probables. Por ejemplo 12 es menos probable que 6.
A fin de aplicar la definición de Laplace, a menudo podemos reducir el problema a uno, en el cual todos los
resultados son igualmente posibles, mediante una selección apropiada del espacio muestral. Cada vez que sea
posible se debe hacer esto, puesto que en general simplifica los cálculos.
En el último ejemplo deberíamos considerar, en su lugar, el espacio muestral
S’ = {(1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,1), (2,2), (2,3), (2,4), (2,5), (2,6), (3,1), (3,2), (3,3), (3,4), (3,5), (3,6), (4,1), (4,2),
(4,3), (4,4), (4,5), (4,6), (5,1), (5,2), (5,3), (5,4), (5,5), (5,6), (6,1), (6,2), (6,3), (6,4), (6,5), (6,6) }
Donde los elementos de cada par ordenado representan el resultado del primer y del segundo lanzamiento, en ese orden.
lanzamiento y todos los puntos muestrales de S’ son igualmente probables.
Por lo tanto S consta de los 36 resultados posibles:
El suceso B del que nos interesa calcular la probabilidad será B = {(5,6), (6,5), (6,6)} ¿Por qué?
Luego aplicando la definición clásica de probabilidad, pues todos los puntos muestrales son igualmente posibles,
P(A) = # A = 3  0,0833
#S 36
La definición clásica de probabilidad tiene un campo de aplicación muy restringido. En efecto, toda vez que al
efectuar un experimento no se pueda razonablemente considerar a los resultados posibles como “igualmente
probables”, la definición resulta inaplicable. Tal es el caso en la mayoría de los problemas que se presentan por
ejemplo en las ciencias naturales.
Selección al Azar
En el ejemplo anterior y en muchos otros que vamos a considerar, nos interesa la elección al azar de uno o más
objetos de una colección dada. Definamos con precisión esta noción. Supongamos que tenemos N objetos,
digamos a1, a2, ... ,aN
a) Escoger al azar un objeto de los N objetos, significa que cada uno de ellos tiene la misma probabilidad
de ser elegido. Eso es,
Prob (elegir ai ) = 1 / N, i = 1, 2, ..., N
b) Escoger al azar dos objetos entre N objetos significa que cada uno de los pares de objetos (sin
considerar el orden) tiene la misma probabilidad de ser escogido que cualquier otro par. Por ejemplo, si
debemos elegir dos objetos al azar del conjunto {a1, a2, a3, a4 }, obtener a1 y a2 es tan probable como
obtener a3 y a4 , etc. Esta afirmación nos lleva de inmediato a la cuestión de cuántos pares diferentes
hay. Supóngase que hay K de tales pares. Entonces, la probabilidad de cada par sería 1 / K. Solo hay
que calcular K. ¿Cuánto vale K en este caso?
c) Escoger al azar n objetos ( n  N) entre N objetos significa que cada selección de n objetos (sin
considerar el orden) tiene tantas probabilidades de ser elegida como cualquier otra selección.
DEFINICION EMPIRICA DE PROBABILIDAD (Nos da una estimación de la probabilidad
Para cada experimento aleatorio  y para cada suceso A vinculado con él, postulamos la existencia de un número
P(A), dependiente en su valor de  y de A, que llamamos la probabilidad empírica de A. interpretamos las

TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -6


frecuencias relativas f1/n1, f2/n2, ... obtenidas en secuencias prolongadas de repeticiones de , como los valores
experimentales aproximados de P(A).
f
P(A)  , con n suficientemente grande.
n
Regla: Aproximación de la probabilidad por frecuencia relativa.
Realice (u observe) un experimento un gran número de veces y cuente las veces que ocurre el suceso A
entonces, P(A) se estima de la siguiente forma:
número de veces que ocurrió A
P(A) =
númerode veces que se repitióel experimento

Ejemplo: Para escoger entre varios fabricantes de computadoras, un agente de compras desea conocer la probabilidad de
que una computadora personal se descomponga durante los primeros dos años. Determine esa probabilidad.
Solución. Solo hay dos resultados: una computadora personal se descompone durante los dos primeros años o no lo hace.
Dado que las probabilidades de que ocurra cada uno de estos resultados no son iguales, hay que usar la aproximación de
frecuencia relativa. Esto requiere arreglárnoslas de alguna manera para observar un gran número de computadoras
personales. Una encuesta de PC World efectuada entre 4000 propietarios de computadoras personales revela que un
número de 992 tuvieron desperfectos durante los dos primeros años (las computadoras tuvieron desperfectos, no los
propietarios). Con base en ese resultad, estimamos que la probabilidad es de 992/4000 = 0,248.
Hay dos objeciones serias a este planteamiento (Leer Meyer)
a) No está claro cuan grande (¿1000? ¿2000? ¿10000?) debe ser n antes de que conozcamos el número
p que estabiliza la frecuencia relativa
b) Una vez que el experimento se ha descrito por completo y se ha especificado el evento A, el número que
buscamos no debe depender del experimentador o de una racha de suerte. (Por ejemplo, es posible que
con una moneda perfectamente balanceada que se lanzó 10 veces, resulten 9 caras y 1 sello. La
frecuencia relativa del evento A “salen caras” es igual a 9/10. Aunque es posible que en los 10
lanzamientos siguientes el modelo de caras y sellos pueda estar invertido.)
Lo que queremos es un medio de obtener tal número sin recurrir a la experimentación. Por supuesto, para que
el número estipulado sea significativo, cualquier experimento debería dar una frecuencia relativa “cercana” al
valor estipulado, en especial si el número de repeticiones en las cuales se calculó la frecuencia relativa es muy
grande.
Planteamos ahora una definición de probabilidad que posee las características formales de una definición
matemática estricta, definiendo el concepto de probabilidad de manera axiomática.
DEFINICION AXIOMATICA
Sea S el espacio muestral asociado a un experimento aleatorio  y sean A, B, C, ... , A1, A2, A3, ...sucesos
asociados a S.
Llamamos probabilidad a toda función P que asocia a cada suceso de A de S un número real y que cumple
los siguientes axiomas:
Axioma 1. P(A)  0 para todo suceso A de S
Axioma 2. P(S) = 1
Axioma 3. Si A1, A2, A3,  son sucesos de S disjuntos dos a dos (mutuamente excluyentes), Ai  Aj =
   
 ,  i  j , entonces P  A k    P(A k )
 k 1  k 1
[esto es P (A1  A2  A3  ) = P(A1) + P(A2) + P(A3) + ]
se llama Propiedad de Aditividad de la probabilidad cuando los sucesos son disjuntos dos a dos.

CONSECUENCIAS PRINCIPALES DE LOS AXIOMAS


Teorema 1: P() = 0
Demostración: definamos una sucesión de subconjuntos de S : A1, A2, A3,  tales que A1 = , A2 = , A3= ,
 , esto es Ai =  para todo i.
Luego Ai  Aj =  ,  i  j  Ai son disjuntos dos a dos y se cumplen las hipótesis del axioma 3. por consiguiente
P(A1  A2  A3  ) = P(A1) + P(A2) + P(A3) + 
P (    3  ) = P() + P() + P() + 
P () = P() + P() + P() +  (2)
Por el axioma 1, P(A)  0 para todo suceso A. Luego (2) se satisface solo si P() = 0
Teorema 2: Si A  B =  entonces P (A  B) = P(A) + P(B)
Demostración: Consideremos la sucesión A1 = A, A2= B, A3= , A4= , 
TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -7
Ai  Aj =  ,  i  j pues: A1  Aj = A   = , si j = 3, 4, ...
de igual modo A2  Aj = B   = , si j = 3, 4, ...
y por hipótesis A1  A2 = A  B = .
Luego por el axioma 3: P(A  B    ) = P(A) + P(B) + P() + P() 
son iguales a 0 por Teor.1
Entonces P(A  B) = P(A) + P(B)
Teorema 3: Si A, B, C son sucesos disjuntos dos a dos, A  B = , A  C =  y B  C =  puede
demostrarse que
P(A  B  C) = P(A) + P(B) + P(C)

Demostración: La demostración consiste en escribir A  B  C como (A  B)  C y aplicar el resultado del


teorema anterior.
(A  B) y C son disjuntos dado que
(A  B)  C = (A  C)  (B  C) =    = ,
entonces por el teorema 2
P(A  B  C) = P[(A  B)  C] = P(A  B) + P (C) (3)
Pero A y B son disjuntos, luego P(A  B) = P(A) +P(B),
Reemplazando esta última expresión en (3) resulta
P(A  B  C) = P(A) + P(B) + P(C)

Teorema 4: Si A1, A2, A3,  , An es una sucesión finita de sucesos disjuntos dos a dos
Ai  Aj =  ,  i  j , i , j = 1, 2, ...,n, entonces
P (A1  A2    An) = P(A1) + P(A2) + …+ P(An)
Se demuestra por inducción matemática.
Teorema 5: Para cualquier suceso A del espacio muestral S, P(AC) = 1 – P(A)
Demostración: Es inmediato pues para todo suceso A valen las relaciones
A  AC =  y A  AC = S
AC
Por Teo.2 P(A  A ) = P(A) + P(AC)
C

P(S) = P(A) + P(AC)


Por el axioma 2, P(S)=1 A
Luego P(A) + P(AC) = 1  P(AC) = 1 - P(A) S

Observación: Este es un resultado muy útil porque indica que cada vez que deseamos calcular P(A) en su lugar
podemos calcular P(AC) y obtener el resultado deseado por una simple resta.
Teorema 6: Si A y B son sucesos tales que A  B entonces P(A)  P(B)
Demostración: Podemos descomponer B en dos sucesos mutuamente excluyentes.
En el diagrama de Venn podemos observar que A B = A y
AC  B son sucesos disjuntos pues
A  (AC  B) =  y además forman una partición
A del conjunto B pues
B B = A  (AC  B)
Luego por el teorema 2 resulta
S P(B) = P(A)+ P(AC  B)  P(A)
Dado que por el axioma 1, P(A)  0 y P(AC  B)  0
Luego P(B)  P(A)

Observación: Este resultado es intuitivamente atractivo, porque dice que si B debe ocurrir cada vez que ocurre
A, entonces B es al menos tan probable como A.
Teorema 7: Para todo suceso A de S se verifica 0 ≤ P(A)  1
Dem: Sabemos que todo conjunto A contiene al conjunto vacío ϕ y está contenido en el espacio muestral S, esto
es ϕ  A  S
Por el teorema 6 P(ϕ)  P(A)  P(S) ……… (1)
Por el Axioma 2 P(S)= 1 y por el teorema 1 P(ϕ)= 0, reemplazando en (1) resulta:
0  P(A)  1
Teorema 8: Si A y B son sucesos cualesquiera, entonces
P (A  B) = P(A) + P(B) - P(A  B)
Demostración: La idea de esta demostración es descomponer A  B y B en sucesos mutuamente

TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -8


excluyentes y luego aplicar el teorema 2
Así escribimos A  B = A  (B  AC ),
B = (A  B)  (B  AC ),
Por lo tanto P(A  B) = P(A) + P(B  AC)
P(B) = P(A  B) + P (B  AC ).
Restando la segunda ecuación de la primera, tenemos
P(A  B) – P(B) = P(A) – P(A  B),
Despejando P(A  B) se obtiene el resultado.
Teorema 9: Si A, B y C son tres sucesos cualesquiera, entonces
P(A  B  C) = P(A) + P(B) + P(C) – P(A B) – P(A  C) – P(B  C) + P(A  B  C)
Demostración: La demostración consiste en escribir A  B  C como (A  B)  C y aplicar el resultado del
teorema anterior.
PROBABILIDAD CONDICIONAL E INDEPENDENCIA
PROBABILIDAD CONDICIONAL
Supongamos que se realiza un experimento cuyo espacio muestral es S y también que se han
especificado la probabilidad para todos los sucesos de S. Vamos a estudiar ahora la forma en que cambia la
probabilidad de un suceso A cuando se sabe que otro suceso B ha ocurrido. Esta nueva probabilidad se llama
la probabilidad condicional del suceso A dado que ha ocurrido el suceso B y se denota por P(A  B). Por
conveniencia, esta notación se lee simplemente como la probabilidad de A dado B.
Si se sabe que ha ocurrido el suceso B, entonces se sabe que el resultado del experimento es uno de
los incluidos en B, luego B se llama espacio muestral reducido. Por tanto, para evaluar la probabilidad de que
ocurra A, se debe considerar el conjunto de los resultados incluidos en B que también implican la ocurrencia de
A. Como se presenta en la figura este conjunto es precisamente el conjunto A  B.

S
A B

Resulta, por lo tanto natural definir la probabilidad Condicional P(A B) como la proporción de la probabilidad
total P(B) representada por la probabilidad P(A  B).
Estas consideraciones conducen a la siguiente definición:
DEFINICION 2.1
P(A  B)
Si A y B son dos sucesos cualesquiera tales que P(B) > 0, entonces P(A | B) =
P(B)
La P(A B) no está definida si P(B) = 0.

Nota: Tenemos dos formas de calcular la probabilidad condicional de A dado que ha ocurrido B:
a) En forma directa considerando la probabilidad de A respecto al espacio muestral reducido B (es decir
tomando a B como espacio muestral).
b) Usando la definición anterior, donde P(A  B) y P(B) se calculan respecto al espacio muestral original
S.
Ejemplo 1: Se extrae una carta de una baraja estándar de 52 cartas de póquer. Si se dijera que la carta era negra, ¿cuál es
la probabilidad de que sea un as?
Solución I: resolvemos el problema usando la definición 2.1.
S = {♥As, ♥2, ♥3, ..., ♥10, ♥J, ♥Q, ♥K, ♦As, ♦2, ..., ♦K, ♠As, ♠2 , ..., ♠K, ♣As, ♣2, ..., ♣K}
Consideramos los dos sucesos A “la carta extraída es un As” y B “la carta extraída es negra”, luego nos piden calcular P(A
B).
A = {♥As, ♦As, ♠As, ♣As} B = {♠As, ♠2 , ..., ♠K, ♣As, ♣2, ..., ♣K} A  B = {♠As, ♣As}
Dado que todos los 52 puntos muestrales de S son igualmente posibles, usando la definición clásica de probabilidad resulta:
1
P(A  B) = 2  1 y P(B) = 26  1 , luego P(A B) = 26  1
52 26 52 2 1 13
2
(Vuelva a resolver el problema usando el espacio muestral reducido B.)
Solución II: hay otra forma de “contemplar” un espacio muestral en particular. Podemos asignar los sucesos apropiados a
una tabla de clasificaciones cruzadas. A esta tabla también se la conoce como tabla de contingencia. Si las dos variables de
interés para el ejemplo de las cartas fueran “existencia o no de un As” y “color de la carta”, una tabla de contingencia 2 
2 sería
TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -9
Color de la carta
roja negra total
As 2 2 4
No es un As 24 24 48
Total 26 26 52
Los valores da cada celda de la tabla se obtuvieron subdividiendo el espacio muestral de las 52 carta de acuerdo al número
de ases y al color de la carta.
P(A  B) 2
P(A B) = = 52  1
P(B) 26 13
52

Ejemplo 2. El siguiente cuadro corresponde a una encuesta realizada sobre 1809 personas como parte de un estudio
realizado para analizar que medicamentos toma la gente para cuatro dolencias determinadas.
MEDICAMENTO

PADECIMIENTO Ibuprofeno (I) Dipirona (D) Aspirina (A) Otro (O) Total
Neuralgia (N) 107 47 198 24 376
Resfrío (R) 98 41 401 30 570
Malestar gástrico (MG) 302 60 0 23 385
Dolor de cabeza (DC) 0 242 210 26 478
Total 507 390 809 103 1809
Dado que se selecciona al azar, entre las 1809, a una persona y resulta que padece resfrío, ¿cuál es la probabilidad de que
tome aspirina?
Solución: En primer lugar proponemos un espacio muestral S formado por puntos muestrales igualmente probables, por
ejemplo al seleccionar al azar a una persona podríamos registrar su DNI, su enfermedad y el medicamento que consume,
luego s = Nº de DNI- enfermedad que padece- medicamento.
S= { 15876897-R-D, 10878987-MG-O,....
Nos interesaremos en los siguientes sucesos:
R “la persona padece resfrío” y A “la persona consume aspirina”
Para resolverlo usamos el espacio muestral reducido (defínalo) y encontramos
P(A R) = 401 / 570 0,704
Otra forma de resolver el problema usando la definición 2.1:
P( A  R ) 401/ 1809
P(A R) = = 0,704
P(R) 570/1809
INDEPENDENCIA ESTADISTICA
Nótese que en el ejemplo 1 la probabilidad de que la carta elegida sea un As, sabiendo que es negra es
1/13. Observemos que sin información a priori, la probabilidad de sacar un As de la baraja (de 52 cartas) es 4/52
= 1/13. Este resultado revela información importante. El conocimiento previo de que la carta era negra no afectó
la probabilidad de que ésta fuera un As.
A esta característica se la denomina independencia estadística y se puede definir de la siguiente manera:
DEFINICION 2.2
Dos sucesos A y B son independientes si y solo si P(A B) = P(A) y P(B A) = P(B)
De otra forma se dice que son dependientes.
La condición P(A B) = P(A) implica que P(B A) = P(B) y viceversa. Demostrar.
Observación: esta definición afirma que A y B son independientes si el conocimiento de la ocurrencia de B no
influye de modo alguno en la probabilidad de ocurrencia de A [P(A B) = P(A)]
En el problema 1, como ya lo expresamos los sucesos A y B son independientes, dado que
P(A B) = 1/13 y P(B) = 1/13, luego P(A B) = P(B) y concluimos que A y B son independientes.
Ejemplo 3. El comisario de “Pico Truncado” clasifica los delitos por edad (en años) de la persona que lo cometió, y si el crimen
es con violencia o no. Según se muestra a continuación, al comisario se le informó de un total de 150 delitos cometidos
durante el año pasado

Edad en años
Tipo de delito Menos de 20 20 a 40 40 o más Total
Con violencia 27 41 14 82
Sin violencia 12 34 22 68

TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -10


Total 39 75 36 150
Se quiere analizar si el haber cometido un delito con violencia es independiente de que la persona que lo comete tenga
menos de 20 años.
Nos interesamos en los siguientes sucesos: E “el delito fue cometido por un menor de 20 años” y V “el delito fue con violencia”.
Analizamos las probabilidades
P(E V) = 27 0,329 y P(E) = 39 = 0,26.
82 150
Luego P(E V)  P(E) y esto nos dice que los sucesos analizados no son independientes, sino dependientes.
Observe que la proporción de personas menores de 20 años que se sabe que han cometido delito con violencia es mayor
que la proporción de personas menores de 20 años que han cometido delito.
Teorema:
Dos sucesos A y B son independientes si y solo si P(A  B) = P(A) P(B)
¡¡Demostrar!!
Definición:
Decimos que los tres sucesos A, B y C son mutuamente independientes si y solo si todas las condiciones
siguientes se satisfacen
P(A  B  C) = P(A) P(B) P(C) P(A  B) = P(A) P(B)
P(A  C) = P(A) P(C) P(B  C) = P(B) P(C)
Si A y B son independientes, entonces la ocurrencia o no ocurrencia de A no debería estar relacionada con la
ocurrencia o no ocurrencia de B. Por lo tanto si A y B satisfacen la condición matemática de independencia,
entonces debería ser cierto que AC y B son estadísticamente independientes, lo mismo que A y B C y que AC y
BC.
Teorema:
Si A y B son sucesos independientes, entonces
a) A y BC también los son.
b) AC y B también los son.
c) AC y BC también los son.
REGLAS MULTIPLICATIVAS
La fórmula para la probabilidad condicional se puede manejar en forma algebraica, para que la probabilidad conjunta
P(A  B) se pueda determinar a partir de la probabilidad condicional de un suceso
De acuerdo a 2.1 P(A B) = P(A  B) , luego P(A  B) = P(A B) P(B)
P(B)

Ejemplo 3 Selección de dos bolillas. Supóngase que se van a extraer dos bolillas al azar y sin reemplazamiento de una urna
que contiene r bolillas rojas y b bolillas azules. Determinar la probabilidad de que la primera bolilla sea roja y la segunda
azul.
Solución: Consideremos los sucesos A “la primera bolilla es roja” y B “la segunda bolilla es azul”
Obviamente P(A) = r
r b
Además, si ha ocurrido A, entonces se ha obtenido una bolilla roja de la urna, en la primera extracción. Por lo tanto la
probabilidad de obtener una bolilla azul en la segunda extracción será:
P(B A) = b
r  b -1
r
Resulta que P (A  B) = P(B A) P( A), luego P (A  B) = b

r  b -1 rb
El principio que se acaba de aplicar puede extenderse a cualquier número de sucesos como se afirma en el
siguiente teorema.
TEOREMA DEL PRODUCTO
Supóngase que A1, A2, ..., An son sucesos que verifican la condición P(A1 A2 ... An-1) >0, entonces
P(A1 A2 A3  An-1 An) = P(A1 ) P(A2.A1) P(A3A1A2)  P(An A1A2  An-1 )
Demostración: El producto de probabilidades del segundo miembro es igual a
P(A 1A 2 ) P(A 1A 2 A 3 ) P(A 1A 2  A n )
P(A1 )    = P(A1 A2 A3  An-1 An)
P(A 1 ) P(A 1A 2 ) P(A 1A 2  A n-1 )

TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -11


Puesto que P(A1 A2 ... An-1) >0 cada uno de los denominadores de este producto debe ser positivo y pueden
hacerse las simplificaciones indicadas.
Ejemplo 4 Selección de cuatro bolillas
Se extraen cuatro bolillas al azar y sin reemplazamiento de una urna que contiene r bolillas rojas (r  2) y b bolillas azules
(b  2). Determinar la probabilidad de obtener la sucesión de resultados: roja, azul, roja, azul
Si se denota: Rj “se obtiene una bolilla roja en la j-ésima extracción” y Bj “se obtiene una bolilla azul en la j-ésima extracción”
con j = 1, 2, 3, 4.
Luego P(R1 B2 R3 B4) = P(R1)  P(B2 R1)  P(R3 R1 B2)  P(B4 R1 B2R3)

= r 
b 
r 1  b 1
r  b r  b -1 r  b - 2 r  b - 3
Del teorema del producto se concluye que si los sucesos A1, A2, ..., An son independientes, entonces P(A1 A2 A3
 An-1 An) = P(A1 ) P(A2) P(A3)  P(An)
TEOREMA DE LA PROBABILIDAD TOTAL
Sea S el espacio muestral de un experimento y considérense los n sucesos A 1, A2, A3, ,Ak- de S de
k
forma que A1, A2, A3, ,Ak sean mutuamente excluyentes y  A i  S . Se dice que estos sucesos forman una
i 1
partición de S.
Si los k sucesos A1, A2, A3, ,Ak constituyen una partición de S y si B es cualquier otro suceso en S.

Entonces los sucesos A1 B, A2 B,  , Ak B constituyen una partición de B, como se ilustra en la figura. Por tanto
se puede escribir
B = A1 B  A2 B    Ak B
Además puesto que los k sucesos del segundo miembro son disjuntos dos a dos. (Verificar),
P(B) = P(A1 B) + P(A2 B) +  + P(Ak B)
Finalmente si P(Aj) > 0 para j = 1, 2,  , k, entonces
P(Aj B) = P(Aj) P(B Aj)
y resulta que
P(B) = P(A1) P(B A1) + P(A2) P(B A2) +  + P(Ak) P(B Ak)
En síntesis se ha obtenido el siguiente resultado: Supóngase que los sucesos A 1, A2, A3, ,Ak de S forman una
partición del espacio muestral S y que P(Aj) > 0 para j = 1, 2,  , k. Entonces para cualquier suceso B de S
k
P(B) =  P( A j ) P(B Aj)
j 1

Ejemplo: Para la fabricación de un gran lote de artículos similares se utilizaron tres máquinas M 1, M2 y M3. Supóngase que
el 20% de los artículos fueron fabricados por la máquina M1, el 30% por la máquina M2 y el 50% por la máquina M3.
Supóngase además que el 1% de los fabricados por la máquina M1 son defectuosos, el 2% de los fabricados por la máquina
M2 son defectuosos y que el 3% de los fabricados por la máquina M3 son defectuosos.
Se selecciona al azar uno de los artículos del lote, determinar la probabilidad de que este artículo sea defectuoso.
Solución. Sean los siguientes sucesos Ai (i = 1, 2, 3)
A1 “ el artículo seleccionado ha sido fabricado por la máquina M1”,
A2 “ el artículo seleccionado ha sido fabricado por la máquina M2”,
A3 “ el artículo seleccionado ha sido fabricado por la máquina M3”,
y sea B el suceso de que el artículo seleccionado sea defectuoso. Hay que calcular la probabilidad de B.
La probabilidad de que un artículo seleccionado al azar haya sido producido por la máquina Mi , es, para i = 1,2,3:
P(A1) = 0,2 P(A2) = 0,3 P(A3) = 0,5
Además la probabilidad P(B Ai) de que un artículo producido por la máquina Mi sea defectuoso es:
P(B A1) = 0,01 P(B A2) = 0,02 P(B A3) = 0,03

TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -12


Luego resulta que
P(B) = P(A1) P(B A1) + P(A2) P(B A2) + P(A3) P(B A3)
P(B) = (0,2) (0,01) + (0,3)(0,02) + (0,5)(0,03) = 0,023
TEOREMA DE BAYES (Bayes - Sacerdote inglés 1702-1761)
Supóngase que los sucesos A1, A2, A3, ,An constituyen una partición del espacio muestral S tal que
P(Aj) > 0 con j = 1, 2,  , k y sea B cualquier suceso de S tal que P(B) > 0.
Entonces para todo i= 1, 2, ..., k
P( A i ) P( B A i )
P(Ai  B) =
k
 P( A j ) P( B A j )
j 1

Demostración:
P( A i B) P( A i ) P ( B A i )
P(Ai  B) = =
P( B) k
 P ( A j ) P( B A j )
j 1
El teorema de Bayes proporciona una regla sencilla para calcular la probabilidad condicional de cada suceso A i
dado que ha ocurrido B, a partir de la probabilidad condicional de B dado cada uno de los sucesos A j y las
probabilidad incondicional de cada Aj.
En el ejemplo anterior supóngase que se selecciona al azar uno de los artículos del lote y que resulta ser defectuoso.
Determinar la probabilidad de que este artículo haya sido fabricado por la máquina M2.
Solución: Hay que calcular la probabilidad condicional P(A2 B).
Del teorema de Bayes resulta que P(A2  B) = P( A 2 ) P(B A 2 ) = 0,26
P(B)

BIBLIOGRAFIA:
 Probabilidad y Estadística para ingeniería y Ciencias – Walpole-Myers- Myers – Ye - 2007
 Probabilidad y Aplicaciones Estadísticas – Meyer- Addison-Wesley Iberoamericana, S.A.
 “Lecciones de Cálculo de Probabilidades y Elementos de Estadística.” Dr Félix Herrera –Centro de
Estudiantes de Ingeniería- Universidad Nacional de Tucumán.
 Estadística Matemática con Aplicaciones- Wackerly Mendenhal lIII- Scheaffer – 2002- Thomson.
 Estadística para Ingenieros.- Bowker y Lieberman
 Matemática con Aplicaciones- Wackerly Mendenhal lIII- Scheaffer – 2002- Thomson.
 Bioestadística. Base para el análisis de las ciencias de la salud. Daniel. 2000- Ed. Limusa S.A. de C.V.
Grupo Noriega Editores.

TEORIA DE LA PROBABILIDAD - APUNTE DE CLASE – MARTA CORRO -13

También podría gustarte