Módulo 2 Estadística
Módulo 2 Estadística
Módulo 2 Estadística
PID_00268874
Ninguna parte de esta publicación, incluido el diseño general y de la cubierta, puede ser copiada,
reproducida, almacenada o transmitido de ninguna manera ni por ningún medio, tanto eléctrico
como químico, mecánico, óptico, de grabación, de fotocopia, o por otros métodos, sin la autorización previa
por escrito de los titulares del copyright.de los titulares del copyright.
©FUOC • PID_00268874 Probabilidad
Índice
Sesión 1
Introducción a la probabilidad ........................................................ 5
1. Introducción ........................................................................................ 5
2. Acontecimientos o sucesos aleatorios ................................................. 5
2.1. El suceso seguro ............................................................................ 7
2.2. El suceso imposible ....................................................................... 7
3. Operaciones con sucesos ...................................................................... 7
3.1. Intersección de sucesos y sucesos incompatibles ......................... 7
3.1.1. Sucesos incompatibles ....................................................... 8
3.2. Unión de sucesos .......................................................................... 8
3.3. Complementario de un suceso ..................................................... 9
3.4. Tablas de sucesos .......................................................................... 10
4. Resumen ............................................................................................... 11
Ejercicios ................................................................................................... 12
Sesión 2
Combinatoria y técnicas de recuento ............................................. 15
1. La regla del producto ........................................................................... 15
2. Variaciones ........................................................................................... 16
2.1. Variaciones con repetición ........................................................... 18
3. Permutaciones ...................................................................................... 18
4. Combinaciones .................................................................................... 19
5. Resumen ............................................................................................... 21
Ejercicios ................................................................................................... 22
Sesión 3
Probabilidad .......................................................................................... 24
1. Introducción y frecuencia relativa ....................................................... 24
2. La teoría de la probabilidad ................................................................. 26
3. Propiedades que se derivan de la definición de probabilidad ............. 27
3.1. La probabilidad del suceso imposible ........................................... 27
3.2. La probabilidad del complementario ........................................... 27
3.3. La probabilidad de la unión ......................................................... 27
4. Asignación de probabilidad cuando los resultados son equiprobables.
Regla de Laplace ................................................................................... 29
5. Probabilidades en espacios muestrales no uniformes
y frecuencia relativa ............................................................................. 30
6. Probabilidad condicionada .................................................................. 31
6.1. Relación entre probabilidad condicionada
y probabilidad de la intersección .................................................. 33
7. Independencia de sucesos .................................................................... 34
©FUOC • PID_00268874 Probabilidad
8. Resumen ............................................................................................... 35
Ejercicios ................................................................................................... 37
Sesión 4
El teorema de Bayes ............................................................................. 44
1. Particiones ............................................................................................ 44
2. Teorema de las probabilidades totales ................................................. 45
3. Árboles de probabilidad y probabilidad condicionada ....................... 46
4. Tablas de contingencia ........................................................................ 48
5. El teorema de Bayes ............................................................................. 50
6. El teorema de Bayes sobre un árbol de probabilidades ....................... 51
7. Resumen ............................................................................................... 53
Ejercicios ................................................................................................... 55
©FUOC • PID_00268874 5 Probabilidad
Introducción a la probabilidad
1. Introducción
Experimento aleatorio es aquel que tiene diferentes resultados posi- espacio muestral.
i resultado posible.
bles, de los que no tenemos certeza sobre cuál se producirá realmente.
Además, es preciso que el experimento se pueda repetir en condiciones
idénticas tantas veces como sea necesario.
• C{3, 4, 5, 6}. En este caso el suceso C corresponde a “sacar un valor superior o igual
a 3”; Card(C) 4.
El suceso seguro es el que está formado por todos los resultados posi-
bles; es decir, es el mismo espacio muestral . Ejemplo de un suceso
seguro
Ejemple de suceso
El suceso imposible, denotado por (conjunto vacío), es el suceso imposible
que no ocurre nunca. Evidentemente, Card() 0. Lanzamos un dado y conside-
ramos el suceso “sacar un 26”.
¡Seguro que eso no pasa nun-
ca! Otro ejemplo de suceso im-
posible es “sacar un número
par y múltiplo de 5”.
3. Operaciones con sucesos
Acabamos de ver que podemos determinar un suceso por medio del conjunto
de resultados posibles de un experimento aleatorio. Evidentemente, la des-
cripción puede ser muy compleja y a veces interesa mezclar u operar ciertos
sucesos para describir situaciones más complicadas. También hemos visto que
un acontecimiento es, de hecho, el conjunto de los resultados que contiene:
por tanto, todas las propiedades de los conjuntos y de las operaciones con con-
juntos son válidas para sucesos.
ilustrar gráficamente estas operaciones, nos será útil utilizar los conocidos
Número de elementos
diagramas de Venn. de A B
Más adelante será muy importante saber si dos sucesos tienen resultados en
común o no; esto conduce a la definición de sucesos incompatibles.
Ejemplo de sucesos
Dos acontecimientos son incompatibles si no tienen ningún resultado incompatibles
en común, es decir, si A B es el suceso imposible. Dicho de otra ma- Los sucesos “sacar un número
menor que 2” y “sacar un nú-
nera, A y B son incompatibles si son conjuntos disyuntos, es decir, si
mero par mayor o igual que 4”
A B . En este caso Card(A B) 0. son sucesos incompatibles.
Es decir, unir los sucesos A y B sirve para crear un suceso mayor que contiene
los resultados de A más los resultados de B. Es fácil ver que:
Observad que en Card(A) Card(B) cuentan dos veces los elementos de la in-
tersección (una vez por pertenecer a A y una vez por pertenecer a B); en
Card(A) Card(B) Card(A B), cada elemento de la unión está contado
una sola vez.
Notación
El suceso AC (leído complementario de A) está formado por aquellos
resultados que no son favorables a A. A veces se escribe A o C(A) en
lugar de AC.
Si B {1, 2, 5}, entonces Bc {3, 4, 6}, precisamente los resultados que no están en B. Si el
suceso es A ”sacar un número par”, entonces A {2, 4, 6} y AC {1, 3, 5}, que se corres-
ponde, como cabía esperar, con los números impares. Gráficamente:
©FUOC • PID_00268874 10 Probabilidad
Complementario
Card(AC) Card() Card(A) e incompatibilidad
En ocasiones nos puede resultar útil confeccionar una tabla en la que se vean
claramente los resultados que pertenecen a cada suceso y a ciertas operaciones
con los sucesos. Por ejemplo, en el caso del dado y si el suceso A es “sacar un
número par” y el suceso B es “sacar un número mayor que 3”, entonces A {2,
4, 6} y B {4, 5, 6}, podemos construir una tabla como ésta, en la que vamos
marcando qué resultado pertenece a cada suceso:
Posible
resultado: ¿Es de ¿Es de
¿Es de A? ¿Es de B? ¿Es de AC?
Valor A B? A B?
del dado
1 No No No No Sí
2 Sí No Sí No No
3 No No No No Sí
4 Sí Sí Sí Sí No
5 No Sí Si No Sí
6 Sí Sí Sí Si No
4. Resumen
Ejercicios
1 Doors95 Lenteron
2 Doors98 FortiumII
3 Doors95 Lenteron
4 Doors2000 FortiumII
5 Doors95 Lenteron
6 Doors98 Lenteron
7 Doors95 Lenteron
8 Doors98 FortiumII
9 Doors95 FortiumII
10 Doors2000 FortiumII
Solucionario
1.
El experimento aleatorio consiste en escoger un ordenador al azar y, por tanto,
cada uno de los diez ordenadores es un resultado posible. Es decir, {1, 2, 3,
4, 5, 6, 7, 8, 9, 10}, si suponemos que tenemos los ordenadores numerados del
1 al 10.
©FUOC • PID_00268874 13 Probabilidad
1 No No No No Sí Sí No Sí
2 Sí Sí Sí Sí No No No Sí
3 No No No No Sí Sí No Sí
4 No SÍ Sí No Sí No Sí Sí
5 No No No No Sí Sí No Sí
6 Sí No Sí No No Sí No No
7 No No No No Sí Sí No Sí
8 Sí Sí Sí Sí No No No Sí
9 No SÍ Sí No Sí No Sí Sí
10 No SÍ Sí No Sí No Sí Sí
d) Bc “no tener FortiumII” {1, 3, 5, 6, 7} (en este caso será tener Lenteron)
2.
El espacio muestral se puede distribuir en forma de tabla en la que la fila re-
presenta el valor de la primera tirada y la columna, el valor de la segunda.
1 2 3 4 5 6 Card(A)=6
Card(B^c)=21
©FUOC • PID_00268874 14 Probabilidad
y Card(A) 6.
2) Las variaciones
3) Las permutaciones
1) ¿Se tienen que agrupar todos los objetos disponibles o sólo unos cuántos?
2) ¿Podemos repetir los objetos en las agrupaciones o bien en éstas los objetos
deben ser todos diferentes?
Nuestra empresa monta ordenadores y los clientes pueden escoger algunas de las carac-
terísticas del equipo: concretamente, pueden escoger entre 64 ó 128 MB de memoria
RAM, disco duro de 6, 12 ó 20 GB y pantalla de 14 ó de 16 pulgadas, opciones que se
pueden mezclar de todas las maneras posibles. ¿Cuántos modelos diferentes de ordena-
dor podemos ofrecer a nuestros clientes? Mediante un diagrama de árbol podemos dis-
poner fácilmente de todas las configuraciones posibles.
2. Variaciones
Supongamos que queremos considerar todas las posibles palabras (en el sentido de secuen-
cias de letras, aunque no tengan sentido) de tres letras que se pueden formar usando sólo
letras de la palabra SRAM (por tanto, N 4). Lo haremos mediante un árbol en el que se vea
que a cada paso tenemos una posibilidad de elección menos y que necesitamos tres pasos
para construir los subconjuntos ordenados de tres elementos. Observad que, de hecho, es
como si escogiésemos tres letras de la palabra SRAM y después las ordenásemos de todas las
formas posibles, ya que ordenaciones diferentes dan lugar a “palabras” diferentes.
Observamos que tenemos que hacer k elecciones y que en cada una tenemos
una posibilidad menos que en la anterior. Aplicando la regla del producto, po-
demos saber fácilmente el número total de posibles agrupaciones.
N! -
N N – 1 N – k + 1 = ---------------------
N – k !
Ejemplo
La revista PC Universe nos envía una lista de veintitrés portátiles y nos pide que devolva-
mos la lista de los que creamos que son los cinco mejores, ordenada de la forma: primero,
©FUOC • PID_00268874 18 Probabilidad
segundo, tercero, cuarto y quinto. En este caso tenemos que ordenar 5 (k) portátiles
como mejores portátiles entre 23 (N) posibles y, por tanto, tenemos:
Características de las
El número de las variaciones con repetición de N elementos cogidos variaciones con repetición
de k en k se obtiene haciendo el producto de k factores iguales a N, es En las variaciones con repeti-
decir, es igual a: ción no es preciso que agru-
pemos todos los objetos
de golpe, podemos repetir los
objetos y, además, importa
Nk el orden.
3. Permutaciones
Características
Una permutación de un conjunto de objetos es cualquier posible orde- de las permutaciones
nación de estos objetos. En las permutaciones debemos
agrupar todos los objetos de
golpe, no podemos repetir los
objetos y, además, evidente-
mente, importa el orden.
Calcular el número total de permutaciones de un conjunto de objetos resulta
muy fácil utilizando la regla del producto: supongamos que tenemos N obje-
tos; para decidir cuál irá en primer lugar, tenemos N posibles elecciones. Una
vez que hemos escogido cuál irá en primer lugar, tenemos N 1 posibilidades
de elección para escoger cuál irá en segundo lugar, y así sucesivamente. Es de-
cir, en cada paso tenemos una posibilidad menos de elección, ya que hemos
ido fijando los objetos y, por tanto, cada vez disponemos de un objeto menos
©FUOC • PID_00268874 19 Probabilidad
que hay que situar; aplicando la regla del producto, obtenemos el número to-
Otra manera
tal de posibles ordenaciones. de verlo
¿De cuántas formas se pueden ordenar las letras de la palabra RAM? Si hacemos un árbol,
observamos que en el primer paso tenemos tres opciones; en el segundo sólo tenemos Las ordenaciones
de veintitrés portátiles
dos, ya que una letra está fijada en el primer lugar, y en el tercer paso tenemos una única
opción, que es la letra que todavía no hemos situado. Por tanto, el número de permuta- Si la revista PCUniverse nos pide
ciones será 3! 3 · 2 · 1 6. que ordenemos de todas las
formas posibles los veintitrés
portátiles, tendremos que es-
cribir 23! ordenaciones dife-
rentes.
23! es un número enorme,
concretamente es:
25.852.016.738.884.976.640.000.
4. Combinaciones
Características
Dados N objetos diferentes, una combinación de estos N objetos toma- de las combinaciones
dos de k en k es cualquier subconjunto de k elementos que se pueda for- En las combinaciones no es
mar usando sólo los N objetos iniciales. preciso que agrupemos todos
los objetos, no podemos repe-
tir los objetos y no importa el
orden.
Supongamos que tenemos que escribir todos los posibles subconjuntos de tres ele-
mentos que se pueden formar utilizando únicamente letras de la palabra SRAM. Lo
haremos mediante un árbol en el que se ve que en cada paso tenemos una posibili-
dad de elección menos y que necesitamos tres pasos para construir los subconjuntos
de tres elementos. El paréntesis indica que el subconjunto ya ha sido construido an-
teriormente y con qué subconjunto se corresponde.
©FUOC • PID_00268874 20 Probabilidad
Comentario
También observamos que hay muchas repeticiones porque, por lo que respecta a los
conjuntos, es lo mismo considerar {S, R, A} como {R, A, S}. En el árbol hemos indicado
las repeticiones y, por tanto, sólo tenemos que considerar los subconjuntos siguientes:
{S, R, A}, {S, R, M}, {S, A, M], {R, A, M}. Así pues, tenemos cuatro combinaciones posibles;
este número se puede deducir a partir del árbol: el árbol tiene en total 4 · 3 · 2 24 ramas Notación
(que, de hecho, se corresponden a las variaciones de cuatro elementos tomados de tres
en tres), pero cada una de éstas aparece 3! veces, ya que las tres letras aparecen en todos El número combinatorio N so-
bre k también se puede escribir
los órdenes posibles; por tanto, el número de combinaciones es igual a 4 · 3 · 2 / 3!, que, C(N, k) o bien CNk.
escrito utilizando factoriales, se puede expresar como 4! / (3! · 1!).
5. Resumen
En esta sesión se hace un recorrido por algunas técnicas de recuento muy uti-
lizadas en el contexto del estudio de la probabilidad. En el cuadro siguiente
resumimos los casos estudiados, sus características y las fórmulas de combina-
toria más importantes que aparecen, suponiendo que dispongamos de N indi-
viduos y tengamos que cogerlos de k en k:
Variaciones
No Si Sí Nk
con repetición
Permutaciones Sí No Sí N!
N N!
Combinaciones No No No = -------------------------
k k! N – k !
Ejercicios
1. El póquer
La baraja de póquer consta de cincuenta y dos cartas con cuatro palos (cora-
zones, diamantes, tréboles y picas) y trece cartas de cada palo, numeradas así:
as, 2 ..., 10, J, Q y K. Cada vez se reparten cinco cartas; esto se llama una mano
de cinco cartas.
Solucionario
1. El póquer:
b) Miremos las posibilidades de escoger cuatro cartas que no sean ases, que
son:
48 = 194,580
4
Ahora, para completar una mano, tenemos que escoger entre cuatro ases; por
tanto, las posibilidades totales son:
48 4 = 778,320
4
©FUOC • PID_00268874 23 Probabilidad
c) Hay que escoger cinco cartas entre las cuarenta y ocho que no son un as.
Por tanto:
48 = 1,712.304
5
• Escoger cuatro cartas de este número: una posibilidad, ya que sólo hay cua-
tro cartas de cada número.
• Escoger una carta de entre las que quedan: cuarenta y ocho posibilidades.
52 – 4 = 1,712.300
5
Quitamos las cuatro K de la baraja y nos quedan cuarenta y ocho cartas, de las
que tengo que coger cinco. Por tanto, hay al menos una K en:
Probabilidad
Para ilustrar las ideas sobre probabilidad que se introducirán más adelante de
manera formal, comenzaremos por reflexionar sobre la frecuencia relativa de
un resultado de un experimento aleatorio. Así pues, consideramos un experi-
mento aleatorio y su espacio muestral y vemos, en primer lugar, un ejemplo
que nos guiará en esta introducción.
Lanzamos un dado R 100 veces y anotamos cuántas veces aparece cada resultado en la
tabla siguiente:
Resultado 1 2 3 4 5 6
Apariciones 12 28 20 20 5 15
Significado de la
La frecuencia relativa de cualquier suceso es igual a la suma de las frecuen- frecuencia relativa 0
cias relativas de sus resultados favorables. Es evidente que la frecuencia re- Frecuencia relativa 0 significa
que no ha pasado nunca; fre-
lativa de un suceso es un número entre cero y uno.
cuencia relativa 1 significa
que todas las veces hemos
obtenido un resultado favora-
ble al suceso.
La frecuencia relativa en un dado trucado (II)
Siguiendo con el ejemplo del dado trucado: ¿cuál es la frecuencia relativa del suceso P
”sacar un número par”? De las cien veces que hemos lanzado el dado, 28 20 15 veces
hemos obtenido un número par; por tanto, la frecuencia relativa de P es:
es decir, la suma de las frecuencias relativas del 2, el 4 y el 6 (los resultados pares). Así
pues, ¡el 63% de las veces ha salido un número par!
Es muy importante que os deis cuenta de que a partir de las frecuencias relati-
vas de ciertos sucesos podemos deducir la frecuencia relativa de otros.
Recordad que...
Si dos sucesos son incompatibles, la frecuencia relativa de su unión es
la suma de las respectivas frecuencias relativas. ... dos sucesos son incompati-
bles si son disyuntos.
Siguiendo con el ejemplo del dado trucado, la frecuencia relativa del suceso P “sacar un
número par” es 63% y la del suceso Q “salir un 3 o un 5” es 25%; la frecuencia relativa de
P Q es 88%, que es precisamente igual a 63% 25%, ya que P y Q son disyuntos.
Si consideramos P “sacar un número par” y Q “sacar un número mayor que 3”; la fre-
cuencia relativa de P es 63%, la de Q es 40%, pero la de P Q no es 63% 40% 103%,
ya que la frecuencia relativa no puede ser mayor que 100% 1. De hecho, la frecuencia
relativa de P Q corresponde a la suma de las frecuencias relativas de los resultados 2, 4,
5, 6 y es igual al 68%.
Podemos comprobar la propiedad citada en el caso del ejemplo del dado trucado, ya que
la frecuencia relativa de la intersección de P Q es 35% y, por tanto, la frecuencia relativa
de P Q es igual a 63% 40% 35% 68%.
©FUOC • PID_00268874 26 Probabilidad
lativa de A.
Frecuencia relativa
de la Ac
2. La teoría de la probabilidad Si un suceso se da el 23% de
las veces, su complementario
se tiene que dar el 77% (100%
La teoría de la probabilidad es una teoría matemática que establece cómo po- 23%) de las veces.
Si comenzamos por definir la probabilidad como una función P que hace co-
Probabilidad
rresponder a cada suceso su probabilidad, podemos reescribir las propiedades y frecuencia relativa
anteriores de la manera siguiente: Observad que estas propieda-
des son algunas de las mencio-
nadas por la frecuencia relativa,
P1.) 0 P(A) 1 para todo suceso A. sólo que cambiando la ex-
presión “frecuencia relativa”
por “probabilidad”.
P3.) P() 1 (en el que es el espacio muestral, que se corresponde con el su-
ceso que contiene todos los posibles resultados).
©FUOC • PID_00268874 27 Probabilidad
A continuación veremos que, con las propiedades P1, P2 y P3, podemos llegar Observad que en la definición
de probabilidad no existe nin-
a conclusiones muy interesantes sobre la probabilidad de algunos sucesos de- guna regla para calcular la
P(A B) en función de P(A)
terminados. y P(B).
P() 0
Gráficamente:
Según ésta, para calcular la probabilidad de la unión hay que calcular la suma
de probabilidades y después restar la probabilidad de la intersección. Por tan-
to, siempre tenemos que P(A B) P(A) P(B).
La regla según la cual P(A B) P(A) P(B) P(A B) se puede demostrar muy fácilmente
a partir de los hechos siguientes:
tenemos que A B B (A Bc ). Puesto que estos conjuntos son evidentemente disyun-
tos, tenemos que P(A B) P(B) P(A Bc );
©FUOC • PID_00268874 29 Probabilidad
2) Puesto que P(A) P(A B) P(A Bc), podemos deducir que P(A Bc) P(A) P(A B).
Hasta ahora hemos visto cómo permite la teoría de la probabilidad asignar pro-
babilidades a ciertos sucesos a partir de la probabilidad de otros sucesos más
simples. Ahora falta ver cómo podemos asignar probabilidades a los sucesos
más simples de todos (los resultados de un experimento aleatorio), de manera
que podamos obtener, gracias a la probabilidad, conclusiones interesantes so-
bre los sucesos y sobre las situaciones descritas por los sucesos que interesan.
P i = 1 1 -
--- = ----------------------
k Card
Card A - = -----------------------------------------------------------------------------------------------------
P A = ---------------------- Número de resultados favorables a A-
Card Número total de posibles resultados
por tanto:
es decir, tenemos ocho posibles resultados, y todos ellos son equiprobables (ya que a cada
tirada la probabilidad de que salga cara es la misma probabilidad de que salga cruz). A
continuación podemos calcular cada uno de los sucesos:
Las probabilidades correspondientes son P(A) 1/8, P(B) 3/8, P(D) 2/8.
está trucado; ahora nos enfrentamos a dos nuevos problemas: cómo podemos
confirmar esta sospecha y cómo podemos calcular la probabilidad de cada re-
sultado. En los dos casos la respuesta pasa por calcular la frecuencia relativa de
cada uno de los resultados después de repetir el experimento una y otra vez.
Necesidad
Estas probabilidades, obtenidas como el valor al que tienden las frecuen- de la repetibilidad
cias relativas después de repetir muchas veces un experimento, se deno- Recordad que una de las carac-
minan probabilidades empíricas. terísticas que pedimos a los ex-
perimentos aleatorios es que se
tienen que poder repetir tantas
veces como sea necesario.
Resultado 1 2 3 4 5 6
Para calcular las probabilidades empíricas de cada uno de los resultados, debemos dividir
su frecuencia por 150.000 (el número de veces que hemos repetido el experimento). La
probabilidad de que el número sea par es (100.000 / 150.000) (9.999 / 150.000). La pro-
babilidad de que el número sea mayor que 5 es 0.
6. Probabilidad condicionada
Si lanzamos un dado perfecto, la probabilidad de que el resultado sea un número par es 0,5.
A continuación lanzamos el mismo dado y cae debajo de la mesa, y antes de mirar el nú-
mero que ha salido, alguien nos dice que es mayor que 3; en este caso, ¿cuál es la proba-
bilidad de que sea par? Lo primero que debemos preguntarnos es cuáles son los posibles
resultados: son {4, 5, 6}, ya que la información previa de la que disponemos descarta que
©FUOC • PID_00268874 32 Probabilidad
haya salido un uno, un dos o un tres. Así, de los posibles resultados mayores que 3, dos
son pares. Por tanto, dado que tenemos tres resultados en los que el número que sale es
mayor que 3 –y de éstos, dos son pares–, la probabilidad de que salga par sabiendo que
el número es mayor que 3 es 2/3.
Observación sobre la
La probabilidad del suceso A condicionado a B, probabilidad que deno- probabilidad condicionada
taremos por P(A | B), es la probabilidad de que al realizar el experimento Observamos que si el resultado
aleatorio, el resultado obtenido sea de A, sabiendo que el resultado ob- es de B, puede ser de A (con lo
que será de A B) o no.
tenido es de B. En el ejemplo del dado perfec-
to, si B ”ser mayor que 3” y
A ”ser par”, tendremos que si
el resultado es de B (“ser mayor
que 3”), puede ser de A (“ser
Comenzaremos calculando de forma intuitiva probabilidades condicionadas par”) o no (“no ser par”).
64 MB 128 MB
Patinum1 10 20
Patinum22 10 10
Otro caso: hemos puesto en marcha un ordenador sin mirar el adhesivo del
procesador y resulta que tiene 128 MB de RAM. ¿Cuál es la probabilidad de que
©FUOC • PID_00268874 33 Probabilidad
tenga Patinum1? De la misma manera que antes, hay treinta ordenadores con
128 MB de RAM, de los cuales veinte tienen Patinum1; por tanto:
en el que 30/50 resulta ser la probabilidad de tener 128 MB de RAM y, por tanto,
Ahora nos queda averiguar qué representa el numerador: puesto que hay vein-
te ordenadores que tienen Patinum1 y 128 MB de RAM, 20/50 es la probabili-
dad de que un ordenador tenga Patinum1 y también 128 MB de RAM, con lo
que finalmente obtenemos:
P A B -
P A B = -----------------------
PB
Cálculo de probabilidades
condicionadas
7. Independencia de sucesos
cia con la probabilidad condicionada: pues bien, es fácil demostrar que para de-
terminar si dos sucesos son independientes, tenemos tres vías diferentes.
Independencia
de sucesos (II)
Si P(A) > 0 y P(B) > 0, las afirmaciones siguientes son equivalentes: a) Calculamos P(A) y P(A | B); si
P(A) P(A | B), entonces los su-
cesos son independientes;
1) Los sucesos A y B son independientes. si P(A) P(A | B), entonces no lo
son.
2) P(A B) P(A) · P(B) b) Calculamos P(B) y P(B | A); si
3) P(A | B) P(A) P(B) P(B | A), entonces los su-
cesos son independientes; si
4) P(B | A) P(B) P(B) P(B | A), entonces no lo
son.
Por otra parte, si P(A | B) P(A), tenemos que P(A B)/P(B) P(A) y, por tanto, P(A
B) P(A) · P(B), con lo que demostramos que la afirmación 3 implica la 2.
Puesto que P(A) 1/2 P(A/B) 2/3, los sucesos A y B no son independientes. En cambio:
P(A | C) P(A C) / P(C) P(“par mayor que 4”) / P(“mayor que 4”)
P({6}) / P({5, 6}) (1/6) / (2/6) 1/2
Dado que P(A) 1 / 2 P(A | C), los sucesos son independientes.
Continuamos con los dados, pero ahora lanzamos un dado dos veces. Consideremos los
sucesos A “el valor máximo de las dos tiradas es 1”; B “la suma de los valores de las Interpretación de dos
sucesos independientes
dos tiradas es un número par”. Es fácil ver que P(A) 1 / 36, ya que hay 36 resultados
posibles y sólo en uno –el caso (1,1)– el máximo vale 1. Para calcular la P(B), construimos En el caso del suceso C, la pro-
el espacio muestral, en el que destacamos los resultados de B: porción de pares dentro de C
es 1 / 2, igual que la propor-
(1 1) (1 2) (1 3) (1 4) (1 5) (1 6) ción de pares con respecto
(2 1) (2 2) (2 3) (2 4) (2 5) (2 6) al total; por tanto, el hecho
(3 1) (3 2) (3 3) (3 4) (3 5) (3 6) de que ocurra C no afecta a la
probabilidad de A, o lo que es
(4 1) (4 2) (4 3) (4 4) (4 5) (4 6)
lo mismo, A y C son indepen-
(5 1) (5 2) (5 3) (5 4) (5 5) (5 6) dientes.
(6 1) (6 2) (6 3) (6 4) (6 5) (6 6)
Había que esperar este valor, ya que dentro de B (que tiene 18 elementos) sólo hay un
resultado que pertenezca a A. Dado que P(A | B) P(A), podemos concluir que A y B no
son independientes.
En resumen, y si nos fijamos en la relación entre los valores de P(A) y P(A | B),
tenemos las posibilidades siguientes:
a) P(A | B) > P(A); en este caso, podemos decir que el suceso B favorece que
ocurra el suceso A, ya que la probabilidad de A sabiendo que hemos obtenido
un resultado de B es mayor que la probabilidad de A solo.
b) P(A | B) < P(A); en este caso podemos decir que el suceso B dificulta que ocu-
rra el suceso A, ya que la probabilidad A disminuye si se da un resultado de B.
8. Resumen
Ejercicios
2. Póquer
La baraja de póquer consta de cincuenta y dos cartas con cuatro palos (corazones,
diamantes, tréboles y picas) y trece cartas de cada palo, numeradas así: as, 2, .., 10,
J, Q y K. Cada vez se reparten cinco cartas, lo que se denomina una mano de cinco
cartas.
3. Las alarmas
En una fábrica la probabilidad de que el sistema de alarma 1 falle es del 20%,
la probabilidad de que falle el sistema de alarma 2 es del 10% y la probabilidad
que fallen los dos al mismo tiempo, del 4%. ¿Cuál es la probabilidad de que:
4. Defectos en cadena
El proceso de fabricación de un objeto pasa por dos cadenas independientes. La
probabilidad de adquirir un defecto en la primera cadena es de 0,001 y en la se-
gunda, del 0,0001. Calculad la probabilidad de que un objeto sea defectuoso.
f) Dad un ejemplo de dos sucesos relacionados con las tres monedas que sean
independientes; justificad vuestra respuesta.
6. Lanzamos una moneda trucada tres veces. Repetid el problema anterior su-
poniendo que la moneda está trucada, de modo que la probabilidad de obte-
ner cara en cada lanzamiento es 0,8.
Se pide:
Solucionario
16 = 120
2
(es como escoger dos elementos de 16). Los resultados en los que ambos sean
rechazados por la compañía KaBaC son únicamente uno (tenemos que coger
los dos productos muy defectuosos) y, por tanto:
1 - = 0,00833
P (“los dos rechazados por KaBaC”) -----------
16
2
60 - = 0,5
P (“uno aceptado por el comerciante”) -----------
16
2
c) Con un razonamiento análogo, obtenemos:
6
3
P (“comerciante que no acepte ninguno de los tres”) -----------
- = 0,0357
16
3
2. Póquer
a) Dado que todas las manos son equiprobables, tenemos que dividir el total
de manos en las que hay un único as por el total de manos, con lo que obte-
nemos el resultado siguiente:
48 4
4
-------------------
- = 0,29947
52
5
48
5
P (“no obtener ningún as”) -----------
- = 0,6588
52
5
ya que para no tener ningún as, debemos escoger cinco cartas entre las cua-
renta y ocho que no son as. Así pues:
3. Las alarmas
Definimos F1 “la alarma 1 falla’’ y F2 “la alarma 2 falla’’. Sabemos que P(F1)
0,2; P(F2) 0,1 y P(F1 F2) 0,04. Entonces:
a)
b)
4. Defectos en cadena
Definimos D1 “defecto en la cadena 1” y D2 “defecto en la cadena 2”. Sa-
bemos que:
P (“objeto defectuoso”)
P(D1 D2) P(D1) P(D2) P(D1 D2) 0,001 0,0001 0,000001
3
2
a) -------- 0,37; ya que de las tres tiradas dos tienen que ser caras. También se
8
puede calcular haciendo:
Card cc+,+cc - = 2
-------------------------------------------- ---
8 8
P (“dos caras consecutivas, pero no tres caras” | “han salido dos caras”)
P (“dos caras consecutivas, pero no tres caras” “han salido dos caras) /
/ P (“han salido dos caras”) (2/8) / (3/8) 2/3.
P (“dos caras consecutivas, pero no tres caras”|“han salido dos caras”) 2/3
pero
f) Por ejemplo, consideremos los sucesos U “la tercera vez sale cara’’ y F “la
primera vez sale cara’’; tenemos que P(U) 1/2 y P(F) 1/2; también tenemos que
P(U F) 2/8 1/4. Dado que P(U F) 2/8 1/4 P(U) · P(F), llegamos a la
conclusión de que los sucesos son independientes.
1 2 3 4 5 6 7 8
Probabilidad 0,83 0,82 0,2 0,82 0,2 0,82 0,2 0,8 0,22 0,8 0,22 0,8 0,22 0,23
©FUOC • PID_00268874 42 Probabilidad
• Dos caras consecutivas, pero no tres caras, se corresponden con los sucesos
2 y 4; la suma de sus probabilidades es: 0,82 0,2 0,82 0,2 0,256.
P (“dos caras consecutivas, pero no tres caras” | “han salido dos caras”) 0,67
pero P (“dos caras consecutivas, pero no tres caras”) 0,256 y, por tanto,
los sucesos no son independientes.
U “la tercera vez sale cara” y F “la primera vez sale cara”
Tenemos que:
Es evidente que P(F) 0,8; también tenemos que P(U F) 0,83 0,82 · 0,2
0,64. Dado que P(U F) 0,64 P(U) · P(F), llegamos a la conclusión de
que los sucesos son independientes.
7.
a) Si aplicamos la definición, tenemos que: P(AC | B) P(AC B) / P(B); por
otro lado, sabemos que P(B) P(B AC) P(A B) y, así, P(B AC) P(B)
P(A B). Por tanto:
C P B – P A B - = 1 – -----------------------
P A B = ----------------------------------------- P A B - = 1 – P A B
PB PB
8.
a) En total respondieron cien personas, de las cuales setenta eran hombres.
Por tanto:
P(“hombre”) 70/100
©FUOC • PID_00268874 43 Probabilidad
b) Dado que hay cuarenta y dos hombres que han visitado el Valle de Nuria,
P (“hombre” “ha visitado Nuria”) 42/100.
d) Nos piden:
Puesto que estas probabilidades son iguales, los sucesos son independientes, y
al ser sucesos independientes, podemos afirmar que el hecho de ser hombre ni
favorece ni dificulta el que una persona haya visitado el Valle de Nuria.
©FUOC • PID_00268874 44 Probabilidad
El teorema de Bayes
1. Particiones
1) Ai Aj para todo i, j, y j
2) A1 … Am E
(suponiendo que cada ordenador tiene sólo un procesador y que sólo tenemos dos tipos
de procesador: PIII y PIV).
También tenemos una partición según la RAM que tienen instalada, según la cual, por
ejemplo, O {“64 MB”} {“128 MB”} {“264 MB”} (siempre suponiendo que sólo tene-
mos estas posibilidades).
E {“estudiantes a los que les gustan los cebollinos”} {“estudiantes a los que no les gus-
tan los cebollinos”}
©FUOC • PID_00268874 45 Probabilidad
El teorema de las probabilidades totales afirma que si {A1, A2, ..., Am}
es una partición del espacio muestral y B es cualquier suceso, tenemos
que:
P(B) P(B A1) P(B A2) P(B A3) ... P(B Am)
o lo que es lo mismo:
Representación gráfica
del teorema
a) Supongamos que dentro del colectivo de estudiantes de la UOC los chicos fumadores
representan el 15% del total y que las chicas fumadoras representan el 12% del total.
¿Qué porcentaje de alumnos de la UOC fuma? En este ejemplo consideramos B ”fumar”
y la partición {A1, A2}, donde A1 = “hombre” y A2 = “mujer”. Por aplicación del teorema
de las probabilidades totales y dado que {“hombre”, “mujer”} es una partición del con-
junto de alumnos, tenemos que:
b) En otra universidad el 54% de los estudiantes son hombres y el 46%, mujeres; por otra
parte, el 30% de los hombres son fumadores, mientras que de las mujeres el 25% son fu-
©FUOC • PID_00268874 46 Probabilidad
madoras. ¿Qué porcentaje de alumnos de esta universidad fuma? Observad que en este
caso disponemos de información sobre el porcentaje de fumadores dentro de cada sexo,
es decir, disponemos de las probabilidades condicionadas de fumar por cada sexo, P (“fu-
ma” | “hombre”) 0,3, P (“fuma” | “mujer”) 0,25. Por aplicación del teorema de las pro-
babilidades totales y puesto que {“hombre”, “mujer”} es una partición del conjunto de
alumnos, tenemos que:
Además:
Llevamos a cabo un estudio sobre el grado de satisfacción de los usuarios con el sistema
operativo con el que trabajan. En nuestra empresa sólo tenemos ordenadores con
Doors98 y Lanus y sólo se podía contestar “Muy satisfecho” y “Poco satisfecho”. El espa-
cio muestral son los usuarios que están distribuidos en dos particiones: {“Doors98”, “La-
nus”}, si consideramos el sistema operativo y {“Muy satisfecho”, “Poco satisfecho”}, si
consideramos su grado de satisfacción. Supongamos que de la encuesta se desprende que:
• P (“Doors98”) 0,7
• P (“Muy satisfecho” | “Doors98”) 0,1
• P (“Doors98” “Poco satisfecho”) 0,63
• P (“Muy satisfecho”) 0,34
En este caso concreto conviene considerar como primera partición el sistema operativo,
ya que pensamos que puede ser la causa de la satisfacción o insatisfacción de los usuarios.
Con lo que tenemos el árbol siguiente con algunas incógnitas que hay que encontrar:
• Dado que s e y son los nodos terminales tales que la rama que llega a ellos es “Muy satis-
fecho”, tenemos que s y P(“Muy satisfecho”) 0,34 y, por tanto, s 0,34 0,07 0,27.
• Puesto que z · L s, tenemos que z s/L 0,27/0,3 0,9.
• Ahora tenemos que u 0,1 (ya que u z 1) y que t L · u 0,3 · 0,1 0,03.
Así, podemos ver que el uso de “Lanus” causa el efecto de mucha satisfacción en el 90%
de los casos, mientras que, por ejemplo, el uso de “Doors98” sólo causa mucha satisfac-
ción en un 10% de los casos.
Árboles como los presentados en esta sección permiten considerar las rela-
ciones entre la primera partición y la segunda en términos de causas y efec-
tos: la primera partición (usar “Doors98” o “Lanus”) son las posibles causas
de los efectos recogidos en la segunda partición (“estar muy satisfecho” o
“estar poco satisfecho”).
4. Tablas de contingencia
A1 A2 ... Am Total
...
a) Supongamos que a partir de los datos de los ordenadores de una empresa de la com-
petencia obtenemos la tabla de contingencia siguiente, que relaciona el procesador (A1,
A2) y la memoria RAM de las máquinas:
64 MB 128 MB Total
• Los sucesos “A1” y “64 MB” de RAM no son independientes, ya que (30/50) · (20/50)
10/50
• La probabilidad de tener 128 MB de RAM sabiendo que tiene un “A2” es P(“128 MB”
“A2”) / / P(“A2”) (10/50) / (20/50)
• La probabilidad de tener 64 MB de RAM sabiendo que tiene un “A1” es P(“64 MB”
“A1”) / / P(“A1”) (10/50) / (30/50)
En la que vemos claramente que ser usuario de Lanus y estar muy satisfecho no son in-
dependientes, ya que (0,3 · 0,34 0,27). Cosa razonable, ya que, como hemos demostra-
do antes, usar Lanus aumenta el nivel de satisfacción del usuario.
5. El teorema de Bayes
P(B) P(B | A1) · P(A1) P(B | A2) · P(A2) ... P(B | Am) · P(Am).
El teorema de Bayes establece que si {A1, A2, ..., Am} es una partición de y son
conocidas las probabilidades de B condicionado a cada uno de los Ai y la proba-
bilidad de cada uno de los Ai , podemos calcular la P(Ai | B) de la manera siguiente:
P Ai B
P A i B = ------------------------
- =
PB
P B A i P A i
= -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-
P B A 1 P A 1 + P B A 2 P A 2 + P B A 3 P A 3 + + P B A m P A m
En el caso de Lanus frente a Doors98, tenemos las probabilidades de cada nivel de satis-
facción condicionadas por el sistema operativo que se utiliza. Es decir, conocemos las
probabilidades de los supuestos efectos (“satisfecho” o “no satisfecho”) condicionados a
las supuestas causas (usar un sistema u otro).
©FUOC • PID_00268874 51 Probabilidad
Ahora podemos preguntarnos las probabilidades de utilizar cierto sistema a partir del gra-
do de satisfacción del usuario; es decir, nos preguntamos las probabilidades de cada causa
(uso de un sistema u otro) condicionadas por los efectos sobre los usuarios (grado de sa-
tisfacción). En este caso tendremos que utilizar el teorema de Bayes. Supongamos que nos
piden P(“Doors98” | “está muy satisfecho”); para calcularla, tendremos que efectuar las
operaciones siguientes (en las que abreviamos “Doors98” por D98, “Lanus” por L y “Muy
satisfecho” por S:
Y, por tanto, dentro del grupo de los usuarios satisfechos, la probabilidad de usar Doors98
es de 0,2058.
En este caso particular el teorema de Bayes permite invertir las relaciones causa-efecto,
ya que es como si pudiésemos ir atrás en el tiempo y, partiendo del grado de satisfacción
sobre el sistema informático, remontarnos a la probabilidad de la causa de esta satisfac-
ción. En el ejemplo anterior, si escogemos a un usuario al azar y resulta estar satisfecho,
tenemos una probabilidad de 0,2058 de que sea usuario de D98, mientras que tenemos
una probabilidad de (1 0,2058) 0,7942 de que sea usuario de “Lanus”. Como podéis
ver, ¡usar “Lanus” es una causa mucho más probable de satisfacción que usar D98!
Ahora nos preguntamos la probabilidad de que una persona haya tenido puente
sabiendo que ha afirmado habérselo pasado bien (P(A1 | B1)). Si nos fijamos en
el árbol, observamos que el 61% (0,49 0,12 0,61) dice que se lo ha pasado
bien, pero sólo el 49% (0,49) ha tenido puente; por tanto, forzosamente tendre-
mos que la probabilidad de haber disfrutado del puente sabiendo que se lo han
pasado bien es de 80,32% (0,49 / 0,61 0,8032). Así pues, podemos pensar que
en el 80,32% de los casos pasárselo bien es a causa del puente.
b)
c) P(“no tiene puente” | “se lo ha pasado bien”) 0,12 / (0,49 0,12) 0,1967.
que es mayor que la probabilidad de tener puente (70%); es decir, el hecho de pasárselo
bien (efecto) hace que aumente la probabilidad de haber tenido puente (causa).
Acabaremos esta sesión con un fragmento de un libro de John Allen Paulos que
esperamos que os ayude a entender mejor los cálculos y la interpretación que se
pueden hacer del teorema de Bayes. Es recomendable que reescribáis el ejemplo
en forma de árbol y que comprobéis los cálculos:
Supongamos que haya un análisis para detectar el cáncer con una fiabilidad del 98%; es
decir, si uno tiene cáncer el análisis dará positivo el 98% de las veces, y si no lo tiene, dará
negativo el 98% de las veces. Supongamos además que el 0,5% de la población –una de
cada doscientas personas– padece verdaderamente cáncer.
Imaginemos que uno se ha sometido al análisis y que su médico le informa en tono pesi-
mista que ha dado positivo. ¿Hasta qué punto ha de deprimirse esa persona? Lo sorprenden-
te del caso es que dicho paciente ha de mantenerse prudentemente optimista. El porqué de
este optimismo lo encontramos al determinar la probabilidad condicional de que uno tenga
cáncer sabiendo que el análisis ha dado positivo.
Supongamos que se hacen 10.000 pruebas de cáncer. ¿Cuántas de ellas darán positivo?
En promedio 9,50 de estas 10.000 personas (el 0,5% de 10.000) tendrán cáncer, y como
el 98% de ellos darán positivo, tendremos 49 análisis positivos. Por otra parte, el 2% de
las 9.950 personas restantes, que no padecen cáncer, también darán positivo, con un to-
tal de 199 análisis positivos (0,02 · 9.950 199). Así, del total de 248 positivos (199 49
248), la mayoría son falsos positivos, y la probabilidad condicional de padecer el cáncer
sabiendo que se ha dado positivo es sólo 49/248, ¡aproximadamente un 20%! (Hay que
comparar este porcentaje relativamente bajo con la probabilidad de dar positivo en el su-
puesto de que se tenga efectivamente el cáncer que, por hipótesis, es del 98%)”.
John Allen Paulos (1990). El hombre anumérico. Tusquets Editores (Metatemas, 20).
7. Resumen
Los resultados de esta sesión son muy técnicos y resumir su contenido infor-
malmente resulta muy difícil; de todos modos, podemos decir que el teorema
©FUOC • PID_00268874 54 Probabilidad
Ejercicios
Grado de satisfacción
Nada Poco Bastante Mucho Total
• P(M) 0,8
• P(PC | M) 0,1
• P(P) 0,74
Se pide:
a) Acabad de rellenar el árbol de probabilidades (valores de x2, x3, x4, x5, x6,
x7 y a, b, c, d, e, f).
b) ¿Los sucesos M y P son independientes?
c) ¿Cuánto vale P(MC P)?
Solucionario
1.
a) P(‘‘poco satisfecho con el entorno” | “usuario de Linux’’)
P(‘‘poco satisfecho’’ ‘‘usuario de Linux’’) / P(‘‘usuario de Linux’’)
0,15/0,7 0,2143
2.
a) Observemos los cálculos siguientes:
– a P(M) 0,8
– b P(MC) 1 P(M) 1 0,8 0,2
– x2 a P(M) 0,8
– x3 b P(MC) 1 P(M) 1 0,8 0,2
– c P(P | M) P(P M) / P(M) P(M P) / P(M) 0,72/0,8 0,9
– d P(PC | M) 0,1
– x4 P(M P) 0,72
– x5P(M PC) P(PC | M) · P(M) 0,1 · 0,80,08;
– P(P) 0,74 P(P) P(P M) P(P MC) P(M P) P(MC P)
0,72 P(MC P) y, por tanto, P(MC P) 0,74 0,72 0,02
(o lo que es lo mismo, x4 x6 0,74 y x4 0,72 implica x6 0,02)
– x6 P(MC P) 0,02
– e P(P | MC) P(MC P) / P(MC) 0,02/0,2 0,1
– f 0,9 (ja que e f 1)
– x7 P(MC PC) 0,18 (también se puede hacer viendo que x6 x7 0,2)
b) Dado que P(P | M) 0,9 y P(P) 0,74, está claro que P(P | M) 0,9 P(P) y,
por tanto, P y M no son independientes. También se puede hacer comprobando
que P(M P) P(M) · P(P).
3. Podemos considerar que este árbol en el que “hay virus” significa “hay virus
detectable”).
(es la suma de las probabilidades de los nodos a los que llega una rama del tipo
sí lo detecta).
b)
Es decir, con una probabilidad del 0,016 el ordenador no tiene virus, pero el
antivirus da mensaje de existencia de virus.
e) P(V | DC) P(V DC) / P(DC) 0,02 / (1 0,196) 2,4876 · 102 2,48%
Este caso también es preocupante: ¡el 2,48% de las veces que el antivirus no da
ningún mnsaje de virus, efectivamente tenemos uno!