Módulo 2 Estadística

Probabilidad
PID_00268874
Àngel J. Gil Estallo

©FUOC • PID_00268874 2 Probabilidad
Àngel J. Gil Estallo
Doctor en Ciencias Matemáticas por

la Universidad de Barcelona desde
el año 1996. Profesor titular
de escuela universitaria de la
Universidad Pompeu Fabra desde
1991. Su actividad docente
se centra en temas de matemáticas,
estadística e informática
en los estudios de Economía de
dicha Universidad. Consultor
de la Universitat Oberta de
Catalunya desde 1998.
La revisión de este recurso de aprendizaje UOC ha sido coordinada

por la profesora: Mireia Besalú Mayol (2019)
Cuarta edición: septiembre 2019

© Àngel J. Gil Estallo
Todos los derechos reservados
© de esta edición, FUOC, 2019
Av. Tibidabo, 39-43, 08035 Barcelona
Realización editorial: FUOC
Ninguna parte de esta publicación, incluido el diseño general y de la cubierta, puede ser copiada,
reproducida, almacenada o transmitido de ninguna manera ni por ningún medio, tanto eléctrico
como químico, mecánico, óptico, de grabación, de fotocopia, o por otros métodos, sin la autorización previa
por escrito de los titulares del copyright.de los titulares del copyright.
©FUOC • PID_00268874 Probabilidad
Índice
Sesión 1
Introducción a la probabilidad ........................................................ 5
1. Introducción ........................................................................................ 5
2. Acontecimientos o sucesos aleatorios ................................................. 5
2.1. El suceso seguro ............................................................................ 7
2.2. El suceso imposible ....................................................................... 7
3. Operaciones con sucesos ...................................................................... 7
3.1. Intersección de sucesos y sucesos incompatibles ......................... 7
3.1.1. Sucesos incompatibles ....................................................... 8
3.2. Unión de sucesos .......................................................................... 8
3.3. Complementario de un suceso ..................................................... 9
3.4. Tablas de sucesos .......................................................................... 10
4. Resumen ............................................................................................... 11
Ejercicios ................................................................................................... 12
Sesión 2
Combinatoria y técnicas de recuento ............................................. 15
1. La regla del producto ........................................................................... 15
2. Variaciones ........................................................................................... 16
2.1. Variaciones con repetición ........................................................... 18
3. Permutaciones ...................................................................................... 18
4. Combinaciones .................................................................................... 19
5. Resumen ............................................................................................... 21
Ejercicios ................................................................................................... 22
Sesión 3
Probabilidad .......................................................................................... 24
1. Introducción y frecuencia relativa ....................................................... 24
2. La teoría de la probabilidad ................................................................. 26
3. Propiedades que se derivan de la definición de probabilidad ............. 27
3.1. La probabilidad del suceso imposible ........................................... 27
3.2. La probabilidad del complementario ........................................... 27
3.3. La probabilidad de la unión ......................................................... 27
4. Asignación de probabilidad cuando los resultados son equiprobables.
Regla de Laplace ................................................................................... 29
5. Probabilidades en espacios muestrales no uniformes
y frecuencia relativa ............................................................................. 30
6. Probabilidad condicionada .................................................................. 31
6.1. Relación entre probabilidad condicionada
y probabilidad de la intersección .................................................. 33
7. Independencia de sucesos .................................................................... 34
©FUOC • PID_00268874 Probabilidad
8. Resumen ............................................................................................... 35
Ejercicios ................................................................................................... 37
Sesión 4
El teorema de Bayes ............................................................................. 44
1. Particiones ............................................................................................ 44
2. Teorema de las probabilidades totales ................................................. 45
3. Árboles de probabilidad y probabilidad condicionada ....................... 46
4. Tablas de contingencia ........................................................................ 48
5. El teorema de Bayes ............................................................................. 50
6. El teorema de Bayes sobre un árbol de probabilidades ....................... 51
7. Resumen ............................................................................................... 53
Ejercicios ................................................................................................... 55
Introducción a la probabilidad
1. Introducción
Comencemos por introducir algunos ejemplos y preguntas que nos puedan

guiar en el desarrollo posterior de la teoría; para hacerlo, nos basaremos en un
ejemplo muy sencillo: el estudio del comportamiento de un dado.
Lanzar un dado y observar cuál es el número de puntos que aparece en la cara

Experimento aleatorio
superior es lo que se denomina un experimento aleatorio, ya que, si bien sa-
bemos cuáles son los posibles resultados (que salgan 1, 2, 3, 4, 5 ó 6 puntos), Seguro que cuando lancemos
el dado siempre saldrá un nú-
no podemos saber cuál será el número de puntos que saldrá en cada tirada par- mero de puntos menor o igual
que 6, pero no podemos decir
ticular. El conjunto de todos los resultados posibles se denomina espacio mu- exactamente cuántos puntos
conseguiremos en cada tirada.
estral y se suele designar con la letra .
Experimento aleatorio es aquel que tiene diferentes resultados posi-  espacio muestral.
i resultado posible.
bles, de los que no tenemos certeza sobre cuál se producirá realmente.
Además, es preciso que el experimento se pueda repetir en condiciones
idénticas tantas veces como sea necesario.
Espacio muestral es el conjunto de resultados posibles que podemos

obtener al realizar un experimento aleatorio. Se designa por la letra .
A partir de este momento, y si no se dice lo contrario, consideraremos que el

Ejemplos de espacio
espacio muestral es finito y que tenemos k resultados posibles: 1, 2, …, k. muestral
En el caso del dado, el espacio

Es importante fijar desde el primer momento cuál es el espacio muestral aso- muestral es:
 = {1, 2, 3, 4, 5, 6}
ciado al experimento aleatorio.
Ver qué sale si lanzamos una
moneda al aire es un experi-
mento aleatorio (los resultados
posibles son cara o cruz, pero
en cada tirada no podemos de-
2. Acontecimientos o sucesos aleatorios cir cuál de los dos saldrá) con
espacio muestral:
 = {cara, cruz}
Un acontecimiento o suceso aleatorio es cualquier subconjunto del
espacio muestral. Es decir, cualquier subconjunto del conjunto de resul-
tados de un experimento aleatorio.
Denotaremos los acontecimientos por letras mayúsculas A, B…
Podemos preguntarnos ahora cuáles son los acontecimientos más simples de

todos: evidentemente, serán aquellos que constan de un único resultado; son
los llamados acontecimientos elementales.
Identificaremos los resultados del experimento aleatorio con los acon-

tecimientos elementales, que son los acontecimientos formados por
un único resultado.
En general, los acontecimientos contendrán más de un resultado, y muchas

Notación
veces nos interesará conocer el número de resultados que contienen.
Card( ) es la función cardinal
de un conjunto.
En otros textos Card(A) se de-
Card(A) denotará el número de resultados que contiene el aconteci- nota por #A o por n(A).
miento A.
Así pues, después de realizar un experimento aleatorio, tenemos acontecimien-

tos de dos tipos:
a) Acontecimientos elementales: son estrictamente los que podemos obtener

como resultado del experimento.
b) Acontecimientos: son agrupaciones de uno o más resultados. A menudo

podremos dar una descripción del acontecimiento a partir de una característi-
ca común a todos los resultados del acontecimiento (del tipo “ser par”, “ser
El acontecimiento “ser
primero”, etc.). par”
Los dados no saben si los nú-

meros que salen son pares o
Así pues, si el acontecimiento contiene un único resultado, diremos que se tra- no. Tampoco llevan escrita
ta de un acontecimiento elemental; si contiene más de uno, diremos simple- la palabra par. El hecho de que
el número que aparece en un
mente que es un acontecimiento. dado sea par se corresponde a
la descripción que hacemos de
cierta situación que no se cor-
responde a un único valor del
Ejemplos de resultados y acontecimientos dado. Por tanto, ¡ser par no es
un resultado!
a) En el caso del dado, el conjunto de posibles resultados (espacio muestral) es  = {1, 2,
3, 4, 5, 6} y podemos tener, entre otros, los sucesos siguientes:
• B “el número de puntos es par”, que corresponde a la agrupación de los resultados

{2, 4, 6}; es decir, en el fondo B {2, 4, 6}. Evidentemente, Card(B) 3.
• C{3, 4, 5, 6}. En este caso el suceso C corresponde a “sacar un valor superior o igual
a 3”; Card(C) 4.
• D {1, 6}. D es un suceso formado por los resultados 1 y 6.
• F {3}. F es el suceso que corresponde a “sacar un 3”.
b) “Sacar un número mayor que 5” es un acontecimiento elemental o resultado, ya que

se corresponde a sacar un 6. “Sacar un número par” no es un suceso elemental, ya que
no se corresponde con un único valor concreto del dado.
Los resultados favorables a un suceso son los resultados que contiene.

Card(A) es el número de resultados favorables a A.
A continuación definiremos dos sucesos muy especiales: el suceso seguro y el

imposible.
2.1. El suceso seguro
El suceso seguro es el que está formado por todos los resultados posi-
bles; es decir, es el mismo espacio muestral . Ejemplo de un suceso
seguro
Lanzamos un dado y conside-

ramos el suceso “sacar un nú-
El suceso seguro contiene todos los resultados; así, pase lo que pase, “seguro” mero menor que 10”. ¡Esto
seguro que siempre pasa!
que cualquier resultado pertenece al suceso “seguro”.
2.2. El suceso imposible
Ejemple de suceso
El suceso imposible, denotado por  (conjunto vacío), es el suceso imposible
que no ocurre nunca. Evidentemente, Card() 0. Lanzamos un dado y conside-
ramos el suceso “sacar un 26”.
¡Seguro que eso no pasa nun-
ca! Otro ejemplo de suceso im-
posible es “sacar un número
par y múltiplo de 5”.
3. Operaciones con sucesos
Acabamos de ver que podemos determinar un suceso por medio del conjunto
de resultados posibles de un experimento aleatorio. Evidentemente, la des-
cripción puede ser muy compleja y a veces interesa mezclar u operar ciertos
sucesos para describir situaciones más complicadas. También hemos visto que
un acontecimiento es, de hecho, el conjunto de los resultados que contiene:
por tanto, todas las propiedades de los conjuntos y de las operaciones con con-
juntos son válidas para sucesos.
A continuación describiremos varias operaciones conjuntivas aplicadas a los

sucesos aleatorios; en concreto, hablaremos de la unión, de la intersección y
del complementario de sucesos.
3.1. Intersección de sucesos y sucesos incompatibles
Supongamos que tenemos dos sucesos A y B:
El suceso A  B (leído A intersección B) está formado por aquellos resul-

tados favorables a A y a B simultáneamente.
Es decir, la intersección de los sucesos A y B es un suceso menor que A y que

B, en el que sólo aparecen los resultados que están en A y también en B. Para
ilustrar gráficamente estas operaciones, nos será útil utilizar los conocidos
Número de elementos
diagramas de Venn. de A  B
No existe una fórmula que nos

Ejemplo de intersección de sucesos diga el número de elementos
de A  B a partir de los elemen-
Si el suceso A es “sacar un número par” y el suceso B es “sacar un número mayor que tos de A y de B. En la mayoría
3”, entonces A {2, 4, 6} y B {4, 5, 6} y, evidentemente, A  B {“sacar un número de los casos deberemos mirar
directamente cuántos resulta-
par mayor que 3”}{4, 6}, que son los únicos resultados que están al mismo tiempo
dos hay en A  B. Lo seguro
en A y en B. Gráficamente: es que Card(A  B)  Card(A)
y Card(A  B)  Card(B).
3.1.1. Sucesos incompatibles
Más adelante será muy importante saber si dos sucesos tienen resultados en
común o no; esto conduce a la definición de sucesos incompatibles.
Ejemplo de sucesos
Dos acontecimientos son incompatibles si no tienen ningún resultado incompatibles
en común, es decir, si A  B es el suceso imposible. Dicho de otra ma- Los sucesos “sacar un número
menor que 2” y “sacar un nú-
nera, A y B son incompatibles si son conjuntos disyuntos, es decir, si
mero par mayor o igual que 4”
A  B  . En este caso Card(A  B) 0. son sucesos incompatibles.
3.2. Unión de sucesos
Supongamos que tenemos dos sucesos A y B. El suceso A  B (leído A

unión B) está formado por aquellos resultados favorables a A, a B o a
ambos a la vez.
Es decir, unir los sucesos A y B sirve para crear un suceso mayor que contiene
los resultados de A más los resultados de B. Es fácil ver que:
Card(A  B) Card(A) Card(B) Card(A  B)

Observad que en Card(A) Card(B) cuentan dos veces los elementos de la in-
tersección (una vez por pertenecer a A y una vez por pertenecer a B); en
Card(A) Card(B)  Card(A  B), cada elemento de la unión está contado
una sola vez.
Ejemplo de unión de sucesos
Si el suceso A es “sacar un número par” y el suceso B es “sacar un número mayor

que 3”, entonces A {2, 4, 6} y B {4, 5, 6} y, A  B “sacar un número par o mayor
que 3” {2, 4, 5, 6} y A  B {4, 6}. Así, Card(A  B) 4, que coincide con Card(A) 
Card(B) Card(A  B), ya que Card(A) 3, Card(B) 3 y Card(A  B) 2. Gráficamente:
3.3. Complementario de un suceso
Supongamos que estudiamos un suceso A.
Notación
El suceso AC (leído complementario de A) está formado por aquellos
resultados que no son favorables a A. A veces se escribe A o C(A) en
lugar de AC.
Es decir, el complementario del suceso A es el suceso que únicamente contiene

los resultados que no están en A.
Ejemplo de suceso complementario
Si B {1, 2, 5}, entonces Bc {3, 4, 6}, precisamente los resultados que no están en B. Si el
suceso es A ”sacar un número par”, entonces A {2, 4, 6} y AC {1, 3, 5}, que se corres-
ponde, como cabía esperar, con los números impares. Gráficamente:
Evidentemente, el número de elementos de AC es el número de posibles resul-

tados menos el número de elementos de A, es decir:
Complementario
Card(AC) Card() Card(A) e incompatibilidad
A y Ac siempre son sucesos

disyuntos, ya que no puede
ser que un resultado esté en A
y fuera de A simultáneamente.
Por ejemplo, un número no
3.4. Tablas de sucesos puede ser par e impar simul-
táneamente.
En ocasiones nos puede resultar útil confeccionar una tabla en la que se vean
claramente los resultados que pertenecen a cada suceso y a ciertas operaciones
con los sucesos. Por ejemplo, en el caso del dado y si el suceso A es “sacar un
número par” y el suceso B es “sacar un número mayor que 3”, entonces A {2,
4, 6} y B {4, 5, 6}, podemos construir una tabla como ésta, en la que vamos
marcando qué resultado pertenece a cada suceso:
Posible
resultado: ¿Es de ¿Es de
¿Es de A? ¿Es de B? ¿Es de AC?
Valor A  B? A  B?
del dado
1 No No No No Sí
2 Sí No Sí No No
3 No No No No Sí
4 Sí Sí Sí Sí No
5 No Sí Si No Sí
6 Sí Sí Sí Si No
En dicha tabla, como podéis observar, para tener...
• “Sí” a la pregunta “¿Es de A  B?”, debéis tener como mínimo un “Sí” (o

bien a “¿Es de A?” o bien a “¿Es de B?”);
• “Sí” a la pregunta “¿Es de A  B?”, debemos tener un “Sí” a “¿Es de A?” y

también un “Sí” a “¿Es de B?”;
• “Sí” a la pregunta “¿Es de AC?”, debemos tener un “No” a “¿Es de A?”.
Podemos visualizar el contenido de la tabla mediante un gráfico, en el que po-

demos ver que el suceso A  B engloba los resultados de A y los de B, mientras
que el suceso A  B contiene exclusivamente los resultados que están en A y
también en B.
A es “sacar un número par”

y el suceso B es “sacar un número
mayor que 3”.
4. Resumen
En esta sesión hemos introducido el concepto de experimento aleatorio, a par-

tir del cual se desarrollará la teoría de la probabilidad. Todo experimento alea-
torio tiene asociado el conjunto de sus resultados, llamado espacio muestral. Los
resultados se pueden agrupar en sucesos (también llamados acontecimientos),
que se denominan elementales si contienen un único resultado. Se insiste en la
noción de resultado favorable a un suceso (de hecho, son los resultados que for-
man parte del mismo).
Después se recuerdan las operaciones de unión, intersección y complementario

de conjuntos, aplicadas al caso de los experimentos aleatorios. Se tratan dos ti-
pos particulares de sucesos: el suceso seguro y el suceso imposible. A partir de
este último se definen los sucesos incompatibles, que son aquéllos en los que
su intersección está vacía (es decir, su intersección es el suceso imposible). Para
favorecer la visualización de los sucesos y las operaciones que se pueden reali-
zar sobre éstos, se utilizan los diagramas de Venn y las tablas de sucesos.
Ejercicios
1. Supongamos que hemos examinado el sistema operativo y el procesador de

diez ordenadores de nuestra empresa. Los resultados han sido los siguientes:
Ordenador Sistema operativo Procesador
1 Doors95 Lenteron
2 Doors98 FortiumII
3 Doors95 Lenteron
4 Doors2000 FortiumII
5 Doors95 Lenteron
6 Doors98 Lenteron
7 Doors95 Lenteron
8 Doors98 FortiumII
9 Doors95 FortiumII
10 Doors2000 FortiumII
Consideremos los sucesos A y B, que son:
• A “el sistema operativo es Doors98”

• B “el procesador es FortiumII”
a) Interpretad la situación en términos de experimentos aleatorios y determi-

nad el espacio muestral correspondiente.
b) Determinad qué resultados forman los sucesos A  B, A  B, Ac, Bc, Ac  B,
Ac  B y dad una descripción de cada uno.
2. Lanzamos un dado dos veces:

a) Calculad el espacio muestral del experimento y el número de resultados
posibles.
b) Determinad cuáles son los sucesos siguientes y el número de resultados fa-
vorables a cada uno de éstos:
• A “las dos tiradas sale el mismo número”

• B “la suma de los dos número es mayor que 7”
• A  B, A  B, BC
Solucionario
1.
El experimento aleatorio consiste en escoger un ordenador al azar y, por tanto,
cada uno de los diez ordenadores es un resultado posible. Es decir,  {1, 2, 3,
4, 5, 6, 7, 8, 9, 10}, si suponemos que tenemos los ordenadores numerados del
1 al 10.
Podemos construir la tabla de sucesos siguiente:
¿Es ¿Es ¿Es de ¿Es de

Ordenador ¿Es de A  B ¿Es de A B ¿Es de Ac? ¿Es de Bc?
de A? de B? Ac  B? Ac  B?
1 No No No No Sí Sí No Sí
2 Sí Sí Sí Sí No No No Sí
4 No SÍ Sí No Sí No Sí Sí
6 Sí No Sí No No Sí No No
8 Sí Sí Sí Sí No No No Sí
Y también podemos dar una descripción de cada uno de los sucesos:
a) A  B “el sistema es Doors98 o tiene FortiumII” {2, 4, 6, 8, 9, 10}
b) A  B “el sistema es Doors98 y tiene FortiumII” {2, 8}
c) Ac “el sistema no es Doors98” {1, 3, 4, 5, 7, 9, 10} (en este caso el sistema

será o Doors95 o Doors2000).
d) Bc “no tener FortiumII” {1, 3, 5, 6, 7} (en este caso será tener Lenteron)
e) Ac  B “el sistema no es Doors98 y tiene FortiumII” {4, 9, 10}; por tanto,

será Doors95 o Doors2000 con FortiumII.
f) Ac  B “el sistema no es Doors98 o tiene FortiumII” {1, 2, 3, 4, 5, 7, 8, 9, 10};

por tanto, será Doors95 o Doors2000 o tendrá FortiumII .
2.
El espacio muestral se puede distribuir en forma de tabla en la que la fila re-
presenta el valor de la primera tirada y la columna, el valor de la segunda.
1 2 3 4 5 6 Card(A)=6
1 (1,1) (1,2) (1,3) (1,4) (1,5) (1,6)
2 (2,1) (2,2) (2,3) (2,4) (2,5) (2,6) Card(B)=15
3 (3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

Card(AuB)=18
4 (4,1) (4,2) (4,3) (4,4) (4,5) (4,6)
5 (5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

Card(AnB)=3
6 (6,1) (6,2) (6,3) (6,4) (6,5) (6,6)
Card(B^c)=21
Por tanto, hay 36 resultados posibles, es decir, Card() 36.
Los sucesos favorables a A son:
{(1,1), (2,2), (3,3), (4,4), (5,5), (6,6)}
y Card(A) 6.
Los sucesos favorables a B son:
{(2,6), (3,5), (3,6), (4,4), (4,5), (4,6), (5,3), (5,4),

(5,5), (5,6), (6,2), (6,3), (6,4), (6,5), (6,6)}
y, por tanto, Card(B) 15.
Inspeccionando los sucesos A y B, tenemos que A  B  {(4,4), (5,5), (6,6)} y

Card(A  B) 3. Ahora tenemos que:
A  B  {(1,1), (2,2), (3,3), (2,6), (3,5), (3,6), (4,4), (4,5),

(4,6), (5,3), (5,4), (5,5), (5,6), (6,2), (6,3), (6,4), (6,5), (6,6)}
y Card(A  B) 18, también podemos calcular de forma indirecta:
Card(A  B) Card(A) Card(B) Card(A  B) 6 15 3 18
BC {(1,1), (1,2),(1,3), (1,4), (1,5), (1,6), (2,1),(2,2), (2,3), (2,4),

(2,5), (3,1), (3,2), (3,3), (3,4), (4,1), (4,2), (4,3), (5,1), (5,2), (6,1)}
que, evidentemente, corresponden al caso de que la suma de los dados sea

menor o igual que 7; en total, Card(BC) 21, número que también se puede
calcular haciendo:
Card (BC) Card() Card(B) 36 15 21

Combinatoria y técnicas de recuento
En el estudio de un experimento aleatorio es importante contar los resultados

que forman parte de cierto suceso, así como contar los posibles resultados que
se pueden obtener al llevar a cabo el experimento. En esta sesión recordaremos
brevemente algunas técnicas básicas de combinatoria para poder tratar las si-
tuaciones más comunes. En concreto trabajaremos:
1) La regla del producto
2) Las variaciones
3) Las permutaciones
4) Las combinaciones y los números combinatorios
En general, se tratará de, dados unos cuantos objetos, construir agrupaciones

utilizando sólo dichos objetos y teniendo en cuenta los aspectos siguientes:
1) ¿Se tienen que agrupar todos los objetos disponibles o sólo unos cuántos?
2) ¿Podemos repetir los objetos en las agrupaciones o bien en éstas los objetos
deben ser todos diferentes?
3) ¿Importa el orden? Es decir, ¿interesa considerar las diferentes posibilidades

de ordenación dentro de cada agrupación o son indiferentes?
Según la respuesta a estas preguntas, deberemos utilizar alguna de las técnicas

que comentamos a continuación.
1. La regla del producto
En este apartado enunciaremos una regla general de mucha utilidad en nu-

merosos casos.
Para determinar el total de posibilidades que tenemos si debemos efec-

tuar una secuencia de elecciones sucesivas, hay que multiplicar el núme-
ro de posibilidades de la primera elección por el número de posibilidades
de la segunda elección, y así sucesivamente.
Estos procesos en los que hacemos elecciones sucesivas se pueden representar

fácilmente en forma de árboles, en los que de cada nodo salen tantas ramas
como posibilidades tenemos, tal como veremos en el ejemplo siguiente.
Ejemplo de aplicación de la regla del producto
Nuestra empresa monta ordenadores y los clientes pueden escoger algunas de las carac-
terísticas del equipo: concretamente, pueden escoger entre 64 ó 128 MB de memoria
RAM, disco duro de 6, 12 ó 20 GB y pantalla de 14 ó de 16 pulgadas, opciones que se
pueden mezclar de todas las maneras posibles. ¿Cuántos modelos diferentes de ordena-
dor podemos ofrecer a nuestros clientes? Mediante un diagrama de árbol podemos dis-
poner fácilmente de todas las configuraciones posibles.
Se ve claramente que en total podemos ofrecer 2 · 3 · 2 12 configuraciones diferentes

en nuestros equipos.
2. Variaciones
Supongamos que tenemos N objetos y nos piden que escogamos k de éstos, de

Características
manera que no haya dos repetidos y que cualquier cambio en la ordenación de las variaciones
dé lugar a otro grupo diferente: ¿de cuántas maneras podemos hacerlo? En las variaciones no es preciso
que agrupemos todos los obje-
tos de golpe, no podemos re-
petir los objetos y, además,
importa el orden.
Cada una de las maneras en las que podemos escoger y ordenar k ele-
mentos de entre N dados –sin repetir ninguno– es una de las variacio-
nes de los N elementos cogidos de k en k.
Variaciones de las letras de la palabra SRAM
Supongamos que queremos considerar todas las posibles palabras (en el sentido de secuen-
cias de letras, aunque no tengan sentido) de tres letras que se pueden formar usando sólo
letras de la palabra SRAM (por tanto, N 4). Lo haremos mediante un árbol en el que se vea
que a cada paso tenemos una posibilidad de elección menos y que necesitamos tres pasos
para construir los subconjuntos ordenados de tres elementos. Observad que, de hecho, es
como si escogiésemos tres letras de la palabra SRAM y después las ordenásemos de todas las
formas posibles, ya que ordenaciones diferentes dan lugar a “palabras” diferentes.
Observamos que en el primer paso tenemos N 4 posibilidades de elección, en el segun-

do N 1 3 y en el tercero N 2 2; en total, tenemos N(N 1)(N 2) 4 · 3 · 2 24
palabras diferentes.
Observamos que tenemos que hacer k elecciones y que en cada una tenemos
una posibilidad menos que en la anterior. Aplicando la regla del producto, po-
demos saber fácilmente el número total de posibles agrupaciones.
El número de las variaciones de N elementos cogidos de k en k se ob-

tiene haciendo el producto de k factores a partir de N, restando cada vez
una unidad:
N! -
N  N – 1   N – k + 1  = ---------------------
 N – k !
(donde hay k factores decrecientes a partir de N).
Ejemplo
La revista PC Universe nos envía una lista de veintitrés portátiles y nos pide que devolva-
mos la lista de los que creamos que son los cinco mejores, ordenada de la forma: primero,
segundo, tercero, cuarto y quinto. En este caso tenemos que ordenar 5 (k) portátiles
como mejores portátiles entre 23 (N) posibles y, por tanto, tenemos:
N(N 1) … (N 5 1) 23 · 22 · 21 · 20 · 19 4.037.880 posibles respuestas diferentes.
2.1. Variaciones con repetición
Si nos encontramos en la situación descrita por las variaciones, pero con la

particularidad de que se pueden repetir los objetos tantas veces como sea ne-
cesario, nos encontraremos con un problema de variaciones con repetición.
La diferencia con las variaciones normales es que en cada elección podemos vol-
ver a escoger entre todos los objetos iniciales (se pueden repetir).
Características de las
El número de las variaciones con repetición de N elementos cogidos variaciones con repetición
de k en k se obtiene haciendo el producto de k factores iguales a N, es En las variaciones con repeti-
decir, es igual a: ción no es preciso que agru-
pemos todos los objetos
de golpe, podemos repetir los
objetos y, además, importa
Nk el orden.
Ejemplo de variaciones con repetición
¿Cuántos caracteres diferentes de ocho dígitos se pueden codificar utilizando ceros y

unos? Tenemos dos objetos (0 y 1), tenemos que cogerlos ocho veces y podemos repe-
tir el 0 y el 1 tantas veces como convenga; dado que tenemos ocho elecciones y cada
una de éstas con dos posibilidades, el número total es 28. Observad que las cadenas
01000000 y 1000000 son diferentes (codifican caracteres diferentes) y, por tanto, im-
porta el orden.
3. Permutaciones
A continuación nos planteamos de cuántas maneras diferentes se puede orde-

nar un conjunto de objetos.
Características
Una permutación de un conjunto de objetos es cualquier posible orde- de las permutaciones
nación de estos objetos. En las permutaciones debemos
agrupar todos los objetos de
golpe, no podemos repetir los
objetos y, además, evidente-
mente, importa el orden.
Calcular el número total de permutaciones de un conjunto de objetos resulta
muy fácil utilizando la regla del producto: supongamos que tenemos N obje-
tos; para decidir cuál irá en primer lugar, tenemos N posibles elecciones. Una
vez que hemos escogido cuál irá en primer lugar, tenemos N 1 posibilidades
de elección para escoger cuál irá en segundo lugar, y así sucesivamente. Es de-
cir, en cada paso tenemos una posibilidad menos de elección, ya que hemos
ido fijando los objetos y, por tanto, cada vez disponemos de un objeto menos
que hay que situar; aplicando la regla del producto, obtenemos el número to-
Otra manera
tal de posibles ordenaciones. de verlo
También se puede calcular pen-

sando que el número de permu-
taciones es el número de las
El número de las permutaciones de N objetos es: variaciones de N elementos co-
gidos de N en N, ya que, por de-
finición, se trata de ordenarlos
N! N · (N 1) · (N 2) · ... · 3 · 2 · 1 todos.
Ejemplo de aplicación de las permutaciones
¿De cuántas formas se pueden ordenar las letras de la palabra RAM? Si hacemos un árbol,
observamos que en el primer paso tenemos tres opciones; en el segundo sólo tenemos Las ordenaciones
de veintitrés portátiles
dos, ya que una letra está fijada en el primer lugar, y en el tercer paso tenemos una única
opción, que es la letra que todavía no hemos situado. Por tanto, el número de permuta- Si la revista PCUniverse nos pide
ciones será 3! 3 · 2 · 1 6. que ordenemos de todas las
formas posibles los veintitrés
portátiles, tendremos que es-
cribir 23! ordenaciones dife-
rentes.
23! es un número enorme,
concretamente es:
25.852.016.738.884.976.640.000.
4. Combinaciones
En otras situaciones interesa considerar agrupaciones en las que no hay que

tener en cuenta el orden, bien porque no es relevante, bien porque no afecta
al resultado final. En este caso trabajaremos directamente con subconjuntos.
Características
Dados N objetos diferentes, una combinación de estos N objetos toma- de las combinaciones
dos de k en k es cualquier subconjunto de k elementos que se pueda for- En las combinaciones no es
mar usando sólo los N objetos iniciales. preciso que agrupemos todos
los objetos, no podemos repe-
tir los objetos y no importa el
orden.
Ejemplo de aplicación de combinaciones
Supongamos que tenemos que escribir todos los posibles subconjuntos de tres ele-
mentos que se pueden formar utilizando únicamente letras de la palabra SRAM. Lo
haremos mediante un árbol en el que se ve que en cada paso tenemos una posibili-
dad de elección menos y que necesitamos tres pasos para construir los subconjuntos
de tres elementos. El paréntesis indica que el subconjunto ya ha sido construido an-
teriormente y con qué subconjunto se corresponde.
Comentario
SAR es el mismo subconjunto

que SRA y, por tanto, no lo
consideramos como un grupo
diferente.
También observamos que hay muchas repeticiones porque, por lo que respecta a los
conjuntos, es lo mismo considerar {S, R, A} como {R, A, S}. En el árbol hemos indicado
las repeticiones y, por tanto, sólo tenemos que considerar los subconjuntos siguientes:
{S, R, A}, {S, R, M}, {S, A, M], {R, A, M}. Así pues, tenemos cuatro combinaciones posibles;
este número se puede deducir a partir del árbol: el árbol tiene en total 4 · 3 · 2 24 ramas Notación
(que, de hecho, se corresponden a las variaciones de cuatro elementos tomados de tres
en tres), pero cada una de éstas aparece 3! veces, ya que las tres letras aparecen en todos El número combinatorio N so-
bre k también se puede escribir
los órdenes posibles; por tanto, el número de combinaciones es igual a 4 · 3 · 2 / 3!, que, C(N, k) o bien CNk.
escrito utilizando factoriales, se puede expresar como 4! / (3! · 1!).
Los cinco mejores

El número de combinaciones de N objetos cogidos de k en k se calcula portátiles
haciendo: PCUniverse nos envía una lista

de veintitrés portátiles y nos
pide que devolvamos la lista de
los que creemos que son los
cinco mejores de la lista. En
 N Número de variaciones de N elementos cogidos de k en k este caso, debemos escoger
  = ---------------------------------------------------------------------------------------------------------------------------------------------------------------- = 5(k) entre 23 (N) posibles y,
 k  Permutaciones de k elementos por tanto, tenemos:
23!
 N – 1   N – k + 1 - = ------------------------ C  N, K  = ------------------------------------ =
= N
--------------------------------------------------------- N! -  5!  23 – 5 ! 
k! k!  N – k !
23!
= --------------------- = 33.649
 5! 18! 
posibilidades de escoger cinco
portátiles (la revista no pide
 N que los ordenemos, sólo quiere
  es el llamado número combinatorio “N sobre k”. saber los que creemos que son
 k  los cinco mejores, sin orden de
preferencia entre sí).
5. Resumen
En esta sesión se hace un recorrido por algunas técnicas de recuento muy uti-
lizadas en el contexto del estudio de la probabilidad. En el cuadro siguiente
resumimos los casos estudiados, sus características y las fórmulas de combina-
toria más importantes que aparecen, suponiendo que dispongamos de N indi-
viduos y tengamos que cogerlos de k en k:
¿Hay que ¿Se pueden ¿Importa

Número total
cogerlos todos? repetir? el orden?
N(N 1) ... (N k 

Variaciones No No Sí
1)
Variaciones
No Si Sí Nk
con repetición
Permutaciones Sí No Sí N!
 N N!
Combinaciones No No No   = -------------------------
 k  k!  N – k !
Las fórmulas se deducen a partir de la llamada regla del producto. También se

insiste en cómo distinguir un caso de otro y en qué casos hay que aplicar cada
una de las definiciones.
Ejercicios
1. El póquer
La baraja de póquer consta de cincuenta y dos cartas con cuatro palos (cora-
zones, diamantes, tréboles y picas) y trece cartas de cada palo, numeradas así:
as, 2 ..., 10, J, Q y K. Cada vez se reparten cinco cartas; esto se llama una mano
de cinco cartas.
a) ¿Cuántas manos de cinco cartas diferentes pueden aparecer al jugar al pó-

quer?
b) ¿Cuántas de estas manos tienen exactamente un as?
c) ¿Cuántas manos no tienen ningún as?
d) ¿Cuántos póquers se pueden formar? Un póquer son cuatro cartas del mis-
mo número y otra de un número diferente.
e) ¿En cuántas manos hay al menos una K?
2. Las sillas de Guillermo Puertas

Se hace una reunión de los diez empresarios más importantes del sector infor-
mático del mundo; a la reunión asisten Guillermo Puertas y su feroz competi-
dor, director de Oracel. Para evitar problemas de protocolo, se sientan en una
hilera de diez sillas:
a) ¿De cuántas maneras diferentes se pueden sentar los diez empresarios?

b) ¿De cuántas maneras diferentes se pueden sentar los diez empresarios, pero
de manera que Guillermo Puertas y su feroz competidor no estén uno al lado
del otro?
Solucionario
1. El póquer:
a) Se trata de hacer subconjuntos de cinco cartas en los que no importa el or-

den y en los que, evidentemente, no se pueden repetir las cartas.
En total, pues,  52 = 2,598,960 manos diferentes.

 5
b) Miremos las posibilidades de escoger cuatro cartas que no sean ases, que
son:
 48 = 194,580
 4
Ahora, para completar una mano, tenemos que escoger entre cuatro ases; por
tanto, las posibilidades totales son:
 48  4 = 778,320
 4
c) Hay que escoger cinco cartas entre las cuarenta y ocho que no son un as.
Por tanto:
 48 = 1,712.304
 5
d) Para formar un póquer, debemos seguir un proceso como éste:
• Escoger un número (del as a la K): trece posibilidades.
• Escoger cuatro cartas de este número: una posibilidad, ya que sólo hay cua-
tro cartas de cada número.
• Escoger una carta de entre las que quedan: cuarenta y ocho posibilidades.
En total tenemos 13 · 48 624 póquers diferentes.
e) Primero miramos en cuántas manos no hay ninguna K:
 52 – 4 = 1,712.300
 5 
Quitamos las cuatro K de la baraja y nos quedan cuarenta y ocho cartas, de las
que tengo que coger cinco. Por tanto, hay al menos una K en:
 52 –  52 – 4 = 886.656 manos

 5  5 
2. Las sillas de Guillermo Puertas:
a) Son las permutaciones de diez personas: 10!  3.628.800.
b) Primero calculamos todas las maneras posibles de que se sienten juntos.

Haremos los cálculos...
Puesto que tienen que sentarse juntos, es como si tuviéramos nueve objetos
por ordenar; teniendo en cuenta que un objeto (el par Guillermo Puertas-di- ... con ordenador o usando la
función factorial de algunas
rector de Oracel) vale por dos, ya que Guillermo Puertas tanto puede estar a la calculadoras.
derecha como a la izquierda, en total tenemos, pues, 2 · 9!  725.760 maneras
de que se sienten juntos. Por tanto, tenemos:
10! 2 · 9! 10 · 9! 2 · 9! 8 · 9!  2.903.040 posibilidades de maneras de

sentarse separados.
Probabilidad
Aquí comenzamos el estudio de la probabilidad. A grandes rasgos, la probabi-

lidad de un suceso es una medida de la tendencia que tiene a darse dicho su-
ceso. Esta medida será un número situado entre dos valores: el 0, que será la
probabilidad de un suceso que no se pueda dar nunca (el suceso imposible) y
el 1, que se corresponderá con un suceso que se da siempre (el suceso seguro).
1. Introducción y frecuencia relativa
Para ilustrar las ideas sobre probabilidad que se introducirán más adelante de
manera formal, comenzaremos por reflexionar sobre la frecuencia relativa de
un resultado de un experimento aleatorio. Así pues, consideramos un experi-
mento aleatorio y su espacio muestral  y vemos, en primer lugar, un ejemplo
que nos guiará en esta introducción.
La frecuencia relativa en un dado trucado (I)
Lanzamos un dado R 100 veces y anotamos cuántas veces aparece cada resultado en la
tabla siguiente:
Resultado 1 2 3 4 5 6
Apariciones 12 28 20 20 5 15
La frecuencia relativa del resultado 2 es 28 / 100; el resultado 5 tiene frecuencia relativa

5/100. Como podéis observar, hay números que tienen más tendencia a salir que otros,
lo que nos puede hacer sospechar que el dado no es perfectamente “neutral”. La frecuen-
cia relativa es un indicador numérico de la tendencia a darse que tiene cada resultado.
Repetimos el experimento aleatorio un número R de veces; si dividimos

el número de veces que se da un resultado por R, obtenemos la frecuen-
cia relativa del resultado. Evidentemente, la frecuencia relativa de cual-
quier resultado es un número entre 0 y 1. La suma de las frecuencias
relativas de todos los resultados debe ser igual a 1.
Partiendo del hecho de que un suceso es un conjunto de resultados, también

es posible determinar su frecuencia relativa.
La frecuencia relativa de un suceso se obtiene dividiendo el número de

veces que el resultado que se obtiene al realizar el experimento es favo-
rable al suceso por el número de repeticiones del experimento.
Para calcular la frecuencia relativa de un suceso también podemos utilizar la

frecuencia relativa de los resultados que contiene.
Significado de la
La frecuencia relativa de cualquier suceso es igual a la suma de las frecuen- frecuencia relativa 0
cias relativas de sus resultados favorables. Es evidente que la frecuencia re- Frecuencia relativa 0 significa
que no ha pasado nunca; fre-
lativa de un suceso es un número entre cero y uno.
cuencia relativa 1 significa
que todas las veces hemos
obtenido un resultado favora-
ble al suceso.
La frecuencia relativa en un dado trucado (II)
Siguiendo con el ejemplo del dado trucado: ¿cuál es la frecuencia relativa del suceso P 
”sacar un número par”? De las cien veces que hemos lanzado el dado, 28 20 15 veces
hemos obtenido un número par; por tanto, la frecuencia relativa de P es:
(28 20 15)/100 63/100
que es precisamente igual a:
28/100 20/100 15/100
es decir, la suma de las frecuencias relativas del 2, el 4 y el 6 (los resultados pares). Así
pues, ¡el 63% de las veces ha salido un número par!
Es muy importante que os deis cuenta de que a partir de las frecuencias relati-
vas de ciertos sucesos podemos deducir la frecuencia relativa de otros.
Recordad que...
Si dos sucesos son incompatibles, la frecuencia relativa de su unión es
la suma de las respectivas frecuencias relativas. ... dos sucesos son incompati-
bles si son disyuntos.
Frecuencia relativa de la unión de sucesos (I)
Siguiendo con el ejemplo del dado trucado, la frecuencia relativa del suceso P “sacar un
número par” es 63% y la del suceso Q “salir un 3 o un 5” es 25%; la frecuencia relativa de
P  Q es 88%, que es precisamente igual a 63% 25%, ya que P y Q son disyuntos.
Fijaos en que si los sucesos no son incompatibles, la frecuencia relativa de su

unión no es la suma de sus frecuencias relativas.
Frecuencia relativa de la unión de sucesos (II)
Si consideramos P “sacar un número par” y Q “sacar un número mayor que 3”; la fre-
cuencia relativa de P es 63%, la de Q es 40%, pero la de P  Q no es 63% 40% 103%,
ya que la frecuencia relativa no puede ser mayor que 100% 1. De hecho, la frecuencia
relativa de P  Q corresponde a la suma de las frecuencias relativas de los resultados 2, 4,
5, 6 y es igual al 68%.
En realidad, la frecuencia relativa de la unión de dos sucesos es la suma de sus

frecuencias relativas menos la frecuencia relativa de su intersección.
Frecuencia relativa de la unión de sucesos (III)
Podemos comprobar la propiedad citada en el caso del ejemplo del dado trucado, ya que
la frecuencia relativa de la intersección de P  Q es 35% y, por tanto, la frecuencia relativa
de P  Q es igual a 63% 40% 35% 68%.
¿Qué otras propiedades de la frecuencia relativa podemos destacar? De entre

Frecuencia relativa
las muchas que tiene, comentaremos dos: del suceso seguro
¿Cuál es la frecuencia relativa

del suceso “sacar un número
1) La frecuencia relativa del suceso seguro es 1, ya que se da siempre que efec- menor que 10” cuando lanza-
mos un dado mil veces? Evi-
tuemos el experimento. La frecuencia relativa del suceso imposible es cero, ya dentemente 1, ya que las mil
que no se da nunca. veces hemos obtenido un nú-
mero menor que diez. Y esta
frecuencia será siempre 1, in-
dependientemente del núme-
2) La frecuencia relativa del complementario de A es 1 menos la frecuencia re- ro de tiradas que efectuemos.
lativa de A.
Frecuencia relativa
de la Ac
2. La teoría de la probabilidad Si un suceso se da el 23% de
las veces, su complementario
se tiene que dar el 77% (100%
La teoría de la probabilidad es una teoría matemática que establece cómo po- 23%) de las veces.
demos asignar una probabilidad a sucesos complejos a partir de la probabilidad

de sucesos más simples. Existen varias formas de definir estas probabilidades,
pero todas tienen que cumplir unos requisitos de coherencia que se correspon-
den con algunas de las propiedades mencionadas para la frecuencia relativa de
los sucesos que hemos comentado en la sección anterior.
La cuestión de decidir qué propiedades básicas se tienen que exigir a lo que

llamamos probabilidad fue estudiada por Kolmogorov hacia los años treinta;
en sus trabajos llegó a la conclusión de que era suficiente con tres propiedades
(axiomas) para establecer el concepto de probabilidad. Estas propiedades son
las siguientes:
1) La probabilidad de cualquier suceso debe ser un número entre 0 y 1. Expresiones para la

probabilidad
Puesto que la probabilidad es

2) Si dos sucesos son disyuntos, la probabilidad de su unión es la suma de las un número entre 0 y 1, a veces
probabilidades de ambos sucesos. la expresaremos en porcentaje,
tal como se suele hacer con la
frecuencia relativa. Así, dire-
mos que cierta probabilidad
3) La probabilidad del conjunto de todos los posibles resultados (suceso segu- es 0,3 o bien del 30%.
ro) debe ser 1.
Si comenzamos por definir la probabilidad como una función P que hace co-
Probabilidad
rresponder a cada suceso su probabilidad, podemos reescribir las propiedades y frecuencia relativa
anteriores de la manera siguiente: Observad que estas propieda-
des son algunas de las mencio-
nadas por la frecuencia relativa,
P1.) 0  P(A)  1 para todo suceso A. sólo que cambiando la ex-
presión “frecuencia relativa”
por “probabilidad”.
P2.) Si A y B son sucesos disyuntos, entonces P(A  B)  P(A) P(B).
P3.) P() 1 (en el que  es el espacio muestral, que se corresponde con el su-
ceso que contiene todos los posibles resultados).
3. Propiedades que se derivan de la definición de probabilidad

Probabilidad
y frecuencia relativa
A continuación veremos que, con las propiedades P1, P2 y P3, podemos llegar Observad que en la definición
de probabilidad no existe nin-
a conclusiones muy interesantes sobre la probabilidad de algunos sucesos de- guna regla para calcular la
P(A  B) en función de P(A)
terminados. y P(B).
3.1. La probabilidad del suceso imposible
Con respecto al suceso imposible , tenemos que:
P() 0
Esto se debe a los hechos siguientes:
a) Puesto que  y  son disyuntos, por aplicación de la propiedad P2:
P(  ) P()  P()
b) Pero dado que     , por la propiedad P3, P(  ) P() 1.
c) En consecuencia, 1 P() 1, de lo que podemos concluir que P() 0.
3.2. La probabilidad del complementario
Un razonamiento análogo nos permite tratar la probabilidad del complemen-

tario de un suceso. Fijémosnos en que, para todo suceso A, A  Ac ; por las
propiedades P2 y P3, tenemos que P(A  Ac) P(A) P(Ac) P() 1; entonces:
P(Ac) 1  P(A)
3.3. La probabilidad de la unión
Otra propiedad muy interesante que se deriva de A (A  B)  (A  Bc) y del

hecho de que (A  B) y (A  Bc) son disyuntos es la siguiente:
P(A) P(A  B) P(A  Bc)

Gráficamente:
Una propiedad de la unión
A (A  B)  (A  Bc), ya que

los resultados de A son “los
de A que están en B” unión
“los de A que no están en B”.
La propiedad 2 permite calcular la probabilidad de la unión de sucesos que

sean incompatibles, pero ¿qué pasa si los sucesos no lo son? En este caso apli-
caremos la regla siguiente:
P(A  B) P(A) P(B) P(A  B)
Según ésta, para calcular la probabilidad de la unión hay que calcular la suma
de probabilidades y después restar la probabilidad de la intersección. Por tan-
to, siempre tenemos que P(A  B)  P(A) P(B).
Demostración de la regla de la probabilidad de la unión
La regla según la cual P(A  B) P(A) P(B) P(A  B) se puede demostrar muy fácilmente
a partir de los hechos siguientes:
1) Tal como se ve en el gráfico siguiente:
tenemos que A  B B  (A  Bc ). Puesto que estos conjuntos son evidentemente disyun-
tos, tenemos que P(A  B) P(B)  P(A  Bc );
2) Puesto que P(A) P(A  B) P(A  Bc), podemos deducir que P(A  Bc) P(A) P(A  B).
3) Finalmente, P(A  B) P(B) P(A  Bc )  P(B)  P(A) P(A  B).
4. Asignación de probabilidad cuando los resultados son

equiprobables. Regla de Laplace
Hasta ahora hemos visto cómo permite la teoría de la probabilidad asignar pro-
babilidades a ciertos sucesos a partir de la probabilidad de otros sucesos más
simples. Ahora falta ver cómo podemos asignar probabilidades a los sucesos
más simples de todos (los resultados de un experimento aleatorio), de manera
que podamos obtener, gracias a la probabilidad, conclusiones interesantes so-
bre los sucesos y sobre las situaciones descritas por los sucesos que interesan.
Primero comenzaremos por definir lo que se entiende por resultados equipro-

bables.
Dos resultados de un experimento aleatorio son equiprobables si tie- Probabilidad

nen la misma probabilidad de suceder. y equiprobabilidad
Puede parecer paradójico defi-

nir la probabilidad a partir del
Un espacio muestral es uniforme si todos los resultados son equiproba- concepto de sucesos equipro-
bles. bables. Lo que pasa es que
todo el mundo entiende per-
fectamente que, si el dado es
perfecto, tantas posibilidades
hay de sacar un uno como un
En este caso, si  {1, 2 … k} tiene k posibles resultados, tendremos que dos, etc. Es decir, el concepto
de equiprobabilidad no depen-
P(1) P(2) … P(k). Por aplicación de la propiedad 2 y partiendo del de de cómo midamos efectiva-
mente la probabilidad de cada
hecho de que los resultados de un experimento aleatorio son siempre disyun- uno de los números del dado.
tos –ya que si se da un resultado, no se puede dar otro diferente–, tenemos que:
1 P() P(1  2  …k) P(1) P(2) …P(k) kP(1)
y, por tanto, la probabilidad de cada resultado es:
P  i  = 1 1 -
--- = ----------------------
k Card   
¿Cuál será la probabilidad de un suceso cualquiera? Supongamos que el suceso

Probabilidad de un dado
A resulta estar formado por s resultados, con lo que Card(A) s; supongamos perfecto
que, por ejemplo, A {1, 2, …, s}. En este caso: Si lanzamos un dado perfecto,
todos los números tienen la
misma probabilidad de salir.
P(A)  P(1) P(2) … p(s)  (1/k) … (1 / k) s/k ¿Cuál es ésta probabilidad?
Evidentemente, será 1/6.
Es decir, para calcular la probabilidad de A, deberemos determinar cuántos re-

sultados forman parte del suceso A –los resultados favorables a A– y dividir este
número por el total de resultados posibles; ésta es la llamada regla de Laplace.
La regla de Laplace afirma que en un espacio uniforme la probabilidad

de un suceso A se calcula mediante el cociente siguiente:
Card  A - = -----------------------------------------------------------------------------------------------------
P  A  = ---------------------- Número de resultados favorables a A-
Card    Número total de posibles resultados
El uso de esta regla permite interpretar la probabilidad como porcentaje, ya que

Ejemplo de cálculo
podemos considerar P(A) como el porcentaje de veces que se da un resultado de de probabilidades
A con respecto al total de posibles resultados. Lanzamos un dado perfecto
(sin trucar) y consideramos los
Ejemplo de aplicación de la regla de Laplace sucesos A  “sale un número
mayor que 4”, B “sale un nú-
mero par”, C “sale un núme-
Lanzamos una moneda perfecta tres veces y consideramos los sucesos siguientes: A “salen
ro mayor que 8”. En este caso,
3 caras”, B “sale una única cruz”, D “no salen ni dos caras ni dos cruces consecutivas”. el espacio muestral tiene 6 po-
En primer lugar determinamos el espacio muestral del experimento, espacio que se puede sibles resultados equiprobables
obtener fácilmente mediante el árbol de los posibles resultados (en los que C representa cara y P(A) 2/6, P(B) 3/6 1/2,
y  representa cruz): P(C) 0/6 0.
por tanto:
 {(CCC), (CC), (C C), (C),(CC), (C), (C), ()}
es decir, tenemos ocho posibles resultados, y todos ellos son equiprobables (ya que a cada
tirada la probabilidad de que salga cara es la misma probabilidad de que salga cruz). A
continuación podemos calcular cada uno de los sucesos:
A {(CCC)}, B {(CC), (C C), (CC)}, D {(C C), (C)}
Las probabilidades correspondientes son P(A) 1/8, P(B) 3/8, P(D) 2/8.
5. Probabilidades en espacios muestrales no uniformes

y frecuencia relativa
No siempre podemos asegurar que los resultados de un experimento aleatorio

sean equiprobables. Pensemos en el caso de un dado del que sospechamos que
está trucado; ahora nos enfrentamos a dos nuevos problemas: cómo podemos
confirmar esta sospecha y cómo podemos calcular la probabilidad de cada re-
sultado. En los dos casos la respuesta pasa por calcular la frecuencia relativa de
cada uno de los resultados después de repetir el experimento una y otra vez.
Así, si después de repetir el experimento (lanzar el dado) mil veces, obtenemos

cien unos, cien doses, cien treses, cien cuatros, cien cincos y quinientos seises, po-
demos pensar que la probabilidad de obtener un seis es aproximadamente 1/2,
mientras que la probabilidad de obtener cualquier otro número será de aproxima-
damente 1/10.
Claro que estas aproximaciones a la probabilidad de cada resultado no serán

definitivas, ya que al ir aumentando el número de repeticiones del experimen-
to, irán cambiando las frecuencias relativas. Para evitar esta ambigüedad, se va
repitiendo el experimento y se observa si la frecuencia relativa de cada resulta-
do tiende hacia algún valor a medida que se van repitiendo los experimentos.
Necesidad
Estas probabilidades, obtenidas como el valor al que tienden las frecuen- de la repetibilidad
cias relativas después de repetir muchas veces un experimento, se deno- Recordad que una de las carac-
minan probabilidades empíricas. terísticas que pedimos a los ex-
perimentos aleatorios es que se
tienen que poder repetir tantas
veces como sea necesario.
A partir de estas probabilidades empíricas, y aplicando las propiedades que de-

finen la probabilidad, podemos asignar probabilidad a todos los otros sucesos.
Un dado curioso y bastante trucado
Lanzamos un dado 150.000 veces y obtenemos los resultados siguientes:
Resultado 1 2 3 4 5 6
Frecuencia 1 100.000 40.000 9.999 0 0
Para calcular las probabilidades empíricas de cada uno de los resultados, debemos dividir
su frecuencia por 150.000 (el número de veces que hemos repetido el experimento). La
probabilidad de que el número sea par es (100.000 / 150.000) (9.999 / 150.000). La pro-
babilidad de que el número sea mayor que 5 es 0.
6. Probabilidad condicionada
En este apartado nos concentraremos en el concepto de probabilidad condi-

cionada. Comenzaremos por un ejemplo en el que se ilustra la influencia que
unos sucesos pueden tener sobre otros.
Probabilidad condicionada en un dado perfecto
Si lanzamos un dado perfecto, la probabilidad de que el resultado sea un número par es 0,5.
A continuación lanzamos el mismo dado y cae debajo de la mesa, y antes de mirar el nú-
mero que ha salido, alguien nos dice que es mayor que 3; en este caso, ¿cuál es la proba-
bilidad de que sea par? Lo primero que debemos preguntarnos es cuáles son los posibles
resultados: son {4, 5, 6}, ya que la información previa de la que disponemos descarta que
haya salido un uno, un dos o un tres. Así, de los posibles resultados mayores que 3, dos
son pares. Por tanto, dado que tenemos tres resultados en los que el número que sale es
mayor que 3 –y de éstos, dos son pares–, la probabilidad de que salga par sabiendo que
el número es mayor que 3 es 2/3.
A continuación definimos el concepto de probabilidad condicionada, que re-

coge la influencia que pueden tener unos sucesos sobre otros.
Observación sobre la
La probabilidad del suceso A condicionado a B, probabilidad que deno- probabilidad condicionada
taremos por P(A | B), es la probabilidad de que al realizar el experimento Observamos que si el resultado
aleatorio, el resultado obtenido sea de A, sabiendo que el resultado ob- es de B, puede ser de A (con lo
que será de A  B) o no.
tenido es de B. En el ejemplo del dado perfec-
to, si B ”ser mayor que 3” y
A ”ser par”, tendremos que si
el resultado es de B (“ser mayor
que 3”), puede ser de A (“ser
Comenzaremos calculando de forma intuitiva probabilidades condicionadas par”) o no (“no ser par”).
en una situación relacionada con los ordenadores de nuestra empresa.
Consideremos la tabla siguiente, que registra las diferentes configuraciones de

los cincuenta ordenadores de nuestra empresa, considerando la RAM de la que
disponen y el tipo de procesador (el tipo de procesador aparece en una etique-
ta pegada al lado del botón de puesta en marcha, mientras que para saber la
RAM, hay que poner en funcionamiento el ordenador):
64 MB 128 MB
Patinum1 10 20
Patinum22 10 10
De la tabla obtenemos que tenemos diez ordenadores con 64 MB de RAM y

Patinum1, veinte ordenadores con 128 MB de RAM y Patinum1, diez ordena-
dores con 64 MB de RAM y Patinum22 y, finalmente, diez ordenadores de 128
MB de RAM y Patinum22. Si escogemos un ordenador al azar, podemos calcu-
lar fácilmente muchas probabilidades; por ejemplo, P (“estar equipado con Pa-
tinum1”) 30/50, mientras que P (“tener 64 MB de RAM”) 20/50.
A continuación introducimos la probabilidad condicionada: supongamos que

escogemos un ordenador al azar y leemos en la etiqueta que su procesador es
un Patinum22; nos preguntamos cuál es la probabilidad de que tenga 64 Mb de
RAM. ¿Cuál es esta probabilidad? Sabemos que el ordenador lleva un Patinum22
y, por tanto, debe ser uno de los veinte ordenadores que tienen este procesador.
De entre estos veinte, sabemos que diez tienen 64 MB de RAM, por tanto:
P(“tiene 64 MB de RAM” | “lleva Patinum22”) 10 / 20 1 / 2
Otro caso: hemos puesto en marcha un ordenador sin mirar el adhesivo del
procesador y resulta que tiene 128 MB de RAM. ¿Cuál es la probabilidad de que
tenga Patinum1? De la misma manera que antes, hay treinta ordenadores con
128 MB de RAM, de los cuales veinte tienen Patinum1; por tanto:
P(“lleva Patinum1” | “tiene 128 MB de RAM”)20/30
Si en esta última fórmula dividimos numerador y denominador por el total de

individuos, obtenemos:
P(“lleva Patinum1” | “tiene 128 MB de RAM”) (20/50) / (30/50)
en el que 30/50 resulta ser la probabilidad de tener 128 MB de RAM y, por tanto,
P(“lleva Patinum1”| “tiene 128 MB de RAM”) 

= (20 / 50) / P(“tiene 128 MB de RAM”)
Ahora nos queda averiguar qué representa el numerador: puesto que hay vein-
te ordenadores que tienen Patinum1 y 128 MB de RAM, 20/50 es la probabili-
dad de que un ordenador tenga Patinum1 y también 128 MB de RAM, con lo
que finalmente obtenemos:
P(“lleva Patinum1” | “tiene 128 MB de RAM”) 

P(“lleva Patinum1”  “tiene 128 MB de RAM”) / P(“tiene 128 MB de RAM”)
Observación
Fijaos en que si P(B) 0, no tie-

Este resultado motiva la fórmula siguiente, válida para calcular probabilidades ne sentido definir la probabili-
dad P(A | B).
condicionadas. Sean A y B dos sucesos, de manera que P(B) > 0; entonces:
P  A  B -
P  A B  = -----------------------
PB
Cálculo de probabilidades
condicionadas
En el ejemplo de la RAM y los

Patinum tenemos que P(“tiene
6.1. Relación entre probabilidad condicionada y probabilidad 128 MB” | “lleva Patinum22”) 
P(“tiene 128 MB” “lleva
de la intersección Patinum22”) / P(“lleva Pati-
num22”) = (10/50) /
/ (20/50) = 1/2.
Recordad que no tenemos ninguna fórmula para determinar la probabilidad
de la intersección de dos sucesos; en cambio, a partir de la fórmula de la pro-
babilidad condicionada podemos obtener el resultado siguiente: dados dos su-
cesos cualesquiera A y B, con P(A) > 0 y P(B) > 0, entonces:
P(A  B)  P(A | B) · P(B) P(B | A) · P(A)
Esta propiedad se demuestra de forma fácil, simplemente aislando P(A  B) en

la definición de P(A | B) y P(B  A) P(A  B) en la definición de P(B | A).
7. Independencia de sucesos
Comenzaremos por una definición intuitiva del concepto de independencia

para poder justificar más adelante la definición formal.
Dos sucesos A y B son independientes cuando el hecho de que ocurra

uno no altera la probabilidad de que ocurra el otro.
La formalización de esta idea a partir de la probabilidad condicionada da lugar

Independencia
a la llamada regla del producto de probabilidades. Dos sucesos A y B son inde sucesos (I)
dependientes si y sólo si: Para ver si dos sucesos son in-
dependientes calculamos P(A),
P(B) y P(A  B).
• Si P(A  B) P(A) · P(B),
P(A  B) P(A) · P(B) entonces son independien-
tes.
• Si P(A  B)  P(A) · P(B), en-
tonces no son independien-
Ahora podemos preguntarnos qué relación tiene esta definición de independen- tes.
cia con la probabilidad condicionada: pues bien, es fácil demostrar que para de-
terminar si dos sucesos son independientes, tenemos tres vías diferentes.
Independencia
de sucesos (II)
Si P(A) > 0 y P(B) > 0, las afirmaciones siguientes son equivalentes: a) Calculamos P(A) y P(A | B); si
P(A) P(A | B), entonces los su-
cesos son independientes;
1) Los sucesos A y B son independientes. si P(A)  P(A | B), entonces no lo
son.
2) P(A  B) P(A) · P(B) b) Calculamos P(B) y P(B | A); si
3) P(A | B) P(A) P(B) P(B | A), entonces los su-
cesos son independientes; si
4) P(B | A) P(B) P(B)  P(B | A), entonces no lo
son.
Demostración de la regla del producto de probabilidades

Ejemplo de sucesos
independientes
Las afirmaciones 1 y 2 son equivalentes por definición (es la regla del producto).
Consideremos dos sucesos
Ahora supongamos que se da la afirmación 2, según la cual P(A  B) P(A) · P(B); por cualesquiera tales que P(A) 
tanto: 0,5, P(B) 0,5 y P(A  B) 
 0,25; los sucesos A y B son
P(A | B) P(A  B)/P(B) P(A) · P(B)/P(B) P(A) independientes, ya que:
P(A  B) P(A) · P(B).
con lo que hemos demostrado la afirmación 3.
Por otra parte, si P(A | B) P(A), tenemos que P(A  B)/P(B) P(A) y, por tanto, P(A 
B) P(A) · P(B), con lo que demostramos que la afirmación 3 implica la 2.
Que la afirmación 2 es equivalente a la 4 se hace de la misma forma, observando que:

Interpretación de dos
P(A  B) P(B  A) sucesos no independientes
Los sucesos A y B no son

Ejemplo de sucesos independientes con un dado perfecto independientes, ya que dentro
de B la proporción de pares
Volvamos ahora al ejemplo del dado perfecto y consideremos los sucesos A ”sacar un es 2/3, mientras que del total
número par”, B ”sacar un número mayor que 3” y C ”sacar un número mayor que 4”. de resultados la proporción de
Nos preguntamos si los sucesos A y B son independientes; para hacerlo, calculamos: pares es 1/2; es decir, dentro
del suceso B la probabilidad de
P(A) 3/6 1/2 y A es mayor que con respecto al
total de resultados; por eso A y
P(A | B) P(A  B)/P(B) P(“par mayor que 3”) / P(“mayor que 3”) 
B no son independientes.
P({4, 6})/P({4, 5, 6}) (2/6) / (3/6) 2/3
Puesto que P(A) 1/2  P(A/B) 2/3, los sucesos A y B no son independientes. En cambio:
P(A | C) P(A  C) / P(C) P(“par mayor que 4”) / P(“mayor que 4”) 
 P({6}) / P({5, 6}) (1/6) / (2/6) 1/2
Dado que P(A) 1 / 2 P(A | C), los sucesos son independientes.
Ejemplo de procesos no independientes lanzando un dado dos veces
Continuamos con los dados, pero ahora lanzamos un dado dos veces. Consideremos los
sucesos A “el valor máximo de las dos tiradas es 1”; B “la suma de los valores de las Interpretación de dos
sucesos independientes
dos tiradas es un número par”. Es fácil ver que P(A) 1 / 36, ya que hay 36 resultados
posibles y sólo en uno –el caso (1,1)– el máximo vale 1. Para calcular la P(B), construimos En el caso del suceso C, la pro-
el espacio muestral, en el que destacamos los resultados de B: porción de pares dentro de C
es 1 / 2, igual que la propor-
(1 1) (1 2) (1 3) (1 4) (1 5) (1 6) ción de pares con respecto
(2 1) (2 2) (2 3) (2 4) (2 5) (2 6) al total; por tanto, el hecho
(3 1) (3 2) (3 3) (3 4) (3 5) (3 6) de que ocurra C no afecta a la
probabilidad de A, o lo que es
(4 1) (4 2) (4 3) (4 4) (4 5) (4 6)
lo mismo, A y C son indepen-
(5 1) (5 2) (5 3) (5 4) (5 5) (5 6) dientes.
(6 1) (6 2) (6 3) (6 4) (6 5) (6 6)
Claramente, P(B) 18 / 36 1 / 2. Ahora bien:
P(A | B) P(A  B)/P(B) (1/36) / (1/2) 1/18
Había que esperar este valor, ya que dentro de B (que tiene 18 elementos) sólo hay un
resultado que pertenezca a A. Dado que P(A | B)  P(A), podemos concluir que A y B no
son independientes.
En resumen, y si nos fijamos en la relación entre los valores de P(A) y P(A | B),
tenemos las posibilidades siguientes:
a) P(A | B) > P(A); en este caso, podemos decir que el suceso B favorece que
ocurra el suceso A, ya que la probabilidad de A sabiendo que hemos obtenido
un resultado de B es mayor que la probabilidad de A solo.
b) P(A | B) < P(A); en este caso podemos decir que el suceso B dificulta que ocu-
rra el suceso A, ya que la probabilidad A disminuye si se da un resultado de B.
c) P(A | B) P(A); en este caso, el hecho de que ocurra un resultado de B no afec-

ta a la probalilidad de A. Por tanto, ambos sucesos no se afectan mutuamente:
son independientes.
8. Resumen
Esta sesión está dedicada íntegramente a definir el concepto de probabilidad y

a deducir sus consecuencias más importantes. Se comienza trabajando sobre la
noción de frecuencia relativa de sucesos para justificar la presentación de tres
axiomas (las propiedades P1, P2 y P3), con las que quedan fijadas las caracterís-
ticas que debe tener una función de probabilidad. Una vez fijados los axiomas,
se extraen las primeras consecuencias de la relación entre la probabilidad y
las operaciones entre sucesos (unión, complementario...), considerando es-
pecialmente aquellas propiedades necesarias posteriormente en el desarrollo
de la teoría.
Los axiomas de la probabilidad determinan cómo podemos asignar probabili-

dad a sucesos complejos a partir de sucesos más simples, pero también cabe pre-
ocuparse de la asignación de probabilidad a los sucesos más simples de todos:
los resultados del experimento aleatorio; para hacerlo, hay que considerar dos
casos, según si el espacio es uniforme o no:
1) Si el espacio es uniforme, es decir, si todos los resultados tienen la misma

probabilidad, resulta que la probabilidad de un resultado es 1 dividido por el
número de resultados posibles; como consecuencia, obtenemos la llamada re-
gla de Laplace, según la cual la probabilidad de un suceso se obtiene dividien-
do el número de resultados favorables al suceso por el número de resultados
posibles.
2) En caso de que el espacio no sea uniforme, la probabilidad de los sucesos se

aproxima por las llamadas probabilidades empíricas, que se corresponden al
valor al que tienden las frecuencias relativas de los sucesos a medida que vamos
repitiendo el experimento aleatorio.
En la segunda parte de la sesión se examina la noción de probabilidad condi-

cionada, concepto que recoge y formaliza la posible influencia de un suceso
en otro. Si suponemos que tenemos dos sucesos A y B, P(A | B) denota la pro-
babilidad de obtener un resultado de A sabiendo que se ha obtenido un resul-
tado de B. En caso de que P(A | B) P(A), es decir, si el hecho de que se dé un
resultado de B no afecta a la probabilidad del suceso A, diremos que A y B son
independientes. Finalmente, se caracteriza la independencia de sucesos me-
diante la regla del producto de probabilidades, según la cual los sucesos A y B
son independientes si P(A  B) P(A) · P(B).
Ejercicios
1. Hemos fabricado dieciséis unidades de un determinado producto. Hemos

obtenido diez buenos, cuatro con pequeños defectos y dos muy defectuosos.
Los comerciantes sólo aceptan los artículos buenos, pero la compañía KaBaC
sólo rechaza los muy defectuosos.
a) Si escogemos un artículo al azar, ¿cuál es la probabilidad de que sea acep-

tado por el comerciante?
b) Si escogemos dos, ¿cuál es la probabilidad de que los dos sean rechazados
por la compañía KaBaC? ¿Y de que sea aceptado exactamente uno por el co-
merciante?
c) Si escogemos tres, ¿cuál es la probabilidad de que el comerciante no acepte
ninguno?
2. Póquer
La baraja de póquer consta de cincuenta y dos cartas con cuatro palos (corazones,
diamantes, tréboles y picas) y trece cartas de cada palo, numeradas así: as, 2, .., 10,
J, Q y K. Cada vez se reparten cinco cartas, lo que se denomina una mano de cinco
cartas.
a) ¿Cuál es la probabilidad de obtener una mano con un único as?

b) ¿Cuál es la probabilidad de obtener al menos un as?
3. Las alarmas
En una fábrica la probabilidad de que el sistema de alarma 1 falle es del 20%,
la probabilidad de que falle el sistema de alarma 2 es del 10% y la probabilidad
que fallen los dos al mismo tiempo, del 4%. ¿Cuál es la probabilidad de que:
a) al menos uno de los dos funcione?

b) funcionen los dos?
4. Defectos en cadena
El proceso de fabricación de un objeto pasa por dos cadenas independientes. La
probabilidad de adquirir un defecto en la primera cadena es de 0,001 y en la se-
gunda, del 0,0001. Calculad la probabilidad de que un objeto sea defectuoso.
5. Lanzamos una moneda perfecta tres veces:
a) ¿Cuál es la probabilidad de obtener un total de dos caras en las tres tiradas?

b) ¿Cuál es la probabilidad de obtener al menos una cara?
c) ¿Cuál es la probabilidad de obtener dos caras consecutivas, pero no tres caras?
d) Calculad la probabilidad de obtener dos caras consecutivas, pero no tres ca-
ras, sabiendo que, efectivamente, han salido dos caras.
e) ¿Los sucesos “obtener dos caras consecutivas pero no tres caras” y “obtener
dos caras” son independientes?
f) Dad un ejemplo de dos sucesos relacionados con las tres monedas que sean
independientes; justificad vuestra respuesta.
6. Lanzamos una moneda trucada tres veces. Repetid el problema anterior su-
poniendo que la moneda está trucada, de modo que la probabilidad de obte-
ner cara en cada lanzamiento es 0,8.
7. Demostrad, utilizando las propiedades conocidas de la probabilidad, lo si-

guiente:
a) P(AC | B) 1 P(A | B)

b) P(B | A) P(A | B) · P(B)/P(A)
8. Un estudio llevado a cabo entre los estudiantes de la universidad pregunta-

ba, entre otras variables, el sexo y si alguna vez se había visitado el Valle de Nu-
ria. Una vez procesadas las respuestas, se obtuvo lo siguiente:
• Respondieron 70 hombres y 30 mujeres.

• En total, 60 de los encuestados habían visitado el Valle de Nuria.
• 42 hombres habían visitado Nuria.
Se pide:
a) Calculad la probabilidad de que un encuestado seleccionado al azar sea

hombre.
b) Calculad la probabilidad de que un encuestado seleccionado al azar sea
hombre y haya visitado el Valle de Nuria.
c) Escogemos un cuestionario al azar y resulta ser el de un hombre. ¿Cuál es
la probabilidad de que en este cuestionario se haya respondido ‘‘no’’ a la pre-
gunta ‘‘¿Ha estado en el Valle de Nuria?’’.
d) Escogemos un cuestionario al azar y resulta ser el de una persona que afir-
ma haber visitado el Valle de Nuria. ¿Cuál es la probabilidad de que este cues-
tionario corresponda a una mujer?
e) En vista de los resultados de la encuesta, ¿los sucesos ‘‘ser hombre’’ y ‘‘ha-
ber visitado el Valle de Nuria’’ son independientes? Interpretad el resultado.
Solucionario
1. Estamos en una situación en la que todos los posibles resultados tienen la

misma probabilidad. Así, para calcular la probabilidad de un suceso, utilizaremos
la fórmula:
a) El número total de resultados es 16 y el número a favor del suceso es 10:
Número de resultados a favor del suceso

---------------------------------------------------------------------------------------------------------------
Número total de resultados
Por tanto, P (“aceptado por el comerciante”) 10/16.
b) En este caso el número total de resultados es el binomio:
 16 = 120
 2
(es como escoger dos elementos de 16). Los resultados en los que ambos sean
rechazados por la compañía KaBaC son únicamente uno (tenemos que coger
los dos productos muy defectuosos) y, por tanto:
1 - = 0,00833
P (“los dos rechazados por KaBaC”)  -----------
 16
 2
Los resultados a favor de que el comerciante acepte exactamente uno son

10 * 6 60 (tenemos que escoger uno entre los diez buenos y uno de entre
los seis restantes). Por tanto:
60 - = 0,5
P (“uno aceptado por el comerciante”)  -----------
 16
 2
c) Con un razonamiento análogo, obtenemos:
 6
 3
P (“comerciante que no acepte ninguno de los tres”)  -----------
- = 0,0357
 16
 3
2. Póquer
a) Dado que todas las manos son equiprobables, tenemos que dividir el total
de manos en las que hay un único as por el total de manos, con lo que obte-
nemos el resultado siguiente:
 48  4
 4
-------------------
- = 0,29947
 52
 5
b) Será 1 menos la probabilidad de no tener ningún as; evidentemente:
 48
 5
P (“no obtener ningún as”)  -----------
- = 0,6588
 52
 5
ya que para no tener ningún as, debemos escoger cinco cartas entre las cua-
renta y ocho que no son as. Así pues:
P (“obtener al menos un as”) 1 P (“no obtener ningún as”) 

1 0,6588 0,3412
3. Las alarmas
Definimos F1 “la alarma 1 falla’’ y F2 “la alarma 2 falla’’. Sabemos que P(F1)
0,2; P(F2) 0,1 y P(F1  F2) 0,04. Entonces:
a)
P (‘‘que al menos uno de los dos funcione’’) =

1 P (‘‘que ninguno funcione’’) 1 P(F1  F2) 1 0,04 0,96
b)
P(“que funcionen los dos’’) 1 P(“que alguno no funcione”) 

1 P(F1  F2) 1  (P(F1) P(F2) P(F1  F2)) 
1 (0,2 0,1 0,04) 0,74
4. Defectos en cadena
Definimos D1 “defecto en la cadena 1” y D2 “defecto en la cadena 2”. Sa-
bemos que:
P(D1) 0,001; P(D2) 0,0001 y P(D1  D2) P(D1) · P(D2) 0,0000001
ya que, al ser las cadenas independientes, D1 y D2 son sucesos independientes.

Entonces:
P (“objeto defectuoso”) 
 P(D1  D2) P(D1) P(D2) P(D1  D2) 0,001 0,0001 0,000001
5. Lanzamos una moneda perfecta tres veces.

En total tenemos ocho posibilidades: {ccc, cc, cc, cc, c, c, c, }; cal-
cularemos las probabilidades y después comprobaremos el resultado buscando
los sucesos favorables; observad que los ocho resultados tienen la misma pro-
babilidad: 1/8.
 3
 2
a) --------  0,37; ya que de las tres tiradas dos tienen que ser caras. También se
8
puede calcular haciendo:
Card (“ en total dos caras ” )   cc+, c+c,+cc  - = 3

- = Card
------------------------------------------------------------------------- --------------------------------------------------------- ---
8 8 8
b) La probabilidad de obtener al menos una cara es:
1 P(“no obtener ninguna cara”) 

Card (“ no obtener ninguna cara” -) = 1 – Card
= 1 – ----------------------------------------------------------------------------------------------   +++   = 1 – 1
----------------------------------- ---
8 8 8
c) La probabilidad de obtener dos caras consecutivas, pero no tres caras, es:
Card   cc+,+cc  - = 2
-------------------------------------------- ---
8 8
d) La probabilidad que nos piden en el enunciado es:
P (“dos caras consecutivas, pero no tres caras” | “han salido dos caras”)
P (“dos caras consecutivas, pero no tres caras”  “han salido dos caras) /
/ P (“han salido dos caras”) (2/8) / (3/8) 2/3.
e) Hemos visto que:
P (“dos caras consecutivas, pero no tres caras”|“han salido dos caras”) 2/3
pero
P (“dos caras consecutivas, pero no tres caras”) 2/8
y, por tanto, los sucesos no son independientes.
f) Por ejemplo, consideremos los sucesos U “la tercera vez sale cara’’ y F “la
primera vez sale cara’’; tenemos que P(U) 1/2 y P(F) 1/2; también tenemos que
P(U  F) 2/8 1/4. Dado que P(U  F) 2/8 1/4 P(U) · P(F), llegamos a la
conclusión de que los sucesos son independientes.
6. Lanzamos una moneda trucada tres veces:

Calcularemos las probabilidades de cada uno de los posibles resultados:
P(CCC) 0,83 0,512
ya que, puesto que las tiradas son independientes:
P(CCC) P (“primera es cara”  “segunda es cara”  “tercera es cruz”) 

P (primera es cara) · P (segunda es cara) · P (tercera es cara) 0,83;
P(CC) 0,82 · 0,2
Ya que las tiradas son independientes:
P(CC) P (“primera es cara”  “segunda es cara”  “tercera es cruz”) 

P (“primera es cara”) · P (“segunda es cara”) · P (“tercera es cruz”)  0,82 · 0,2.
Siguiendo este razonamiento, tenemos la tabla siguiente:
1 2 3 4 5 6 7 8
Resultado CCC CC CC CC C C C +++
Probabilidad 0,83 0,82 0,2 0,82 0,2 0,82 0,2 0,8 0,22 0,8 0,22 0,8 0,22 0,23
• La probabilidad de obtener dos caras será la suma de las probabilidades de

los sucesos 2, 3 y 4; es, pues: 0,82 0,2 0,82 0,2 0,82 0,2  0,384.
• La probabilidad de obtener al menos una cara será la suma de las probabi-

lidades de los resultados 1, 2, 3, 4, 5, 6, 7 o uno menos la probabilidad del
resultado 8, es decir, será: 1 0,23 0,992.
• Dos caras consecutivas, pero no tres caras, se corresponden con los sucesos
2 y 4; la suma de sus probabilidades es: 0,82 0,2 0,82 0,2 0,256.
• Ahora debemos calcular:
P (“dos caras consecutivas, pero no tres caras”“han salido dos caras”) /

/ P (“han salido dos caras”)  0,256/0,384 0,67.
• Hemos visto que:
P (“dos caras consecutivas, pero no tres caras” | “han salido dos caras”) 0,67
pero P (“dos caras consecutivas, pero no tres caras”) 0,256 y, por tanto,
los sucesos no son independientes.
• Consideremos los sucesos del ejercicio anterior:
U “la tercera vez sale cara” y F “la primera vez sale cara”
Tenemos que:
P(U) 0,83 0,82 0,2 0,82 0,2 0,8 0,22 0,8
Es evidente que P(F) 0,8; también tenemos que P(U  F)  0,83 0,82 · 0,2
 0,64. Dado que P(U  F) 0,64 P(U) · P(F), llegamos a la conclusión de
que los sucesos son independientes.
7.
a) Si aplicamos la definición, tenemos que: P(AC | B) P(AC  B) / P(B); por
otro lado, sabemos que P(B) P(B  AC) P(A  B) y, así, P(B  AC) P(B) 
P(A  B). Por tanto:
C P  B  – P  A  B - = 1 – -----------------------
P  A B  = ----------------------------------------- P  A  B - = 1 – P  A B 
PB PB
PB PA  B PB  A  B - = P  B  A - = P  B A 

b) P  A B   ------------ = ------------------------  ------------ = P
----------------------- -----------------------
PA PB PA PA PA
8.
a) En total respondieron cien personas, de las cuales setenta eran hombres.
Por tanto:
P(“hombre”) 70/100
b) Dado que hay cuarenta y dos hombres que han visitado el Valle de Nuria,
P (“hombre”  “ha visitado Nuria”) 42/100.
c) Nos pide que calculemos la probabilidad siguiente:
P (“no ha visitado el Valle de Nuria” | “hombre”) 

P (“no ha visitado el Valle de Nuria”  “hombre”) / P (“hombre”) 
 (28/100) / (70/100)  0,4
d) Nos piden:
P (“mujer” | “ha visitado el Valle de Nuria”) 

P (“mujer”  “ha visitado el Valle de Nuria”) / P (“ha visitado el Valle de
Nuria”)  (18/100) / (60/100) 0,3
e) Podemos calcular las probabilidades siguientes:
P (“ha visitado el Valle de Nuria”) 60/100 0,6 y

P (“ha visitado el Valle de Nuria” | “hombre”) (42/100) / (70/100) 0,6
Puesto que estas probabilidades son iguales, los sucesos son independientes, y
al ser sucesos independientes, podemos afirmar que el hecho de ser hombre ni
favorece ni dificulta el que una persona haya visitado el Valle de Nuria.
El teorema de Bayes
En esta sesión presentaremos el teorema de Bayes, un resultado importantísi-

mo para entender las relaciones causa-efecto entre diferentes sucesos. Comen-
zaremos trabajando con particiones del espacio muestral y relacionándolas
con la probabilidad condicionada.
1. Particiones
Comenzaremos por definir una partición de un conjunto cualquiera.

Utilidad de las particiones
Como tendremos oportunidad

Dado un conjunto cualquiera E, una partición de E es una colección de de ver más adelante, el hecho
de trabajar con dos particiones
subconjuntos de E disyuntos, tales que su unión es el conjunto E. permite estudiar situaciones en
las que se estudian consecuti-
vamente dos características y
ver cómo la primera influye en
la segunda (y también cómo la
Es decir, {A1, A2, ..., Am} es una partición de E si se verifican las condiciones segunda influye en la primera).
siguientes:
1) Ai  Aj   para todo i, j, y  j
2) A1  … Am E
Sobre un mismo conjunto podemos tener diferentes particiones según dife-

rentes conceptos.
Algunas posibles particiones
1) Si consideramos el conjunto O de los ordenadores de nuestra empresa, podemos obte-

ner una partición según su procesador, de manera que, por ejemplo,
O{“ordenadores con PIII” }  {“ordenadores con PIV”}
(suponiendo que cada ordenador tiene sólo un procesador y que sólo tenemos dos tipos
de procesador: PIII y PIV).
También tenemos una partición según la RAM que tienen instalada, según la cual, por
ejemplo, O {“64 MB”}  {“128 MB”}  {“264 MB”} (siempre suponiendo que sólo tene-
mos estas posibilidades).
2) Si consideramos el conjunto E de los estudiantes de informática de Cataluña, podemos

obtener diferentes particiones:
a) Según el sexo: E {“hombres”}  {“mujeres”}
b) Según el número de hijos:
E {“no tienen ningún hijo”}  {“tienen 1 hijo”}  {“tienen 2 hijos”} 

 {“tienen 3 hijos”}  {“tienen 4 hijos”}  {“tienen más de 4 hijos”}
c) Según si les gustan los cebollinos:
E {“estudiantes a los que les gustan los cebollinos”}  {“estudiantes a los que no les gus-
tan los cebollinos”}
2. Teorema de las probabilidades totales
El teorema de las probabilidades totales afirma que si {A1, A2, ..., Am}
es una partición del espacio muestral  y B es cualquier suceso, tenemos
que:
P(B) P(B  A1) P(B  A2) P(B  A3) ... P(B  Am)
o lo que es lo mismo:
P(B) P(B|A1)·P(A1) P(B|A2)·P(A2) P(B|A3)·P(A3) ... P(B|Am)·P(Am)
Demostración del teorema de las probabilidades totales
La demostración del resultado del teorema de las probabilidades es puramente conjun-

tista. Es fácil ver que dado que {A1, A2, ..., Am} es una partición del espacio muestral,
tenemos que B (B  A1)  (B  A2)  …  (B  Am), y que dado que B  Ai y B  Aj
son siempre disyuntos (ya que Ai y Aj lo son), tenemos, por la probabilidad de la unión
de conjuntos disyuntos que P(B)P(B  A1) P(B  A2)  … P(B Am). Puesto que
P(B  Ai) P(B | Ai ) P(Ai), tenemos la segunda fórmula del teorema.
Gráficamente el teorema de las probabilidades totales se entiende muy fácil-

mente (supongamos que la partición consta de cuatro conjuntos): primero di-
bujamos el espacio muestral  y los conjuntos de la partición, conjuntos que
se reparten unos con otros todos los puntos del espacio muestral, sin que nin-
gún punto esté simultáneamente en dos de los conjuntos; ahora representa-
mos un suceso B arbitrario; este suceso se puede descomponer en la unión de
los resultados de B que están en cada uno de los Ai.
Representación gráfica
del teorema
Los elementos de B están re-

partidos entre los conjuntos
A1, A2, ..., Am: cada elemento
de B está en uno y sólo en uno
de los Ai. La región 1 es A1  B,
la 2, A2  B,...
Ejemplos de aplicación del teorema de las probabilidades totales
a) Supongamos que dentro del colectivo de estudiantes de la UOC los chicos fumadores
representan el 15% del total y que las chicas fumadoras representan el 12% del total.
¿Qué porcentaje de alumnos de la UOC fuma? En este ejemplo consideramos B ”fumar”
y la partición {A1, A2}, donde A1 = “hombre” y A2 = “mujer”. Por aplicación del teorema
de las probabilidades totales y dado que {“hombre”, “mujer”} es una partición del con-
junto de alumnos, tenemos que:
P(“fumar”) P(“fumar”  “hombre”) P(“fumar”  “mujer”) 0,15 0,12 0,27
b) En otra universidad el 54% de los estudiantes son hombres y el 46%, mujeres; por otra
parte, el 30% de los hombres son fumadores, mientras que de las mujeres el 25% son fu-
madoras. ¿Qué porcentaje de alumnos de esta universidad fuma? Observad que en este
caso disponemos de información sobre el porcentaje de fumadores dentro de cada sexo,
es decir, disponemos de las probabilidades condicionadas de fumar por cada sexo, P (“fu-
ma” | “hombre”) 0,3, P (“fuma” | “mujer”) 0,25. Por aplicación del teorema de las pro-
babilidades totales y puesto que {“hombre”, “mujer”} es una partición del conjunto de
alumnos, tenemos que:
P (“fumar”) P (“fumar” | “hombre”) · P (“hombre”) P (“fuma” | “mujer”) · P (“mu-

jer”) 0,30 · 0,54 0,25 · 0,46  0,277
3. Árboles de probabilidad y probabilidad condicionada

Orden de las particiones
Supongamos que ahora disponemos de dos particiones {A1, A2, ..., Am} y {B1,
Si disponemos de dos particio-
B2, ..., Bn} del espacio muestral; una manera muy útil de representar las parti- nes, consideraremos normal-
mente como primera partición
ciones y las probabilidades de la forma P(Ai | Bj) y P(Ai  Bj) para todos los po- aquella que contiene los suce-
sibles pares (Ai, Bj) consiste en dibujar el árbol de probabilidad de estas dos sos que se dan antes en el
tiempo, o bien aquellos que
particiones, árbol que presenta la forma siguiente: se pueden considerar causas
de los sucesos de la segunda
partición.
en el que, como se puede observar:
a) En cada nodo tenemos la probabilidad de estar situados en éste.
b) En cada rama tenemos la probabilidad de pasar por la rama, suponiendo

que estemos situados en el nodo en el que ésta comienza.
Además:
a) En cada nodo terminal tenemos la probabilidad de la intersección, que se

puede calcular como el producto de las probabilidades de las ramas que hay
que coger para llegar al nodo, ya que P(Ai  Bj) P(Ai) · P(Bj | Ai).
b) La suma de las probabilidades de las ramas que salen de un mismo nodo es

1 (esto se debe a que tanto las Ai como las Bj son particiones del espacio mues-
tral).
c) La suma de los valores de todos los nodos terminales ha de ser 1.
d) Por el teorema de las probabilidades totales tenemos que P(B) P(B 

A1) …  P(B  Am). Por tanto, la probabilidad de B es la suma de las pro-
babilidades de todos los nodos terminales a los que la rama que llega es B.
Ejemplo: Lanus frente a Doors98
Llevamos a cabo un estudio sobre el grado de satisfacción de los usuarios con el sistema
operativo con el que trabajan. En nuestra empresa sólo tenemos ordenadores con
Doors98 y Lanus y sólo se podía contestar “Muy satisfecho” y “Poco satisfecho”. El espa-
cio muestral son los usuarios que están distribuidos en dos particiones: {“Doors98”, “La-
nus”}, si consideramos el sistema operativo y {“Muy satisfecho”, “Poco satisfecho”}, si
consideramos su grado de satisfacción. Supongamos que de la encuesta se desprende que:
• P (“Doors98”) 0,7
• P (“Muy satisfecho” | “Doors98”) 0,1
• P (“Doors98”  “Poco satisfecho”) 0,63
• P (“Muy satisfecho”) 0,34
En este caso concreto conviene considerar como primera partición el sistema operativo,
ya que pensamos que puede ser la causa de la satisfacción o insatisfacción de los usuarios.
Con lo que tenemos el árbol siguiente con algunas incógnitas que hay que encontrar:
Ahora tenemos que:
• L 0,3, ya que L 0,7 1

• y P(“Doors98”  “Muy satisfecho”)  P(“Muy satisfecho” | “Doors98”) · P(“Doors 98”) 
0,1 · 0,7 0,07
• Dado que s e y son los nodos terminales tales que la rama que llega a ellos es “Muy satis-
fecho”, tenemos que s y P(“Muy satisfecho”) 0,34 y, por tanto, s 0,34 0,07 0,27.
• Puesto que z · L s, tenemos que z s/L 0,27/0,3 0,9.
• Ahora tenemos que u 0,1 (ya que u z 1) y que t L · u 0,3 · 0,1 0,03.
Finalmente, el árbol queda de la manera siguiente:
Así, podemos ver que el uso de “Lanus” causa el efecto de mucha satisfacción en el 90%
de los casos, mientras que, por ejemplo, el uso de “Doors98” sólo causa mucha satisfac-
ción en un 10% de los casos.
Árboles como los presentados en esta sección permiten considerar las rela-
ciones entre la primera partición y la segunda en términos de causas y efec-
tos: la primera partición (usar “Doors98” o “Lanus”) son las posibles causas
de los efectos recogidos en la segunda partición (“estar muy satisfecho” o
“estar poco satisfecho”).
4. Tablas de contingencia
Un mecanismo muy útil para describir y encontrar relaciones de depen-

dencia o independencia entre sucesos son las llamadas tablas de contin-
gencia.
Formalmente tenemos, como en los árboles de probabilidad, dos particiones

{A1, A2, ..., Am} y {B1, B2, ..., Bn} del espacio muestral y construimos una tabla
como ésta, tabla que contiene como filas los sucesos de una partición y como
columnas, los sucesos de la otra partición; en la intersección de cada fila y co-
lumna aparece la probabilidad de la intersección de los correspondientes su-

cesos:
A1 A2 ... Am Total
B1 P(B1  A1) P(B1  A2) ... P(B1  Am) P(B1)
B2 P(B2  A1) P(B2  A2) ... P(B2  Am) P(B2)
...
Bn P(Bn  A1) P(Bn  A2) ... P(Bn  Am) P(Bn)
Total P(A1) P(A2) ... P(Am) 1
En la última columna y en la última fila aparecen las llamadas probabilidades

Independencia
marginales, que son las probabilidades de cada suceso de las particiones invo- de dos sucesos
lucradas; se pueden calcular sumando las probabilidades de la fila o de la co- Para comprobar la indepen-
lumna correspondiente. dencia de dos sucesos, siempre
se tiene que exhibir un argu-
mento basado en el cálculo
Estas tablas permiten visualizar fácilmente la independencia de sucesos, ya de las probabilidades de A,
de B, de A  B, de A | B o
que, por ejemplo, A2 y B2 son independientes si P(A2  B2) P(A2) ·P(B2), es de B | A y en la relación entre
estas probabilidades.
decir, si el producto de los marginales correspondientes es, efectivamente, la
probabilidad de la intersección. Para calcular las probabilidades condiciona-
das, dividiremos la casilla correspondiente por el total de la fila (si condiciona-
mos por el valor de la fila) o por el total de la columna (si condicionamos sobre
el total de la columna).
Ejemplos de utilización de tablas de contingencia
a) Supongamos que a partir de los datos de los ordenadores de una empresa de la com-
petencia obtenemos la tabla de contingencia siguiente, que relaciona el procesador (A1,
A2) y la memoria RAM de las máquinas:
64 MB 128 MB Total
A1 10/50 20/50 30/50
A2 10/50 10/50 20/50
Total 20/50 30/50 1
A partir de la tabla podemos concluir lo siguiente:
• Los sucesos “A1” y “64 MB” de RAM no son independientes, ya que (30/50) · (20/50) 
10/50
• La probabilidad de tener 128 MB de RAM sabiendo que tiene un “A2” es P(“128 MB” 
“A2”) / / P(“A2”) (10/50) / (20/50)
• La probabilidad de tener 64 MB de RAM sabiendo que tiene un “A1” es P(“64 MB” 
“A1”) / / P(“A1”)  (10/50) / (30/50)
b) En el ejemplo Lanus frente a Doors98 podemos obtener la tabla de contingencia si-

guiente:
Muy satisfecho Poco satisfecho Total
Doors98 0,07 0,63 0,7
Lanus 0,27 0,03 0,3
Total 0,34 0,66 1

En la que vemos claramente que ser usuario de Lanus y estar muy satisfecho no son in-
dependientes, ya que (0,3 · 0,34  0,27). Cosa razonable, ya que, como hemos demostra-
do antes, usar Lanus aumenta el nivel de satisfacción del usuario.
5. El teorema de Bayes
A continuación consideraremos la misma situación de la que parte el teorema

de las probabilidades totales, es decir, que disponemos de un suceso B y de una
partición {A1, A2, ..., Am}; de esta manera, podemos calcular la probabilidad de
B como:
P(B) P(B | A1) · P(A1) P(B | A2) · P(A2) ... P(B | Am) · P(Am).
Es decir, sabiendo las probabilidades de B condicionado a cada uno de los Ai y

las probabilidades de los Ai, podemos obtener la probabilidad de B. Si queremos
interpretar este resultado en términos de causa-efecto, tenemos que el suceso B
se puede producir como efecto de m posibles causas (A1, ..., Am) y que para cal-
cular la probabilidad de B, debemos hacer la suma de los productos de la proba-
bilidad que se dé en cada una de las causas por la probabilidad que, dada la
causa, ocurra efectivamente B.
Ahora “giraremos” la situación e intentaremos calcular la probabilidad de

cada causa, sabiendo que se ha producido el efecto B. Esto nos puede parecer
un tanto complicado, pero resulta que calcular las probabilidades de cada uno
de los Ai (causas) condicionados a B (efecto) es bastante fácil, manipulando de
forma adecuada las probabilidades.
El teorema de Bayes establece que si {A1, A2, ..., Am} es una partición de  y son
conocidas las probabilidades de B condicionado a cada uno de los Ai y la proba-
bilidad de cada uno de los Ai , podemos calcular la P(Ai | B) de la manera siguiente:
P  Ai  B 
P  A i B  = ------------------------
- =
PB
P  B A i P  A i 
= -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-
P  B A 1 P  A 1  + P  B A 2 P  A 2  + P  B A 3 P  A 3  +  + P  B A m P  A m 
Demostración del teorema de Bayes
Este teorema es muy fácil de demostrar dando los pasos siguientes:
1) Primero, la definición de probabilidad condicionada según la cual:

P  Ai  B  P B  Ai  P  B A i P  A i 
P  A i B  = ------------------------
- = ------------------------
- = ----------------------------------
-
PB PB PB
2) Después, sólo hay que aplicar el teorema de las probabilidades totales y sustituir P(B)
por P(B | A1) · P(A1) P(B | A2) · P(A2) ... P(B | Am) · P(Am).
Aplicación del teorema de Bayes a un caso particular
En el caso de Lanus frente a Doors98, tenemos las probabilidades de cada nivel de satis-
facción condicionadas por el sistema operativo que se utiliza. Es decir, conocemos las
probabilidades de los supuestos efectos (“satisfecho” o “no satisfecho”) condicionados a
las supuestas causas (usar un sistema u otro).
Ahora podemos preguntarnos las probabilidades de utilizar cierto sistema a partir del gra-
do de satisfacción del usuario; es decir, nos preguntamos las probabilidades de cada causa
(uso de un sistema u otro) condicionadas por los efectos sobre los usuarios (grado de sa-
tisfacción). En este caso tendremos que utilizar el teorema de Bayes. Supongamos que nos
piden P(“Doors98” | “está muy satisfecho”); para calcularla, tendremos que efectuar las
operaciones siguientes (en las que abreviamos “Doors98” por D98, “Lanus” por L y “Muy
satisfecho” por S:
P  S D98   P  D98  0,1  0,7

P  D98 S  = -------------------------------------------------------------------------------------------- = ------------------------------------------------- = 0,2058
P  S D98   P  D98  + P  S L   P  L  0,1  0,7 + 0,9  0,3
Y, por tanto, dentro del grupo de los usuarios satisfechos, la probabilidad de usar Doors98
es de 0,2058.
En este caso particular el teorema de Bayes permite invertir las relaciones causa-efecto,
ya que es como si pudiésemos ir atrás en el tiempo y, partiendo del grado de satisfacción
sobre el sistema informático, remontarnos a la probabilidad de la causa de esta satisfac-
ción. En el ejemplo anterior, si escogemos a un usuario al azar y resulta estar satisfecho,
tenemos una probabilidad de 0,2058 de que sea usuario de D98, mientras que tenemos
una probabilidad de (1 0,2058)  0,7942 de que sea usuario de “Lanus”. Como podéis
ver, ¡usar “Lanus” es una causa mucho más probable de satisfacción que usar D98!
6. El teorema de Bayes sobre un árbol de probabilidades
Si estamos trabajando con un árbol de probabilidades concreto, el teorema de Ba-

yes tiene una formulación equivalente muy intuitiva; lo veremos con un
ejemplo. Según la época del curso en el que estudiéis este material, es posible que
estéis preparando el puente del 6 al 8 de diciembre. En este caso quizá os inte-
resarían estos datos (ficticios) sobre cómo se lo pasa la gente en este puente:
a) El 70% de los catalanes tiene puente (o se lo coge).

b) De los catalanes que cogen puente, el 70% declara habérselo pasado bien.
c) De los catalanes que no cogen puente, el 40% declara habérselo pasado bien.
d) Sólo admitimos dos posibilidades: pasárselo bien o no.
El correspondiente árbol de probabilidades es el siguiente:

En este caso la primera partición es la que contiene los acontecimientos que

ocurren temporalmente en primer lugar: primero se hace (o no se hace) puen-
te y después se responde a la pregunta de si se lo han pasado bien. De alguna ma-
nera, ¡también estamos presuponiendo que la causa de pasárselo bien es haber
hecho el puente!
Ahora nos preguntamos la probabilidad de que una persona haya tenido puente
sabiendo que ha afirmado habérselo pasado bien (P(A1 | B1)). Si nos fijamos en
el árbol, observamos que el 61% (0,49 0,12 0,61) dice que se lo ha pasado
bien, pero sólo el 49% (0,49) ha tenido puente; por tanto, forzosamente tendre-
mos que la probabilidad de haber disfrutado del puente sabiendo que se lo han
pasado bien es de 80,32% (0,49 / 0,61 0,8032). Así pues, podemos pensar que
en el 80,32% de los casos pasárselo bien es a causa del puente.
Es decir, la probabilidad P (“tiene puente | se lo ha pasado bien”) = P (A1 | B1)

se calcula dividiendo la probabilidad del nodo “se lo pasan bien y han tenido
puente” por la suma de las probabilidades correspondientes a “pasárselo bien”,
es decir:
P  tiene puente se lo pasa bien  =
Probabilidad del nodo tienen puente y se lo pasan bien- =

------------------------------------------------------------------------------------------------------------------------------------------------------------------
Suma de las probabilidades de los nodos correspondientes
a pasárselo bien
0,49 -
= ------------------------------
0,49 + 0,12
Y, en general, en un árbol de probabilidades en el que aparecen las probabili-

dades P(B | Ai), la P(Ai | B) se calcula como:
Probabilidad del nodo correspondiente a A i  B

P A i B  = ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------
-
Suma de las probabilidades de los nodos correspondientes a B
Cálculo de probabilidades por el teorema de Bayes

Los puentes y las causas
En el ejemplo del puente del 6 al 8 de diciembre, ¿cuáles son las probabilidades...
En términos de causas y efec-
a) de tener puente sabiendo que no se lo han pasado bien? tos, podemos entender tener
b) de no tener puente sabiendo que no se lo han pasado bien? puente o no tenerlo como cau-
sa de los efectos pasárselo bien
c) de no tener puente sabiendo que se lo han pasado bien?
o no. El teorema de Bayes
d) de que los sucesos “tener puente” y “pasárselo bien” sean independientes? permite encontrar las probabi-
lidades de que los efectos
a) provengan de alguna de las
posibles causas. Por ejemplo,
P  tiene puente no se lo pasa bien  = P(“tener puente” | “se lo ha
pasado bien”) nos indica hasta
P  puente  no se lo pasa bien - = -----------------------------
= ------------------------------------------------------------------------------------------------ 0,21 - = 0,5384 qué punto tener puente se
P  no se lo pasa bien  0,21 + 0,18 puede considerar como causa
de pasárselo bien, ya que nos
Es decir, la probabilidad de que una persona haya tenido puente sabiendo que no se lo dice cuál es el porcentaje de
quienes se lo han pasado bien
ha pasado bien es de 0,53; dicho de otro modo, el 53% de los que no se lo han pasado que han tenido puente.
bien ha tenido puente (quizá estaban en una retención de tráfico).
b)
P  no tiene puente no se lo pasa bien  =

P  no tiene puente  no se lo pasa bien- = -----------------------------
= ------------------------------------------------------------------------------------------------------------------------- 0,18 - = 0,4615
P  no se lo pasa bien  0,21 + 0,18
c) P(“no tiene puente” | “se lo ha pasado bien”) 0,12 / (0,49 0,12) 0,1967.
d) Los sucesos no son independientes, ya que:
P(“tiene puente” | “se lo ha pasado bien”) 80,32%
que es mayor que la probabilidad de tener puente (70%); es decir, el hecho de pasárselo
bien (efecto) hace que aumente la probabilidad de haber tenido puente (causa).
Acabaremos esta sesión con un fragmento de un libro de John Allen Paulos que
esperamos que os ayude a entender mejor los cálculos y la interpretación que se
pueden hacer del teorema de Bayes. Es recomendable que reescribáis el ejemplo
en forma de árbol y que comprobéis los cálculos:
“Una elaboración interesante a partir del concepto de probabilidad condicional es el co-

nocido teorema de Bayes, que fue demostrado por primera vez por Thomas Bayes en el
siglo XVIII, y constituye la base del siguiente resultado, un tanto sorprendente, con impor-
tantes consecuencias para los análisis de SIDA o la detección del consumo de drogas.
Supongamos que haya un análisis para detectar el cáncer con una fiabilidad del 98%; es
decir, si uno tiene cáncer el análisis dará positivo el 98% de las veces, y si no lo tiene, dará
negativo el 98% de las veces. Supongamos además que el 0,5% de la población –una de
cada doscientas personas– padece verdaderamente cáncer.
Imaginemos que uno se ha sometido al análisis y que su médico le informa en tono pesi-
mista que ha dado positivo. ¿Hasta qué punto ha de deprimirse esa persona? Lo sorprenden-
te del caso es que dicho paciente ha de mantenerse prudentemente optimista. El porqué de
este optimismo lo encontramos al determinar la probabilidad condicional de que uno tenga
cáncer sabiendo que el análisis ha dado positivo.
Supongamos que se hacen 10.000 pruebas de cáncer. ¿Cuántas de ellas darán positivo?
En promedio 9,50 de estas 10.000 personas (el 0,5% de 10.000) tendrán cáncer, y como
el 98% de ellos darán positivo, tendremos 49 análisis positivos. Por otra parte, el 2% de
las 9.950 personas restantes, que no padecen cáncer, también darán positivo, con un to-
tal de 199 análisis positivos (0,02 · 9.950 199). Así, del total de 248 positivos (199 49 
248), la mayoría son falsos positivos, y la probabilidad condicional de padecer el cáncer
sabiendo que se ha dado positivo es sólo 49/248, ¡aproximadamente un 20%! (Hay que
comparar este porcentaje relativamente bajo con la probabilidad de dar positivo en el su-
puesto de que se tenga efectivamente el cáncer que, por hipótesis, es del 98%)”.
John Allen Paulos (1990). El hombre anumérico. Tusquets Editores (Metatemas, 20).
7. Resumen
En esta sesión se introducen dos resultados importantísimos para entender la

probabilidad y cómo podemos aplicarla a multitud de situaciones: el teorema
de las probabilidades totales y el teorema de Bayes. Para enunciar estos resul-
tados, es necesario trabajar con particiones; para facilitar el seguimiento de la
teoría y la visualización de los resultados, se introducen los árboles de proba-
bilidad y las tablas de contingencia.
Los resultados de esta sesión son muy técnicos y resumir su contenido infor-
malmente resulta muy difícil; de todos modos, podemos decir que el teorema
de las probabilidades totales permite calcular la probabilidad de un suceso sa-

biendo la probabilidad del suceso en todas las posibles circunstancias en las
que se puede dar. El teorema de Bayes permite calcular ciertas probabilidades
condicionadas, probabilidades esenciales para entender muchos resultados;
este teorema admite una presentación muy sencilla a partir de ciertos árboles
de probabilidad.
Ejercicios
1. Un amigo ha llevado a cabo un estudio sobre la satisfacción de los usuarios

de diferentes entornos informáticos y ha resumido la información obtenida
en forma de tabla de contingencia. La transmisión de la tabla por fax no ha
sido demasiado buena y nos ha llegado con algunos “agujeros”, que han sido
sustituidos por letras mayúsculas:
Grado de satisfacción
Nada Poco Bastante Mucho Total
Linux 0,05 0,15 A B 0,7
Windows 0,15 0,05 C D 0,3
Total 0,2 0,2 0,3 0,3 1
a) ¿Cuál es la probabilidad de que un usuario de Linux esté poco satisfecho

con el entorno?
b) ¿Cuál es la probabilidad de que una persona sea usuaria de Linux y respon-
da que no está nada satisfecha?
c) Los sucesos “ser usuario de Windows” y “estar nada satisfecho”, ¿son inde-
pendientes?
d) Calculad el valor de A, si mi amigo me confirma telefónicamente que los su-
cesos “ser usuario de Linux” y “estar bastante satisfecho” son independientes.
e) Con el valor de A calculado antes, encontrad los valores de B, C y D y re-
construid la tabla de contingencia original.
2. Dado el árbol de probabilidades siguiente:

en el que si los sucesos son M “Usa Macrohard Phrase” y P “Se cuelga el

ordenador”, sabemos lo siguiente:
• P(M) 0,8
• P(PC | M) 0,1
• P(P) 0,74
Se pide:
a) Acabad de rellenar el árbol de probabilidades (valores de x2, x3, x4, x5, x6,
x7 y a, b, c, d, e, f).
b) ¿Los sucesos M y P son independientes?
c) ¿Cuánto vale P(MC  P)?
3. Se instala un programa antivirus en un ordenador. La probabilidad de que el

ordenador tenga un virus detectable por el antivirus es de 0,2. Si el ordenador tie-
ne el virus, la probabilidad de que el antivirus lo detecte es de 0,9. Si el ordenador
no tiene el virus, la probabilidad de que el antivirus dé un mensaje de existencia
de virus es de 0,02.
a) Demostrad que la probabilidad de que el antivirus detecte un virus (puede

existir o no) es 0,196.
b) Calculad la probabilidad de que el ordenador no tenga virus y haya apare-
cido un mensaje de existencia de virus.
c) Calculad la probabilidad de que, si ha aparecido un mensaje de existencia
de virus, el ordenador no lo tenga realmente.
d) Calculad la probabilidad de que el ordenador tenga el virus y el antivirus
no lo detecte.
e) Calculad la probabilidad de que aunque no haya salido ningún mensaje de
existencia de virus, el ordenador lo tenga.
Solucionario
1.
a) P(‘‘poco satisfecho con el entorno” | “usuario de Linux’’) 
P(‘‘poco satisfecho’’  ‘‘usuario de Linux’’) / P(‘‘usuario de Linux’’) 
0,15/0,7 0,2143
b) P(‘‘nada satisfecho’’  ‘‘usuario de Linux’’) 0,05
c) P(‘‘nada satisfecho’’  ‘‘usuario de Windows’’) 0,15 

 P(‘‘nada satisfecho’’) · P(‘‘usuario de Windows’’)  0,2 · 0,3
Por tanto, no son independientes.
d) Si son independientes, se deberá cumplir:
A P(‘‘bastante satisfecho’’  ‘‘usuario de Linux’’) 

P(‘‘bastante satisfecho’’) · P(‘‘usuario de Linux’’) 0,7 · 0,3 0,21
B 0,7 (0,05 0,15 0,21) 0,29

C 0,3 0,21 0,09; D 0,3 0,29 0,01
2.
a) Observemos los cálculos siguientes:
– a P(M) 0,8
– b P(MC) 1 P(M) 1 0,8 0,2
– x2 a P(M) 0,8
– x3 b P(MC) 1 P(M) 1 0,8 0,2
– c P(P | M) P(P  M) / P(M) P(M  P) / P(M) 0,72/0,8 0,9
– d P(PC | M) 0,1
– x4 P(M  P) 0,72
– x5P(M  PC) P(PC | M) · P(M) 0,1 · 0,80,08;
– P(P) 0,74 P(P) P(P  M) P(P  MC) P(M  P) P(MC  P) 
0,72 P(MC  P) y, por tanto, P(MC  P) 0,74 0,72 0,02
(o lo que es lo mismo, x4 x6 0,74 y x4 0,72 implica x6 0,02)
– x6 P(MC  P) 0,02
– e P(P | MC) P(MC  P) / P(MC) 0,02/0,2 0,1
– f 0,9 (ja que e f 1)
– x7 P(MC  PC) 0,18 (también se puede hacer viendo que x6 x7 0,2)
y el árbol completo queda de la manera siguiente:
b) Dado que P(P | M) 0,9 y P(P) 0,74, está claro que P(P | M) 0,9  P(P) y,
por tanto, P y M no son independientes. También se puede hacer comprobando
que P(M  P)   P(M) · P(P).
c) P(MC  P) es la probabilidad de que “no use Macrohard Phrase” y “se “cuel-

gue” el ordenador”. Esta probabilidad corresponde a x6 P(MC  P) 0,02.
3. Podemos considerar que este árbol en el que “hay virus” significa “hay virus
detectable”).
Decimos V “el ordenador tiene virus detectable por el antivirus’’ y D “el

antivirus detecta un virus’’. Entonces, sabemos por el enunciado P(V) 0,2;
P(“detecte el virus si hay virus”) P(D | V) 0,9 y P(“detecte el virus si no hay
virus”) P(D | VC) 0,02. Inmediatamente, también sabemos que P(DC | V) 
1 0,9 0,1. Con esto podemos completar el árbol de la manera siguiente:
Ahora podemos contestar a las preguntas siguientes:
a) Por el teorema de las probabilidades totales:
P(“el antivirus detecta un virus”) 

P(“detecta y hay virus”  “detecta y no hay virus”) 
P(D) P(D  V) P(D  VC) 
P(D | V) P(V) P(D | VC) P(VC) (0,9 · 0,2) (0,02 · 0,8) 
0,18 0,016 0,196
(es la suma de las probabilidades de los nodos a los que llega una rama del tipo
sí lo detecta).
b)
P(“el ordenador no tiene virus”  “el antivirus detecta un virus”) 

P(VC  D) P(D | VC) · P(VC) 0,02 · 0,8 0,016
Es decir, con una probabilidad del 0,016 el ordenador no tiene virus, pero el
antivirus da mensaje de existencia de virus.
c) Por el teorema de Bayes y el apartado a, tenemos que:
P(VC | D) P(VC  D) / P(D) 0,016/0,196  8,1633 · 102 8,16%
Es decir, el 8,16% de los casos en los que aparece un mensaje de existencia de

virus, el antivirus se equivoca, ya que no hay virus.
d) P(DC  V) P(DC | V) · P(V) 0,1 · 0,2 0,02 2%
Este caso sí es preocupante: ¡en el 2% de los casos el ordenador tiene virus y el

antivirus no lo encuentra!
e) P(V | DC) P(V  DC) / P(DC) 0,02 / (1 0,196)  2,4876 · 102 2,48%
Este caso también es preocupante: ¡el 2,48% de las veces que el antivirus no da
ningún mnsaje de virus, efectivamente tenemos uno!

Módulo 2 Estadística

Cargado por

Copyright:

Formatos disponibles

Módulo 2 Estadística

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Módulo 2 Estadística

Cargado por

Copyright:

Formatos disponibles

Probabilidad

Àngel J. Gil Estallo

Àngel J. Gil Estallo

Doctor en Ciencias Matemáticas por

La revisión de este recurso de aprendizaje UOC ha sido coordinada

Cuarta edición: septiembre 2019

Comencemos por introducir algunos ejemplos y preguntas que nos puedan

Lanzar un dado y observar cuál es el número de puntos que aparece en la cara

Espacio muestral es el conjunto de resultados posibles que podemos

A partir de este momento, y si no se dice lo contrario, consideraremos que el

En el caso del dado, el espacio

Denotaremos los acontecimientos por letras mayúsculas A, B…

Podemos preguntarnos ahora cuáles son los acontecimientos más simples de

Identificaremos los resultados del experimento aleatorio con los acon-

En general, los acontecimientos contendrán más de un resultado, y muchas

Así pues, después de realizar un experimento aleatorio, tenemos acontecimien-

a) Acontecimientos elementales: son estrictamente los que podemos obtener

b) Acontecimientos: son agrupaciones de uno o más resultados. A menudo

Los dados no saben si los nú-

• B “el número de puntos es par”, que corresponde a la agrupación de los resultados

• D {1, 6}. D es un suceso formado por los resultados 1 y 6.

• F {3}. F es el suceso que corresponde a “sacar un 3”.

b) “Sacar un número mayor que 5” es un acontecimiento elemental o resultado, ya que

Los resultados favorables a un suceso son los resultados que contiene.

A continuación definiremos dos sucesos muy especiales: el suceso seguro y el

2.1. El suceso seguro

Lanzamos un dado y conside-

2.2. El suceso imposible

A continuación describiremos varias operaciones conjuntivas aplicadas a los

3.1. Intersección de sucesos y sucesos incompatibles

Supongamos que tenemos dos sucesos A y B:

El suceso A  B (leído A intersección B) está formado por aquellos resul-

Es decir, la intersección de los sucesos A y B es un suceso menor que A y que

No existe una fórmula que nos

3.1.1. Sucesos incompatibles

3.2. Unión de sucesos

Supongamos que tenemos dos sucesos A y B. El suceso A  B (leído A

Card(A  B) Card(A) Card(B) Card(A  B)

Ejemplo de unión de sucesos

Si el suceso A es “sacar un número par” y el suceso B es “sacar un número mayor

3.3. Complementario de un suceso

Supongamos que estudiamos un suceso A.

Es decir, el complementario del suceso A es el suceso que únicamente contiene

Ejemplo de suceso complementario

Evidentemente, el número de elementos de AC es el número de posibles resul-

A y Ac siempre son sucesos

En dicha tabla, como podéis observar, para tener...

• “Sí” a la pregunta “¿Es de A  B?”, debéis tener como mínimo un “Sí” (o

• “Sí” a la pregunta “¿Es de A  B?”, debemos tener un “Sí” a “¿Es de A?” y

• “Sí” a la pregunta “¿Es de AC?”, debemos tener un “No” a “¿Es de A?”.

Podemos visualizar el contenido de la tabla mediante un gráfico, en el que po-

A es “sacar un número par”

En esta sesión hemos introducido el concepto de experimento aleatorio, a par-

Después se recuerdan las operaciones de unión, intersección y complementario

1. Supongamos que hemos examinado el sistema operativo y el procesador de

Ordenador Sistema operativo Procesador

Consideremos los sucesos A y B, que son:

• A “el sistema operativo es Doors98”

a) Interpretad la situación en términos de experimentos aleatorios y determi-