Introducción A La Teoría de Decisión
Introducción A La Teoría de Decisión
Introducción A La Teoría de Decisión
La teoría de decisiones trata de las decisiones contra la naturaleza. Esta frase se refiere a
una situación en la que el resultado (rendimiento) de una decisión, depende de la acción de
otro jugador (naturaleza).
En los problemas de la teoría de decisiones, la pieza fundamental de los datos es una tabla
de retribuciones como la siguiente. En ella se hace una lista de alternativas de decisión a un
lado de la tabla y otra de los estados posibles de la naturaleza, en la partes superior. Los
datos del cuerpo de la tabla son las utilidades de todas las combinaciones posibles de
decisiones y estados de la naturaleza (entorno). El proceso de decisión se realiza de la
siguiente manera:
1. Usted, encargado de tomar decisiones, elige una de las alternativas
𝑑1 , 𝑑2 , 𝑑3 , … , 𝑑𝑛 . Suponga que elige 𝑑1 .
2. Después de que toma su decisión, ocurre un estado de la naturaleza. Suponga que
ocurre el estado 2.
3. Se puede determinar ahora el rendimiento que usted recibe, mediante la tabla de
retribuciones. Dado que usted ha tomado la decisión 1 y ocurrió el estado de la
naturaleza 2, el rendimiento es 𝑟12.
Tabla de retribuciones
ESTADO DE LA NATURALEZA
DECISION 1 2 3 𝑚
𝑑1 𝑟11 𝑟12 𝑟13 ⋯ 𝑟1𝑚
𝑑2 𝑟21 𝑟22 𝑟23 ⋯ 𝑟2𝑚
𝑑3 𝑟31 𝑟32 𝑟33 ⋯ 𝑟3𝑚
⋮ ⋮ ⋮ ⋮ ⋮ ⋮
𝑑𝑛 𝑟𝑛1 𝑟𝑛2 𝑟𝑛3 ⋯ 𝑟𝑛𝑚
La pregunta en términos generales es: “¿Cuál de las decisiones debe usted elegir?”. A usted
le gustaría un rendimiento tan bueno como fuese posible, es decir, el mayor valor posible
de
𝑟𝑖𝑗 . Es evidente que la decisión que elijamos dependerá de nuestra creencia relativa a lo
que hará la naturaleza, es decir, de cuál estado de la naturaleza ocurrirá. Si creemos que se
presentará el estado 2, elegiremos la decisión asociada con el número más grande de la
columna 2, y así para otro caso.
DECISIONES BAJO CERTEZA.
Una decisión bajo certeza es aquella en la que se sabe cuál estado de la naturaleza ocurrirá.
O de otro modo, se puede pensar en un caso en el que hay un solo estado natural.
DECISIÓN LLUVIA
Llevar paraguas 0 dólares
No llevar paraguas -8 dólares
Desde el punto de vista conceptual es fácil resolver un problema que sólo tiene un estado
natural. Basta con elegir la decisión que produce el máximo rendimiento. Para los
problemas de programación lineal tomar esta decisión implicar aplicar algoritmos
especiales (método simplex) que en situaciones especiales son bastante complejos.
En este tipo de problemas, el administrador debe entonces tomar la decisión que maximice
el rendimiento esperado, el máximo de los 𝑈𝐸𝑖 .
ESTADO DE LA NATURALEZA
DECISION 1 2 3 𝑚 Rendimiento esperado
𝑑1 𝑟11 𝑟12 𝑟13 ⋯ 𝑟1𝑚 𝑼𝑬𝟏 = 𝒓𝟏𝟏 ∗ 𝒑𝟏 + ⋯ + 𝒓𝟏𝒎 ∗ 𝒑𝒎
𝑑2 𝑟21 𝑟22 𝑟23 ⋯ 𝑟2𝑚 𝑼𝑬𝟐 = 𝒓𝟐𝟏 ∗ 𝒑𝟏 + ⋯ + 𝒓𝟐𝒎 ∗ 𝒑𝒎
𝑑3 𝑟31 𝑟32 𝑟33 ⋯ 𝑟3𝑚 𝑼𝑬𝟑 = 𝒓𝟑𝟏 ∗ 𝒑𝟏 + ⋯ + 𝒓𝟑𝒎 ∗ 𝒑𝒎
⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋯
𝑑𝑛 𝑟𝑛1 𝑟𝑛2 𝑟𝑛3 ⋯ 𝑟𝑛𝑚 𝑼𝑬𝒏 = 𝒓𝒏𝟏 ∗ 𝒑𝟏 + ⋯ + 𝒓𝒏𝒎 ∗ 𝒑𝒎
Probabilidad 𝒑𝟏 𝒑𝟐 𝒑𝟑 ⋯ 𝒑𝒎
Ejemplo.
Suponga el caso de un vendedor de periódicos, la cantidad de periódicos que solicitará
depende de la demanda, la cual no se conoce con certeza. El vocero compra los periódicos
a 1000 pesos cada uno y los vende a 2500 pesos. Por experiencia conoce que la probabilidad
de vender 0, 10, 20, 30 periódicos y vienen dadas por:
1
𝒑𝟏 = 𝑝𝑟𝑜𝑏(𝑑𝑒𝑚𝑎𝑛𝑑𝑎 = 0) =
10
3
𝒑𝟐 = 𝑝𝑟𝑜𝑏(𝑑𝑒𝑚𝑎𝑛𝑑𝑎 = 10) =
10
4
𝒑𝟑 = 𝑝𝑟𝑜𝑏(𝑑𝑒𝑚𝑎𝑛𝑑𝑎 = 20) =
10
2
𝒑𝟒 = 𝑝𝑟𝑜𝑏(𝑑𝑒𝑚𝑎𝑛𝑑𝑎 = 30) =
10
Cuántos periódicos: 0, 10, 20 o 30 debe comprar para que su rendimiento sea máximo?.
Solución.
En este problema, cada uno de los cuatro valores diferentes de la demanda es un estado de
la naturaleza distinto, y la decisión es el número de periódicos por comprar. Los
rendimientos o retribuciones se calculan así:
𝑟𝑒𝑛𝑑𝑖𝑚𝑖𝑒𝑛𝑡𝑜 = 2500(# 𝑑𝑒 𝑝𝑒𝑟𝑖ó𝑑𝑖𝑐𝑜𝑠 𝑣𝑒𝑛𝑑𝑖𝑑𝑜𝑠) − 1000(# 𝑑𝑒 𝑝𝑒𝑟𝑖ó𝑑𝑖𝑐𝑜𝑠 𝑐𝑜𝑚𝑝𝑟𝑎𝑑𝑜𝑠)
Tabla de retribuciones
ESTADO DE LA NATURALEZA
DECISION 0 10 20 30
0 0 0 0 0
10 -10000 15000 15000 15000
20 -20000 5000 30000 30000
30 -30000 -5000 20000 45000
Para 𝑑1 = 0 y 𝑑𝑒𝑚𝑎𝑛𝑑𝑎 0, 10, 20, 30, todos los rendimientos serán de cero
ESTADO DE LA NATURALEZA
DECISION 0 10 20 30
0 0 0 0 0
10 -10000 15000 15000 15000
20 -20000 5000 30000 30000
30 -30000 -5000 20000 45000
probabilidad 0,1 0,3 0,4 0,2
Para 𝑑2 = 10, tenemos 𝑈𝐸2 = −10000 ∗ 0,1 + 15000 ∗ 0,3 + 15000 ∗ 0,4 + 15000 ∗ 0,2 = 12500
Para 𝑑3 = 20, tenemos 𝑈𝐸3 = −20000 ∗ 0,1 + 5000 ∗ 0,3 + 30000 ∗ 0,4 + 30000 ∗ 0,2 = 17500
Para 𝑑4 = 30, tenemos 𝑈𝐸4 = −30000 ∗ 0,1 − 5000 ∗ 0,3 + 20000 ∗ 0,4 + 45000 ∗ 0,2 = 12500
Puesto que 𝑈𝐸3 es el mayor de los cuatro valores, la decisión óptima consiste en ordenar
20 periódicos.
Tabla de retribuciones
ESTADO DE LA NATURALEZA
DECISION 0 10 20 30
0 0 0 0 0
10 -10000 15000 15000 15000
20 -20000 5000 30000 30000
30 -30000 -5000 20000 45000
Cálculo de los rendimientos esperados:
ESTADO DE LA NATURALEZA
DECISION 0 10 20 30
0 0 0 0 0
10 -10000 15000 15000 15000
20 -20000 5000 30000 30000
30 -30000 -5000 20000 45000
probabilidad 0,25 0,25 0,25 0,25
Para 𝑑2 = 10, tenemos 𝑈𝐸2 = −10000 ∗ 0,25 + 15000 ∗ 0,25 + 15000 ∗ 0,25 + 15000 ∗ 0,25 = 8750
Para 𝑑3 = 20, tenemos 𝑈𝐸3 = −20000 ∗ 0,25 + 5000 ∗ 0,25 + 30000 ∗ 0,25 + 30000 ∗ 0,25 = 11250
Para 𝑑4 = 30, tenemos 𝑈𝐸4 = −30000 ∗ 0,25 − 5000 ∗ 0,25 + 20000 ∗ 0,25 + 45000 ∗ 0,25 = 7500
Puesto que 𝑈𝐸3 es el mayor de los cuatro valores, la decisión óptima consiste en ordenar
20 periódicos.
Ejemplo
En el ejemplo del vendedor de periódicos calculemos los rendimientos mínimos de cada
decisión así:
Puesto que máximo valor de los rendimientos mínimos es 0, la decisión óptima consiste en
ordenar 0 periódicos.
𝐶𝑟𝑖𝑡𝑒𝑟𝑖𝑜 𝑚𝑎𝑥𝑖𝑚𝑎𝑥
Este criterio es tan optimista como el maximin es pesimista. Evalúa cada decisión conforme
a lo mejor que puede suceder si se le toma. En este caso evalúa cada decisión por el máximo
rendimiento posible asociado con ella. Se selecciona la decisión que produce el máximo de
estos rendimientos máximos (de ahí lo de 𝑚𝑎𝑥𝑖𝑚𝑎𝑥).
Ejemplo
En el ejemplo del vendedor de periódicos calculemos los rendimientos máximos de cada
decisión así:
Puesto que máximo valor de los rendimientos máximos 45000, la decisión óptima consiste
en ordenar 30 periódicos.
𝐶𝑟𝑖𝑡𝑒𝑟𝑖𝑜 𝑃𝑒𝑟𝑗𝑢𝑖𝑐𝑖𝑜 (𝑜 𝑝é𝑟𝑑𝑖𝑑𝑎) 𝑚𝑖𝑛𝑖𝑚𝑎𝑥
Se introduce un nuevo concepto para medir lo deseable de un resultado, es decir, construir
una tabla de perjuicios (o pérdidas) a partir de la tabla de rendimientos o retribuciones:
Ejemplo
En el ejemplo del vendedor de periódicos la tabla de rendimientos o retribuciones es:
ESTADO DE LA NATURALEZA
DECISION 0 10 20 30
0 0 0 0 0
10 -10000 15000 15000 15000
20 -20000 5000 30000 30000
30 -30000 -5000 20000 45000
ESTADO DE LA NATURALEZA
DECISION 0 10 20 30
0 0 0 0 0
10 -10000 15000 15000 15000
20 -20000 5000 30000 30000
30 -30000 -5000 20000 45000
Rendimientos máximos 0 15000 30000 45000
ESTADO DE LA NATURALEZA
DECISION 0 10 20 30
0 0-0 15000-(0) 30000-0 45000-0
10 0-(-10000) 15000-15000 30000-15000 45000-15000
20 0-(-20000) 15000-5000 30000-30000 45000-30000
30 0-(-30000) 15000-(-5000) 30000-20000 45000-45000
Rendimientos máximos 0 15000 30000 45000
ESTADO DE LA NATURALEZA
DECISION 0 10 20 30
0 0 15000 30000 45000
10 10000 0 15000 30000
20 20000 10000 0 15000
30 30000 20000 10000 0
En esta tabla se puede observar en el segundo renglón que la máxima pena de 30000 pesos
ocurre si hay una demanda de 30 periódicos. Entonces se asocia el valor 30000 a la decisión
de “ordenar 10 periódicos. En otras palabras, el valor máximo de cada renglón se asocia con
la decisión de ese renglón.