Inferencia Plausible
Inferencia Plausible
Inferencia Plausible
COMN Y LA PROBABILIDAD
SIXTO ROS GARCA Y DAVID ROS INSUA
Real Academia de Ciencias
Estrictamente hablando, todo nuestro
conocimiento, aparte de las matemticas
y la lgica demostrativa, consiste en con-
jeturas.
(Polya, 1954)
INTRODUCCIN
En su introduccin a esta serie de lecturas que la Real
Academia ha dedicado al Ao Mundial de las Matemti-
cas, el profesor Etayo, al comparar la imagen de nuestra
disciplina con otras actividades del pensamiento, men-
ciona cmo el gran pblico asocia las matemticas con el
pensamiento ms hermtico. Nuestro objetivo aqu es des-
granar algunas ideas sobre tal pensamiento, motivadas, en
parte, por la cita introductoria de Polya, intentando rela-
cionar las matemticas con el pensamiento cotidiano y el
sentido comn.
Se da el nombre de inferencia al proceso discursivo que,
partiendo de una proposicin, llega a otra como conclu-
sin, siendo habitual distinguir entre inferencia deducti-
va e inductiva. La segunda supone incertidumbre, carac-
terstica de las conclusiones cientficas en su aspecto
inductivo, permite el conocimiento plausible y comprende
la evidencia inductiva del fsico, la evidencia circunstan-
cial del abogado, la documental del historiador, la esta-
dstica del economista o del socilogo... La diferencia en-
tre ambos tipos de razonamiento se centra en que el
primero es seguro, pero no permite con su rgida lgica ob-
tener ningn conocimiento nuevo sobre el mundo que
nos rodea. Por contra, el razonamiento plausible, sin al-
canzar la fuerza de una demostracin lgica estricta, se
hace necesario en las conclusiones cientficas y de la vida
diaria, al pasar de observaciones y datos experimentales a
valores no observados.
Por tanto, nuestro inters primordial est en el paso del
razonamiento lgico, o determinista, al razonamiento in-
cierto, o plausible, puesto que refleja el estado actual de
una clase de conocimientos que va del puro sentido comn
al lenguaje sofisticado con que se construyen actualmente
los conocimientos cientficos y humanos, en su impre-
sionante variedad de modelos, que van de la psicologa
cognitiva y la filosofa a la teora de la decisin y la inves-
tigacin operativa y de la inteligencia artificial y los siste-
mas expertos a la prctica diaria de profesiones como la me-
dicina o la abogaca, en que va siendo urgente un cambio
de manera de razonar que incluya el razonamiento plau-
sible o inductivo, manejado en forma rigurosa. Esto es as
porque la incertidumbre es un fenmeno casi ubicuo en
nuestras vidas: en realidad hay pocas cosas de las que es-
temos completamente seguros, y en nuestro discurso son
habituales locuciones del tipo probablemente, es casi se-
guro que..., puede que.... Aunque tales locuciones son
vlidas en el lenguaje coloquial, en el razonamiento cien-
tfico en condiciones de incertidumbre deberemos expre-
sarlas de forma cuantitativa.
George Polya (Budapest, Hungra, 1887-Palo Al to, California,
EEUU, 1985).
109
SIXTO ROS GARCA Y DAVID ROS INSUA
Aristteles (Estagira, Grecia, 384 a. C. - Euboea, Grecia, 322 a. C) .
Es interesante observar desde el principio que ha sido un
matemtico, Polya (1954), quien ha influido ms decisi-
vamente que cualquier otro probabilista o estadstico en
conseguir abrir las puertas de la teora y aplicaciones de la
induccin y la inferencia plausible a un campo de posi-
bilidades de formalizacin y aplicaciones a las ciencias
y humanidades en que no se pueden olvidar nombres tan
importantes como los de Laplace, Jeffreys, Shannon, Cox,
Jaynes...
Creemos que este enfoque del problema de la induccin
como lgica del razonamiento plausible, completado en
los ltimos aos del siglo XX, representa una novedad res-
pecto de la teora de la probabilidad basada en los axio-
mas de Kolmogorov y el axioma de Bayes, que ahora se
sustituyen por los axiomas de Aristteles, complementados
con los de la lgica inductiva de Polya, que no nace de la
idea de aleatoriedad sino de la de informacin incomple-
ta, y la adicin de Cox-Jaynes de medidas de la plausibili-
dad. Podemos as pasar de una lgica para el razonamien-
to deductivo a una lgica extendida para el razonamiento
inductivo. Estamos convencidos de que este nuevo esque-
ma de acceso al razonamiento inductivo, superada la iner-
cia de los enseantes, resultar ms asequible al estudioso,
tanto del campo de las humanidades como del de las cien-
cias, lo que contribuir a la cada del gran muro que an
separa las dos culturas e impide colaboraciones que facili-
tarn progresos fundamentales en los mismos, lo cual debe
destacarse en el ao 2000 como una importante aportacin
de las matemticas a la unidad de ambas culturas.
El resto de esta lectura comienza revisando algunos con-
ceptos bsicos del razonamiento lgico. Tras motivar las
diferencias con el razonamiento plausible y hacer una intro-
duccin histrica al problema de la induccin, revisamos
algunas reglas del razonamiento plausible para introdu-
cir, despus, su modelizacin mediante plausibilidades.
Finalmente, describimos algunas cuestiones relativas a
la implementacin prctica de estas ideas, con especial
referencia a los sistemas inteligentes.
RAZONAMIENTO LGICO
Para entender las matemticas escritas, debemos com-
prender qu constituye un razonamiento matemtico
correcto. A grandes rasgos, las matemticas se describen
en trminos de teoremas, demostraciones, axiomas, hi-
ptesis y reglas de inferencia. Como sabemos, un teore-
ma es una sentencia que puede demostrarse que es ver-
dadera. Demostramos que un teorema es verdadero con
una sucesin de sentencias que forman uno o ms
argumentos, lo que denominamos demostracin. Para
construir demostraciones necesitamos derivar nuevas
sentencias a partir de sentencias anteriores. Las senten-
cias empleadas en una demostracin pueden incluir axio-
mas o postulados, que son hiptesis subyacentes sobre las
estructuras matemticas pertinentes, las hiptesis del
teorema a probar y teoremas previamente demostrados.
Las reglas de inferencia, los medios para derivar conclu-
siones de otras sentencias, ligan los pasos de una de-
mostracin.
Quiz el primer tratamiento cientfico explcito del ra-
zonamiento lgico aparece en el Organon de Aristteles
(siglo IV a. C) . En esta obra fundamental se enuncian
dos silogismos fuertes, el modusponensy el modus tollens,
que se han considerado desde entonces la base de todo ra-
zonamiento lgico, es decir, que todo razonamiento de-
ductivo debe aparecer como una reiterada composicin
de los citados silogismos. Recordemos brevemente su ex-
presin.
1. Modus ponens
Si A es verdadero, entonces B es verdadero
A es verdadero
Por tanto, B es verdadero.
Un ejemplo de aplicacin sera:
110
LA ARQUITECTURA DEL CONOCIMIENTO COMPLEJO, EL SENTIDO COMN Y LA PROBABILIDAD
Si leo esta leccin, leer el nombre de Cox
He ledo esta leccin
Por tanto, he ledo el nombre de Cox.
2. Modus tollens
Si A es verdadero, entonces B es verdadero
B es falso
Por tanto, A es falso.
Un ejemplo de aplicacin sera:
Si leo esta leccin, leer el nombre de Cox
No he ledo el nombre de Cox
Por tanto, no he ledo esta leccin.
Existen muchas otras reglas de inferencia, como la de adi-
cin o el silogismo disyuntivo (ver, por ejemplo, Rosen,
1994), pero, como hemos dicho, todas ellas pueden re-
ducirse a los dos silogismos anteriores. En tal sentido, un
lgico podra decir a un matemtico que en su trabajo
est haciendo, simplemente, lgica; estrictamente, sera
correcto, pues podra tomar los axiomas de la lgica y la
aritmtica y reproducir los resultados matemticos me-
diante razonamiento lgico. Una visin ms til sera la
de que est empleando razonamiento lgico para hacer
matemticas: razona sobre conceptos y relaciones mate-
mticas, con ayuda de la lgica como herramienta.
As, un argumento basado en reglas de inferencia ser
vlido. Cuando todas las proposiciones empleadas en un
argumento vlido sean verdaderas, obtendremos una con-
clusin correcta. Obsrvese, sin embargo, que un argu-
mento vlido puede conducir a una conclusin incorrec-
ta si se emplean una o ms proposiciones falsas.
Tambin es importante recordar que las reglas de infe-
rencia suelen llevar asociadas falacias que en ocasiones
aparecen en argumentos invlidos. Y as, a pesar del tiem-
po que ha pasado desde Aristteles, se siguen utilizando
falacias como la de
Afirmacin de la conclusin
Si A es verdadero, entonces B es verdadero
B es verdadero
Por tanto, A es verdadero,
como en
Si leo esta leccin, leer el nombre de Cox
He ledo el nombre de Cox
Por tanto, he ledo esta leccin,
que es un razonamiento incorrecto. Observemos que pue-
do haber ledo sobre Cox, sin necesidad de haber ledo
esta leccin.
Dado el xito del razonamiento deductivo, el impresio-
nante desarrollo de las matemticas y el tiempo pasado des-
de Aristteles, no es de extraar la tendencia natural a que-
rer aplicar los silogismos fuertes anteriores, no slo en las
construcciones matemticas, sino en situaciones inciertas co-
rrientes en la vida, en el descubrimiento de verdades cien-
tficas, en el lenguaje corriente o de sentido comn..., pero
ste es, ms bien, el terreno de las conjeturas, el terreno del
razonamiento plausible, que estudiamos a continuacin.
RAZONAMIENTO PLAUSIBLE
Cuando nos recreamos recordando los pasos sucesivos
por razonamientos lgicos que surgen en la demostracin
de un teorema matemtico y los comparamos con otros
procesos inductivos, llamados plausibles o inciertos, que
no son tan fuertes como un razonamiento lgico, pero s
completamente necesarios para explicar hechos de la vida
real, en la que empleamos los razonamientos de sentido co-
mn, o del mundo tecnolgico, social..., sentimos la ne-
cesidad de clarificar las diferencias.
Consideremos el siguiente prrafo en que un polica
describe un suceso que ha observado:
Paseaba por la calle de Valverde la noche del 30 de octu-
bre, a las 2, solitaria y oscura. De pronto, o una seal de
alarma y, poco despus, observ una tienda de instrumentos
musicales, con un escaparate forzado. Despus vi salir por el
escaparate a un individuo con una careta de Drcula, con un
saco pesado. Decid que era un ladrn y le persegu.
Claramente, la conclusin del polica no es una deduc-
cin lgica a partir de la evidencia. Podra ser, por ejem-
plo, que el seor de la careta fuese el dueo de la tienda
de instrumentos, que vena de una fiesta de Halloween y
pasase cerca de la tienda momentos antes de que unos
gamberros hubiesen apedreado el escaparate y un gato hu-
biese entrado en la tienda. Por no estar trabajando, no lle-
vara la llave de la tienda y, en un momento, intent re-
coger los objetos ms valiosos antes de que potenciales
ladrones pudiesen darse cuenta de la situacin.
De igual forma, podran darse otras descripciones com-
patibles con los hechos parcialmente contemplados. Sin
embargo, a pesar de no tratarse de una deduccin lgica,
basada en las reglas antes mencionadas, le daremos, sin
duda, cierto grado de validez: la evidencia no confirma
que el hombre de la careta sea un ladrn, pero lo hace muy
plausible. De hecho, podramos formalizar el tipo de ra-
zonamiento empleado con un silogismo dbil del tipo:
3. Si A es verdadero, entonces B es ms plausible
B es verdadero
Por tanto, A resulta ms plausible,
donde A es La persona es un ladrn y B es La persona
sale corriendo de la tienda con una bolsa.
Con mucha frecuencia, se nos plantean situaciones como
la del polica en las que, basados en informacin insuficiente
para realizar un razonamiento deductivo, debemos tomar
una decisin. En estos casos, resulta conveniente emplear
n:
SIXTO ROS GARCA Y DAVID ROS INSUA
David Hume (Edimburgo, Escocia, 1711 - Edimburgo, Escocia, 1776).
razonamientos plausibles, que tienen cierto grado de va-
lidez, sin llegar a la fuerza probatoria de un razonamiento
lgico. Y esto afecta no slo a la vida cotidiana, sino tam-
bin a la actividad cientfica (no lgico-matemtica), so-
lindose hablar de inferencias de la muestra a la pobla-
cin, de los datos a las hiptesis, de los efectos observados
a las causas inciertas, del pasado al futuro, aspectos di-
versos de la induccin con que continuamente nos en-
frentamos en nuestras actividades de conocer y decidir.
Nota histrica sobre el problema de la induccin
De una forma u otra, la humanidad ha estado siempre
preocupada por el problema de cmo tratar la ignorancia.
Los filsofos y estadsticos han adoptado puntos de vista
diferentes para abordar estos problemas. Los primeros
proporcionan intentos de identificacin de las caracters-
ticas universales de las inferencias inductivas para llegar a
una teora magna como justificacin de los mtodos in-
ductivos. Los estadsticos se restringen a problemas
inductivos ms concretos, logrando con ayuda de modelos
matemticos apropiados, establecer reglas de inferencia
en condiciones bien especificadas.
Refirindonos al enfoque filosfico, con precursores
como Avicena (980 - 1037), Roger Bacon (1214 - 1294)
y otros posteriores, llegamos a Francis Bacon (1561 - 1626)
que, con su Novum Organum, inicia la ruptura con los
mtodos aristotlicos deductivos, y a John Stuart Mili
(1806 - 1 873), que introduce una metodologa cuyo pro-
psito es establecer relaciones de causa a efecto en un
proceso dialctico en que, a partir de un conjunto poten-
cialmente infinito de observaciones, se obtendran unas
primeras afirmaciones inductivas que se someteran a com-
probacin. De confirmarse por las nuevas experiencias,
permitiran llegar a teoras cientficas sucesivamente per-
feccionadas. Con l, aparecen ya las ideas iniciales de los
mtodos eliminativos de Popper, ms tarde tan en boga,
y muy relacionados con los mtodos de contraste de hi-
ptesis.
Es obligado mencionar antes a Hume que, en su Trea-
tise of Human Nature (1739), define por primera vez cla-
ramente el problema de la induccin en la siguiente forma:
Cuando se pasa de lo observado O a lo inobservado I,
0 e I son lgicamente distintos, al menos en el sentido de que
se puede concebir O como evidente, mientras 1 no. En con-
secuencia, no existe necesidad lgica de que I se siga de O.
Cules podran ser entonces los fundamentos para afirmar
1 dado O.
En definitiva, plantea el problema de dar una justifica-
cin racional a las inferencias inductivas. Su postura em-
piricista le lleva a negar que tal problema pudiera tener so-
lucin. Pero, como dice, muchos aos despus, Bertrand
Russell:
Es necesario elegir entre la induccin, con su irracionali-
dad relativa, y la irracionalidad absoluta.
Las respuestas filosficas al problema han sido de dos ti-
pos. Las primeras sugieren que las inferencias inductivas
son injustificables y no deben figurar en ningn libro cien-
tfico. Otros filsofos, como Popper, Kuhn, Feyerabend...,
tratan de auxiliar al cientfico con sus mtodos de falsacin
Sir Harold Jeffreys (Fatfield, Inglaterra, 1891 -Cambri dge, Inglaterra,
1989).
112
LA ARQUITECTURA DEL CONOCIMIENTO COMPLEJO, EL SENTIDO COMN Y LA PROBABILIDAD
m
Leonard Jimmie Savage (Detroit, Estados Unidos, 1917 - Connecticut,
Estados Unidos, 1971).
o refutacin, que se relacionan con los mtodos estads-
ticos de contraste de hiptesis (ver, por ejemplo, French
y Ros Insua, 2000) como trmino de una lnea de traba-
jos, ya mencionados, que se inicia en Bacon y Mili.
Los filsofos del segundo grupo se ocupan de justifi-
car racionalmente las inferencias inductivas, bien tra-
tndolas como argumentos deductivos incompletos, bien
aadiendo algn principio de carcter general, como el
de uniformidad de la naturaleza. Sin embargo, en esta
lnea no se avanza mucho en tiempos posteriores, a pe-
sar del enfoque pragmtico de Reichenbach (1949) y de
las aportaciones de Keynes, que, en su A Treatise on Pro-
bability (1921), introduce la probabilidad lgica o ne-
cesaria. Hoy se considera fallido este ambicioso intento
de reconstruccin y formalizacin racional de la reali-
dad cientfica, a pesar de los importantes trabajos de
Carnap (1950), cuyo complicado sistema de axiomas
fue pronto abandonado. Carnap, junto con Keynes y
Jeffreys, contribuy en parte a resucitar la antigua lnea
bayesiana de trabajos que en la actualidad pueden con-
siderarse como el primer tratamiento formal exitoso de
la inferencia inductiva.
El teorema de Bayes, que Laplace redescubri y aplic
muchos aos despus, constituye la base de la inferencia
bayesiana, que se desarroll y utiliz hasta la Primera Gue-
rra Mundial, junto con otras metodologas, que se suelen
denominar de estimacin y contraste de hiptesis. Despus
surgieron los importantes trabajos de Fisher, que con su va-
riada gama de tcnicas, ms fciles de elaborar, arrincona-
ron las ideas bayesianas, a lo que contribuyen tambin los
trabajos ms formalizados de Neyman-Pearson y Wald, que
dominaron a partir de los aos treinta entre los estadsticos
tericos y aplicados, hasta el reciente auge de los mtodos
bayesianos (ver, por ejemplo, French y Ros Insua, 2000).
Esto lleva a la construccin axiomtica de un modelo
probabilstico subjetivo mediante axiomas que han ido
perfeccionndose con los trabajos de De Finetti, Savage,
Anscombe y Aumann... Con ellos se llega finalmente
a las mismas reglas de Kolmogorov, que permiten el
clculo de la probabilidad subjetiva de cada sentencia S,
bien construida mediante las reglas de Boole, a partir de
un conjunto de proposiciones atmicas A, B, C... en un
cierto contexto provisto de una cierta informacin H.
Sobre esta construccin axiomtica se edifica el forma-
lismo bayesiano para razonar en condiciones de incerti-
dumbre.
Aqu, siguiendo la lnea de trabajos de Polya, Cox y
Jaynes, mostraremos cmo la lgica deductiva aristotli-
ca puede extenderse de manera consistente con algunas
reglas de razonamiento plausible, de modo que los gra-
dos de creencia se representan mediante nmeros reales
que satisfacen las propiedades de las probabilidades, con
lo que puede hablarse de probabilidades como lgica ex-
tendida.
Reglas de razonamiento plausible
En el apartado anterior introdujimos un silogismo d-
bil que recordaba en parte al modus ponens. Otro silogis-
mo dbil, que debe compararse con la falacia de afirma-
cin de la conclusin, y habitualmente empleamos en el
razonamiento plausible, es:
4. Si A es verdadero, entonces B es verdadero
B es verdadero
Por tanto, A resulta ms plausible
Por ejemplo, supongamos que A es Comenz a llover a
las 9 de la maana y B es El cielo estaba nublado a las 8.55
de la maana. Si tratamos de aplicar el silogismo modus
ponens, nos encontramos que la presencia de nubes a
las 8.55 no nos da una certidumbre lgica de que llo-
ver a las 9. Esto nos lleva a introducir, para el razona-
miento plausible, el silogismo dbil anterior, que en
nuestro contexto se expresara Si el cielo estaba nublado
a las 8.55 de la maana (B) resulta ms plausible que
llueva a las 9 (A).
La contribucin esencial de Polya fue fijarse en los as-
pectos cualitativos de extensin de los esquemas clsicos
de la lgica aristotlica al planteamiento de nuevos es-
quemas, que sirven de soporte a los razonamientos in-
ductivos que llamaremos plausibles y desempean un pa-
pel fundamental en los procesos intuitivos, como hemos
visto en el ejemplo del polica. Polya busca formas debi-
litadas de los esquemas bsicos de Aristteles para efec-
tuar estas construcciones. Otro ejemplo es:
113
SIXTO ROS GARCA Y DAVID ROS INSUA
5. Si A es verdadero, entonces B es verdadero
A es falso
Por tanto, B resulta menos plausible,
como ocurre en el ejemplo anterior de lluvia a las 9 (A) y
cielo nublado a las 8.55 (B).
En conjunto, Polya proporciona una tabla de patrones
de inferencia plausible que usamos en nuestro razona-
miento comn, y que los cientficos y los matemticos ',
en particular, empleamos en el descubrimiento de nue-
vas verdades, que despus deben convertirse en teoras
que habrn de desarrollarse mediante silogismos. Por ejem-
plo, los silogismos dbiles 4 y 5 permiten a los cientficos
rechazar o aceptar teoras. Incluso se emplean para realizar
demostraciones en computacin aleatorizada.
El razonamiento deductivo anteriormente descrito, tie-
ne la propiedad de que podemos realizar largas cadenas de
deducciones modus ponens y modus tollens, preservando
las conclusiones la misma certeza que las premisas. Sin
embargo, con razonamientos basados en silogismos dbi-
les como los aqu expuestos, la Habilidad de las conclusiones
se debilita si pasamos por varias fases.
Modelizacin del razonamiento plausible
Hemos indicado que Polya puso el nfasis en los as-
pectos cualitativos del razonamiento plausible. De hecho,
basndonos en los axiomas de Cox (1946), es posible mo-
delizar el razonamiento plausible en trminos probabils-
ticos, con lo que se consigue ver cmo el razonamiento
plausible puede considerarse como una extensin del ra-
zonamiento lgico.
Partimos de un conjunto de proposiciones elementa-
les, o sentencias que pueden ser verdaderas o falsas, que de-
notamos por A, B... Suponemos la estructura bsica del l-
gebra de Boole, con el producto lgico o conjuncin que
designamos por AB y representa A y B son ambas verda-
deras; la suma lgica o disjuncin A + B que representa la
proposicin al menos una de las proposiciones A, B es ver-
dadera; y la negacin de una proposicin, A. Con ellas
creamos el conjunto S de sentencias bien formadas que obe-
decen las reglas de combinacin del lgebra de Boole,
como las de doble negacin, la de idempotencia, la con-
mutativa, la asociativa, la de dualidad, la distributiva y la
simplificativa. Lgicamente, en un entorno cambiante,
iremos descubriendo que la informacin disponible se va
modificando, por lo que es necesario hablar de la propo-
sicin A sabiendo que la proposicin B es verdad, que
designaremos mediante AIB.
Podemos ya enunciar las hiptesis bsicas de Cox que
permiten representar los grados de creencia mediante n-
meros que satisfacen las reglas de combinacin de las pro-
babilidades y que, como veremos, permiten modelizar
cuantitativamente el razonamiento plausible. Esencial-
mente, a cada proposicin sobre la que razonemos le asig-
naremos un grado de plausibilidad y cuando recibamos
nueva evidencia deberemos modificar tal asignacin para
tener en cuenta tal informacin. Las hiptesis de Cox
son:
Los grados de plausibilidad se representan mediante
nmeros reales. Simblicamente, a cada proposicin
AIB se le asocia un nmero p(AIB), que medir su
grado de plausibilidad.
El grado de plausibilidad de una inferencia, dada cier-
ta evidencia, determina el grado de plausibilidad de
la inferencia contraria, basada en la misma eviden-
cia. Simblicamente:
P(AIB) = g(
P
(AIB))
El grado de plausibilidad de la conjuncin de dos in-
ferencias dada cierta evidencia se determina a partir
del grado de plausibilidad de una inferencia, dada la
evidencia, y del grado de plausibilidad de la otra in-
ferencia dada la evidencia y que la primera inferencia
sea verdadera. Simblicamente:
p(ABIC) = f(p(AIC), p(BIAQ)
A partir de ellas se prueba que se pueden asignar nmeros
no negativos a las sentencias AIB que satisfacen las reglas
bsicas del clculo de probabilidades:
p(ABIC) = p(AIC)p(BIAC) = p(BICp(AIBC)
p(AIB) + p(AlB) = 1
La primera se denomina regla del producto. La segunda,
regla de la suma.
Horvitz et al. (1986) proporcionaron una versin del
resultado anterior ms cercana al lenguaje de la inteli-
gencia artificial. Jaynes (1990), de forma algo ms im-
precisa, relaciona el resultado de Cox con las reglas, algo
ms cualitativas:
Representacin de grados de plausibilidad mediante
nmeros reales.
Correspondencia cualitativa con el sentido comn.
Consistencia.
Probabilidades como lgica extendida
A continuacin vamos a analizar cmo, una vez ob-
tenida la representacin de los grados de plausibilidad
mediante probabilidades condicionadas, somos capaces de
El propio Polya emple los patrones que descubri en sus investigaciones en teora de nmeros.
114
LA ARQUITECTURA DEL CONOCIMIENTO COMPLEJO, EL SENTIDO COMN Y LA PROBABILIDAD
implementar el razonamiento lgico (deductivo) y las re-
glas de razonamiento plausible (inductivo) debidas a
Polya.
Si designamos por C la proposicin Si A entonces B,
vemos que modusponensy modus tollensse. adaptan, res-
pectivamente, a las reglas de producto:
A partir de modus ponensy modus tollens tenemos, respec-
tivamente, que p(ABIC) = p(AIC) y p(ABIC) = 0, por lo que:
p(BIAC) = 1
p(AIBC) = 0
Podemos, por tanto, modelizar modus ponensy modus to-
llens con ayuda de las probabilidades, como casos extremos
en los que estamos seguros de las conclusiones.
Ms an, podemos dar versiones cuantitativas de las re-
glas dbiles. As, por ejemplo, el silogismo dbil 4 corres-
ponde a la regla del producto en la forma:
p(AIBC) = p(AIC)
p(blC)
Ahora bien, de modus ponens, p(BIAC) = 1 y, como
p(BIC) < 1, tenemos:
p(AIBC) a p(AIC)
como se indica en el silogismo dbil 4. El silogismo 5 co-
rresponde a la regla producto en la forma
p(BIC) = p(BIC)
De la conclusin anterior se sigue:
con lo cual:
p(IBC) < p(AlC)
p(BIAC) <; p(BIC)
como se indica en el silogismo. Respecto a 3, si C desig-
na la informacin disponible, la primera premisa es
p(BIAC) s p(BIC); aplicada a la regla de producto:
p(AIBC) = p(AIC)
tenemos directamente: .
p(AIBC) a p(AIC)
Vemos, pues, cmo somos capaces de modelizar en tr-
minos probabilsticos el razonamiento lgico y los patrones
de razonamiento plausible, con lo que, efectivamente,
podemos hablar de probabilidades como lgica extendida.
IMPLEMENTACIN
Los axiomas antes mencionados de Cox sugieren intro-
ducir la probabilidad como una medida de los grados de
plausibilidad o creencia que una persona tiene en la verdad
de una proposicin basada en su informacin en un mo-
mento dado. En presencia de informacin adicional, las
probabilidades se actualizan mediante la frmula de Bayes:
p(AIB) =
P(B)
p(BIA)p(A)
que es una consecuencia inmediata de la regla del pro-
ducto. No hemos descrito an cmo implementar tal
programa, para lo cual debemos proporcionar, primero,
mtodos de asignacin de probabilidades.
Asignacin de probabilidades
La ventaja de la concepcin adoptada de la probabili-
dad es que corresponde a un concepto ms general que
el tradicionalmente considerado y que, por tanto, pue-
de aplicarse a fenmenos en los que no haya simetras apa-
rentes, ni sean de carcter repetitivo, como ocurre en
numerosos campos como la medicina o la abogaca.
Nuestro objetivo es proporcionar un modelo probabi-
lstico, que no es otra cosa que una codificacin de la
informacin disponible sobre la verdad de las sentencias
bien formadas a partir de las proposiciones elementales
en trminos de una distribucin de probabilidad. Para ello
describimos tres mtodos, siendo el ms general y gen-
rico el tercero.
En ocasiones, por razones de simetra fsica o lgica,
encontramos todos los resultados de un experimento igual-
mente verosmiles y apelamos al concepto clsico de pro-
babilidadque se define mediante el cociente del nmero
de casos favorables, i.e. casos en los que es verdadera la
proposicin, por el de casos posibles.
Ejemplo 1
Consideramos una urna con ocho bolas numeradas del
1 al 8. Dada la simetra fsica, encontramos igual de ve-
rosmil sacar cualquiera de las bolas en una extraccin.
As, por ejemplo, si preguntamos por la probabilidad de
sacar una bola con nmero par tenemos:
/MPar) = 4/8 = 0,5
Un concepto ms general es el frecuentista. Se aplica en
experimentos que se pueden repetir bajo condiciones si-
115
SIXTO ROS GARCA Y DAVID ROS INSUA
milares, adoptndose la hiptesis intuitiva de que la fre-
cuencia relativa con la que una proposicin es verdad se
estabiliza al repetirse un experimento.
Ejemplo 2
La figura muestra la traza de la frecuencia relativa de
aparicin de cara en n tiradas de una moneda equilibrada.
Frecuencia
de caras
0.5-
0.4-
0.3-
0.2-
0.1 -
0.
1 i'
V
0 10 20 30 40 50 60 70 80 90 100
Lanzamientos de moneda
Fi g. 1 . - Evolucin de la frecuencia relativa de cara al tirar una
moneda equilibrada.
Se interpreta entonces la probabilidad de la proposi-
cin como el lmite de la frecuencia relativa de aparicin
de la proposicin, cuando el nmero de ensayos tiende a
infinito. Observemos, sin embargo, que no es fsicamen-
te posible hablar de una sucesin infinita de repeticiones,
por lo que, en la prctica, hablamos de la fraccin de ve-
ces que una proposicin es verdad en una sucesin larga
de ensayos.
Ejemplo 3
En un gran hospital que atiende a cierto sector de una
ciudad, se han registrado 7.227 ingresos de nios entre
uno y cinco aos, de los cuales 536 presentaban amigda-
litis aguda. Tenemos entonces que:
Pr (nio entre 1 y 5 aos de esa poblacin
con amigdalitis) = 536/7227 = 0,07
Obsrvese el problema con esta definicin, al no ser
preciso lo que se entiende por un nmero grande de en-
sayos. As, por ejemplo, si al tirar un dado de seis caras cin-
co veces, el 4 no aparece ninguna vez, no tiene sentido
estimar mediante 0 la probabilidad de que salga 4.
El concepto ms general utiliza un experimento de ca-
libracin para medir probabilidades. Un experimento es
de calibracin para un individuo si ste encuentra todos
los resultados igualmente verosmiles, utilizndose tal ex-
perimento para comparar la verosimilitud de las proposi-
ciones de inters con la verosimilitud de las proposiciones
de calibracin.
Ejemplo 4
En el ejemplo 1, los autores de este trabajo encuentran
igual de preferibles todas las apuestas del tipo Ganar 10.000
pesetas si sale la bola con el nmero i, 0 pesetas en otro caso
para z= 1, ..., 8. Nos sirve, por tanto, de instrumento
para medir probabilidades con valores en 0, 1/8, 2/8, ...,
7/8, 1. As, por ejemplo, si deseamos encontrar la proba-
bilidad de uno de nosotros (DRI) de que Espaa gane la
Copa Davis del ao 2000
2
, encontramos tan verosmil
que saquemos una bola con nmero menor o igual que 6,
como que gane Espaa, por lo que para DRI la probabi-
lidad de que Espaa gane es 3/4.
Adems, debe mencionarse que existe la posibilidad de
emplear distribuciones por defecto o no informativas,
que exigen poco esfuerzo por parte del experto. Un ejem-
plo de tales distribuciones es el de las basadas en el princi-
pio de mxima entropa, ver Jaynes (1996).
Subjetivismo, consenso e imprecisin
Una cuestin llamativa es que hemos introducido las
probabilidades como grados de plausibilidad o creencia
asociados, por tanto, a una persona. Las probabilidades son
propiedades del observador, no del sistema observado. La
primera cuestin que surge es si las creencias tienen cabi-
da en la Ciencia y en la Ingeniera. En nuestra opinin,
la respuesta es afirmativa: en numerosas fases de la Historia
de la Ciencia, y en distintas ramas, ha habido teoras con-
tradictorias que defendan distintas concepciones de un fe-
nmeno. En muchas ocasiones, con la recepcin de nue-
va informacin, algunas teoras han quedado refutadas,
mientras que otras han evolucionado y convergido a una
teora mejor.
De hecho, las creencias dependern de cada persona y de
la informacin que tenga en cada momento, de manera que
dos personas podran discutir e intercambiar informacin has-
ta que sus creencias convergiesen, con lo que tendramos
una forma de modelizar consenso implcitamente.
Ejemplo 5
Como ilustracin, supongamos que dos ingenieros
se enfrentan a un problema de control de calidad de
una lnea de produccin. Para ello se fijan en la pro-
porcin de piezas defectuosas de la lnea. El primero
es muy inexperto sobre el proceso de produccin y mo-
Escrito unas semanas antes del evento.
116
LA ARQUITECTURA DEL CONOCIMIENTO COMPLEJO, EL SENTIDO COMN Y LA PROBABILIDAD
P0.8-
3 0.4
ai
oa
0.0
o
d
m
tu
03
10-
8-
6-
4-
2-
0-
0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
0.0 0.2 0.4 0.6 0.8 1.0
00
15
5-
0
0.0 0.2
15
fM
101
0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0
Fi g. 2. - Evolucin de las creencias de los ingenieros.
delizamos sus creencias sobre la proporcin con una
distribucin /5e(l, 1), esto es una distribucin unifor-
me en el intervalo (0, 1). El segundo cree saber mucho
sobre el proceso y modeliza sus creencias sobre la pro-
porcin con una /fe(10, 70). Ambos observan tres pie-
zas, siendo una de ellas defectuosa. Las creencias del
primer ingeniero pasan a modelizarse mediante una
j8e(2, 3)cambiando radicalmente; las del segundo pasan a ser
j8e(l 1, 72), no sufriendo apenas cambio. Despus de observar
380 piezas, con 160 defectuosas, las creencias del primero
pasan a ser j3e( 161, 221) y las del segundo 8e( 170, 290), las
creencias de ambos ingenieros se parecen bastante.
Un problema implcito en el procedimiento de asig-
nacin, y en los axiomas de Cox, en concreto en el pri-
mero de ellos, es que somos capaces de asignar a cada
proposicin un grado de plausibilidad. Exigimos, por
tanto, un grado de precisin muy grande en la mente del
observador, lo cual es aceptable desde un punto de vis-
ta normativo, pero quiz no tanto desde un punto de
vista descriptivo. Debemos mencionar que, desde una
perspectiva normativa, se han desarrollado axiomticas
que no exigen tanta precisin (ver Girn y Ros, 1980,
o Ros Insua, 1990). Desde un punto de vista prescrip-
tivo se han desarrollado enormemente los mtodos del
anlisis robusto (ver Ros Insua y Ruggeri, 2000).
Razonamiento plausible en sistemas inteligentes
En cierta medida, el resurgir del inters por las cues-
tiones relativas al razonamiento plausible se debe a la ne-
cesidad que los sistemas inteligentes tienen de procesar
informacin incierta y tomar decisiones bajo condiciones
de incertidumbre. El objetivo de la inteligencia artificial
(IA) es proporcionar un modelo computacional del com-
portamiento inteligente (Pearl, 1988). Ciertamente, dos
tareas asociadas al mismo son el aprendizaje y la toma de
decisiones bajo condiciones de incertidumbre. Por consi-
guiente, cabra esperar la importancia de los conceptos
probabilistas en la inteligencia artificial. Sin embargo, has-
ta muy avanzada la historia de esta disciplina, la IA mos-
tr poco inters por estas teoras. Este desinters inicial
tiene fcil explicacin: tales teoras implican utilizar pro-
babilidades y utilidades, que son nmeros, y la IA, en
principio, no se interesaba por la manipulacin de n-
meros, sino por programas con entradas y salidas simb-
licas. Este prejuicio contra los nmeros en general, y, en
particular, los que utiliza la teora de la probabilidad, no
ha desaparecido de la IA, lo que explicara la introduc-
cin de mtodos no numricos para el tratamiento de la
incertidumbre, como las lgicas no montonas o la teo-
ra de la confirmacin, dando lugar a la lnea logicista de
tratamiento de la incertidumbre.
117
SIXTO ROS GARCA Y DAVID ROS INSUA
Sin embargo, los factores causantes de este prejuicio han
cambiado sustancialmente. La idea de definir la inteli-
gencia artificial por contraposicin al procesamiento nu-
mrico, ha sido sustituida por la idea de que la inteli-
gencia se produce mediante la complejidad y por acceso
a grandes cantidades de conocimiento. As, se han abier-
to dos vas para el posible empleo de las probabilidades
enlA:
El inters por los sistemas expertos que, en ocasio-
nes, se disean para interaccionar con personas que
proporcionan entradas numricas. Por tanto, ha de-
saparecido en algunos casos la prohibicin sobre la
manipulacin de nmeros.
Los investigadores en IA aceptaron las propuestas de
Marr (1982) sobre niveles de explicacin: la com-
prensin de un sistema inteligente requiere explica-
ciones segn diversos niveles. As, incluso si las entra-
das y salidas fuesen no numricas, puede ser muy
valioso para una inteligencia artificial poder disear el
tipo de argumentos empleados en el clculo de proba-
bilidades y generar los juicios numricos que sta
requiere.
A pesar de ello, las probabilidades se consideraron du-
rante bastante tiempo computacionalmente infactibles y
epistemolgicamente inadecuadas, lo que motivara la
adopcin de mtodos neo calculistas para el tratamiento de
la incertidumbre, como la lgica difusa o el mtodo
de Dempster-Shafer.
Ciertamente, los primeros intentos de emplear pro-
babilidades debieron limitarse a modelos muy senci-
llos, denominados Buyes naive (ver Warner et al, 1961),
muchas veces inadecuados. El enorme potencial de
los mtodos probabilsticos se debe, en gran medida, al
estudio en detalle de la propiedad de independencia
condicionada, su relacin con las denominadas redes
bayesianas y la introduccin de algoritmos para el ra-
zonamiento probabilstico y estadstico en tales estruc-
turas de conocimiento, bien descritas en Cowell et al.
(1999).
Decimos que los sucesos A y C son independientes dado
B si p(C I B, A) = p(C I B), o, cualitativamente, si, una vez
conocido B, A no aporta informacin sobre C (y rec-
procamente). Grficamente se tiene la representacin que
se muestra en la figura 3.
( Disnea )
Fig. 4. - Red bayesiana del problema de enfermedades pulmonares.
El inters de este concepto est en que permite la re-
presentacin modular del conocimiento complejo me-
diante las denominadas redes bayesianas o causales. Una
red bayesiana es un grafo acclico dirigido G = (N, A),
donde N es el conjunto de nodos y A es el conjunto de aris-
tas, que lleva asociado a cada nodo n una variable aleato-
ria, con una distribucin condicionada p(n I pa(n))
donde pa(n) es el conjunto de nodos padre de n, de
manera que la distribucin conjunta asociada a la red es
E L N P(
n
! P
a
(
n
))-
Ejemplo 6
Un ejemplo ya clsico es el debido a Lauritzen y Spie-
gelhalter(1988):
La disnea puede deberse a tuberculosis, cncer de pul-
mn o bronquitis, a ninguna de ellas, o a ms de una de
ellas. Una visita reciente a Asia aumenta las probabilidades
de tener tuberculosis. Sabemos, adems, que fumar es un
factor de riesgo tanto para el cncer de pulmn como para
la bronquitis. Los resultados de una nica radiografa tor-
cica no discriminan entre el cncer de pulmn y la tuber-
culosis, como tampoco lo hace la presencia o ausencia de la
disnea.
La estructura cualitativa del problema viene ilustrada
en el grafo, mientras que la distribucin asociada al pro-
blema es:
p(f, a, b, c, t, o, d, r) = p(f)p(a)p(b I f)p(c I f)p(t I a)
p(o I c, t)p(d I b,o)p(r I o)
Fig. 3. - Representacin de la independencia condicionada de A y C
T a l si s
tema se empleara en situaciones como la siguiente.
dado B. Se presenta un paciente con disnea que ha visitado Asia;
118
LA ARQUITECTURA DEL CONOCIMIENTO COMPLEJO, EL SENTIDO COMN Y LA PROBABILIDAD
el mdico deseara saber las probabilidades de presencia de
alguna de las enfermedades. Adems, podra estar intere-
sado en saber cmo afectara a tales probabilidades el co-
nocer los resultados de la radiografa o de determinar el his-
torial como fumador del paciente, de cara a planificar la
exploracin. Una vez realizada sta y absorbida la evi-
dencia, puede preguntarse cul es la informacin ms im-
portante al formarse tales probabilidades.
La ventaja obvia de esta estructura modular del cono-
cimiento es que reduce enormemente el nmero de pro-
babilidades a asignar. As, en el ejemplo anterior, supues-
to que cada nodo puede tener dos estados (por ejemplo,
en Asia podemos haber visitado o no Asia) en lugar de
tener que realizar 255 ( = 2
8
1) asignaciones, basta con
realizar 18 asignaciones. Ms an, se han construido
diversos algoritmos, ver Cowell etal. (1999) para una in-
troduccin, que posibilitan, de forma eficiente, el razo-
namiento probabilstico y estadstico en redes bayesianas.
Percepcin como inferencia
Hemos indicado cmo la adopcin de las hiptesis de
Marr permitieron la introduccin de conceptos probabi-
lsticos en la inteligencia artificial. Es quiz interesante re-
visar las aportaciones de estos mtodos en el campo de la
percepcin. De forma muy esquemtica, intervienen, esen-
cialmente, cuatro elementos:
La representacin de las propiedades de la escena s.
Un modelo de la estructura de las escenas p(s).
Un modelo de formacin de la imagen Jt(s).
Un modelo de ruido n, de manera que la imagen es
i = Jt(s) + n.
Entonces, el objetivo en el problema de percepcin sera
calcular la distribucin sobre las escenas, dada la imagen
formada, que se obtiene a travs de la frmula de Bayes me-
diante:
p(
s
= p(s)p(s)
Usualmente se emplea la moda de esta distribucin, la
moda a posterior!, para resumirla. La aplicabilidad de es-
tas ideas se extiende enormemente con la teora de patrones
(Grenander, 1995). Pastor et al. (1998) proporcionan
una descripcin detallada del problema de reconocimiento
de objetos.
DISCUSIN
Durante ms de dos milenios, la lgica aristotlica ha do-
minado el pensamiento occidental, conformndose las
teoras y modelos cientficos a sus principios. Hemos visto
aqu cmo, de forma natural, las probabilidades extienden
la lgica permitindonos tratar situaciones en las que exis-
te incertidumbre, ayudndonos a modelizar figuras del
sentido comn empleadas en la vida diaria y en el trabajo
habitual del cientfico.
Hemos puesto nfasis en la axiomtica de Cox (1946),
pero existen otras que, esencialmente, llevan a las mismas
conclusiones, lo cual reasegura su slida fundamentacin.
Debemos quiz destacar las axiomticas relacionadas con
la teora de la decisin, como las de Savage o de Anscombe
y Aumann (ver French y Ros Insua, 2000).
Tambin hemos indicado algunas aplicaciones im-
portantes, especialmente, en el campo de la inteligencia
artificial, la medicina, la biologa, la ciencia, la tecnolo-
ga o la abogaca. Estos mtodos inductivos estocsticos,
como dice Mumford will transform pur and applied
mathematics in the beginning of the third millenium.
Probability and statistics will come to be viewed as the
natural tools to use in mathematical as well as scientific
modeling. The intellectual world as a whole will come to
view logic as a beautiful elegant idealization but to view sta-
tistics as the standard way in which we reason and think.
AGRADECIMIENTOS
Este trabajo ha sido financiado por proyectos de la CAM
URJC y CICYT-TIC. Agradecemos los comentarios de
Jess Palomo y Juanmi Marn.
BIBLIOGRAFA
1. Berger, J. (1985) Statistical Decisin Theory and Ba-
yesian Analysis. Ed.: Springer.
2. Carnap, R. (1950) Logical Foundations of Probability.
Ed.: U. Chicago Press.
3. Cowell, R., Dawid, P., Lauritzen, S., Spiegelhalter,
D. (1999) Probabilistic Networks and Expert Systems.
Ed.: Springer.
4. Cox, R. T. (1946) Probability, frequency and reaso-
nable expectation, American Journal of Physics, 14,
1-13.
5. French, S., Ros Insua, D. (2000) Statistical Decisin
Theory. Ed.: Arnold.
6. Girn, E, Ros, S. (1980) Quasi-Bayesian behaviour:
a more realistic approach to decisin making. En Ber-
nardo, DeGroot, Lindley, Smith (eds.) Bayesian Sta-
tistics. Ed.: Valencia University Press, 17-38.
7. Grenander, U. (1995) Elements ofPattern Theory. Ed.:
Johns Hopkins.
8. Horvitz, ., Heckerman, D., Langlotz, C. (1986) A
framework for comparing alternative formalisms
for plausible reasoning, Proc. 5th Nat. Conf. on AI,
210-214.
9. Jaynes, E. T. (1996) Probability Theory: The Logic of
Science, http://bayes.wustl.edu/etj/prob.html.
10. Keynes, J. M. (1921) A Treatise on Probability, Ed.:
MacMillan.
119
SIXTO ROS GARCA Y DAVID ROS INSUA
11. Lauritzen, S., Spiegelhalter, D. (1988) Local compu-
tations with probabilities on graphical structures and
their application to expert systems (with discussion),
/. RoyalStat. Soc. B, 50, 157-224.
12. Marr, D. (1982) Vision. Ed.: Freeman.
13. Mumford, D. (2000). The Dawning of the Age of
Stochasticity. A. H. S.
14. Pastor, L, Rodrguez, A., Ros Insua, D. (1998) Wa-
velets for object representation and recognition in
computer visin, en Muller, Vidakovic (eds.) Baye-
sian Inference in Wavelet-BasedModels. Ed.: Springer.
15. Pearl,J. (1988) Probabilistic Reasoningin IntelligentSys-
tems. Ed.: Morgan Kauffman.
16. Polya, G. (1954) Patterns of Plausible Inference. Ed.:
Princeton Univ. Press.
17. Ros Insua, D. (1990) Sensitivity Analysis in Multiob-
jective Decisin Making. Ed.: Springer.
18. Ros Insua, D., Ruggeri, F. (2000) Robust Bayesian
Analysis. Ed.: Springer.
19. Rosen, K. (1994) Discrete Mathematics with Applica-
tions. Ed.: McGraw Hill.
20. Wainer, H., Toronts, A., Veasey, L, Stephenson, R.
(1961) A mathematical approach to medical diagno-
sis. An application to congenital heart disease. /. Amer.
Medical Association, 177, 177-189.
120