Antologia de Inteligencia Artificial
Antologia de Inteligencia Artificial
Antologia de Inteligencia Artificial
I.S.C. Carlos Daniel Olvera Aguirre I.E. Henry Izquierdo Cruz I.S.C. Vianey Fuentes Mateos.
NDICE
OBJETIVO GENERAL 5
JUSTIFICACIN
UNIDAD 1
FUNDAMENTOS 1.1 El Propsito de la IA y su evolucin histrica. 1.2 Las habilidades cognoscitivas segn la psicologa.
Teoras de la Inteligencia (Conductismo, Gardner,)
8 9 26
1.3 El Proceso de razonamiento segn la lgica (Axiomas, Teoremas, Demostracin). 1.4 El modelo de adquisicin del conocimiento segn la filosofa. 1.5 El modelo cognoscitivo. 1.6 El modelo del agente inteligente. 1.7 El papel de la heurstica.
53
61
65 73 77
UNIDAD 2
REPRESENTACIN DEL CONOCIMIENTO Y RAZONAMIENTO 2.1 Mapas conceptuales. 2.2 Redes semnticas. 2.3 Razonamiento montono. 2.4 La lgica de predicados sintaxis, semntica, validez e inferencia. 2.5 La demostracin y sus mtodos. 2.6 El mtodo de resolucin de Robinson. 2.7 Conocimiento no montono y otras lgicas. 2.8 Razonamiento probabilstico. 2.9 Teorema de Bayes. 98 100 101 105 107
III
86 87 92 94 95
UNIDAD 3
SISTEMAS DE RAZONAMIENTO LGICO 3.1 Reglas de produccin. 3.2 Sintaxis de las Reglas de Produccin (A1 A2An => C Representacin Objeto- Atributo- valor). 3.3 Semntica de las reglas de produccin. 3.3.1 Conocimiento causal. 3.3.2 Conocimiento de diagnostico. 3.4 Arquitectura de un Sistema de produccin (SP)( sistemas basados en reglas, SBR). 3.4.1 Hechos. 3.4.2 Base de conocimientos. 3.4.3 Mecanismo de control. 3.5 Ciclo de Vida de un Sistema de produccin.
132
134
144
UNIDAD 4
BSQUEDA Y SATISFACCIN DE RESTRICIONES 4.1 Problemas y espacios de estados. 4.2 Espacios de estados determinsticos y espacios no
determinsticos.
4.3 Bsqueda sistemtica. 4.3.1 Bsqueda de metas a profundidad. 4.3.2 Bsqueda de metas en anchura. 4.3.3 Bsqueda ptima. 4.4 Satisfaccin de restricciones. 4.5 Resolucin de problemas de juegos.
154
176 177
BIBLIOGRAFIA
179
IV
OBJETIVO GENERAL
El estudiante representar problemas basados en conocimiento en trminos formales y disear la solucin a problemas tpicos de la Inteligencia Artificial (I.A.).
JUSTIFICACION
El siguente trabajo se presenta para resolvera la problematica de la falta de material didactico en el Instituto Tecnologico Superior de Acayucan, y apoyando la creatividad y esfuerzo del docente. Otro punto que tiene este trabajo es apoyar al proceso de enseanza aprendizaje del alumno, teniendo como objetivo fundamental recopilar informacion interesante de diferentes autores en el tema de la inteligencia artificial.
Viendo la falta de libros acerca de estos temas nos dimos a la tarea de buscar, recopilar, seleccionar y filtrar contenidos de diferentes autores y libros, que abarcaban temas como agentes inteligentes, redes neurales, mineria de datos, sistemas basados en conocimiento, etc. Puesto que en la biblioteca local no se cuenta con ninguna ayuda bibliografica acerca de los temas.
Considerando que los temas de esta antologa abarca el contenido temtico de la materia y facilita el estudio de la inteligencia artificial partiendo de la base de conocimiento hasta la forma de genera el conocimiento por medio de. Esperamos que este trabajo realizado y analizado, sea de utilidad a la comunidad de estudiantil, docentes y publico en general.
VI
UNIDAD 1
FUNDAMENTOS
UNIDAD I / FUNDAMENTOS
UNIDAD I / FUNDAMENTOS
computacin, con su amplsimo rango de mbitos de aplicacin, como respuesta a la
siempre creciente demanda de la sociedad, de la industria y de la humanidad en general. En este tipo de situaciones, la Inteligencia Artificial ofrece perspectivas interesantes ya que es capaz de suministrar metodologas que permiten realizar de forma automtica algunas de las tareas realizadas tpicamente por los humanos. El estudio y desarrollo de sistemas inteligentes requiere significativos esfuerzos de investigacin multidisciplinarios para integrar conceptos y mtodos de distintas areas tales como ciencias de la computacin, inteligencia artificial, investigacin operativa, gestin del conocimiento, tratamiento de la informacin, control, identificacin, estimacin, teora de la comunicacin, etc. La Inteligencia Artificial esta ayudando a expandir el horizonte del tratamiento de la informacin. Parte de esta expansin se debe a la extensin de las fronteras de la tecnologa. Desde el microprocesador al impacto del procesamiento en paralelo, va redes neuronales, o los procesadores fuzzy, todo apunta a la expansin de las tcnicas computacionales.
10
UNIDAD I / FUNDAMENTOS
Un sistema inteligente se caracteriza tambin por su habilidad para la asignacin dinmica de subobjetivos y acciones de control de forma interna o autnoma. La organizacin del conocimiento puede ser vista tambin como un importante atributo de la inteligencia. De ah que los sistemas son autonoma respecto a su organizacin interna (selforganized systems) se consideran sistemas inteligentes. El sistema inteligente tiene la habilidad de actuar apropiadamente en un entorno con incertidumbre, donde una accin adecuada es la que aumenta la probabilidad del xito, y el xito es la consecucin de los subobjetivos de comportamiento que respaldan el ltimo objetivo del sistema. Concretando la definicin para maquinas y sistemas, se considera inteligente aquella que satisface el test de Turing (hombre y maquina realizan la misma tarea con el mismo resultado). Alan Turing fue un cientfico y matemtico ingles, que estableci las bases tericas de las que serian las computadoras digitales. La Maquina Universal de Turing, un dispositivo consistente en una cinta con smbolos (programa) y un escner de lectura/escritura (el ordenador), poda emular el comportamiento de un ser humano trabajando con papel y lpiz, siguiendo un proceso mecnico o algortmico. La Maquina Universal de Turing puede simular el comportamiento de cualquier otra maquina de procesamiento. Define los lmites de la computabilidad usando ordenadores convencionales. La prueba de Turing, diseada para demostrar si una maquina puede pensar, consiste a grandes rasgos en: 1. Dos personas y una computadora; una de las personas es un interrogador y la otra persona y la computadora son los elementos que van a ser identificados. 2. Cada uno de los elementos del experimento est en un cuarto distinto. 3. La comunicacin entre los elementos es escrita y no se pueden ver. 4. Despus de un cierto nmero de preguntas y respuestas a ambos, si el interrogador no puede identificar cul es la computadora y quin es la persona, entonces podemos decir que la computadora piensa igual que el ser humano en esa tarea.
11
UNIDAD I / FUNDAMENTOS
La mquina sera entonces igual de inteligente que el hombre en ese dominio de conocimiento restringido. Es una definicin ms formal: Mquina inteligente es la que realiza el proceso de analizar, organizar y convertir los datos en conocimiento, donde el conocimiento del sistema es informacin estructurada adquirida y aplicada para reducir la ignorancia o la incertidumbre sobre una tarea especfica a realizar por la mquina inteligente. Por ltimo, como se ha dicho, hay diferentes grados de inteligencia en los sistemas. Algunas de las caractersticas fundamentales para hablar de sistemas inteligentes se deducen de la siguiente definicin operativa de sistema con un nivel de inteligencia: Un sistema inteligente debe ser altamente adaptable a cambios significativos impredecibles, por lo que el aprendizaje es esencial. Debe exhibir un alto grado de autonoma para tratar con los cambios. Debe ser capaz de tratar con complejidad significativa, y esto conduce a ciertos tipos de arquitecturas funcionales como las jerrquicas. En definitiva, sistema inteligente es un procedimiento computacionalmente eficiente de dirigir un sistema complejo a un objetivo, con una representacin incompleta o inadecuada y/o bajo unas especificaciones imprecisas de cmo hacerlo; es decir, que acta apropiadamente en un entorno con incertidumbre.
mentales a travs del uso de modelos computacionales. Este trmino data de los aos 50 del siglo XX y se debe a un grupo de cientficos que estudiaron el cerebro humano como modelo natural, integrando la ciberntica y las computadoras (McCarthy, Minsky, Newell, Simon).
12
UNIDAD I / FUNDAMENTOS
En palabras de uno de ellos, Marvin minsky, la Inteligencia Artificial es el estudio de cmo programar computadoras que posean la facultad de hacer aquello que la mente humana puede realizar, o en sentido amplio: la Inteligencia Artificial es una ciencia orientada al diseo y construccin de maquinas que implementen tareas propias de humanos dotados de inteligencia. Caracterizar los sistemas inteligentes incluye las tareas de: a) Reconocerlos y distinguirlos de los sistemas convencionales. b) Clarificar el papel de la inteligencia en estos sistemas. c) Identificar los problemas para los cuales la Inteligencia Artificial es la nica o la mejor solucin. Una mquina inteligente debe hacer las cosas que nosotros queremos que haga, que nosotros haramos, pero quizs no como nosotros las hacemos. Una aproximacin practica y realista a la IA es conseguir que estas tcnicas realicen de forma eficiente una serie de tareas que nos faciliten nuestro trabajo, quizs en menos tiempo, con menos datos, aunque no pasaran el test de Turing. En cualquier caso, se trata de que las soluciones que aporta la IA sean mejores que otras para esas tareas determinadas. Segn el filsofo Searle, una computadora puede simular algo que en el hombre se da de otra manera. Un hombre capta la esencia de una cosa, mientras que en una computadora se pueden simular procesos epistemolgicos en base a la forma accidental. En lugar de confiar en las habilidades del programador, un verdadero programa inteligente aprender de su experiencia por generalizacin y abstraccin, emulando la mente humana, especialmente en su habilidad para razonar y aprender en un ambiente de incertidumbre, imprecisin, con informacin incompleta o errnea, etc., caractersticas propias del mundo real, tanto de los sistemas como del lenguaje natural. De esta forma, es capaz de modelar y controlar una amplia variedad de sistemas complejos, construyndose en una herramienta efectiva para tratar con problemas hasta ahora no abordados por su complejidad o por la naturaleza de su informacin. As se utiliza en general para la toma de decisiones en ambientes con incertidumbre, para el razonamiento aproximado, la clasificacin y comprensin de seales, el reconocimiento de patrones entre oras utilidades. Sus aplicaciones estn relacionadas, entre otros mbitos, con el comercio, las finanzas, la medicina, la robtica o la automatizacin.
13
UNIDAD I / FUNDAMENTOS
Estrategias de la IA
En el horizonte de los descubrimientos relacionados con la informtica surgen no solo ideas nuevas para mejorar las tcnicas existentes, sino tambin paradigmas radicalmente diferentes de las actuales estrategias. Uno de ellos, actualmente muy extendido en el mbito de la investigacin computacional, es la Computacin Suave o Soft Computing, en su idioma nativo. Su objetivo es implementar la inteligencia Artificial en las mquinas. Los avances en el campo de la computacin, la electrnica, sensores, procesamiento de seales, representacin de la informacin, etc., proporcionan nuevas herramientas para el desarrollo de sistemas inteligentes. Al ser la IA un rea multidisciplinar, dinmica y amplia, se sirve de distintas tcnicas para conseguir sus objetivos. En particular, la Inteligencia Artificial puede hacer efectivo del uso de: nuevas tcnicas y entornos avanzados de programacin; tcnicas para tratar la heurstica; nuevos sistemas hardware.
Las metodologas de la Inteligencia Artificial incluyen, por ejemplo, la lgica borrosa, sistemas expertos, aprendizaje, sistemas de planificacin, algoritmos de bsqueda sistemas hbridos, diagnostico de fallos y reconfiguracin, autmatas, redes de Petri, redes neuronales, computacin evolutiva, etc. No obstante, conviene aclarar que las tcnicas asociadas a la IA tienen un desarrollo y una fundamentacin independiente. Cada una de ellas contribuya con una metodologa distintiva para tratar problemas en su dominio de aplicacin. Sin embargo, de una forma complementaria y sinrgica en lugar de competitiva-, se combinan algunas de ellas componiendo los denominados sistemas inteligentes hbridos, que combinan dos o mas de estas tcnicas para su aplicacin a sistemas especficos que por su complejidad requieren un acercamiento desde distintos enfoques. As se habla de los sistemas neurocombinacin con la lgica biolgica borrosa, o los neuro-borrosos-genticos, etc. Particular importancia tienen dentro de esta sinergia entre diversas metodologas de computacin la unin de tcnicas denominadas clsicas o convencionales con las que genticos, donde una estrategia de la computacin evolutiva, los Algoritmos Genticos, se aplican en la
14
UNIDAD I / FUNDAMENTOS
provienen de la IA. Adems de complementarse de forma evidente y extender las potencialidades de los mtodos hasta ahora aplicados con profusin durante dcadas en entornos como la robtica, el control industrial, etc., su incursin en el mercado y la industria se ve favorecida porque en muchos casos su apariencia y su utilizacin mantienen las principales caractersticas de los sistemas con los que hasta ahora los operadores de distintos mbitos estas acostumbrados a trabajar. Cada una de estas metodologas se centra en un aspecto o una funcionalidad
inteligente de los seres vivos. As, las redes Neuronales actan como una metfora del cerebro, con una estructura similar a las conexiones que se establecen entre las sinapsis de ste, y que tienen como propiedades inherentes el aprendizaje y la adaptacin; la lgica Fuzzy permite tratar con la imprecisin propia del lenguaje, e implementa el razonamiento aproximada la computacin con palabras; los sistemas basados en reglas, que suponen en muchos mbitos una gran ayuda a la toma de decisin y al diagnostico; la computacin Gentica como mtodo eficiente de optimizacin y bsqueda aleatoria sistematizada; el Razonamiento Probabilstico, para el anlisis de decisiones y el manejo de la informacin estocstica, etc. Algunas de ellas se resumen en la siguiente tabla. Hoy da, la mayora de estos mtodos de la IA estn bien delimitados y gran parte de ellos han sido aplicados con xito en diversos mbitos.
En 1962 Carl Adam Petri public su tesis doctoral en la que por primera vez se formulaba una teora general para sistemas discretos paralelos. Las redes de Petri son una generalizacin de la teora de autmatas, y Redes de Petri eventos. Un modelo de red de Petri formula las propiedades de un sistema en el lenguaje de la lgica aunque tambin utiliza la representacin algebraica. Campo pionero de la IA. Un sistema experto (SE) es bsicamente un conjunto de programas informticos que aplica el proceso del Sistemas Expertos razonamiento humano al conocimiento de un experto en la solucin de tipos especficos de problemas. Son sistemas basados en reglas de produccin u otros procesos de razonamiento. Algunas de sus caractersticas son: la heurstica, el tratamiento simblico, la toma de decisiones, la memoria, la prediccin y la inferencia.
15
UNIDAD I / FUNDAMENTOS
La lgica Fuzzy o borrosa, una forma matemtica de representar la imprecisin inherente al lenguaje natural, introducida por Lofti A. Zadeh en 1965. Es una generalizacin de la lgica clsica: las variables toman Lgica Fuzzy valores lingsticos de verdad. La pertenencia a los conjuntos borrosos es gradual. Implementa la forma de razonar propia del sentido comn. En la dcada de los 80 se empez a considerar este paradigma computacional conexionista cuya estructura emula el proceso biolgico del aprendizaje humano. Son sistemas compuestos por muchos Redes Neuronales elementos de procesamiento (neuronas) que operan en paralelo, cuya funcin es determinada por la estructura de la red, las conexiones y el procesamiento local realizado por los elementos computacionales o nodos. Las redes neuronales pueden aprender de datos de entrenamiento, y en realidad son aproximaciones de funciones matemticas. Inspirada en el mundo biolgico, desarrolla programas usando analogas con procesos biolgicos tales como la evolucin y la seleccin natural. Se aplica satisfactoriamente, sobre todo, a problemas de optimizacin, Computacin Evolutiva programacin automtica y aprendizaje de mquinas. Dentro de ella se encuentran los Algoritmos Genticos y el sistema computacional inmunizado, basado en la operacin de un sistema biolgico inmune. Un algoritmo Gentico (AG) es esencialmente un procedimiento de bsqueda y optimizacin modelado segn los mecanismos genticos de seleccin natural de los seres vivos. Surgieron del estudio de los autmatas celulares llevado a cabo por Holland en 1975. Su funcionamiento bsico es evolucionar a partir de una poblacin que representa las soluciones candidatas (individuos) para un determinado Algoritmos Genticos problema, intentando producir nuevas generaciones de soluciones mejores que las anteriores, evaluadas por una funcin de ajuste. Se utilizan en problemas complejos de optimizacin por su paralelismo implcito y su habilidad para mantener mltiples soluciones concurrentemente. Aplica los principios evolutivos de los AG para hacer evolucionar
16
UNIDAD I / FUNDAMENTOS
programas Programacin Gentica informticos. La programacin gentica conduce al
predominio de los programas ms aptos para la solucin de un problema dado. Ahora en la Poblacin los individuos son programas. Cada nueva generacin se obtiene por la reproduccin de los programas que funcionan mejor, con un pequeo factor de mutaciones aleatorias. Es un conjunto de tcnicas utilizadas para examinar y determinar relaciones altamente complejas entre datos que han sido inicialmente clasificados al azar. Una caracterstica de este tipo de datos es que una pequea variacin en las condiciones iniciales puede dar lugar a cambios drsticos en los resultados muy rpidamente. El supuesto fundamental de la teora del caos es que la unidad individual no importa; lo que importa son las simetras recursivas entre los diferentes niveles del sistema.
La IA sigue siendo un campo abierto a la investigacin, y junto con continuas mejoras y modificaciones que esta experimentando, todava estn por desarrollarse nuevas implementaciones computacionales de facetas de la inteligencia humana.
17
UNIDAD I / FUNDAMENTOS
Lingstica Ciencias de la computacin
Las principales contribuciones de esta ciencia al desarrollo de la IA son las siguientes. La filosofa cuenta con ms de 2000 a os de tradicin, a lo largo de los cuales han surgido diversas teoras sobre el razonamiento (lgica) y el aprendizaje (la didctica). Junto con el mundo de las ideas de Platn, el mundo del cerebro se reduca en muchos casos a un simple sistema fsico que los trepanadores (ya en el antiguo Egipto) acostumbraban a estudiar buscando la fuente del pensamiento. Los filsofos (desde el ao 400 a.C.) intuyeron la inteligencia artificial al concebir la mente como una maquina que funcionaba a partir de un conocimiento codificado en un lenguaje interno, y al considerar que el pensamiento serva para determinar cual era la accin correcta que haba que emprender. Simultneamente, durante ms de 400 aos se cultivaron las matemticas unidas a la lgica, de donde surgieron teoras formales relacionadas con el habla, la probabilidad, la teora de decisiones e incluso la computacin. Las matemticas proveyeron de las herramientas necesarias para manipular tanto las aseveraciones de certeza lgica como la incertidumbre de tipo probabilstica. Asimismo prepararon el terreno para la implementacin del razonamiento mediante algoritmos. La psicologa ofrece herramientas que permiten la investigacin de la mente humana as como un lenguaje cientfico para expresar las teoras que se van proponiendo. Los psiclogos reforzaron la idea de que los humanos y otros animales podan ser considerados como mquinas para el procesamiento de informacin. La lingstica ofrece teoras sobre la estructura (sintaxis) y significado (semntica) del lenguaje. Los lingistas demostraron que el uso de un lenguaje es necesario dentro de la implementacin de la IA para representar y manejar el conocimiento. Por ultimo, la ciencia de la computacin es la que ha permitido que la Inteligencia Artificial sea una realidad. Aporto las herramientas de clculo necesarias para que la idea de IA fuera una metodologa aplicada. Adems, los programas de inteligencia artificial por lo general son extensos y su ejecucin no seria factible sin los grandes avances de tiempo de procesamiento, capacidad de memoria, potencia de clculo, etc., que facilitan las computadoras actuales. El concepto de la IA, aunque parte de una concepcin abstracta, es
18
UNIDAD I / FUNDAMENTOS
realmente una realizacin fsica de hardware y software que tiene un comportamiento inteligente, dentro del rea de la ciencia de la computacin.
Hitos de la evolucin de la IA
La idea de desarrollar mquinas autnomas no es nueva. En el siglo XVII, el filosofo John Locke ya se preguntaba si las mquinas podan saber. En la literatura cientfica encontramos tres desarrollos que han servido de base a la formalizacin de la Inteligencia Artificial: En el siglo XVII, el tambin filosofo Gottfriend Leibniz propuso construir una mquina capaz de llevar a cabo cualquier proceso de razonamiento por el que se le preguntara. En el siglo XIX, Charles Babbage, cuyo ingenio analtico era capaz de realizar operaciones algebraicas, pens que se poda implementar un sistema formal en el cual toda la pluralidad de los fenmenos fsicos pudiera ser adecuadamente descrita. Ya en siglo XX, en 1936, Alan Turing diseo una mquina que pensara y
realizara tareas en un dominio especfico de forma equiparable a los hombres. Aunque entonces nadie supusiera viable el objetivo comn de estos tres proyectos, su relacin es hoy da evidente, y se han visto hechos realidad en los sistemas expertos y las calculadoras automticas. Junto con ellos, a Boole le debemos el inicio del lenguaje simblico a mediados del siglo XIX. Pero no es hasta los aos 50 y a principios de los 60 del siglo XX cuando se logra realizar un sistema inteligente que tuvo cierto xito, el Perceptrn de Rossenblatt (1962). Era un nivel visual de reconocimiento de patrones en el cual se aunaron refuerzos para que se pudieran resolver una gama amplia de problemas. Auque estas estrategias se diluyeron enseguida, sin embargo, ha quedado como una aportacin relevante, fundamento de las redes neuronales. Sus antecedentes haban sido los trabajos de McCulloch y Pitts (1943), que propusieron modelos basados en la analoga neuronal del cerebro.
19
UNIDAD I / FUNDAMENTOS
Poco despus, Alan Newell y Herbert Simon (1963), trabajando sobre la demostracin de teoremas y aplicacin de la lgica para el problema del ajedrez por ordenador, logran crear un programa llamado GPS (General Problem Solver; solucionador general de problemas). El GPS era un sistema en el que el usuario defina en torno a funcin de una serie de objetos y los operadores que se podan aplicar sobre ellos. Este programa era capaz de trabajar con las torres de Hanoi, as como con criptoaritmtica y otros problemas similares, operando, clara est, con microcosmos formalizados que representaban los parmetros dentro de los cuales se podan resolver problemas. Lo que no poda hacer el GPS era resolver problemas ni del mundo real, ni mdicos, ni tomar decisiones importantes. El GPS manejaba reglas heursticas (aprender a partir de sus propios descubrimientos) que le conducan hasta el objetivo final mediante el mtodo del ensayo error. En torno a los aos 70, un equipo de investigadores dirigido por Edward Feigenbaum comenz a elaborar un proyecto para resolver problemas de la vida cotidiana o que se centrara, al menos, en problemas dentro de dominios ms concretos. As nacieron los sistemas expertos El primer sistema experto (SE), Mycin, capaz de diagnosticar trastornos en la sangre y recetar la correspondiente medicacin. Todo un logro en aquella poca. En la siguiente dcada, los 80, se desarrollaron lenguajes ms apropiados para desarrollar las metodologas de la Inteligencia Artificial, tales como el LISP o el PROLOG. Es en esta poca cuando se desarrollan sistemas expertos ms refinados, como por ejemplo, el EURISKO: este programa perfecciona su propia base de reglas heursticas, es decir, su conocimiento, de forma automtica, por induccin. El origen inmediato del concepto y de los criterios de desarrollo de la IA, como ya se ha comentado, se remota a la intuicin del genio matemtico ingls Alan Turing y el apelativo Inteligencia Artificial se debe a McCarthy, uno de los integrantes del grupo del Grupo de Darmouth, que en el verano de 1956 se reuni en el Darmouth Collage, en los Estados Unidos, para discutir la posibilidad de construir mquinas inteligentes. Los principales integrantes del grupo eran: John McCarthy: quien bautiz a esta nueva rea de conocimiento y estudiaba sistemas capaces de efectuar razonamientos de sentido comn. Marvin Minsky: fundador del laboratorio de la IA del MIT. Trabajaba sobre razonamientos analgicos de geometra. Claude Shannon: de los laboratorios Bell de EE.UU.
20
UNIDAD I / FUNDAMENTOS
Nathaniel Rochester: de IBM. Allen Newell: primer presidente de la AAAI (Asociacin Americana de Inteligencia Artificial). Herbert Simon: Premio Novel de Carnegie-Mellon University.
Tambin se puede descartar la importante intervencin de Arthur Samuel, que haba escrito un programa de juego de damas capaz de aprender de su propia experiencia; y a Selfridge, que estudiaba el reconocimiento visual por computadora. A partir de este grupo inicial se formaron dos grandes escuelas de Inteligencia Artificial (IA): por un lado, Newell y Simon lideraron el equipo de la universidad de CarnegieMellon, proponindose desarrollar modelos de comportamiento humano con aparatos cuya estructura se pareciese lo ms posible a la del cerebro. Esta teora deriv posteriormente en el llamado paradigma conexionista y consecuentemente en los trabajos sobre redes neuronales artificiales. McCarthy y Minsky formaron otro equipo en el Instituto Tecnolgico de Massachusett (MIT), centrndose en que los productos del procesamiento tuvieran el carcter de inteligente, sin preocuparse de que el funcionamiento o la estructura de los componentes fueran parecidas a los del ser humano. Ambos enfoques se adecuan a los mismos objetivos prioritarios de la IA: por un lado entender la inteligencia natural humana, y por otro usar mquinas inteligentes para adquirir conocimientos y resolver problemas considerados como intelectualmente difciles. La historia de IA ha sido testigo de ciclos de xito, de justificado e injustificado optimismo con la consecuente desaparicin de entusiasmo y apoyos financieros. Tambin ha habido periodos caracterizados por la introduccin de nuevos y creativos enfoques y de un sistemtico perfeccionamiento de las mejores estrategias que han contribuido significativamente al desarrollo de la ciencia.
Desarrollos histricos de la IA
Terminamos este apartado de revisin histrica con dos de las propuestas ms extendidas, desarrolladas por estudios del tema: Jackson (1989) y la perspectiva de Russell
21
UNIDAD I / FUNDAMENTOS
y Norving, tomada de su libro cuyo original data de 1995. Las referencias especficas se encuentran en esos dos textos.
Desarrollo Histrico segn Jackson 1950-1965 PERIODO CLSICO Gestacin [McCulloch y Pitts, Shannon, Turing] Inicio Darmouth Collage, 1956 [Minsky, McCarthy] Redes neuronales, robtica (Shakey) Bsqueda en un espacio de estados, heurstica, LISP Resolvedor general de problemas (GPS) [Newell, Simon] Juegos, prueba de teoremas Limitaciones como consecuencia de la dedicacin a la bsqueda pura, explosin combinatoria 1965-1975 PERIODO ROMNTICO Representacin general del conocimiento Redes semnticas [Quilian] Prototipos (frames) [Minsky] Perceptrn [Minsky y Papert] Lgica [Kowalski] Mundo de bloques (SHDRLU) [Winograd] Compresin de lenguaje, visin, robtica Dificultades de representacin general, problemas juguete
22
UNIDAD I / FUNDAMENTOS
1975-HOY PERIODO MODERNO Inteligencia especfica vs. general Representacin explicita del conocimiento especfico del dominio Sistemas expertos o basados en conocimientos Regreso de redes neuronales [Hopfield, Rumelhart, Hinton], algoritmos genticos [Holand, Goldberg], reconocimiento de voz (HMM), incertidumbre (RB, Lgica difusa), planificacin, aprendizaje. Aplicaciones reales (medicina, finanzas, ingeniera, exploracin, etc.) Limitaciones: conocimiento superficial
Desarrollo Histrico segn Russell y Norving 1943-1956 GESTACIN McCulloch y Pitts (43), Hebb (49), Shannon (50) Turing (53), Minsky y Edmonds (51). Darmouth Collage (56), McCarthy, Newell y Simon The Logic Theorist 1952-1969 GRANDES EXPECTATIVAS Samuel Checkers (52), McCarthy (58); Planificacin Temporal, Programas con sentido comn. Minsky y McCarthy en MIT moldearon mucho del rea. (63) McCarthy se fue a Standford SRI, Shakey, etc. Minsky, Evans, Student, Waltz, Winston, Winograd. Trabajo en RN: Hebb, Widrow, Rosenblatt 1966-1976 DOSIS DE REALIDAD Simon predeca que en 10 aos se tendra una mquina inteligente.
23
UNIDAD I / FUNDAMENTOS
Predicciones similares en traduccin automtica y ajedrez. Teora de NP-completitud. Experimentos en machine evolucin (ahora algoritmos genticos) (Friedberg, 58). Minsky y Papert: Perceptrones (69); el mismo ao se descubri el backpropagatin (Bryson y Ho) 1969-1979 SISTEMAS BASADOS EN CONOCIMIENTO Dendral, Mycin, HPP, Prospector, Winograd SHDRLU, Shank (no hay sintaxis), frames, Prolog, Planner IA como industria (1980-1988):R1/XCOM, proyecto de la quinta generacin, shells y mquinas de Lisp 1986-HOY 1987-HOY VUELTA A LAS REDES NEURONALES Hopfield, Rumelhart y Hinton y descenso de los Sistemas Expertos LOGROS RECIENTES Cambio gradual hacia reas aplicadas (cierto grado de madurez y estabilidad); reconocimiento de voz (HMM), incertidumbre (Bayes), planificacin (Tweak), robtica, aprendizaje, etc.
Futuro de la IA
La ciencia de la Inteligencia Artificial tiene su formalizacin en 1958, en la Conferencia de Dartmouth. Durante estos aos ha habido dcadas de un avance decidido hacia la implementacin de inteligencia prctica en las mquinas. Los campos de reconocimiento de voz, lenguaje natural, reconocimiento de caracteres, etc., han sido campos en los que se especializ la IA y de su mano vio un gran avance. Sin embargo, algunos de estos xitos no tuvieron la continuidad esperada, y se sucedieron temporadas en las que las expectativas creadas en torno a las mquinas inteligentes dejaron paso a una desilusin que hicieron ms lento el desarrollo de las contribuciones prcticas de esta ciencia. Efectivamente, hay una serie de tareas fciles para
24
UNIDAD I / FUNDAMENTOS
los seres humanos que son an impensables para un mquina inteligente, pero esto no es bice para admitir que se han realizado interesantes progresos en la lnea de incorporar conocimiento, razonamiento y aprendizaje a los sistemas computacionales. Las faces de Desarrollo de IA se han ido sucediendo al paso de la evolucin de las computadoras. En los primeros aos la mayora los problemas abordados por la IA eran problemas estructurados y con sus lmites muy bien definidos, por ejemplo, juegos (ajedrez), pruebas de teoremas, etc. En esta fase el nfasis se centr sobre todo en crear mquinas que pudieran pensar, capaces de resolver una amplia clase de problemas, que incluan fundamentalmente razonamientos sofisticados y muchas veces artificiosos, y tcnicas de bsqueda. Una segunda fase comenz de la mano del xito de la IA para aplicaciones de reconocimiento, que exigan un dominio muy restringido y delimitado. Generalmente les acompaaba una gran cantidad de conocimiento respecto al problema a resolver. Esta aproximacin de aadir conocimiento de un dominio especfico a un mtodo en cierto modo general de resolucin condujo al desarrollo de los sistemas basados en reglas, una de las tcnicas pioneras de la IA que alcanz gran resonancia por sus xitos en mbitos muy diversos: diagnstico mdico, anlisis qumico, configuracin de computadoras, etc. A su difusin contribuy la comercializacin de muchos de ellos. A la vez las potentes estaciones de trabajo permitan trabajar con lenguajes y aplicaciones como Lisp, Prolog, etc., que facilitaban la realizacin procedural de estas tcnicas de la IA. Desde finales de los aos 80, la comunidad de la IA se ha planteado retos de mayor envergadura: razonamiento de sentido comn, traduccin e interpretacin del lenguaje natural, visin por computador, automatizacin y control de procesos complejos, etc. Desde entonces, distintas ramas de la IA han ido alternando en popularidad: la aproximacin conexionista, representada por las redes neuronales; la computacin biolgica, con algoritmos evolutivos como tcnicas de bsqueda; la lgica borrosa, en un intento de dotar de sentido comn a las mquinas, etc. Recientemente, el crecimiento de Internet y de la computacin distribuida en general ha abierto nuevos campos de aplicacin a la IA.
25
UNIDAD I / FUNDAMENTOS
1.2
Introduccin
Hablar de actividades cognitivas, aunque sea brevemente, nos permite al mbito de las aptitudes e implica, en primer lugar, introducirnos en el estudio del pensamiento, como proceso o sistemas de procesos complejos que abarcan desde la captacin de estmulos, hasta su almacenaje en memoria y su posterior utilizacin, en su evolucin y su relacin con el lenguaje; abordar el estudio de la inteligencia y su evolucin, como herramienta bsica del pensamiento; y profundizar en el estudio del aprendizaje, como cambio relativamente estable del comportamiento producido por la experiencia. Para, en segundo lugar, con mayor profusin y especificidad, pasar al estudio del binomio cognicin-metacognicin y su relacin con aquellas variables que ms le afectan, como es el caso de las afectivas, tales como: la motivacin, el autoconcepto, la autoestima, la autoeficacia, la ansiedad, etc. De manera que los trminos aprender a pensar, aprender a aprender y pensar para aprender, cada vez nos sean menos ajenos. As pues, aqu nos podemos hacer una revisin de los principales conceptos y teoras, formas de evaluacin e intervencin ofrecidos en este mbito; aunque, como es obvio, de forma sucinta.
Conceptos y teoras
Actualmente estamos sumergidos en la era de la revolucin tecnolgica y, por ello, el nmero de conocimientos culturales y tcnicos, de teoras y habilidades, de modelos y estrategias, etc., aumentan de modo exponencial; siendo por lo que la educacin se enfrenta al gran reto de transmitirlos relacionando a la vez lo terico con la vida real, problema cada vez ms difcil de solucionar. Adems, curiosa y paradjicamente, hallndonos de pleno en la era de la comunicacin social, nos encontramos con los niveles ms altos, histricamente, hablando, de incomunicacin personal; lo que agrava sobremanera esta problemtica. La verdad es que, en general, nuestros alumnos dedican muy poco tiempo al trabajo autnomo, especialmente a las consultas, y su actividad se reduce casi exclusivamente, en
26
UNIDAD I / FUNDAMENTOS
la mayor parte de los casos, a escuchar (no or siquiera)m al profesor, empleando como nica habilidad cognitiva, tomar notas y memorizar los apuntes para los exmenes; lo cual denota inters por las clases de tipo explosivo, una alta orientacin en sus actividades de trabajo y un procesamiento pasivo de la informacin. Por otra parte, no slo se trata de una cuestin de ndole prctica, sino que es una imposicin de la perspectiva cognitiva frente a la conductista, interesada por el procesamiento de la informacin y su almacenamiento en memoria, destacando cmo los resultados del aprendizaje no dependen exclusivamente del modo en que el profesor presenta la informacin; sino, adems, del modo en que el alumno lo procesa, la interioriza y la guarda (Weinstein y Mayer, 1986). En la investigacin especializada sobre habilidades y estrategias pueden recogerse multitud de definiciones al respecto; no obstante, es factible detectar un nico ncleo de significado, aunque con algunas diferencias en los niveles denotativos de los trminos empleados; en otras palabras, el nivel de generalidad concedido al concepto de habilidad o estrategia vara segn el tipo de definicin formulada. Por ello, se recogen aqu dos grupos claramente diferenciados y delimitados de definiciones: sintticas y analticas. a) Sintticas En este caso, las habilidades o estrategias se presentan en un sentido general, aunque asignndoles un papel concreto, siendo fcil detectar tanto macrohabilidades o macroestrategias, habilidades ejecutivas, etc., como microhabilidades o microestrategias, habilidades no ejecutivas, etc. Las habilidades cognitivas son entendidas como operaciones y procedimientos que puede usar el estudiante para adquirir, retener y recuperar diferentes tipos de conocimientos y ejecucin suponen del estudiante capacidades de representacin (lectura, imgenes, habla, escritura y dibujo),capacidades de seleccin (atencin e intencin) y capacidades de autodireccin (autoprogramacin y autocontrol)(Rigney, 1978:165). ONeil y Spielberger (1979), a diferencia de Rigney, prefieren utilizar el trmino estrategias de aprendizaje, pues en l incluyen las estrategias de tipo afectivo y motor, as como las estrategias propiamente cognitivas; aunque de hecho reconocen tres caractersticas bsicas de este dominio: la gran diversidad terminolgica, el limitado acuerdo existente respecto a sus conceptos fundamentales y el estado de arte en el que se encuentra.
27
UNIDAD I / FUNDAMENTOS
Sin embargo, ello no impide que puedan establecerse algunas distinciones; por ejemplo, respecto a un tema muy prximo conceptualmente, tal como el de los estilos cognitivos. Perkins (1985), comentando el problema de la generalidad o especificidad de las habilidades cognitivas, seala una posible distincin entre estilos cognitivos y estrategias; los primeros estn ms ntimamente ligados a la conducta general de la persona, a su modo de pensar, de percibir, etc. (dependencia/independencia de campo; reflexividad/impulsividad, etc.), mientras las segundas son conductas ms especficas aplicadas en un momento determinado de un proceso (como, repasar un texto que se acaba de leer). Derry y Murphy formularon en 1986 un planteamiento de diseo de sistemas de instruccin para mejorar la habilidad e aprender, utilizando como gua la teora de Gagn, la de Sternberg y la teora metacognitiva. El anlisis de estas teoras les llev a la conclusin de que la mejora de la habilidad para aprender necesita el desarrollo no slo de habilidades de aprendizaje especficas, sino tambin de un mecanismo de control ejecutivo que acceda a las habilidades de aprendizaje especficas, sino tambin de un mecanismo de control ejecutivo que acceda a las habilidades de aprendizaje y las combine cuando sean necesarias; planteando diversas posibilidades en cuanto al diseo curricular para estas estrategias: independiente (detached)(Weinstein, McCombs, Dansereau), incluido en el curriculum normal (embedded)(Johns), o una solucin de compromiso entre ambas (incidental learning model)(Derry). Auque, advierten que cualesquiera de las posibilidades debe considerar que esas habilidades, sobre todo las de control ejecutivo, son difciles de entrenar, sesarrollndose y automatizndose lentamente. Por ello, sus investigaciones representan una integracin de las diversas taxonomas existentes, incorporando estrategias de: memoria, lectura y estudio, solucin de problemas y afectivas. McCormick et al. (1989) abordan la cuestin de las habilidades cognitivas en el marco del aprendizaje en una lnea actual de transicin de los contextos de laboratorio a las situaciones acadmicas de la vida real. En este mbito han tenido lugar dos avances importantes: 1. El desarrollo de modelos complejos de pensamiento calificable como competente; lo cual ha permitido identificar con mayor precisin las habilidades y estrategias ms importantes. 2. La elaboracin de diseos de instrumentacin que promueven una actuacin competente, evaluando el valor y efectividad de la instruccin en contextos naturales.
28
UNIDAD I / FUNDAMENTOS
En relacin al primer apartado los autores sealan tres modelos representativos del enfoque de procesamiento de la informacin: el modelo de resolucin de problemas de Baron, el modelo de componentes de Sternberg y el del buen utilizador de estrategias de Pressley et al. Y, en relacin al segundo apartado, destacan: el modelo de Pressley, que manifiesta la necesidad de sealar todos los componentes del uso correcto de estrategias (estrategias, metacognicin, motivacin y conocimiento), el modelo de la universidad de Kansas, focalizado en la educacin especial, pero con aplicaciones ms generales (estrategias de memoria y compresin, incluyendo el parafrasear, formularse preguntas, mnemotcnicos, imaginacin visual, control de errores, etc.), y el modelo de entrenamiento en habilidades de solucin de problemas aritmticos de Derry et al., que incluye una enseanza de la planificacin en la resolucin de problemas. De la autocomprobacin y del autocontrol. b) Analticas. En este caso, las habilidades no son simples conglomerados de reglas o hbitos, sino que se trata de habilidades de alto orden que controlan y regulan las habilidades ms especficamente referidas a las tareas o ms prcticas (Nisbet y Shucksmith, 1987:21). Resnick y Beck (1976) distinguen entre actividades de tipo amplio, utilizadas para razonar y pensar (habilidades generales), y habilidades especficas, dedicadas a realizar una tarea una tarea concreta (habilidades mediacionales). En un sentido ms preciso, Sternberg (1983) diferencia entre habilidades ejecutivas (tiles para planificar, controlar y revisar las estrategias empleadas en la ejecucin de una tarea, como identificar un problema) y habilidades no ejecutivas (utilizadas en la realizacin concreta de una tarea, como comparar). En nuestro caso, preferimos hablar de estrategias cognitivas y metacognitivas, que podramos resumir de la siguiente forma: I. Habilidades cognitivas.
Son las facilitadoras del conocimiento, aquellas que operan directamente sobre la informacin: recogiendo, analizando, comprendiendo, procesando y guardando informacin en la memoria, para, posteriormente, poder recuperarla y utilizarla dnde, cundo y cmo convenga. En general, son las siguientes: 1. Atencin: Exploracin, fragmentacin, seleccin y contradistractoras.
29
UNIDAD I / FUNDAMENTOS
2. Comprensin (tcnicas o habilidades de trabajo intelectual): Captacin de ideas, subrayado, traduccin a lenguaje propio y resumen, grficos, redes, esquemas y mapas conceptuales. A travs del manejo del lenguaje oral y escrito (velocidad, exactitud, comprensin). 3. Elaboracin: Preguntas, metforas, analogas, organizadores, apuntes y mnemotecnias. 4. Memorizacin/Recuperacin (tcnicas o habilidades de estudio): Codificacin y generacin de respuestas. Como ejemplo clsico y bsico, el mtodo 3R: Leer, recitar y revisar (read, recite, review). II. Habilidades metacognitivas.
Son las facilitadoras de la cantidad y calidad de conocimiento que se tiene (productos), su control, su direccin y su aplicacin a la resolucin de problemas, tareas, etc. (procesos). 1. Conocimiento del conocimiento: de la persona, de la tarea y de la estrategia. 2. Control de los procesos cognitivos: 2.1. Planificacin: Diseo de los pasos a dar. 2.2. Autorregulacin: Seguir cada paso planificado. 2.3. Evaluacin: Valorar cada paso individualmente y en conjunto. 2.4. Reorganizacin (feedhack): Modificar pasos errneos hasta lograr los objetivos. 2.5. Anticipacin (forward): Avanzar o adelantarse a nuevos aprendizajes. Las habilidades cognitivas aluden directamente a las distintas capacidades intelectuales que resultan de la disposicin o capacidad que demuestran los individuos al hacer algo. Estas habilidades son, como indican Hartman y Sternberg (1993), los obreros (workers) del conocimiento. Pueden ser numerosas, variadas y de gran utilidad, a la hora de trabajar en las distintas reas de conocimientos y cuya actividad especfica se ve afectada por multitud de factores que dependen de la materia, de la tarea, de las actitudes y de las variables del contexto donde tienen lugar. Precisamente, la actuacin estratgica se refiere a
30
UNIDAD I / FUNDAMENTOS
la seleccin, organizacin y disposicin de las habilidades que caracterizan el sistema cognitivo del individuo. Por ejemplo, Weinstein y Mayer (1986) las estructuran en tres apartados: 1) Estrategias de repeticin, ensayo o recitacin, cuyo objetivo es influir en la atencin y en el proceso de codificacin en la memoria de trabajo (a corto plazo), facilitando un nivel de comprensin superficial. 2) Estrategias de elaboracin, que pretenden una comprensin ms profunda de los contenidos de los aprendizajes, posibilitando la conexin entre la nueva informacin y la previa, ayudando a su almacenamiento en la memoria a largo plazo, para conseguir aprendizajes significativos. 3) Estrategias de organizacin, que permiten seleccionar la informacin adecuada y la construccin de conexiones entre los elementos de la informacin que va a ser aprendida, lo que fomenta el anlisis, la sntesis, la inferencia y la anticipacin ante las nuevas informaciones por adquirir. Las estrategias metacognitivas hacen referencia, por una parte, a la consciencia y conocimiento del estudiante de sus propios procesos cognitivos, conocimiento del conocimiento, y, por otra, a la capacidad de control de estos procesos, organizndolos, dirigendolos y modificndolos, para lograr las metas del aprendizaje (Flavell, 1976, 1977; Flavell y Wellman, 1977). En general, supondran aprender a reflexionar, estando integradas por variables de la persona, la tarea y las estrategias. Las variables de la persona estaran formadas por nuestros conocimientos y creencias acerca de cmo somos y cmo son los dems, como procesadores cognitivos, estando directamente relacionadas con los componentes cognitivos de la motivacin (percepcin de autoeficacia, creencias de control, expectativas de rendimiento, etc.). Markman (1973, 1975), por ejemplo, observ que los nios pequeos no son capaces de predecir su comportamiento en la mayora de las tareas cognitivas y que tienen dificultades para identificar contradicciones e incoherencias presentes en una historia. Asimismo, Pramling (1983) confirm que los nios del segundo ciclo de Educacin Infantil relacionaban el aprendizaje con hacer cosas o crecer, pero nunca con algo que tuviera relacin con el conocimiento o que el aprendizaje proviniera de la experiencia. Las variables de la tarea incluyen la consciencia acerca de sus demandas: magnitud, grado de dificultad, estructura, si es conocida o no, esfuerzo que requiere, etc.; adquirindose tambin de forma progresiva la comprensin de su influencia. Hay estudios experimentales que confirman el grado de dificultad que entraa reconocer ciertos aspectos asociados a las demandas de las tareas, de manera que los aspectos que implican mayor
31
UNIDAD I / FUNDAMENTOS
dificultad o complejidad se aprenden despus que los ms fciles o simples (Moynahan, 1973; Kreutzer, 1975). En este mismo sentido, Miller (1985) analiz los factores que, segn los nios, influyen en la atencin que prestan a las tareas escolares cuando las hacen en casa yen la escuela, llegando a la conclusin de que, para los de 5 a 8, los factores ms importantes eran estar callados (no hacer ruido) y centrados en lo que explica el maestro (inters por la tarea), no moverse de su sitio y observar lo que hace el profesor (aspectos extrnsecos a la tarea de aprender). Sin embargo, los nios mayores, atribuyen la falta de atencin a factores que suelen tener un carcter ms psicolgico, la falta de motivacin, la dificultad de la tarea o el hecho de desviar el inters hacia otras cosas ajenas a la escuela (aspectos intrnsecos de la tarea de aprender). Mazzoni y Cornoldi (1993) demostraron que el conocimiento previo sobre la facilidad o dificultad percibida o ida de una tarea, afecta a la distribucin del tiempo de estudio, de manera que a las tareas fciles se les dedica menos tiempo que a las lateas difciles. De igual forma, Dufresne y Kobassigawa (1989), en otro estudio experimental, manipularon el grado de relacin entre los componentes de una lista de pares asociados, observando que el tiempo de recuerdo de los temes menos relacionados entre si, los ms difciles, superaba el tiempo dedicado al recuerdo de los ms relacionados. Todas estas apreciaciones ponen de manifiesto que el grado de percepcin de las variables concernientes a las tareas afectan al modo de realizacin de las mismas, de forma que, a medida que el sujeto va teniendo una mayor conciencia de la tarea, se incrementa su eficacia de realizacin. Las variables de las estrategias van referidas al conocimiento estratgico cognitivo, metacognitivo y de los medios que pueden propiciar y facilitar el xito, tales como: repetir elementos de una lista, ordenarlos por categoras, comprender un determinado contenido, relacionarlos son otros, recordar una determinada cuestin, resolver tal o cual problema, etc. El conocimiento de las variables de estrategia se refiere al conocimiento procedimental, extrado de la experiencia, resultante de la ejecucin de tareas anteriores. A partir del conocimiento de las caractersticas requisitos tareas, las caractersticas personales y las estrategias que hay que emplear, es cuando se puede empezar a planificar, regular, evaluar y reorganizar el proceso cognitivo coherente. As, pues, la metacognicin supone el
32
UNIDAD I / FUNDAMENTOS
conocimiento y control de los propios estados y procesos cognitivos (Brown, Bransford, Ferrara, Capione, 1983). Las actividades de planificacin estn integradas por el establecimiento de metas de aprendizaje, subdivisin de la tarea en pasos, generacin de interrogantes ante el nuevo material, identificacin y anlisis del problema, planteamiento de hiptesis de trabajo, determinacin de la dosificacin del tiempo y el esfuerzo necesarios, etc. Las actividades de direccin (monitoring) y autorregulacin incluyen la autodireccin y autocontrol cognitivo durante todo el proceso de realizacin de una actividad cognitiva, siendo capaz de seguir el plan trazado. Y, las estrategias de evaluacin permiten comprobar la eficacia del proceso cognitivo, mientras que las de reorganizacin facilitan su modificacin en su defecto. El desarrollo de las actividades de control cognitivo, de autoconciencia acerca de cmo se conoce y de automanejo de la propia actividad cognitiva, permite a los alumnos asumir la responsabilidad de su propio aprendizaje, que, paran Nisbet y Shuckmith (1986), es la clase del aprender a aprender. Precisamente, estos autores, describen, la metacognicin como el sptimo sentido que lleva a aprender a aprender; es decir, la capacidad de reconocer y controlar la situacin de aprendizaje. Lo que no debe confundirse con el aprendizaje de habilidades especficas para el estudio es ser capaz de organizar, dirigir controlar los procesos mentales y ajustarlos a las exigencias o contexto de la tarea. En este sentido, Nickerson et al. (1987) indican que la actuacin de los expertos, respecto a los novatos, es de mayor en la planificacin y la aplicacin de estrategias, una mejor distribucin del tiempo y los recursos, y un control y valuacin cuidadosa del progreso. Los hallazgos de diferentes investigaciones confirman que los nios muy pequeos poseen un grado considerable de conocimiento metacognitivo que se va desarrollando gradualmente durante su proceso de maduracin, de ah la conveniencia de que los estudiantes, desde muy corta edad, dentro del currculo y no como apndice del mismo, se inicien en la prctica del autoexamen y el control de su autoeficacia, distribuyendo cuidadosamente el tiempo y los recursos de que disponen. Las habilidades y estrategias metacognitivas deben ensearse simultneamente a la enseanza de los contenidos de las diferentes materias escolares (Hartman y Sternberg, 1993), integradas en alguno de los mtodos de interaccin didctica. Una parte de ellas se centran en el maestro y otras les corresponde desarrollarlas a los propios estudiantes,
33
UNIDAD I / FUNDAMENTOS
dependiendo de quin tenga la responsabilidad y el control de la actividad de aprender en cada momento de la situacin de aprendizaje-enseanza. Las tcnicas centradas en el maestro incluyen: preguntar, decir en voz alta lo que se hace al tiempo que se realiza, anticipar los pasos que se van a seguir, preguntarse por el valor y el inters de cada uno de ellos, justificar las decisiones que se toman, proporcionar diferentes ejemplos, analogas, grficos, esquemas y justificar su valor procedimental para adquirir el conocimiento. En suma, modelar y justificar previamente el aprendizaje que queremos que realice el alumno despus de forma individal. Las habilidades y estrategias centradas en el alumno incluyen marcarse objetivos y planificar las tareas, hablarse a s mismo a lo largo del aprendizaje para autopreguntarse y cuestionarse cada paso de la actividad de aprender, pensar en voz alta, detenerse a reflexionar y revisar lo realizado previamente, anticipar y prever etapas y resultados, evaluar resultados parciales y finales, preguntarse por qu las tareas se hacen bien o mal, a qu se puede deber, si est en manos del alumno proponer soluciones y cules. Por ltimo, destacas la importancia del estudio conjunto de los factores cognitivosmetacognitivos y motivacionales, que, como consecuencia, ha dado como resultado la aparicin del nuevo constructo conocido como aprendizaje autorregulado (SRL: SelfRegulated Learning). Puede considerarse autorreguladores a los alumnos en la medida en que son, cognitiva-metacognitiva, motivacional y conductualmente, promotores activos de sus propios procesos de aprendizaje (Zimmerman, 1990b; y McCombs y Marzano, 1990). Cognitiva-metacognitiva, cuando son capaces de tornar decisiones que regulan la seleccin y uso de las diferentes formas de conocimiento: planificando, organizando, instruyendo, controlando y evaluando (Corno, 1986.1989). Motivacionalmente, cuando son capaces de tener gran autoeficacia, autoatribuciones y gran inters intrnseco en la tarea, destacando un extraordinario esfuerzo y persistencia durante el aprendizaje (Borkowski et al., 1990; Schunk, 1986). Conductualmente, cuando son capaces de seleccionar, estructurar y crear entornos para optimizar el aprendizaje, buscando consejos, informacin y lugares donde puedan ver favorecido su aprendizaje (Wang y Peverly, 1986; Zimmerman y Martinez-Pons, 1986), autoinstruyndose y autorreforzndose (Rohrkemper, 1989).
34
UNIDAD I / FUNDAMENTOS
En suma, un aprendiz efectivo es aquel que llega a ser consciente de las relaciones funcionales entre sus patrones de pensamiento y de accin (estrategias) y los resultados socio-ambientales (Corno y Mandinach, 1983; Corno y Rohrkemper, 1985); es decir, cuando se siente agente de su comportamiento, estando automotivado, usando estrategias de aprendizaje para lograr resaltados acadmicos deseados, autodirigiendo la efectividad de su aprendizaje, evalundolo y retroalimentndolo.
Evaluacin
Sin duda alguna, las habilidades cognitivas y metacognitivas suponen, quizs, los constructos ms investigados en la psicologa de la instruccin contempornea; no obstante, tanto su delimitacin conceptual como su evaluacin y entrenamiento requieren un tratamiento metodolgico emprico vlido y fiable, que d solidez a sus planteamientos. Hay autores que restringen la cognicin-metacognicin a los procesos de los que las personas son o pueden ser conscientes y que se manifiestan a travs de indicadores internos, introspectivos (Flavell, 1976, 1977; Flavell y Wellman, 1977); y otros, sin embargo, lo hacen a travs de indicadores externos, indirectos, susceptibles de medida y cuantificacin (Paris y Jacobs, 1984; Jacobs y Paris, 1987; Cross y Paris, 1988). En este sentido, unos u otros, intentan analizar la cognicin-metacognicin mediante la observacin y la medida de los dos grandes aspectos que la definen: autoconocimiento y proceso de control. As pues, en general, el procedimiento metodolgico ms utilizado en la evaluacin de la cognicin- metacognicin es el informe verbal, como forma de inferir los estados de conciencia de los individuos; aunque, es una herramienta que cuenta con numerossimas crticas (Nisbet y Wilson, 1977) y que supone costosos esfuerzos para mejorar los procedimientos que permitan validar y fiabilizar los hallazgos obtenidos (Ericsson y Simon, 1980). No obstante, podramos distinguir dos grupos de tcnicas diferenciadas al respecto: las primeras, serian aquellas donde los sujetos abordan de forma consciente sus propios estados mentales haciendo alusin a la descripcin de los procesos que verbalizan -think aloud (Cavanaugh y Permlmutter, 1982), entrevistas (Brown, 1987) y cuestionarios (Pintrich y De Groot, 1990, Cuestionario de Estrategias Motivadas -MSLQ-)-, y, las segundas,
35
UNIDAD I / FUNDAMENTOS
considerando las respuestas verbales corno resultado o producto de un proceso mental dado, actuando como indicadores de que determinados procesos se activan por parte del sujeto -peer tutoring (Garner, 1987), pictorial techniques (Diaz y Rodrigo,1989), graphing subjective (Hall, Dansereau, ODonnell, 1990), cuestionario metacognitivo MQ (Swanson, 1990), judgments of knowing y feeling of knowing (Nelson y Leonesio, 1990), etc.-. Queda claro, pues, que la mayor parte de las tcnicas, salvo las que utilizan dibujos o grficos, se fundamentan en el informe verbal, como procedimiento para acceder a los estados y los procesos de control del conocimiento de los que los individuos son conscientes y que podemos inferir a partir de autovaloraciones personales (Pelegrina, Justicia y Cano, 1991). No obstante, las verbalizaciones, como herramienta metodolgica, han sido objeto de numerosos anlisis (fiabilidad, influencia del experimentador, relaciones entre lo que el sujeto sabe y lo que en realidad hace, consideraciones sobre el estado evolutivo de los sujetos, etc.), poniendo de manifiesto algunas precauciones, como recomienda Garner (1987): 1. Evitar preguntar sobre procesos automticos, inaccesibles a la reflexin. 2. Reducir el intervalo entre procesamiento e informe 3. Evitar el efecto de sesgo del experimentador utilizando preguntas indirectas. 4. Utilizar diferentes mtodos que no compartan las mismas fuentes de error para valorar el conocimiento y la utilizacin de las estrategias. 5. Utilizar tcnicas que reduzcan las demandas de verbalizacin, especialmente en los sujetos ms jvenes. 6. Evitar escenarios hipotticos y cuestiones muy generales. 7. Valorar la consistencia de las respuestas de la entrevista a lo largo del tiempo para un grupo de sujetos. 8. Valorar la validez de las preguntas para reducir las respuestas verbales a temas de inters. As, pues, la tcnica del cuestionario, junto con la entrevista, tal vez sean, entre los procedimientos analizados, los ms utilizados para medir la cognicin-metacognicin
36
UNIDAD I / FUNDAMENTOS
(Belmont y Borkoswski, 1988; Clements y Natassi, 1990; Clements y Natassi, 1988; Clements y Natassi, 1990; Meichenbaum, Burland, Gruson y Cameron, 1985; Pintrich y De Groot, 1990; Tobias, Hartman, Everson y Gourgey, 1991; Swanson, 1990). De ellos, aqu nos interesan particularmente el Metacognitive Questionnaire, MQ, de Swanson y el Motivated Strategies for Learning Questionnaire, MSLQ, de Pintrich y De Groot.
Programas de intervencin
En general, podramos distinguir dos lneas de intervencin: 1) La que alude exclusivamente al trmino cognicin-metacognicin, y 2) La referida a la conjuncin cognicin-metacognicin Y motivacin. Respecto a la primera orientacin, programas de intervencin exclusivos en cognicin-metacognicin, decir que son numerosos los trabajos que han demostrado el efecto favorable del entrenamiento en habilidades y estrategias cognitivas y metacognitivas en diferentes reas del currculo: en lectura (Brown, Armbruster y Baker, 1985; Brown y Palincsar, 1987; Campione y Brown, 1990; Chipman, Segal y Glaser, 1985; Jacob y Paris, 1987; Snchez, 1993); en escritura (Bereiter y Scardamalia, 1987; Castell, 1995; Hayes y Flower, 1980; Higgins, Flower y Petraglia, 1992; Saunders, 1989); en el uso de grficos y mapas (Moore, 1993; Schofield y Kirby, 1994); en fsica (Pirolli y Bielaczyc, 1989; PirolIi y Recker, 1994); en la solucin de problemas (Borkowski, 1992; Chi et al., 1989; Bielaczyc, Pirolli y Brown, 1995; Klahr, 1985; Swanson, 1990), y, recientemente, la de Herrera y Ramrez Salguero (2001) sobre cognicin-metacognicin en contextos pluriculturales. Estos trabajos, al mismo tiempo, han desarrollado diversos mtodos de enseanza para llevar a cabo el entrenamiento en cognicin-metacognicin. Dichos mtodos tienen distinta fundamentacin terica y se basan en la observacin, la comparacin y la reflexin sobre el modo de ejecutar tareas hechas por otros (profesores o grupo de iguales) o sobre la propia ejecucin de los estudiantes, concerniente a tareas relacionadas con el aprendizaje escolar. Entre estos mtodos, podemos citar: el role-playing; la discusin; el debate; el mtodo de explicacin o enseanza directa (Duffy et al., 1986); el modelado y el mtodo de andamia-je, derivado de lo supuestos que inspiran el trabajo de Vygotsky (1978) (Collins, Brown y Newman, 1989); el mtodo de entrenamiento cognitivo, basado en el dilogo, la
37
UNIDAD I / FUNDAMENTOS
explicacin directa, el modelado (un ejemplo de este mtodo lo tenemos en el programa ISL Informed Strategies for,Learnig- propuesto por Paris y colaboradores, 1984); el mtodo de aprendizaje cooperativo, entendido como una ayuda al aprendizaje cuando los alumnos realizan tareas en comn (Slavin, 1991); o, el mtodo de enseanza recproca, basado en la interaccin del trabajo en situacin de pareja (dada), en la que uno de los integrantes del par adopta el rol de lder (Palincsar y Brown, 1984). Las propuestas, en general, se han dirigido al aumento de las estrategias de memoria, incidiendo en el problema de la generalizacin y mantenimiento de estrategias previamente entrenadas, o a fomentar la lectura comprensiva, utilizando tcnicas de enseanza informativa, metforas, grupos de dilogo, prcticas dirigidas y aplicaciones, como el ISL de Paris et al. (1984). Respecto a la segunda orientacin, programas de intervencin en metacognicin y motivacin conjuntamente (SRL), decir que tambin son numerosos los trabajos que han demostrado el efecto ms favorable del entrenamiento en estrategias cognitivas y metacognitivas cuando se llevan a cabo conjuntamente con programas de desarrollo motivacional (Paris, Olson y Stevenson, 1983; Corno y Mandinach, 1983; Corno y Rohrkemper, 1985; Zimmerman y Martnez Pons, 1986; Dweck, 1986; Alonso, Garca y Montero, 1986; Castro, 1986; Pintrich y De Groot, 1990; Pokay y Blumenfeld, 1990; Wellman, 1990, 1995; Zimmerman, 1989, 1990; Valle y Nez, 1989; McCombs y Marzano, 1990; Weiner (1990); Gonzlez-Pienda, Nez y Valle, 1991; Borkowski y Muthukrishma, 1992; Jussim y Eccles, 1992; Nez, 1992; Navas et al., 1991, 1992; McCombs, 1993; Castejn, Navas y Sampascual, 1993; Pardo y Alonso, 1993; Cabanach, Nez y GarcaFuentes, 1994; Nez y Gonzlez-Pienda, 1994; Sampascua, Navas y Castejn, 1994; Rivire Sarri, Nez y Rodrigo, 1994; Butler y Winne, 1995; Alonso, l995.etc.). De ellos es preciso destacar que, en general, han sido diseados basndose en la modificabilidad de las atribuciones causales y de la cognicin-metacognicin, siendo sus mximos exponentes Schunk et al.(1992), recomendando dirigir la atribucin del sujeto, en caso de fracaso, no a la falta de esfuerzo; sino, al uso inadecuado de las estrategias de resolucin o al planteamiento incorrecto del problema, por las siguientes razones: 1. Si el sujeto se esfuerza constantemente para obtener un resultado positivo y nunca lo consigue, no slo acabar cansndose de intentarlo, sino que reducir su autoconfianza, creyndose incapaz de alcanzar el xito, por ms que lo intente.
38
UNIDAD I / FUNDAMENTOS
2. De persistir en la atribucin del xito al esfuerzo, el sujeto antes que esforzarse y darse cuenta de que no es capaz, preferir disimular, mostrar un falso inters o esforzarse poco (confirmado por Covington, 1992). 3. Por mucho que le digamos que no se esfuerza, si no se le muestra dnde ha fallado y cmo resolver el problema, nunca lo har correctamente. En caso de xito, la atribucin tampoco sera debida al esfuerzo, sino a la habilidad; dado que, segn el grado de comprensin que tiene el nio de los conceptos esfuerzo y habilidad, indicarle que ha aprobado porque se ha esforzado, es como sugerirle que tiene poca capacidad, ya que ha tenido que esforzarse para conseguirlo y, adems, porque conduce a un crecimiento menor de sus expectativas futuras. En este sentido, sera conveniente seguir lo que Pardo Alonso (1993:338) denominan los criterios rectores de intervencin: Antes de la tarea, durate la tarea y despus de la tarea. Finalmente, es conveniente tener en cuenta tambin los conceptos y teoras, los sistemas de evaluacin y programas de intervencin ms relevantes sobre aprender a pensar y pensar para aprender, destacando las, siguientes ideas: 1. Respecto al concepto, recogiendo las opiniones de De Bono (1973), Feuerstein (1979), Gardner (1983) y Sternberg (1985), podramos entenderlo como conjunto de habilidades intelectuales relacionadas entre s, que cambian o evolucionan con la edad, cuya operatividad debe partir del conocimiento de su potencialidad y capitalizacin, y de las propias debilidades, para compensar habilidades y debilidades. 2. En cuanto a las teoras, entre otras, destacar especialmente las aportaciones de De Bono (1973), sobre la aplicacin del pensamiento crtico, analtico y creativo, junto con el conocimiento, a la solucin de problemas (operatividad: capacidad de hacer CoRT); de Feuerstein (1979), sobre la mejora de la inteligencia, la reestructuracin general de los procesos cognitivos y la mejora del potencial de aprendizaje a travs de un correcto aprendizaje mediado (Teora de la Modificabilidad Estructural Cognitiva TMEC); de Gardner (1983), sobre las inteligencias mltiples, proponiendo siete reas, en principio, y despus una ms, relativamente autnomas de cognicin humana o inteligencias: lingstica, lgico-matemtica, musical, espacial, corporal-cinestsica, interpersonal y naturalista. De manera que, solamente a travs de la combinacin de estas inteligencias, podremos explicar una serie relativamente completa de capacidades y estados extremos que figuran en todas las culturas humanas (Teora de las Inteligencias Mltiples); y de Sternberg (1985), sobre la
39
UNIDAD I / FUNDAMENTOS
inteligencia como capacidad de autogobierno cognitivo que procura la adaptacin al medio, inhibiendo la primera respuesta instintiva, redefinindola y eligiendo la mejor respuesta. Destacando en ella tres aspectos esenciales: analtico, sinttico o creativo y prctico, que estn representados en tres subsistemas: componencial, experiencial y contextual (Teora Trirquica de la Inteligencia). 3. Sobre los instrumentos de evaluacin, decir que prcticamente todos van asociados a sus correspondientes teoras y programas de intervencin. De entre ellos, destacar los propuestos por Feuerstein (1983), el Learning Potential Assessment Device LPAD (Evaluacin Dinmica del Potencial de Aprendizaje), conjunto de estrategias de anlisis de la inteligencia, cuya finalidad consiste en provocar una serie de interacciones entre examinador y examinado para valorar su potencial oculto o su capacidad para beneficiarse del aprendizaje, orientado al anlisis de los procesos mediante los cuales los alumnos van razonando sus respuestas; por Gardner, cuya propuesta va unida al del Proyecto Cero de Harvard (1988), que comenz con la puesta en marcha de un programa y tcnicas de valuacin de la inteligencia, utilizando contextos ms prximos a la vida real, tanto en educacin preescolar como en primaria y secundaria SPECTRUM y PROPEL; por Sternberg (1993) con su Sternberg Triarchic Abilities Test STAT, cuyo objetivo es medir de cuatro formas (a travs de material verbal, cuantitativo, figurativo y de ensayos) los tres tipos de habilidades intelectuales (analtica, creativa y prctica); y la propuesta comn de Sternberg y Gardner (1993), el Practical Intelligence for Schools PIFS, programa para la evaluacin y el desarrollo de la inteligencia prctica en las escuelas, cuya intencin es utilizar el contenido de las materias escolares como trampoln para adquirir habilidades de aprendizaje, a travs de la reflexin y el control de las propias tcnicas de pensamiento, mientras trabajan en una materia curricular especfica, armonizando y conjugando as sus respectivas posturas Teora de las Inteligencia Mltiples y Teora Trirquica de la Inteligencia. 4. Referente a los programas de intervencin, destacar dos tipos de programas: los que se llevan a cabo a parte de currculo escolar, como una asignatura ms, este es el caso de la propuesta de Feuerstein; y, los que se insertan en el curriculum, como los de Sternberg y Gardner. La aportacin de Feuerstein (1985), el Instrumental Enrichment Program PEI, pretende desarrollar la capacidad humana modificndola a travs de la exposicin directa a
40
UNIDAD I / FUNDAMENTOS
los estmulos y a la experiencia proporcionada por el contacto directo con la vida, a travs del aprendizaje formal e informal, destacando el papel especial del mediador. La aportacin de Gardner y Sternberg (1993 ),el Practical Intelligence for Schools PIFS, organizado en trminos del manejo intelectual de tres elementos: s mismo (conocernos), las tareas (conocer y organizar nuestras tareas) y los otros (conocer y relacionarnos con los dems), supone una magnfica contribucin para el autogobierno eficaz de las habilidades intelectuales. Todo lo cual, a la hora de evaluar e intervenir en el aprender a pensar y pensar para aprender, nos lleva a decantarnos por las aportaciones de Feuerstein (l985) y de Gardner y Sternberg (1993).
41
UNIDAD I / FUNDAMENTOS
nuevo concepto de capacidades superiores que se ha desarrollado en diferentes direcciones y que comprende diversas formas de actividad intelectual. A partir de tales consideraciones surgieron dos posturas diferenciadas: la de quienes consideran la inteligencia como un fenmeno unitario o general, y la de quienes admiten la existencia de una gran variedad de fenmenos que interactan entre s y determinan la inteligencia, y, en consecuencia, distinguen capacidades diferentes, aunque relacionadas entre s.
42
UNIDAD I / FUNDAMENTOS
43
UNIDAD I / FUNDAMENTOS
para su medicin se disearon muchos tests de inteligencia, aunque tendan a incorporar el mismo tipo de cuestiones y mostraban una estrecha correlacin entre ellos. Una de las aportaciones ms interesantes de Binet fue la introduccin del concepto de edad mental, que poda coincidir o no con la edad cronolgica de un sujeto. La edad mental se consideraba normal si coincidan con la cronolgica y superior o inferior segn los casos de mayor o mejor puntuacin obtenida respecto de ella. Esto favoreci la comprensin de lo que con frecuencia sucede en los sujetos superdotados, que al mostrar en la ejecucin de las tareas una superioridad respecto de su edad cronolgica, dan como resultado una edad mental superior. Binet trat de conocer a travs de su Escala Mtrica de Inteligencia en qu grado difieren los sujetos entre s, pero sobre todo se interes por cmo difieren, y denomin a este ltimo aspecto brillantez intelectual (Benedet, 1991). Otra modalidad de gran relevancia dentro de este mismo enfoque fue la relacionada con la teora de factores de Spearman. Este autor, propuso por un lado el factor general de inteligencia o factor g, que explicara lo que tienen en comn todos los tests de inteligencia, y por otro, los factores especficos s, que estn implicados en toda actividad intelectual. Pero a Spaerman se le incluye en la lnea monoltica debido a que de sus factores solamente el factor g es significativo. Spearman dirigi su atencin a la comprensin de las diferencias individuales, particularmente en el campo de la inteligencia (Berk, 1998). En general podemos decir que la idea de superdotacin como alto nivel de cociente intelectual responde a este tipo de enfoque monoltico (Garca Ganuza y Abaurrea, 1997). Modelos factorialistas Los modelos fecotialistas surgieron frente los modelos monolticos y se desarrollaron de los EEUU a partir de los trabajos de Thurstone, que partiendo de los supuestos de Spearman, lleg a un modelo de inteligencia factorialista, es decir, construido por una serie de componentes bsicos independientes entre s y al que el equipo Thurstone denomin teora de los factores primarios. En la dcada de 1960 apareci el modelo del intelecto de Guilford, con el que pretenda una catalogacin de los factores (Genovard y Castell, 1990), aportando un marco de referencia amplio para su interpretacin. A partir de entonces resulta posible que un sujeto pueda destacar respecto del grupo de forma significativa en uno o varios factores. Thurstone (1938) y Guilford (1967) conceptualizaron la inteligencia con un perfil de aptitudes distintas, relacionadas en algunos casos e independientes en otros (Prez, 1995).
44
UNIDAD I / FUNDAMENTOS
La consideracin de los modelos factorialistas dio un nuevo dinamismo a la interpretacin de la superdotacin, altiempo que contribuy a ampliar el concepto y la definicin, si bien signific tambin la aparicin de nuevos problemas, como el punto de corte en cada una de las aptitudes y las posibles interrelaciones (Prez, 1999). Modelo de la estructura del intelecto de Guilford Guilford (1967) propuso un modelo de la Estructura del Intelecto complejo y
tridimensional. Siguiendo a Berk (1998), sus factores se pueden clasificar de acuerdo con tres dimensiones: 1) Las operaciones o proceso a que se somete la informacin, que puede ser de cinco clases: cognicin, memoria, pensamiento convergente, pensamiento divergente y evaluacin; 2) Los contenidos o informaciones sobre los que se realizan estas operaciones, que se presentan en cinco categoras: visual, auditivo, simblico, semntico y conductual, y 3) Los productos resultantes de las operaciones que se identifican en seis tipos: unidades, clases, relaciones, sistemas, transformaciones e implicaciones. As pues, combinando estas tres dimensiones de todas las maneras posibles, el modelo de la estructura del intelecto, genera un total de 150 factores (ver figura1).
Figura 1. Modelo de la estructura del intelecto de Guilford (Berk, 1998;408)
45
UNIDAD I / FUNDAMENTOS
La influencia de este modelo propici una nueva y compleja concepcin de superdotacin en funcin de la amplitud que se manifieste. De ah que el fenmeno de la superdotacin pase a ser un constructo multidimensional.
Este modelo est considerado como la clasificacin ms extensa de habilidades mentales propuesta desde la teora factorialista. Aunque el anlisis factorial ha sido la aproximacin ms importante para la definicin de las habilidades mentales, Berk advierte
46
UNIDAD I / FUNDAMENTOS
que segn muchos investigadores su utilidad es limitada, a menos que se combine con otras aproximaciones tericas del estudio de la cognicin humana. Planteamientos jerrquicos A partir de los planteamientos monolticos y de los factorialistas surgieron los deonominados modelos jerrquicos, con una pretensin integradora. Sin embargo tambin aqu encontramos soluciones diferentes. Autores como Burt (1940) y Vernon (1965) tienden a incluir el factor g de Spearman en el nivel superior de la jerarquizacin de factores, mientras Cattel (1963) se centra en los factores secundarios, sobre todo en los de la inteligencia fluida (innata, no influida por los aprendizajes anteriores) y el correspondiente a la inteligencia cristalizada (determinada por los aprendizajes anteriores). Ahora bien, uno y otro dependen del factor g. Los modelos jerrquicos han sido los menos utilizados a la hora de explicar los fenmenos de la superdotacin y el talento. Sin embargo, para fraseando a Garca Ganuza y Abaurrea (1997), resultan ms comprehensivos que los modelos factoriales de distintos niveles produce una estructura mucho ms rica y compleja y tambin ms cercana a los modelos explicativos actuales. Genovard y Castell (1990) afirman que en el mbito de la inteligencia la excepcionalidad puede ser definida segn los citados modelos. Dada su relacin con el instrumente de medida, la definicin que se deriva del enfoque monoltico se ajustara a criterios de carcter cuantitativo. En consecuencia la inteligencia de un sujeto se correspondera con un punto dentro de un continuo y las comparaciones se estableceran en trminos de ms o menos inteligencia. Sin embargo, desde los modelos factorialistas la capacidad intelectual se desglosa en mltiples aptitudes, con lo que el perfil de cada sujeto, corresponde a diferentes tipos de inteligencia, en funcin de las combinaciones de aptitudes, por lo que perspectiva sera fundamentalmente cualitativa, ya que concibe el intelecto como un conjunto de factores diferenciados que guardan entre s diversas formas de dependencia y organizacin segn la teora concreta en la que nos situamos. Esta es tambin la razn por la que la teora factorialista, a diferencia de los enfoques monolticos, es capaz de explicar el fenmeno del talento. Castell (1997) considera que a partir de cualquier teora factorialista concreta es posible realizar cierta estimacin de los recursos mentales individuales siempre con limitaciones instrumentales y metodolgicas-, pero asumiendo en todo caso una estructura
47
UNIDAD I / FUNDAMENTOS
intelectual compuesta por mltiples recursos diferenciados. De esta forma el anlisis intelectual se realiza a partir de un perfil de recursos (aptitudes) y no sobre un valor nico, tal como se pretende desde el enfoque monoltico.
48
UNIDAD I / FUNDAMENTOS
experimental y contextual (ver figura 3). La subteora componencial comprende las habilidades propias del procesamiento de la informacin que subyace a la conducta inteligente. La subteora experiencial manifiesta que los individuos muy inteligentes, en comparacin con otros menos inteligentes, procesan mejor la informacin y realizan las tareas nuevas con mayor rapidez, e interiorizan y automatizan lo aprendido. La subteora contextual propone que las personas inteligentes tienen gran facilidad para procesar la informacin de acuerdo con sus deseos personales y en relacin con la vida diaria. Sternberg (1985), dependiendo del grado en que los sujetos poseen los componentes, clasifica a los superdotados en tres tipos: analticos, creativos y prcticos: Analticos: Poseen una extraordinaria capacidad para planificar estrategias, representar la informacin, resolver problemas y controlar los recursos disponibles. Creativos. Son capaces de generar nuevas ideas y reformular problemas, superar las definiciones existentes del los problemas y automatizar la informacin en campos especializado como la danza, la msica, los idiomas o los deportes. Prcticas. Tienen gran habilidad para aplicar sus capacidades en la solucin de problemas reales, adaptarse a una nueva formulacin de los problemas, a investigar en el propio campo de la actividad y a la seleccin apropiada y oportuna de un entorno de trabajo.
Figura 3. Teora trirquica de la inteligencia de Sternberg (Berk, 1998, p. 412)
49
UNIDAD I / FUNDAMENTOS
Estos componentes constituyen un sistema interactivo en el que los
metacomponentes son los elementos centrales. Los sujetos superdotados se caracterizan por la alta calidad y cantidad de interaccin que realizan entre las distintas clases de componentes dentro del sistema (Tourn y otros, 1998). Para Sternberg (1981) esta teora de la inteligencia humana proporciona una buena base para la comprensin de la superdotacin intelectual, entendida en trminos de funcionamiento, de activacin, de de posibilidad entre los componentes del procesamiento de la informacin, y admite que sea entrenable en algn grado cuando se trata de enfatizar el desarrollo de las funciones de los componentes descritos. Segn estas teoras los tests de CI proporcionan medidas tiles, aunque incompletas, puesto que no sirven para medir todos los aspectos de la inteligencia, lo que significa, segn el prototipo Sternberg (1986), una inadecuacin para el proceso de identificacin de nios superdotados. Partiendo de las nuevas teoras de la Inteligencia Gardner y Sternberg consideran que existen una variedad de fenmenos que interactan y que determinan la inteligencia, y en consecuencia la fragmentan en capacidades diferentes pero relacionadas entre s. As el concepto de capacidades superiores se ha ampliado e incluye muchos tipos de habilidades de gran importancia tanto en beneficio de quien las posee como la sociedad. Actualmente los expertos conciben la superdotacin desde una perspectiva mucho ms amplia que hace solo unas dcadas, y en las definiciones se introducen dimensiones como la creatividad, la motivacin, el autoconcepto, la capacidad de liderazgo y la capacidad fsica, la socializacin as como factores no intelectivos y fortuitos y caractersticas cognitivas. Otras caractersticas de la superdotacin tienen una perspectiva claramente social y contextual, ya que la asocian sobre todo con reas de competencia humana valoradas socialmente.
dcadas del siglo XIX y principios del XX, coincidiendo con los inicios de la psicologa cientfica. En la primera mitad del siglo XX predomin el criterio psicomtrico y se ignoraron otras posibles variables significativas para la identificacin del superdotado. En la dcada de los aos cuarenta los expertos comenzaron a sealar limitaciones en los test de inteligencia
50
UNIDAD I / FUNDAMENTOS
para definir e identificar a los superdotados, y es a partir de los aos cincuenta cuando se empiezan a investigar y analizar otros factores. Sin embargo, y pese a que no es posible prescindir de tal medio para la identificacin de las capacidades excepcionales, la propia evolucin de las nociones de la inteligencia y superdotacin hizo que se fuera imponiendo la idea que los tradicionales test de inteligencia deban complementarse con otro tipo de pruebas: personalidad, creatividad, afectividad, autoconcepto, etc. El concepto de superdotacin ha ido cambiando de forma considerable desde su aparicin hasta nuestros das. La gran variedad de modelos y conceptos de los que disponemos hace que resulte difcil la unanimidad incluso en lo que respecta a la denominacin de este grupo de poblacin. No obstante el trmino que ms se ha extendido en los ltimos aos y con el que ha ido evolucionando el propio concepto es superdotado. As se ha puesto de manifiesto en el ltimo congreso mundial, World Council for Gifted and Talented Children, celebrado en Barcelona en el verano de 2001. Estudios posteriores, como los de Torrance (1986) a travs de Torrance Tests of Creative Thinking, inciden en los aspectos concretos de la creatividad como conceptualizacin especfica de los superdotados. Otros muchos autores han opinado sobre la creatividad y su relacin con la superdotacin. As, Clark (1986) considera la creatividad como la ms alta expresin de las capacidades superiores. Guilford (1987) estudia la creatividad como aspecto bsico de la inteligencia humana. Sternberg (1988) sugiere que probablemente los individuos superdotados son aquellos que hacen las mayores atribuciones a la sociedad (). Las personas creativas y que se conocen bien as mismas son las que hacen los descubrimientos que cambian la sociedad. De hecho se considera la creatividad como una de las variables ms destacadas en la configuracin de la superdotacin (Renzulli, 1978). No existe, pues, un unvoco concepto de superdotacin, por lo que resulta imprescindible el establecimiento de algn tipo de criterio objetivo, y una caracterizacin general que pueda orientar la identificacin y favorezca el entendimiento de profesionales e investigadores. Debemos delimitar el trmino superdotado por que de lo contrario careceramos de una estructura orientada del modelo y las estrategias de identificacin de este tipo de sujetos (Rayo, 2001). Adems los distintos conceptos de superdotacin mantienen una relacin interactiva con los modelos, el diagnostico y la toma de decisiones para la educacin de este grupo de poblacin.
51
UNIDAD I / FUNDAMENTOS
Una de las definiciones ms relevante a nuestro juicio es la que formul en 1993 el
Departamento de Educacin de EEUU en un estudio denominado National Excelence: A case for Developing Americ`s Talent (La Excelencia Nacional: Las razones para desarrollar el talento en los EEUU). En l se propona una nueva definicin de alumnos superdotados basada en las recientes investigaciones sobre procesos cognitivos, que reflejaban las novedades tericas y el horizonte donde se situaban las investigaciones sobre la superdotacin (Howell y otros, 1997:438). Se propuso la siguiente definicin: los nios y adolescentes superdotados muestran respuestas notablemente elevadas, o el potencial necesario para alcanzarlas, comparados con los de su misma edad, experiencia o entorno. Poseen altos niveles de capacidades en las reas cognitivas, creativas y/o artsticas (). Estos alumnos necesitan programas y actividades programas y actividades que la escuela ordinaria no suele ofrecer. Las capacidades superiores se dan en nios y adolescentes de todos los grupos culturales, en todos los estratos sociales y es todos los campos de la creatividad humana.
Sin duda esta definicin implica una nueva concepcin de superdotacin, en primer
lugar porque sus autores evitan una identificacin del superdotado que derive nicamente de los test de inteligencia. Pero adems la definicin supone que los factores del entorno son al menos tan importantes para el desarrollo de capacidades superiores como la predisposicin gentica, y que estas capacidades pueden encontrarse en cualquiera de los grupos culturales y socioeconmicos, por muy diferentes que sean sus caractersticas, as como tambin en todos los mbitos de la actividad humana. A partir de definiciones como sta y de otras que aparecen en la literatura ms reciente se puede concluir que La superdotacin parece definirse ms por una combinacin de caractersticas de acuerdo con una consideracin multidimensional que por un nico rasgo, como hacen las teoras unidimensionales (Castejn y otros, 1997, p. 40). Uno de los temas recurrentes en los actuales estudios sobre superdotacin es el grado de conexin y las diferencias entre superdotacin y talento. Gagn (1993), que ha sido uno de los autores ms preocupado por la relacin entre estos dos conceptos, desarrollo el Modelo Diferencial de Superdotacin y Talento (DMGT), que permite diferenciarlos claramente. Gagn (1999) propone aplicar el termino superdotacin a la posesin de altas habilidades naturales (denominadas aptitudes o dotaciones) que, sin estar entrenadas, se manifiestan espontneamente en al menos un campo, en el que ocupara el percentil del
52
UNIDAD I / FUNDAMENTOS
10% de los mejor situados, como mnimo, dentro de los individuos de su edad y aplica el trmino talento al dominio de conocimientos y habilidades sistemticamente desarrolladas por un sujeto en, al menos, un campo de la actividad humana, en cuya prctica destaca sobre el 10% ms alto, dentro de los individuos de su misma edad, con compaeros que estn o han estado activos en ese o esos campos. El modelo propuesto por Gagn presupone que las habilidades naturales o aptitudes son la materia prima para el desarrollo de talento. Tales habilidades pueden permanecer como potencialidades sin traducirse en talento. El desarrollo de talento se produce cuando el sujeto se compromete con el aprendizaje sistemtico, con su preparacin y con la prctica, y se ve favorecido por dos tipos de catalizadores: intrapersonales (entorno, personas, intervenciones y acontecimientos).
espacio problema partiendo de un estado inicial y finalizando en un estado objetivo. Mientras que PROLOG nicamente efecta la bsqueda a partir de un estado objetivo, en realidad existen dos direcciones hacia las que se puede dirigir dicha bsqueda: Hacia delante, a partir de los estados iniciales. Hacia atrs, partiendo de los estados objetivo.
El modelo de sistema de produccin del proceso de bsqueda proporciona una forma fcil de considerar el razonamiento hacia delante y hacia atrs como procesos simtricos. Considrese el problema de resolver un ejemplo concreto de un 8-puzzle. Las reglas que se pueden utilizar para resolver el puzzle se muestran en la Figura 6.2. Racionamiento hacia delante a partir de los estado iniciales. Se comienzo por construir un rbol de secuencia de movimientos que se pueden presentar como
53
UNIDAD I / FUNDAMENTOS
Supongamos que los cuadrados del tablero estn numerados de la siguiente forma:
1 4 7
2 5 8
3 6 9
El cuadrado 1 est vacio y el cuadrado 2 contiene la ficha n El cuadrado 2 est vaco y el cuadrado 1 contiene la fichan n El cuadrado 2 est vaco y el cuadrado 4 contiene la ficha n El cuadrado 4 est vaco y el cuadrado 1 contiene la ficha n El cuadrado 2 est vaco y el cuadrado 1 contiene la ficha n El cuadrado 1 est vaco y el cuadrado 2 contiene la ficha n
soluciones, empezando por la(s) configuracin(es) iniciales(es) en la raz del rbol. Se generar el siguiente nivel del rbol encontrando todas las reglas cuyos lados izquierdos se relaciones con el nodo raz, y que utilicen sus lados derechos para crear nuevas configuraciones. Se crear el siguiente nivel tomando cada nodo que se haya generado en el nivel anterior, y aplicndolo a todas las reglas cuyos lados izquierdos se relacionen con ste. Se continuar as hasta que se consiga una configuracin que se empareje con el estado objetivo. Razonamiento hacia atrs a partir de los estados objetivo. Se comienza construyendo un rbol de secuencias de movimientos que ofrezcan soluciones empezando con la(s) configuracin(es) objetivo en la raz del rbol. Se generar el siguiente nivel del rbol encontrando todas las reglas cuyos lados derechos estn ligadas con el nodo raz. stas sern todas las reglas que, si son nicas que se aplican, generarn el estado que se desea. Se utilizar el lado izquierdo de las reglas para generar los nodos en este segundo nivel del rbol. Se generar el siguiente nivel del rbol tomando cada nodo del nivel previo, y encontrando todas las reglas cuyo lado derecho est ligado con ste. Entonces se utilizarn los correspondientes lados izquierdos para generar los nuevos nodos. Se continuar hasta que se genere un nodo que se empareje con el
54
UNIDAD I / FUNDAMENTOS
estado inicial. Este mtodo de razonamiento hacia atrs, a partir del estado inicial deseado, se denomina veces razonamiento dirigido al objetivo. Para el razonamiento hacia atrs, los lados derechos enfrenta con el nodo actual, los nodos lados izquierdos se utilizan para generar nuevos nodos que representan nuevos estados objetivo a ser alcanzados. Esto contina hasta que uno de estos estados objetivo queda emparejado a un estado inicial. En el caso del 8-puzzle no se observa mucha diferencia entre el razonamiento hacia delante y el razonamiento hacia atrs; aproximadamente se explora el mismo nmero de caminos en ambos casos. Pero esto no siempre sucede as. Dependiendo de la topologa del espacio problema, puede resultar ms eficiente la bsqueda en una direccin que en la otra. Existen cuatro factores que influyen sobre la cuestin de si es mejor razonar hacia delante o hacia atrs: Existen ms estados iniciales posibles que estados objetivo? Resultara mucho ms fcil manejar conjuntos pequeos de estados antes que un conjunto grande de stos, ya que de este modo la bsqueda resulta ms asequible. En qu direccin es mayor el estado de ramificacin? (es decir, la proporcin de nodos que se puede alcanzar directamente a partir de un nico nodo). Sera preferible actuar en aquella direccin que presente el factor de ramificacin ms bajo. Se pretender que el programa justifique un proceso de razonamiento al usuario? Si es as, es importante actuar en la direccin que se corresponda ms estrechamente con el modo de pensar del usuario. Qu clase de evento ser el que activar un episodio resolutor de problemas? Si el evento consistir en la llegada de un nuevo hecho, tendr ms sentido llevar un razonamiento hacia delante. Si por el contrario, es una pregunta para la que se requiere una respuesta, resultar ms natural utilizar el razonamiento hacia atrs. Esto se ve ms claro a travs de una serie de ejemplos. En principio, resulta ms sencillo conducir desde un lugar desconocido hasta nuestra casa, que hacerlo al contrario. Cul es la razn? El factor de ramificacin es prcticamente el mismo en ambas
55
UNIDAD I / FUNDAMENTOS
direcciones (a menos que encontremos una gran cantidad de calles de un solo sentido). Pero en lo referente a encontrar un camino, resulta mucho ms fcil hallar referencias cuando nos encontramos cerca de nuestra casa, que encontrarlas en un sitio que no nos resulte familiar. Cualquier sitio del que sepamos regresar correctamente a nuestra casa se puede considerar equivalente a casa. Pero si consideramos la cuestin de encontrar una ruta desde un lugar hacia otro que nos resulta desconocido, debemos estar en todo momento en guardia en dicho lugar. Por tanto, dirigirnos hacia un lugar que no nos resulta familiar, requiere alcanzar un objetivo mucho ms pequeo que el que se requerira al dirigirnos hacia nuestra propia casa. Esto hace ver que si la posicin de comienzo en nuestra casa, y si la posicin objetivo es ese lugar desconocido, se debe planear la ruta razonando hacia atrs partiendo de ese lugar desconocido. Por otro lado, considrese el problema de la integracin simblica. El espacio problema es un conjunto de frmulas, algunas de las cuales contienen expresiones integrales. El estado inicial es una forma concreta que contiene alguna expresin integral. El estado objetivo deseado es una frmula equivalente al estado inicial, pero que no contiene ninguna expresin inicial. Por tanto, se comienza con un estado inicial fcilmente identificable, y una gran cantidad de estados objetivos posibles. As para resolver este problema, resulta mejor razonar hacia delante utilizando las reglas de integracin para intentar generar una expresin integral libre, que empezar con expresiones libres arbitrarias, usar reglas de diferenciacin, y de ah intentar generar la integral particular que se pretende resolver. Estos dos ejemplos ilustran la importancia del nmero relativo de estados iniciales y estados objetivo, para la direccin ptima en la que se debe dirigir la bsqueda cuando el factor de ramificacin no sea el mismo, se debe tener en cuente lo que se ha dicho.
dominio especfico de las matemticas. El estado ser el teorema en particular que desee comprobar. Los estados iniciales son generalmente un pequeo conjunto de axiomas. No existe diferencia de tamao normalmente entre estos conjuntos. Pero consideraremos el factor de ramificacin en cada una de las direcciones. Partiendo de un conjunto de axiomas, se puede derivar un gran nmero de teoremas. Por otro lado, este extenso conjunto de teoremas debe volver al pequeo conjunto de axiomas, por tanto, el factor de ramificacin de presenta sensiblemente mayor cuando se acta hacia delante, partiendo de los axiomas hacia los teoremas, que cuando se trabaja hacia atrs, partiendo de los teoremas hacia los
56
UNIDAD I / FUNDAMENTOS
axiomas. Esto nos hace ver que resulta mucho mejor el razonamiento hacia atrs cuando se trata de demostrar teoremas. Hace tiempo que los matemticos se han dado cuenta de esto (Polya, 1957), cuando se trata de disear programas de demostracin de teoremas. El tercer factor que determina en qu direccin debe efectuarse la bsqueda, es la necesidad de generar justificaciones coherentes para el proceso de razonamiento segn este va actuando. A veces esto resulta crucial para la aceptacin de programas en la ejecucin de tareas muy importantes. Por ejemplo, los mdicos que resisten a aceptar las advertencias de un programa de diagnsticos que no sea capaz de explicar su razonamiento a la entera satisfaccin de dichos mdicos. Todo esto viene a propsito de los diseadores del programa MYCIN (Shortliffr, 1976), que diagnostica enfermedades infecciosas. El programa razona hacia atrs partiendo de su objetivo de determinar la causa de la enfermedad del paciente. Para hacerlo utiliza reglas que le dicen cosas tales como si el organismo tiene un conjunto de caractersticas como el que determina los resultados de laboratorio, entonces seguramente estn producidos por el organismo X. Por medio de razonamiento hacia atrs utilizando dichas reglas, el programa puede responder preguntas como Por qu debo hacerme esas pruebas?, con respuestas como Por que podra ayudar a averiguar si el organismo x est presente. La mayora de las tcnicas de bsqueda descritas en captulos anteriores se pueden utilizar para la bsqueda, ya sea hacia delante o hacia atrs. Describiendo el proceso de bsqueda como la aplicacin de un conjunto de reglas de produccin resulta fcil describir los algoritmos especficos de bsqueda sin referirnos a la direccin de la bsqueda. Tambin se puede realizar, tanto la bsqueda hacia delante a partir de un estado inicial como hacia atrs partiendo de un estado objetivo, simultneamente, hasta que los dos caminos se encuentren en algn punto medio. Esta energa se denomina bsqueda bidireccional. Es atrayente si el nmero de nodos aumenta exponencialmente con el nmero de pasos que se han tomado. Los resultados empricos (Pohl, 1971), parecen sugerir que para una bsqueda a ciegas, esta estrategia de dividir y vencer es ciertamente eficaz. Por desgracia, otros resultados (Pohl, 1971; De Cham-peaux y Sint, 1977), dirigidos a la bsqueda heurstica, dejan mucho que desear. La figura 6.3 muestra por qu la bsqueda bidireccional puede resultar ineficaz. Los dos caminos de bsqueda pueden no llegar a encontrarse el uno con el otro, dando como resultado mucho ms trabajo del que hubiera tomado el uso de un solo de los procedimientos de bsqueda trabajando individualmente. Sin embargo, si los pasos individuales hacia delante y atrs se llevan acabo mediante un
57
UNIDAD I / FUNDAMENTOS
programa cuidadosamente construido para usarlos a ambos exactamente en las situaciones en las que es ms adecuado, los resultados son mucho ms positivos. De hecho, muchas de las ms importantes aplicaciones de la IA se han construido utilizando una combinacin de razonamiento hacia delante y de razonamiento hacia atrs, y adems, la mayora de los procedimientos de programacin de IA proporcionan un soporte explcito para ese tipo de razonamiento hbrido. Aunque en principio el mismo conjunto de reglas puede ser utilizado tanta para el razonamiento hacia delante, como para el razonamiento hacia atrs, en la prctica se ha demostrado que resulta ms fcil definir dos clases de reglas, cada una de las cuales codifica un tipo particular de razonamiento. Reglas hacia delante, que codifican el conocimiento acerca de cmo responder a determinadas configuraciones de entrada. Reglas hacia atrs, que codifican el conocimiento acerca de cmo se pueden alcanzar determinados objetivos. Separando las reglas en estos dos casos, se aade esencialmente a cada regla una pequea informacin adicional que especifica cmo debe ser utilizada en la resolucin de problemas. En los tres siguientes apartados se describirn ms detalladamente las dos clases de sistemas de reglas y el modo en que stas pueden ser combinadas.
58
UNIDAD I / FUNDAMENTOS
Por ejemplo, un sistema interrogador probablemente utilizar un encadenamiento hacia atrs para razonar acerca de las respuestas a las preguntas del usuario. En el PROLOG, las reglas ests restringidas a ser clusulas de Horn. Esto permite crear un ndice, ya que todas las reglas que se utilizan para deducir un hecho dado, comparten la misma cabeza de regla. Las reglas se emparejan a travs del procedimiento de inificacin intenta encontrar un conjunto de restricciones para las variables, y as igualar un subobjetivo con las cabezas de algunas reglas. Las reglas, en un programa PROLOG se emparejan en el orden en el que aparecen. Otros sistemas de encadenamiento hacia atrs permiten reglas ms complejas. En el sistema MYCIN, por ejemplo, las reglas pueden ser aumentadas con factores de certeza probabilsticos para reflejar el hecho de que unas reglas son ms fiables que otras.
encadenamiento hacia delante que en los encadenados hacia atrs. Por ejemplo, consideraremos una regla que verifica alguna condicin en la descripcin de estado, y entonces aade una asercin. Despus de que la regla se dispara, estas condiciones continuarn probablemente siendo vlidas, y, por tanto, podran volverse a disparar inmediatamente. Sin embargo, se necesitar algn mecanismo para prevenir disparos repetidos, especialmente si el estado permanece invariable. Mientras que sea sencillo conseguir un emparejamiento y estrategias de control, la mayora de los sistemas encadenados hacia delante (como por ejemplo el OPSS [Brownston et al., 1985]), implementan emparejadores altamente eficientes y sustituyen muchos de los
59
UNIDAD I / FUNDAMENTOS
mecanismos eligiendo una determinadas reglas antes que otras. Se hablar del emparejamiento (matching) con ms detalle en el siguiente apartado.
60
UNIDAD I / FUNDAMENTOS
61
UNIDAD I / FUNDAMENTOS
software y el mecanismo computacional? En este caso se est hablando del equipo necesario que ha de desembocar en un mtodo de diseo.
Las respuestas a las cuestiones anteriores dan lugar a los distintos modelos CommonKADS, encuadrndose y abordando cada uno de ellos un aspecto concreto. Modelo de organizacin: soporta el anlisis de las caractersticas principales de una organizacin, con el fin de descubrir problemas y oportunidades para sistemas de conocimiento, establecer su viabilidad y ponderar los impactos en la organizacin de las acciones del conocimiento. Modelo de tarea: es la parte relevante de un modelo de negocio. Analiza la tarea global, sus entradas y salidas, precondiciones y criterios de realizacin, as como recursos necesarios y competencias. Modelo de agente: los agentes son los ejecutores de una tarea. Un agente puede ser humano, un sistema de informacin, o cualquier otra entidad capaz de llevar a cabo una tarea. El modelo de agente describe las caractersticas de los agentes, en particular sus competencias, autoridad para actuar y restricciones en este aspecto. Adems, relaciona los enlaces de comunicacin entre agentes a la hora de llevar a cabo una tarea. Modelo de conocimiento: el propsito de este es explicar los tipos y estructuras de conocimiento utilizados para llevar a cabo una tarea. Proporciona una descripcin independiente de la implementacin del papel que diferentes componentes de conocimiento juegan en la resolucin de problemas, de forma que es comprensible por los humanos. Esto
62
UNIDAD I / FUNDAMENTOS
hace que el conocimiento sea un vehculo importante para la comunicacin con los expertos y los usuarios sobre los aspectos relativos a la solucin de problemas de un sistema de conocimiento tanto durante el desarrollo como durante la ejecucin del sistema. Modelo de comunicacin: dado que varios agentes pueden verse involucrados en una tarea, es importante modelar las transacciones entre los agentes implicados, esto se realiza mediante el modelo de comunicacin, como suceda en el modelo de conocimiento. Modelo de diseo: los modelos anteriores juntos pueden verse como constituyendo la especificacin de los requisitos para el sistema de conocimiento, desde diferentes aspectos, Basados en los aspectos, el modelo de diseo proporciona la especificacin tcnica del sistema en trminos de arquitectura, plataforma de implementacin, mdulos de software, construcciones de representacin y mecanismos de computacin requeridos para implementar las funciones propuestas en los modelos de conocimiento y comunicacin. Juntos, los modelos de organizacin, tarea y agente analizan la organizacin del entorno y los factores crticos de xito para un sistema de conocimiento. Los modelos de conocimiento y comunicacin proporcionan la descripcin conceptual de las funciones de resolucin de problemas y los datos que son manejados y entregados por un sistema de conocimiento. El modelo de diseo convierte esto en una especificacin que es la base para la implementacin del sistema software. No obstante, no siempre es necesario construir todos los modelos, esto depende de los objetivos del proyecto. Esta eleccin corresponde al jefe de proyecto, bajo consenso previo con el cliente. Un proyecto de un SBC utilizando la tecnologa CommonKADS produce tres tipos de producto o entrega: Documentos de los modelos. Informacin sobre la gestin del proyecto. Software del Sistema de Conocimiento.
El objetivo final de la metodologa CommonKADS consiste en estructurar el proceso de desarrollo propio de la ingeniera del conocimiento, que se concreta en un sistema que debe resolver los problemas con una capacidad comparable a la del experto humano como poseedor del conocimiento. Obviamente, esta debe circunscribirse a un dominio especfico
63
UNIDAD I / FUNDAMENTOS
de aplicacin. Por ejemplo, si se trata de un sistema para el diagnstico de una cardiopata, el mbito de aplicacin sera justamente el de las cardiopatas y no otro aunque el experto supere con creces este dominio. En aras de la consecucin del objetivo anteriormente propuesto, resulta necesario disear un equipo de desarrollo que lo concrete y materialice, cada uno de los miembros este equipo debe tener encomendados unos roles especficos que son los que se le describen a continuacin.
64
UNIDAD I / FUNDAMENTOS
Las caractersticas atribuidas a cada uno de los componentes del sistema se describen a continuacin: Suministrador de conocimiento/especialista: un papel importante en el proceso lo desempea el propietario del conocimiento, que es un experto en el dominio de la aplicacin. Ingeniero de conocimiento/analista: CommonKADS ofrece al ingeniero de conocimiento o analista un conjunto de herramientas para llevar a cabo el anlisis de la tarea global.
65
UNIDAD I / FUNDAMENTOS
como el cerebro traduce los estmulos externos e internos, manipula smbolos y expresa por medio de imgenes o representaciones modelos.
66
UNIDAD I / FUNDAMENTOS
En la neurona, son identificadas tres porciones: el cuerpo celular, el rbol dentrital ou dentritos y el axonio. La funcin bsica del axonio es transmitir informacin en forma de pulsos elctricos regenerativos y por medio de sustancias que se transportan en su interior por las diversas partes del sistema nervioso y del organismo. Los dentritos, parte receptiva de la clula nerviosa, tienen como caracterstica ofrecer una amplia rea de contacto para recepcin de informacin por medio de estructuras denominadas sinapses. En las sinapses ocurren las interacciones especficas entre una neurona y la otra. La particularidad de estas intersecciones es la clave para el funcionamiento para el sistema nervioso. Segn Maturana y Varela (1995:1962), el conjunto de neuronas formas la base de un sistema nervioso capaz de actuar y reaccionar de manera compleja, en que cada neurona contribuye en direrentes resdes a partir de diferentes estados del sistema nervioso que prevalecen en un tiempo determinado. Son decenas de billones de neuronas que se contactan entre s que, por su vez, se conectan con muchas clulas. La combinacin de posibles interacciones es ms que astronmica. El sistema nervioso opera con determinacin estructural. Luego, la estructura del medio no puede determinar sus cambios, pero solamente desencadenarlos. De acuerdo con investigaciones de la neurociencia, los sistemas nerviosos fueron evolucionando en la medida en que el organismo fue necesitando adaptarse a los cambios del ambiente. Esa creencia es debida a la capacidad del sistema nervioso en adaptarse o sufrir continuas modificaciones en la medida en que interacta con el ambiente, por medio de aprendizaje. Tanto que la ausencia de ocurrencia de este aprendizaje hace con que el sistema nervioso se habite. Gracias al sistema nervioso, podemos adquirir el conocimiento del mundo que nos rodea a partir de ste efectuar una representacin de este mundo, en un continuo conocer y representar. Para Maturana y Varela, el medio imprime en el sistema nervioso las caractersticas que le son propias y este las utiliza para crear la conducta, como quien usa un mapa para determinar una ruta. La interaccin del sistema nervioso con el ambiente es la prefera sensoria y motora. Es por medio de la percepcin que tomamos conocimiento del mundo que nos rodea.
67
UNIDAD I / FUNDAMENTOS
68
UNIDAD I / FUNDAMENTOS
La percepcin implica en la capacidad de captar eventos o ideas, mezclar, seleccionar y relacionar con las que disponemos. Como bien expresa Kovacs, la percepcin equivale a extraer informacin del caos sensorio y este proceso empieza en la periferia sensoria donde procesos de filtraje, a ejemplo de ventanas limitadas, coloridas y destorcidas, necesariamente, impondrn limitaciones (Kovacs, 1997: 70). Entre los sistemas ms complejos y ms nobles estn la visin y la audicin. Son los responsables por nuestra percepcin del mundo que nos rodea, de la propia naturaleza de nuestro conocimiento. Son las bases de nuestra interlocucin: del lenguaje de la capacidad de contemplacin y manifestacin por medio de representaciones artsticas, como la msica, la pintura, entre otras. Somos o que somos y como somos por ser seres visual-auditivos. Por medio del sistema visual, por ejemplo, tenemos acceso a la naturaleza rica en formas, colores, texturas. La mirada se constituye en un proceso activo y exploratorio, que nos permite extraer informaciones y delinear un mapa cognitivo de la escena o ambiente, condicionados al conocimiento y a nuestros objetivos, Para eso, el sistema visual efecta sucesivas miradas no aleatorias, por saltos bruscos, en que el centro visual es posicionado de un punto a otro de la escena, por medio de un traslado rpido, cuyas imgenes proyectadas en la retina son rpidamente traslaciones en un proceso continuo. Es pausible la hiptesis de que las intricadas redes neuronales, que componen los crtices visuales, tengan como funcin detectar y extraer ciertos patrones elementares, presentes en el estmulo visual primario y, a partir de estos, construir una representacin cognitiva consistente de la escena (Maturana y Varela, 1995:105). Lejos de ser un registro mecnico en discriminar colores, en identificar profundidad en reconocer patrones de forma eficiente e rpida, el sistema visual permtenos ultrapasar imgenes aprehendidas, llevndonos a concebir otras imgenes y agudizando la sensibilidad imaginativa y creativa. El sentido de la visin nos ofrece todava una plataforma metal para conducir nuestros circuitos de abstracciones, visualizando situaciones, buscando soluciones para problemas que muchas veces nada tienen que ver con estmulos visuales primarios (Kovascs, 1997: 94). El proceso de traduccin de un estmulo fsico especfico en cdigo neuronal por cualquiera de los sistemas operativos, segn Kovacs, se puede ser resumido por la secuencia: estmulo fsico alteracin en la permeabilidad de la membrana del receptor primario despolarizacin de la membrana potencial generadora potencial de accin.
69
UNIDAD I / FUNDAMENTOS
Aunque la percepcin no sea la fuente del conocimiento, sin duda es esencial para una primera descripcin del medio que nos cerca permitiendo la mente decodificarla y efectuar representaciones. Nuestra percepcin est estrechamente relacionada con el pensamiento, la resolucin de problemas y los procesos decisorios. La diferencia entre esos puntos se encuentra en el grado de complejidad de la percepcin y su relacin con la situacin real de la resolucin de problemas lo que, sobremanera, se cristaliza alrededor de la naturaleza de la percepcin influenciada por las emociones, proyectos, deseos y/o intenciones inconscientes. (George, 1973:51). Y en ese sentido, se puede realmente decir que esta percepcin es una mediacin necesaria a pesar de que, seguramente, no suficiente para tener conocimiento. 2) Comprensin y Explicacin El eslabn entre la percepcin y el conocimiento es la comprensin. Comprender es expresar de manera intuitiva una sensacin. Una vez habiendo sido sensibilizada con el hecho presentado, la mente busca explicar, relacionar con algo ya conocido y deducir los fenmenos que de all derivan. En la medida en que los estmulos o informaciones perceptibles van siendo comprendidos por la mente, esta busca explicar o aclararlos, dibujando smbolos o fragmentos de smbolos que se pueden o no tomar conscientes. Un proceso, que abarca la clasificacin de los estmulos o informaciones, a nuevas combinaciones y/o a la recognicin de estmulos familiares, es todava una forma de lenguaje en la cual los diferentes cdigos de los sentidos (visin, audicin, etc.) son traducidos para poder comunicarse. El proceso cognitivo consiste en variar las observaciones y las medidas, en formular hiptesis posibles de verificacin, o sea, en saber discernir los elementos esenciales de la situacin observada. Procesos que sern tanto ms refinados cuanto mayor sea la vivencia y la experiencia. La magia aqu esta en la forma como la mente selecciona, filtra las percepciones o informaciones adquiridas y procesa lo que interesa o que est a disposicin para generar ideas, comprensin y el entendimiento. Eso demuestra que las percepciones, luego, la comprensin y el entendimiento difieren de una persona a otra.
70
UNIDAD I / FUNDAMENTOS
3) significacin y Modelacin Una vez comprendidas y explicadas las percepciones o informaciones, se busca traducirlas o representarlas por medio de smbolos e/o modelos. Esas representaciones mentales smbolos e/o modelos pueden internas o externas. Las representaciones internas son las que construimos en el sistema cognitivo para la comprensin del medio en que vivimos, siendo una forma de supervivencia, las externas son las que conseguimos expresar o producir externamente como pinturas, fotografas, objetos, etc. Las representaciones internas pueden ser divididas en analgicas, ms abstractas y proposicionales. Las respuestas analgicas son similares al objeto o imgenes formadas a partir de los sentidos modelos mentales; mientras las proposicionales, ms abstractas, son las organizadas por medio de reglas abstractas y referenciales del sistema cognitivo, independiente de la manera como fueron encontradas; esas representaciones son la cadena de smbolos que corresponden al lenguaje natural, modelos mentales, son anlogos estructurales del mundo e imgenes a los modelos vistos de determinada perspectiva. (Moreira y Masini, 1999:182). Es creble que la mente manipula los smbolos y busca imitarlos, creando modelos de las situaciones con las cuales interacta y que permite no solamente interpretarlos, ms aun entender, prever, influenciar, saber y actuar sobre las situaciones o eventos modelados y, en ltima instancia, el entendimiento. No todas nuestras percepciones generan aprendizaje. Aprender implica tener conocimiento y no solamente informacin. En el da a da, recibimos enormes cantidades de informaciones, de varias formas y por varios medios, captados por nuestros sentidos, pero la mente los descarta o los tiene por un periodo de tiempo en la memoria. El aprendizaje est relacionado al inters. En estos trminos, de acuerdo con el grado de inters que tenemos respecto a algo, el aprendizaje el conocimiento adquirido puede quedar almacenado en una memoria de corto, mediano o largo plazo. El aprendizaje es un proceso de adaptacin a las circunstancias mutables y a la fijacin de los mecanismos de xito y fracaso involucrados en el proceso. () y una adaptacin adquirida como resultado de las transacciones entre el organismo y el medio ambiente (George, 1973:27). Aprender como manejar un vehculo o nadar, pasar a hacer parte de su propia estructura, en cierto sentido.
71
UNIDAD I / FUNDAMENTOS
Podemos decir que conocimiento es la capacidad de la mente en significar o modelar una informacin o un evento y utilizarlos en el momento oportuno. Refleja la habilidad intrnseca del sistema cognitivo de reorganizarse, para generar nuevos conocimientos frente a nuevas necesidades impuestas por el medio.
Consideraciones finales
As siendo, vimos que nuestro proceso cognitivo es esencialmente simblico al formar imgenes e/o smbolos modelos para entender el mundo. Modelos esos que son tambin modificados a partir de nuevas percepciones y nuevos intereses. Modelos anteriores que influencian los modelos subsecuentes, gracias a la percepcin y al debido entendimiento de las representaciones simblicas. De esta manera, cuando escuchamos el sonido o el nombre de una persona conocida, an, cuando sentimos un aroma de algo conocido, nuestra mente busca verificar si ya disponemos de este conocimiento, relacionando con el existente y haciendo emerger una imagen, un significado, un modelo. De igual forma, si nos deparamos con un sonido o una palabra o un concepto que desconocemos, al no encontrar cualquier significacin modelo a ser comparado, nuestra mente busca entender y explicar formando un nuevo modelo o descartndolo cuando no hay inters o necesidad orgnica. Como bien expresa Sacks, cuando abrimos nuestro ojos todas las maanas, nos damos de cara con un mundo que pasamos la vida aprendiendo a ver. El mundo no nos es dado: construimos nuestro mundo a travs de la experiencia, clasificacin, memoria y reconocimiento incesantes (Sacks, 1995:129). Aparentemente, el sistema cognitivo es tal, de forma, que las races del proceso de modelar tal vez estn mucho ms profundas: pensar es una forma de accin, y con muchas el poder de formar cuadros mentales es limitado por su capacidad de establecer modelos de cosa imaginada (Childe, 1971:47). Podemos percibir, por todo lo que los procesos de cognicin los modelos ofrecen abundantes recursos de investigacin por la complejidad frente a sus estructuras biolgicas (campo de la neurociencia) y por los smbolos formados en la mente debido a la percepcin y debido a la comprensin que tenemos del medio en que vivimos. Sin duda, la comprensin de cmo las costumbres, los valores, los objetivos, los ideales orientan o forman nuestras
72
UNIDAD I / FUNDAMENTOS
conductas y nuestras actitudes, puede revelar algunas de las races de nuestra cognicin y, quien sabe, de la cognicin humana en su totalidad. Tal vez aqu resida un camino para llegar a la integracin y al entendimiento humano y su medio.
3.- Agentes y Objetos 4.- Agentes y SE 5.- Agentes e IA 6.- Propiedades de los Ambientes
Qu es un agente?
El aspecto principal sobre los agentes es que son autnomos: son capaces de actuar independientemente, exhibiendo control sobre su estado interno. Por lo tanto: un agente es un sistema de computacin capaz de realizar acciones autnomas en un ambiente.
73
UNIDAD I / FUNDAMENTOS
Un agente inteligente es un sistema de computacin capaz de acciones de forma autnoma y flexible en un ambiente. Por flexible nos referimos a: Reactivo Pro-activo Social
Reactividad
Si se garantiza que el ambiente de un programa es fijo, este no necesita preocuparse por su propio xito o fracaso el programa simplemente se ejecuta ciegamente. Ejemplo ambiente fijo: Un compilador El mundo real no es fijo: las cosas cambian y la informacin es incompleta. Muchos (la mayora?) de los ambientes interesantes son dinmicos. El software para dominios dinmicos es difcil de construir: los programas deben tener en cuenta la posibilidad de falla preguntarse a s mismos si vale la pena realizar una accin. Un sistema reactivo es aquel que mantiene una interaccin constante con su ambiente, y responde a los cambios que ocurren en este (en un tiempo es que la respuesta es til).
Pro-Actividad
Reaccionar ante un ambiente es fcil (ej., reglas estmulo-respuesta) Pero, generalmente queremos agentes que hagan cosas por nosotros. Esto requiere: comportamientos orientados a metas
74
UNIDAD I / FUNDAMENTOS
Pro-actividad = generar y tratar de alcanzar metas; no guiarse solamente por los eventos; tomar la iniciativa Reconocer oportunidades.
Habilidad Social
El mundo real es un ambiente multi-agente: no podemos ir por ah tratando de alcanzar metas son tomar en cuenta a los otros. Algunas metas solo pueden ser alcanzadas con la cooperacin de otros. Lo mismo ocurre con muchos ambientes computacionales; ej. Internet. La habilidad social en agentes es la habilidad de interactuar con otros agentes (y posiblemente con humanos) por medio de algn tipo de lenguaje de comunicacin de agentes, y quizs cooperar con otros.
Otras Propiedades
Movilidad: La habilidad de un agente para moverse dentro de una red electrnica. Veracidad: Un agente no debe a consciencia comunicar informacin falsa. Benevolencia: Los agentes no tienen metas conflictivas, luego todo agente deber tratar siempre de hacer lo que se le ha solicitado. Racionalidad: Un agente siempre actuar en funcin de lograr sus metas. Aprendizaje/Adaptacin: Agentes que mejoran su performance con el tiempo.
Agentes y Objetos
Son los agentes simplemente objetos con otro nombre? Objetos: Encapsulan un estado; Se comunican va pasaje de mensajes; Tienen mtodos, correspondientes con las operaciones que pueden ser realizadas en su estado actual. Principales Diferencias: Son autnomos: Los agentes poseen una nocin de autonoma ms fuerte que la de los objetos; en particular deciden por s mismos si realizar o no una accin requerida por otro agente. Son inteligentes: Capaces de comportamientos flexibles (reactivos, pro-activos); el modelo estndar de objetos no contempla este tipo de comportamiento.
75
UNIDAD I / FUNDAMENTOS
Son activos: Un sistema multiagentes en inherentemente multi-hilos, se asume que cada agente tiene al menos un hilo de control activo. Los objetos lo hacen de gratis. Los agentes lo hacen porque quieren. Los agentes lo hacen por dinero.
Agentes y SE
Sistemas expertos con otro nombre? Tpicamente los SE contienen experticia sobre algn dominio de discurso (abstracto) (ej. Enfermedades sanguneas). Ejemplo: MYCIN. Conocimiento en forma de reglas sobre enfermedades sanguneas.
Principales Diferencias: Los agentes estn situados en un ambiente: MYCIN no Los agentes actan: MYCIN no opera. est enterado del mundo, solo obtiene informacin del usuario. Algunos sistemas expertos en tiempo real (usualmente procesos de control) son agentes.
Agentes e IA
No es el objeto de la IA construir agentes? La IA apunta a construir sistemas que puedan (en ltima instancia) entender el lenguaje natural, reconocer y entender escenas, utilizar el sentido comn, pensar creativamente, etc.- Todo ello muy difcil de lograr.
76
UNIDAD I / FUNDAMENTOS
Un ambiente accesible es aquel en el cul el agente puede obtener informacin completa, precisa y actualizada sobre el estado del ambiente. La mayora de los ambientes moderadamente complejos (incluyendo el mundo fsico e Internet) son inaccesibles. Mientras ms accesible sea el ambiente es ms sencillo construir agentes que funcionen sobre l. Determinstico vs. No-determinstico: Un ambiente determinstico es aquel en el cul cualquier accin tiene un nico efecto garantizado No hay incertidumbre sobre el estado que resultar de realizar una accin. El mundo fsico es no determinstico. Los ambientes no determinsticos son un mayor reto para los diseadores de agentes. Episdico vs. No-episdico: En un ambiente episdico, el funcionamiento de un agente depende de un nmero discreto de episodios, sin que halla relacin entre el funcionamiento del agente en diversos escenarios. Los ambientes episdicos son ms simples desde la perspectiva del desarrollador del agenten porque el agente puede decidir que accin tomar basndose slo en el episodio actual - no necesita reaccionar sobre las interacciones entre el episodio actual y los futuros. Discreto vs. Continuo: Un ambiente es discreto si tiene un nmero fijo y finito de acciones y percepciones. Russell & Norvig: ajedrez! discreto. conductor! contnuo.
77
UNIDAD I / FUNDAMENTOS
suficientemente buena, y hay varios mtodos de bsqueda heurstica que proporcionan formas prcticas de hacerlo. Las estrategias de bsqueda heurstica se caracterizan por la tendencia a limitar el tiempo y el espacio en donde buscar la respuesta a problemas complejos, y asumir que aceptaremos cuando la encontremos una buena solucin, que puede nos ser ptima. En este sentido, aplicamos reglas heursticas o empricas para determinar a lo largo de un recorrido cul es el trayecto que con mayor probabilidad nos lleve a una solucin. Los algoritmos vistos hasta ahora se denominan en general algoritmos de generacin y prueba. En su implementacin ms bsica, los pasos para ejecutarlos son: 1. Generar una posible solucin, ya sea un nuevo estado o un camino a travs del espacio de bsqueda. 2. Probar si ese nuevo estado o camino generado es una solucin comparndolo con un conjunto de estados objetivos. 3. Si es la solucin, determinar. En otro caso, volver al paso1. Realmente es un recorrido a profundidad que realiza una bsqueda exhaustiva del espacio de estados. Si hay una solucin, este algoritmo encontrar, aunque probablemente le lleve mucho tiempo. Para problemas de dimensiones pequeas puede ser efectivo, pero para problemas ms complejos esta bsqueda no guiada es impracticable. Su principal desventaja radica en que no hay ninguna informacin relativa a en qu direccin orientar la bsqueda, por lo que se han desarrollado otras estrategias para incorporar este tipo de conocimiento con el uso de las funciones heursticas. La bsqueda heurstica utiliza informacin adicional sobre el problema especfico, como el coste o la distancia al estado final. Para tener en cuenta esta informacin, los mtodos heursticos utilizan las denominadas funciones de evaluacin heursticas f que calculan o evalan el valor de cada nodo particular en el rbol de bsqueda, dando una idea de lo cerca de lejos que se encuentra en el nodo objetivo. Es decir, son aplicaciones que hacen corresponder a cada estado del espacio de bsqueda en valor numrico cj. f(estadoj)=cj
78
UNIDAD I / FUNDAMENTOS
Con estos valores se puede estimar el coste que llevara recorrer sus ramificaciones, guiando la bsqueda hacia aquellos caminos que parecen ms prometedores. El valor mximo o mnimo de las funciones heursticas debe alcanzarse en un estado meta. Vamos a describir los principales mtodos de bsqueda heurstica.
79
UNIDAD I / FUNDAMENTOS
Para evitar estos extremos locales se han propuesto diversas estrategias. Una consiste, por ejemplo, en forzar un reinicio aleatorio. Cuando no se logra ningn avance significativo se recomienza desde otro nuevo punto. Habitualmente esta tcnica es sufiente para encontrar la solucin. Otro mtodo consiste en aadir ruido a la funcin de evaluacin para lograr salir de los extremos locales. Inicialmente el nivel de ruido es alto y se va reduciendo gradualmente con el tiempo. Esta tcnica, denominada simulated annealing (enfrianmiento o temple simulando) permite al algoritmo explorar direcciones que no son las mejores pero que pueden conducir a una exploracin ms completa del espacio de estados. Como esta tcnica recuerda analoga que se da en los metales cuando son calentados y luego enfriados lentamente, el parmetro que se utiliza en el enfriamiento simulado se denomina temperatura, de forma que una temperatura elevada permite continuar con la bsqueda de forma un tanto aleatoria, mientras que temperatura bajas hacen que el algoritmo vuelva a un comportamiento ms determinista.
Primero el mejor
La bsqueda por primero el mejoro bsqueda preferentemente por lo mejor es una estrategia de control sistemtica que combina las ventajas de los mtodos de bsqueda exhaustiva en amplitud y profundidad. Su principal diferencia con esos mtodos es que en este caso se hace uso de la informacin que proviene de las funciones de evaluacin para ordenar los nodos en la cola. En este sentido se elige como primer nodo el que parece que va a ser mejor (coste mnimo), antes de cualquier otro, sin tener en cuenta su posicin en el rbol grafo. Es decir, se expande el ms prometedor, el que ha resultado mejor evaluado. Con este mtodo siempre se encuentra un mnimo global, por lo que consigue paliar el problema de los extremos locales. Sin embargo, presenta una desventaja: el hecho de que en el algoritmo no se considera el camino recorrido hasta el momento, lo que podra dar lugar a una solucin no idnea. Por ejemplo, si un nodo se encuentra muy cerca de la meta, quizs ya inicialmente, pero hay otro cuya distancia al nodo final es menor aunque suponga un recorrido ms largo, se seleccionar este ltimo debido a esa estimacin de la distancia que no tiene en cuenta el coste acumulado.
80
UNIDAD I / FUNDAMENTOS
Por ejemplo, definimos una funcin coste asociada a cada nodo cuyo valor sea la distancia al nodo meta (figura 2.2). El coste de la generacin de cada sucesor se puede considerar cero o uno. En cualquier caso, va a ser un valor constante.
Los pasos del algoritmo primero el mejor son: 1.- El estado inicial est formado nicamente por el nodo inicial. 2.- Lazo: 2.1 Extraer el nodo inicial. 2.2 Se expresa el nodo y se aaden todos sus sucesores a la cola. Guardar el recorrido. 2.3 Se evala cada uno de los nodos sucesores. Si algn sucesor es la meta, salir. La solucin es el nodo de la lista y el camino recorrido 2.4 Se extrae el nodo con menor coste y se aaden sus sucesores. Guardar el recorrido 2.5 Volver al paso 2.3 El algoritmo aplicado al ejemplo de la figura 2.2, donde la solucin consiste en llegar al nodo F, seria:
81
UNIDAD I / FUNDAMENTOS
El camino recorrido siguiendo los punteros que conduce a la solucin es: HAEDKLF Como se ha hecho notar, con este mtodo no se ha seleccionado el recorrido ms corto en el sentido de correr menos nodos, que hubiera sido por la rama del nodo C, sino que las decisiones se han ido tomando en cada momento segn la distancia estimada en ese punto, no acumulada, aunque el coste acumulado sea menor en esta solucin. Existe una variante denominada bsqueda de haz (beam search), que pretende acelerar el proceso de bsqueda permitiendo explorar ms una rama simultneamente.
Bsqueda avara
Denominada greedy search, este algoritmo es tambin una estrategia derivada del mtodo primero el mejor, y viene a paliar una de sus desventajas. En este caso lo que se intenta es minimizar el coste total para alcanzar la meta. Por lo tanto, siguiendo una estrategia avara, se expandir el nodo que se presuponga ms cercano al nodo final, para minimizar as tambin el recorrido. Desafortunadamente, el coste exacto del recorrido al estado final no se puede calcular de forma precisa por lo que tendemos que conformarnos con una estimacin basada en una funcin heurstica h, en la que se computa para cada nodo el coste estimado desde ese nodo al nodo final por el camino de menor coste. Cuanto mejor sea la estimacin de la funcin h mejor y ms rpidamente se encontrar la solucin. Cuando se llega al nodo meta, la evaluacin de h en ese estado debe ser cero. Es por lo tanto un caso de bsqueda heurstica ya que es esta funcin h la que dirige el recorrido en base a un conocimiento sobre el camino con menor coste. La seleccin de la funcin heurstica es crucial para el funcionamiento del algoritmo y tambin para reducir la complejidad especial y temporal del mismo. Generalmente es un cdigo eficiente ya que suele encontrar la solucin con rapidez, si bien sta no siempre es ptima porque lo que va considerando en cada momento es la
82
UNIDAD I / FUNDAMENTOS
solucin inmediata ms barata, sin una visin global. Tampoco es completa pues puede recorrer una ruta infinita y se estancara en ella sin probar otros caminos alternativos.
Algoritmo A*
Uno de los algoritmos de bsqueda ms conocidos y utilizados en la IA es el A*, que combina la eficiencia del algoritmo de bsqueda avara con el mtodo de coste uniforme que tiene las deseables propiedades de ser ptimo y completo. Es decir, encuentra una solucin siempre y cuando esta exista, incluso para grafos infinitos, y adems no cae en mnimos locales, sino que encuentra el extremo global. Otras de las ventajas de este mtodo es que expande el menor nmero de nodos. Sin embargo, puede tardar mucho en hacer la seleccin entre dos caminos casi iguales por lo que a veces puede requerir mucho tiempo. El mtodo de la bsqueda avara lo hemos descrito en el apartado anterior. Lo que se trata era de reducir al mnimo el coste de la meta h(n). El mtodo denominado de coste uniforme es una variacin de la bsqueda en amplitud donde lo que se busca no son los caminos de menor longitud sino de menor coste, por lo tanto, minimizar la ruta, g(n). Es decir, se expande el nodo con menor coste de ruta, en vez del que tenga menor profundidad, como haca la estrategia en amplitud. Esta bsqueda si es ptima y completa, pero puede ser muy ineficiente. En el algoritmo A* la funcin de evaluacin se calcula sumando estas dos medidas heursticas para cada nodo n: el coste estimado para ir de n al estado meta, h(n); el coste que ha sido necesario para llegar a ese nodo n desde la raz o nodo inicial, g(n). Este ltimo dato no es una estimacin ya que puede ser conocido con exactitud.
La funcin de evaluacin f(n) estima el coste total de camino a la solucin que pasa por el nodo n. f(n) = g(n) + h(n) Es decir, el conocimiento heurstico incorporado a este procedimiento permite evaluar y ordenar los nodos en la lista para dirigirla de forma ms eficiente hacia el nodo meta. Como se puede deducir, el mtodo del coste uniforme es un caso particular del algoritmo A* que tiene lugar cuando n h(n) = 0.
83
UNIDAD I / FUNDAMENTOS
El procedimiento para llevar a cabo este algoritmo es el mismo que el anterior, si bien ahora habr que sumar a la distancia estimada a la meta el camino de menor coste encontrado hasta cada nodo para formar la nueva funcin heurstica. Para el ejemplo de la figura 2.2, el proceso de ejecucin del algoritmo con esta estrategia sera:
Con el cual se obtiene el mismo camino solucin que con el mtodo del primero el mejor. A los arcos que unen los distintos nodos se les puede asociar un coste no constante, en cuyo caso el procedimiento de resolucin sera el mismo pero ahora habra que sumar a cada nodo como valor de g(n) el que indica ese enlace. Como se ha comentado, el algoritmo A* es completo y ptimo siempre y cuando se verifique una instruccin: que la funcin heurstica h(n) sea admisible. Es decir, que la funcin h que se seleccione nunca sobreestime el coste que implica alcanzar la meta. Es por lo tanto una acepcin optimista de la bsqueda. Sin embargo, sigue siendo un mtodo con una complejidad temporal y espacial que generalmente es exponencial. Una conocida modificacin del algoritmo A* es la llamada IDA* (Iterative Deepening A*) o bsqueda por profundizacin iterativa (A*PI), que tiene por objeto garantizar la linealidad respecto a la complejidad espacial. En vez de limitar la profundidad de la bsqueda, este nuevo algoritmo utiliza una limitacin en el coste. Mantiene menos caminos simultneamente que A*, de ah la reduccin del consumo de memoria, pero no dja de encontrar la solucin gracias a que explora mltiples rutas.
Algoritmos genricos
La computacin evolutiva consiste en el desarrollo de algoritmos basados en los mecanismos genticos de seleccin natural de los sistemas biolgicos. Dentro de ella, el paradigma de los Algoritmos Genricos es una de las tcnicas ms populares y relativamente recientes. Surgieron del estudio de los autmatas celulares llevado a cabo por Holland y col. (1975), en la universidad de Michigan.
84
UNIDAD I / FUNDAMENTOS
Los Algoritmos Genricos son un procedimiento de bsqueda y optimizacin heurstica que utiliza una funcin de evaluacin en base a la cual se dirige la bsqueda. Esta funcin heurstica pondera la calidad de cada estado. Su principal ventaja es que permite explorar un amplio espacio de estados. Sin embargo, no son ptimos. Se utilizan cuando lo que se persigue es una solucin aceptable buena en un tiempo razonablemente corto. Basada en la analoga con el comportamiento evolutivo de los seres vivos, las representaciones de las posibles soluciones dentro de un espacio de bsqueda se denominan cromosomas y definen individuos. Estos individuos o soluciones candidatas forman una poblacin, y son manipulados mediante operadores genticos, como la mutacin o cruce, para dar lugar a nuevos individuos ms cercanos a la solucin final. Estos operadores genticos permiten ampliar el espacio de bsqueda. En concreto el operador de cruce introduce gran cantidad de ruido en el proceso para garantizar que se cubre en la exploracin todo el espacio de estados. Se van sucediendo las generaciones de individuos que son elevados mediante una funcin de ajuste que prueba su bondad o cercana a la solucin. Una serie de parmetros determinan el nmero de individuos seleccionados para la siguiente poblacin, el tamao de sta, la forma de seleccionarlos, etctera. El xito de los algoritmos sta en su capacidad de optimizar tanto explorando nuevos puntos en el espacio de bsqueda como explorando la informacin ya descubierta. Es ms, poseen un paralelismo implcito y tienen la habilidad de mantener mltiples soluciones concurrentemente, por lo que son menos susceptibles a mnimos locales y problemas de ruido.
85
UNIDAD 2
REPRESENTACION DEL CONOCIMIENTO Y RAZONAMIENTO
Objetivo: Aplicar las tcnicas de
Es una tcnica usada para la representacin grfica del conocimiento. Un mapa conceptual es una red de conceptos. En la red, los nodos representan los conceptos, y los enlaces las relaciones entre los conceptos en forma de flechas etiquetadas.
Un resumen esquemtico que representa un conjunto de significados conceptuales incluidos en una estructura de proposiciones". (Joseph D. Novak)
Un
Esquema:
dado
que
es
una
representacin
Grafica,
se
simboliza
fundamentalmente con modelos simples (lneas y valos) y pocas palabras (conceptos y palabras enlace), Dibujos, colores, lneas, flechas (conexiones cruzadas)
z
Una Estructura: se refiere a la ubicacin y organizacin de las distintas partes de un todo. En un mapa conceptual los conceptos ms importantes o generales se ubican arriba, desprendindose hacia abajo los de menor jerarqua. Todos son unidos con lneas y se encuentran dentro de valos.
Conjunto de significados: dado que se representan ideas conectadas y con sentido, enunciadas a travs de proposiciones y/o conceptos(frases) Cuando se realiza un mapa conceptual, se obliga a relacionarse, a jugar con los
conceptos, a que se empape con el contenido. No es una simple memorizacin; se debe prestar atencin a la relacin entre los conceptos. Es un proceso activo.
87
Fig 2.1 Definicin de mapa conceptual en un mapa conceptual. El mapa conceptual puede tener varios propsitos: * Generar ideas (brain storming, etc.); * Disear una estructura compleja (textos largos, hipermedia, pginas web grandes, etc.); * Comunicar ideas complejas; * Contribuir al aprendizaje integrando explcitamente conocimientos nuevos y antiguos; * Evaluar la comprensin o diagnosticar la incomprensin; * Explorar el conocimiento previo y los errores de concepto; * Fomentar el aprendizaje significativo para mejorar el xito de los estudiantes; * Medir la comprensin de conceptos. * Clasificar de forma similar a las palabras las cuales se encuentran en las diferentes temticas que se puedan utilizar en el tema dado. Elementos que componen los mapas conceptuales: 1. Concepto 2. La elipse u ovalo
88
3. Palabras de enlace 4. Proposicin 5. Lneas y Flechas de Enlace 6. Las Flechas 7. Conexiones Cruzadas Concepto Un concepto es un evento o un objeto que con regularidad se denomina con un nombre o etiqueta (Novak y Gowin, 1988). El concepto, puede ser considerado como aquella palabra que se emplea para designar cierta imagen de un objeto o de un acontecimiento que se produce en la mente del individuo. (Segovia, 2001). Existen conceptos que nos definen elementos concretos (casa, escritorio) y otros que definen nociones abstractas, que no podemos tocar pero que existen en la realidad ( Democracia, Estado)El concepto, puede ser considerado como aquella palabra que se emplea para designar cierta imagen de un objeto o de un acontecimiento que se produce en la mente del individuo. (Segovia, 2001). Existen conceptos que nos definen elementos concretos (casa, escritorio) y otros que definen nociones abstractas, que no podemos tocar pero que existen en la realidad ( Democracia, Estado) La elipse u ovalo Los conceptos se colocan dentro de la elipse y las palabras enlace se escriben sobre o junto a la lnea que une los conceptos. Muchos autores estn empleando algunos smbolos para incluir, adems de los conceptos y proposiciones, otra informacin como: actividades, comentarios, dudas, teoras... En la representacin visual, adoptan formas y eventualmente colores distintos para cada uno Palabras de enlace Son las preposiciones, las conjunciones, el adverbio y en general todas las palabras que no sean concepto y que se utilizan para relacionar estos y as armar una "proposicin" Ej. : para, por, donde, como, entre otras. Las palabras enlace permiten, junto con los conceptos, construir frases u oraciones con significado lgico y hallar la conexin entre conceptos. Proposicin Una proposicin es dos o ms conceptos ligados por palabras enlace en una unidad semntica.
89
Lneas y Flechas de Enlace En los mapas conceptuales convencionalmente, no se utilizan las flechas porque la relacin entre conceptos esta especificada por las palabras de enlace, se utilizan las lneas para unir los conceptos. Las Flechas Novak y Gowin reservan el uso de flechas "... solo en el caso de que la relacin de que se trate no sea de subordinacin entre conceptos", por lo tanto, se pueden utilizan para representar una relacin cruzada, entre los conceptos de una seccin del mapa y los de otra parte del "rbol" conceptual.. La flecha nos indica que no existe una relacin de subordinacin. Por ejemplo: agua, suelo, fruta. Conexiones Cruzadas Cuando se establece entre dos conceptos ubicados en diferentes segmentos del mapa conceptual, una relacin significativa. Las conexiones cruzadas muestran relaciones entre dos segmentos distintos de la jerarqua conceptual que se integran en un solo conocimiento. La representacin grafica en el mapa para sealar la existencia de una conexin cruzada es a travs de una flecha. Cmo construir un mapa conceptual 1. Seleccionar 2. Agrupar 3. Ordenar 4. Representar 5. Conectar 6. Comprobar 7. Reflexionar Seleccionar Despus de leer un texto, o seleccionando un tema concreto, seleccionar los conceptos con los que se va a trabajar y hacer una lista con ellos. Nunca se pueden repetir conceptos ms de una vez en una misma representacin. Puede ser til escribirlos en notas autoadhesivas (Post-it) para poder jugar con ellos Agrupar Agrupar los conceptos cuya relacin sea prxima. Aunque hay sitios donde se recomienda ordenar antes que agrupar, es preferible hacerlo primero: a medida que
90
agrupamos, habr conceptos que podamos meter en dos grupos al mismo tiempo. De esta forma aparecen los conceptos ms genricos. Representar Explicar cada concepto del tema seleccionado Conectar Esta es la fase ms importante: a la hora de conectar y relacionar los diferentes conceptos, se comprueba si se comprende correctamente una materia. Conectar los conceptos mediante enlaces. Un enlace define la relacin entre dos conceptos, y este ha de crear una sentencia correcta. La direccin de la flecha nos dice cmo se forma la sentencia. Comprobar Comprobar el mapa: ver si es correcto o incorrecto. En caso de que sea incorrecto corregirlo aadiendo, quitando, enseando, cambiando de posicin...los conceptos Reflexionar Reflexionar sobre el mapa, y ver si se pueden unir distintas secciones. Es ahora cuando se pueden ver relaciones antes no vistas, y aportar nuevo conocimiento sobre la materia estudiada. Diferencias respecto al Mapa mental Es un diagrama que se construye de manera personal utilizando palabras clave, colores, lgica, ritmo visual, nmeros e imgenes. El mapa mental rene solo los puntos importantes de un tema e indica de forma sencilla la manera en que estos se relacionan entre s."Un mapa mental consta de una palabra central o concepto, en torno a la palabra central se dibujan de 5 a 10 ideas principales que se refieren a aquella palabra. Entonces a partir de cada una de las palabras derivadas, se dibujan a su vez de 5 a 10 ideas principales que se refieren a cada una de esas palabras.". Para muchas personas las dos tcnicas pueden parecer similares, pero gran parte de su diferencia estriba en la capacidad visual del mapa mental y las conexiones que realiza. El mapa mental busca y exige imgenes para su construccin. Las imgenes y dibujos tienen varias funciones, algunas nemotcnicas, otra para reducir las palabras manteniendo un concepto o idea compleja y tambin para buscar nuevas conexiones. Se sabe que las imgenes conectan rpidamente con otras ideas afines, por lo que parte de la potencia del mapa mental est en su capacidad visual de generar nuevas conexiones y retener las ideas con el hemisferio visual del cerebro.
91
2.2 Redes Semnticas Historia En 1909, Charles Peirce propuso una notacin grfica de nodos y arcos denominada grafos existenciales que l denomin la Lgica del futuro. Entonces empez un debate de larga duracin entre los defensores de la lgica y los defensores de las redes se-m n t i c a ~Desafortunadamente, el debate oscureci el hecho de que las redes semnticas (por lo menos aquellas con un concepto de semntica bien definido) son una forma de Igica. La notacin que proporcionan las redes semnticas para cierta clase de sentencias es a menudo ms conveniente, pero si se deja de lado la interfaz humana, los conceptos base (objetos, relaciones, cuantificacin, etc.) son los mismos. Una red semntica o esquema de representacin en Red es una forma de representacin de conocimiento lingstico en que las interrelaciones entre diversos conceptos o elementos semnticos se les dan la forma de un grafo. Estas redes pueden ser visualizadas como grafos, aunque algunas veces pueden ser tambin rboles. Las redes semnticas pueden ser mapas conceptuales y mentales. Las redes semnticas se utilizan para definir el significado de un concepto mediante su relacin con otros conceptos. Para representarlas se utilizan grafos donde los conceptos representan a los nodos y a los enlaces definen la relacin entre ellos. Los enlaces estn etiquetados en lenguaje natural y especifican la naturaleza de esas relaciones. Guarda una semejanza con la representacin y la terminologa de la programacin orientada a objetos. En un grafo o red semntica los elementos semnticos se representan por nodos. Dos elementos semnticos entre los que se admite se da la relacin semntica que representa la red, estarn unidos mediante una lnea, flecha o enlace o arista. Cierto tipo de relaciones no simtricas requieren grafos dirigidos que usan flechas en lugar de lneas. Existen diversos tipos de relaciones semnticas como la hiponimia, hiperonimia, la meronimia, etc. Dado un conjunto de conceptos, elementos semnticos o trminos relacionados semnticamente mediante alguna relacin semntica, una red semntica representa estas relaciones en forma de grafo. Explcitamente, dado un conjunto de trminos {t1, t2,..., tn} y cierta relacin semntica simtrica entre ellos se construye un grafo G = (V,A) cumpliendo las siguientes condiciones: 1. El conjunto V es el conjunto de vrtices o nodos del grafo. Este conjunto estar formado por n elementos (tantos vrtices como trminos relacionables). A cada uno de los
92
vrtices del grafo representar uno de los trminos, por tanto los vrtices del grafo se llamarn: t1, t2,..., tn. 2. El conjunto A es el conjunto de aristas o lneas del grafo. Dados dos vrtices (trminos) del grafo ti y tj existir una lnea aij que une los vrtices ti y tj si y slo si los trminos ti y tj estn relacionados. Si la relacin no es simtrica, entonces se usan grafos dirigidos para representar la relacin. Los responsables de los primeros esquemas de representacin formalizados fueron Quillian (1968) y Shapiro & Woddmansee (1971). Los esquemas de redes semnticas tienen una fundamentacin psicolgica muy slida, por lo que se han realizado numerosos esfuerzos por llevar a cabo implementaciones importantes basadas en ellas. Las redes semnticas han sido muy utilizadas en Inteligencia Artificial para representar el conocimiento y por tanto ha existido una gran diversificacin de tcnicas. Los elementos bsicos que encontramos en todos los esquemas de redes son: 1. Estructuras de datos en nodos, que representan conceptos, unidas por arcos que representan las relaciones entre los conceptos. 2. Un conjunto de procedimientos de inferencia que operan sobre las estructuras de datos. Bsicamente, podemos distinguir tres categoras de redes semnticas: 1. Redes IS-A, en las que los enlaces entre nodos estn etiquetados. 2. Grficos conceptuales: en los que existen dos tipos de nodos: de conceptos y de relaciones 3. Redes de marcos: en los que los puntos de unin de los enlaces son parte de la etiqueta del nodo.
El mecanismo por el que una red semntica permite inferir conocimiento se denomina propagacin de la activacin. Muestra como dos conceptos o nodos estn relacionados. Aun que puede no ser evidente, tanto los marcos como las redes semnticas son paradigmas muy cercanos a la lgica de predicados. Russell y Norving propusieron en 1995 un mecanismo para transformar el conocimiento de ambas representaciones en expresiones de la lgica de primer orden. La principal diferencie entre estas representaciones del conocimiento radica en su sintaxis, y que unas se basan en representaciones graficas del conocimiento y otras en representaciones formales.
93
Ejemplo de red semntica Existen diversas variantes de las redes semnticas, pero todas son capaces de representar objetos individuales, categoras de objetos y relaciones entre objetos. Una notacin grfica comn visualiza objetos o nombres de categoras en valos o cajas, y los conecta con arcos etiquetados. Por ejemplo, la Figura 2.2 tiene un enlace Miembro De entre Mary y Persona Femenina, correspondiente a la asercin lgica Mary Persona Femeninas de igual modo, el enlace Hermana De entre Mary y John corresponde a la asercin Hermana De (Mary, John). Se pueden conectar categoras usando enlaces Subconjunto De. Es tan divertido dibujar burbujas y flechas que uno puede dejarse llevar. Por ejemplo, se conoce que todas las personas tienen una madre de sexo femenino, por lo tanto se puede dibujar un enlace Tiene Madre desde Personas hasta Persona Femenina? La respuesta es no, porque Tiene Madre es una relacin entre una persona y su madre, y las categoras no tienen madre. Por esta razn, se ha usado una notacin especial (en enlace con caja doble) en la Figura 2.2.
94
informacin parcial, que muchas veces se revisan o se desechan cuando se obtiene nueva informacin o evidencia del dominio. Ej. Se nos dice que alguien tiene un pjaro, pensamos que vuela, si luego nos dicen que es un pingino, ya no pensamos que vuela.
Definicin: La lgica del predicado consiste en un lenguaje para expresar proposiciones y reglas para inferir nuevas proposiciones a partir de las que ya conocemos. Proposicin: Un enunciado lingstico (generalmente en la forma gramatical de una oracin enunciativa) puede ser considerado como proposicin lgica cuando es susceptible de ser verdadero o falso. Es de noche. Aunque existen lgicas polivalentes, en orden a la claridad del concepto, aqu consideramos nicamente el valor de Verdad o Falsedad. Se llama proposicin atmica cuando hace referencia a un nico contenido de verdad o falsedad (equivaldra a la oracin
95
enunciativa simple). Proposicin molecular cuando se obtiene combinando proposiciones atmicas mediante ciertas partculas llamadas conectivas.
Sintaxis: La sintaxis estudia las formas en que se combinan las palabras, as como las relaciones sintagmticas y paradigmticas existentes entre ellas. Para construir las expresiones de la lgica de predicados, se utilizan dos tipos de smbolos:
Smbolos no lgicos, dependientes del universo modelado: 1. un conjunto de smbolos de predicados {p1, p2, ...} con aridad definida. 2. un conjunto de smbolos de funcin {f1, f2, ...} con aridad definida. 3. un conjunto de smbolos de constantes {c1, c2, ...}. Smbolos lgicos, independientes del universo modelado:
1. conectivos lgicos: , , ,,. 2. un conjunto de smbolos de variables {X1, X2, ...}. 3. cuantificadores: (universal) (Smbolos de puntuacin: )
Semntica En trminos generales, una semntica permite atribuir un significado a las expresiones del lenguaje simblico considerado. En el caso de un lenguaje de programacin como C, esta semntica es procedural y consiste en describir el efecto que produce el programa sobre sus estructuras de datos. Para un lenguaje de representacin, lo que interesa es capturar una descripcin del universo modelado. La lgica permite hacer esto asignando un valor de verdad a cada expresin del lenguaje. La semntica de un lenguaje proposicional depende (i) de la interpretacin de los conectivos lgicos, que tienen el mismo significado en todos los dominios, y (ii) de los valores de verdad asignados a las variables proposicionales, distintos segn la situacin reflejada. Dado un lenguaje proposicional L(P), se define su semntica por medio de una asignacin de verdad o valuacin que declara a las variables proposicionales en P como verdaderas o falsas. Tomando a 0 como valor falso y a 1 como valor verdadero, una asignacin de verdad es una funcin s de P en el conjunto {0, 1}: s: P {0, 1}.
96
s1: p s2: p
1 1
Si P tiene n variables proposicionales, entonces a priori hay 2n valuaciones posibles, aunque no todas tengan sentido en el universo modelado.
Validez Una expresin X de L(P) es vlida siempre y cuando es siempre verdadera, es decir, si y slo si, para toda valuacin s: P {0, 1} se cumple s(X) = 1. Estas expresiones, que son verdaderas independientemente del universo modelado, tambin son llamadas tautologas.
La validez de una expresin lgica puede verificarse exhaustivamente mediante una tabla de verdad. Por ejemplo, para la expresin (((p q) la conclusin [q] es cierta": p) q), que corresponde al modus ponens "si la premisa mayor [p implica q] es cierta y la premisa menor [p] es cierta, entonces
p q (p q) ((p q) 00 01 10 11 1 1 0 1 0 0 0 1
p) (((p q) 1 1 1 1
p)
q)
Otro ejemplo trivial de tautologa es cualquier expresin de la forma (X X). Tambin, si X y Y son expresiones lgicamente equivalentes, entonces (X Y) es una tautologa. La importancia de las tautologas desde el punto de vista computacional radica en el hecho que se pueden estudiar y aplicar en forma general. Pertenecen al sistema lgico, y no al dominio de aplicacin.
97
Inferencia Inferir es concluir o decidir a partir de algo conocido o asumido; llegar a una conclusin. A su vez, razonar es pensar coherente y lgicamente; establecer inferencias o conclusiones a partir de hechos conocidos o asumidos. El proceso de razonamiento, por lo tanto, involucra la realizacin de inferencias, a partir de hechos conocidos. Realizar inferencias significa derivar nuevos hechos a partir de un conjunto de hechos conocidos como verdaderos. La lgica de predicados proporciona un grupo de reglas slidas, con las cuales se pueden realizar inferencias. Las principales Reglas de Inferencia son: Modus ponens.- Es la ms importante, en los sistemas basados en conocimiento. Establece que: Si las sentencias p y (p inferir que q tambin es verdadera. Modus tolens.- Esta regla establece que: Si la sentencia (p tambin es falsa. Resolucin.- Utiliza refutacin para comprobar una determinada sentencia. La refutacin intenta crear una contradiccin con la negacin de la sentencia original, demostrando, por lo tanto, que la sentencia original es verdadera. La regla de resolucin, establece que: Si (A B) es verdadero y (~B verdadero. C) es verdadero, entonces (A C) tambin es q) es verdadera y q es falsa, entonces se puede inferir que p q) se conocen que son verdaderas, entonces se puede
98
"
A,
"
B,
"
C,
[mayor
(A,
B)
mayor
(B,
C)
mayor
(A,
C)]
Abduccin.- Es un mtodo de razonamiento comnmente utilizado para generar explicaciones. A diferencia de la induccin, la abduccin no garantiza que se puedan lograr conclusiones verdaderas, por lo tanto no es un mtodo slido de inferencia. La forma que tiene la abduccin es la siguiente: Si la sentencia (A B) es verdadera y B es verdadera, entonces A es posiblemente verdadera. En abduccin, se empieza por una conclusin y se procede a derivar las condiciones que podran hacer a esta conclusin vlida. En otras palabras, se trata de encontrar una explicacin para la conclusin. Induccin.- Se define como el razonamiento a partir de hechos particulares o casos individuales, para llegar a una conclusin general. El mtodo inductivo es la base de la investigacin cientfica. La forma ms comn del mtodo inductivo es la siguiente: Si se conoce que P(a), P(b), ......, P(n) son verdaderos, entonces se puede concluir que " X, P(X) es tambin verdadero. La induccin es una forma de inferencia muy importante ya que el aprendizaje, la adquisicin de conocimiento y el descubrimiento estn basados en ella. Al igual que la abduccin, la induccin no es un mtodo slido de inferencia. El razonamiento deductivo es una forma monotnica de razonar que produce argumentos que preservan la verdad. En un sistema monotnico todos los axiomas utilizados se conocen como verdaderos por sus propios mritos, o pueden ser derivados de otros hechos conocidos como verdaderos. Los axiomas no pueden cambiar, ya que una vez que se los conoce como verdaderos, siempre permanecen as y no pueden ser modificados o retractados. Esto significa que en el razonamiento monotnico el conjunto de axiomas continuamente crece en tamao. Otro aspecto del razonamiento monotnico es que si ms de una inferencia lgica puede ser hecha a un tiempo especfico y una de ellas se realiza, las inferencias que quedan sern todava aplicables despus que dicha inferencia haya sido hecha.
99
Si la negacin de una sentencia entra en contradiccin con los hechos de nuestra base de conocimiento es porque lo contrario, es decir, la sentencia original era verdadera y se puede deducir lgicamente de las sentencias que componen dicha base de conocimientos.
PROLOG Las ideas bsicas de la programacin en lgica desarrolladas por Robinson, Kowalski y otros fueron implementadas en 1971, por Alain Colmerauer, en la Universidad de Marsella (Francia), en un sistema que se llam originalmente SISTAMA Q y que luego se hizo conocido con el nombre de PROLOG
(Programing in Logic). Prolog es un lenguaje de programacin en lgica basado en el Principio de Resolucin lineal de Robinsn, que trabaja con clusulas, especficamente con las clusulas de Horn. Utiliza un sistema de inferencia denominado mquina PROLOG, basada en el principio de resolucin de Robinsn, el cual permite deducir lgicamente las respuestas a las consultas realizadas en base al conocimiento que previamente se ha incorporado. Utiliza el mtodo de resolucin "Top-Down" y una tcnica de la lgica formal llamada clculo de predicados para representar el conocimiento. Un programa en Prolog consiste en la declaracin de un conjunto de hechos, que reciben el nombre de base de conocimiento o base de datos y un conjunto de reglas que hacen uso de la base de conocimiento y de otras reglas, este conjunto de reglas recibe el nombre de base de conocimiento procedurales.
100
Cada una de las clusulas y hechos son independientes del resto lo que les da a los programas en Prolog un carcter modular. Las variables, como son independientes para cada clusula, hacen de Prolog un lenguaje distinto al resto de los convencionales, al no ser de naturaleza algortmica. Es un intento por llegar a un lenguaje declarativo en el cual el usuario formule el conocimiento que quiere representar, a travs de conjuntos de hechos y reglas y con lenguaje similar al lenguaje natural. Prolog constituye una herramienta extremadamente til para la construccin de sistemas basados en conocimiento. Prolog es un lenguaje que a pesar de poseer limitaciones tales como: incompletitud en las demostraciones de teoremas, algoritmos de control ligados al orden de las clusulas y el cuestionamiento general que se hace al formalismo lgico, se ha logrado demostrar su eficacia como herramienta til a las aplicaciones propias de la IA. El ha sido capaz de enriquecerse con caractersticas que permiten el tratamiento de gramticas, la aceptacin de la negacin, predicados de entrada y salida y predicados para restringir y orientar mejor las bsquedas a travs de meta reglas.
Ejemplo: Razonamiento de sentido comn, el cual establece conclusiones a partir de informacin parcial, que muchas veces se revisan o se desechan cuando se obtiene nueva informacin o evidencia del dominio. Ej. Se nos dice que alguien tiene un pjaro, pensamos que vuela, si luego nos dicen que es un pingino, ya no pensamos que vuela. Para resolver problemas para los que se carece de una teora slida y contrastada, se crean reglas o leyes que permiten realizar un tipo de razonamiento denominado razonamiento por defecto. Una de las posibles soluciones al razonamiento por defecto es la aplicacin de las denominadas lgicas no montonas. Las lgicas clsicas parten del carcter no excluyente de los nuevos axiomas aadidos a los ya existentes. Por el contrario, las lgicas no montonas tienen en cuenta la necesidad de detectar posibles inconsistencias con los nuevos axiomas. El rango definitorio es que se tienen en cuenta lo que no se conoce, o lo que es lo mismo asume los lmites de su propio conocimiento.
101
Formalismos
z
Lgica no-montona: Poder representar leyes como Si x es un ser humano, entonces x puede andar, a menos que haya algo que lo contradiga. Para ello se amplia la lgica de primer orden introduciendo el operador modal M (es modal ya que indica una modalidad de verdad). Es necesario establecer un mecanismo de mantenimiento de coherencia generalmente traducido como mantenimiento de verdad (truth maintenance)- que permita eliminar el supuesto en cuanto se presente un hecho que lo invalide.
Lgica por-defecto: Muy parecido al anterior, pero el operador M ya no hace la funcin de un operador modal capaz de formar sentencias Mp supuestamente vlidas en el sistema; en su lugar dicho operador slo aparece en las reglas de inferencia denominadas reglas por defecto definidas al efecto. Los enfoques presentados sobre el razonamiento no montono se pueden tildar de
permisivos en el sentido de que posibilitan la obtencin de suposiciones cuando no existen evidencias que las contradigan. Es decir, El razonamiento montono, utiliza contradicciones para procesar. Elimina un hecho (factor de conocimiento) obteniendo la contradiccin hasta que llega a una conclusin final. Tambin puede realizarse un enfoque restrictivo del problema donde slo se considera vlido lo que se ha comprobado como cierto. Un ejemplo de este tipo es la consideracin de la circunscripcin de un predicado.
Formalismos Lgica no-montona: Poder representar leyes como Si x es un ser humano, entonces x puede andar, a menos que haya algo que lo contradiga. Para ello se amplia la lgica de primer orden introduciendo el operador modal M (es modal ya que indica una modalidad de verdad). Es necesario establecer un mecanismo de mantenimiento de coherencia generalmente traducido como mantenimiento de verdad (truth maintenance)- que permita eliminar el supuesto en cuanto se presente un hecho que lo invalide.
102
de un operador modal capaz de formar sentencias Mp supuestamente vlidas en el sistema; en su lugar dicho operador slo aparece en las reglas de inferencia denominadas reglas por defecto definidas al efecto.
Los enfoques presentados sobre el razonamiento no montono se pueden tildar de permisivos en el sentido de que posibilitan la obtencin de suposiciones cuando no existen evidencias que las contradigan. Es decir, El razonamiento montono, utiliza contradicciones para procesar. Elimina un hecho (factor de conocimiento) obteniendo la contradiccin hasta que llega a una conclusin final. Tambin puede realizarse un enfoque restrictivo del problema donde slo se considera vlido lo que se ha comprobado como cierto. Un ejemplo de este tipo es la consideracin de la circunscripcin de un predicado.
Qu es el conocimiento? El conocimiento, en su sentido ms amplio, es una apreciacin de la posesin de mltiples datos interrelacionados que por s solos poseen menor valor cualitativo. Significa, en definitiva, la posesin de un modelo de la realidad en la mente. El conocimiento comienza por los sentidos, pasa de estos al entendimiento y termina en la razn. Igual que en el caso del entendimiento, hay un uso meramente formal de la misma, es decir un uso lgico ya que la razn hace abstraccin de todo un contenido, pero tambin hay un uso real. Saber es el conjunto de conocimientos que producen un pensamiento continuo de recuerdos de los conocimientos adquiridos a lo largo del tiempo.la racionalidad humana permite el conocimiento que se deriva en el saber y el conocer.
1. El conocimiento es una relacin entre sujeto y objeto. 2 Si a un ser se le considera como un objeto es por la relacin a un objeto, y si a otro se le considera como a un sujeto es por la relacin a un sujeto.
103
Objeto, Operacin y Representacin interna) de tal manera que si fuera uno de estos, aquel no existe.
Visin filosfica clsica Segn Platn, el conocimiento se caracteriza por ser necesariamente verdadero (episteme). De otro modo, la verdadera creencia y opinin (ignorante de la realidad de las cosas) quedan relegadas al mbito de lo probable y lo aparente. Una certeza que el da de maana probara ser falsa, en verdad nunca habra sido conocimiento. Y en efecto, esta vinculacin entre conocimiento-verdad-necesidad forma parte de toda pretensin de conocimiento filosfico, cientfico, en el pensamiento occidental.
Visin cientfico/tcnica En ciencias de la informacin, se acostumbra a definir un continuo progresivamente complejo, integrado por los datos, la informacin, el conocimiento y la sabidura. As, se define al conocimiento como el conjunto organizado de datos e informacin destinados a resolver un determinado problema.
Esquema sobre el conocimiento desde el punto de vista de las ciencias de la informacin, como se genera y como se aplica. Para alcanzarlo se aplica un mtodo existiendo as mltiples vas de llegar obtener el conocimiento: mtodo emprico, mtodo histrico, mtodo lgico, analoga, etc.
104
En general, para que una creencia constituya conocimiento cientfico no basta con que sea vlida y consistente lgicamente, pues ello no implica su verdad. As por ejemplo, tngase un sistema lgico deductivo consistente y vlido. Niguese la totalidad de las premisas del sistema, y se obtendr un sistema igualmente consistente y vlido, slo que contradictorio al sistema previo. De tal manera, validez no garantiza verdad. Para que una teora deba ser considerada como verdadera, deben existir, desde el punto de vista de la ciencia, pruebas que la apoyen. Es decir, debe poder demostrarse su verosimilitud empleando el mtodo cientfico, tambin conocido como mtodo experimental. Ello sin embargo se ve seriamente complicado si se introducen interrogantes relativas a la suficiencia de dicho mtodo, como por ejemplo, la transparencia de los hechos (existen los hechos puros o ms bien interpretaciones?), la factibilidad de la pretensin de objetividad y neutralidad valrica (es posible la comprensin de la realidad desde un punto de vista neutro, tal como fuera el de un dios, o estamos condenados a perspectivas?), etc.
105
probabilidades (probabilidad matemtica), todo ser humano participa del pensamiento probabilstico (probabilidad subjetiva). Esto quiere decir que no se necesita estar entrenado formalmente en el clculo de probabilidades: la capacidad de pensar e trminos de probabilidades es inherente a nuestra condicin de seres humanos. Por ejemplo, una persona dice: En Puno hubo una helada la otra noche y uno posiblemente infiera: Los pollos del to Pedro probablemente no la han sobrevivido Esta inferencia se basa en el conocimiento que se tiene de los efectos de la helada, adquiridos a partir de la experiencia. Dichas inferencias son parte de la forma en que est estructurado el pensamiento humano y no dependen de entrenamiento matemtico alguno. Estas probabilidades suelen ser subjetivas en el sentido en que diversas personas pueden conceder probabilidades diferentes al mismo acontecimiento. Un componente fundamental en inferencia, tanto clsica, como bayesiana es el razonamiento probabilstico condicional, que permite incorporar cambios en nuestro grado de creencia sobre los sucesos con una nueva informacin. El razonamiento probabilstico condicional se aplica tambin en el diagnstico, evaluacin y toma de decisiones. Sin embargo, incluso cuando las investigaciones previas han informado de errores en el razonamiento probabilstico condicional, no se encuentra un instrumento comprensivo que evale, el conocimiento formal, y los sesgos de razonamiento en una nica aplicacin. Condicionamiento y causacin. Algunas personas identifican como similares condicionalidad y causalidad, aunque la relacin condicional P(A/B) puede ser debida a una relacin diagnstica si A es causa de B (Tversky y Kahneman, 1982 a). La principal ventaja del razonamiento probabilstico sobre el razonamiento lgico es que el primero permite tomar decisiones racionales an en los casos en que no haya suficiente informacin para probar que cualquier accin dada funcionar.
Probabilidad en la vida cotidiana El azar est presente en la vida cotidiana en muchos contextos en los que aparecen nociones de incertidumbre, riesgo y probabilidad, por ejemplo, el pronstico del tiempo, diagnstico mdico, estudio de la posibilidad de tomar un seguro de vida o efectuar una inversin, evaluacin de un estudiante, etc. No slo los profesionales, sino cualquier persona ha de reaccionar a mensajes en que aparecen estos elementos, tomar decisiones que le
106
pueden afectar, emitir juicios sobre relacin entre sucesos o efectuar inferencias y predicciones (Gigerenzer, 2002). En estas situaciones la probabilidad no es una propiedad fsica tangible- por tanto objetiva de los sucesos que nos afectan (como sera el peso, color, superficie, temperatura) sino una percepcin o grado de creencia en la verosimilitud de la persona que asigna la probabilidad sobre la plausibilidad de ocurrencia del suceso (que ocurrir o no).
Donde:
P(Ai) son las probabilidades a priori. P(B | Ai) es la probabilidad de B en la hiptesis Ai. P(Ai | B) son las probabilidades a posteriori.
Esto se cumple
107
El Teorema de Bayes se apoya en el proceso inverso al del Teorema de la Probabilidad Total Teorema de la probabilidad total: a partir de las probabilidades del suceso A (probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad del suceso B (que ocurra un accidente). Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un accidente) deducimos las probabilidades del suceso A (estaba lloviendo o haca buen tiempo?).
Primer ejemplo. El servicio meteorolgico ha anunciado tres posibilidades para el fin de semana:
a) Que llueva: probabilidad del 50%. b) Que nieve: probabilidad del 30% c) Que haya niebla: probabilidad del 20%.
Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un accidente es la siguiente:
a) Si llueve: probabilidad de accidente del 20%. b) Si nieva: probabilidad de accidente del 10% c) Si hay niebla: probabilidad de accidente del 5%.
Resulta que efectivamente ocurre un accidente y como no estbamos en la ciudad no sabemos que tiempo hizo (llovi, nev o hubo niebla). El teorema de Bayes nos permite calcular estas probabilidades:
108
Las probabilidades que manejamos antes de conocer que ha ocurrido un accidente se denominan "probabilidades a priori" (lluvia con el 50%, nieve con el 30% y niebla con el 20%). Una vez que incorporamos la informacin de que ha ocurrido un accidente, las probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B), que se denominan "probabilidades a posteriori".
Existen planes para desarrollar una herramienta capaz de clasificar un texto, esto es determinar a qu clase pertenece el texto, de entre un conjunto de clases dadas a priori.
Ejemplos.
a) Dada una noticia de un peridico, clasificarla como de opinin, sucesos, cultural, poltica, deportiva, pronstico del tiempo, local, nacional, internacional, etc.
b) En el rincn del vago, se reciben unos apuntes enviados por Juan Buena-voluntad, pero ste olvida decir a qu categora (o subcategora) pertenecen.
Solucin
Aunque hay muchas formas de abordar este problema, se propone un procedimiento basado en el Algoritmo de Clasificador Naive de Bayes.
109
UNIDAD 3
SISTEMAS DE RAZONAMIENTO LGICO
Objetivo: Aplicar la representacin basada en reglas de produccin, en la solucin de problemas basados en conocimiento.
asignatura_elegida_robtica. Esta regla tiene dos clusulas antecedentes unidas por la conjuncin, y una clusula simple como consecuente. Una regla establece una relacin entre las clusulas (aserciones o hechos) y, dependiendo de la situacin se pueden usar para generar nueva informacin (imperativa) o probar la veracidad de una asercin (declarativa). Por ejemplo, en el caso anterior, si sabemos que una asignatura para ser seleccionada debe ser interesante y tener un horario compatible con otras obligaciones para
111
el alumno, podremos concluir que la asignatura elegida es robtica, y aadir ese hecho a nuestra base de conocimiento. Por otro lado, podramos querer intentar probar que robtica es la asignatura elegida, para lo cual se necesitara saber si es una asignatura con un contenido interesante y si su horario es compatible. Aunque se vera con ms detalle en el siguiente captulo, el primer caso razona con encadenamiento hacia adelante, usando hechos y reglas para derivar nuevos hechos, y en el segundo hacia atrs, intentando probar un enunciado que sta en el consecuente de una regla demostrando que los antecedentes de la misma son verdaderos. Se dice que una regla se ha activado o disparado cuando su antecedentes son ciertos. Una base de reglas puede contener varias reglas cuyos antecedentes se verifiquen. En este caso, ser la estrategia de control la que decida cul se dispara o en qu orden lo hacen. La mayora de los sistemas de conocimiento tienen una base de reglas formada por varias de ellas, y etiquetas secuenciales: regla 1, regla 2,.. En algunos casos pueden venir descritas por alguna palabra clave que permita una rpida identificacin de las mismas, sobre todo durante el proceso de inferencia. Esto permite obtener una traza de las reglas que se han activado para llegar a una determinada conclusin, lo que aade conocimiento al sistema y permite depurar la base de reglas o validar su consistencia. Algunos sistemas basados en conocimiento permiten unir sus clusulas
antecedentes mediante disyunciones (or), para reducir el tamao d una base de reglas. Por ejemplo, si tenemos: Regla 1: si curso = 4 entonces ciclo_estudios = segundo Regla 2: si curso = 5 entonces ciclo_estudios = segundo Regla 3: si (curso = 4 or curso =5) entonces ciclo_estudios = segundo La regla 3 puede reemplazar a las reglas 1 y 2 en la base de reglas. La mayora de los sistemas basados en reglas permiten el uso de operadores booleanos para expresar estas relacione. Regla 4: si (curso > 3 and curso < 6) entonces ciclo_estudios = segundo
112
En el consecuente tambin pueden definirse acciones o aserciones simultneas, aunque lo habitual es desdoblarlas en tantas reglas como operaciones derivadas de la conclusin haya. Por ejemplo, Si tema_interesante = robots y horario_robtica = posible entonces
asignatura_elegida = robtica y accin_a_realizar = matricularse. La primera conclusin indicara una afirmacin (declarativa) y la segunda una accin (imperativa). Otra caracterstica que se puede incorporar a la sintaxis de las reglas es el grado de confianza o factor de certeza (CF). Esto puede resultar interesante si la aplicacin trata con datos de incertidumbre, o si queremos aadir un factor de certeza que pondere la conveniencia de aplicar una regla. Por ejemplo, Si (realizacin_examen = floja) y (criterio_correccin_estricto > 80%) entonces (posibilidad_suspenso = alta) con CF: 90. Esta regla se interpretara diciendo que si la realizacin del examen es floja con una probabilidad de ms del 80% de ser corregido con criterios estrictos, entonces estamos seguros en un 90% de que el alumno se suspender. Si por ejemplo tenemos poca confianza en los criterios de correccin y pensamos que eso va a ayudar al alumno, podremos bajar el factor de certeza a un 50%. La mayora de los sistemas basados en reglas admiten que las clusulas
antecedentes invoquen funciones. Estas funciones se denominan sensores por que chequean una condicin del entorno. Habitualmente los sensores devuelven valores booleanos pero tambin pueden proporcionar datos o hechos. Cuando desde el consecuente se pueden invocar funciones, stas se denominan actuadores, y permiten expandir notablemente la capacidad de actuacin del sistema basado en conocimiento. Un actuador convierte una regla de un mecanismo de generacin de hachos a un mecanismo de generacin de acciones. Esta diferenciacin ser fundamental a la hora de distinguir, por ejemplo, un sistema experto de un sistema con lgica borrosa. Es el caso de la regla: Si sensor (detecta_obstculo) entonces actuador (para_robot)
113
Cuando en las clusulas los datos y las instancias aparecen explcitamente, como se ha mostrado hasta ahora, las reglas constituyen una lgica de primer orden, con una capacidad expresiva por lo tanto muy limitada. Cada objeto o elemento requiere una regla particular, por lo que el nmero de stas seria elevadsimo incluso en aplicaciones un poco complejas. Para dotar de capacidad de generalizacin a las reglas se utilizan variables, que admiten como posibles valores distintos datos. Se ha transformado el formalismo a nivel de la lgica de predicados. Por ejemplo, la regla Todos los alumnos de informtica son estudiosos se puede expresar en la lgica de predicados como: x, alumno_informtica (x) estudioso (x) Para introducir variables se utilizan distintas convenciones; una de ella es denotarlas anteponiendo el signo de interrogacin, con lo que la regla se convertira ahora en: Si ?x es alumno_informtica entonces ?x es estudioso Con un nmero no muy elevado de reglas, el conocimiento intuitivo que se puede tener de un dominio de conocimiento se mantiene. Sin embargo, cuando el nmero de stas es muy alto, su legibilidad se pierde y resulta ms difcil interpretarlas. Por eso en algunos sistemas basados en reglas stas se agrupan en bloques de conocimiento segn hagan relacin a aspectos especficos del dominio. Otra dificultad que puede presentar esta representacin en reglas de actualizacin de la informacin. Es difcil mantener la consistencia de una base de reglas cuando se aade informacin en forma de nuevas reglas, o se modifican, por ejemplo, los consecuentes de algunas de ellas. De hecho, hay un tipo de razonamiento denominado no-montono que describe la actualizacin de una base de conocimientos cuando se dispone de una nueva informacin y sta lleva a retraernos de algunos hechos que habamos deducido como ciertos. La mayora de los sistemas de razonamiento, como la lgica de predicados, son montonos, es decir, aadir informacin no supone invalidar o retirar conocimiento de la base de datos. Pero en las lgicas no montonas puede ocurrir que tengamos que cambiar o revocar unos hechos o aserciones establecidos en la base. Por ejemplo, puede existir una regla de la que se derive que hay un fuego por que ha saltado la alarma de incendios de un edificio. Sin embargo, nos puede llegar una informacin adicional de que estn revisando el sistema de alarmas y la
114
han disparado para comprobar su nivel de sonoridad. Esto puede llevarnos a retirar nuestra conclusin o al menos a reducir nuestro grado de certeza a la hora de aceptarla. En el siguiente captulo se detallarn tipos de razonamiento que se aplican a los sistemas de conocimiento basado en reglas, y que permiten inferir nuevo conocimiento basados en reglas, y que permiten inferir nuevo conocimiento a partir de ellas. Hasta aqu se han mostrado como un formalismo muy utilizado por la IA en el desarrollo de los sistemas inteligentes.
115
Herramienta muy potente: unas pocas reglas permiten una gran potencia de clculo. Utilizacin extendida tanto en diversos pases como en muy distintos mbitos y aplicaciones. Campo abierto a la investigacin como avalan miles de artculos anuales en revistas y congresos cientficos internacionales. Como todas las estrategias de la IA, la lgica borrosa emula una de las funcionalidades inteligentes de los seres humanos, en este caso, el razonamiento con incertidumbre. De hecho tambin se denomina la lgica del sentido comn porque proporciona un fundamento al razonamiento aproximado, propio del raciocinio humano. Esta forma de representar el conocimiento se centra en el lenguaje natural, incorporando la imprecisin que es propia. La imprecisin no reside en el contenido de la informacin, sino que est en la misma esencia del lenguaje y del pensamiento y las emociones humanas. El origen de esta potente herramienta computacional de la IA se debe a Lofti Zadeh, profesor de la Universidad de California en Berkeley, que en 1965 public en la revista Information and control un artculo titulado Fuzzy sets. Este artculo supuso una concepcin totalmente distinta de uno de los pilares de la matemtica: el concepto de conjunto. Poco despus aparecan los algoritmos borrosos y la lgica fuzzy como tal, as como la Teora de la Posibilidad, con la que se formaliza la idea de la inferencia borrosa de una manera rigurosa. Zadeh justifica los primeros xitos prcticos de sus trabajos tericos con la frase el mundo real es fuzzy. Y aade: Hay muchas cosas que no vale la pena preguntarse con precisin, y para tratar de ellas hace falta reglas que manejen la inexactitud. El terico de Berkeley ironiza sobre los que buscan intilmente la perfeccin al comentar que la mayora de acciones de la vida real pueden efectuarse, precisamente, porque no hace falta hacerlas de manera prefecta. Esta idea subyace en los primeros trabajos de Zadeh, que ve las deficiencias del lenguaje preciso en el rea de la automatizacin y el control, lo que le lleva a enunciar su conocido Principio de la incompatibilidad: a medida que la complejidad de un sistema aumenta, disminuye nuestra capacidad para hacer afirmaciones precisas, incluso significativas, sobre su comportamiento, hasta que se alcanza un umbral ms all del cual precisin y relevancia son caractersticas casi mutuamente excluyentes (Zadeh, 1973). Esto
116
quiere decir que resultados muy precisos suelen tener poco significado, y lo que puede interesar en muchos casos son resultados cualitativos. Por otro lado, el hombre aprende bien una serie de tareas de informacin imprecisa. Por ejemplo, en el aprendizaje de conduccin de vehculos, solo unas cuantas indicaciones vagas: levante ligeramente el pie del acelerador, gire un poco a la derecha, apriete ms el embrague.., son suficientes para adquirir esta habilidad. Existen, sin embargo marcos donde la precisin es deseable y en algunos casos necesaria e imprescindible. En resumen, la lgica borrosa surge ante la necesidad de formalizacin del razonamiento con incertidumbre: intenta abordar problemas definidos en trminos lingsticos, y por lo tanto, imprecisos, donde los datos estn expresados en los trminos cualitativos que utilizaran los expertos humanos. Generalmente nosotros hacemos inferencias imprecisas; la lgica multivaluada no permite hacer ese tipo de inferencias con matices (difcil, muy difcil,...), imposibles de abordar con la simple extensin del conjunto de valores de verdad. Ese tipo de inferencia imprecisa es el que pretende afrontar la lgica borrosa.
117
probabilstica. Cualquier sistema lgico puede hacerse borroso; el razonamiento exacto se contempla como un caso limite del razonamiento aproximado. Concretamente, en lgica borrosa se puede hablar del grado de verdad de una determinada sentencia o de la probabilidad que tiene la sentencia de ser verdadera. Entre otras caractersticas que diferencian a la lgica borrosa de la lgica tradicional cabe tambin destacar: a) Como ya se ha comentado, el grado de verdad de una aseveracin en la lgica bivalente toma un valor entre un conjunto finito de valores: verdadero o falso; en la lgica borrosa, el grado de verdad es un subconjunto que se puede expresar como verdadero, muy verdadero, bastante falso, no muy falso, etc. b) En la lgica clsica los predicados son concretos, mientras que en la lgica borrosa pueden ser tanto ntidos como borrosos. c) La lgica polivalente y la bivalente como caso particular admite slo dos cuantificadores: el universal para todo, , y el existencial existe un... tal qu, . La lgica borrosa admite adems una gran variedad de cuantificadores borrosos, como muchos, pocos, algunos, la mayora, etc. Estos se pueden interpretar como nmeros borrosos que dan una caracterizacin imprecisa del cardinal de un conjunto borroso o clsico. Desde esta perspectiva, un cuantificador borroso se puede considerar como un predicado borroso de segundo orden. d) A diferencia de la lgica de predicados de primer orden, donde el nico modificador que existe es la negacin no, la lgica borrosa incorpora una gran variedad de modificadores de predicados como muy, algo, no, casi, etc. Asignando operaciones para definir cada uno de estos modificadores se consigue realizar clculos con las variables lingsticas, propias de la lgica borrosa. e) Este tipo de razonamiento aproximado permite distintas interpretaciones de las sentencias: casi cierta, muy falsa, poco verdadera, etc.
La lgica borrosa tendr por una parte, el mismo aspecto sintctico de la lgica d predicados, y por otra, su semntica se basa en el concepto de borrosidad que se formaliza en la teora de conjuntos borrosos.
118
Como no siempre e posible hacer esta clara distincin entre los elementos que pertenecen y los que no pertenecen a un conjunto, el concepto de uncin de pertenencia puede generalizarse d manera que su valor vari de forma continua en un intervalo, admitiendo la posibilidad de pertenencia parcial de un elemento a un conjunto. Cuanto mayor sea el valor de la funcin de pertenencia, mayor ser el grado de pertenencia del elemento al conjunto en cuestin. Cada uno de los elementos predicables de
119
esos conjuntos pertenece con un cierto grado a un conjunto borroso. No tiene un sentido probabilstico, como en otras lgicas, sino ms bien representa un grado de compatibilidad con un cierto predicado o un grado de posibilidad de que este sea cierto. La funcin de pertenencia generalizada de un elemento x a un conjunto A, A(x), no solo valdr 1 o 0, sino que toma sus valores en un conjunto L, llamado conjunto de pertenencia. Los elementos de L no tienen que ser necesariamente nmeros; cualquier conjunto total o al menos parcialmente ordenado seria igualmente vlido. El orden entre los elementos del conjunto est representado por los distintos grados de pertenencia que representan. Ordinariamente se toma el conjunto de nmeros reales comprendidos entre 0 y 1, inclusive: L = [0,1]. A(x) = [0,1] Para el conjunto de slo dos valores, 0 o 1, es decir, L = {0,1}, A se reduce a un conjunto ordinario, de manera que la teora clsica de conjuntos es un caso particular de la teora de conjuntos borrosos, en los que la funcin de pertenencia toma exclusivamente valores 0 o 1. Un conjunto borroso puede ser visto como la extensin o generalizacin del concepto de conjunto ordinario ya que las funciones de pertenencia de stos ltimos slo admiten pertenencia total o nula, mientras que los conjuntos borrosos admiten tambin pertenencia parcial. La funcin de pertenencia puede definirse de forma numrica, mediante un vector (para universos discretos y finitos) o de forma funcional, en cuyo caso tiene generalmente forma de campana, triangular, trapezoidal, etc. En este ltimo caso adems puede depender de algn parmetro que permita variar su forma, por ejemplo, de en la funcin de A(x) descrita por la siguiente ecuacin: A(x)= exp - ( x - A (x) )2 2 2 La representacin grfica de una funcin de pertenencia es otra forma de representar los conjuntos borrosos que resulta muy fcil para compararlos y operar con ellos. A) CONJUNTOS BORROSOS Un conjunto borroso es un conjunto de pares ordenados de un elemento genrico x que pertenece al universo de discurso U, y su grado de pertenencia al conjunto.
120
A = {x A(x), x U} Podemos ilustrar esta definicin de conjunto borroso en los siguientes ejemplos: 1) Consideremos como universo de discurso U, que es el rango de variacin de las
variables. En este caso, U ser de edades comprendidas entre 0 y 120 aos, representada en el eje de las abscisas de la figura 3.4 U = {x x [0, 110]} Pueden definirse de forma arbitraria los subconjuntos borrosos J (joven) y V (viejo) analticamente, representados en la figura 3.4, como: J = { (x 1), 0 x 40 } V = { (x 0), 0 x 40 } { (x (1 + (x - 40)2 / 40)-1), x > 40} { (x (1+ 40 / (x - 40)2)-1), x > 40}
Funciones de pertenencia
Joven
viejo
50
100
150
De forma que una persona con 50 aos seria 0.3 joven y 0.7 vieja, y una de 40 aos seria igual de joven que de vieja. Cualquiera menor de 40 aos se considerar joven. Se ha supuesto continuo el universo de discurso.
2)
Para un universo discreto y finito, por ejemplo U = {meses del ao}, se pueden
definir los conjuntos borrosos F (frio) y C (calor) que se muestra en la tabla 3.1:
121
F = (1 enero) + (1 febrero) + (0.8 marzo) + (0.7 abril) + (0.5 mayo) + ..... C = (0 enero) + (0 febrero) + (0.4 marzo) + (0.6 abril) + (0.6 mayo) + .....
U Frio Calor
Ene. 1 0
Feb. 1 0
Jul. 0.2 1
Ago. 0 1
Dic. 1 0
As que en mayo empezaremos a sentir algo de calor, en un grado de 0.6 y frio en grado de 0.5. La funcin de pertenencia representa el grado de asociacin de un valor concreto con ese trmino lingstico. 3) De igual forma, se puede definir el conjunto borroso blanco,
que ira desde el negro (grado de pertenencia 0) por una gradacin ascendente de claridad hasta el blanco, o el conjunto borroso inverso negro. Un valor intermedio de gris claro tendra, por ejemplo: Blanco (x) = 0.7 Negro (x) = 0.3 Se han asignado unos valores semnticos a los conjuntos borrosos anteriores (joven, viejo, frio...) con los que se les designa. Denominados etiquetas lingsticas. Estas
etiquetas corresponden en gran medida con el lenguaje natural. El nmero de etiquetas lingsticas depende de la aplicacin, del grado de detalle que busquemos, etc. Habitualmente se toman un numero par de ellas, pero en ningn caso puede ser excesivo, ya que seria difcil distinguir entre etiquetas como alto, muy alto, altsimo, y... La capacidad dediscernirentredostrminoslingsticossedenominagranularidad. Otro concepto importante para la aplicacin de la lgica borrosa, propuesto por
Zadeh (1975) es el de variable lingstica: variable cuyos valores son palabras o sentencias enunlenguajenaturaloartificialreducido.
122
Una variable lingstica esta caracterizad por una quntupla (x, A (x), U, G M) donde
x es el nombre de la variable; A(x) es el conjunto de trminos lingsticos de x, es decir, el conjuntodevaloreslingsticosdexdondecadavaloresunnumeroborrosodefinidosobre eluniversoU;GesunareglasintcticaparagenerarlassentenciascorrectasenA;yMesla regla semntica que permite asociar a cada valor su significado, M(x), dado por un subconjuntoborrosodeU,delostrminosdeA. Porejemplo,sixeslavariablelingsticaescaladegris,quepuedetomarlosvalores
A(escaladegris)={blanco,grisclaro,grismedio,grisoscuro,negro,etc.},cadaterminodeA (escala de gris) esta caracterizado por un conjunto borroso definido en el universo de
discurso U = [0, 225]. Podran ser los de la figura 3.5.
Variables lingsticas Escala de grises Blanco 1 0.8 0.6 0.4 0.2 0 0 125 Figura 3.5 Representacin de la variable lingstica escala de gris 255 gris claro gris oscuro negro
Lavariablelingsticatemperaturatendra,entreotros,losconjuntosborrososfrioy
calor como extremos; la variable lingstica edad estara descrita por los conjuntos nio, joven,adulto,anciano,etc. Las operaciones entre conjuntos borrosos, A y B, se pueden definir de forma
AB={xAB(x)=max(A(x),B(x))xU)}
123
Interseccin: AB={xAB(x)=min(A(x),B(x))xU)}
Pueden equipararse a la interpretacin de los operadores lgicos not, and y or respectivamente y se puede comprobar que incluyen, como casos particulares, a las definicionesclsicasenconjuntosordinariosparaL={0,1}. AABAB
Figura 3.6 interpretacin y representacin de las conectivas
Las funciones unin, interseccin y complemento estndar definidas anteriormente, que corresponden a las propuestas por Zadeh, no son las nicas posibles generalizaciones de las operaciones homnimas entre conjuntos clsicos. Se pueden adoptar otras caracterizaciones, siempre y cuando verifiquen una serie de propiedades. Tanto la unin como la interseccin borrosa requieren funciones no decrecientes, de forma que al aumentar uno de los conjuntos tambin aumente su unin e interseccin. Deben ser conmutativas y distributivas. Deben ser continuas para asegurar que pequeos cambios en los conjuntos den lugar a cambios tambin pequeos en la unin e interseccin. La diferencia entre ambas operaciones esta en las condiciones en los lmites que deben admitir las operaciones entre conjuntos ordinarios como un caso particular. Las funciones que verifican las propiedades citadas son las que corresponden a la clase de conormas triangulares (t conormas o s - conormas) para la unin, y a la de normas triangulares (t-normas) para la interseccin. Otras operaciones adicionales cuyo resultado no es un conjunto borroso son, entre otras, el producto entre conjuntos borrosos y la potenciacin.
124
Asimismo, la mayora de las propiedades de las operaciones en los conjuntos ordinarios (identidad, asociatividad, conmutatividad, distributividad, idempotencia, etc.) se siguen cumpliendo, excepto dos muy importantes: A (conjunto vacio)
(noverificaelPrincipiodecontradiccinclsico)
U (todo el universo)
(noverificalaleydeltercioexclusoclsica)
Con estas definiciones para las operaciones bsicas, al no cumplir algunas de las
propiedades de la lgica clsica, la lgica borrosa no ser completa ni consistente, y los conjuntosborrososconlasoperacionesasdefinidasnoformanunalgebradeBoole. Adems, los conjuntos borrosos se les pueden aplicar operadores o reglas de
modificacin. Tienen gran importancia en el tratamiento de variables lingsticas. Corresponden a los modificadores lingsticos adverbios que se utilizan con frecuencia en ellenguajenaturalparaespecificar,juntoconelpredicado,unapropiedadmsconcreta. Como se puede observaren la figura 3.7, la interpretacin de esos modificadores se
corresponden con un cambio en la forma d la funcin original. Por ejemplo, al conjunto borroso claro, definido por una funcin de pertenencia simtrica en forma de campana, se le han aplicado modificadores como: bastante (que ensancha su forma), muy (que la hacemasestrecha),etc.
125
operaciones sobre la funcin de pertenencia asociada al predicado que se esta modificando. Entre las operaciones propuestas con este fin destacan las de negacin, concentracin, dilatacin o intensificacin. Operador de negacin (NEG): es una operacin unaria de resultado el complemento; es tpico del trmino no. NEG ( (x)) = 1 - (x) Operador o regla de concentracin (CON): es una operacin unaria que, aplicada a un conjunto borroso A, resulta un subconjunto borroso de A tal que la reduccin en los grados mas altos de la funcin de pertenencia es mucho menor que la reduccin en los grados mas bajos de la misma: el conjunto borroso se concentra. Correspondera al adverbio muy.
126
B) RELACIONES BORROSAS Una relacin clsica representa la presencia o ausencia de asociacin, interaccin o interconexin entre los elementos de dos o ms conjuntos. Este concepto se puede generalizar asignando a cada grupo de elementos un nmero comprendido entre 0 y 1 que represente el grado de pertenencia a la relacin, en este caso borrosa. De sta manera, la relacin borrosa incluir como un caso particular a la relacin clsica. Se pueden definir relaciones ordinarias entre conjuntos borrosos A y B definidos sobre el mismo universo de discurso U. Estas relaciones no son borrosas. Inclusin: A B si A(x) B(x) x U B si A(x) = B(x) x U B si A(x) B(x) x U
Equivalencia: A Desigualdad: A
Por ejemplo, la propiedad de inclusin permite definir el concepto de subconjunto. Se dice que un conjunto borroso A es un subconjunto de otro conjunto borroso B, definidos sobre un mismo universo U, si el grado de pertenencia de cada elemento del universo al conjunto A es menor o igual que su grado de pertenencia al conjunto B: A B si A(x) B(x) x U
Siguiendo con el ejemplo propuesto, el conjunto borroso blanco podra ser un subconjunto de claro, y negro de oscuro. Por otro lado, las relaciones borrosas entre conjuntos ordinarios, que en principio pueden estar definidos en universos de discurso diferentes, si dan como resultado un conjunto borroso, es decir, se obtiene un conjunto de pares ordenados (x, y), cada uno con determinado grado de pertenencia R a la relacin R, que indica en que grado o con que intensidad los elementos x, y estn en la relacin R. Las relaciones as definidas son binarias; en este caso, la relacin binaria borrosa se suele escribir tambin A R B. La relacin R es realmente un subconjunto borroso del producto cartesiano de A y B. R A
x
127
Un ejemplo de relacin binaria borrosa dada en la tabla 3.2 seria para x U1 es una familiar cercano de y U2, definida en los Universos de discurso. U1 = {madre, to, primo}, U2 = {hijo} R Hijo Madre 1 To 0.6 Primo 0.3
Tabla 3.2 Relacin borrosa es un familiar cercano La generalizacin a ordenes superiores (relaciones entre mas de dos conjuntos) es inmediata. Una relacin borrosa n-aria entre n conjuntos ordinarios, A1, A2,.., An no tienen por que ser todos distintos- pertenecientes a los universos U1, ...., Un, discretos o continuos, es un subconjunto borroso del producto cartesiano de todos ellos. Queda definida por una funcin de pertenencia que asigna a cada n-tupla (x1, x2, ..., xn) del producto cartesiano un grado de pertenencia a la relacin R. Por ultimo se pueden definir las relaciones borrosas entre conjuntos borrosos. Al ser una relacin borrosa ser d nuevo un subconjunto del producto cartesiano. El producto cartesiano admite diversa definiciones. La mas estndar es identificarla con el mismo, es decir, asignar a cada pareja formada por un elemento de U1 otro de U2, el menor de sus grados de pertenencia al conjunto A y al conjunto B respectivamente. A x B = {(x, y) A x B(x, y) = min (A (x), B (y)) x U1, y U2,} La operacin es similar a como se ha definido la interseccin salvo que, como los universos son diferentes, el conjunto borroso resultante esta formado por parejas. Esta expresin del producto cartesiano propuesta por Mamdini (1974) es la mas utilizada, si bien otra definicin usual resulta de reemplazar la operacin mnimo por el producto algebraico (Larsen, 1980), o por cualquier otra t-norma, como la utilizada por Zadeh (1975). A x B = {(x, y) A x B(x, y) = (A (x) * B (y)) x U1, y U2,} La generalizacin al caso n-ario es tambin inmediata.
128
La operacin propia de las relaciones borrosas de denomina composicin. En general, la composicin de relaciones puede ser expresada como una secuencia de operaciones max -*, donde * es cualquier operador de la clase de las normas triangulares; los mas usuales son el mnimo, producto algebraico, producto drstico o producto acotado. El operador es elegido segn la aplicacin especifica. R1 (U1, U2) o R2 (U2, U1) = R3 (U1, U3) Donde R3 (U1, U3) = {(x, z) R1 or R2 (x, z) x U1, y U2, z U3} Siendo R1 or R2 (x, z) = max [y U2 : min (R1(x, y), R2(y, z))] Existe una analoga entre la operacin definida anteriormente y el producto matricial usual, sin ms que asociar la suma con la operacin max y el producto con la operacin min. En este caso, a la composicin de relaciones borrosas se la conoce tambin por el nombre de producto matricial max-min, y su representacin se ve facilitada con esa estructura. Por ejemplo, sean los siguientes universos: U1 = {primavera, verano, otoo, invierno} U2 = {frio, calor} U3 = {abanico, abrigo, paraguas} Se definen sobre ellos las siguientes relaciones: R1 (U1, U2) p v o i frio 0.4 0.0 0.6 1.0 calor 0.6 1.0 0.4 0.0
129
La composicin de relaciones nos lleva a establecer la siguiente matriz: 0.4 0 R1 (U1, U2) = 0.6 1 0.6 1 0.4 0 0.1 0.9 0.6 0.4 = 0.6 0.9 0.4 0.1 0.1 0.1 0.6 0.9 0.4 0.4 0.6 0.6
0.9 0.1
son.Noobstante,sueleccinsehahechoteniendoencuentalossiguientescriterios: a) Que sean consistentes con las definiciones paralelas de la teora de conjuntos ordinarios; es decir, que esta pueda considerarse como un caso particular de la teoradeconjuntosborrosos. b) Quelosmodelosbasadosenlateorareflejenrazonablementebienlarealidad. c) Quelos clculosquese derivandelautilizacin delosmodelosseansencillosy,por lo tanto, se ejecuten con rapidez; en particular, las operaciones de seleccin de mximoomnimorequierenmuchomenostiempoquelasdesumaoproducto. Un caso particular de la composicin de relaciones, utilizado en la inferencia borrosa y empleando tambin en la lgica de relaciones, tiene lugar entre una relacin y un conjunto borroso.Severaconmasdetalleenelsiguientecapitulo.
130
3.2
de las variables lingsticas del antecedente y del consecuente son conjuntos borrosos, es decir, resultados lingsticos con una semntica asociada. Estas reglas, enunciadas en el lenguaje natural, incorporan el conocimiento de un experto en la tarea. Su aplicacin es inmediata a situaciones reales. Representan mediante instrucciones que se pueden programar en un ordenador el comportamiento de un experto u operador humano en esas circunstancias. Veamos en trminos generales el ejemplo de una base de reglas borrosas. Supongamos que tenemos la base de R, reglas que describe el comportamiento de una lavadora donde las variables lingsticas de los antecedentes son cantidad_ropa y suciedad_ropa, y la variable lingstica de salida es temperatura. Cada una de esas variables tiene asignadas varias etiquetas lingsticas como por ejemplo, poca, media o mucha, para la cantidad de ropa; alta, media, baja... para la temperatura, etc. R1: SI cantidad_ropa es poca Y suciedad_ropa es poca ENTONCES temperatura es baja R2: SI cantidad_ropa es media Y suciedad_ropa es bastante ENTONCES temperatura es media R3: SI cantidad_ropa es mucha Y suciedad_ropa es mucha ENTONCES temperatura es alta El numero de reglas que hacen la base consistente, es decir que para cualquier combinacin posible de valores de antecedentes se derive una conclusin depende lgicamente del numero de variables lingsticas que describan nuestro sistema y el numero
131
de conjuntos fuzzy o etiquetas que hayamos asociado a cada una de ellas. En general. Para n variables y m etiquetas, el nmero de reglas R es: R = mn Cada una de estas reglas corresponde a una implicacin borrosa, es decir se puede representar como una relacin borrosa entre los antecedentes y el consecuente. En su formulacin ms simple, las reglas pueden considerarse como una versin reducida de la lgica de predicados. La principal diferencia entre ambos mtodos es que las reglas reducen la expresividad y la capacidad de inferencia con el fin de lograr una mayor eficiencia. La limitacin en la expresividad consiste en la imposibilidad, o al menos en restricciones, a la hora de utilizar cuantificadores existenciales. Una ventaja de las reglas, adems de la eficiencia, es la capacidad de tratar la incertidumbre (las reglas superan una de las limitaciones de la lgica clsica y se acercan a las lgicas modales, al razonamiento no montono y al razonamiento aproximado).
132
V = {blanco, gris claro, gris perla, gris, gris oscuro, gris marenga, negro, etc.} Dado un predicado monadico al que se ha asociado un conjunto borroso A, que representa su significado, a la interpretacin (I) verdadera de una sentencia de la forma A(x), donde x es un elemento del universo U, se le asigna el valor de verdad A(x), es decir, el grado de pertenencia del elemento x al conjunto borroso A. Por ejemplo, la sentencia Jaime es alto se interpreta con un grado de verdad al conjunto borroso alto. La notacin matemtica que resume la interpretacin de sentencias simples con predicados monadicos es: I ( A(x) ) = A(x) = Donde es el grado de verdad de una sentencia, y asume valores comprendidos en el intervalo [0, 1]. Todo predicado n-ario representa una relacin. Se puede definir el significado de un predicado n-ario como la relacin borrosa formada por todas las relaciones semnticas del predicado con la tuplas formadas por los elementos de los distintos universos. La notacin matemtica correspondiente a la notacin I de sentencias simples con predicados didicos seria: I(R(x, y)) = R(x, y) = Para poder interpretar una sentencia simple con un sujeto x que no pertenece al universo U sobre el que sea definido el predicado, es necesario efectuar primero una correspondencia entre ese sujeto y algn elemento del universo de discurso. Esta correspondencia se denomina paso a forma canonca. As como la interpretacin de sentencias simples es un cierto grado de pertenencia a un conjunto borroso o a una relacin borrosa, la interpretacin de sentencias compuestas se har utilizando reglas bsicas que se traducen en operaciones sobre funciones de pertenencia comn. 1) Disyuncin: I(P(x) v Q(y)) = max (P(x), Q(x)) x U1 y U2 2) Conjuncin: I(P(x) ^ Q(y)) = min (P(x), Q(x)) x U1 y U2 Por ejemplo, el predicado Jaime es joven y alto se interpretara con la conjuncin segn la definicin dada.
133
Un caso particular lo constituye la interpretacin de la sentencia condicional. En el calculo proposicional clsico, la proposicin si A entonces B, donde A y B son variables proposicionales, se escribe (AB), y esta definida como AB = v B. Una extensin de este concepto da lugar al concepto mas general de sentencia condicional borrosa, donde ahora A y B son conjuntos borrosos, y el conectivo () puede interpretarse como una relacin borrosa entre las variables asociadas a A y B. Existen diversas interpretaciones de la sentencia condicional borrosa. Como interpretacin mas usual se puede tomar la de una relacin borrosa entre las interpretaciones de A y B. En particular, como el propio producto cartesiano. I (A(x)) B(y)) = I(A) x I(B) Pero segn las definiciones respectivamente: I (A(x)) B(y)) = A(x), B(x)) x U1 y U2 I(A(x)) B(y)) = min(1, 1 - A(x) + B(x)) x U1 y U2 Los modificadores no, muy, etc. Tambin tienen su correspondiente regla de interpretacin, que debe ser aplicada. de Larsen (1980) y Zadeh (1973) serian,
3.4
adecuado estructurar los programas de IA de forma que se facilite describir y desarrollar el proceso de bsqueda. Los sistemas de produccin proporcionan tales estructuras. Ms abajo se introduce una definicin de sistema de produccin. Conviene no confundirse con otros usos de la palabra produccin, tales como lo que se produce en una fbrica. Un sistema de produccin consiste en: Un conjunto de reglas compuestas por una parte izquierda (un patrn) que determina la aplicabilidad de la regla, y una parte derecha, que describe la operacin que se lleva a cabo si se aplica la regla.3
134
Una o mas bases de datos/conocimiento que contengan cualquier tipo de informacin apropiada para la tarea en particular. Parte de la base de datos pueden ser permanentes, mientras que otras pueden hacer referencia solo a la solucin del problema actual. La informacin almacenada en estas bases de datos debe estructurar de forma adecuada.
Una estrategia de control que especifique el orden en el que las reglas se comparan con la base de datos, la forma de resolver los conflictos que surjan cuando varias reglas puedan ser aplicadas a la vez.
Un aplicador de reglas. Hasta aqu, la definicin de un sistema de produccin es muy general. Abarca una
gran cantidad de sistemas, incluyendo nuestras descripciones del jugador de ajedrez y de la solucin al problema de las jarras de agua. Tambin abarca una familia de intrpretes generales de sistemas de produccin que incluye: Lenguajes bsicos de sistemas de produccin, tales como OPSS (Brownston et al. 1985) y ACT* (Anderson, 1983). Sistemas ms complejos, con frecuencia hbridos, denominados armazones de sistemas expertos (expert systems shells), los cuales poseen entornos completos (hablando relativamente) para la construccin de sistemas expertos basados en conocimiento. Arquitecturas generales de resolucin de problemas tales como SOAR (Lairdet al, 1987), sistema basado en un conjunto especfico de hiptesis motivadas cognoscitivamente por la naturaleza del problema a resolver. Todos estos sistemas mantienen la arquitectura de un sistema de produccin en su totalidad y permiten que el programador escriba reglas para definir los problemas particulares que tienen que resolverse. Los sistemas de produccin se explican con mas detalle en el capitulo 6. Se ha visto que para poder resolver un problema, primero hay que reducirlo a una forma en la que se pueda dar una definicin precisa. Esto puede lograrse mediante la definicin de un espacio de estados del problema (incluyendo los estados inciales y finales), y de un conjunto de operadores para trasladarse a travs del espacio que una un estado. El
135
problema se reduce entonces a buscar una ruta a travs del espacio que una un estado inicial con un estado objetivo. El proceso de resolucin del problema puede modelarse con sistema de produccin. En el resto de este apartado se explica el problema de la eleccin de la estructura de control apropiada para el sistema de produccin con el fin de que el proceso de bsqueda sea lo mas eficiente posible.
136
ACTION:
clnicos disponibles a partir del objetivo de encontrar organismos significativos causantes de enfermedades. Una vez que encuentra la identidad de tales organismos, intenta seleccionar una terapia para tratar la enfermedad. Para poder comprender la forma en la que MYCIN utiliza informacin incierta, debe responderse a dos cuestiones: Cul es el significado de los factores de certeza? y Cmo combina MYCIN las estimaciones sobre la certeza de cada una de las reglas para hacer una estimacin de la certeza de sus conclusiones?. Debe tambin responderse a otra cuestin que surge de la ya descrita intratabilidad del razonamiento puramente bayesiano, que es Qu compromisos se realizan en l tcnica MYCIN y que riesgos llevan asociados?. En el resto de esta seccin se responde a todas estas interrogantes. Comencemos con una sencilla respuesta a la primera de las preguntas (a la que se volver mas tarde para dar una respuesta mas detallada). Un factor de certeza (CF [h, e]) se define en trminos de dos componentes: MB [h, e]. Una medida (entre 0 y 1) de la creencia de que la hiptesis h proporciona la evidencia e. MB da una medida sobre hasta que punto la evidencia soporta la hiptesis. Es cero si la evidencia no soporta la hiptesis. MD [h, e]. Una medida (entre 0 y 1) sobre la incredulidad de que la hiptesis h proporciona la evidencia e. MB da una medida de hasta que punto la evidencia soporta la negacin de la hiptesis. Es cero si la evidencia soporta la hiptesis. A partir de estas dos medidas, se puede definir el factor de certeza como sigue: CF [h, e] = MB [h, e] MD [h, e] En cada regla basta un nico numero para definir tanto el valor de MB como el de MD, y por lo tanto, tambin el de CF, ya que cada regla de MYCIN se corresponde con una parte de la evidencia (aunque puede ser una parte compuesta de la evidencia) y cada parte de la evidencia o bien soporta o bien niega una hiptesis (pero nunca ambas cosas). Los factores de certeza de las reglas de MYCIN los proporcionan los expertos que escriben las reglas. Reflejan las valoraciones del experto sobre la fortaleza con que la evidencia soporta la hiptesis. Sin embargo, en el proceso de razonamiento de MYCIN, los
137
factores de certeza tienen que combinarse para reflejar el uso de las mltiples partes de la evidencia y de las mltiples reglas que se aplican para resolver el problema. La figura 8.1 ilustra tres formas de combinacin que es necesario considerar. En la figura 8.1(a), todas las reglas proporcionan la evidencia que relaciona una nica hiptesis. En la figura 8.1(b), es necesario considerar nuestra creencia como una coleccin de distintas proposiciones tomadas juntas. En la figura 8.1(c), la salida de una regla proporciona la entrada de la siguiente. Qu formulas deberan utilizarse para plasmar estas combinaciones? Antes de responder a esta cuestin, es necesario primero describir algunas propiedades que seria adecuado que cumplieran las funciones de combinacin: Las funciones de combinacin deberan ser conmutativas y asociativas, ya que el orden en el que se renen las evidencias es arbitrario. A C B (a) (b) A B A B C (c)
Hasta que no se alcance la certeza, las evidencias adicionales que confirman debe incrementar MB (y, de forma similar, con las evidencias que restan confirmacin y MD).
Si las inferencias inciertas se encadenan juntas, el resultado debe de ser menor certeza que cada una de las inferencias por separado. Si se supone que todas estas propiedades son deseables, considere en primer lugar
la figura 8.1(a), en la que varias partes de evidencia se combinan para determinar el factor de certeza de una hiptesis. Las medidas sobre la creencia o no creencia de una hiptesis dada dos observaciones s1 y s2 se calculan de la siguiente forma: si MD [h, s1 ^ s2] =1 MB [h, s1 ^ s2] =
0
en caso contrario
138
en caso contrario
Una forma de plasma estas formulas en castellano consiste en que las medida sobre la creencia en h es 0 si no se cree en h con certeza. En caso contrario, la medida sobre la creencia en h, dada dos observaciones, es la medida sobre la creencia dada solo por una observacin ms algn incremento debido a la segunda observacin. Este incremento se calcula tomando primero la diferencia entre 1 (certeza) y la creencia dada por la primera observacin. Esta diferencia es la mayor que puede aadir la segunda observacin. La diferencia se escala mediante la creencia sobre h dada solo la segunda observacin. De forma similar puede darse una explicacin parecida para la formula que calcula la incredulidad. A partir de MB y MD, puede calcularse CF. Ntese que si se unen varias fuentes de corroboracin de la evidencia, el valor absoluto de CF se incrementa. Si se introduce una evidencia conflictiva, el valor absoluto de CF disminuye. Un sencillo ejemplo muestra como operan estas funciones. Suponga que se tienen una observacin inicial que confirma nuestra creencia en h con MB = 0.3. Entonces MD [h, s1] = 0 y CF[h, s1] = 0.3. A continuacin se hace una segunda observacin, que confirma h con un valor de MB [h, s2] = 0.2. Entonces: MB [h, s1 ^ s2] = 0.3 + 0.2 * 0.7 = 0.44 MD [h, s1 ^ s2] = 0.0 MD [h, s1 ^ s2] = 0.44 En este ejemplo se observa como una evidencia que tan solo sirve apara apoyar levemente una cierta suposicin, puede acumularse y producir incrementos mayores en los factores de certeza. Considere ahora la figura 8.1 (b), en donde es necesario calcular el factor de certeza de una combinacin de hiptesis. En particular, esto es necesario cuando se necesita conocer el factor de certeza de un antecedente de una regla que contiene varias clausulas (como, por ejemplo, en la regla del estafilococo). El clculo de la combinacin de factores de certeza puede hacerse a partir de MB y MD. Las formulas que usa MYCIN para la conjuncin y disyuncin de dos hiptesis son:
139
MD [h1 ^ h2, e] = min (MB [h1, e], MB [h2, e]) MD [h1 ^ h2, e] = max (MB [h1, e], MB [h2, e]) MD se calcula d forma anloga. Finalmente, considere la figura 8.1(c), en donde las reglas se encadenan de forma que el resultado de la incertidumbre que sale de una regla es la entrada de la otra. La solucin para este problema tambin tendr en cuenta el caso en el que tenga que asignarse a las entradas inciales una medida sobre su incertidumbre. Este caso podra darse fcilmente en aquellas situaciones donde la evidencia es el resultado de algn experimento o algn test de laboratorio, de forma que los resultados no son completamente exactos. En estos casos, el factor de certeza de la hiptesis debe tener en cuenta la intensidad con la que la evidencia parece indicar la hiptesis como el nivel de confianza en la evidencia. MYCIN define el encadenamiento de reglas como sigue. Sea MB[h, s] la medida de la creencia sobre h estando completamente segura la validez de s. Sea e la evidencia que nos lleva a creer en s (por ejemplo, las lecturas de los instrumentos del laboratorio o los resultados de aplicar otras reglas). Entonces: MB [h, s] = MB [h, s] . max (0, CF[s, e]) Como en MYCIN los factores de certeza inciales son estimaciones que proporcionan los expertos que escriben las reglas, no es realmente necesario dar una definicin mas precisa del significado de CF a parte de la ya mencionada, Sin embargo, el trabajo original proporcionaba una mediante la definicin de MB (que podra interpretarse como una reduccin proporcional de la incredulidad en h como resultado de e) como sigue: 1 MB [h, e] = max [P (h\e), P (h)] P (h) 1 P (h) De igual forma, MD es la reduccin proporcional en la creencia en h como resultado de e. 1 si P (h) = 0 MD [h, e] = min [P (h\e), P (h)] P (h) en caso contrario si P (h) = 1 en caso contrario
140
P (h)
Estas definiciones son incompatibles con la visin bayesiana de la probabilidad condicionada. Sin embargo, realizando unos pequeos cambios (Hekerman, 1986), se logra que sea compatible. En particular, puede redefinirse MB de la siguiente forma: 1 MB [h, e] = max [P (h\e), P (h)] P (h) (1 P (h)) * P (h\e) La definicin de MD se modifica de forma similar. Con estas reinterpretaciones, no surge ningn conflicto importante entre las tcnicas empleadas en MYCIN y las que sugieren las estadsticas bayesianas. Al final del apartado anterior se argumentaba que las estadsticas puramente bayesianas normalmente conducan a sistemas inabordables. Sin embargo, MYCIN si funciona (Buchanan Y Shortliffe, 1984). Por qu? En cada regla de MYCIN, CF representa la contribucin de una regla individual a la creencia de MYCIN en una cierta hiptesis. En cierto sentido, representa una probabilidad condicionada P (H\E). Sin embargo, se recuerda que en un sistema bayesiano puro, P (H\E) describe la probabilidad condicionada de H teniendo como nica evidencia relevante a E. Si existe otra evidencia es necesario que se considere la combinacin de las probabilidades. Este es el punto en que MYCIN se aparta de los sistemas bayesianos puros, de forma que es mas sencillo de escribir y mas eficiente en su ejecucin, pero surge el correspondiente peligro de que su comportamiento resulte contrario a la intuicin. En particular, las formulas que MYCIN emplea para los tres casos mostrados en la figura 8.1 suponen que todas las reglas son independientes. El peso de garantizar la independencia (al menos con la extensin que se ha hecho) recae sobre el que escribe las reglas. Cualquier forma de combinacin se vuelve vulnerable si se viola esta suposicin de independencia. Considere primero el escenario de la figura 8.1(a). La regla que nos sirve como ejemplo tiene tres antecedentes con un nico factor CF en lugar tres reglas separadas; esto hace que sea innecesaria la combinacin de las reglas. El escritor de reglas obra de este modo debido a que los tres antecedentes no son independientes. Para ver cuantas diferencias pueden hacerse sobre la suposicin d independencia de MYCIN, suponga por un momento que se tiene tres reglas separadas y que el factor CF de cada una de ellas es 0.6. Esto seria posible y aun seria consistente con el factor combinado CF de 0.7 si las tres si P (h) = 1 en caso contrario
141
condiciones se solapan de forma sustancial. Si se aplica la formula de combinacin de MYCIN a las tres reglas por separado, se obtiene: MB [h, s1 ^ s2] = 0.6 + (0.6 * 0.4) = 0.84 MB [h, (s1 ^ s2) ^ s3] = 0.84 + (0.6 * 0.16) = 0.936 El resultado es sustancialmente diferente del valor verdadero, tal como lo expreso el experto que era 0.7. Considere ahora que ocurre se violan las suposiciones de independencia en el escenario de la figura 8.1(c). Considere un ejemplo concreto en el que: S: el riego automtico funciono anoche. W: la hierba esta hmeda. R: anoche llovi. Se pueden escribir las reglas, al estilo de MYCIN, que describen las relaciones predecibles entre estos tres eventos: Si: el riego automtico funciono anoche Entonces sugiere una evidencia (0.8) de que La hierba estar hmeda por la maana. Si se toma por separado, esta regla puede describir el mundo con exactitud. Pero considere ahora una segunda regla: Si: la hierba esta hmeda esta maana Entonces se sugiere una evidencia (0.8) de que Anoche llovi. Tomado por separado, esta regla tiene sentido desde que la fuente d agua mas comn para la hierba es la lluvia. Pero si las dos reglas se aplican juntas, utilizando la regla de encadenamiento de MYCIN, se obtiene: MB [W, S] = 0.8 {riego automtico sugiere humedad}
142
En otras palabras, se tiene la creencia de que llevo porque se cree que el riego automtico funciono, Esto se obtiene a pesar del hecho de que si se sabe que el riego estuvo funcionando y que es la causa de que la hierba este hmeda, entonces no existe prcticamente evidencia de la lluvia (por que el hecho d que la hierba este mojada puede explicarse de otra forma). Una de las mayores ventajas que proporciona la modularidad del sistema de reglas de MYCIN es que permite considerar las relaciones antecedente/consecuente individuales de forma independiente de las otras. En atrs y considerar la evidencia que soporta. Desafortunadamente, este ejemplo muestra que con este enfoque existe siempre el peligro de que las justificaciones de una creencia sean importantes para la determinacin de sus consecuencias. En este caso, es necesario conocer por que se cree que la hierba esta hmeda (por ejemplo, porque se ha observado que lo esta como oposicin a que se sabe que el riego estuvo funcionando) con el fin de que se determine si la hierba hmeda es una evidencia de que estuvo lloviendo. En este punto es adecuado sealar que este ejemplo ilustra una estructura de reglas especfica que casi siempre provoca dificultades, y que debe evitarse. Ntese que la primera regla describe una relacin casual (el riego provoca la hierba hmeda). La segunda regla, aunque parece lo mismo, en realidad escribe una relacin de casualidad inversa (la hierba hmeda es causada por la lluvia, por lo que es una evidencia de su causa). Aunque puede derivarse la evidencia de un indicio a partir de su causa y de una causa a partir de la observacin del indicio, es importante que la evidencia se derive de una forma que no se utilice otra vez para no volver a otra forma con nueva informacin. Para evitar este problema, muchos sistemas basados en reglas o limitan las reglas a una estructura o dividen claramente las dos clases de forma que no puedan inferir una con la otra. Cuando se expliquen las redes bayesianas en el siguiente apartado, se describir una solucin general para este problema. Se puede resumir esta explicacin sobre los factores de certeza y los sistemas basados en reglas de la siguiente manera. Con este enfoque se estn realizando fuertes suposiciones de independencia que hacen que sean relativamente fciles de utilizar; al mismo tiempo, estas suposiciones entraan un peligro si las reglas no se escriben con cuidado con el fin de que capturen las dependencias importantes. Este enfoque puede servir como base para programas de aplicacin prcticos, como es el caso de MYCIN. Tambin se ha logrado con una larga lista de sistemas construidos sobre una plataforma llamada
143
EMYCIN (van Melle et el.., 1981), que no es mas que una generalizacin (con frecuencia denominado armazn (shell)) de MYCIN en donde se han eliminado todas las reglas referentes al dominio especifico. Una razn que hace que este marco sea til, a pesar de sus limitaciones, es que se observa que en un sistema robusto los nmeros exactos utilizados no tienen mucha importancia. La otra razn consiste en que las reglas se disearon con cuidado para evitar los principales peligros que se han descrito. Otro aspecto interesante sobre este enfoque es el que surge el imitar con exactitud (Shultz et al.., 1989) la forma en que las personas manipulan las certezas.
144
implementacin. Sin embargo, antes de explicar estas relaciones, puede resultar provechoso clarificar las condiciones viendo como se relacionan con problemas especficos. De esta forma, se llega a la segunda de las cuestiones expresadas anteriormente, la cual indaga sobre se existe una relacin interesante entre las clases de sistemas de produccin y las clases de problemas. Dado un problema resoluble, existe un nmero infinito de sistemas de produccin que proporcionan formas de encontrar soluciones. Algunos de ellos sern ms eficientes y naturales que otros. Un problema que puede ser resuelto con un sistema de produccin, puede ser resuelto con uno conmutativo (la clase ms restrictiva), sin embargo, el sistema conmutativo puede ser tan inmanejable que sea prcticamente intil. Puede utilizar estados individuales para describir secuencias enteras de reglas aplicadas por un sistema no conmutativo ms simple. As, desde un punto de vista formal, no existe relacin alguna entre tipos de problemas y tipos de sistemas de produccin debido a que todos los problemas pueden resolverse utilizando todos los tipos de sistemas de produccin. Peor desde un punto de vista prctico, definitivamente existe la relacin entre tipos de problemas y los tipos de sistemas de produccin que se prestan de forma natural a representar estos problemas. Para ver esto, veamos algunos ejemplos. La figura 2.17 muestra las cuatro categoras
En que se dividen los sistemas de produccin de acuerdo con las dos dicotomas, sistemas montonos versus no montonos y sistemas parcialmente conmutativos versus no parcialmente conmutativos, de forma que algunos problemas pueden resolverse ms naturalmente por un tipo de sistema. La esquina superior izquierda la forman los sistemas conmutativos. Los sistemas parcialmente conmutativos y los montonos son adecuados para resolver problemas ignorables. Esto no es sorprendente desde el momento en que las definiciones de ambos son esencialmente las mismas. Sin embargo, se advierte que los problemas ignorables son aquellos en los que una formulacin natural conduce a acciones
145
que pueden posteriormente ignorarse. Esta formulacin natural ser un sistema parcialmente conmutativo y montono. Los problemas que implican la creacin de nuevos objetos ms que el cambio de los viejos suelen ser ignorables. La demostracin de teoremas, tal y como se ha descrito, es un ejemplo de proceso creativo. Realizar deducciones a partir de hechos conocidos es tambin un proceso creativo. Ambos procesos se pueden implementar fcilmente con un sistema parcialmente conmutativo y montono. Los sistemas parcialmente conmutativos y montonos son importantes desde el punto de vista de la implementacin por que no contemplan la caracterstica de volver hacia estados pasados cuando se descubre que se ha seguido un camino incorrecto. Si bien con frecuencia es adecuado implementar estos sistemas con vuelta atrs (back-tracking) para asegurar una bsqueda sistemtica, la base de datos actual que representa el problema, no necesita regenerarse. El resultado de esto es, con frecuencia, un notable incremento de la eficiencia debido a que la base de datos no tiene que ser regenerada y no es necesario estar al tanto de cada cambio que se produjo en el proceso de bsqueda. Hasta ahora se han explicado aquellos sistemas de produccin que son la vez montonos y parcialmente conmutativos. Estos sistemas son adecuados para problemas en los que las cosas no cambian; se crean. Por otro lado, los sistemas no montonos y parcialmente conmutativos se adecuan a aquellos problemas en los que se realizan cambios pero estos son reversibles y en los que el orden de las operaciones no es crtico. Este es normalmente el caso de los problemas de manipulacin fsica, como la navegacin de robots en una superficie plana. Suponga que el robot dispone de los siguientes operadores: ir hacia el norte (N), ir hacia el este (E), ir hacia el sur (S), e ir a el oeste (O). Para llevar a cabo su objetivo, no importa si el robot ejecuta N-N-E o N-E-N. Dependiendo de cmo se eligen los operadores, el problema del 8-puzzle y el del mundo de bloques pueden considerarse tambin como parcialmente conmutativos. Estos dos tipos de sistemas parcialmente conmutativos son importantes desde el punto de vista de la implementacin por que tienden a alcanzar muchos estados individuales duplicados durante el proceso de bsqueda. Esto se explica mas tarde en el apartado 2.5. Los sistemas de produccin que no son parcialmente conmutativos son adecuados para muchos problemas en los que se produce cambios irreversibles. Por ejemplo, considere el problema de realizar un proceso que produzca un compuesto qumico. Los operadores disponibles incluyen cosas como Aadir el agente qumico x al recipiente o Cambiar la temperatura hasta t grados. Estos operadores pueden causar cambios irreversibles en el
146
compuesto. El orden en que se realizan las operaciones es importante para determinar el resultado final. Es posible que si x se aade a y, se forme un compuesto estable, de forma que la posterior adicin de z no produzca ningn efecto; sin embargo, si z se aade a y, puede formarse un compuesto estable diferente, de forma que no tenga efecto alguno la posterior adicin de x. En los sistemas de produccin que no son parcialmente conmutativos es menos probable que se llegue al nodo varias veces durante el proceso d bsqueda. Cuando se trate con sistemas que describan procesos irreversibles, es particularmente importante tomar las decisiones correctas la primera vez, aunque si el universo es predecible, puede que una buena planificacin las haga menos determinantes.
147
UNIDAD 4
BSQUEDA Y SATISFACCIN DE RESTRICCIONES
Objetivo: Aplicara tcnicas sistemticas bsicas de profundidad y en la anchura en la solucin de problemas de bsqueda de metas.
149
En este captulo vamos a abordar la definicin de un problema en un espacio de estados, y su resolucin mediante estrategias de bsqueda que vendrn limitadas por el tipo de conocimiento que tengamos del problema en cuestin. No hay que perder de vista, aunque los mtodos de bsqueda se reduzcan en muchos casos a meros algoritmos matemticos; que lo que se persigue desde el punto de vista de la IA es entender el problema que se trata de resolver, analizar sus posibles soluciones y las consecuencias de buscar una solucin por un camino u otro. No se trata tanto de encontrar una solucin final ptima o al menos convincente como de haber ganado en el conocimiento de un problema que se puede aplicar a una situacin real. Aunque hoy en da tal y como estn implementados los mtodos de bsqueda no reflejan la forma en la que los seres humanos resolvemos los problemas, no dejan de ser estrategias muy eficientes y probadas, y siempre han obtenido su lugar adentro de la IA. En las siguientes secciones del captulo se van a exponer diversas formas de definir un problema para aplicarle distintas estrategias de resolucin. En cualquier caso, no hay que olvidar que lo ms definitorio a la hora de abordar un problema es el objetivo final planteado, que no siempre ser el resultado concreto sino el conocimiento ganado sobre el problema, el proceso seguido para encontrar una solucin, u otros requerimientos como necesidad de ahorrar tiempo computacional o rapidez en la toma de desicin.
El Espacio de Estados.
Cuando alguien se plantea resolver un problema, ya sea por ejemplo un juego simple como el 3 en raya o alguno ms complejo, como el ajedrez o el backgammon, tenemos al menos mentalmente una representacin del espacio en el que se va a desarrollar el mismo, es decir, una imagen grfica o un mapa del terreno, del tablero, en el que va a tener lugar la estrategia de solucin. Para su resolucin computacional, el primer paso es buscar una estructura de datos que capture lo esencial de ese juego o problemas que refleje con propiedad la distribucin de los elementos en un espacio de situaciones o posiciones posibles. Se denomina espacio inicial aquel del que partimos, y que refleja la estructura que subyace en el problema. Por ejemplo, para el juego del 3 en raya sera una matriz cuadrada de 3x3 posiciones, inicialmente vacas.
150
La combinacin del espacio inicial y los operadores forma el espcaio de estados o espacio de representacin. Es decir, es el entorno donde se desarrolla el proceso de bsqueda, y lo componen todos los estados por los que se avanza y que se van recorriendo en la tarea de llegar a la meta. Cada uno de los estados recorridos es una situacin candidata a ser solucin. La secuencia de estados que resulta de la aplicacin vlida de operadores a partir del estado inicial se denomina traza en el espacio de estados. Esta secuencia de operaciones nos permite ir avanzando en nuestro espacio de estados a situaciones vlidas que nos van acercando al objetivo final. La estrategia de control es la encargada de optimizar el proceso de bsqueda, determinando los operadores aplicables y utilizando informacin del dominio cuando sta sea conocida. Por contraposicin se podra hablar de los espacios de reduccin, donde al aplicar un operador se generan una serie de subproblemas, cada uno de los cuales ser en general ms sencillo que el original (de ah el trmino reduccin que lo describe). Se aplica el conocido principio de divide y vencers, para llegar a problemas de menor dimensin que tengan solucin conocida. Algo importante a implementar en los problemas de bsqueda es el criterio para detectar cundo se ha llegado a la consecucin del objetivo propuesto. En nuestro juego se tratara de identificar sobre el tablero si alguna fila, columna o diagonal est formada por todo Xs o Os. En este caso la prueba final es sencilla, pero la definicin del criterio la consecucin del objetivo final puede ser en s misma un problema importante. En muchos problemas de bsqueda el inters se centra no slo en conseguir un estado final, sino alcanzarlo en el mnimo tiempo posible, o minimizando otro tipo de coste (en definitiva, maximizando un beneficio). En estos casos se puede asociar un coste o peso a los operadores que se aplican y tambin a las transiciones de un estado a otro. Esta traza del coste o funcin de coste denota habitualmente con la letra g. Permite comparar distintos algoritmos de resolucin tanto por la solucin obtenida como por la calidad de la misma en trminos de coste asociado. En algunos problemas como el del ejemplo del juego de 3 en raya, el espacio de bsqueda es limitado, porque tambin lo est el espacio de estados posibles y de soluciones. Pero en muchos problemas del mundo real el espacio de bsqueda no est acotado, e incluso puedan escalarse para tratar espacios muy extensos.
151
Hay otros aspectos sobre el funcionamiento de los algoritmos de bsqueda que se pueden tener en cuenta. Por ejemplo: -Un algoritmo es ptimo si encuentra la mejor solucin entre todas las posibles. -Una estrategia es completa si garantiza que encontrar una solucin siempre y cuando sta exista. La eficiencia de un algoritmo en trminos de complejidad temporal (cunto tiempo requiere para alcanzar la solucin) o en trminos de complejidad espacial (memoria que necesita) son consideraciones prcticas de gran importancia. Un algoritmo ptimo que garantiza encontrar la mejor solucin tendr poco valor prctico si tarda horas en completarse, cuando a lo mejor slo contamos con unos minutos para tomar una decisin. De forma similar, un algoritmo completo que utilice mucha memoria es intil si antes de encontrar la solucin a un problema se queda sin memoria.
152
el nodo predecesor o padre, y el destino el sucesor o nodo hijo; o pueden ser no dirigidos, en el caso contrario. Expandir un nodo es obtener todos sus posibles sucesores en el grafo de bsqueda a travs de la aplicacin de todos los operadores disponibles relacionados. Un nodo o estado es cerrado si ya ha sido expandido, y est abierto si todava queda por aplicar algn operador. A estos ltimos tambin se les denomina margen o frontera. En general un problema de bsqueda se representa por un rbol, que es un grafo dirigido acclico conexo (figura 2.1). El obtener el rbol de bsqueda es la tarea prioritaria en todo problema de bsqueda o de decisin ya que en definitiva la resolucin del problema disponible con las dependencias y relaciones que existan. Aplicando esta representacin al juego de 3 en raya, cada nodo es un estado o valor de la matriz; cada arco apunta la operacin que lleva de un valor de la matriz a otro, por ejemplo, cuando el jugador X mueve un 1 de una celda vlida. Los nodos terminales son aquellos que dan una configuracin ganadora. Otro ejemplo sera la representacin arbrea de un laberinto, donde cada nodo sera una bifurcacin, salida o pared al final de un camino, y cada arco un camino. El problema cosiste en encontrar el camino ms corto a una salida, nodo final.
Este espacio es completamente predictivo si se conocen las entradas al mismo. Dicho de otra forma si se conocen las entradas siempre producir la misma salida, y la maquina interna pasara por la misma secuencia de estados. Este tipo de estados ha sido el ms estudiado durante la historia y por lo tanto resulta ser el tipo mas familiar de los espacios, as como el ms prctico ya que puede analizarse en las maquinas eficientemente. Un espacio es deterministico si la respuesta que produce se puede conocer a partir de los datos de entrada.
153
ayudarse en esa bsqueda directa en el espacio de estados, es la llamada bsqueda ciega, o fuerza bruta. Es decir, no hay caminos prioritarios en el recorrido hacia el objetivo final. La nica diferencia entre las distintas tcnicas que se aplican de bsqueda a ciegas es el distinto orden en el que los nodos se expanden. Pero en este caso cambios incluso muy pequeos pueden tener un impacto decisivo en el comportamiento del algoritmo. Los algoritmos de bsqueda que utilizan informacin sobre el problema,
como el coste o la distancia al estado final, se denominan heursticos o bsqueda dirigida o respaldada con informacin. La principal ventaja de stos es que se puede seleccionar con ms fundamento cul es el siguiente nodo que se debe expandir, lo que mejora la eficiencia de la bsqueda. Para juzgar la eficiencia de una bsqueda e incluso para determinar si se trata de una bsqueda a ciegas o una bsqueda heurstica, hay algunos conceptos que se deben considerar. Por ejemplo: Coste de un arco: Indica el tiempo requerido para aplicar un operador a un
estado en el proceso de bsqueda (por defecto tiene valor de 1). Coste de un nodo: Medida del tiempo consumido en alcanzar un nodo a lo
154
nmero medio de operadores que pueden aplicarse a un estado. Longitud de una trayectoria: Nmero de nodos generados en un camino, es
decir, el nmero de operadores aplicados en dicho camino. Profundidad: Longitud del camino ms corto desde el estado inicial a un
nodo determinado. La profundidad del nodo raz es 0. Por ltimo, recordar que la eficiencia de un algoritmo se ha definido en trminos de su complejidad temporal y espacial. Por ello un aspecto importante a considerar dentro los mtodos de bsqueda es la generacin de estados repetidos, es decir, recorridos que ya se han hecho, nodos que ya se expandieron y de los que se vuelven a generar sus sucesores, etc. En muchos problemas es inevitable, aunque se puede paliar con una buena formulacin del mismo. Algunos de los consejos para tratar de forma eficiente esta problemtica seran: Un bucle hace volver continuamente al mismo estado. Por lo tanto, evitar el
generar rutas con ciclos, es decir, no permitir que un operador transforme un estado en su predecesor, que un hijo genere a su correspondiente padre. No retroceder al estado anterior, si no viene forzado por la misma ejecucin
del algoritmo. Supondra repetir el estado y volver al punto donde se encontraba anteriormente. Si es posible, almacenar todos los estados resultados de la expansin de los
nodos hasta ese momento, con el objetivo de no volver a generar nodos que ya fueron expandidos alguna vez. Estas posibles estrategias para evitar un exceso intil de clculo no son siempre fciles de implementar. En algunos casos pueden incrementar notablemente la complejidad del algoritmo, y en cualquier caso hay que llegar a un compromiso de rentabilidad entre el coste adicional de memoria que supondra, por ejemplo, almacenar todos los nodos generados alguna vez y el coste computacional de expandirlos de nuevo.
155
Bsqueda a Ciegas.
En Esta sesin se van a examinar las dos tcnicas bsicas que se utilizan para resolver problemas de bsqueda en el mbito de la IA, dentro de la bsqueda por fuerza bruta o a ciegas. Como se ha comentado, es la que no cuenta con informacin a priori que la dirija en su secuencia de acciones para la consecucin del objetivo final. Es decir, realiza una bsqueda exhaustiva. Aunque el funcionamiento de estos procedimientos es muy simple, a lo largo de las ltimas dcadas se han ido modificando para mejorar sus prestaciones. En primer lugar vamos a definir un problema de trabajo al que iremos aplicando los distintos algoritmos. Podemos partir de un problema real, por ejemplo, dado un mapa que recoge una serie de ciudades de una regin, se trata de encontrar una ciudad determinada a partir de cualquier posicin en la que nos encontremos, siempre y cuando exista algn camino que una la ciudad inicial con la meta. Una vez definido el problema, el siguiente paso es cmo representarlo en un espacio de estados. Podramos tener un mapa que represente esa regin en el que marcaramos las ciudades que forman parte de nuestro escenario y los caminos que las unen. Claro que esta estructura queda perfectamente reflejada por un grafo, por lo que dando un paso ms de nivel de abstraccin tendremos las ciudades representadas como nodos, y las carreteras o vas de circulacin que las unen sern los arcos. Por lo tanto, el problema de bsqueda se reduce a recorrer una estructura de datos de forma sistemtica hasta que encontremos la ciudad objetivo o hayamos acabado de forma exhaustiva con todas las posibilidades. En este caso partimos de que un grafo simple representa de forma completa el problema. Para casos ms complejos, el grafo slo representara una parte, y a partir de los operadores que generan nuevos estados se ira expandiendo el grafo de forma dinmica. En ambos casos los algoritmos de bsqueda se aplican de igual forma. El rbol jerrquico que representa el problema en el espacio de estados es el de la figura 2.1. El nodo H, raz, es el nodo inicial, y los nodos objetivos son los nodos L y G.
156
Recorrido en Amplitud.
Se denomina tambin recorrido en anchura prioritaria. El algoritmo define una forma de moverse a lo largo de la estructura arbrea examinando los valores de los nodos de manera sistemtica y controlada, de forma que se pueda encontrar el nodo solucin. La idea es generar varias trayectorias de una determinada longitud antes de crear una trayectoria ms larga. Es decir, se recorren de izquierda a derecha, todos los subobjetivos generados por el objetivo de nivel inmediatamente superior antes de considerar el siguiente nivel de profundidad del rbol. Se examina cada nodo situado a un paso del estado inicial, y despus dos niveles ms all, y as sucesivamente, hasta que se han considerado todos los nodos del rbol o se ha encontrado la solucin. Es un procedimiento completo: garantiza encontrar una solucin si sta existe. Pero en general no es ptimo (no encontrar la mejor solucin, simplemente la primera que satisfaga el objetivo). Especficamente se realiza mediante los siguientes pasos: 1. Crear una lista de nodos e inicializarla con el nodo raz (estado inicial). Esta lista se maneja como una cola FIFO (first-in-first-out). 2. Lazo: -Si la lista est vaca, terminar.
157
-Quitar el primer nodo de la lista. -Si la lista contiene el nodo meta, salir. La solucin es el primer nodo de la lista. -Expandir el nodo actual y aadir todos sus hijos como nuevos nodos al final de la cola. La lista a gestionar para el rbol de la figura 2.1 tendra los siguientes valores:
En este ltimo paso se comprobara que el primer nodo de la lista es uno de los nodos solucin. Es decir, los nodos recorridos seran los representados en la diagonal: HABCDEFGJKL Por lo tanto, al llegar al nodo G se terminara el algoritmo dando esa solucin. Como se puede observar, el nodo L, la otra meta, sera el ltimo en alcanzarse. Si el nivel de profundidad asociado a la solucin es significativamente menor que el factor de ramificacin, se expandirn demasiados nodos intilmente .Por eso una variante muy utilizada de esta estrategia es la denominada prioridad al mejor (best-first), consistente en seleccionar primero los nodos con el mnimo nmero de subobjetivos y recorrerlos as; es decir, en ejemplo: HBFCGJAEDKL De esta forma se llega a la solucin de forma mucho ms eficiente. En este ejemplo se encontrara el nodo G a la quinta iteracin.
158
Este mtodo tiene complejidad exponencial tanto temporal como espacial. La complejidad temporal depende del factor de ramificacin y de la profundidad de la solucin. Si el nmero medio de sucesores es n (se utiliza el valor medio ya que el rbol de bsqueda no tiene por qu ser uniforme; es decir, no todos los nodos tienen igual nmero de sucesores) y la solucin se alcanza en el nivel p, el tiempo empleado es 1+n+n2++np. Siendo p un valor generalmente grande, la complejidad ser del orden O(nn). La complejidad espacial es tambin del orden O(nn), lo que lo hace difcil de utilizar en problemas reales. Las complejidades de las estrategias de bsqueda se calculan considerando el peor caso. Es decir, tanto la complejidad temporal como la espacial crecen exponencialmente con esta estrategia de bsqueda, por lo que slo se pueden aplicar a problemas de pequea dimensin.
Recorrido en Profundidad.
La bsqueda en profundidad es otra forma de recorrer sistemticamente una estructura de rbol para encontrar el nodo solucin, pero recorrindolo en profundidad, es decir, bajando de nivel. En vez de buscar de forma exhaustiva en cada nivel, este algoritmo sigue las ramas del rbol hacia abajo hasta el nivel ms inferior que pueda, hasta que encuentra la solucin o un nodo sin hijos. Se trata de expandir un nico camino desde la raz. En el caso de llegar a un callejn sin salida se retrocede hasta el nodo ms cercano desde donde se pueda tomar una rama alternativa para seguir avanzando. La complejidad temporal de esta estrategia es la misma que la del procedimiento de bsqueda en amplitud, puesto que para un grafo de una determinada profundidad se generan los mismos nodos, aunque en diferente orden. Sin embargo, esta estrategia puede ser muy ineficiente ya que el algoritmo puede dedicarse a recorrer un camino demasiado largo que no conduzca a ninguna solucin, o meterse en bucles infinitos. Por eso el algoritmo de bsqueda en profundidad no es completo ni ptimo. El procedimiento sigues los siguientes pasos:
159
1. Crear una lista de nodos e inicializarla con el nodo raz (estado inicial). Esta lista se maneja como una pila LIFO (last-in-first-out). 2. Lazo: 2.1 Si la lista est vaca, salir. 2.2 Extraer el primer nodo de la lista. 2.3 Si la lista contiene el nodo meta, salir.
Para cada hijo del nodo actual, expandirlo y aadir todos sus hijos como nuevos nodos al principio de la cola. La lista a gestionar tendra los siguientes valores para la figura 2.1:
El recorrido realizado sera: HADKLEBCGJ La complejidad espacial se reduce respecto al anterior ya que slo es necesario guardar constancia del camino construido hasta el momento. La complejidad para un camino de longitud p ser dicho valor ms el factor de ramificacin (r), es decir, O(p+r). Adems, cuando existen mltiples soluciones posibles, la eficiencia del mtodo aumenta. Debera establecerse un lmite de nivel de exploracin para acortar la longitud real del camino de la solucin. Esta estrategia se denomina bsqueda limitada por profundidad.
160
Se impone un lmite a la profundidad mxima de un recorrido (lp), que debe ser estimada en cada paso. Esta variante tiene la ventaja de que en general es completa (excepto para lmites muy `pequeos) aunque no es ptima. La eleccin del lmite de profundidad adecuado puede resultar crucial para la obtencin de la solucin. La bsqueda por profundizacin iterativa (iterative deepening) evita los problemas que conlleva esa seleccin probando de forma iterativa todos los lmites de profundidad posibles. As, comienza con profundidad cero (nodo raz), para probar con profundidad 1,2, etc. Esta estrategia es ptima y completa. De hecho, es el mtodo idneo para problemas con espacios de bsqueda de dimensin grande, de los que se conocen sus lmites de profundidad. Es una combinacin de la bsqueda preferente por amplitud y en profundidad. Otra variante de este mtodo es la llamada bsqueda con retroceso en la que, en lugar de generar todos los sucesotes al expandir un nodo, se genera un nico sucesor en cada paso, que ser el que se expanda. La lista tendra los siguientes valores para la figura 2.1:
El recorrido hasta encontrar los nodos sera: HADKLBFCG Su principal ventaja es que requiere menor espacio de almacenamiento que la bsqueda en profundidad: solo hay que recordar en cada instante un sucesor del nodo seleccionado, es decir, su complejidad es O(p). Otra ventaja es que no se generan las ramas del rbol de bsqueda que se encuentren despus del camino de la solucin. Sin embargo, la complejidad temporal es la misma que con los otros algoritmos, y tiene un factor de
161
indeterminacin en el orden del recorrido de los nodos que puede hacerle perder su eficiencia.
Bsqueda Heurstica.
La bsqueda heurstica tiene muchos ejemplos en la vida real. Uno de los ms conocidos es el problema del viajero, donde un vendedor tiene que recorrer una serie de ciudades de forma que en su ruta slo puede pasar una vez por cada ciudad y adems tiene que hacer el menor recorrido posible. Es un tipo de problema donde el nmero de soluciones sigue ley de explosin combinatoria, conocidos como np-completos. Es decir, no puede ser resuelto por los algoritmos de bsqueda ciega. Son problemas para los que es imposible computacionalmente encontrar la mejor solucin para dimensiones elevadas por ese crecimiento exponencial. La nica forma de abordarlos es conformarnos con una solucin suficientemente buena, y hay varios mtodos de bsqueda heurstica que proporcionan formas prcticas de hacerlo. Las estrategias de bsqueda heurstica se caracterizan por la tendencia a limitar el tiempo y el espacio en donde buscar la respuesta a problemas complejos, y asumir que aceptaremos cuando la encontremos una buena solucin, que puede no ser ptima. En este sentido, aplicamos reglas heursticas o empricas para determinar a lo largo de un recorrido cul es el trayecto que con mayor probabilidad nos lleve a una solucin. Los algoritmos vistos hasta ahora se denominan en general algoritmos de generacin y prueba. En su implementacin ms bsica, los pasos para ejecutarlos son: 1. Generar una posible solucin, ya sea un nuevo estado o un camino a travs del espacio de bsqueda. 2. Probar si ese nuevo estado o camino generado es una solucin comparndolo con un conjunto de estados objetivo. 3. Si es la solucin, terminar. En otro caso, volver al paso 1. Realmente es un recorrido en profundidad que realiza una bsqueda exhaustiva del espacio de estados. Si hay una solucin, este algoritmo la encontrar, aunque probablemente le lleve mucho tiempo. Para problemas de dimensiones pequeas puede ser efectivo, pero para problemas ms complejos esta bsqueda no guiada es impracticable.
162
Su principal desventaja radica en que no hay ninguna informacin relativa a en que direccin orientar la bsqueda, por lo que se han desarrollado otras estrategias para incorporar este tipo de conocimiento con el uso de las funciones heursticas. La bsqueda heurstica utiliza informacin adicional sobre el problema especfico, como el coste o la distancia al estado final. Para tener en cuenta esta informacin, los mtodos heursticos utilizan las denominadas funciones de evaluacin heursticas f que calculan o evalan el valor de cada nodo particular en el rbol de bsqueda, dando una idea de lo cerca o lejos que se encuentren del nodo objetivo. Es decir, son aplicaciones que hacen corresponder a cada estado del espacio de bsqueda un valor numrico cj. F(estadoj)=cj (2.1)
Con estos valores se puede estimar el coste que llevara recorrer sus ramificaciones, guiando la bsqueda hacia aquellos caminos que parecen ms prometedores. El valor mximo o mnimo de las funciones heursticas debe alcanzarse en un estado meta. Vamos a describir los principales mtodos de bsqueda heurstica.
163
Sin embargo, uno de sus principales problemas es que puede caer en extremos locales. Porque estamos siempre avanzando en la direccin del menor coste, por ejemplo, se puede seguir un camino que alcance una buena solucin pero dejando de lado la solucin ptima que quizs se encontraba muy cerca. De este mnimo o mximo local es difcil salir ya que cualquier movimiento nos llevar a un prximo estado peor, con menor valor de bondad en la funcin de evaluacin. En algunos casos el espacio de bsqueda presentar una meseta o zona plana en la cual cualquier nuevo estado tiene asociado el mismo valor que el anterior, por lo que el algoritmo se estancar ya que no encontrar la diferencia de valores positiva o negativa necesaria para avanzar. Para evitar estos extremos locales se han propuesto diversas estrategias. Una consiste, por ejemplo, en forzar un reinicio. Cuando no se logra ningn avance significativo se recomienza desde otro nuevo punto. Habitualmente esta tcnica es suficiente para encontrar la solucin. Otro mtodo consiste en aadir ruido a la funcin de evaluacin para lograr salir de los extremos locales. Inicialmente el nivel de ruido es alto y se va reduciendo gradualmente con el tiempo. Esta tcnica, denominada simulated annealing (enfriamiento o temple simulado) permite al algoritmo explorar direcciones que no son las mejores pero que pueden conducir a una exploracin ms completa del espacio de calentados y luego enfriados lentamente, el parmetro que se utiliza en el enfriamiento simulado se denomina temperatura, de forma que una temperatura elevada permite hacen que el algoritmo vuelva a un comportamiento ms determinista.
Primero el Mejor.
La bsqueda por primero el mejor o bsqueda preferentemente por lo mejor es una estrategia de control sistemtica que combina las ventajas de los mtodos de bsqueda exhaustiva en amplitud y en profundidad. Su principal diferencia con esos mtodos es que en este caso se hace uso de la informacin que proviene de las funciones de evaluacin para ordenar los nodos en la cola. En este sentido se elige como primer nodo el que parece que va a ser mejor (coste mnimo), antes que cualquier otro, sin tener en cuenta su posicin en el rbol o grafo. Es decir, s expande el ms prometedor, el que ha resultado mejor evaluado.
164
Con este mtodo siempre se encuentra un mnimo global, por lo que consigue paliar el problema de los extremos locales. Sin embargo, presenta una desventaja: el hecho de que en el algoritmo no se considera el camino recorrido hasta el momento, lo que podra dar lugar a una solucin no idnea. Por ejemplo, si uno nodo se encuentra muy cerca de la meta, quizs ya inicialmente, pero hay otro cuya distancia al nodo final es menor aunque suponga un recorrido ms largo, se seleccionar este ltimo debido a esa estimacin de la distancia que no tiene en cuenta el coste acumulado. Por ejemplo, definimos una funcin de coste asociada a cada nodo cuyo valor sea la distancia al nodo meta (figura 2.2). El coste de la generacin de cada sucesor se puede considerar cero o uno. En cualquier caso, va a ser un valor constante.
Los pasos del algoritmo primero el mejor son: 1. El estado inicial est formado nicamente por el nodo inicial. 2. Lazo: 2.1 Extraer el nodo inicial. 2.2 Se expande el nodo y se aaden todos sus sucesores a la cola. Guardar el recorrido.
165
2.3 Se evala cada uno de los nodos sucesores. Si algn sucesor es la meta, salir.
2.4 Se extrae el nodo con menor coste y se aaden sus sucesores. Guardar el recorrido. 2.5 Volver al paso 2.3.
El algoritmo aplicado al ejemplo de la figura 2.2, donde la solucin consiste en llegar al nodo F, seria:
El camino recorrido siguiendo los punteros que conduce a la solucin es: HAEDKLF Como se ha hecho notar, con este mtodo no se ha seleccionado el recorrido ms corto en el sentido de recorrer menos nodos, que hubiera sido por la rama del nodo C, sino que las decisiones se han ido tomando en cada momento segn la distancia estimada en ese punto, no acumulada, aunque el coste acumulado sea menor en esta solucin. Existe una variante denominada bsqueda en haz (beam search), que pretende acelerar el proceso de bsqueda permitiendo explorar ms de una rama simultneamente.
166
Bsqueda Avara.
Denominada greedy search, este algoritmo es tambin una estrategia derivada del mtodo primero el mejor, y viene a paliar una de sus ventajas. En este caso lo que se intenta es minimizar el coste total para alcanzar la meta. Por lo tanto, siguiendo una estrategia avara, se expandir el nodo que se presuponga ms cercano al nodo final, para minimizar as tambin el recorrido. Desafortunadamente, el coste exacto del recorrido al estado final no se puede calcular de forma precisa por lo que tendremos que conformarnos con una estimacin basada en una funcin heurstica h, la que se computa para cada nodo el coste estimado desde ese nodo al nodo final por el camino de menor coste. Cuanto mejor sea la estimacin de la funcin h mejor y ms rpidamente se encontrar la solucin. Cuando se llega al nodo meta, la evaluacin de h en ese estado debe ser cero. Es por lo tanto un caso de bsqueda heurstica ya que es esta funcin h la que dirige el recorrido en base a un conocimiento sobre el camino con menor coste. La eleccin de la funcin heurstica es crucial para e funcionamiento del algoritmo y tambin para reducir la complejidad espacial y temporal del mismo. Generalmente es un mtodo eficiente ya que suele encontrar la solucin con rapidez, si bien sta no siempre es ptima porque lo que va considerando en cada momento es la solucin inmediata ms barata, sin una visin global. Tampoco es completa pues puede recorrer una ruta infinita y se estancara en ella sin probar otros caminos alternativos.
Algoritmo a*
Uno de los algoritmos de bsqueda ms conocidos y utilizados en la IA es el A*,que combina la eficiencia del algoritmo de bsqueda avara con el mtodo de coste uniforme que tiene las deseables propiedades de ser ptimo y completo. Es decir, encuentra una solucin siempre y cuando sta exista, incluso para grafos infinitos, y adems no cae en mnimos locales, sino que encuentra el extremo global. Otras de las ventajas de este mtodo es que expande el menor nmero de nodos. Sin embargo, puede tardar mucho en hacer la seleccin entre dos caminos casi iguales por lo que a veces puede requerir mucho tiempo.
167
El mtodo de la bsqueda avara lo hemos descrito en el apartado anterior. Lo que se trataba de reducir al mnimo el coste de la meta h(n). El mtodo denominado de coste uniforme es una variacin de la bsqueda en amplitud donde lo que se busca no son los caminos de menor longitud si no de menor coste, por lo tanto, minimizar la ruta g(n). Es decir, se expande el nodo con menor coste de la ruta, en vez del que tenga menor profundidad, como haca la estrategia en amplitud. Esta bsqueda si es ptima y completa, pero puede ser muy ineficiente. En el algoritmo A* la funcin de evaluacin se calcula sumando estas dos medidas heursticas para cada nodo n: -El coste estimado para ir de n al estado meta, h(n); -El coste que ha sido necesario para llegar a ese nodo n desde la raz o nodo inicial, g(n). Este ltimo dato no es una estimacin ya que puede ser conocido con exactitud. La funcin de evaluacin f(n) estima el coste total de camino a la solucin que pasa por el nodo n. F(n)=g(n)+h(n) 2.2
Es decir, el conocimiento heurstico incorporado a este procedimiento permite evaluar y ordenar los nodos en la lista para dirigirla de forma ms eficiente hacia el nodo meta. Como se puede deducir, el mtodo del coste uniforme es un paso particular del algoritmo A* que tiene lugar cuando Vn h(n)=0. El procedimiento para llevar a cabo este algoritmo es el mismo que el anterior, si bien ahora habr que sumar a la distancia estimada a la meta el camino de menor coste encontrado hasta cada nodo para formar la nueva funcin heurstica f. Para el ejemplo de la figura 2.2, el proceso de ejecucin del algoritmo con esta estrategia sera.
168
Con el cual se obtiene el mismo camino solucin que con el mtodo del primero el mejor. A los arcos que unen los distintos nodos se les puede asociar un coste no constante, en cuyo caso el procedimiento de resolucin sera el mismo pero ahora habra que sumar a cada nodo como valor de g(n) el que indica ese enlace. Como se ha comentado, el algoritmo A* es completo y ptimo siempre y cuando se verifique una restriccin: que la funcin heurstica h(n) sea admisible. Es decir, que la funcin h que se seleccione nunca sobreestime el coste que implica alcanzar la meta. Es por lo tanto una acepcin optimista de la bsqueda. Sin embargo, sigue siendo un mtodo con una complejidad temporal y espacial que generalmente es exponencial. Una conocida modificacin del algoritmo A* es la llamada IDA* (Iterative Deepening A*) o bsqueda por profundizacin iterativa (A*PI), que tiene por objeto garantizar la linealidad respecto a la complejidad espacial. En vez de limitar la profundidad de la bsqueda, este nuevo algoritmo utiliza una limitacin en el coste. Mantiene menos caminos simultneamente que A*, de ah la reduccin del consumo de memoria, pero no deja de encontrar la solucin gracias a que explora mltiples rutas.
Algoritmos Genticos.
La computacin evolutiva consiste en el desarrollo de algoritmos basados en los mecanismos genticos de seleccin natural de los sistemas biolgicos. Dentro de ella el paradigma de los Algoritmos genticos es una de las tcnicas ms populares y relativamente recientes. Surgieron del estudio de los autmatas celulares llevando a cabo por Holland y col.(1975), en la Universidad de Michigan.
169
Los Algoritmos genticos son un procedimiento de bsqueda y optimizacin heurstica que utiliza una funcin de evaluacin en base a la cual se dirige la bsqueda. Esta funcin heurstica pondera la calidad de cada estado. Su principal ventaja es que permite explorar un amplio espacio de estados. Sin embargo, no son ptimos. Se utilizan cuando lo que se persigue es una solucin aceptablemente buena en un tiempo razonablemente corto. Basada en la analoga con el comportamiento evolutivo de los seres vivos, las representaciones de las posibles soluciones dentro de un espacio de bsqueda se denominan cromosomas y definen individuos. Estos individuos o soluciones candidatas forman una poblacin, y son manipulados mediante operadores genticos, como la mutacin o el cruce, para dar lugar a nuevos individuos ms cercanos a la solucin final. Estos operadores genticos permiten ampliar el espacio de bsqueda. En concreto el operador de cruce introduce gran cantidad de ruido en el proceso para garantizar que se cubre en la exploracin todo el espacio de estados. El xito de los algoritmos genticos est en su capacidad de optimizar tanto explorando nuevos puntos en el espacio de bsqueda como explorando la informacin ya descubierta. Es ms, poseen un paralelismo implcito y tienen la habilidad de mantener mltiples soluciones concurrentemente, por lo que son menos susceptibles a mnimos locales y problemas de ruido.
Verificacin de Restricciones.
Junto con las anteriores aproximaciones, se puede enunciar en el planteamiento de un problema una serie de requisitos que deben cumplir las soluciones para que sean viables. Son una forma de representar una parte del conocimiento que tenemos de un problema. Estas restricciones pueden ser de gran ayuda en la bsqueda ya que restringen el espacio de soluciones posibles y reducen el nmero de caminos que hay que recorrer para encontrar una solucin factible. Los caminos que violan alguna de esas restricciones no son analizados. El problema, que se puede representar como un grafo, se entiende entonces como una bsqueda de un conjunto de objetivos, donde uno es el nodo final pero adems hay una
170
serie de acotaciones a los valores posibles que van tomando las variables del algoritmo. Esto reduce de forma inmediata el nmero de combinaciones a explorar. El enunciado de un problema de bsqueda con restricciones tiene tres trminos: Las variables del problema. Los dominios de esas variables o conjunto de valores posibles que pueden asignarse. El conjunto de restricciones que deben ser satisfechas.
Las restricciones pueden ser monarias o unarias, cuando constrien los valores de una sola variable; binaria, cuando limitan a un par de variables etc. Tambin se pueden clasificar en absolutas o hard constraints, que realmente determinan la solucin pero admiten cierta tolerancia en su cumplimiento. Estos algoritmos suelen requerir adems alguna estrategia de seleccin de variables cuando hay conflicto, es decir, asignar unas prioridades a las condiciones. De este orden pueden depender que se encuentre o no la solucin. Por ejemplo, se suele comenzar por asignar valor a las variables que estn implicadas en un mayor nmero de restricciones. Se pueden establecer distintos criterios. Las restricciones se pueden propagar a lo largo de los nodos de un rbol de bsqueda, de forma que se va asociado a cada nodo la limitacin correspondiente. Por ejemplo, si el coste total no puede pasar de 30, y por una rama determinada la primera generacin de sucesores supone un coste de 10, el lmite para los dems elementos que se vayan a generar posteriormente es obviamente 20. En muchos casos las restricciones dan lugar a retrocesos en la bsqueda para encontrar una solucin que las satisfaga (backtracking). Se trata de deshacer el camino andando ya que se ha llegado a una incompatibilidad, e ir rastreando hacia arriba hasta llegar a la variable que no se compatible y asignarle un nuevo valor. Como se trata de recorrer el rbol desde los niveles inferiores hacia arriba, y luego con el nuevo valor de la variable volver a hacer el recorrido sin la garanta de que ahora es compatible, este proceso puede llevar bastante tiempo.
171
En este sentido, la verificacin anticipada puede suponer un ahorro de tiempo ya que consiste en probar la consistencia de algunos valores antes de asignarlos a las variables correspondientes. Relacionan con esta implementacin est la heurstica de la variable ms restrictiva, en la que en la que se intenta reducir el factor de ramificacin en futuras elecciones asignando un valor a la variable que est relacionada con el mayor nmero de restricciones de otras variables sin valor asignado. Suele ser bastante efectiva, sobre todo en combinacin con la heurstica del valor menos restrictivo: seleccionar un valor que repercuta en el mnimo nmero de valores en variables relacionadas mediante restricciones.
Bsqueda de Adversarios.
El problema de la toma de decisin puede ser crucial en una serie de aplicaciones. Por ejemplo, en los juegos o estrategias logsticas donde el objetivo es ganar ante unos adversarios, cualquier tipo de informacin que ayude a tomar la decisin acertada es muy valiosa. En ese sentido, el plantear este tipo de problemas de forma que se puede aplicar una estrategia de bsqueda ha sido siempre un campo de inters para los investigadores de la IA. Como se ha recordado en el primer captulo, la mayora de las primeras aplicaciones de la IA fueron juegos que requeran la aplicacin de las facultades intelectuales. En ese sentido, este tipo de problemas han contribuido enormemente el desarrollo de la IA. Un juego tiene una gran similitud con un problema de bsqueda porque se define mediante: -Un estado inicial o configuracin inicial (tablero, laberinto, etc). -Una serie de operadores (jugadas o movimientos permitidos). -Una funcin de utilidad o de resultados (determina quin gana). Puede representarse por la puntuacin asociada a una jugada o al juego en general. -Un estado o prueba final (identifica el final). Genera los estados terminales. Por lo tanto, el primero paso ser la representacin del juego como un rbol de bsqueda, y la definicin de las funciones de utilidad y de prueba final, es decir, determinar el objetivo final. En general aunque se puede plantear como escenario un rbol completo
172
que represente las caractersticas del juego, frecuentemente no es posible tener en cuenta la totalidad del rbol, por lo que en algn momento suele ser necesario suspender la bsqueda y aplicar una funcin de evaluacin mediante la cual se obtenga una estimacin de la utilidad de un estado determinado para saber por dnde seguir. Hay diversos tipos de planteamiento en la resolucin de los problemas de bsqueda aplicados a los juegos, determinados por sus caractersticas especficas. Depende de nmero de elementos con capacidad de decisin involucrados, de la informacin que posean del entorno y de los contrarios, etc. En las aplicaciones con dos participantes que cuentan con informacin perfecta (y juegan tambin de forma perfecta), el algoritmo minimax permite determinar cul ser la mejor jugada. Como una modificacin de ste, el algoritmo alfa-beta es ms eficiente gracias a la poda que realiza de las ramas del rbol de bsqueda que resultan irrelevantes para el resultado final. Ejemplos explicados con detalle de estos mtodos se muestran en el libro de escolano y colaboradores 2003. Los juegos de azar se pueden manejar como una extensin del algoritmo minimax mediante el que se evalan nodos aleatorios, para lo que se toma en cuenta el valor de la utilidad promedio de todos sus nodos hijos, ponderados por la probabilidad respectiva de cada hijo.
173
valores bajos de la funcin de utilidad son buenos para MIN que intenta minimizar el valor de la funcin heurstica para dificultar a su contrincante la consecucin de la meta. Debido a la alternativa en el juego, cada nivel dentro del rbol est formado slo por nodos MAX o nodos MIN. Si comienza MAX y ocupa la raz, este ocupar los niveles pares del rbol y el nivel inmediatamente inferior lo ocupar los nodos del jugador contrario. El algoritmo de minimax desarrolla una bsqueda en profundidad limitada. Se puede describir de forma simplificada en los siguientes pasos: 1.-Generacin del rbol de bsqueda, desde la raz hasta los estados terminales. 2.- Obtencin del valor de la funcin de utilidad en cada estado terminal. 3.-Aplicacin de la funcin de utilidad para calcular este valor de cada uno de los nodos del nivel inmediatamente superior a los terminales. 4.-Continuacin de la propagacin de los valores de los nodos hojas en direccin a la raz una capa cada vez. 5.-Cuando los valores calculados llegan a la raz del rbol, MAX elige la jugada que le permite obtener el valor ms alto. Es decir, este algoritmo en cada jugada el operador con el que se obtiene la mejor utilidad, la mejor jugada posible. Recorre todo el rbol del juego con una exploracin exhaustiva y va pasando por todas las hojas para ir calculando el valor de utilidad de un movimiento que llevar a la toma de decisin. Hay que tener en cuenta que lo se propaga hacia arriba depende del estado terminal, que puede tener una funcin de utilidad que represente tanto ganar como perder o empatar. Al recorrer el rbol en sentido ascendente se va conociendo cul de las tres situaciones mencionadas se puede llegar desde cada nodo de los niveles superiores al aplicar operadores. Por ejemplo, en el rbol de la figura 2.3, la estrategia ganadora sera la que llevar a MAX a los valores ms altos de la funcin de utilidad, supongamos que igual o mayor que el valor 6. La jugada seleccionada por MIN sera la respuesta a la jugada de MAX que diera el menor valor de los posibles despus del primer movimiento de MAX. Se han marcado los nodos MAX con rombos y los MIN con elipses.
174
Si existe, una estrategia ganadora para MAX ser un subrbol en el que todos sus nodos terminales son ganadores; de esta forma se puede garantizar el xito sea cual sea la respuesta del adversario. El recorrido marcado en la figura 2.3 desemboca siempre en una rema ganadora. Cualquier jugada de MIN hace que MAX sea el vencedor si ha optado por esa rama.
Figura 2.3 rbol para minimax. Por el contrario, una estrategia ganadora para MIN ser el subrbol en el que todos sus nodos terminales sean perdedores, teniendo en cuenta que cada vez que juega MAX habr que considerar todos sus movimientos y cuando juega MIN slo es necesario considerar una de las dos alternativas. El ejemplo comentado anteriormente de 3 en raya se puede tambin expresar como rbol de bsqueda para aplicar esta estrategia de minimax, pero resulta tan compleja su representacin total que slo se pueden mostrar aspectos parciales del mismo. Como es un algoritmo de bsqueda en profundidad, su complejidad temporal es exponencial, pero la espacial es lineal. Es por lo tanto ineficiente para problemas reales por el tiempo de cmputo requerido, pero sin embargo permite abordar el problema de los juegos desde un punto de vista de la representacin que facilita su comprensin.
175
Poda Alfa-Beta.
Es un mtodo basando en el minimax pero ms eficiente puesto que evita el recorrido exhaustivo de todos los nodos de un rbol de bsqueda. Reduce por lo tanto considerablemente el nmero de nodos expandidos, y por eso se le denomina mtodo de poda, ya que no explora todas las ramas. Obtiene la misma solucin que con el anterior pero no recorre las ramas que no van a influir en la decisin final, y por tanto, al no calcular sus consiguientes valores de utilidad ni expandir sus sucesores, requiere generalmente menor tiempo computacional. Sin embargo, esa afirmacin depende del orden en que se exploren los nodos del rbol. De hecho, en el peor de los casos habra que examinar todos los nodos terminales y tendra la misma complejidad que el procedimiento minimax. Para realizar la poda, este mtodo va anotando cundo se puede hacer una poda porque en una rama haya algn nodo con un valor de utilidad inferior al de otro recorrido. Para ello lo que hace es pasar, en cada llamada recursiva a un nodo hijo, dos valores ( y ) de manera que marque la cota inferior de los valores que se van a ir buscando en la parte del rbol que queda por explorar, y es la cota superior de esos mismos valores. Si en algn momento llega a ser mayor o igual que no tendra sentido seguir con la bsqueda, realizndose una poda si estamos en un modo MAX o si estamos en un nodo MIN. Se suele denominar por eso poda -. Los valores de y se suelen inicializar a - y + respectivamente. Tambin se les puede asignar a el valor mnimo de la funcin de la utilidad y a el valor mximo que puede alcanzar la funcin de evaluacin heurstica.
176
mientras que la resolucin de restricciones esta orientada principalmente a problemas sobre dominios infinitos o dominios ms complejos. En este capitulo, se trataran principalmente los problemas de satisfaccin de restricciones (CSP). Los conceptos clave en esta metodologa corresponden a los aspectos de: La modelizacin del problema, que permite presentar un problema mediante un conjunto finito de variables, un dominio de valores finito para cada variable y un conjunto de restricciones que acotan las combinaciones validas de valores que las variables pueden tomar. En la modelizacin CSP, es fundamental la capacidad expresiva, a fin de poder captar todos los aspectos significativos del problema a modelar. Tcnicas inferenciales que permiten deducir nueva informacin sobre el problema a partir de la explcitamente representada. Estas tcnicas tambin permiten acotar y hacer ms eficiente el proceso de bsqueda de soluciones. Tcnicas de bsqueda de la solucin, apoyadas generalmente por criterios heursticos, bien dependientes o independientes del dominio. El objetivo es encontrar un valor para cada variable del problema de manera que se satisfagan todas las restricciones del problema. En general, la obtencin de soluciones CSP es NP completo mientras que la obtencin de soluciones optimizadas NP duro, no existiendo forma de verificarla optimalidad de la solucin en tiempo polinomial. Por ello, se requiere una gran eficiencia en los procesos de bsqueda.
177
Una funcin utilidad (tambin llamada funcin objetivo o funcin de rentabilidad), que da un valor numrico a los estados terminales. En el ajedrez, el resultado es un triunfo, perdida, o empate, con valores +1, -1o. Algunos juegos tienen una variedad ms amplia de resultados posibles: las rentabilidades en el backmmon se extienden desde + 192 a -192. El estado inicial y los movimientos legales para cada lado definen el rbol de juegos. Los juegos son interesantes porque son demasiado difciles para resolverlos. Porejemplo, el ajedrez tiene un factor de ramificacin promedio de aproximadamente35, y lo s juegos a menudo van a 50 movimientos por cada jugador, entonces el rbol de bsqueda tiene aproximadamente 35"' o nodos. Por lo tanto, los juegos, como el mundo real, requieren de capacidad de tomar alguna decisin cuando es in factible calcular la decisin ptima. Los juegos tambin castigan la ineficiencia con severidad. Mientras que una implementacin de la bsqueda A* que sea medio e entre costar simplemente dos veces ms de ajedrez que sea demasiado eficiente en la utilizacin de su tiempo disponible, probablemente tendr que descartarse si no intervienen los otros factores. La investigacin en juegos ha generado, por lo tanto, varias ideas interesantes sobre cmo hacer uso, lo mejor posible, del tiempo. Comenzando con una definicin del movimiento ptimo y un algoritmo para encontrarlo. Veremos tcnicas para elegir un movimiento bueno cuando el tiempo es limitado. La poda nos permite ignorar partes del rbol de bsqueda de no marcan ninguna diferencia para obtenerla opcin final, y las funcional es de evaluacin heurstica nos permiten aproximar la utilidad verdadera de un estado sin hacer una bsqueda
178
BIBLIOGRAFIA
Moker Robert J. Dologite D.G. Knowledge-based Systems: An introduccion to expert systems. Ed. MacMillan, 1992. Lgica matemtica. Ed. Suppes, ed. Revert, 1988. Cuena Jos. Lgica matemtica. (2 Edicin), Ed. Alianza Editorial, S.A. Mxico, 1986. Russell Stuart, Norving Peter. Inteligencia Artificial (un enfoque moderno). Ed. Prentice Hall, 1995. C. Rowe Neil. Artificial Inteligence through Prolog. Ed. Prentice Hall, 1988. Giarratano Joseph, Riley Gary. Sistemas expertos, principios y programacin (CLIPS). 3 Edicin Ed. International Thompson Editores, Mxico, 1996. Rich Elaine, Knight. Inteligencia Artificial. 2 Edicin, Ed. McGraw-Hill, 1994. M.J. Benedet . Procesos cognitivos en la deficiencia mental. Madrid: Pirmide, 1991 L.E. Berk. Desarrollo del nio y del adolescente. Madrid: Prentice Hall, 1998 V. Gordon Childe. A Evoluo Cultural do Homem. Trad Waltensir Dutra. RJ: Zahar Editores, Rio de Janeiro, 1971. Dr. Frank George. Modelos de Pensamientos. Trad. Mrio Guerreiro. Petrpolis, RR: Vozes, 1973 Immanuel Kant. Duas introdues Critica do Juzo. (Org) Ricardo R. Terra So Paolo: Lluminuras, 1995. Zsolt Lszio Kovacs. O cerebro e a sua mente: uma introduo neurociencia Computacinal. So Paulo: Academica, 1997. Maturana, Humbert R. e Varela, Francisco J. A arvore do conhecimento. Trad Jonas Pereira dos Santos. Editora Psy II: Campinas, 1995. Moreira Marco Antonio e Masini, Elcie Salzano. Aprendizagem Significativa: a teora de David Ausubel. Sao Paulo: Moraes, 1995. Sacks, Oliver. Um antropgo em Marte. Trad. Bernardo Carvalho. Sao Pulo: Companhia das Letras, 1995
179