Manual HTN-PDDL
Manual HTN-PDDL
Manual HTN-PDDL
dominios HTN-PDDL
1. Introduccin
En este documento se describe la extensin del lenguaje PDDL para la descripcin de dominios jerrquicos que se denomina HTN-PDDL. HTN-PDDL es un lenguaje con soporte temporal que permite controlar y dirigir la bsqueda mediante el uso de heursticas. El lenguaje HTN-PDDL est basado en el estndar de facto PDDL [pddl2-1] [pddl2.2] [pddl-ext] [PDDL 3.0] (Planing Domain Description Language) utilizado en la International Planning Competition (IPC), que es una competicin que se realiza de forma bianual y de forma conjunta con la Conferencia Internacional de Planificacin y Scheduling (ICAPS International Conference on Automated Planning and Scheduling) y que trata de comparar los planificadores ms modernos enfrentndolos a una batera de problemas en diversos dominios descritos en PDDL. La versin del lenguaje a partir de la cual se extiende HTN-PDDL es la 2.2 en su nivel 3, versiones posteriores no estn todava soportadas en el lenguaje. Las principales caractersticas del lenguaje PDDL son las siguientes:
Las acciones o operadores primitivos tienen el estilo usado por el planificador STRIPS [strips] [strips2]. Se pueden definir efectos condicionales. Dispone de cuantificadores universales. Permite la descripcin de axiomas sencillos. Se pueden describir restricciones de integridad. En la primera versin del lenguaje PDDL, la 1.2, exista la posibilidad de definir acciones jerrquicas. El formalismo introducido era muy complejo y eso hizo que ninguno de los planificadores ms conocidos hiciera uso de esta caracterstica. Esta capacidad del lenguaje adems no fue ampliada ni modificada en versiones posteriores por lo que ha quedado abandonada. Se permiten utilizar distintas extensiones del lenguaje, que los planificadores pueden o no utilizar dependiendo de la potencia expresiva de estos. Aumenta la expresividad temporal de PDDL 2.2 nivel 3. Aade un soporte para las acciones jerrquicas, con una expresividad distinta y ms clara que la usada en PDDL 2.1. Aade la posibilidad de invocar a lenguajes de scripting, como Python, para hacer llamadas externas o realizar ciertos clculos, durante la fase de planificacin.
Aunque HTN-PDDL es un superconjunto de PDDL se basa en un formalismo distinto al utilizado por los planificadores planos que son los que compiten en la IPC. Por lo tanto probablemente ningn planificador jerrquico pueda resolver los dominios y los problemas usados en la IPC sin introducir ciertos cambios sobre los mismos, a pesar de que un parser de HTN-PDDL pueda parsear los dominios escritos en PDDL. De hecho los objetivos en HTN-PDDL se describen de una manera distinta que en PDDL. El lenguaje HTN-PDDL est en constante desarrollo y evolucin, por lo tanto el lenguaje descrito en este documento puede ser ampliado en futuras versiones, aunque siempre se tratar de mantener la compatibilidad hacia atrs. Esta documento especfica las caractersticas del lenguaje HTNPDDL en su versin 1.1.
2. Notacin
La notacin que se utilizar para describir las reglas ser EBNF (Extended BNF). Se utilizarn los siguientes formalismos para describir las reglas sintcticas del lenguaje HTN-PDDL
Las reglas tienen la siguiente forma <elemento>: <expansion> Se usarn ngulos para delimitar los nombres de los elementos sintcticos. Se usan los corchetes [ ] para delimitar aquellos elementos que son opcionales. Se usan parntesis para delimitar bloques dentro del lenguaje HTN-PDDL o para indicar parmetros de una regla en concreto. Los parntesis forman parte del lenguaje. Como en BNF el asterisco * denota 0 o ms veces y el smbolo + denota 1 o ms veces.
3. Comentarios
Los comentarios en HTN-PDDL empiezan con un ; y terminan con un retorno de carro.
Ejemplo 1. ; Esto es un comentario escrito en HTN-PDDL
4. Trminos y tomos
Los trminos pueden ser constantes (objetos del dominio) o variables.
<symbol>: <term>: <name> <constant> | <variable> | <number> <variable>: <constant>: <predicate>: <typed-predicate>: <typed-variable>: <typed-variable>: <type>: ?<name> <symbol> (<symbol> <term>*) (<symbol> <typed-variable>*) <variable> - <type> <variable> <symbol> | (either <type>*)
Un smbolo es una cadena alfanumrica que comienza con una letra y que puede contener letras, dgitos, guiones y subrayados. Los caracteres acentuados y la del castellano tambin es aceptada. HTN-PDDL no es sensible a las maysculas, es decir, el smbolo hola es equivalente al smbolo HoLa.
Una constante se identifica con un smbolo y representa un objeto del dominio. Una variable se identifica con un smbolo que comienza por un carcter de cierre de interrogacin. Al igual que en el PDDL estndar tanto smbolos, como variables, como predicados, pueden tener un tipo asociado. Se permite definir una jerarqua de tipos que efecta las relaciones de herencia de propiedades entre los objetos del dominio.
Ejemplo 2. ; objetos ferrari - automovil ; predicados (atributos de un objeto) ; instanciados y no instanciados (velocidad_maxima ?vehiculo - automovil ?x - number) (velocidad_maxima ferrari 220)
En HTN-PDDL si no se especifica expresamente un tipo se supone que hereda por defecto del tipo especial object.
5. Dominios
Para que un planificador disponga de toda la informacin para operar con el lenguaje HTN-PDDL ste recibe dos ficheros de entrada. Un fichero con la especificacin del dominio, que es la descripcin del mundo (tareas jerrquicas, operadores primitivos, objetos, atributos y tipos) y otro fichero con el problema que queremos resolver. La descripcin de un dominio en HTN-PDDL tiene la siguiente sintaxis:
<domain>: (define (domain <symbol>) [<require-def>] [<customization-def>] [<types-def>] [<constants-def>] [<predicates-def>] [<functions-def>] [<structure-def>*])
En HTN-PDDL Un dominio consta de siete bloques todas excepto el bloque de personalizacin customization ya existen en PDDL 2.2. La seccin de personalizacin ser analizada en detalle ms adelante. Se empezar estudiando la sintaxis de la declaracin de tipos.
6. Declaracin de tipos
<types_def>: <type-def>: <type-def>: (:types <type-def>*) <symbol>+ - <type> <symbol>+
Se usa una lista de tipos para declarar todos los tipos que heredan (son subtipo) de un tipo determinado. Los tipos aparecen precedidos de un guin (-), todo tipo que preceda al guin (subtipo) queda declarado como del tipo que aparece tras el guin (supertipo). Si no se especifica un supertipo explcitamente un tipo siempre se supone por defecto que hereda del tipo especial object. Se permite realizar herencia mltiple mediante el uso de clausula either.
Ejemplo 3. ; declaracin de tipos (:types persona persona_anorexica persona persona_guapa persona ; herencia mltiple
7. Declaracin de constantes
<constants-def>: <constant-def>: <constang-def>: (:constants <constant-def>*) <symbol>+ - <type> <symbol>+
Las constantes se representan mediante smbolos y modelan los objetos del dominio. Se permite que las constantes sean declaradas como pertenecientes a una serie de tipos determinados, como se puede apreciar en el siguiente ejemplo:
Ejemplo 4. ; declaracin de constantes (:types paz_vega actor ana_belen (either actor cantante) )
8. Declaracin de predicados
<predicates-def>: (:predicates <typed-predicate>*)
Los predicados son usados para definir atributos de los objetos. Tambin se usan para definir relaciones de cualquier aridad entre los objetos. En planificacin jerrquica HTN tambin se pueden usar ciertos predicados que no forman parte del estado como herramientas para generar heursticas de control del procesamiento del planificador.
Ejemplo 5. ; declaracin de predicados (:predicates (altura ?p persona ?x -number) (casado ?amargado_x -persona ?amargado_y - persona) (jefe_de ?x -persona ?mala persona) (director ?la_peor - persona) )
9. Declaracin de funciones
<functions-def>: <function-def>: <python-code>: (:functions <function-def>*) (<typed-predicate>*) [- <type>] [<python-code>] {<python_script>}
Las funciones utilizadas en PDDL no se corresponden totalmente con el concepto que tenemos de funcin, por eso en PDDL se denominan fluents literals. Un fluent es un predicado que almacena un determinado valor, que en la mayora de los casos suele ser un nmero, de forma que el lenguaje permite realizar operaciones aritmticas y de comparacin entre estos fluents como veremos ms adelante. En HTN-PDDL se permite asociar un literal a una verdadera funcin descrita en un lenguaje de scripting. El lenguaje de script ms usado en los dominios descritos en HTN-PDDL es Python (http://www.python.org). Las convenciones a usar para el paso y retorno de parmetros al script estn todava en una fase
experimental. Actualmente slo se permite que el script devuelva (mediante la clusula return) un nmero o un smbolo (objeto constante) ya predefinido en el dominio. El script debe poder usar las variables PDDL declaradas como argumento de la funcin, en los clculos internos. El parser de HTN-PDDL debe hacer una sustitucin de estas variables por los valores que efectivamente toman en tiempo de planificacin. De esta forma si se consigue tener funciones reales, que realizan clculos o llamadas externas en pleno proceso de planificacin.
Ejemplo 6. ; declaracin de funciones y llamadas a Python (: functions ; un predicado python (distance ?x1 ?y1 ?x2 ?y2) { import math return math.sqrt ( (?x2 - ?x1) * (?x2 -?x1) + (?y2 - ?y1) * (?y2 - ?y1)) } ; un predicado pddl (distance ?x ?y -location) - number )
<derived-def>: <derived-def>:
Las acciones y las tareas se estudiarn con mas detalle en las siguientes secciones. Los axiomas sirven para definir nuevos predicados a partir del uso de predicados ya existentes en una clusula ms compleja.
Ejemplo 7. ; declaracin de axiomas (:derived (ganga ?x producto) (and (bueno ?x) (bonito ?x) (barato ?x)) )
<tag>:
(*) Nota: <text> es una cadena de caracteres delimitada por comillas dobles ().
La principal diferencia la constituye la posibilidad de usar metatags, cuyo uso se explicar en las siguientes secciones.
11.1. Parmetros
Los parmetros son una lista de variables que el planificador instancia durante la fase de planificacin, y que son los argumentos utilizados dentro del cuerpo del operador.
11.2. Metatags
Los metatags son una extensin del lenguaje que actualmente est en fase experimental, por lo que puede cambiar en futuras versiones. El concepto subyacente a los metatags es poder incluir informacin extra en el dominio, que aunque no sea directamente utilizable por el planificador, pueda ser utilizada por otros mdulos, o en un anlisis posterior del plan resultante. Cuando el planificador termina puede incluir esta informacin extra en plan resultante. En concreto, si se supone que el planificador obtiene un plan como un documento XML, los metatags podran ser incluidos como tags XML, que podran ser parseados y analizados con posterioridad.
Ejemplo 8. ; Ejemplo de accin durativa (temporizada) con ; metatags (:durative-action move :parameters (?obj - object ?loc -location) :meta( (:tag prettyprint "?start ?end > mover ?obj desde ?lx hasta ?loc. Llegada a las ?end (?duration min)") (:tag cost "low") ) :duration (= ?duration 22) :condition((and (location ?obj ?lx) (not (same ?lx ?loc)) )) :effect((and (not (location ?obj ?lx)) (location ?obj ?loc) )) )
Existe un metatag que tiene un carcter especial que se llama prettyprint. Prettyprint es una cadena de texto parseable, pensada para presentar las acciones resultantes del proceso de planificacin, de una forma ms legible al usuario final.
prettyprint, o en general cualquier metatag, debe permitir incluir dentro de la cadena de texto variables, que son sustituidas por el valor al que estas variables son ligadas. Las variables deben incluir al menos los parmetros de la accin, aunque un planificador en concreto. puede incluir variables extras a costa de la prdida de la generalidad del dominio. Cuando un planificador encuentra una variable que es capaz de interpretar, por defecto no debe hacer la sustitucin. Cuando termina el proceso de planificacin y las acciones resultantes son presentadas al usuario (ya sea a travs de la salida estndar o a travs de un fichero XML o de texto), el planificador debe usar el formato especificado en prettyprint. Otra alternativa tambin permitida es que en lugar de usar los identificadores de las variables para hacer la sustitucin, se utilice el nmero de argumento dentro de la lista de argumentos, precedido por el carcter $ ($1, $2, ...), al igual que en el resultado del matching de una expresin regular en Perl.
11.3. Precondiciones
Las precondiciones son una lista opcional de objetivos que deben ser satisfechos en el estado del mundo justo antes de la ejecucin de la accin. La descripcin de objetivos es bastante expresiva, ya que se permiten expresiones en lgica de primer orden. Sino se especifican precondiciones se supone que la accin puede ejecutarse en cualquier estado del universo. La sintaxis BNF para una condicin es la siguiente:
<goal-def>: () | | | | | (:print <text>) | (:print <term>*) | <sgoal-def> | <timed-goal> <sgoal-def>: (and <goal-def>*) | | | | | | <fluent-comp> | <atomic-formula(term)> <variable-ord>: <fluent-comp>: <binary-comp>: <variable> :asc | <variable> :desc (<binary-comp> <fluent-exp> <fluent-exp> ) > | | | | | < = >= <= != (or <goal-def>*) (not <goal-def>) (imply <goal-def> <goal-def>) (exists (<typed-variable>* ) <goal-def>) (forall (<typed-variable>* ) <goal-def>) (! <goal-def>) (:sortby <variable-ord>+ <goal-def>) (:bind <variable> <fluent-exp>) (:print <sgoal-def>)
Se han aadido algunos predicados ms no incluidos en PDDL estndar como son los siguientes:
bind: Permite asignar a una variable sin instanciar el contenido de un predicado numrico o un fluent. print: Es un predicado que siempre es cierto y permite imprimir un texto libre, el contenido de una variable, o el resultado de analizar la unificacin de una condicin. Este predicado es
til a la hora de imprimir mensajes por pantalla durante el proceso de planificacin y facilitar as la tarea de depuracin.
Cuando se produce una unificacin el planificador puede escoger cualquiera de las posibles sustituciones de variables por valores constantes. A veces es interesante que el diseador de dominios tenga el control sobre el orden en el que se quieren ir probando las unificaciones. ste es precisamente el objetivo del predicado sortby.
Ejemplo 9. ; Un ejemplo de uso de precondiciones con sortby y bind (:action recoger_pasajero :parameters (?p person ?y - point) :precondition (and (esperando_taxi ?p) (sortby ?d :asc (and (libre ?t -taxi) (posicion ?t ?x - point) (bind ?d (calcula_distancia ?x ?y)) )) ) :effect (and (not (esperando_taxi ?p)) (not (libre ?t))) )
Los objetivos en HTN-PDDL, no se describen en base a una condicin que es necesario hacer cierta en el estado final, como ocurre en PDDL, sino como una red de tareas a descomponer. Por eso se tratarn ms adelante, cuando se presenten las redes de tareas.
11.4. Efectos
Los efectos son una descripcin completa de los cambios que la accin produce en el estado actual del universo. Los efectos pueden ser cuantificados universalmente y tambin se permiten efectos condicionales (dependientes del estado actual del universo), pero no todas las sentencias de la lgica de primer orden estn permitidos (por ejemplo funciones de Skolem o expresiones disyuntivas). Es importante destacar que, en este sentido, el lenguaje es asimtrico, es decir, las precondiciones de las acciones son considerablemente ms expresivas que sus efectos.
<effect>: () | (and <c-effect>*) | <c-effect> <c-effect>: (forall (<typed-variable>+) <effect>) | (when <goal-def> <cond-effect> ) | <p-effect> | <timed-effect> (<assign-op> <atomic-formula(term)> <fluent-exp>) | (not <af-effect>) | <af-effect> <atomic-formula(term)> | (:maintain <atomic-formula(term)>) <cond-effect>: <assign-op>: (and <p-effect>*) | <p-effect> assign | scale-up | scale-down | increase | decrease <fluent-exp>: (<binary-op> <fluent-exp> <fluent-exp>) | (<unary-op> <fluent-exp>) | <atomic-formula(term)> | <term>
<p-effect>:
<af-effect>:
unary_op:
binary_op:
A la hora de que el planificador evale un efecto se supone que todas las variables deben estar ligadas, bien por qu lleguen desde un parmetro, se hayan ligado al hacer una unificacin en las precondiciones, o bien por que estn cuantificadas. Tambin se asume que como en STRIPS el valor de verdad de un predicado es persistente a lo largo del tiempo. En STRIPS por eso se define una lista de supresin para hacer falsos los predicados (retirarlos del estado, ya que cualquier predicado que no se encuentre en el estado se supone falso). En HTN-PDDL sin embargo no existe explcitamente una lista de supresin, en lugar de ello cuando se quiere hacer falso un predicado, simplemente se niega.
Ejemplo 10. ; hacer falso el valor de un predicado (:action drop_item :parameters (?arm robotic_arm ?obj - item) :precondition (holding ?arm ?obj) :effect ((not (holding ?arm ?obj)) ))
Cmo es lgico ningn efecto de un operador primitivo puede alterar el valor de verdad de un predicado si no es mencionado explcitamente. Es decir si el efecto de un operador no cambia el valor de el predicado P el predicado P debe mantenerse inalterado tras la ejecucin del operador.
Ejemplo 11. ; Algunos ejemplos autoexplicativos de efectos ; condicionales y cuantificadores universales. (:action unload_cargo :parameters (?t truck ?l - location) :precondition (at ?t ?l) :effect (forall ?x obj (when (in ?obj ?t) (and (not (in ?obj ?t)) (in ?obj ?l)) ) ))
Observar que los objetivos en un efecto condicional tienen la misma sintaxis que en las precondiciones pero su funcin es distinta. Si un objetivo no se puede cumplir en las precondiciones el operador no puede ejecutarse, sin embargo si un objetivo no se cumple en un efecto condicional, la accin si puede ejecutarse, pero el efecto condicional no producir cambios en el estado actual. La clausula para proteger un predicado maintain pertenece a HTN-PDDL y no est soportada en el PDDL estndar. Esta clusula sirve para evitar que otros operadores primitivos puedan alterar el predicado protegido. Si una accin trata de modificar el valor de verdad de un predicado mantenido, la aplicacin de la accin fallar y el planificador har backtracking. Para eliminar la proteccin simplemente hay que negarla.
Ejemplo 12. ; Ejemplo de clusula maintain (:action proteger :parameters (?x) :precondition () :effect (:maintain (maintained ?x)))
(:action desproteger :parameters (?x) :precondition () :effect (not (:maintain (maintained ?x))))
Los fluents de HTN-PDDL son iguales a los de PDDL salvo la adicin de algunos operadores.
Ejemplo 13. ; Un ejemplo con fluents (:action revender :parameters (?x -producto) :precondition (> (en_stock ?x) 0) :effect (assign (pvp ?x) (* (precio_compra ?x) 2)) )
<task-def>:
<inline-def>: <atomic-formula(x)>:
Una red de tareas en HTN-PDDL, tiene un nombre unos parmetros y una lista de mtodos de descomposicin asociados. Cada mtodo lleva asociado un nombre una precondicin que debe hacerse cierta para su ejecucin y una red de tareas para expandir. Las redes de tareas en HTNPDDL son de tres tipos:
Secuenciales: Este tipo de red de tareas se representa colocando las tareas hijas a expandir entre parntesis. Obliga a que las tareas y sus descendientes mantengan el orden. Paralelas o independientes: Se representan colocndolas entre corchetes. El planificador podr escoger cualquier orden entre las tareas y entre sus subtareas, pero se considerar que si una tarea de la red falla, la red de tareas enteras es fallida. Permutables o combinatorias: Se representan entre ngulos. El planificador deber comprobar todos los rdenes entre las tareas incluyendo sus subtareas.
Esta sintaxis a la hora de definir redes de tareas hace que el cdigo HTN-PDDL sea sencillo y fcilmente legible:
Ejemplo 14. ; Definicin de una tarea abstracta (:task moverse :parameters (?quien ?destino) (! (:method en-destino :precondition (= (posicion ?quien) ?destino) :tasks () ) (:method andando :precondition (and (bound ?donde (posicion ?quien)) (<= (distancia ?donde ?destino) (limite_andando ?quien))) :tasks (ir_caminando ?quien ?destino) ) (:method en_taxi :precondition () :tasks (ir_en_taxi ?quien ?destino) ) ) ) (:task ir_en_taxi :parameters (?quien ?destino) (:method ir_en_taxi :precondition (= ?origen (posicion ?quien)) :tasks ( (esperar_taxi_en ?quien ?origen) (coger_taxi_a ?quien ?destino)) ) )
Las :inline: Estas acciones si sus precondiciones fallan, fallarn como una accin normal y producirn backtracking. Las :!inline: Estas acciones no producen fallo, ni provocan backtracking aunque sus precondiciones sean falsas. Si la precondicin es cierta la accin inline aplicar los efectos, en otro caso no har nada.
Las acciones inline no deben incluirse en el plan resultante puesto que no tienen la semntica de una accin primitiva real. Los literales con los que operen las acciones inline no deben alterar el estado del mundo, puesto que estas acciones no estn diseadas para finalmente ejecutarse. Solamente podrn alterar los literales internos al proceso de planificacin que tienen informacin de control.
Ejemplo 15. ; Uso de acciones inline ;; ;; ;; ;; Esta tarea evita hacer mltiples llamadas a la funcin calcula_distancia insertando en el estado un literal con la distancia cacheada. Acelera la planificacin en dominios donde este clculo es muy habitual
(:task Cachear_Distancias :parameters (?punto) (:method unico :precondition () :tasks ( (:inline () (forall (?x - Posicionable) (when (and (disponible ?x) (posicion ?x ?pos) (assign ?d (calcula_distancia ?punto ?pos) ) (assign (distancia_cacheada ?x ?punto) ?d) ))) ) )
El corte (!) es otro de los conceptos introducidos para mejorar la eficiencia del proceso de planificacin. Este concepto est tomado del lenguaje PROLOG [PROLOG] donde se utiliza para olvidar las unificaciones previas si se vuelve por backtracking. Obviamente el uso del corte afecta a la completitud del proceso de refutacin, por lo que debe de ser utilizado con cuidado. En HTN-PDDL es posible usar el corte para parar el backtracking en dos lugares distintos:
En la definicin de precondiciones: Su uso es exactamente el mismo que el corte de PROLOG. Se toma de la lista de posibles unificaciones una de forma no determinista y se descarta el resto. Si se vuelve por backtracking no se vuelven a considerar el resto de las unificaciones. En dominios con muchas unificaciones usado con cuidado puede utilizarse para acelerar mucho el procesamiento y reducir el backtracking, sin que por ello se vea afectada la completitud. En la lista de mtodos de una tarea abstracta. Sirve para que una vez que se han probado como ciertas las precondiciones de un mtodo se descarte probar con el resto de mtodos. Nuevamente usado con cuidado este corte tampoco tiene por que afectar a la completitud del algoritmo. El escritor de dominios puede conocer que los mtodos son mutuamente excluyentes y que una vez que se prueba con uno, el resto ya son invlidos.
:precondition (and (end_ciudad ?p ?c) (hotel ?c ?h) (camas_libres ?h) (not (residencia ?p ?c ?l) ) :tasks ( (Ira ?p ?h) (Reservar_habitacion ?p ?h) (Ducharse ?p) (Ponerse_Pijama ?p) (Dormir ?p) ) )
En este ejemplo es muy claro que ambos mtodos son excluyentes. La exclusin sin embargo podra no ser tan obvia y ocurrir a niveles ms bajos en la jerarqua. El proceso de unificacin con los hoteles disponibles en la ciudad puede ser costoso (sobre todo si hay muchos) por lo que si ya sabemos que vamos a dormir en casa, no hace falta que el planificador pruebe todas las posibles unificaciones con todos los hoteles de la ciudad. Otra forma alternativa de construir la precondicin del mtodo en-hotel podra ser la siguiente:
Ejemplo 16. ; Uso de los cortes ... (:method en-hotel :precondition (!(and (end_ciudad ?p ?c) (hotel ?c ?h) (camas_libres ?h) (not (residencia ?p ?c ?l) )) ...
Esta precondicin al tener un corte en las precondiciones nicamente probar con el primer hotel que encuentre libre en la ciudad. Si se vuelve por backtracking la precondicin fallar. Obviamente se pueden perder soluciones vlidas, pero la decisin es responsabilidad del escritor de dominios.
durativos) o 4 (soporte de efectos continuos de las acciones en el tiempo). La expresividad de HTNPDDL llega hasta el nivel 3, es decir hasta el soporte de acciones y literales con tiempo, por lo que los efectos numricos de las acciones son tratados de una forma discreta. HTN-PDDL sin embargo tiene una expresividad ms rica en el uso del tiempo que PDDL 2.2 nivel 3, aunque las acciones primitivas durativas tienen prcticamente la misma sintaxis: Las acciones durativas se definen en HTN-PDDL de la siguiente forma:
<durative-action-def>: (:durative-action <name> :parameters (<typed-variable>*) [<meta-tags>] :duration (= ?duration <fluent-exp>) [:condition <timed-goal>] [:effect <timed-effect>]) <timed-goal>: <time-specifier>: (<time-specifier> <sgoal-def>) | <goal-def> <time-point> | over all | between <time-point> and <time-point> <time-point>: at start | at end | <f-time-point> <f-time-point>: <timed-effect>: at <fluent-exp> (<time-point> <p-effect>)
La estructura de la accin durativa es muy similar a la de una accin sin tiempo, con la salvedad de que la durativa tiene asociada una duracin codificada como un valor numrico fijo, o calculada a travs de una expresin fluent (de esta forma se puede hacer el valor de la duracin dependiente del estado). En cualquier caso es requisito indispensable que el valor numrico resultante sea mayor o igual a 0 (las acciones con duracin negativa no tienen sentido).
Ejemplo 17. ; Poner la duracin a una accin ; como se ve los efectos no son continuos (:action correr :parameters (?fromx ?fromy ?tox ?toy) :duration (= ?duration (* 15000 (distance ?fromx ?fromy ?tox ?toy))) :precondition (in ?fromx ?fromy) :effect (and (at start (not (in ?fromx ?fromy))) (at end (in ?tox ?toy)) ))
HTN-PDDL permite usar la clusula between para manejar el concepto de timeline que se discutir ms adelante.
Literales que se hacen vlidos en un instante de tiempo determinado hasta que el efecto de un operador primitivo lo niegue. Se declaran utilizando la clusula de PDDL at: (at instante_temporal (literal_temporizado)).
Literales que son ciertos durante un intervalo de tiempo determinado. Se declaran utilizando la clusula de HTN-PDDL between: (between instante_temporal_1 and instante_temporal_2 (literal_temporizado)). Literales que son ciertos de forma peridica. Se declaran utilizando la clusula de HTNPDDL between: (between instante_temporal_1 and instante_temporal_2 and every unidades_de_tiempo (literal_temporizado)).
Hay que hacer una serie de consideraciones sobre el ejemplo mostrado. Primero se observa como en HTN-PDDL es posible mezclar referencias a un instante temporal relativas al instante de tiempo con referencias absolutas expresadas como cadenas fecha/hora. De esta forma se facilita la escritura de dominios temporales y la legibilidad de los mismos, pero tambin nos obligan a introducir una serie de parmetros en el planificador para que este sea capaz de interpretarlos. Estos parmetros son introducidos en la seccin de personalizacin (customization) (ver la seccin dedicada al bloque de personalizacin ms adelante) del fichero del problema y marcan la unidad temporal que usaremos (en los literales del ejemplo minutos), el formato de fecha/hora, y el instante temporal que se toma como inicio.
Ejemplo: ;; Ejemplo de seccin de personalizacin, para los literales mostrados en ;; el ejemplo anterior (:customization (= :time-format "%H:%M:%S %d/%m/%Y") (= :time-horizon-relative 1000) (= :time-start " 00:00:00 12/05/2007") (= :time-unit :minutes) )
<dur-constraint>:
Cada accin de la red de tareas puede hacer referencia a sus timepoints usando las variables
especiales ?start y ?end. Tambin puede hacer referencia a su duracin mediante la variable ?dur a la hora de definir restricciones. Los siguientes ejemplos muestran la definicin de algunas restricciones en un ejemplo sencillo:
Ejemplo 19: ;; Tres tareas abstractas con relaciones de herencia ;; La tarea A (MA) no impone ms restricciones que las de ordenacin (:task A :parameters () (:method MA :precondition () :tasks ((A1)(A2)) )) ;; La tarea B (MB1) pone restricciones en el inicio y el fin de la ;; subtarea A2 (:task B :parameters () (:method MB1 :precondition () :tasks ((A1) ((and (>= ?start 3)(<= ?end 5)) (A2))) )) ;; Definicin de la tarea A2 utilizada por las tareas ;; abstractas anteriores (:task A2 :parameters () (:method A2 :precondition () :tasks ((a21)(a22)) ))
Observar cmo en el mtodo MB1 de la tarea del ejemplo B, se impone la restriccin de que la tarea A2 se tiene que ejecutar en el intervalo de tiempo [3,5]. Existe un mecanismo de herencia de restricciones temporales que hace que las tareas hijas en una red de tareas hereden las restricciones de sus tareas abstractas padre. De esta forma, en nuestro ejemplo si las tareas a21 y a22 durasen entre las dos (se tienen que ejecutar en secuencia) ms de dos unidades temporales, se producira una violacin temporal que provocara un backtracking en el planificador. Las variables ?start y ?end de una tarea tambin se pueden utilizar para definir sincronizaciones complejas entre tareas o lmites mximos o mnimos en la distancia temporal entre dos tareas. Estas variables son referencias al inicio y al fin de la tarea en el modelo temporal subyacente Estas referencias (o landmarks) forman parte de la estructura de tipos bsica gestionada en HTNPDDL. De este modo se permite que formen parte de los argumentos de un literal y por lo tanto pueden ser insertadas en el estado de planificacin para ser posteriormente ser consultadas ms adelante en el proceso de planificacin y servir para definir restricciones en otra red de tareas. Por comodidad los landmarks suelen ser definidos en la descripcin de dominios como fluents que pueden ser utilizados directamente en los operadores de comparacin al describir una restriccin. El siguiente ejemplo muestra la insercin en el estado del planificador de los landmarks:
Ejemplo 20: ;; insercin de los landmarks de una tarea abstracta y de un operador primitivo en el estado (:task A2 :parameters () (:method MA2 :precondition () :tasks ((:inline () (and (assign (start A2) ?start) (assign (end A2) ?end))) (a21) (a22)) )) (:durative-action b :parameters() :duration (= ?duration 1)
Observar cmo se hace uso de las acciones inline para introducir los landmarks de la tarea abstracta A2. Recordemos que las acciones inline se usan en HTN-PDDL para introducir conocimiento de control en el estado del planificador, como es la informacin temporal, y que estas acciones no deben ser contempladas en el plan final. Al operador primitivo b en cambio no le queda ms remedio que insertar la informacin temporal como efectos. Esta informacin temporal puede ser utilizada para definir restricciones en la red de tareas de un mtodo distinto, como se aprecia en el siguiente ejemplo:
Ejemplo 21: ;; Uso de un landmark guardado con anterioridad para hacer una ;; sincronizacin. (:task A3 :parameters () (:method MA3 :precondition () :tasks (((= ?start (start A2)) (b))) ))
En el ejemplo la tarea A3 en su mtodo MA3 utiliza el landmark guardado en el ejemplo 20 del inicio de la tarea A2, para sincronizar el inicio de la accin b con dicha tarea.
Cada problema tiene un nombre para identificarlo y va asociado a un dominio tambin con un nombre determinado. Es un error sintctico introducir en el planificador un problema y un dominio donde los nombres de dominio no coincidan.
La diferencia principal con respecto a PDDL es la posibilidad de declarar literales que se hacen ciertos de forma peridica, o en ciertos instantes de tiempo, como ya se mostr en la subseccin dedicada al timeline:
Ejemplo 23. ; Declaracin de literales (:init ;; un literal normal (fabricante A320 Airbus_SAS) ;; un literal fluent (= (velocidad_maxima airbus_320) 0.82) ;; un literal temporizado que se hace cierto ;; en un instante determinado (at 28/03/1988 12:00:00 (disponible A320)) ;; declaracin de un evento periodico (between 01/01/2007 00:00:00 and 01/01/2007 11:59:59 and every 12 (es-maniana)) ;; si, antes del uno de enero del 2007 no haba maanas ;). ;; observar que estamos usando como unidad de tiempo las horas, ;; esto se fija en la seccin de personalizacin (customization) .... )
<time-unit>:
En la versin 1.1 todos los parmetros tienen que ver con informacin temporal, pero esta previsto que esta seccin incluya muchos otros parmetros en la siguiente versin. El significado de cada uno de los parmetros es el siguiente:
El parmetro time-unit define la unidad de tiempo a utilizar cuando es necesario utilizar referencias temporales relativas. Las referencias temporales relativas se codifican mediante un valor numrico. Por ejemplo si (= :time-unit hours), cuando se utilice un 3 en una expresin temporal, significar 3 horas. El parmetro time-format define el formato que se usar para las referencias temporales absolutas. Por comodidad y legibilidad del dominio se permite definir fechas y horas utilizando cadenas de texto. time-format define el formato de estas cadenas utilizando el mismo formato que el usado por la funcin del estndar ANSI de C strftime, que es el ms extendido. El parmetro time-start se usa marcar el punto de tiempo inicial, que las acciones tomarn como referencia a la hora de anclarse. Ninguna accin debera comenzar antes del time-start. El parmetro time-horizon define el horizonte temporal hasta el que el planificador permitir que las acciones se deslicen. Este parmetro adems es utilizado para cortar la generacin de intervalos de tiempo para literales intervalares. En principio estos literales podran generar infinitos intervalos, como cada intervalo supone un punto de anclaje, el planificador podra caer en un bucle infinito hacia adelante y hacia atrs cuando vuelva por backtracking. El parmetro time-horizon-relative: es equivalente al time-horizon pero en lugar de tomar una referencia de tiempo absoluta, la toma relativa al inicio.
(:customization (= :time-format "%d/%m/%Y %H:%M:%S") (= :time-horizon-relative 1000) (= :time-start "27/1/2007 8:10:0") (= :time-unit :minutes) )
El lenguaje permite que la seccin de personalizacin aparezca tanto en el fichero de dominio como en el de problema, aunque lo ms recomendable es que los parmetros time-start y time-horizon aparezcan en el fichero de problema. De otra forma en cierta medida se pierde la independencia del fichero de dominio del problema.
17. Requisitos
La seccin de requisitos (requirements) define un conjunto de flags con caractersticas que el planificador debe soportar para hacer frente al dominio o al problema. Como no todos los planificadores son capaces de soportar la expresividad de HTN-PDDL, esto permite al diseador de dominio imponer requisitos al planificador y al planificador descartar de una forma rpida a los problemas que no es capaz de abordar. HTN-PDDL aade algunos requisitos ms a los ya existentes en PDDL 2.2:
<require-def>: <require-key>: (:requirements <require-key>*) :strips | :typing | :negative-preconditions | :disjuntive-preconditions | :equality | :existential-preconditions | :universal-preconditions | :quantified-preconditions | :conditional-effects | :fluents | :adl | :durative-actions | :derived-predicates | :timed-initial-literals | :metatags | :htn-expansion
Por defecto todo planificador tiene que soportar el modelo de STRIPS, por lo tanto este requirement siempre se supone aunque no se establezca explcitamente. La descripcin de las caractersticas que cada requirement imponen al planificador es la siguiente:
strips: Modelo de acciones similar al de STRIPS. typing: Soporte para tipar los objetos del dominio respetando una jerarqua de tipos. netative-preconditions: Permite usar negaciones en las precondiciones. disjuntive-preconditios: Permite usar el operador or en las precondiciones. equality: Permite utilizar el predicado de igualdad = para la comparacin de constantes. existential-preconditions: Uso de precondiciones cuantificadas existencialmente. universal-preconditions: Uso de precondiciones cuantificadas universalmente. quantified-preconditions: Es azcar sintctica ya que es equivalente a declarar en un dominio el soporte para precondiciones existenciales y universales. conditional-efects: Permite el uso del operador when para definir efectos condicionales. fluents: Permite el uso de la aritmtica con nmeros enteros y reales, as como la utilizacin
de operadores matemticos en las precondiciones. Permite asignar nmeros a predicados y hacer operaciones con ellos en los efectos.
adl: Incluye todas las capacidades expresivas del lenguaje ADL (Action Description Language) [adl] . Es equivalente a declarar en un dominio que el planificador debe soportar los requisitos de Strips, typing, negative-preconditions, disjuntive-preconditions, equality, quantified-preconditions, y conditional-effects. durative-actions: Permite el uso de acciones durativas en el dominio. Cuando se impone este requisito implcitamente tambin se hace el de fluents. derived-predicates: Permite la definicin de axiomas en el dominio. timed-initial-literals: Permite el uso de predicados temporizados. Destacar que la filosofa y el tratamiento de este tipo de predicados es distinto en HTN-PDDL que en el PDDL 2.2 nivel 3 estndar. metatags: Permite incluir tags en diferentes partes del dominio con informacin extra no imprescindible para el planificador, pero necesaria en procesamientos posteriores del plan por otras herramientas. htn-expansion: Requiere el manejo de redes jerrquicas y tareas abstractas.