| Teorías de Agencia
Todos los
formalismos considerados hasta ahora se han enfocado
simplemente en un aspecto de la agencia. Sin embargo, es
de esperar que una teoría realista de agente sea una
estructura lógica que combine los
diversos componentes. Además, esperamos que una lógica
de agente sea capaz de representar los aspectos dinámicos de la
agencia. Una teoría completa de agente, expresada en una
lógica con estas propiedades, debe definir cómo se
relacionan los atributos de agencia. Por ejemplo,
necesitará mostrar cómo se relacionan información de un
agente y pro-actitudes; cómo cambia el estado cognitivo
de un agente en el tiempo; cómo afecta el entorno al
estado cognitivo de un agente; y cómo la información de
un agente y las pro-actitudes le guían al ejecutar
acciones. El problema más significativo de los teoristas
de agente es dar buena cuenta de todas esas
relaciones.
Una teoría
de agente que abarque todos los aspectos llevará todavía
algún tiempo, aunque ya se han conseguido pasos
importantes. En las secciones siguientes, revisaremos
brevemente algunos trabajos en ese
sentido.
Moore:
conocimiento y acción
Moore fue,
en muchos aspectos, pionero en el uso de lógicas para
capturar aspectos de agencia (Moore, 1990). Su interés
principal era el estudio de las precondiciones de
conocimiento para ejecutar acciones. La cuestión es
qué necesita saber un agente para que sea capaz de
ejecutar una acción. Formalizó un modelo de habilidad en una
lógica con modalidad para el conocimiento, y cierta
lógica dinámica como mecanismo para modelar la acción
(Harel, 1984). Este formalismo permite la posibilidad de
que un agente tenga información incompleta acerca de
cómo lograr cierta meta, y que ejecute acciones a fin de
averiguar como lograrla. Críticas de este formalismo (e
intentos de mejorarlo) se pueden encontrar en
Morgenstern, 1987 y Lespérance, 1989.
Cohen y
Levesque: intención
Una de las
contribuciones mejor conocida y más influyente en el
área de la teoría de agente es la de Cohen y Levesque en
1990. Su formalismo se utilizó originalmente para
desarrollar una teoría de intención (“yo pretendo...”),
que los autores precisaron como pre-requisito para una
teoría de actos de discurso. Sin embargo,
posteriormente, la lógica se comprobó tan útil para
razonar acerca de agentes, que se utilizó para el
análisis de conflictos y la cooperación en el diálogo
entre multi-agentes (Galliers, 1988), así como en varios
estudios teóricos para intentar resolver el problema de
la cooperación (Levesque, 1990; Jennings, 1992;
Castelfranchi, 1990; Castelfranchi, 1992). Estudiaremos
su uso en el desarrollo de una teoría de
intención.
Basándose en
Bratman, (Bratman, 1987; Bratman, 1990), Cohen y
Levesque identifican siete propiedades que debería
satisfacer una teoría razonable de
intención:
1. Las
intenciones presentan problemas para los agentes, que
necesitarán determinar la manera de
superarlos.
2. Las
intenciones proveen un filtro para adoptar otras
intenciones, que no deben ser
conflictivas.
3. Los
agentes siguen la pista del éxito de sus intenciones, y
son proclives a intentarlo de nuevo si fallan en sus
intentos.
4. Los
agentes creen que sus intenciones son
posibles.
5. Los
agentes no creen que ellos no llevarán a cabo sus
intenciones.
6. Bajo
ciertas circunstancias, los agentes creerán que llevarán
a cabo sus intenciones.
7. Los
agentes no pretenderán todos los efectos laterales
esperados de sus
intenciones.
Dados estos
criterios, Cohen y Levesque adoptan un enfoque
doblemente enlazado al problema de formalizar la
intención. Primero, construyen una lógica de la agencia
racional, “teniendo cuidado de ordenar fuera a las
relaciones entre los operadores modales básicos” (Cohen
y Levesque, 1990). Sobre esta estructura, introducen un
número de constructores derivado, que constituye una
“teoría parcial de acción racional”; la intención será
uno de esos constructores.
El
constructor derivado más importante es la meta persistente.
Un agente tiene una meta persistente de j
si:
1. Tiene una
meta que j eventualmente hace
cierta, y cree que j no es cierta
actualmente.
2. Antes de
abandonar la meta j, debe cumplir
una de las condiciones siguientes: (i) el agente cree
que j ha sido satisfecha; o
(ii) el agente cree que j no será satisfecha nunca
.
Un pequeño
paso de las metas persistentes hacia una primera
definición de intención, como “intento de actuar” sería:
un agente intenta hacer una acción a si tiene una meta
persistente que ha producido acerca de un estado en
donde creyó que iba a hacer a, y entonces hizo
a.
Rao y
Georgeff: creencia, deseo, arquitecturas de
intención
Como hemos
podido observar, no hay un consenso claro en las
comunidades de Inteligencia Artificial sobre qué
combinaciones de información y pro-actitudes son las
mejores para caracterizar a los agentes racionales. En
el trabajo de Cohen y Levesque, ya descrito, se utilizan
simplemente dos actitudes básicas: creencias y metas.
Actitudes adicionales, tales como intención, se
definieron en términos de éstas. Rao y Georgeff han
desarrollado una estructura lógica para la teoría de
agente con base en tres modalidades de primitiva:
creencias, deseos, e intenciones (1991, 1993). Su
formalismo se basa en un modelo de bifurcación de
tiempo, (Emerson y Halpern, 1986), en el que los mundos
accesibles creencia, deseo e intención sean en sí mismos
estructuras ramificadas de
tiempo.
Se preocupan
particularmente de la noción de realismo. La
pregunta es cómo influyen en los deseos e intenciones de
un agente sus creencias sobre el futuro. En otro
trabajo, consideran también el potencial de agregar
planes (sociales) a su formalismo (Rao y Georgeff, 1992;
Kinny, 1992).
Singh
Un enfoque
bastante diferente para modelar agentes es el de Singh,
que ha desarrollado una familia interesante de lógicas
para representar intenciones, creencias, conocimiento,
pericia, y comunicación en estructuras de tiempo
ramificadas (Singh, 1990; Singh, 1991; Singh y Asher,
1991). El formalismo de Singhs es sumamente rico, y se
han dedicado considerables esfuerzos para establecer sus
propiedades. Sin embargo, su complejidad impide una
discusión detallada aquí.
Werner
Werner ha
sentado las bases de un modelo general de agencia, a
partir de trabajos de economía, la teoría de juego, la
teoría de autómatas, la semántica de situación, y la
filosofía (Werner, 1988, 1989, 1990, 1991). Sin embargo,
las propiedades de este modelo aún no se han investigado
a fondo .
Wooldridge:
modelado de sistemas
multi-agente
Wooldridge
desarrolló en 1992 una familia de lógicas para
representar las propiedades de sistemas multi-agente. A
diferencia de los enfoques vistos anteriormente, la
aspiración de Wooldridge no era para desarrollar una
estructura general para la teoría de agente. Más bien,
esperaba construir formalismos que pudieran utilizarse
en la especificación y comprobación de sistemas
multi-agente realistas. Para este fin, desarrolló un
modelo simple (y en cierto sentido general) de sistemas
multi-agente, y mostró cómo los historiales trazados en
la ejecución de dicho sistema podían utilizarse como
base semántica para una familia de lógicas de creencia
lineales y de tiempo ramificado. Dio, además, ejemplos
de cómo pueden utilizarse estas lógicas en la
especificación y comprobación de protocolos para la
acción cooperativa.
Comunicación
Los
formalismos para representar comunicación en la teoría
de agente tienden a basarse en la teoría de los actos
de discurso,
originaria de Austin (1962), y desarrollada
adicionalmente por Searle (1969) y otros (Cohen y
Perrault, 1979; Cohen y Levesque, 1990). El axioma
principal de la teoría del acto de discurso es que las
expresiones comunicativas son las acciones, en el
sentido de acciones físicas. Se llevan a cabo por un
orador con la intención de ocasionar un cambio deseado
en el mundo: típicamente, el orador intenta ocasionar
algún estado mental particular en un receptor. Los actos
de discurso pueden fallar del mismo modo en que lo
pueden hacer las acciones físicas: un receptor
generalmente tiene control sobre su estado mental, y no
podemos garantizar que reaccione en la manera que desea
el emisor. Muchos trabajos en la teoría de discurso se
han dedicado a clasificar los diferentes tipos de actos
de discurso. Quizás las dos categorías más ampliamente
reconocidas de actos de discurso son representantes
(informar es un ejemplo típico), y directivas
(demandar es un ejemplo
típico).
Aunque no
directamente relacionado con los actos de discurso,
mencionaremos
aquí un trabajo sobre lenguajes de
comunicación de agente (Genesereth y Ketchpel,
1994). Este trabajo se ha dedicado en su mayor parte a
desarrollar dos lenguajes conexos: el lenguaje de
manipulación y petición de conocimiento (KQML) y el
formato de intercambio de conocimiento (KIF). KQML
provee al diseñador de agentes de una sintaxis estándar
para los mensajes, y un número de representaciones
que definen la fuerza de un
mensaje. Ejemplos de representaciones son decir, realizar y replicar; la inspiración
de estos tipos de mensaje viene en su mayor parte de la
teoría del acto de discurso. KIF provee una sintaxis
para el contenido del
mensaje, será esencialmente un predicado de cálculo de
primer orden, remodelado en una sintaxis parecida a la
de LISP.
Discusión
Los
formalismos para razonar sobre agentes han seguido un
largo camino desde el primer trabajo sobre lógicas de
conocimiento y creencia debido a Hintikka en 1962.
Dentro de la Inteligencia Artificial, quizás el énfasis
principal de los trabajos subsiguientes ha sido intentar
desarrollar formalismos que capten la relación entre los
diversos elementos que comprenden a un estado cognitivo
de agente; ejemplo típico de este trabajo es la teoría
de la intención desarrollada por Cohen y Levesque
(1990). A pesar de que se han realizado progresos,
todavía siguen pendientes muchas cuestiones y problemas
fundamentales.
A nivel
técnico, podemos identificar un número de puntos que
quedan abiertos. Primero, los problemas asociados con la
semántica de mundos posibles (sobre todo el de la
omnisciencia lógica) no pueden considerarse resueltos.
La semántica de los mundos posibles sigue siendo la
elección para muchos investigadores, pero éstos no
representan, en general, un modelo realista de agentes
con recursos delimitados. Una solución está en tomar
como fundamento la semántica de mundos posibles, dando
una interpretación precisa desde el punto de vista del
mundo. Este fue el enfoque escogido por Rosenschein y
Kaelblings para su paradigma del autómata situado, y
puede ser bastante bueno. Sin embargo, no queda claro
cómo encajar pro-actitudes tales como deseos o
intenciones (algunos intentos son los de Singh,
Wooldridge y Werner). Queda mucho trabajo por hacer en
formalismos para el conocimiento y creencia,
particularmente en el tema de modelado de recursos de
razonamiento delimitados.
Con respecto
a las lógicas que combinan diferentes actitudes, quizás
los problemas pendientes más importantes son los
relacionados con la intención. En particular, la
relación entre intención y acción no se ha representado
formalmente de manera satisfactoria. El problema es que
el tener una intención de actuar hace más probable que
un agente vaya a actuar, pero no lo garantiza. Aunque es
bastante directo construir sistemas que parecen tener
intenciones, (Wooldridge, 1995), es mucho más difícil
capturar esta
relación formalmente. Otros problemas que aún no
se han tratado son los de la gestión múltiple,
intenciones posiblemente conflictivas, y la formación,
planificación, y reconsideración de
intenciones.
También es
tema de debate la combinación de actitudes exacta que se
requiere para caracterizar a un agente. Como ya hemos
visto, un enfoque actualmente popular es utilizar una
combinación de creencias, deseos, e intenciones
(arquitecturas BDI (Rao y Georgeff, 1991)). Sin embargo,
existen alternativas: Shoham, por ejemplo, sugiere como
más fundamental la noción de elección (Shoham, 1990). Se
han hecho pocos trabajos que comparen formalmente la
conveniencia de estas combinaciones. Quizás el
requerimiento obvio a corto plazo sea experimentar con
las especificaciones de agentes reales, a fin de
comprender mejor las ventajas de los distintos
formalismos.
En general,
los tipos de lógicas utilizados en la teoría de agente
tienden a ser más elaborados, conteniendo muchas
modalidades que interactúan entre sí de manera sutil.
Muy pocos trabajos se han hecho aún sobre la teoría
subyacente a tales lógicas (quizás la única excepción
notable sea la de Catach). Hasta que las limitaciones y
principios generales de tales lógicas multi-modales
lleguen a entenderse, el progreso utilizando tales
lógicas será lento. Un área de trabajo probable para un
futuro próximo será obtener un teorema que pruebe las
técnicas de las lógicas
multi-modales.
Finalmente,
existe cierta confusión sobre el papel que efectúa una
teoría de agencia. Nuestro punto de vista es que tales
teorías representan especificaciones
para agentes. La ventaja de tratar teorías de agente
como especificaciones, y lógicas de agente como
lenguajes de especificación, es que los problemas y
cuestiones que surjan nos serán familiares con respecto
a la ingeniería del software: ¿Cuán útil o expresivo es
el lenguaje de especificación? ¿Cómo son de concisas las
especificaciones de agente? ¿Cómo refinamos o
transformamos una especificación en una implementación?
Sin embargo, la forma de ver las especificaciones como
teorías de agente no es compartida por todos los
investigadores. Algunos intentan utilizar sus teorías de
agente como formalismos de representación de
conocimiento, encontrándose con el difícil problema de
encontrar algoritmos para razonar con dichas teorías.
Otros intentan que su trabajo formalice un concepto de
interés en la filosofía o en la ciencia cognitiva (esto
es lo que Hintikka pretendía en su trabajo sobre lógicas
de conocimiento de
creencia).
Lecturas
Adicionales
Una
discusión reciente sobre el papel de la lógica y la
agencia es la de Israel (1993). Para una discusión
detallada de la intencionalidad y la postura
intencional, ver Dennett, (1978, 1987). Cierto número de
trabajos sobre el tratamiento de la agencia en
Inteligencia Artificial pueden encontrarse en Allen
(1990). Para una introducción a la lógica modal, ver
Chellas (1980); una ligeramente más antigua, aunque más
amplia, puede encontrarse en Hughes y Cresswell (1968).
En lo que concierne al uso de lógicas modales para
modelar conocimiento y creencia, ver Halpern y Moses
(1992), que incluyen resultados de complejidad y
procedimientos de demostración. Un trabajo relacionado
con el modelado de conocimiento es el realizado por la
comunidad de sistemas distribuidos, que una
interpretación precisa a los mundos en la semántica de
mundos posibles; para una introducción y referencias
adicionales, ver Halpern (1987) y Fagin (1992).
Descripciones de formalismos para el modelado de
conocimiento y creencia pueden encontrarse en Halpern
(1986), Konolige (1986), Reichgelt (1989) y Wooldridge
(1992). Una variante sobre la estructura de mundos
posibles, llamada el método de modelado
recursivo,
se describe en Gmytrasiewicz y Durfee (1993); una
profunda teoría de creencia puede encontrarse en Mack
(1994). La semántica de
situación, desarrollada recientemente en los 80 y
renovado tema de interés, representó fundamentalmente un
nuevo enfoque para modelar el mundo y los sistemas
cognitivos (Barwise y Perry, 1983; Devlin, 1991). Sin
embargo, la semántica de situación no es aún un tema
predominante en la Inteligencia Artificial, y no se
conoce cuál será su impacto
final.
Las lógicas
que integran tiempo con estados mentales se discuten en
Kraus y Lehmann (1988), Halpern y Vardi (1989),
Wooldridge y Fisher (1994); éstos últimos presentan un
método de prueba basado en tablas para una lógica de
creencia temporal. Otra referencia importante para
aspectos temporales es Shoham (1988, 1989). Thomas ha
desarrollado algunas lógicas para representar teorías de
agente como parte de su estructura para lenguajes de
programación de agente; véase Thomas (1991, 1993). Para
una introducción a las lógicas temporales y temas
relacionados, podemos ver Goldblatt (1987) y
Emerson(1990). Una discusión no formal de la intención
puede encontrarse en Bratman (1987), o más breve en
Bratman (1990). Trabajos adicionales relacionados con el
modelado de la intención pueden encontrarse en Grosz y
Sidner (1990), Sadek (1992), Goldman y Lang (1991),
Konolige y Pollack (1993), Bell (1995) y Dongha (1995).
Trabajos relacionados que se centran más en los aspectos
sociales que en las actitudes de un agente simple son
los de Levesque (1990), Jennings (1993), Wooldridge
(1994) y Wooldridge y Jennings
(1994).
Finalmente,
aunque no hayamos discutido formalismos para razonar
sobre la acción, sugerimos anteriormente que una lógica
de agente necesitaría incorporar algún mecanismo para
representar acciones de agentes. La razón para evitar el
tema es simplemente que es demasiado amplio, y merece
una revisión completa. Para introducirnos en el
tratamiento de la acción podemos leer a Allen (1984,
1990, 1991). Otros tratamientos de la acción en las
lógicas de agente se basan en la lógica dinámica
(originalmente desarrollada para razonar sobre programas
de ordenador) (Harel, 1984). La lógica de ver para lo que
ha sido debatida en la literatura formal de
filosofía, pero aún puede incidir bastante en la
Inteligencia Artificial (Belnap y Perloff, 1988;
Perloff, 1991; Belnap, 1991; Segerberg,
1989). |