Este documento presenta los objetivos y contenidos de una unidad sobre agentes inteligentes. Los objetivos incluyen identificar los componentes de un sistema de agentes, conocer métricas para evaluar el rendimiento de agentes inteligentes, y reconocer las propiedades del entorno de un agente. Los contenidos cubren temas como agentes, sensores y actuadores; medidas de rendimiento; racionalidad; entornos de trabajo; y clasificación de agentes.
1. INTELIGENCIA ARTIFICIAL - ICIF0021
Unidad 5 - Agentes Inteligentes
Docente: Milton A. Ram´ Klapp
ırez
miramire@gmail.com
Universidad San Sebasti´n
a
Facultad de Ingenier´ y Tecnolog´
ıa ıa
Primer Semestre de 2011
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 1 / 71
2. Objetivos de la Unidad
Identifican los componentes que conforman un sistema de agentes.
Conocen m´tricas para evaluar el rendimiento de un agente
e
inteligente.
Identifican la caracterizaci´n del entorno de trabajo de un agente en
o
base al an´lisis REAS (Rendimiento, Entorno, Actuadores, Sensores).
a
Reconocen las propiedades del entorno de un agente en funci´n de la
o
interacci´n que ´ste tiene con su medio.
o e
Clasifican el entorno de un agente seg´n sus propiedades.
u
Conocen las componentes de un sistema de agentes.
Reconocen la clasificaci´n que tienen los agentes dependiendo de las
o
caracter´
ısticas propias de su programa.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 2 / 71
3. Contenidos
1 Agentes, entorno, sensores y actuadores.
2 Medidas de rendimiento de agentes.
3 Racionalidad.
4 Entornos de trabajo de agentes.
5 Estructura de un agente.
6 Clasificaci´n de agentes.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 3 / 71
4. Agentes y su entorno
Introducci´n
o Agente percepción
sensores A
M
Agente es cualquier B
cosa capaz de percibir I
su medio ambiente , ? E
N
utilizando sensores T
acciones E
. . . as´ como tambi´n
ı e actuadores
actuar en ese medio
usando actuadores.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 4 / 71
5. Agentes y su entorno
El ser humano como agente
Sensores Actuadores
ojos, o´
ıdos piernas, brazos
lengua, piel boca, dedos
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 5 / 71
6. Agentes y su entorno
Un robot como agente
Sensores Actuadores
pulsaciones de mensajes en el
teclas, archivos monitor, escritura
con informaci´n
o de archivos de
paquetes de datos datos
que recibe por red. env´ de paquetes
ıo
de datos v´ red.
ıa
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 6 / 71
7. Agentes y su entorno
Hip´tesis general sobre agentes
o
Cada agente puede percibir sus propias acciones.
Pero no siempre los efectos de las mismas.
Percepci´n
o
Percibir es recibir entradas en cualquier momento.
Una secuencia de percepciones corresponde al hist´rico de lo que el
o
agente ha recibido:
a veces, los agentes toman decisiones seg´n lo percibido en una
u
secuencia
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 7 / 71
8. Agentes y su entorno
En t´rminos matem´ticos un agente es una funci´n que proyecta
e a o
percepciones en acciones.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 8 / 71
9. Agentes y su entorno
La funci´n de comportamiento se puede representar como una
o
tabla:
que por lo general es muy grande
a veces puede ser infinita a menos que se limite el tama˜o de la
n
secuencia de percepciones.
Esta tabla es una caracterizaci´n externa:
o
el programa del agente es su caracterizaci´n interna.
o
Hay que diferenciar la funci´n del agente del programa del agente.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 9 / 71
10. Agentes y su entorno
El mundo de la aspiradora como agente
Tenemos una aspiradora que puede estar en dos ubicaciones posibles:
A o B.
Supondremos que es capaz de percibir en qu´ posici´n est´ y si su
e o a
ubicaci´n actual tiene o no suciedad.
o
Sus acciones permitidas son:
moverse a la izquierda (Izquierda), derecha (Derecha)
limpiar (Limpiar)
hacer nada (HacerNada).
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 10 / 71
11. Agentes y su entorno
Ejemplo de tabulaci´n parcial para estudiar el comportamiento del agente aspiradora
o
Observaciones Tabulaci´n parcial
o
Es una tabla que Percepci´n
o Acci´n
o
contrasta la secuencia [A, Limpia] Derecha
de percepciones con [A, Sucia] Limpiar
la acci´n que debiera
o [B, Limpia] Izquierda
emprender. [B, Sucia] Limpiar
La secuencia es lo que [A, Limpia], [A, Limpia] Derecha
se conoce. [A, Limpia], [A, Sucia] Limpiar
.
. .
.
La acci´n es lo que
o . .
hay que determinar. [A, Limpia], [A, Limpia], [A, Sucia] Limpiar
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 11 / 71
12. Agentes y su entorno
Un ejemplo m´s sofisticado: la aspiradora Roomba
a
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 12 / 71
13. Concepto de Racionalidad
Agente racional
Un agente racional es aquel que siempre hace lo correcto.
Cada elemento de la tabla de comportamiento debe rellenarse
correctamente.
¿Qu´ significa hacer lo correcto?
e
Como primera aproximaci´n, aquello que le permita al agente obtener
o
un resultado mejor:
por lo tanto, se debe medir el ´xito.
e
De esta manera, los sensores, actuadores y medida de ´xito nos
e
permiten definir qu´ es racionalidad.
e
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 13 / 71
14. Medidas de Rendimiento
Un agente genera una secuencia de acciones
en el medio en que se inserta y de acuerdo a las percepciones que recibe
entonces, el habitat tiene una secuencia de estados
si secuencia es la deseada, el agente habr´ actuado correctamente.
a
La medida del ´xito puede ser
e
subjetiva
objetiva
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 14 / 71
15. Medidas de Rendimiento
¿C´mo se puede medir el ´xito en el ejemplo de la aspiradora?
o e
Propuesta 1: por la cantidad de suciedad que se ha limpiado en un
intervalo de tiempo determinado (¿10 horas?):
¿y si el agente limpia, luego vuelve a tirar la basura y vuelve a limpiar
(repetidamente)?
Propuesta 2: mantener el suelo limpio.
Observaci´n
o
Es mejor crear medidas de utilidad de acuerdo al entorno, m´s que de
a
acuerdo al c´mo lo hace el agente.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 15 / 71
16. Racionalidad
Factores que determinan la racionalidad de un agente en un momento
determinado
1 La medida de rendimiento que define el criterio de ´xito del
e
comportamiento.
2 El conocimiento acumulado por el agente sobre el medio en el que
habita.
3 Las acciones que el agente puede realizar.
4 La secuencia de percepciones del agente que hasta un momento
determinado ha captado.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 16 / 71
17. Racionalidad
Definici´n de agente racional
o
En cada secuencia de percepciones, un agente racional deber´ emprender
a
aquella acci´n que supuestamente maximice su medida de rendimiento,
o
bas´ndose en las evidencias aportadas por la secuencia de percepciones y
a
en el conocimiento que el agente mantiene.
Con respecto a la aspiradora
¿Se puede considerar al agente aspiradora como un agente racional?
¿Qu´ es aquello que se debiera determinar?
e
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 17 / 71
18. Racionalidad
Agente aspiradora
Medida de rendimiento: premia con un punto por cada recuadro
limpio en un periodo de tiempo.
Geograf´ del medio: el medio se conoce de antemano (recordar la
ıa
figura del ejemplo anterior)
podemos suponer que la distribuci´n de la suciedad y la posici´n inicial
o o
del agente no se conocen
Acciones posibles: Izquierda, Derecha, Limpiar y HacerNada.
Se puede suponer tambi´n que percibe correctamente la localizaci´n y
e o
si hay suciedad en la celda actual.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 18 / 71
19. Racionalidad
Recopilaci´n de informaci´n
o o
Proceso relacionado con ejecutar acciones que intenten modificar
percepciones futuras.
Es una parte importante de lo que involucra el concepto de
racionalidad.
Exploraci´n
o
Es un ejemplo de recopilaci´n de informaci´n.
o o
El agente aspiradora debe realizar una exploraci´n inicial debido a
o
que no conoce el ambiente.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 19 / 71
20. Racionalidad
Aprendizaje
No s´lo se deber´ recopilar informaci´n:
o ıa o
sino tambi´n ser capaz de aprender de ella.
e
Cuando se conoce el entorno de antemano, no se necesita aprender. . .
s´lo actuar correctamente
o
pero aquellos son simplemente agentes fr´giles.
a
Autonom´ de agentes
ıa
Se dice que un agente no es aut´nomo
o
cuando se apoya m´s en el conocimiento inicial que en sus propias
a
percepciones
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 20 / 71
22. ¿Qu´ vimos la clase pasada?
e
Introducci´n a los sistemas de agentes.
o
Racionalidad.
Medida del rendimiento de un agente.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 22 / 71
23. Hoy veremos
Entornos de trabajo de un agente.
Propiedades de los entornos de trabajo.
Estructuras de agentes.
Tipos de agente seg´n el programa del agente.
u
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 23 / 71
24. La naturaleza del entorno
Los agentes racionales son soluciones a entornos de trabajo
(problemas).
¿C´mo se define el entorno de trabajo?
o
En el agente aspiradora definimos lo que era la medida de
Rendimiento, Entorno, Actuadores y Sensores (REAS).
Mediante el estudio del REAS se pueden comprender de manera m´s a
cabal las distintas aristas que intervienen en la formulaci´n del
o
problema que tiene que resolver el agente.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 24 / 71
25. La naturaleza del entorno
REAS para el taxista autom´tico
a
Tipo de Medida de
Ambiente Actuadores Sensores
Agente Rendimiento
c´maras, espe-
a
rutas, tr´nsito,
a acelerador, jos,
peatones, palanca de veloc´ımetro,
conductor seguro, r´pido,
a
pasajeros, cambio, freno, GPS,
autom´tico de
a viaje confor-
condiciones luces de tac´metro,
o
taxi. table.
meteo- se˜alizaci´n,
n o niveles de los
rol´gicas.
o bocina. par´metros del
a
motor.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 25 / 71
26. La naturaleza del entorno
REAS para un sistema de diagn´stico m´dico
o e
Tipo de Medida de
Ambiente Actuadores Sensores
Agente Rendimiento
teclado para
pacientes
la entrada de
sanos y re- pacientes, set de pre-
sistema de s´
ıntomas, sis-
ducir costos y hospital, taba- guntas, diag-
diagn´stico
o tema fon´tico
e
demandas por jadores del n´stico,
o
m´dico.
e para interpre-
negligencias hospital tratamiento.
tar lo que dice
m´dicas.
e
el paciente.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 26 / 71
27. Propiedades de entornos
Existen muchos tipos de entornos de trabajo donde se utiliza la IA.
Propiedades de los entornos de trabajo donde se aplica la IA
1 Observaci´n del ambiente.
o
2 Determinaci´n del siguiente estado.
o
3 Consideraci´n de la experiencia del agente.
o
4 Cambio del entorno.
5 Manejo de percepciones.
6 Agentes participantes.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 27 / 71
28. Propiedades de entornos
Observaci´n del ambiente
o
Ambientes totalmente observables
Los sensores del agente permiten acceso al estado completo del
ambiente.
Se detectan todos los aspectos medibles para la toma de decisiones
del agente.
En t´rminos de rendimiento, es lo m´s recomendable y conveniente.
e a
Ambientes parcialmente observables
Los sensores no son capaces de captar todo el ambiente:
es lo m´s habitual
a
debido a que los sensores pueden ser poco exactos.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 28 / 71
29. Propiedades de entornos
Determinaci´n del siguiente estado
o
En entornos deterministas
El siguiente estado se determina totalmente desde el estado actual
y la acci´n ejecutada del agente.
o
El agente no tiene que lidiar con la incertidumbre.
Si el medio fuera parcialmente observable, puede parecer estoc´stico.
a
En entornos estoc´sticos
a
El siguiente estado no siempre se puede determinar siempre desde el
estado actual y la acci´n del agente.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 29 / 71
30. Propiedades de entornos
Consideraci´n de la experiencia del agente
o
Entorno epis´dico
o
La experiencia del agente se divide en episodios at´micos:
o
cada episodio es una percepci´n con su acci´n asociada.
o o
El siguiente episodio no depende de las acciones de los episodios
previos.
Entorno secuencial
Las decisiones y acciones presentes pueden afectar a las decisiones y
acciones futuras.
Ejemplo cl´sico: agente que juega Ajedrez.
a
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 30 / 71
31. Propiedades de entornos
Cambio de entorno
Entorno est´tico
a
El ambiente no puede cambiar mientras el agente est´ deliberando.
a
Son f´ciles de tratar puesto que no es necesario estar pendiente de los
a
cambios que se puedan estar sucediendo.
Tampoco interesa analizar el paso del tiempo.
Entorno din´mico
a
El ambiente puede cambiar mientras se delibera.
El agente no siempre conoce el estado del mundo sin volver a sentirlo
nuevamente.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 31 / 71
32. Propiedades de entornos
Manejo de percepciones
Entorno discreto
Sus estados son distinguibles de forma finita.
Se refiere a la forma en que el agente interpreta las percepciones,
genera acciones y maneja el tiempo.
Por ejemplo: agente que juega ajedrez.
Entorno continuo
Es lo contrario a un entorno discreto.
Por ejemplo, el caso del taxista autom´tico:
a
Variables continuas a considerar: velocidad, coordenadas geogr´ficas
a
del taxi, ´ngulo de viraje, etc.
a
Las c´maras que pueda tener se consideran como continuas, pese a su
a
naturaleza discreta.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 32 / 71
33. Propiedades de entornos
Agentes participantes
Agente individual
Interviene un agente.
Por ejemplo: un agente que resuelve crucigramas.
Mutiagentes
Intervienen dos o m´s agentes, que no tienen por qu´ ser s´lo robots
a e o
o software.
Por ejemplo: agentes que juegan ajedrez, videojuegos de estrategia,
de guerra, de aventuras.
Cuando los agentes intentan minimizar el rendimiento entre s´ ı,
estamos hablando de un medio competitivo:
en caso contrario, el medio es cooperativo como en el caso de la
RoboCup Search and Rescue (Urban Search and Rescue).
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 33 / 71
34. Estructuras de Agente
Hasta ahora hemos hablado de la conducta de los agentes
inteligentes. . .
que es la acci´n dada una secuencia de percepciones.
o
La IA debe dise˜ar lo que se conoce como el programa del agente.
n
Los programas de agente se ejecutan en computadores con sensores
y actuadores, que es el hardware del agente.
Esto se llama Arquitectura
Entonces: Agente = Arquitectura + Programa.
El programa debe ser el adecuado para la arquitectura.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 34 / 71
35. Programas de Agente
La mayor´ sigue la misma estructura:
ıa
reciben percepciones desde sensores
env´ acciones a los actuadores
ıan
Programa y Funci´n del Agente
o
El programa recibe la percepci´n actual.
o
La funci´n recibe todo el hist´rico de percepciones (tabla).
o o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 35 / 71
36. Programas de Agente
¿Cu´l es el problema con la tabla de agente?
a
Est´ condenada al fracaso.
a
Veamos el caso del taxi automatizado:
si cada imagen de c´mara entrega una tasa de 27 MB , suponiendo
a s
una resoluci´n de 640 × 480, con 24 bits de color y 30 fps.
o
Se estima que por cada hora de conducci´n tendr´
o ıamos una tabla con
la no despreciable cantidad de 10250.000.000.000 entradas.
En el caso del peque˜o y ordenado mundo del Ajedrez:
n
ıamos 10150 entradas.
Al menos tendr´
S´lo como referencia
o
Se calcula que el n´mero de ´tomos observables en el universo es del
u a
orden de 1080 .
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 36 / 71
37. Programas de Agente
La idea de la IA es crear programas de agentes racionales usando una
peque˜a cantidad de c´digo, sin tener que recurrir a grandes tablas.
n o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 37 / 71
38. Programas de Agente
Otras ´reas han logrado un objetivo similar
a
Antiguamente hab´ grandes tablas con ra´ cuadradas para
ıan ıces
ingenieros y matem´ticos:
a
hoy las calculadoras utilizan un programa que no excede las cinco
l´
ıneas.
De la misma manera para el c´lculo de funciones
a
logar´
ıtmico-exponenciales, circulares, etc.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 38 / 71
39. Programas de Agente
Tipos de programa de agente.
1 Agentes reactivos simples.
2 Agentes reactivos basados en modelos.
3 Agentes basados en objetivos.
4 Agentes basados en utilidad.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 39 / 71
40. Tipos de Programa de Agente
Agentes Reactivos Simples
Es el tipo de agente m´s sencillo.
a
Seleccionan la acci´n s´lo sobre las percepciones actuales del agente,
o o
ignorando las percepciones hist´ricas.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 40 / 71
41. Tipos de Programa de Agente
Agentes Reactivos Simples
Las reacciones son conexiones mentales que siguen una regla
sencilla:
si <percepci´n> entonces <acci´n>
o o
por ejemplo: si el auto que va adelante enciende la luz de freno,
entonces disminuyo mi velocidad.
Estas reglas se llaman reglas de condici´n-acci´n (CA).
o o
Agente percepción
sensores A
M
B
I
reglas E
CA N
T
acciones E
actuadores
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 41 / 71
42. Tipos de Programa de Agente
Agentes Reactivos Simples
Ejemplo: Programa de Agente Reflejo Simple Aspiradora
Entrada: (ubicaci´n, estado), ubicaci´n ∈ {A, B},estado ∈ {limpio, sucio}
o o
Salida: acci´n ∈ {Izquierda, Derecha, Limpiar}
o
1: si (estado = limpio) y (ubicaci´n = A) entonces
o
2: retornar Derecha
3: fin si
4: si (estado = limpio) y (ubicaci´n = B) entonces
o
5: retornar Izquierda
6: fin si
7: si (estado = sucio) y (ubicaci´n = A) entonces
o
8: retornar Limpiar
9: fin si
10: si (estado = sucio) y (ubicaci´n = B) entonces
o
11: retornar Limpiar
12: fin si
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 42 / 71
43. Tipos de Programa de Agente
Agentes Reactivos Simples
Estos agentes son simples pero tienen una inteligencia limitada.
Por lo general requieren que el mundo sea totalmente observable:
si acaso lo que se desea es tomar la decisi´n correcta.
o
Otro problema es que pueden caer en bucles infinitos, dependiendo de
su arquitectura:
pueden tomar decisiones de modo aleatorio
por ejemplo: aspiradora sin sensor de ubicaci´n.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 43 / 71
44. Tipos de Programa de Agente
Agentes basados en Modelos
El problema a resolver es la visibilidad del mundo.
La soluci´n para la visibilidad parcial: almacenar aquellas partes del
o
mundo que no se ven. . .
se requiere de un estado interno
que dependa de la historia de las percepciones
por ejemplo: al conducir, saber d´nde est´n los otros veh´
o a ıculos.
Se necesita informaci´n sobre el c´mo evoluciona el mundo,
o o
independiente del agente: saber por ejemplo que los autos se
acercan cuando se encienden las luces de freno traseras.
El c´mo es lo que se conoce como modelo.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 44 / 71
45. Tipos de Programa de Agente
Agentes basados en Modelos
Estructura del agente basado en modelos
Agente
estado sensores
percepción
A
cómo evoluciona
elmundo
cómo es el mundo M
ahora B
qué hacen mis
acciones
I
E
N
qué acción
reglas CA emprender ahora T
acciones E
actuadores
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 45 / 71
46. Tipos de Programa de Agente
Agentes basados en Objetivos
No siempre es suficiente el conocimiento sobre el estado actual del
mundo.
Por ejemplo: el taxista autom´tico al verse enfrentado a un cruce de
a
calles. . .
puede decidir girar a la izquierda, derecha o bien continuar su marcha
hacia adelante
dependiendo hacia d´nde quiere ir, y NO de las percepciones del
o
mundo.
Se requiere, por lo tanto, informaci´n sobre un objetivo o meta
o
para el agente.
Para esto, se puede emplear el resultado que generen las acciones, de
un modo similar a c´mo opera el agente basado en modelos.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 46 / 71
47. Tipos de Programa de Agente
Agentes basados en Objetivos
Estructura de un agente reactivo basado en objetivos
Agente
sensores
A
percepción
M
estado
cómo es el mundo
ahora B
cómo evoluciona
elmundo
I
qué hacen mis ¿cómo será si emprendo
acciones la acción A? E
N
qué acción debiera
metas emprender ahora
T
acciones
actuadores
E
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 47 / 71
48. Tipos de Programa de Agente
Agentes basados en Objetivos
Se recomienda su uso en. . .
B´squeda.
u
Planificaci´n.
o
Porque encuentran secuencias de acciones para alcanzar objetivos
concretos:
de acuerdo a lo que agente perciba.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 48 / 71
49. Tipos de Programa de Agente
Agentes basados en Utilidad
Las metas por s´ solas no son suficientes:
ı
para generar comportamiento de gran calidad
Por ejemplo, hay muchas maneras de que el taxi autom´tico llegue a
a
su destino:
no est´ en discusi´n que el taxista cumple con su objetivo
a o
pero no todas resultan c´modas o baratas para el usuario.
o
Por lo tanto, las metas definen vagamente lo que es felicidad y
tristeza, con respecto al cumplimiento de objetivos.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 49 / 71
50. Tipos de Programa de Agente
Agentes basados en Utilidad
Ser´ mejor tener una medida concreta de felicidad que permita
ıa
comparar estados:
cient´
ıficamente conocida como utilidad
un estado puede tener m´s utilidad que otro.
a
Funci´n de Utilidad
o
Toma uno o m´s estado y los transforma a un n´mero real, que va a
a u
representar al nivel de felicidad del agente.
A veces hay estados conflictivos:
la utilidad representa un balance
por ejemplo: velocidad y seguridad al conducir
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 50 / 71
51. Tipos de Programa de Agente
Agentes basados en Utilidad
Agente
sensores
percepción A
estado
cómo es el mundo M
ahora
cómo evoluciona
elmundo B
¿ cómo será siemprendo
qué hacen mis la acción A? I
acciones
E
¿ qué tan feliz seré
utilidad en ese caso? N
T
qué acción debiera
emprender ahora
acciones E
actuadores
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 51 / 71
52. ¿Qu´ vimos la clase pasada?
e
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 52 / 71
53. Hoy veremos
Estructura de agentes.
Tipos de programas de agentes.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 53 / 71
54. Estructuras de Agente
Hasta ahora hemos hablado de la conducta de los agentes
inteligentes. . .
que es la acci´n dada una secuencia de percepciones.
o
La IA debe dise˜ar lo que se conoce como el programa del agente
n
Los programas de agente se ejecutan en computadores con sensores
y actuadores.
Esto se llama Arquitectura
Entonces: Agente = Arquitectura + Programa.
El programa debe ser el adecuado para la arquitectura.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 54 / 71
55. Programas de Agente I
La mayor´ sigue la misma estructura:
ıa
reciben percepciones desde sensores
env´ acciones a actuadores
ıan
Programa y Funci´n del Agente
o
El programa recibe la percepci´n actual:
o
porque no hay algo disponible en el entorno
por ende, es necesario recordar las percepciones.
La funci´n recibe todo el hist´rico de percepciones (tabla).
o o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 55 / 71
56. Programas de Agente II
¿Cu´l es el problema con la tabla de agente?
a
Est´ condenada al fracaso.
a
Veamos el caso del taxi automatizado:
si cada imagen de c´mara entrega una tasa de 27 MB , suponiendo una
a s
resoluci´n de 640 × 480, con 24 bits de color y 30 fps.
o
Se estima que por cada hora de conducci´n tendr´
o ıamos una tabla con
la no despreciable cantidad de 10250.000.000.000 entradas.
En el caso del peque˜o y ordenado mundo del Ajedrez:
n
ıamos 10150 entradas
Al menos tendr´
S´lo como referencia
o
Se calcula que el n´mero de ´tomos observables en el universo es del
u a
orden de 1080 .
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 56 / 71
57. Programas de Agente III
La idea de la IA es crear programas de agentes racionales usando una
peque˜a cantidad de c´digo, sin tener que recurrir a grandes tablas.
n o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 57 / 71
58. Programas de Agente IV
Otras ´reas han logrado un objetivo similar
a
Antiguamente hab´ grandes tablas con ra´ cuadradas para
ıan ıces
ingenieros y matem´ticos:
a
hoy las calculadoras utilizan un programa que no excede las cinco
l´
ıneas.
De la misma manera para el c´lculo de funciones
a
logar´
ıtmico-exponenciales, circulares, etc.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 58 / 71
59. Programas de Agente V
Tipos de programa de agente.
1 Agentes reactivos simples.
2 Agentes reactivos basados en modelos.
3 Agentes basados en objetivos.
4 Agentes basados en utilidad.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 59 / 71
60. Tipos de Programa de Agente I
Agentes Reactivos Simples
Es el tipo de agente m´s sencillo.
a
Seleccionan la acci´n s´lo sobre las percepciones actuales del agente,
o o
ignorando las percepciones hist´ricas.
o
Ejemplo: Funci´n de Agente Reflejo Simple Aspiradora
o
Entrada: [ubicaci´n, estado]
o
Salida: acci´n
o
1: si estado = Sucio entonces
2: retornar Limpiar
3: sino si ubicaci´n = A entonces
o
4: retornar Derecha
5: sino si ubicaci´n = B entonces
o
6: retornar Izquierda
7: fin si
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 60 / 71
61. Tipos de Programa de Agente II
Agentes Reactivos Simples
Las reacciones son conexiones mentales que siguen una regla
sencilla:
si <percepci´n> entonces <acci´n>
o o
por ejemplo: si el auto que va adelante enciende la luz de freno,
entonces frenar.
Estas reglas se llaman reglas de condici´n-acci´n (CA)
o o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 61 / 71
62. Tipos de Programa de Agente III
Agentes Reactivos Simples
Estos agentes son simples pero tienen una inteligencia limitada.
Por lo general requieren que el mundo sea totalmente observable:
si acaso lo que se desea es tomar la decisi´n correcta.
o
Otro problema es que pueden caer en bucles infinitos, dependiendo de
su arquitectura:
pueden tomar decisiones de modo aleatorio
por ejemplo: aspiradora sin sensor de ubicaci´n.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 62 / 71
63. Tipos de Programa de Agente I
Agentes basados en Modelos
El problema a resolver es la visibilidad del mundo.
La soluci´n para la visibilidad parcial: almacenar aquellas partes del
o
mundo que no se ven:
se requiere de un estado interno
que dependa de la historia de las percepciones
por ejemplo: al conducir, saber d´nde est´n los otros veh´
o a ıculos.
Se necesita informaci´n sobre el c´mo evoluciona el mundo,
o o
independiente del agente: saber por ejemplo que los autos se
acercan cuando frenan.
El c´mo es lo que se conoce como modelo.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 63 / 71
64. Tipos de Programa de Agente II
Agentes basados en Modelos
Agente
estado sensores
percepción
A
cómo evoluciona
elmundo
cómo es el mundo M
ahora B
qué hacen mis
acciones
I
E
N
qué acción
reglas CA emprender ahora T
acciones E
actuadores
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 64 / 71
65. Tipos de Programa de Agente I
Agentes basados en Objetivos
No siempre es suficiente el conocimiento sobre el estado actual del
mundo.
Por ejemplo: el taxista autom´tico al verse enfrentado a un cruce de
a
calles. . .
puede decidir girar a la izquierda, derecha o bien continuar su marcha
hacia adelante
dependiendo hacia d´nde quiere ir, y NO de las percepciones del
o
mundo.
Se requiere, por lo tanto, informaci´n sobre un objetivo o meta
o
para el agente.
Para esto, se puede emplear el resultado que generen las acciones, de
un modo similar a c´mo opera el agente basado en modelos.
o
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 65 / 71
66. Tipos de Programa de Agente II
Agentes basados en Objetivos
Estructura de un agente reactivo basado en objetivos
Agente
sensores
A
percepción
M
estado
cómo es el mundo
ahora B
cómo evoluciona
elmundo
I
qué hacen mis ¿cómo será si emprendo
acciones la acción A? E
N
qué acción debiera
metas emprender ahora
T
acciones
actuadores
E
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 66 / 71
67. Tipos de Programa de Agente III
Agentes basados en Objetivos
Se recomienda su uso en. . .
B´squeda.
u
Planificaci´n.
o
Porque encuentran secuencias de acciones para alcanzar objetivos
concretos:
de acuerdo a lo que agente perciba.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 67 / 71
68. Tipos de Programa de Agente I
Agentes basados en Utilidad
Las metas por s´ solas no son suficientes:
ı
para generar comportamiento de gran calidad
Por ejemplo, hay muchas maneras de que el taxi autom´tico llegue a
a
su destino:
no est´ en discusi´n que el taxista cumple con su objetivo
a o
pero no todas resultan c´modas o baratas para el usuario.
o
Por lo tanto, las metas definen vagamente lo que es felicidad y
tristeza, con respecto al cumplimiento de objetivos.
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 68 / 71
69. Tipos de Programa de Agente II
Agentes basados en Utilidad
Ser´ mejor tener una medida concreta de felicidad que permita
ıa
comparar estados:
cient´
ıficamente conocida como utilidad
un estado puede tener m´s utilidad que otro.
a
Funci´n de Utilidad
o
Toma uno o m´s estado y los transforma a un n´mero real, que va a
a u
representar al nivel de felicidad del agente.
A veces hay estados conflictivos:
la utilidad representa un balance
por ejemplo: velocidad y seguridad al conducir
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 69 / 71
70. Tipos de Programa de Agente III
Agentes basados en Utilidad
Estructura de un agente basado en utilidad
Agente
sensores
percepción A
estado
cómo es el mundo M
ahora
cómo evoluciona
elmundo B
¿ cómo será siemprendo
qué hacen mis la acción A? I
acciones
E
¿ qué tan feliz seré
utilidad en ese caso? N
T
qué acción debiera
emprender ahora
acciones E
actuadores
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 70 / 71
71. Fin de la Unidad 5
M. Ram´
ırez K. (USS) Apunte curso IA Primer Semestre 2011 71 / 71