Docsity
Docsity

Prepare-se para as provas
Prepare-se para as provas

Estude fácil! Tem muito documento disponível na Docsity


Ganhe pontos para baixar
Ganhe pontos para baixar

Ganhe pontos ajudando outros esrudantes ou compre um plano Premium


Guias e Dicas
Guias e Dicas


IA busca online, Notas de aula de Informática

Aula de IA.

Tipologia: Notas de aula

Antes de 2010

Compartilhado em 01/12/2009

ygor-dos-santos-luz-3
ygor-dos-santos-luz-3 🇧🇷

4.7

(3)

55 documentos

1 / 6

Toggle sidebar

Esta página não é visível na pré-visualização

Não perca as partes importantes!

bg1
Busca local em espaços contínuos
Vamos supor que queremos instalar 3 novos aerportos em qualquer lugar
de um mapa, de tal forma que a soma dos quadrados das distâncias de
cada cidade no mapa seja minimizada.
Espaço de estados pode ser definido pelas coordenadas dos
aeroportos: (x1,y1), (x2,y2), (x3,y3) .
Espaço hexadecimal definido por 6 variáveis
Movimentação nesse espaço corresponde a mover um ou mais
aeroportos no mapa. Isso é claramente um problema contínuo.
Uma maneira de evitar problemas contínuos é tornar discreta a
vizinhança de cada estado. Por exemplo, podemos mover apenas
um aeroporto de cada vez na direção x ou y por um valor fixo ±a
Com 6 variáveis, isso nos dá 12 sucessores para cada estado.
Podemos então aplica qualquer dos algoritmos de busca local.
Busca Offine x Busca Online
Busca Offline (ou planejamento clássico)
Computa a solução (do estado inicial até o objetivo) para depois
iniciar a seqüência de ações
A partir de então as percepções são ignoradas
Domínios Determinísticos e Estáticos
Exemplo jogo dos n-números
Busca Online
Intercala planejamento e ação.
Executa uma ação, observa o ambiente e calcula a próxima
ação.
Domínios Estocásticos e Dinâmicos
Exemplo: Ratinho tentando achar o caminho por um labirinto,
dirigir sem mapa,...
pf3
pf4
pf5

Pré-visualização parcial do texto

Baixe IA busca online e outras Notas de aula em PDF para Informática, somente na Docsity!

Busca local em espaços contínuos

 Vamos supor que queremos instalar 3 novos aerportos em qualquer lugar de um mapa, de tal forma que a soma dos quadrados das distâncias de cada cidade no mapa seja minimizada.

  • Espaço de estados pode ser definido pelas coordenadas dos aeroportos: (x1,y1), (x2,y2), (x3,y3).
  • Espaço hexadecimal definido por 6 variáveis
  • Movimentação nesse espaço corresponde a mover um ou mais aeroportos no mapa. Isso é claramente um problema contínuo.
  • Uma maneira de evitar problemas contínuos é tornar discreta a vizinhança de cada estado. Por exemplo, podemos mover apenas um aeroporto de cada vez na direção x ou y por um valor fixo ±a  Com 6 variáveis, isso nos dá 12 sucessores para cada estado. Podemos então aplica qualquer dos algoritmos de busca local.

Busca Offine x Busca Online  Busca Offline (ou planejamento clássico)

  • Computa a solução (do estado inicial até o objetivo) para depois iniciar a seqüência de ações
  • A partir de então as percepções são ignoradas
  • Domínios Determinísticos e Estáticos  Exemplo jogo dos n-números

 Busca Online

  • Intercala planejamento e ação.  Executa uma ação, observa o ambiente e calcula a próxima ação.
  • Domínios Estocásticos e Dinâmicos  Exemplo: Ratinho tentando achar o caminho por um labirinto, dirigir sem mapa,...

Busca online  Problemas exploratórios

  • Espaço de estados desconhecido  Ex. O agente não sabe que ir Para Cima leva de (1,1) para (1,2) até ter feito isto (S = start (Início) e G = goal (Objetivo))  Ele também não sabe que após chegar em (1,2), que ir Para Baixo levará de volta a (1,1)

Agente de busca online

 O que o agente sabe: Funções

  • Ações(s) - ações possíveis para um dado estado s
  • Testa-objetivo(s)
  • Custo(s,a,s’), onde a é uma ação  Observações
  • O agente não tem acesso prévio ao estado sucessor s’ de s, nem ao valor do custo de ir de s para s’  Em ambos os casos precisa agir antes...
  • Vai memorizando/atualizando o espaço de busca (mapa)
  • Só pode expandir nós onde ele fisicamente se encontra (ex. rota de cidade A para B)  Adequado para busca em profundidade!  Assumi-se que
  • as ações são determinísticas
  • o agente pode reconhecer estados já visitados (memorizar)
  • existe uma função heurística admissível h(s) que avalia a distância desde o estado corrente até um estado objetivo.  Ex.: para o labirinto o agente pode conhecer a posição do objetivo e usar a heurística da distância Manhattan

 Exemplo

  • Ordem das visitas: S1, S2, S3, S4, S5, S6...
  • Inexplorado(S3) depois de a = {Cima,Esquerda,Direita}  Pois a única ação executada em S3 foi BAIXO quando ele foi para S
  • Sem_retrocesso de S3 = {S2, S6}  Estados que geraram S

função AGENTE-BP-ON-LINE(s’) retorna uma ação entradas : s’ , uma percepção que identifica o estado atual variáveis estáticas : resultado[s,a] , tabela (mapa) indexada por ação e estado, ação+s => s’, inicialmente vazia inexplorado , para cada nó, lista das ações ainda não executadas sem_retrocesso , tabela que lista para cada nó visitado, os retrocessos ainda não tentados s, a, estado e ação anteriores, inicialmente null Se TESTAR-OBJETIVO( s’ ) então retornar parar se s’ é um estado novo então inexplorado[s’]  AÇÕES(s´) Se s é não nulo então faça

resultado[a,s]  s’

adiciona s ao início de sem_retrocesso[s’] Se inexplorado[s’] está vazio então se sem_retrocesso[s’] está vazio então retornar parar

senão a  uma ação b tal que resultado[b,s’] =

DESEMPILHA(sem_retrocesso[s’] )

senão a  DESEMPILHA(inexplorado[s’] )

s  s’

returnar a

Subida de encosta

 Subida de encosta

  • Mesmo princípio da localidade
  • Já é um algoritmo online (pois só mantém um nó na memória)
  • Não muito útil em sua forma mais simples(preso em máximo local)
  • Reinício aleatório impossível (agente não tem como se transportar para um novo estado).  Alternativa: percurso aleatório (para explorar o ambiente)
  • Escolhe ações aleatoriamente preferindo as não usadas  Se tempo suficientemente grande, acha solução
  • Pode custar bem caro...

Aprendendo em Busca Online

 LRTA* (Learning Real-Time A) ou ATRA

  • Dar mais “memória” para o subida de encosta
  • Armazenar a melhor estimativa atual H(s) do custo para se atingir o objetivo a partir do nó sendo visitado
  • H(s) começa igual à heurística h(s) e é atualizada na medida em que o agente conhece o espaço de estados
  • Agente vai para nó vizinho mais promissor e atualiza nó anterior  H(s) = c(s,a,s’) + H(s’) Custo estimado de s ao objetivo passando por s’ é o custo para ir de s a s’ mais H(s’)  “Aplaina” ótimos locais (tenta escapar)
  • O(n2) para n estados no pior caso