1 / 23

Raciocínio Prático

Raciocínio Prático. Luiz A M Palazzo Abril de 2010. Agentes Inteligentes. Sensores. AGENTE. Racionalidade. AMBIENTE. Atuadores. Raciocínio Prático.

Download Presentation

Raciocínio Prático

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Raciocínio Prático Luiz A M Palazzo Abril de 2010

  2. Agentes Inteligentes Sensores AGENTE Racionalidade AMBIENTE Atuadores

  3. Raciocínio Prático • É o raciocínio orientado à ação (o processo de descobrir o que fazer) em contraponto ao raciocínio teórico, que é orientado às crenças do agente. • O raciocínio prático humano consiste em duas atividades: • Deliberação: decidir onde se quer chegar, e • Raciocínio Meios-Fim: decidir como chegar lá • O resultado da deliberação é a intenção • A intenção é muito mais forte do que meros desejos

  4. Planejamento • Agentes Planejadores • Planejamento é essencialmente programação automática • Raciocínio Meios-Fim: Dar ao agente: • Representação da meta/intenção a atingir, • Representação das ações que podem ser executadas, • Representação do ambiente... • ... e receber um plano para atingir a meta

  5. Exemplo: Mundo dos Blocos • Contém (a) um braço robô, (b) três blocos A, B e C e (c) um topo de mesa • Ontologia on(x,y), ontable(x), clear(x), holding(x) • Ex: clear(A). on(A,B). ontable(B). ontable(C). • Emprega-se a Hipótese do Mundo Fechado. • Um objetivo é representado por um conjunto de fórmulas: ontable(A) ^ ontable(B) ^ ontable(C) • As ações são representadas como no sistema STRIPS. • Cada ação possui: (a) um nome, (b) uma pré-condição, (c) uma del-list e (d) uma add-list. Cada um destes elementos pode possuir variáveis.

  6. Exemplo: stack(x,y) • A ação stack(x,y) pode ser assim definida: • Nome: stack(x,y) • Pré: clear(y) ^ holding(x) • Del: clear(y) ^ holding(x) • Add: armempty ^ on(x,y) • Exemplos: definirunstack(x,y), pickup(x), putdown(x)

  7. Loop de Controle do Agente • O que é um plano? Uma seqüência de ações com variáveis sendo substituídas por constantes. • Agent Control Loop 1. while true 2. observe the world; 3. update internal world model; 4. deliberate about what intention to achieve next; 5. use means-ends reasoning to get a plan for the intention; 6. execute the plan 7. end while

  8. Deliberação • Como um agente delibera? • Começa por tentar entender que opções tem disponíveis • Escolhe entre elas e se compromete com uma delas • As opções escolhidas são então intenções • A função de deliberação pode ser decomposta em dois componentes funcionais: • Geração de opções • Filtragem

  9. A(8) B(5) C(3) A(8) B(5) C(3) Passo 1 Raciocínio Meios - Fim Passo 2 8 4 4 • Simulação (1) Passo 3 Estado Inicial Estado Objetivo Passo 4 Passo 5 Passo 6 Passo 7

  10. Conferindo... • Teseu e o Minotauro: • http://www.logicmazes.com/theseus.html • VáriosDesafios • http://www.logicmazes.com

  11. As Torres de Hanói ESTADO INICIAL ESTADO OBJETIVO ? Clique aqui para jogar: http://www.mazeworks.com/hanoi/

  12. A solução é um caminho no ESPAÇO DE ESTADOS Busca em Espaços de Estados EstadoInicial Solução Espaço de Estados Estado Final

  13. Estratégias de Busca • Tentativa e Erro • Hill Climbing • Análise Meios-Fins

  14. Tentativa e Erro Pode ser organizada: pesquisaem amplitude, ouemprofundidade. Chegaaoobjetivoapósum grandenúmero de passosaleatóriosMuitosmovimentossãodesperdiçadosMaspode ser a saídaquandonão se tem outraalternativa

  15. Hill Climbing 4 3 Estado Inicial A cada estado possívelum valor é atribuído. Aqui quanto mais baixo melhor. A cada passo um novo estado é escolhido com um valor melhor. Pode “empacar”. (Onde?) Nesse caso usar T&E; 4 3 2 3 2 1 Estado Objetivo 2 1

  16. Hill Climbing • Dependendo do estadoinicial o trajetopodeficarempacadoem um máximo local

  17. Análise Meios-Fim • Nãoháplanejamentoenvolvidonasestratégias “Tentativa e Erro” e “Hill Climbing” • A Análise Meios-Fim distingue entre planejarum movimento e executar um movimento • Foipropostacomo parte do General Problem Solver (GPS) por Newell e Simon em 1972.

  18. Análise Meios-Fim A busca é guiadapeladetecção das diferenças entre o estadocorrente e o estadoobjetivo. 1) Comparar o estadocorrente com o estadoobjetivo e identificar as diferenças. 2) Selecionar um operador para reduzir a diferença. • Se o operadorpode ser aplicado, fazer isto; • Se não, estabelecer um novo sub-objetivo, de atingir um estado no qual o operadorpossa ser aplicado. • A análisemeios-fim é entãorecursivamenteaplicada a este novo sub-objetivo. • Voltar a 1

  19. Um Exemplo Simples • Pintarsua casa  • Aplicarpintura • Precisa de tinta e pincel • Iraté a ferragem • Achar as chaves do carro …

  20. A Pilha de Objetivos • Pintar a casa(Objetivo 1) • Aplicar a pintura(Sub-objetivo2) • Precisa de tinta e pincel(Sub-objetivo3) • Vaiaté a ferragem(Sub-objetivo4) • Cheganaferragem(Sub-objetivo4) • Adquiretinta e pincel(Sub-objetivo3) • Aplica a pintura(Sub-objetivo2) • Pinta a casa(Objetivo 1)

  21. Funcionamento da Pilha de Objetivos Solved Goal 4: Pop-offStack Push Goal 1 on Stack Push Goal 2 on Stack Push Goal 3 on Stack Push Goal 4 on Stack G4 G1 G2 G3 G4 G3 G1 G2 G3 G2 G1 G2 G1 G1

  22. Sistemas de Produções Um conjunto de regras de produção (regras se-então) SEvocê tem um pincel de rolo, E você tem tinta E você tem umasuperfíciepronta para ser pintada E a superfície é grande E o seuobjetivo é pintar a superfície ENTÃO use o roloembebidoemtinta para pintar a superfície E espere que a superfícieresultepintada.

  23. Aplicando Sistemas de Produções 1) As condições das regrassãocomparadas com o conteúdocorrentementeativonamemória de trabalho. 2) Se mais do que umaregrapode ser aplicada, aplicarprocedimentos de solução de conflito. 3) A regraselecionada é disparada. 4) Retorna a 1 (O Modelo ACT de Anderson: “a cogniçãohumanabaseia-se emsistemas de produções”).

More Related