1 / 27

Provadores Automáticos de Teoremas

Provadores Automáticos de Teoremas. Estudo e estado da arte dos provadores automáticos de teoremas. Everton Marques egm2@cin.ufpe.br. Agenda. Introdução Provadores automáticos de teoremas: fundamentos teóricos Estado da arte: Provadores automáticos de teoremas em lógica de primeira ordem

maddy
Download Presentation

Provadores Automáticos de Teoremas

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Provadores Automáticos de Teoremas Estudo e estado da arte dos provadores automáticos de teoremas Everton Marquesegm2@cin.ufpe.br

  2. Agenda • Introdução • Provadores automáticos de teoremas: fundamentos teóricos • Estado da arte: Provadores automáticos de teoremas em lógica de primeira ordem • Estado da arte: Outros tipos de provadores • Conclusões

  3. Introdução • As pesquisas direcionadas à área de teoria da prova estudam os conceitos de provas formais e os fundamentos relacionados • Provas formais podem ser classificadas como: • Prova dirigida por humanos • Prova automatizada • O uso de provadores é bastante difundido na área de construção de provas formais • Diversas lógicas • Lógica de primeira ordem • Lógica clássica proposicional • ...

  4. Introdução • Utilização de diversos métodos • Resolução • Tableaux • Anéis booleanos • Dedução Natural • ... • Provador automática de teoremas: um programa computacional que mostra se a conjectura apresentada é uma conseqüência lógica de um conjunto de sentenças (os axiomas e hipóteses) • Linguagem formal sem ambigüidades • Sentença produzida: prova

  5. Provadores automáticos de teoremas: fundamentos teóricos • Herbrand: desenvolveu a base dos provadores automáticos de teoremas em 1930. • Seu método era impraticável de se aplicar até a invenção do computador digital. • Só após o artigo de Robinson em 1965, junto com o desenvolvimento do princípio da resolução, foi possível o desenvolvimento dos provadores.

  6. Fundamentos teóricos: Teorema de Herbrand • Por definição, uma fórmula válida é uma fórmula que é verdade sobre todas as interpretações. • Herbrand desenvolveu um algoritmo para encontrar uma interpretação que pode falsificar uma dada fórmula. • Se a dada fórmula mantém-se válida, não pode existir nenhuma interpretação e seu algoritmo irá parar depois de um número finito de tentativas. • Desta forma, ao invés de provar se uma fórmula é válida, o algoritmo de Herbrand prova que a negação da fórmula é inconsistente

  7. Fundamentos teóricos: Teorema de Herbrand • Com base no teorema de Herbrand, Gilmore foi um dos primeiros a implementar o procedimento de Herbrand em um computador. • Seu programa foi desenvolvido para detectar a inconsistência da fórmula dada, mas encontrou dificuldades com fórmulas não simples. • Estudos do seu programa revelaram que o seu método era ineficiente. O seu método foi melhorado por Davis e Putnam (1960). • O procedimento de prova por resolução é muito mais eficiente que os outros métodos anteriores.

  8. Estado da arte: Provadores em lógica de primeira ordem • CADE – Conference on Automated Deduction • Principal fórum internacional para a apresentação de pesquisas em todos os aspectos da dedução automática. • 1ª vez em 1974. Era bienal até 1996, após anual • Em 2001 uniu-se a outras conferências e virou International Joint Conference on Automated Reasoning • CASC – CADE ATP System Competition • Foi criada para estimular a pesquisa e desenvolvimento de sistemas na área dos provadores • Foi criada também para expor sistemas de provas para a comunidade dos provadores e para fora dela

  9. Estado da arte: Provadores em lógica de primeira ordem • Avalia o desempenho dos provadores em termos de: • Número de problemas resolvidos com ou sem solução de sáida • Média de tempo de execução dos problemas resolvidos • No contexto de: • Um número limitado de problemas qualificados, escolhidos da “TPTP Problem Library” • um determinado tempo limite para cada tentativa de solução • A CASC divide-se em classes e na última edição foram 6: • FOF – axiomática FOF com uma conjectura provável • CNF – conjunto de cláusulas insatisfatíveis • FNT – axiomas FOF com conjecturas que não podem ser provadas • SAT – conjunto de cláusulas satisfatíveis • EPR – conjunto de cláusulas finitas • UEQ – cláusulas de unidade equitativas insatisfatíveis

  10. Estado da arte: Vampire • Baseado na CASC é possível falar dos melhores provadores em lógica de primeira ordem: • Vampire • Desenvolvido na universidade Uppsala pelo PhD Andrei Voronkov e pelo doutor Alexandre Riazanov • Utiliza métodos de resolução e paramodulação para encontrar bons resultados de prova • Ganhou muitos prêmios na CASC, e na última competição, a versão 8.1 venceu a divisão CNF e a versão 9.0 venceu a divisão FOF

  11. Estado da arte: Paradox • Paradox • Desenvolvido na Chalmers University of Technology por Koen Lindström Claessen e Niklas Sörensson • É um provador baseado no método MACE • O método MACE basicamente transforma o conjunto de cláusulas e um domínio em um conjunto de cláusulas em lógica proposicional através da introdução de variáveis proposicionais • Venceu a classe SAT do CASC de 2003 até 2006 • Em 2007 venceu tanto a classe SAT quanto a FNT • Foi desenvolvido na linguagem Haskell e é um software livre

  12. Estado da arte: Darwin • Darwin • O Darwin é a primeira implementação do cálculo de evolução de modelos • Possui algumas das técnicas mais eficazes de busca desenvolvidas pela comunidade SAT • A abordagem é semelhante a outros buscadores de modelos finitos como o Paradox, mas, em vez de transformar um problema em lógica proposicional, ele é convertido em lógica de primeira ordem livre de função. • A versão 1.3 venceu a classe EPR em 2006 e uma variante do Darwin conseguiu o terceiro lugar na classe SAT • No CASC-21 venceu a classe EPR

  13. Estado da arte: WALDMEISTER • WALDMEISTER • Foi desenvolvido na University of Kaiserslautern por Buch e Hillenbrand e foi implementado em C • É um provador de teoremas para lógica equacional de primeira ordem • Tem como objetivo principal ser eficiente em todo o processo de busca da prova • É dividido em 3 níveis lógicos: nível mais alto corresponde à escolha dos parâmetros redução ordenada e heurística de busca, nível intermediário corresponde à uma máquina de inferência e o nível mais baixo fornece algoritmos e estruturas de dados para a execução das operações básicas • Vem vencendo a classe UEQ do CASC desde 1997 e a sua última versão é a WALDMEISTER 806

  14. Estado da arte: E-SETHEO • E-SETHEO • É um provador composicional com estratégia paralela. • Combina uma variedade de provadores de alto desempenho e procedimentos de decisão especializados • Deixa diferentes procedimentos de busca de provas competirem por recursos para resolver um determinado problema • Seu sucesso é parcialmente explicado pelo uso de estratégias paralelas e pela fácil adaptação a um determinado domínio exigido. • Outra importante razão é o uso de excelentes máquinas de inferência para as diferentes estratégias. • Usa estratégias de cooperação baseadas no lema de intercâmbio entre os diferentes sistemas • Venceu o CASC-17 nas classes MIX e SEM. Já no CASC-JC venceu nas classes FOF, MIX e EPR.

  15. Estado da arte: Outros tipos de provadores • Um Provador Automático de Teoremas para a Lógica Modal, Baseado em Anéis Booleanos • Desenvolvido no IME-SP por Fabio Campos Tisovec • Tem como objetivo principal ser um provador com um bom grau de eficiência na prova de problemas SAT • Usa a teoria de anéis booleanos para apoiar a resolução de problemas de satisfatibilidade • Basicamente pega a expressão trabalhada e subdividi-a em inúmeras mini-expressões, compara-as duas a duas, e verifica a existência de contradições entre elas. Caso encontre contradição, sabe-se que a expressão não é válida, caso contrário ela é aceita • Possui uma estrutura dividida em módulos • A linguagem de programação utilizada foi a C++

  16. Estado da arte: Outros tipos de provadores • Kems – Um provador de teoremas multi-estratégia • Foi desenvolvido na USP como tese de doutorado de Adolfo Neto. • É um provador multi-estratégia baseado no método de tableaux KE. • É capaz de provar teoremas em três sistemas lógicos: lógica clássica proposicional, mbC e mCi • Pode ser utilizado com 3 objetivos: educacional, exploratório e adaptativo • Possui uma arquitetura modularizada

  17. Estado da arte: Outros tipos de provadores • Dada a entrada, retorna uma prova de saída que contêm: • O status do tableau • A árvore tableau de prova • O tamanho do problema • O tempo gasto para construir a prova • O tamanho da prova • A versão atual é implementada em Java 1.5 e na linguagem AspectJ • Foi avaliado com várias instâncias de famílias de problemas e nenhuma configuração do KEMS obteve resultados incorretos.

  18. Estado da arte: Outros tipos de provadores

  19. Estado da arte: Outros tipos de provadores • Isabelle • Desenvolvido pela “University of Cambridge” (PhD Larry Paulson) e “Technical University of Munich” (PhD Tobias Nipkow) • A principal aplicação é a formalização de provas matemáticas e em particular verificação formal, incluindo provar propriedades de protocolos e linguagens computacionais • Boa interface visual para o usuário • Ampla documentação, incluindo um tutorial de como usar o sistema • Várias interfaces com outros sistemas • Vem com uma grande biblioteca teórica de matemáticas • Foi utilizado para formalizar muitos teoremas da matemática e da ciência da computação, como o teorema da completude de Gödel • É um software livre

  20. Estado da arte: Outros tipos de provadores

  21. Estado da arte: Outros tipos de provadores • Ergo • Começou o seu desenvolvimento em 2006 na Universidade de Paris • É um provador dedicado a verificação de programas • É baseado no CC(X), um algoritmo de conclusão de congruência e no cálculo de seqüentes • É implementado em Qu-Prolog • Sua arquitetura é modular • É um software livre • ARA • É um provador para vários tipos de relações algébricas • Pode provar muitos teoremas em diversas álgebras • Foi implementado em Haskell

  22. Estado da arte: Outros tipos de provadores • PLLIC - Provador para as Lógicas Linear, Intuicionista e Clássica • Foi desenvolvido no ano de 2006 na universidade UFMG • Foi desenvolvido com a linguagem de programação Java e λ-Prolog • Analisa quando seqüentes do tipo Γ├ L Δ tem resposta: sim ou não, e caso positivo exibe a prova • Trabalha com 3 tipos de lógica: linear, intuicionista e clássica • É acessado via web e é em português • Possui tutoriais, exemplos e fundamentação teórica também em português • É fácil de usar e possui uma interface com o usuário agradável • Tem como objetivo principal ser uma ferramenta de fácil manuseio, podendo ser acessado remotamente para o ensino de lógica em cursos de graduação

  23. Estado da arte: Outros tipos de provadores ~((~ A)/\(~B)) |- A\/B A |- ~(~A)  - Dupla negação

  24. Conclusões • Considerações finais • Embasamento teórico • Estado da arte dos provadores • Estudo de muitos provadores • Dificuldades Encontradas • Escolha de escopo • Dificuldade em encontrar bibliografia • Dificuldade na execução dos programas

  25. Conclusões • Trabalhos Futuros • Implementar um provador automático de teorema • Uma tese de mestrado na área • Desenvolver um provador para competir na CASC

  26. Referências • MARQUES, Everton. Estudo e estado da arte dos provadores automáticos de teoremas. Trabalho de Graduação, Bacharelado em Ciência da Computação, Universidade Federal de Pernambuco. 2008.

  27. Provadores Automáticos de Teoremas Estudo e estado da arte dos provadores automáticos de teoremas Everton Marquesegm2@cin.ufpe.br

More Related