160 likes | 226 Views
Busca Rápida Baseada em Similaridade para Redes Par-a-Par Fast Similarity Search in Peer-to-Peer Networks NOMS 2008 Autores: Thomas Bocek Ela Hunt David Hausheer Burkhard Stiller Apresentador: Sérgio Samuel Furlaneto 18 de Novembro de 2009. Agenda. Introdução
E N D
Busca Rápida Baseada em Similaridade para Redes Par-a-ParFastSimilarity Search in Peer-to-Peer NetworksNOMS 2008Autores: Thomas BocekEla Hunt David HausheerBurkhardStillerApresentador: Sérgio Samuel Furlaneto18 de Novembro de 2009
Agenda • Introdução • Motivação • Objetivo • P2PFast • Conclusão do autor • Conclusão do apresentador
Motivação • Necessidade de sistemas de busca baseados na similaridade de texto: tipografia • Eficiência no tratamento de palavras pequenas
Objetivo • Descoberta de serviços e arquivos baseado em sua descrição • Estrutura descentralizada • Seja aplicável a qualquer DHT • Independente do algoritmo de roteamento
P2PFastSS • É aplicável à descoberta de serviços e arquivos • Usa distância de edição • Número mínimo de operações para transformar uma string em outra: Apagar, Inserir e Substituir
P2PFastSS - Funcionamento • Dividido em duas fases: • Indexação: • Identifica todas as palavras de um documento • Gera vizinhança a partir de remoção de caracteres • Indexação de arquivos a partir da vizinhança gerada • Busca: • Gera vizinhança a partir da remoção de um caractere • Cada vizinho é consultado para uma chave. Cada documento contém um ID e palavra-chave • O documento é recuperado
P2PFastSS - Indexação • Os documentos são armazenados usando DHT, cuja chave é o hash do título do documento • Todos as referências vizinhas ao novo documento são armazenadas
P2PFastSS – Avaliação • Java • 360 hosts PlanetLab, cada um com 100 nós • Distância de edição k=1 • Palavras com comprimento entre 3 e 16 caracteres
P2PFastSS - Avaliação • Métricas • Número de mensagens • Latência • Espaço para armazenamento
Conclusão - Autor • Pode ser usado em qualquer rede P2P • Independente da DHT usada • Mecanismos de descoberta de serviços baseados em texto
Conclusão - Apresentador • Web Semântica • Independente da DHT usada • Mecanismos de descoberta de serviços baseados em texto