1 / 14

Recuperação de dados por Conteúdo

Recuperação de dados por Conteúdo. Slim-Trees. Slim - Motivações. Método eficiente de armazenamento e recuperação de informação por meio de similaridade Informações não possuem relações de ordem total. Métodos de acesso métrico. Função de dissimilaridade: d(Oi, Oj)

vachel
Download Presentation

Recuperação de dados por Conteúdo

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Recuperação de dados por Conteúdo Slim-Trees

  2. Slim - Motivações • Método eficiente de armazenamento e recuperação de informação por meio de similaridade • Informações não possuem relações de ordem total

  3. Métodos de acesso métrico • Função de dissimilaridade: d(Oi, Oj) • fixed query tree; mvp-tree; vp-tree; GNAT : estáticas; • M-Tree, Slim-tree: Dinâmicas

  4. Consulta por abrangência • O = {O1, O2, ..., On} pertence a D d() Q? r(Q) range(Q, r(Q)) => Seleciona Oi dentro da distancia r(Q) de Q • Encontre as estrelas que estão até 10 anos-luz do Sol

  5. Consulta k-NN • O = {O1, O2, ..., On} pertence a D d() Q? K K-NN(Q) => Seleciona os K objetos mais próximos de Q • Selecione as 5 estrelas mais próximas do Sol : 5-NN(Sol)

  6. Slim-tree - Definição Caetano Traina Jr. – ICMC/SC (2000) • Estrutura dinâmica (permite inserções após sua criação); • Balanceada; • Performance superior à M-trees • Páginas (nós) de tamanho fixo, que armazenam no máximo C objetos;

  7. Slim-tree – Nós internos • Sc: Objeto Centro da subárvore apontada por Ptrc • d(Sc, Srep): Distância entre Sc e oobjeto representado; • Ptrc: Nó raiz da subárvore que contémcentro Sc; • Rc: Raio de cobertura da região; • #Ent: Número de nós contido em Ptrc

  8. Slim-tree – Nós folha • Sc: Objeto que o nó armazena • Oid: Identificador do nó • d(): Distancia entre Sc e o objeto central

  9. Slim-tree - Exemplo

  10. Slim-tree - Distâncias

  11. Slim-tree - Inserção • A partir da raiz, busca nó que possa receber objeto • Se não encontra este nó • selecionar nó com centro mais próximo do objeto • Se quantidade de nós > 1 • Random | MidDist | Minoccup

  12. Slim-tree - Splitting • Nó escolhido com taxa de ocupação máxima • Random: seleção aleatória de um par de objetos e redistribuição dos outros objetos em função destes; • minMax: par de objetos que minimiza o raio de cobertura da sub-árvore => O(C3) • MST: Remove o arco mais longo da arvore do caminho mínimo => O(C2 log C)

  13. Slim-trees - Sobreposição • Nós diferentes recaem sobre uma mesma região => reduz performance nas buscas • Absolute-fat-factor: Calcula quantidade de objetos cobertos por múltiplas regiões • Não permite o cálculo para arvores diferentes que representam um mesmo domínio • Relative-fat-factor: Conta nós acessados para responder a uma consulta

  14. Slim-trees – Slim down • Análise dos fatores de sobreposição permite aplicar algoritmo • Reorganizar uma árvore já construída de forma a otimizar as buscas e reduzir o consumo de espaço em disco

More Related