Document images retrieval based on multiple features combination gaofeng meng et al
Download
1 / 22

Document Images Retrieval Based on Multiple Features Combination Gaofeng Meng et. Al. - PowerPoint PPT Presentation


  • 71 Views
  • Uploaded on

Universidade Federal de Pernambuco Centro de Informática. Document Images Retrieval Based on Multiple Features Combination Gaofeng Meng et. Al. IEEE International Conference on Document Analysis and Recognition (ICDAR 2007). Dimas Gabriel , Roberto Pinheiro e Tiago Bockholt

loader
I am the owner, or an agent authorized to act on behalf of the owner, of the copyrighted work described.
capcha
Download Presentation

PowerPoint Slideshow about ' Document Images Retrieval Based on Multiple Features Combination Gaofeng Meng et. Al.' - harvey


An Image/Link below is provided (as is) to download presentation

Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author.While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server.


- - - - - - - - - - - - - - - - - - - - - - - - - - E N D - - - - - - - - - - - - - - - - - - - - - - - - - -
Presentation Transcript
Document images retrieval based on multiple features combination gaofeng meng et al

Universidade Federal de Pernambuco

Centro de Informática

DocumentImagesRetrievalBasedonMultipleFeaturesCombinationGaofeng Meng et. Al.

IEEE International Conference on Document Analysis and Recognition (ICDAR 2007)

Dimas Gabriel , Roberto Pinheiro e Tiago Bockholt

Projeto da disciplina de Recuperação Inteligente de Informação

17/11/2009


Sum rio
Sumário

  • Introdução

    • Overview e Conceitos Chaves

  • Extração de Características

    • Histograma da Projeção (PHF)

    • CrossingsNumberHistogramFeatures (CNHF)

    • Local BinaryPattern (LBP)

    • DensityDistributionFeature (DDF)

  • Algoritmos de Recuperação para sistemas DIR.

  • Algoritmo de Meng (Top N)

  • Experimentos

  • Análise dos Resultados

  • Conclusão

  • Referências


Introdu o overview
IntroduçãoOverview

  • Com o progresso da automação nos escritórios e os avanças nas técnicas de processamento de imagens, as técnicas de recuperação de imagens de documentos estão sendo amplamente desenvolvidas nos últimos anos.

  • O Objetivo da recuperação de imagens de documentos é buscar imagens idênticas ou similares em uma base dado uma imagem de documento como entrada para o sistema.


Introdu o overview1
IntroduçãoOverview


IntroduçãoConceitos chave

  • DIRS são sistemas que visam achar documentos relevantes ou similares de uma grande base de documentos digitalizados.

  • É comum que documentos sejam convertidos para texto para uma fácil busca por palavras chaves. Entretanto, a busca utilizando OCR é uma técnica cara computacionalmente e totalmente dependente do idioma em que o documento foi escrito.


Histograma da ProjeçãoExtração das Características

  • PHF - Histograma é normalizado

  • Dividindo-se cada um dos

  • Componentes do histograma

  • pela soma total dos valores

  • do mesmo.

  • CNHF- O Crossings Number é o número de vezes que há variação entre entre fundo (background) e objeto (foreground).


Histograma da ProjeçãoExtração das Características

LBP - Matriz de pesos usada para calcular valor

final a ser incrementado no histograma

DDF- Matriz na qual os componentes são as densidades relativas entre os pixels de foreground e background em cada região formada pelo particionamento

simétrico do print-Core.


Algoritmo de RecuperaçãoEstratégia de Busca

  • Dada uma imagem de entrada, objetivo é recuperar as imagens mais similares à entrada;

  • Abordagem comum: retornar vizinhos mais próximos;

    • Dificuldade em modelar um espaço onde duas imagens de documentos próximas entre si são realmente similares em conteúdo.

  • Possível solução: utilização de multiplas features para medir a similaridade de dois documentos;


Algoritmo de Recuperaçãoproposto

Estratégia de Busca

  • Realizacombinação entre técnicas:

    • PHF

    • CNHF

    • LBP

    • DDF

  • Composto de duasetapas:

    • 1: União de featuresparagerar a pool original;

    • 2: Ranqueartodas as imagensdapiscina de acordo com o ranking daimagememcadauma das features.


Algoritmo de Recuperação

kNN Cosseno

  • Descobrir os k vizinho mais próximo de uma dada instância.

  • Vantagem: Não possui processamento na fase de treinamento.

  • Desvantagem: Armazenar todos os dados na memória,

    uma vez que o vetor de atributos que define cada padrão é necessário para o cálculo da distância.


Experimentos arcabou o
Experimentos Arcabouço

  • Base de Imagens: 160 imagens divididas em 4 categorias

    • Diferentes resoluções e tamanhos de imagens e com ruidos originais resultantes do escaneamento.

  • Categoria 1:

    • 40 imagens de documentos onde só existia texto impresso.


Experimentos arcabou o1
Experimentos Arcabouço

  • Categoria 2:

    • 40 imagens de documentos com texto misturado com gráficos ou figura.


Experimentos arcabou o2
Experimentos Arcabouço

  • Categoria 3:

    • 40 imagens de documentos com texto, imagem e figuras.


Experimentos arcabou o3
Experimentos Arcabouço

  • Categoria 4:

    • 40 imagens de documentos onde existiam imagens dominantes.


Experimentos resultados algoritmo de meng topn
Experimentos Resultados – Algoritmo de Meng (TopN)


Experimentos resultados algoritmo de meng topn1
Experimentos Resultados – Algoritmo de Meng (TopN)


Experimentos resultados knn cosseno
Experimentos Resultados – kNN Cosseno


Experimentos resultados knn cosseno1
Experimentos Resultados – kNN Cosseno


An lise dos resultados algoritmo de meng topn
Análise dos ResultadosAlgoritmo de Meng (TopN)

Das Tabelas apresentadas anteriormente podemos notar que:

o CNHF apresentou taxas de acerto superiores

quando os documentos analisados continham texto de forma predominante mas não se mostrou muito robusto para a ruídos do tipo sal e pimenta.

2. PHF é mais adequado para recuperar documentos com figuras embora seja mais sensível a ruídos , iluminação não uniforme causada pela distorção do documento.

3. LBP é mais útil quando as texturas nas imagens de documentos são bem definidas mas não é muito efetivo para diferenciar categorias de documentos.

4. DDF não obteve um comportamento satisfatório para documentos onde o texto predomina.


An lise dos resultados knn cosseno
Análise dos ResultadoskNN Cosseno

  • Os testes realizados considerando a base como possuindo apenas 2 categorias apresentaram resultados melhores.

    • 98% média de Acertos.

  • Este teste serve como comprovação para o fato de que a base de dados possui categorias muito semelhantes entre si e que quando adotando-se uma abstração da base, aumentando a distinção entre as categorias, os resultados tentem a melhorar tanto com o algoritmo proposto por Meng quando pelo algoritmo KNN utilizando medida de similaridade do cosseno.


Conclus o da equipe
Conclusão da Equipe

Conclusão 1: As duas novas características propostas são complementares e

podem ser utilizadas em conjunto para um melhor resultado.

Conclusão 2: Pela combinação das características de uma maneira multidisciplinar

os pontos fracos de uma característica são compensados por outras

características e os pontos fortes de cada característica são reforçados .

Conclusão 3: O autor comenta que a estratégia de ranqueamento pode apresentar

resultados ineficientes quando as características combinadas

são correlacionadas.


Refer ncias externas
Referências Externas

  • [1] Cury, M. V. Q. (1999) Modelo Heurístico Neuro-Fuzzy para Avaliação Humanísticas de Projetos de Transporte Urbano. Tese de Doutorado. UFRJ, Rio de Janeiro.

  • [2] TAFNER, M. A.; XEREZ, M.; RODRIGUES FILHO, I. W. Redes Neurais Artificiais — Introdução e princípios de neurocomputação. EKO e FURB, Blumenau. 1995.  


ad