Sistema de Submissão de Resumos, II ENCONTRO DE INICIAÇÃO CIENTÍFICA - 2012 (ENCERRADO)

Tamanho da fonte: 
Reconhecimento de Imagens 2D Utilizando um Modelo Estatístico de Formas
Amaury Kruel Budri, Fernando Freitas Alves

Última alteração: 2012-11-12

Resumo


Introdução

Este trabalho apresenta os resultados da implementação de um método de reconhecimento de silhuetas de objetos. O método utiliza uma abordagem contemporânea de aprendizado de máquina para o reconhecimento de objetos, que consiste em corresponder as silhuetas com modelos de um banco de dados de treinamento.

Objetivos

O objetivo central do trabalho foi verificar a eficiência da abordagem de maximização de verosimilhança para o reconhecimento de imagens.

Metodologias

O algoritmo desenvolvido parte de um mapa de bits (bitmap) da silhueta de um objeto. Para esta silhueta é aplicada uma transformada de eixo medial (MAT - Medial Axis Transform). Esta transformada cria um esqueleto do objeto, que então passa por um processo de simplificação.

Em seguida são identificados os pontos críticos do esqueleto. Há diferentes tipos de pontos críticos:

  • ponto de bifurcação ou nó de junção do esqueleto;

  • ponto crítico de distância de borda, quando há uma mudança significativa da distância dos esqueleto para a borda da silhueta.

  • ponto crítico de curvatura, quando há uma mudança significa de direção do esqueleto;

  • ponto crítico final ou nó final do esqueleto.

O esqueleto então é segmentado hierarquicamente. Os segmentos mais próximos ao centro da figura tem maior hierarquia que os segmentos das extremidades.

Finalmente é aplicado um algoritmo de reconhecimento baseado em aprendizado de máquina. O reconhecimento avalia a probabilidade de correspondência entre os segmentos da imagem.

Resultados

Para avaliação do método foi utilizado um banco de dados de imagens. Foram selecionadas imagens do banco de dados que geram bons esqueletos gerados (o método de simplificação de esqueleto implementado não é adequado para todas as imagens). As imagens foram classificadas em 16 classes: pássaro, osso, camelo, criança, carro clássico, cachorro, pessoa, elefante, garfo, copo, martelo, mão, coração, coelho, arraia e tartaruga. Essa seleção abrange 90 imagens de treinamento e 37 de teste. O algoritmo acertou a classificação para 16 imagens de teste (40,54%).

Conclusão

A abordagem utilizada de representação do esqueleto por pontos críticos mostrou-se muito interessante. É uma representação compacta com poucos pontos, o que permite implementar algoritmos computacionalmente complexos. Verifica-se que é uma representação que apresenta uma variação relativamente grande para imagens semelhantes, o que dificulta o processo de reconhecimento de imagens. Entretanto, resultou num procedimento eficiente para segmentação de imagens, que é outro processo relevante para processamento e reconhecimento de imagens. Desta forma, vislumbra-se que, em associação com outras técnicas, pode contribuir para métodos eficientes de reconhecimento.