Sistema de Submissão de Resumos, II ENCONTRO DE INICIAÇÃO CIENTÍFICA - 2012 (ENCERRADO)

Tamanho da fonte: 
Caracterização de conjunto de dados por meio de redes complexas.
Gleison Moraes, Ronaldo Prati

Última alteração: 2012-11-13

Resumo


Introdução

Uma forma de representar um conjunto de dados pode ser através de grafos, que são a forma de representação utilizada para redes complexas. Analisar conjuntos de dados sob a ótica de redes complexas pode agregar importantes informações ao processo de aplicação de algoritmos de aprendizado de máquina. 

Neste projeto investigamos o usos de análises baseadas em medidas extraídas de redes complexas para extrair propriedades de conjuntos de dados representados como grafos e a aplicação dessas medidas no processo de Meta-Aprendizado (GIRAUD-CARRIER et al., 2004)

Objetivos

Verificar a hipótese de que as informações derivadas a partir da representação de um conjunto de dados como rede complexa possam auxiliar no processo de caracterização das propriedades desse conjunto de dados a serem utilizadas em conjunto com meta-aprendizado para auxiliar na categorização do desempenho de algoritmos de aprendizado.

Metodologia

  • Estudo das principais famílias de redes complexas e as propriedades estatísticas que caracterizam essas famílias. 
  • Desenvolvimento de um ferramental que transformou uma representação de conjuntos de dados baseado em tabela para uma representação baseada em grafos. Para construir os grafos a partir desse conjunto de dados, utilizamos a abordagem de distância entre exemplos, utilizando a métrica HVDM para calcular essas distâncias. 
  • Construção de meta-datasets a partir de métricas extraídas dessa representação. O atributo meta-classe e mais 3 meta-atributos foram obtidos do processo de classificação dos datasets processados, sendo escolhido como meta-classe o algoritmo com a menor taxa de erro na classificação. 
  • Avaliação quanto à capacidade dessas medidas auxiliarem no processo de meta-aprendizado. 

Resultados

A meta-classificação foi realizado no ambiente WEKA com 10 meta-datasets construídos pela ferramenta desenvolvida previamente, utilizando 5 algoritmos diferentes nesse processo. Conseguimos boas taxas de acerto na meta-classificação, chegando a 91.8% de acerto quando consideramos todos meta-atributos calculados e 87.6% quando consideramos apenas os meta-atributos extraídos das representações como grafos.

Conclusão

Neste trabalho analisamos a representação de conjuntos de dados representados na forma de grafos e as propriedades extraídas a partir dessa representação. Mostramos que informações derivadas dessas propriedades podem ajudar no processo de caracterização de conjuntos de dados e as avaliamos em relação à capacidade dessas medidas auxiliarem no processo de meta-aprendizado.

Para realizar essas análises, desenvolvemos uma ferramenta capaz de representar um conjunto de dados em formato de tabelas como grafos, calcular algumas das métricas mais importantes relativas aos estudos das redes complexas e com essas métricas construir um meta conjunto de dados. Obtivemos boas taxas de acerto no processo de meta-classificação.