Tamanho da fonte:
Aplicação de técnicas de Aprendizado de Máquina em bases de dados de aspectos neuropsiquiátricos do envelhecimento
Última alteração: 2014-10-03
Resumo
O projeto teve como iniciativa encontrar aplicações para o Aprendizado de Máquina (AM) para processar bases de dados obtidas através de estudos de aspectos biológicos, neuropsiquiátricos e de motricidade no envelhecimento de humanos.
Inicialmente foi realizado um estudo teórico dos paradigmas de AM, especialmente focando-se nas técnicas de classificação utilizando Árvores de Decisão (AD) e Redes Neurais Artificiais (RNA). Concomitantemente, foi feito o estudo prático das mesmas utilizando o ambiente Weka e bases de dados de benchmark. Partindo da base teórica obtida, foram então preparadas implementações para os algoritmos mencionados no ambiente R, e enfim foi possível realizar a análise, o preparo e o processamento de bases de dados gentilmente cedidas pelo Grupo de Estudos em Aspectos Neuropsiquiátricos e Motricidade (GEANM).
Durante a etapa de experimentos com dados de benchmark, foi possível verificar o impacto da vaiação de diferentes parâmetros na performance das técnicas diferentes técnicas utilizadas. Dessa forma foi possível verificar que cada configuração obtém melhores resultados em diferentes bases de dados, não existindo uma que se sobressaia em todas as situações. Utilizando esses experimentos como referência inicial, foi possível verificar que, aplicar as técnicas RNA e AD em uma bases de dados do GEANM que trata sobre o impacto de algumas mudanças de hábito na viscosidade do sangue em pacientes. Ambas as técnicas, RNA e AD, foram capazes de alcançar altas taxas de aucurácia em suas melhores configurações de parâmetros.
Foi possível observar que técnicas de AM podem extrair informações valiosas de bases de dados de aspectos biológicos, como o obervado no caso de estudo deste trabalho. Mais especificamente, os resultados obtidos podem fornecer dicas sobre as condições necessárias para a mudança na viscosidade do sangue.
Inicialmente foi realizado um estudo teórico dos paradigmas de AM, especialmente focando-se nas técnicas de classificação utilizando Árvores de Decisão (AD) e Redes Neurais Artificiais (RNA). Concomitantemente, foi feito o estudo prático das mesmas utilizando o ambiente Weka e bases de dados de benchmark. Partindo da base teórica obtida, foram então preparadas implementações para os algoritmos mencionados no ambiente R, e enfim foi possível realizar a análise, o preparo e o processamento de bases de dados gentilmente cedidas pelo Grupo de Estudos em Aspectos Neuropsiquiátricos e Motricidade (GEANM).
Durante a etapa de experimentos com dados de benchmark, foi possível verificar o impacto da vaiação de diferentes parâmetros na performance das técnicas diferentes técnicas utilizadas. Dessa forma foi possível verificar que cada configuração obtém melhores resultados em diferentes bases de dados, não existindo uma que se sobressaia em todas as situações. Utilizando esses experimentos como referência inicial, foi possível verificar que, aplicar as técnicas RNA e AD em uma bases de dados do GEANM que trata sobre o impacto de algumas mudanças de hábito na viscosidade do sangue em pacientes. Ambas as técnicas, RNA e AD, foram capazes de alcançar altas taxas de aucurácia em suas melhores configurações de parâmetros.
Foi possível observar que técnicas de AM podem extrair informações valiosas de bases de dados de aspectos biológicos, como o obervado no caso de estudo deste trabalho. Mais especificamente, os resultados obtidos podem fornecer dicas sobre as condições necessárias para a mudança na viscosidade do sangue.