Tamanho da fonte:
Análise de Sentimento no Twitter nas Eleições de 2018
Última alteração: 2019-09-26
Resumo
A Análise de Sentimento é um campo de estudo no qual técnicas de aprendizado de máquina e processamento de linguagem natural são aplicadas em dados textuais para extrair informação subjetiva contida no texto, com o objetivo de classificar a opinião do autor sobre o assunto, pessoa ou entidade em questão. Esse tipo de estudo analítico pode trazer informações sobre a opinião de um vasto público, quando aplicado em redes sociais. O Twitter tem mecanismos que facilitam a coleta de dados, e por isso é uma plataforma onde esse tipo de análise é muito comum. Técnicas similares têm sido utilizadas para a predição de resultados de eleições em trabalhos e pesquisas acadêmicas, e algumas delas serão detalhadas neste trabalho. Entretanto, recentemente verificou-se que há um crescimento no número de perfis falsos no Twitter com objetivo de favorecer certos candidatos ou partidos. Com isso em mente, este projeto propõe um estudo comparativo entre Análise de Sentimento aplicada ao Twitter e pesquisas eleitorais de fontes reconhecidas. Assim, utilizando a linguagem de programação R, foram coletados mais de 4 milhões de tweets durante os dois últimos meses das eleições presidenciais de 2018, e foram reunidos 50 relatórios de pesquisa de opinião política de 4 fontes diferentes. Taxas como aprovação, rejeição e intenção de voto foram comparadas ao longo do tempo com resultados da Análise de Sentimento de tweets dos principais candidatos às eleições presidenciais de 2018. O estudo comparativo procurou estabelecer eventuais correlações e validação entre as tendências dessas duas fontes. A Análise de Sentimento dos tweets foi feita com base no método léxico, utilizando também a remoção de stopwords e aplicação de stemming para o português. Os resultados não demonstraram forte correlação com as pesquisas eleitorais, e tampouco verificou-se uma clara preferência dos usuários do Twitter por um dos candidatos.