Benchmarking Machine Learning Algorithms in Fake Reviews Detection in Brazilian Portuguese
DOI:
https://doi.org/10.5335/rbca.v17i1.16183Palavras-chave:
Fake reviews, machine learning, classification, natural language processingResumo
A proliferação de avaliações falsas tornou-se uma preocupação crescente nas plataformas de comércio eletrônico, uma vez que essas avaliações podem induzir os consumidores ao erro e prejudicar a reputação dos produtos e serviços oferecidos. A detecção automática de avaliações falsas é uma tarefa desafiadora, pois exige a análise de dados textuais e a identificação de padrões sutis que indicam a veracidade das avaliações. Dado que conjuntos de dados de avaliações falsas em português são escassos, este estudo gerou e propôs um conjunto de dados em português brasileiro para a detecção de avaliações falsas. Foram utilizados quatro algoritmos de aprendizado de máquina, combinados com três métodos de vetorização de texto, em um esquema de aprendizado por transferência para a classificação de avaliações falsas. Foi realizada uma análise comparativa utilizando acurácia, F1-score e falsos positivos. Os resultados mostram que, para o conjunto de dados proposto, a combinação de Regressão Logística e um modelo BERT pré-treinado em português brasileiro, i.e., BERTimbau, alcançou os melhores valores de acurácia, atingindo 96,61%.
Downloads
Downloads
Publicado
Edição
Seção
Licença
Copyright (c) 2025 Cristiano Mesquita Garcia, Eduardo C. R. Borges, Samuel da S. Feitosa, Carlos H. Radavelli

Este trabalho está licenciado sob uma licença Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Todos os artigos estão licenciados com a licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional. Autores que publicam nesta revista concordam com os seguintes termos:
a) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
b) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).