Benchmarking Machine Learning Algorithms in Fake Reviews Detection in Brazilian Portuguese

Autores

  • Eduardo C. R. Borges Instituto Federal de Santa Catarina
  • Cristiano Mesquita Garcia Instituto Federal de Santa Catarina
  • Samuel da S. Feitosa Universidade Federal da Fronteira Sul
  • Carlos H. Radavelli Instituto Federal de Santa Catarina

DOI:

https://doi.org/10.5335/rbca.v17i1.16183

Palavras-chave:

Fake reviews, machine learning, classification, natural language processing

Resumo

A proliferação de avaliações falsas tornou-se uma preocupação crescente nas plataformas de comércio eletrônico, uma vez que essas avaliações podem induzir os consumidores ao erro e prejudicar a reputação dos produtos e serviços oferecidos. A detecção automática de avaliações falsas é uma tarefa desafiadora, pois exige a análise de dados textuais e a identificação de padrões sutis que indicam a veracidade das avaliações. Dado que conjuntos de dados de avaliações falsas em português são escassos, este estudo gerou e propôs um conjunto de dados em português brasileiro para a detecção de avaliações falsas. Foram utilizados quatro algoritmos de aprendizado de máquina, combinados com três métodos de vetorização de texto, em um esquema de aprendizado por transferência para a classificação de avaliações falsas. Foi realizada uma análise comparativa utilizando acurácia, F1-score e falsos positivos. Os resultados mostram que, para o conjunto de dados proposto, a combinação de Regressão Logística e um modelo BERT pré-treinado em português brasileiro, i.e., BERTimbau, alcançou os melhores valores de acurácia, atingindo 96,61%.

Downloads

Os dados de download ainda não estão disponíveis.

Downloads

Publicado

23-05-2025

Edição

Seção

Artigo Original

Como Citar

[1]
2025. Benchmarking Machine Learning Algorithms in Fake Reviews Detection in Brazilian Portuguese. Revista Brasileira de Computação Aplicada. 17, 1 (maio 2025), 12–22. DOI:https://doi.org/10.5335/rbca.v17i1.16183.