Benchmarking Machine Learning Algorithms in Fake Reviews Detection in Brazilian Portuguese
DOI:
https://doi.org/10.5335/rbca.v17i1.16183Keywords:
Fake reviews, Machine learning, Classification, Natural Language ProcessingAbstract
The proliferation of fake reviews has become a growing concern on e-commerce platforms, as these reviews can mislead consumers and harm the reputation of products and services offered. Automatic detection of fake reviews is a challenging task, as it requires analyzing textual data and identifying subtle patterns that indicate the veracity of reviews. Since fake review datasets in Portuguese are scarce, in this work, we generate and propose a dataset in Brazilian Portuguese for the detection of fake reviews. Then, four machine learning algorithms, combined with three text vectorization methods, are used in a transfer learning scheme for fake review classification. A comparative analysis is carried out using performance metrics such as accuracy, F1-score, and false positives. The results show that, for the proposed dataset, the combination of Logistic Regression and a pre-trained BERT model in Brazilian Portuguese, i.e., BERTimbau, reached the best metric values, reaching 96.61% of accuracy.
Downloads
Downloads
Published
Issue
Section
License
Copyright (c) 2025 Cristiano Mesquita Garcia, Eduardo C. R. Borges, Samuel da S. Feitosa, Carlos H. Radavelli

This work is licensed under a Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 International License.

Todos os artigos estão licenciados com a licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional. Autores que publicam nesta revista concordam com os seguintes termos:
a) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
b) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).