Redução de Dimensionalidade Aplicada na Classificação de Spams usando Filtros Bayesianos

Autores

  • Tiago A. Almeida
  • Akebo Yamakami

DOI:

https://doi.org/10.5335/rbca.2013.1317

Palavras-chave:

Redução de dimensionalidade, Filtragem de spams, Aprendizagem de máquina

Resumo

Nos últimos anos, e-mails spams têm-se tornado um importante problema com enorme impacto econômico para a sociedade. Felizmente, existem métodos capazes de detectar automaticamente a maioria dessas mensagens, sendo que as técnicas mais empregadas são baseadas na Teoria da Decisão Bayesiana. Por outro lado, grande parte das abordagens probabilísticas apresenta uma dificuldade: a manipulação de dados em um espaço com alta dimensionalidade. Para contornar esse problema, muitas técnicas de seleção de termos têm sido propostas na literatura. Neste artigo, revisamos os métodos mais populares empregados como técnicas para seleção de termos em conjunto com sete modelos diferentes de filtros anti-spam Naive Bayesianos.

Downloads

Os dados de download ainda não estão disponíveis.

Downloads

Publicado

11-04-2011

Edição

Seção

Tutorial

Como Citar

[1]
2011. Redução de Dimensionalidade Aplicada na Classificação de Spams usando Filtros Bayesianos. Revista Brasileira de Computação Aplicada. 3, 1 (abr. 2011), 16–29. DOI:https://doi.org/10.5335/rbca.2013.1317.