A PCA and SPCA based procedure to variable selection in agriculture

Autores

  • Juscelino Izidoro de Oliveira Jr Fundação ABC para Assistência e Divulgação Técnica Agropecuária
  • José Carlos Ferreira da Rocha Universidade Estadual de Ponta Grosa
  • Alaine Margarete Guimarães Universidade Estadual de Ponta Grossa
  • Adriel Ferreira da Fonseca Universidade Estadual de Ponta Grossa

DOI:

https://doi.org/10.5335/rbca.2015.3727

Palavras-chave:

Mineração de dados agrícolas, seleção de variáveis, complexidade da amostra

Resumo

A mineração de dados agrícolas, frequentemente, envolve o processamento de bases de dados com poucas observações e alta dimensionalidade. Como a complexidade da amostra cresce com a dimensionalidade dos dados e esses dois fatores podem limitar a confiança nos resultados obtidos ou produzir modelos em que há overfitting. Uma forma de reduzir a dimensionalidade dos dados e a complexidade da amostra é selecionar os atributos que são relevantes para a descrição do fenômeno de interesse. Este trabalho apresenta um procedimento que combina métodos de busca e análise de componentes principais supervisionada e não supervisionada para selecionar variáveis. O procedimento remove as variáveis irrelevantes ou com pouca influência sobre a variação dos dados e avalia o impacto da seleção sobre tarefas de regressão e classificação. Sempre que possível, o número de variáveis selecionadas é aquele que atende aos requerimentos da complexidade da amostra. O procedimento foi testado na seleção de variáveis para indução de modelos lineares multivariados e redes neurais artificiais mediante uma base de dados de agricultura de precisão. O procedimento proposto permite uma solução de custo-benefício entre a redução da dimensionalidade e a acurácia do modelo.

Downloads

Os dados de download ainda não estão disponíveis.

Biografia do Autor

  • Juscelino Izidoro de Oliveira Jr, Fundação ABC para Assistência e Divulgação Técnica Agropecuária
    Mestre em Computação Aplicada
  • José Carlos Ferreira da Rocha, Universidade Estadual de Ponta Grosa
    Professor Adjunto do Departamento de Informática da Universidade Estadual de Ponta Grossa. Doutorado em Engenharia Mecânica pela USP.
  • Alaine Margarete Guimarães, Universidade Estadual de Ponta Grossa
    Prof. Adjunto do Departamento de Informática da Universidade Estadual de Ponta Grossa.
  • Adriel Ferreira da Fonseca, Universidade Estadual de Ponta Grossa
    Prof. Adjunto do Departamento de Ciência do Solo e Engenharia Agrícola da Universidade Estadual de Ponta Grossa.

Downloads

Publicado

08-12-2014

Edição

Seção

Artigo Original

Como Citar

[1]
2014. A PCA and SPCA based procedure to variable selection in agriculture. Revista Brasileira de Computação Aplicada. 7, 1 (dez. 2014), 30–41. DOI:https://doi.org/10.5335/rbca.2015.3727.