A PCA and SPCA based procedure to variable selection in agriculture

Authors

  • Juscelino Izidoro de Oliveira Jr Fundação ABC para Assistência e Divulgação Técnica Agropecuária
  • José Carlos Ferreira da Rocha Universidade Estadual de Ponta Grosa
  • Alaine Margarete Guimarães Universidade Estadual de Ponta Grossa
  • Adriel Ferreira da Fonseca Universidade Estadual de Ponta Grossa

DOI:

https://doi.org/10.5335/rbca.2015.3727

Keywords:

Mineração de dados agrícolas, seleção de variáveis, complexidade da amostra

Abstract

A mineração de dados agrícolas, frequentemente, envolve o processamento de bases de dados com poucas observações e alta dimensionalidade. Como a complexidade da amostra cresce com a dimensionalidade dos dados e esses dois fatores podem limitar a confiança nos resultados obtidos ou produzir modelos em que há overfitting. Uma forma de reduzir a dimensionalidade dos dados e a complexidade da amostra é selecionar os atributos que são relevantes para a descrição do fenômeno de interesse. Este trabalho apresenta um procedimento que combina métodos de busca e análise de componentes principais supervisionada e não supervisionada para selecionar variáveis. O procedimento remove as variáveis irrelevantes ou com pouca influência sobre a variação dos dados e avalia o impacto da seleção sobre tarefas de regressão e classificação. Sempre que possível, o número de variáveis selecionadas é aquele que atende aos requerimentos da complexidade da amostra. O procedimento foi testado na seleção de variáveis para indução de modelos lineares multivariados e redes neurais artificiais mediante uma base de dados de agricultura de precisão. O procedimento proposto permite uma solução de custo-benefício entre a redução da dimensionalidade e a acurácia do modelo.

Downloads

Download data is not yet available.

Author Biographies

  • Juscelino Izidoro de Oliveira Jr, Fundação ABC para Assistência e Divulgação Técnica Agropecuária
    Mestre em Computação Aplicada
  • José Carlos Ferreira da Rocha, Universidade Estadual de Ponta Grosa
    Professor Adjunto do Departamento de Informática da Universidade Estadual de Ponta Grossa. Doutorado em Engenharia Mecânica pela USP.
  • Alaine Margarete Guimarães, Universidade Estadual de Ponta Grossa
    Prof. Adjunto do Departamento de Informática da Universidade Estadual de Ponta Grossa.
  • Adriel Ferreira da Fonseca, Universidade Estadual de Ponta Grossa
    Prof. Adjunto do Departamento de Ciência do Solo e Engenharia Agrícola da Universidade Estadual de Ponta Grossa.

Published

2014-12-08

Issue

Section

Original Paper

How to Cite

[1]
2014. A PCA and SPCA based procedure to variable selection in agriculture. Brazilian Journal of Applied Computing. 7, 1 (Dec. 2014), 30–41. DOI:https://doi.org/10.5335/rbca.2015.3727.