Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional
DOI:
https://doi.org/10.5335/rbca.v9i3.6601Palavras-chave:
Aprendizado por Reforço, Otimização Combinatória, Problema da Mochila MultidimensionalResumo
Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem a analisar a sensibilidade dos parâmetros do algoritmo Q-learning na resolução desse tipo de problema de otimização combinatória.Downloads
Os dados de download ainda não estão disponíveis.
Downloads
Publicado
31-10-2017
Edição
Seção
Artigo Original
Licença

Todos os artigos estão licenciados com a licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional. Autores que publicam nesta revista concordam com os seguintes termos:
a) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
b) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).
Como Citar
[1]
2017. Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional. Revista Brasileira de Computação Aplicada. 9, 3 (out. 2017), 56–70. DOI:https://doi.org/10.5335/rbca.v9i3.6601.