AutoRL-TSP-RSM: sistema de aprendizado por reforço automatizado com metodologia de superfície de resposta para o problema do caixeiro viajante
DOI:
https://doi.org/10.5335/rbca.v13i3.12653Palavras-chave:
Aprendizado por Reforço, Problema do Caixeiro Viajante, AutoMLResumo
A definição de parâmetros é uma importante etapa para a utilização de métodos de Aprendizado de Máquina. No entanto, pode ser altamente custoso definir esses valores de condições iniciais para cada aplicação. Assim, este trabalho tem como objetivo propor um sistema de Aprendizado de Máquina Automatizado para ajuste de parâmetros. Nesta linha, foi desenvolvido um método de Aprendizado por Reforço Automatizado aplicado ao Problema do Caixeiro Viajante. O sistema proposto ajustou através da Metodologia de Superfície de Resposta dois parâmetros (taxa de aprendizado e fator de desconto) do algoritmo Q-learning. Os resultados revelaram que os valores ajustados pelo método proposto alcançaram, em geral, as melhores soluções, em comparação com a adoção de parâmetros da literatura.
Downloads
Downloads
Publicado
Edição
Seção
Licença

Todos os artigos estão licenciados com a licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional. Autores que publicam nesta revista concordam com os seguintes termos:
a) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
b) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).