Reinforcement learning control of robot manipulator
DOI:
https://doi.org/10.5335/rbca.v13i3.12091Palavras-chave:
Aprendizado por Reforço, Robótica, Inteligência Artificial, Redes Neurais ProfundasResumo
Desde o estabelecimento da robótica em aplicações industriais, a programação de robôs manipuladores envolve o processo repetitivo e demorado de especificação manual de uma trajetória fixa, o que resulta em tempo ocioso de produção e na necessidade de reprogramação completa para diferentes tarefas a serem executadas pelo robô. A tendência de aumento das aplicações da robótica em ambientes não estruturados requer controladores inteligentes e reativos, devido respectivamente à imprevisibilidade do ambiente e a medidas de segurança. Este artigo apresenta uma análise comparativa de duas classes de algoritmos de Aprendizagem por Reforço, iteração de valor (Q-Learning / DQN) e iteração de política (REINFORCE), aplicada à tarefa discretizada de posicionar um manipulador robótico em um ambiente simulado repleto de obstáculos, sem conhecimento prévio das posições dos obstáculos ou da dinâmica do braço do robô. O desempenho do agente e a convergência do algoritmo são analisados sob diferentes funções de recompensa e em quatro projetos de teste cada vez mais complexos: robô 1-DOF, robô 2-DOF, robô industrial Kuka KR16, robô industrial Kuka KR16 com setpoint em posição aleatória. O algoritmo DQN apresentou desempenho significativamente melhor e tempo de treinamento reduzido em todos os projetos de teste e a terceira função de recompensa gerou melhores agentes para ambos os algoritmos.
Downloads
Downloads
Publicado
Edição
Seção
Licença

Todos os artigos estão licenciados com a licença Creative Commons Atribuição-NãoComercial-SemDerivações 4.0 Internacional. Autores que publicam nesta revista concordam com os seguintes termos:
a) Autores mantém os direitos autorais e concedem à revista o direito de primeira publicação, com o trabalho simultaneamente licenciado sob a Licença Creative Commons Attribution que permite o compartilhamento do trabalho com reconhecimento da autoria e publicação inicial nesta revista.
b) Autores têm autorização para assumir contratos adicionais separadamente, para distribuição não-exclusiva da versão do trabalho publicada nesta revista (ex.: publicar em repositório institucional ou como capítulo de livro), com reconhecimento de autoria e publicação inicial nesta revista.
c) Autores têm permissão e são estimulados a publicar e distribuir seu trabalho online (ex.: em repositórios institucionais ou na sua página pessoal) a qualquer ponto antes ou durante o processo editorial, já que isso pode gerar alterações produtivas, bem como aumentar o impacto e a citação do trabalho publicado (Veja O Efeito do Acesso Livre).