Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma. (2016). Revista Brasileira De Computação Aplicada, 8(2), 44-59. https://doi.org/10.5335/rbca.v8i2.5249