Aprendizaje por refuerzo para la evasión de obstáculos en un
robot móvil. (Con
Jorge Peña). Es la extensión de
nuestro trabajo de grado. La idea es probar algoritmos de aprendizaje
por refuerzo (Q-learning, Sarsa, etc.) con estructuras de aproximación
de funciones (basadas en técnicas de
clustering y/o sistemas
neurodifusos) diferentes a las utilizadas en el trabajo de grado y que
permitan mejoras a los modelos planteados para el aprendizaje del
comportamiento de evasión de obstáculos en un robot móvil.