intro_ia/clase7/README.md at main · FIUBA-Posgrado-Inteligencia-Artificial/intro_ia · GitHub

Clase 7

Aprendizaje por Refuerzo
Proceso de decisión de Márkov
Ecuación de Bellman
Algoritmos basados en política o en valor
Soluciones iterativas
Can it Play DOOM? Aplicación de Q-learning