Обучение с подкреплением

  • Этот предмет знакомит с динамической областью обучения с подкреплением (RL), где агенты учатся принимать решения, взаимодействуя с окружающей средой. Студенты изучат ключевые концепции, алгоритмы и приложения RL, такие как Q-обучение и градиенты политики, с практическими сценариями в играх, робототехнике и не только.
  • Образовательная программа 6B06104 Компьютерные науки
  • Кредитов 5
  • Год обучения 4
  • Семестр 7
Top