ИИ: Обучение с подкреплением

  • В рамках курса рассматриваются основные понятия современного перспективного направления – обучения с подкреплением. Слушатели изучат основные методы и алгоритмы обучения с подкреплением: Temporal-Difference learning, Монте-Карло, Sarsa, Q-learning, Policy Gradient и другие. Алгоритмы и методы, изученные на курсе, могут быть применены для решения задач из разных областей: разработка игр, рекомендательные системы, логистика, контроль качества на производстве, финансы, промышленные системам управления и так далее.
  • Кредитов 5
  • Селективная дисциплина
  • Год обучения 1
  • Семестр 2
Top