Следите за новостями и участвуйте в обсуждениях!
Подписывайтесь на
наш Инстаграм,
Телеграм-канал и
присоединяйтесь к чату сообщества — чтобы не пропустить результаты конкурса грантов!
Обучение с подкреплением
-
Этот предмет знакомит с динамической областью обучения с подкреплением (RL), где агенты учатся принимать решения, взаимодействуя с окружающей средой. Студенты изучат ключевые концепции, алгоритмы и приложения RL, такие как Q-обучение и градиенты политики, с практическими сценариями в играх, робототехнике и не только.
-
Образовательная программа 6B06104 Компьютерные науки
-
Кредитов 5
-
Год обучения 4
-
Семестр 7