Следите за новостями и участвуйте в обсуждениях!
Подписывайтесь на наш Инстаграм, Телеграм-канал и присоединяйтесь к чату сообщества — чтобы не пропустить результаты конкурса грантов!

Обучение с подкреплением

Этот предмет знакомит с динамической областью обучения с подкреплением (RL), где агенты учатся принимать решения, взаимодействуя с окружающей средой. Студенты изучат ключевые концепции, алгоритмы и приложения RL, такие как Q-обучение и градиенты политики, с практическими сценариями в играх, робототехнике и не только.
Образовательная программа 6B06104 Компьютерные науки
ВУЗ Казахский национальный университет имени аль-Фараби
Кредитов 5
Год обучения 4
Семестр 7