Жаңалықтарды бақылап, талқылауға қатысыңыз!
Инстаграмымызға,
Telegram-арнаға жазылып,
қауымдастық чатына қосылыңыз — грант байқауының нәтижелерін жіберіп алмау үшін!
Бекітіп оқыту
-
Пәннің мақсаты: Бұл пән агенттер ортамен әрекеттесу арқылы шешім қабылдауды үйренетін күшейтілген оқытудың (RL) динамикалық өрісін ұсынады. Студенттер негізгі ұғымдары, алгоритмдерді, және Q-learning және саясат градиенттері сияқты RL қолданбаларын ойындарында, робототехникада және т.б. практикалық сценарийлермен зерттейді.
-
Образовательная программа 6B06104 Компьютерлік ғылымдар
-
Несиелер 5
-
Оқу жылы 4
-
Семестр 7