Жаңалықтарды бақылап, талқылауға қатысыңыз!
Инстаграмымызға, Telegram-арнаға жазылып, қауымдастық чатына қосылыңыз — грант байқауының нәтижелерін жіберіп алмау үшін!

Бекітіп оқыту

Пәннің мақсаты: Бұл пән агенттер ортамен әрекеттесу арқылы шешім қабылдауды үйренетін күшейтілген оқытудың (RL) динамикалық өрісін ұсынады. Студенттер негізгі ұғымдары, алгоритмдерді, және Q-learning және саясат градиенттері сияқты RL қолданбаларын ойындарында, робототехникада және т.б. практикалық сценарийлермен зерттейді.
Образовательная программа 6B06104 Компьютерлік ғылымдар
ВУЗ әл-Фараби атындағы Қазақ Ұлттық университеті
Несиелер 5
Оқу жылы 4
Семестр 7