Бекітіп оқыту

  • Пәннің мақсаты: Бұл пән агенттер ортамен әрекеттесу арқылы шешім қабылдауды үйренетін күшейтілген оқытудың (RL) динамикалық өрісін ұсынады. Студенттер негізгі ұғымдары, алгоритмдерді, және Q-learning және саясат градиенттері сияқты RL қолданбаларын ойындарында, робототехникада және т.б. практикалық сценарийлермен зерттейді.
  • Образовательная программа 6B06104 Компьютерлік ғылымдар
  • Несиелер 5
  • Оқу жылы 4
  • Семестр 7
Top