Образовательная программа не актуальна

7M07115 Машинное обучение и анализ данных в КазНУ им. аль-Фараби

  • Цель образовательной программы Целью образовательной программы «Машинное обучение и анализ данных» является обеспечение качественной подготовки специалистов для научной, образовательной и производственной сфер, связанных с внедрением программных решений для обработки и анализа больших данных на основе методов машинного обучения, способных осуществлять самостоятельные научные исследования на интеграционных платформах производственных систем с применением методов интеллектуального анализа данных.
  • Академическая степень Магистратура
  • Языки обучения Русский, Казахский
  • Срок обучения 2 года
  • Объем кредитов 120
  • Группа образовательных программ M100 Автоматизация и управление
  • Направление подготовки 7M071 Инженерия и инженерное дело

Дисциплины

  • Педагогика высшей школы

    Цель – формирование способности к педагогической деятельности в вузе на основе знаний дидактики высшей школы, теорий воспитания и менеджмента образования, анализа и самооценки преподавательской деятельности. Курс рассматривает проектирование образовательной деятельности будущего преподавателя с применением КТО, реализации Болонского процесса, овладения лекторским, кураторским мастерством с использованием стратегий и методов обучения/воспитания и оценивания (TLA-стратегий).

    Год обучения - 1
    Семестр - 1
    Кредитов - 5
  • Предиктивный анализ

    Цель дисциплины состоит в формировании способности применять статистические методы и модели машинного обучения для предиктивного анализа данных. Содержание дисциплины: Подходы для предиктивного анализа данных. Статистические методы для анализа данных. Обработка данных. Машинное обучение для предиктивного анализа. Поиск закономерностей и взаимосвязей в больших хранилищах данных. Прогнозное моделирование. Оценка и развертывание модели. Инструменты визуализации.

    Год обучения - 1
    Семестр - 1
    Кредитов - 5
  • Программирование для Data Science

    Цель дисциплины состоит в формировании способности применять методы получения, преобразования и предобработки данных, разрабатывать программное обеспечение для анализа и визуализации данных. Содержание дисциплины: Преобразование необработанных данных в структурированный вид. Разработка конвейера анализа данных. Обработка данных. Визуализация данных. Взаимодействие с фреймворками машинного обучения. Разработка программного обеспечения для анализа и визуализации данных.

    Год обучения - 1
    Семестр - 1
    Кредитов - 5
  • История и философия науки

    Курс вводит в проблематику феномена науки как предмета специального философского анализа, формирует знания об истории и теории науки; о закономерностях развития науки и структуре научного знания; о науке как профессии и социальном институте; о методах ведения научных исследований; о роли науки в развитии общества.

    Год обучения - 1
    Семестр - 1
    Кредитов - 3
  • Компьютерные модели вычислений

    Цель дисциплины состоит в формировании способности применять инструменты и методы, необходимые для предложения алгоритмических решений реальных задач, которые имеют строгие теоретические ограничения использования времени и пространства. В рамках дисциплины рассматриваются следующие аспекты: асимптотическая запись, рекурсия, парадигма «разделяй и властвуй».

    Год обучения - 1
    Семестр - 1
    Кредитов - 5
  • Обработка и анализ данных

    Цель дисциплины состоит в формировании способности выполнять анализ и обработку данных с помощью MATLAB, создавать приложения для прогнозного моделирования. В рамках дисциплины рассматриваются следующие аспекты: Принципы обработки и анализа данных Импорт данных. Визуализация и фильтрация данных. Выполнение расчетов.

    Год обучения - 1
    Семестр - 1
    Кредитов - 5
  • Нейронные сети

    Цель дисциплины состоит в формировании способности строить, обучать и применять глубокие нейронные сети для решения задач анализа данных, требующих больших вычислительных ресурсов. Содержание дисциплины: Архитектура нейронных сетей. Неглубокие нейронные сети. Ключевые вычисления, лежащие в основе глубокого обучения. Построение и обучение глубоких нейронных сетей. Настройка гиперпараметров, регуляризация и оптимизация. Оценка качества обучения.

    Год обучения - 1
    Семестр - 1
    Кредитов - 5
  • Методы и модели многомерного анализа данных

    Цель дисциплины состоит в формировании способности применять современные многомерные статистические методы и современные программные системы при решении задач анализа различных процессов и явлений. В рамках дисциплины рассматриваются следующие аспекты: Вероятностные модели для одномерных и многомерных случайных величин.

    Год обучения - 1
    Семестр - 1
    Кредитов - 5
  • Построение и анализ алгоритмов

    Цель дисциплины состоит в формировании способности реализовывать высокоэффективные алгоритмы и структуры данных для фундаментальных вычислительных задач в различных областях. В рамках дисциплины рассматриваются следующие аспекты: Основные алгоритмы: асимптотическая запись, рекурсия, парадигма «разделяй и властвуй», базовые структуры данных. Сбалансированные бинарные деревья, 2-3 дерева, B-деревья, структуры для множеств, хеширование, сжатие текста (кодирование Хаффмана). Применение алгоритмов максимального потока Рандомизированный выбор и сортировка. Автоматы, сопоставление строк (алгоритм Бойера и Мура, алгоритм Кнута-Морриса-Пратта), сопоставление с образцом. Классы сложности P и NP, NP-полнота, некоторые NP-полные задачи. Стратегии параллельного дизайна. Алгоритмы распределенных вычислений.

    Год обучения - 1
    Семестр - 2
    Кредитов - 5
  • Иностранный язык (профессиональный)

    Эффективное общение в академической среде, представление научных обзоров и результатов оригинальных исследования. Особенности научного дискурса. Научная терминология, использование терминов в научном тексте. Формирование навыков поиска научной информации в сфере медицинских исследований. Оформление научного текста, правила цитирования, варианты оформления сносок. Особенности написания резюме, аннотации, реферата, рецензии.

    Год обучения - 1
    Семестр - 2
    Кредитов - 5
  • Психология управления

    Цель – сформировать способность применять важнейшие аспекты сферы управления в процессе профессионального становления. В рамках курса раскрываются предмет, основные принципы психологии управления, личность в управленческих взаимодействиях, управление поведением личности, психология управления групповыми явлениями и процессами, психологические особенности личности руководителя, индивидуальный стиль управления, психология влияния в управленческой деятельности, управление конфликтными ситуациями.

    Год обучения - 1
    Семестр - 2
    Кредитов - 3
  • Визуализация данных

    Цель дисциплины состоит в формировании способности использовать методы и приложения обнаружения шаблонов в интеллектуальном анализе данных, создавать и интерпретировать визуализацию. В рамках дисциплины рассматриваются следующие аспекты: История развития визуализации. Основные понятия и направления в визуализации. Данные: абстракции данных и их типы. Алфавит визуализации. Эскизирование и проектирование визуализационных решений. Визуальное восприятие человека. Осознание образов. Восприятие цвета. Задачи: абстракции задач и способы их постановки. Человеко-компьютерное взаимодействие. Визуализация данных. Сети и графы. Визуализация текста и документов. Визуализация пространственных данных. Объемы, потоки, карты. Социальная визуализация. Анализ социальных данных. Визуализация для социума. Визуализация и искусство. Визуализация как искусство.

    Год обучения - 1
    Семестр - 2
    Кредитов - 5
  • Организация и планирование научных исследований (англ)

    Цель дисциплины: сформировать способность применения практических навыков организации и планирования научного исследования, систематизировать и применять знания о направлениях научных исследований. Дисциплина изучает: формы и методы планирования, организации и оформления научных статей и диссертации; формы обобщения результатов научных исследований в презентациях, выступлениях, проектах, статьях.

    Год обучения - 1
    Семестр - 2
    Кредитов - 5
  • Методы статистического анализа данных

    Цель дисциплины состоит в формировании способности применять концепции статистического анализа и более продвинутых процедур статистического моделирования с использованием языка программирования Python для интерпретации и анализа данных. В рамках дисциплины рассматриваются следующие аспекты: Методы статистического моделирования. Корреляционный анализ. Регрессионный анализ. Канонический анализ. Методы сравнения средних. Частотный анализ. Кросстабуляция (сопряжение). Иерархические и многоуровневые модели и методы байесовского вывода.Анализ соответствий. Кластерный анализ. Дискриминантный анализ. Факторный анализ. Деревья классификации. способы использования Python в качестве инструмента, включая библиотеки Numpy, Pandas, Statsmodels, Matplotlib и Seaborn. Создание визуализации и управление данными в Python. Анализ главных компонент и классификация. Многомерное шкалирование.

    Год обучения - 1
    Семестр - 2
    Кредитов - 5
  • Глубокое обучение

    Курс охватывает следующие аспекты: Архитектура глубоких нейронных сетей. Настройте гиперпараметры и платформы глубокого обучения. Сверточные нейронные сети, их приложения. Классификация объектов и подобные методы. Сверточные нейронные сети, их приложения. Рекуррентные нейронные сети, их приложения. Параллельные алгоритмы глубокого обучения. Ускорение обучения нейронной сети

    Год обучения - 2
    Семестр - 3
    Кредитов - 5
  • Прикладное машинное обучение

    Цель дисциплины состоит в формировании способности использовать инструменты манипулирования данными для решения задач машинного обучения, разрабатывать алгоритмы для интеллектуального анализа данных. В рамках дисциплины рассматриваются следующие аспекты: Логические методы: решающие деревья и решающие леса. Метрические методы классификации. Линейные методы, стохастический градиент.

    Год обучения - 2
    Семестр - 3
    Кредитов - 5
  • Методы машинного обучения для обработки промышленных данных

    Цель дисциплины сформировать способность оценивать особенности промышленных данных, разрабатывать методы машинного обучения для анализа и визуализации промышленных данных. Содержание дисциплины: Промышленные данные. Платформы промышленных данных. Использование промышленных данных. API интеграции. Методы машинного обучения для промышленных данных. Обучение с учителем. Обучение без учителя. Обучение с подкреплением. Мониторинг состояния и цифровые двойники

    Год обучения - 2
    Семестр - 3
    Кредитов - 5
  • Инфраструктура больших данных

    Цель дисциплины состоит в формировании способности создавать инфраструктуру и средства интеграции систем, приложений и сервисов для обработки больших данных. Содержание дисциплины: Технологии распределенных вычислений. Распределенные файловые системы. Проектирование инфраструктуры больших данных. Разработка и поддержка средств интеграции систем, приложений и сервисов. Пакетная обработка больших данных. Потоковая обработка больших данных. Интерактивная обработка больших данных. Оптимизация размещения больших данных.

    Год обучения - 2
    Семестр - 3
    Кредитов - 5
  • Облачные решения для машинного обучения

    Цель дисциплины состоит в формировании способности применять инженерию машинного обучения и инфраструктуру облачных вычислений для создания облачных приложений прогнозной аналитики. Содержание дисциплины: Основы облачных вычислений. Базовая инфраструктура облачных вычислений. Облачная виртуализация. Контейнеры и API. Облачная инженерия данных. Использование AutoML. Стратегии MLOps и передовые методы разработки облачных решений. Стратегии Edge Machine Learning. Использование AI API.

    Год обучения - 2
    Семестр - 3
    Кредитов - 5
  • Прикладной кластерный анализ

    Цель дисциплины сформировать способность применять различные алгоритмы кластеризации данных для решения прикладных задач, визуализировать сформированные кластеры и анализировать результаты. Содержание дисциплины: Введение в кластеризацию. Метод K-means и модификации. Иерархическая кластеризация. Организация кластеров в виде иерархического дерева. Алгоритм модели гауссовой смеси. Метрики расстояния, используемые в кластеризации. Определение подходящего количества кластеров. Оценка эффективности кластеризации.

    Год обучения - 2
    Семестр - 3
    Кредитов - 5
  • Специализированные технологии больших данных

    Цель дисциплины состоит в формировании способности работать с архитектурами интеграционных платформ, приложениями и сервисами высоконагруженных систем хранения и обработки больших данных. В рамках дисциплины рассматриваются следующие аспекты: Введение в специализированные технологии больших данных. Платформы обработки сверхбольших данных CLAVIRE 2.0. ASPEN – платформа всесторонней оценки систем обработки потоковой информации. Расширенная платформа SparkStreamingс интегрированным механизмом планирования. Оптимизация размещения больших данных. Семантическое хранилище Exarch. Блокчейн технологии в задачах хранения данных.

    Год обучения - 2
    Семестр - 3
    Кредитов - 5
  • Архитектуры нейронных сетей для глубокого обучения

    Цель дисциплины состоит в формировании способности проводить визуальное проектирование нейронных сетей, использовать графический интерфейс для переноса слоев нейронной архитектуры, производить настройку и развертывание моделей с помощью популярных сред глубокого обучения. В рамках дисциплины рассматриваются следующие аспекты: Введение в глубокое обучение. Практические аспекты глубокого обучения. Глубокие сети прямого распространения. Рекуррентные и рекурсивные сети. Продвинутые алгоритмы глубоких нейронных сетей. Настройка гиперпараметров. Регуляризация и оптимизация. Пакетная нормализация и программирование фреймворков. Сверточные нейронные сети. Оптимизация гиперпараметров. Визуальное проектирование нейронных сетей. Защищенная облачная инфраструктура.

    Год обучения - 2
    Семестр - 3
    Кредитов - 5

Результаты обучения

  • Применять современные многомерные статистические методы, инструменты статистического моделирования и программные системы при решении задач анализа различных процессов и явлений.
  • Проектировать и разрабатывать высокоэффективные алгоритмы и структуры данных для вычислительных задач в различных областях, применять инструменты и методы, необходимые для алгоритмических решений научных и прикладных задач, применять коллективную среду документирования программного обеспечения.
  • Управлять инфраструктурой коллективной среды разработки программного обеспечения систем искусственного интеллекта, обучать и применять глубокие нейронные сети для решения задач анализа данных, требующих больших вычислительных ресурсов, производить настройку и развертывание моделей нейронных сетей с помощью сред глубокого обучения.
  • Использовать навыки работы с информацией из различных литературных источников, представлять ее в различных формах сообщений, презентаций и докладов с учетом специфики аудитории, обосновывая и грамотно излагая свою точку зрения на проблемные вопросы. Эффективно работать в команде при поиске и решении научно-исследовательских проблем ОП
  • Применять принципы построения и организации современных программных решений для обработки больших данных, возможности средств интеграции систем, приложений и сервисов, проектировать и использовать архитектуры интеграционных платформ, приложения и сервисы высоконагруженных систем хранения и обработки больших данных.
  • Самостоятельно проводить научные исследования, понимать текущие вопросы исследования, анализировать и критически относиться к различным источникам информации, применять их для структурирования и формулирования рассуждений.
  • Разрабатывать алгоритмы прикладного машинного обучения, предназначенные для описания, изучения и анализа различных наборов данных, нахождения скрытых закономерностей и связей в данных, построения предиктивных моделей.
  • Применять управляемые облачные службы для создания и развертывания решений прогнозной аналитики на основе методов машинного обучения, разрабатывать и внедрять компоненты систем искусственного интеллекта для повышения скорости и качества обработки промышленных данных.
  • Создавать приложения для прогнозного моделирования, использовать методы и приложения обнаружения шаблонов в интеллектуальном анализе данных, создавать и интерпретировать визуализацию, оценивать возможности специализированных приложений по интеллектуальному анализу данных.
  • Вести научно-педагогическую деятельность, внедрять результаты исследований в практическую педагогическую деятельность, руководить исследовательской группой.
Top