7M06115 Наука о данных в КазНУ им. аль-Фараби
-
Цель образовательной программы Цель образовательной программы заключается в формировании высококвалифицированных специалистов, которые могут применять аналитические методы и инструменты для извлечения ценной информации из данных и принимать основанные на данных решения в различных междисциплинарных областях, включая бизнес, науку, общественные и государственные секторы
-
Академическая степень Магистратура
-
Языки обучения Русский, Казахский, Английский
-
Название ВУЗа Казахский национальный университет имени аль-Фараби
-
Срок обучения 2 года
-
Объем кредитов 120
-
Группа образовательных программ M094 Информационные технологии
-
Область образования 7M06 Информационно-коммуникационные технологии
-
Направление подготовки 7M061 Информационно-коммуникационные технологии
Дисциплины
-
Программирование для науки о данных
Цель дисциплины состоит в формировании способности разрабатывать приложения для обработки данных, управлять проектом разработки программного обеспечения. Содержание дисциплины: Жизненный цикл разработки программного обеспечения. Предобработка исходных данных. Ключевые этапы создания конвейера анализа данных. Обработка данных. Методы извлечения знаний из данных. Визуализация данных. Взаимодействие с фреймворками машинного обучения. Разработка программного обеспечения для аналитики данных. Параллелизм в Python. Использование Git и GitHub.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Основы блокчейн инженерии
Цель дисциплины сформировать способность разрабатывать и разворачивать блокчейн приложения с помощью Solidity для различных блокчейн платформ. Содержание дисциплины: Введение в блокчейн технологии. Принципы работы распределенных реестров. Механизмы консенсуса, используемые в блокчейн. Создание и развертывание смарт-контрактов. Процесс создания и развертывания блокчейн приложений. Основные принципов криптографии, используемые в блокчейн.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Машинное обучение и аналитика данных
Цель курса - обеспечить магистрантов фундаментальными знаниями и навыками в области машинного обучения и анализа данных для эффективного анализа, интерпретации и использования больших объемов данных. Задачи включают изучение основных методов машинного обучения, анализа данных и их практическое применение в решении реальных проблем.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Математические методы в науке о данных
Цель дисциплины состоит в формировании способности применять математические методы, включая вероятность, линейную алгебру, исчисление и оптимизацию, обыкновенные дифференциальные уравнения и уравнения в частных производных, в науке о данных. Содержание дисциплины: Линейный метод наименьших квадратов и разложение по сингулярным числам. Теория спектральных графов и приложения. Оптимизация в машинном обучении. Условия оптимальности. Выпуклость. Градиентный спуск: анализ сходимости. Обратное распространение. Стохастический градиентный спуск для логистической регрессии. Вероятностные модели: ключевые понятия и примеры.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Генеративный искусственный интеллект: технологии и применения
Цель курса - ознакомить магистрантов с основами и продвинутыми методами генеративных моделей и их практическим применением в различных областях, таких как создание изображений, генерация текста и синтез голоса. Задачи включают изучение алгоритмов генерации и создание проектов с использованием генеративных искусственных интеллектуальных технологий.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Теоретические основы искусственного интеллекта
Цель курса - предоставить магистрантам глубокое понимание ключевых концепций и теоретических основ искусственного интеллекта. Задачи включают изучение основных алгоритмов, моделей и принципов, а также их применение для создания интеллектуальных систем в различных областях, таких как обработка естественного языка и компьютерное зрение.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
История и философия науки
Изучение закономерностей и тенденций развития особой деятельности по производству научных знаний, взятых в их исторической динамике и рассмотренных в исторически изменяющемся социокультурном контексте. Курс вводит в проблематику феномена науки как предмета специального философского анализа, формирует знания об истории и теории науки; о закономерностях развития науки и структуре научного знания; о науке как профессии и социальном институте; о методах ведения научных исследований; о роли науки в развитии общества.
Год обучения - 1
Семестр - 1
Кредитов - 3
-
Децентрализованные приложения
Цель дисциплины сформировать способность проектировать, разрабатывать, развертывать и тестировать децентрализованные приложения на базе блокчейн технологии. Содержание: Основы децентрализации. Концепция децентрализации и различные подходы к ее реализации в приложениях. Блокчейн-технология. Базовые принципы блокчейн-технологии и ее роль в децентрализованных приложениях. Платформы децентрализованных приложений Ethereum, EOS, NEO и другие. Разработка децентрализованных приложений. Методы и инструменты разработки децентрализованных приложений.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Инженерия данных
Цель курса состоит в формировании способности применять эффективные стратегии сбора данных, методы визуализации, анализа и интерпретации данных для получения значимых выводов при принятии решений на основе данных. Содержание дисциплины: Методы сбора данных. Принципы и инструменты визуализации данных. Исследовательский анализ данных. Методы статистического анализа. Анализ и интерпретация данных. Интеллектуальный анализ данных. Прогнозное моделирование и методы машинного обучения для принятия решений на основе данных. Этическая осведомленность. Безопасность и конфиденциальность данных
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Педагогика высшей школы
Цель – формирование способности к педагогической деятельности в вузе на основе знаний дидактики высшей школы, теорий воспитания и менеджмента образования, анализа и самооценки преподавательской деятельности. Курс рассматривает проектирование образовательной деятельности будущего преподавателя с применением КТО, реализации Болонского процесса, овладения лекторским, кураторским мастерством с использованием стратегий и методов обучения/воспитания и оценивания (TLA-стратегий).
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Психология управления
Цель дисциплины: сформировать способность применять важнейшие аспекты сферы управления в процессе профессионального становления. В рамках курса раскрываются предмет, основные принципы психологии управления, личность в управленческих взаимодействиях, управление поведением личности, психология управления групповыми явлениями и процессами, психологические особенности личности руководителя, индивидуальный стиль управления, психология влияния в управленческой деятельности, управление конфликтными ситуациями.
Год обучения - 1
Семестр - 2
Кредитов - 3
-
Организация и планирование научных исследований (англ.)
Цель дисциплины: сформировать способность самостоятельно вести научный поиск, ставить конкретные научные задачи и знать методы и приемы их решения, для создания научной работы. Дисциплина изучает: формы и методы планирования, организации и оформления научных статей и диссертации; формы обобщения результатов научных исследований в презентациях, выступлениях, проектах, статьях.
Год обучения - 1
Семестр - 2
Кредитов - 5
-
Введение в Web3
Цель курса сформировать способность понимать основные принципы децентрализации и применять технологии web3 для создания различных видов децентрализованных приложений. В рамках курса рассматриваются следующие аспекты: Web3 и децентрализация. Ethereum и смарт-контракты. Основы смарт-контрактов и их роль в разработке децентрализованных приложений на Ethereum. Web3.js и другие библиотеки. Интеграция с веб-приложениями. Методы интеграции децентрализованных функций в веб-приложения.
Год обучения - 1
Семестр - 2
Кредитов - 5
-
Статистика для науки о данных
Цель дисциплины состоит в формировании способности применять статистические процедуры для анализа данных с использованием языков программирования. Содержание дисциплины: Распределения данных и выборок. Доверительные интервалы. Проверка гипотез. Статистические эксперименты и проверка значимости. Регрессия и предсказание. Линейные модели регрессии, дисперсионный анализ. Классификация. Статистическое машинное обучение. Обучение без учителя.
Год обучения - 1
Семестр - 2
Кредитов - 5
-
Когнитивные системы и нейронные сети
Цель курса - познакомить магистрантов с принципами функционирования нейронных сетей и их применением в различных когнитивных системах. Задачи включают изучение основных алгоритмов и моделей нейронных сетей, а также их применение в обработке сигналов, обучении с подкреплением и других областях искусственного интеллекта
Год обучения - 1
Семестр - 2
Кредитов - 5
-
Прикладное машинное обучение
Цель дисциплины состоит в формировании способности применять алгоритмы и методы машинного обучения для анализа и визуализации данных при решении прикладных задач. В рамках дисциплины рассматриваются следующие аспекты: Предварительная обработка данных и проектирование признаков. Методы выбора признаков и уменьшения размерности. Алгоритмы контролируемого обучения. Алгоритмы обучения без учителя. Оценка и проверка модели. Метрики оценки для классификации, регрессии и кластеризации. Перекрестная проверка и настройка гиперпараметров. Передовые методы машинного обучения. Практические приложения и тематические исследования.
Год обучения - 1
Семестр - 2
Кредитов - 5
-
Иностранный язык (профессиональный)
Цель дисциплины заключается в приобретении и совершенствовании компетенций в соответствии с международными стандартами иноязычного образования, способных конкурировать на рынке труда, т.к. через иностранный язык будущий магистр получает доступ к академическим знаниям, новым технологиям и современной информации, позволяющих использование иностранного языка как средства общения в межкультурной, профессиональной и научной деятельности будущего магистра.
Год обучения - 1
Семестр - 2
Кредитов - 5
-
Глубокое обучение для компьютерного зрения
Цель курса - обучить магистрантов глубоким методам машинного обучения, специфическим для обработки и анализа изображений. Задачи включают изучение основных алгоритмов и моделей глубокого обучения, а также их применение для решения задач распознавания образов, сегментации изображений и других задач компьютерного зрения
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Бизнес-модели блокчейна
Цель курса - обучить магистрантов основам и практическим аспектам бизнес-моделей, связанных с блокчейн технологией. Содержание: Бизнес-модели на основе блокчейна. Децентрализованные платформы, рынки, управление цепочками поставок, финансовые услуги и другие сферы применения. Экономика блокчейна. Экономические аспекты блокчейна, экономические стимулы и вознаграждения, механизмы голосования и принятия решений на основе блокчейна. Финансовые модели и бизнес-модели. Регулирование и юридические аспекты. Применение блокчейна в различных отраслях.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Глубокое обучение
Цель дисциплины состоит в формировании способности использовать методы глубоких нейронных сетей для анализа больших данных. Содержание дисциплины: Место глубокого обучения в контексте статистики и машинного обучения. Обучение и проверка глубоких моделей. Модели глубокого обучения и их приложения. Архитектура глубоких нейронных сетей. Настройка гиперпараметров. Сверточные нейронные сети. Рекуррентные нейронные сети. Ускорение обучения сверточных нейронных сетей.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Обучение с подкреплением
Цель курса - обучить магистрантов основным концепциям и алгоритмам обучения с подкреплением для создания автономных агентов, способных принимать решения в динамических средах. Задачи включают изучение теории обучения с подкреплением, реализацию алгоритмов и их применение в различных практических сценариях.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Искусственный интеллект для обработки естественного языка (NLP)
Цель курса - обучить магистрантов основам и продвинутым методам NLP, чтобы они могли разрабатывать и реализовывать интеллектуальные системы для обработки текста. Задачи включают изучение моделей языковых представлений, анализа сентиментов, машинного перевода и других приложений NLP.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Облачные вычисления для науки о данных
Цель дисциплины состоит в формировании способности применять модель MapReduce и вычислительные среды виртуальных машин для масштабируемой обработки данных. Содержание дисциплины: Параллельное программирование с использованием MapReduce. Облака с инфраструктурой, платформой и программным обеспечением как услугой. Технологии и инструменты виртуализации. Облачное хранилище данных. Базы данных NoSQL и параллельная обработка запросов. Обработка потоковых данных.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Управление большими данными
Цель дисциплины состоит в формировании способности управлять большими данными, разрабатывать и внедрять инструменты, необходимые для работы с большими данными. Содержание дисциплины: Экосистема больших данных. Инструменты анализа больших данных. Системы управления распределенными базами данных. Проектирование систем управления большими данными. Бессхемные базы данных. Хранилища ключей-значений. Распределенные файловые системы. Распределенная обработка данных. Управление потоком и обработка.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Архитектура блокчейн-систем
Цель дисциплины состоит в формировании способности понимать основы архитектуры блокчейна и ее компонентов, применять децентрализованные сети и механизмы консенсуса при развертывании и внедрении блокчейна. Содержание: Основные концепции блокчейна. Типы блокчейн-систем. Преимущества и недостатки. Архитектурные компоненты блокчейна. Протоколы и алгоритмы консенсуса. Принципы работы алгоритмов Proof of Work (PoW), Proof of Stake (PoS), Delegated Proof of Stake (DPoS) и другие. Масштабируемость и производительность. блокчейн-систем. Интероперабельность и стандарты. блокчейн-систем. Стандарты и протоколы ERC-20, ERC-721, Hyperledger Fabric и другие
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Приложения науки о данных для индустрии (проект)
Цель дисциплины состоит в формировании способности выполнять практические проекты по анализу данных в сотрудничестве с отраслевыми партнерами. Содержание дисциплины: Методы исследования. Анализ литературы. Оценка объема и планирование проекта. Сбор и предварительная обработка данных. Исследовательский анализ данных. Выбор, разработка алгоритма анализа данных. Разработка и выбор функций, построение и оценка моделей. Интерпретация и визуализация результатов. Представление результатов анализа данных и подготовка отчета.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Архитектура смарт-контрактов
Цель курса - обучить магистрантов основам архитектуры смарт-контрактов и предоставить им понимание принципов и методов проектирования эффективных и надежных смарт-контрактов. В рамках курса рассматриваются следующие аспекты: Введение в смарт-контракты. Концепция смарт-контрактов и их роль в блокчейн-технологии. Основные принципы работы смарт-контрактов, их структура и основные функции. Языки программирования для смарт-контрактов. Архитектура смарт-контрактов. Принципы проектирования и архитектура смарт-контрактов. Модульность, наследование, интерфейсы и другие аспекты для разработки гибких и эффективных смарт-контрактов. Управление состоянием и хранение данных. Структура данных и базовые операции для хранения и изменения данных в смарт-контрактах.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Этика, конфиденциальность и безопасность данных
Цель дисциплины состоит в формировании способности соблюдать этические нормы, принципы конфиденциальности и меры безопасности данных, связанные со сбором, анализом и использованием данных в различных контекстах Содержание дисциплины: Этические нормы при обращении с данными. Правила защиты данных. Способы сохранения конфиденциальности данных. Шифрование/ дешифрование, аутентификация сообщений, целостность данных. Модели угроз для приложений, управляемых данными. Криптография с открытым ключом для защиты данных
Год обучения - 2
Семестр - 3
Кредитов - 5
Профессии
Результаты обучения
- Применять методы сбора, предварительной обработки, визуализации данных из гетерогенных источников для получения представления об исследуемой предметной области, выявления закономерностей и поддержки принятия решений на основе анализа данных.
- Применять методы статистического анализа, линейной алгебры, оптимизации, математического анализа и вычислительные инструменты, необходимые для эффективного получения полезной информации из структурированных и неструктурированных наборов данных любого размера
- Разрабатывать приложения для обработки данных, реализовывать основные вычислительные алгоритмы для анализа данных, производить оценку вычислительной сложности алгоритмов, проектировать и использовать реляционные и нереляционные базы данных, выполнять практические проекты по анализу данных в сотрудничестве с отраслевыми партнерами
- Организовывать, визуализировать и анализировать большие сложные наборы данных с применением методов описательной статистики, разрабатывать приложения управления большими данными в различных областях, разрабатывать, устанавливать и настраивать приложения для облачных вычислений и применять вычислительные среды виртуальных машин для масштабируемой обработки данных. Использовать инструменты бизнес-аналитики и управления проектами.
- Исследовать различные варианты использования технологии блокчейн в различных отраслях, проектировать и разрабатывать децентрализованные приложения на основе технологии блокчейн, учитывать этические вопросы, анализировать потенциальные последствия применения блокчейн для общества и экономики
- Разрабатывать и оптимизировать модели и методы машинного обучения для анализа и визуализации данных при решении прикладных задач, применять модели глубокого обучения в научных исследованиях, инновационных проектах и реальных приложениях. Знать и применять основные алгоритмы обучения с подкреплением. Разрабатывать и реализовывать интеллектуальные системы для обработки текста.
- Анализировать проблемы конфиденциальности данных, соблюдать этические нормы, принципы конфиденциальности и меры безопасности данных, связанные со сбором, анализом и использованием данных в различных контекстах, применять технические механизмы обеспечения безопасности и конфиденциальности данных
- Проводить глубокий анализ области исследования для выбора приемлемых методов анализа данных, использовать знания и навыки для продолжения обучения и адаптации к новым технологиям обработки данных, развивать критическое мышление в отношении данных и решений, основанных на анализе данных, руководить исследовательской группой
- Самостоятельно проводить научные исследования, понимать текущие вопросы исследования, анализировать и критически относиться к различным источникам информации, применять их для структурирования и формулирования рассуждений, вести научно-педагогическую деятельность, внедрять результаты исследований в практическую педагогическую деятельность
- Применять методы и инструменты анализа данных в различных мультидисциплинарных областях, представлять результаты исследований в различных формах в национальных научных изданиях, на конференциях с учетом специфики аудитории, быть толерантным, эффективно работать в команде при поиске и решении научно-исследовательских задач. Изучать и применять новые педагогические и научные технологии.