7M06101 Вычислительная лингвистика в КазНУ им. аль-Фараби
-
Цель образовательной программы Цель образовательной программы «7M06101 – Вычислительная лингвистика» подготовка высококвалифицированных специалистов в интеллектуальных информационных технологий. Программа направлена на формирование профессиональной личности специалиста, способного: интерпретировать и применять глубокие исследовательские знания теорий и технологий в области вычислительной лингвистики; создавать и обрабатывать различные цифровые языковые ресурсы; разрабатывать и применять различные прикладные технологии искусственного интеллекта, т.к. машинный перевод, распознавание речи, интеллектуальный анализ данных, машинное обучение и др.
-
Академическая степень Магистратура
-
Языки обучения Русский, Казахский
-
Название ВУЗа Казахский национальный университет имени аль-Фараби
-
Срок обучения 2 года
-
Объем кредитов 120
-
Группа образовательных программ M094 Информационные технологии
-
Область образования 7M06 Информационно-коммуникационные технологии
-
Направление подготовки 7M061 Информационно-коммуникационные технологии
Дисциплины
-
Педагогика высшей школы
Цель – формирование способности к педагогической деятельности в вузе на основе знаний дидактики высшей школы, теорий воспитания и менеджмента образования, анализа и самооценки преподавательской деятельности. Курс рассматривает проектирование образовательной деятельности будущего преподавателя с применением КТО, реализации Болонского процесса, овладения лекторским, кураторским мастерством с использованием стратегий и методов обучения/воспитания и оценивания (TLA-стратегий).
Год обучения - 1
Семестр - 1
Кредитов - 5
-
История и философия науки
Курс вводит в проблематику феномена науки как предмета специального философского анализа, формирует знания об истории и теории науки; о закономерностях развития науки и структуре научного знания; о науке как профессии и социальном институте; о методах ведения научных исследований; о роли науки в развитии общества.
Год обучения - 1
Семестр - 1
Кредитов - 3
-
Анализ языка
Понятие языкового знака и системы. Язык как средство представления информации. Уровни анализа языка- Лексический, Морфологический Семантический анализ и синтез. Денотативные аспекты слова, словосочетание. Предложение и способы автоматического обнаружения синтаксической структуры. Проблемы генерации предложений и текста.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Языковые ресурсы
Цель дисциплины формирование способности магистрантов работать с языковыми ресурсами и базами данных для вычислительной лингвистики для их использования в обработке текстов языка; использовать принципы сохранения целостности и поддержки безопасности в базах данных; создавать запросы к базам данных.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Статистические методы для обработки естественного языка
Цель дисциплины изучение различных статистических методов, обычно используемых в обработке естественного языка, и изучение способов применения этих методов к различным языковым проблемам. Этот курс охватывает широкий спектр тем в обработке естественного языка, , классификацию текста и лексическое устранение неоднозначности.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Информационные технологии для NLP
Изучение современных информационных технологии и инструментов для NLP. Уровни анализа языка. Лексический уровень языка в автоматической обработке. Денотативные аспекты слова, словосочетание. Предложение и способы автоматического обнаружения синтаксической структуры. Способы кодирования смыслового содержания текста и автоматической его обработки. Естественно-языковые интерфейсы.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Формальные грамматики
Цель дисциплины формирование способности магитстрантов работать с формальными грамматиками естественных языков для совершенствования моделей обработки естественных языков. демонстрировать понимание формального аппарата для описания алгоритмических языков: системы регулярных выражений, контекстно-свободные грамматики, конечные автоматы без памяти и со стековой памятью;
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Вычислительная морфология
Цель дисциплины формирование способности магистрантов работать с формальными моделями автоматической обработки текстов на естественном языке для задач машинного обучения. применять в исследовательской и прикладной деятельности современные языки программирования и языки манипулирования данными, операционные системы, пакеты программ и т.д.;
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Обработка речи
Цель дисциплины сформировать способность применения скрытых марковских моделей для моделирования изменяющихся во времени сигналов, принципов языкового моделирования и стратегий уменьшения шумовых сигналов, методов глубокого обучения для создания современных систем обработки разговорного языка.
Год обучения - 1
Семестр - 1
Кредитов - 5
-
Технологии программирования для NLP
Цель дисциплины изучить язык Python и научиться применять его для решения задач анализа данных и машинного обучения в NLP . Основные конструкции и идиомы языка Python;, использовать и применять углубленные знания в области в NLP
Год обучения - 1
Семестр - 2
Кредитов - 5
-
Организация и планирование научных исследований (англ.)
Цель дисциплины сформировать у магистрантов навык к проведению научных исследований, научно-методической работы, социализации обучающихся и обеспечение их участия в системе корпоративного управления ОВПО. Дисциплина направлена на взаимодействование со стейкхолдерами, участие в исследовательских проектах в области традиционных и новых медиа, формулирование исследовательской задачи, сбор данных для проведения анализов и получения результатов.
Год обучения - 1
Семестр - 2
Кредитов - 5
-
Методы машинного обучения в обработке естественного языка
В содержание дисциплины входит выявление видов задач, решаемых методами машинного обучения, и выбор подходящих методов; изучение методов классификации (метрических, логических, линейных), методов прогнозирования , методов кластеризации, методов композиции алгоритмов; построение различных моделей машинного обучения и рассмотрение способов оценки качества моделей.
Год обучения - 1
Семестр - 2
Кредитов - 5
-
Психология управления
Цель дисциплины: сформировать способность применять важнейшие аспекты сферы управления в процессе профессионального становления. В рамках курса раскрываются предмет, основные принципы психологии управления, личность в управленческих взаимодействиях, управление поведением личности, психология управления групповыми явлениями и процессами, психологические особенности личности руководителя, индивидуальный стиль управления, психология влияния в управленческой деятельности, управление конфликтными ситуациями.
Год обучения - 1
Семестр - 2
Кредитов - 3
-
Иностранный язык (профессиональный)
Цель дисциплины заключается в приобретении и совершенствовании компетенций в соответствии с международными стандартами иноязычного образования, способных конкурировать на рынке труда, т.к. через иностранный язык будущий магистр получает доступ к академическим знаниям, новым технологиям и современной информации, позволяющих использование иностранного языка как средства общения в межкультурной, профессиональной и научной деятельности будущего магистра.
Год обучения - 1
Семестр - 2
Кредитов - 5
-
Понимание естественного языка
Дисциплина нацелена на овладение магистрантами основами автоматической обработки текстов, написанных на естественном языке. Это предполагает не только умение использовать готовые приложения для лингвистического анализа, но и понимание принципов их работы, а также знакомство с базовыми математическими моделями, лежащими в основе современной компьютерной лингвистики.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Глубокое обучение
Цель дисциплины формирование способности использования моделей и методов глубокого обучения для внедрения, обучения и валидации нейронных сетей, а также улучшение понимания текущих исследований в области обработки текстов. Применять инструменты и проектировать и реализовывать системы глубокого обучения к решению практических задач обработки и анализа текстов;
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Методы поиска и извлечения информации
Цель дисциплины: формирование у магистрантов необходимой теоретической базы и практических навыков, которые позволят всесторонне и системно понимать современные проблемы прикладной математики и информатики, проблемы обработки и анализа информации и методы извлечение данных.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Модели и методы нейронных сетей в NLP
Курс вводит в проблематику обработки естественных языков и машинного обучения, формирует знания о простых и продвинутых векторных представлениях слов, архитектуре и моделях нейронных сетей. изучение вопросов конструирования сетей, обучения и подбора параметров; изучение рекуррентных и рекурсивных нейронных сетей и их применении в областях NLP.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Технология сентимент анализа
Цель дисциплины – формирование теоретических знаний о методах и инструментах, используемых для сентимент анализа, об областях применения сентимент анализа, а также практических навыков в сборе данных, предобработке текстов, определении настроений, классификации настроений и визуализации результатов.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Технологии машинного перевода
Цель дисциплины формирование способностей магистрантов работать с системами машинного перевода для разработки эффективных алгоритмов машинного перевода. В результате изучения дисциплины обучающийся будет способен: применять полученные при разработке автоматических систем результаты для извлечения новых знаний о естественном языке; оценивать гибридные и статистические подходы и приемы машинного обучения.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Интеллектуальный анализ данных
Целью дисциплины является формирование способностей использовать теоретические и практические знания при работе с данными различных объемов и сложности. Дисциплина направлена на изучение методов сбора данных, их обработки и анализа для дальнейшего выявления закономерностей, присущих изучаемому явлению.
Год обучения - 2
Семестр - 3
Кредитов - 5
-
Онтологии и семантические технологии
Цель дисциплины формирование способностей магистрантов проектировать и реализовать программные решения в сфере семантических технологий. При изучении дисциплин будут рассмотрены следующие аспекты: цели и задачи использования методов и средств представления знаний, основные типы представления информации и знаний и др.
Год обучения - 2
Семестр - 3
Кредитов - 5
Профессии
Результаты обучения
- Обсуждать методологии и технологические достижения в области вычислительной лингвистики и обработки естественного языка;
- Выбирать методологии и технологии для решения задач обработки естественного языка;
- Исследовать задачи перевода текста и использовать автоматизированные средства;
- Проводить аналитические процессы с текстовыми данными
- Разрабатывать алгоритмы и приложения для проведения семантического, синтаксического, морфологического анализа естественного языка;
- Использовать инструменты ОЕЯ (обработка естественного языка) для анализа больших наборов документов, определения тематики и реферирования;
- Разрабатывать языковые ресурсы и инструменты для ОЕЯ (обработка естественного языка);
- Применять методы глубокого обучения, нейронных сетей для решения задач ОЕЯ и прикладных задач искусственного интеллекта;
- Создавать параллельные и сопоставимые корпуса между иностранными языками;
- Вносить собственный оригинальный вклад в развитие сферы вычислительной лингвистики: подготовить на основе результатов выполненных исследований публикации, научно-технические отчеты, отзывы;
- Вести научно-педагогическую деятельность, участвовать в разработке образовательных и методических материалов для преподавания дисциплин по направлению образовательной программы «Вычислительная лингвистика»;
- Формировать решения проблем, основанные на исследованиях в области информационных систем, путем интеграции знаний из новых или междисциплинарных областей и с учетом социальных, этических, лингвистических и научных соображений