Обработка естественного языка (NLP)

  • Цель дисциплины состоит в формировании способности использовать библиотеки, актуальные и полезные для НЛП в Python. В результате изучения дисциплины сформировать следующие способности: - манипулировать текстом, поиск текста, подсчет слов, разбиение текста на слова, лексическая дисперсия - Извлекать информации из текста - Анализировать структуру предложения(парсер, грамматика) - Управлять лингвистическими данными. В рамках дисциплины рассматриваются следующие аспекты: Обзор пакетов Python, связанных с NLP. Введение в NLP. Простая обработка текста. Обработка сложных конструкций. Естественный . Машинные переводы (статистические, основанные на правилах, буквальные и т. Д.) NLP в Python в примерах. Доступ к текстовым корпусам и лексическим ресурсам. (Общие источники для корпусов. Условные частотные распределения. Подсчет слов по жанрам . Создание собственного корпуса. Словарь произношения. Лексиконы для обуви и инструментов. Смыслы и синонимы. Иерархии. Лексические отношения: меронимы, голонимы. Семантическое сходство) Категоризация и маркировка слов. Текст Извлечение информации из текста. Анализ структуры предложения. Построение грамматик на основе признаков. Анализируя значение предложений. Управление лингвистическими данными. Форматы данных (лексикон или текст), метаданные.
  • Образовательная программа 6B06107 Наука о данных
  • Кредитов 5
  • Селективная дисциплина
  • Год обучения 3
  • Семестр 6
Top