Технологии и системы веб-поиска

  • Цель дисциплины – формирование способности анализировать и оценивать возможности различных технологий веб-поиска и использовать модели извлечения данных для проектирования системы веб-поиска. Будут изучены: Введение в информационный поиск. Архитектура поисковой системы общего назначения. Технологии веб-поиска: веб-роботы, технологии использования разметки, технологии анализа ссылок, технологии анализа профилей пользователей. Индексирование и извлечение текстовых файлов по словам. Исследование моделей извлечения данных. Структура базы данных. Измерение релевантности текста для запроса. Текстовое кодирование: токенизация, стеблирование, лемматизация, шумовые слова, фразы. Модель поиска векторного пространства. Подсчет документов. Косинусная мера. Введение в кластеризацию данных. Введение в классификацию текста. Наивные модели Байеса. Фильтрация электронной почты. Структура веб-графа. Законы Зипфа и Парето. Невидимые и специализированные системы веб-поиска. Извлечение мультимедиа. Проектирование систем веб-поиска.
  • Образовательная программа 7M06109 Информационные системы (КГУСТА)
  • Кредитов 5
  • Селективная дисциплина
  • Год обучения 2
  • Семестр 3
Top