Подписывайтесь на наш instagram, чтобы не пропустить результаты конкурса грантов!
Технологии и системы веб-поиска
-
Цель дисциплины – формирование способности анализировать и оценивать возможности различных технологий веб-поиска и использовать модели извлечения данных для проектирования системы веб-поиска. Будут изучены: Введение в информационный поиск. Архитектура поисковой системы общего назначения. Технологии веб-поиска: веб-роботы, технологии использования разметки, технологии анализа ссылок, технологии анализа профилей пользователей. Индексирование и извлечение текстовых файлов по словам. Исследование моделей извлечения данных. Структура базы данных. Измерение релевантности текста для запроса. Текстовое кодирование: токенизация, стеблирование, лемматизация, шумовые слова, фразы. Модель поиска векторного пространства. Подсчет документов. Косинусная мера. Введение в кластеризацию данных. Введение в классификацию текста. Наивные модели Байеса. Фильтрация электронной почты. Структура веб-графа. Законы Зипфа и Парето. Невидимые и специализированные системы веб-поиска. Извлечение мультимедиа. Проектирование систем веб-поиска.
-
Образовательная программа 7M06109 Информационные системы (КГУСТА)
-
Кредитов 5
-
Селективная дисциплина
-
Год обучения 2
-
Семестр 3