Моделирование данных (BDA-4)

  • Изучение технологии извлечения данных и видов извлечения данных; извлечение структурированных и полу/неструктурированных данных. А также хранение различных типов данных (HDFS, NoSQL(key-value, document oriented, column base)); методы обработки данных; обработка в реальном времени/пакетная обработка; работа с необработанными данными. Очистка данных. Различные форматы данных, преобразования и агрегации. Различные методы преобразования с помощью Python, а также с помощью ETL tools ( Pentaho).
  • Образовательная программа 6B06103 Аналитика больших данных
  • Кредитов 5
  • Селективная дисциплина
  • Год обучения 4
  • Семестр 2
Top