Введение в большие данные и аналитику

  • Этот курс научит магистрантов: 1. Описывать ландшафт больших данных, включая примеры реальных проблем с большими данными, включая три основных источника больших данных: люди, организации и датчики. 2. Понимать основные составляющие больших данных (объем, скорость, разнообразие, достоверность, значимость и ценность) и почему каждая из них влияет на сбор, мониторинг, хранение, анализ и отчетность. 3. Получать пользу от больших данных, используя 5-этапный процесс для структурирования анализа. 4. Определять, какие проблемы есть, а какие нет, и уметь преобразовывать проблемы больших данных в вопросы науки о данных. 5. Иметь представление об архитектурных компонентах и моделях программирования, используемых для масштабируемого анализа больших данных. 6. Использовать основные функцияи и компоненты стека Hadoop, включая систему управления ресурсами и заданиями YARN, файловую систему HDFS и модель программирования MapReduce.
  • Кредитов 5
  • Селективная дисциплина
  • Год обучения 1
  • Семестр 2
Top