Облачные технологии в Data Science

  • Цель дисциплины состоит в формировании способности проводить исследовательский анализ данных с помощью Google Cloud Platform (GCP). В рамках дисциплины отображаются следующие аспекты: Настройка Cloud DataLlb для исследовательской аналитики данных. Сегментация и профилирование. Чтение и запись данных из BigQuery. Управление сегментами облачного хранилища. Создание визуализаций данных BigQuery с помощью GCP Charting API. Что входит в конвейер данных? Продукты GCP Data Pipeline. Охваченные модули Data Science. Параметры конвейера данных GCP. Cloud Dataproc. Облачный поток данных. Cloud Pub / Sub. Что такое Apache Beam? Pcollections. Ввод / вывод конвейера. Настройка GCP для потока данных. Настройка Python. Создание простого конвейера. Настройка потока данных. Выполнение в потоке данных. Обработка данных с помощью луча и потока данных. Потоковая передача с Dataflow.
  • Образовательная программа 6B06107 Наука о данных
  • Кредитов 5
  • Селективная дисциплина
  • Год обучения 3
  • Семестр 6
Top