Подписывайтесь на наш instagram, чтобы не пропустить результаты конкурса грантов!
Облачные технологии в Data Science
-
Цель дисциплины состоит в формировании способности проводить исследовательский анализ данных с помощью Google Cloud Platform (GCP). В рамках дисциплины отображаются следующие аспекты: Настройка Cloud DataLlb для исследовательской аналитики данных. Сегментация и профилирование. Чтение и запись данных из BigQuery. Управление сегментами облачного хранилища. Создание визуализаций данных BigQuery с помощью GCP Charting API. Что входит в конвейер данных? Продукты GCP Data Pipeline. Охваченные модули Data Science. Параметры конвейера данных GCP. Cloud Dataproc. Облачный поток данных. Cloud Pub / Sub. Что такое Apache Beam? Pcollections. Ввод / вывод конвейера. Настройка GCP для потока данных. Настройка Python. Создание простого конвейера. Настройка потока данных. Выполнение в потоке данных. Обработка данных с помощью луча и потока данных. Потоковая передача с Dataflow.
-
Образовательная программа 6B06107 Наука о данных
-
Кредитов 5
-
Селективная дисциплина
-
Год обучения 3
-
Семестр 6