Data Lake и системная инфраструктура

  • Курс включает широкое представление о разведке и управлении большими массивами данных, генерируемыми и используемыми в современном мире. Во-первых, вводятся практические методы, используемые при анализе разведочных данных и добыче; темы включают подготовку данных, визуализацию, статистику для понимания данных, а также методы группирования и прогнозирования. Во-вторых, представлены подходы, используемые для хранения, получения и управления данными в реальном мире; темы включают традиционные системы баз данных, языки запросов, а также целостность и качество данных.
  • Образовательная программа 6B05401 Статистика и наука о данных
  • Кредитов 5
  • Селективная дисциплина
  • Год обучения 4
Top