Анализ больших данных

  • Целью дисциплины является подготовка студентов к созданию программ для работы с большими данными, опираясь на изученные методы и технологии, используемые для работы с большими объемами данных. В рамках данной дисциплины студенты изучат способы работы с данными на различных этапах, включая сбор, хранение, обработку, анализ и визуализацию данных, различные методы обработки и анализа данных, включая статистический анализ, машинное обучение, анализ текстов и изображений, а также анализ данных временных рядов, научатся использовать различные инструменты и технологии для решения задач анализа больших данных, такие как Apache Hadoop, Apache Spark, Python, R и SQL, произведут сравнение различных дистрибутивов платформы Hadoop, "open source" и коммерческих инструментов, используемых для хранения, обработки и аналитики больших данных. В рамках дисциплины студенты будут работать с реальными данными и выполнять практические задания, разработанные предприятиями-партнерами. В рамках проекта студенты разработают модель машинного обучения, визуализируют большие объемы данных с помощью таких инструментов как Zabbix, Grafana и др., предложат решение для конкретных проблем, связанных с анализом больших данных. Итоговая оценка выставляется по результатам защиты проекта
  • Образовательная программа 6B06191 Блокчейн - инженерия
  • Кредитов 5
  • Селективная дисциплина
  • Год обучения 3
  • Семестр 5
Top