Аналитика больших данных

Описание: Курс направлен на развитие навыков анализа больших объемов данных для решения научно-технологических задач по направлению диссертационного исследования. Докторант приобретает практические навыки решения экспериментальных и теоретических задач в области аналитики больших данных. Приобретённые практически навыки позволят представить результаты диссертационного исследования в научных журналах и отчетах НИР в виде прилагаемого к статье компьютерного исполняемого модуля вычислительной модели экспериментальных данных.

Количество кредитов: 5

Пререквизиты:

  • Машинное обучение и анализ данных

Трудоемкость дисциплины:

Виды работ часы
Лекции 15
Практические работы
Лабораторные работы 30
СРОП 75
СРО 30
Форма итогового контроля экзамен
Форма проведения итогового контроля экзамен

Компонент: Компонент по выбору

Цикл: Профилирующие дисциплины

Цель
  • Приобретение практических навыков проведения научных исследований с применением современных технологий анализа данных. Развитие навыков анализа больших данных для решения широкого круга приложений, включая анализ корпоративных данных, финансовых данных с мировых рынков хранилищ данных, моделирование хранения и обработки данных, прогнозирование сложных показателей.
Задача
Результат обучения: знание и понимание
  • Понимать теорию и основы хранения, обработки и анализа больших данных, передовые инструменты для сбора, хранения, передачи и визуализации больших данных.
Результат обучения: применение знаний и пониманий
  • Уметь обрабатывать и анализировать большие объемы данных с помощью современного программного обеспечения
Результат обучения: формирование суждений
  • способность самостоятельно применять методы и средства познания, обучения и самоконтроля, осознавать перспективность интеллектуального, культурного, нравственного, физического и профессионального саморазвития и самосовершенствования, уметь критически оценивать свои достоинства и недостатк
Результат обучения: коммуникативные способности
  • осуществлять коммуникации в профессиональной сфере и в обществе целом, в том числе на иностранном языке, анализировать существующую и разрабатывать самостоятельно техническую документацию, четко излагать и защищать результаты комплексной инженерной деятельности в области IT-технологий
Результат обучения: навыки обучения или способности к учебе
  • готовность к смене социальных, экономических, профессиональных ролей, географической и социальной мобильности в условиях динамики перемен, продолжать обучение самостоятельно
Методы преподавания

При проведении учебных занятий предусматривается использование следующих образовательных технологий: - Технология научно-исследовательской деятельности - Технология учебно-исследовательской деятельности - Коммуникативные технологии (дискуссии, пресс-конференция, мозговой штурм, учебные дебаты и пр.) - Информационно-коммуникационные (в том числе дистанционные) технологии

Оценка знаний обучающегося

Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.

Период Вид задания Итого
1  рейтинг Лабораторная работа 1 0-100
Лабораторная работа 2
Лабораторная работа 3
2  рейтинг Лабораторная работа 4 0-100
Лабораторная работа 5
Лабораторная работа 6
Итоговый контроль экзамен 0-100
Политика оценивания результатов обучения по видам работ
Вид задания 90-100 70-89 50-69 0-49
Отлично Хорошо Удовлетворительно Неудовлетворительно
Выполнение лабораторной работы выполнил лабораторную работу в полном объеме и в соответствии с требованиями, отвечает на все вопросы преподавателя, связанные с выполнением работы выполнил работу в полном объеме, но с ошибкой или недочётами, которые может исправить сам или с помощью рекомендаций преподавателя выполнил более 50% работы, но понимает суть всей лабораторной работы. Отвечает на вопросы преподавателя, связанные с выполненной работой выполнил работу не полностью, на вопросы преподавателя затрудняется ответить, допущено множество ошибок и недочётов
Собеседование по контрольным вопросам демонстрирует теоретические знания, свободно владеет речью, использует терминологию, отвечает на уточняющие вопросы демонстрирует теоретические знания, свободно владеет речью, использует терминологию, при ответе делает несущественные ошибки демонстрирует неглубокие теоретические знания, несвободно владеет речью, путается в терминологии, делает ошибки, которые не может самостоятельно исправить отсутствуют теоретические знания, не владеет терминологией, делает грубые ошибки
Форма оценки

Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:

  • 40% результата, полученного на экзамене;
  • 60% результатов текущей успеваемости.

Формула подсчета итоговой оценки:

И= 0,6 Р12 +0,4Э
2

 

где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.

Итоговая буквенная оценка и ее цифровой эквивалент в баллах:

Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:

Оценка по буквенной системе Цифровой эквивалент Баллы (%-ное содержание) Оценка по традиционной системе
A 4.0 95-100 Отлично
A- 3.67 90-94
B+ 3.33 85-89 Хорошо
B 3.0 80-84
B- 2.67 75-79
C+ 2.33 70-74
C 2.0 65-69 Удовлетворительно
C- 1.67 60-64
D+ 1.33 55-59
D 1.0 50-54
FX 0.5 25-49 Неудовлетворительно
F 0 0-24
Темы лекционных занятий
  • Введение в науку о данных и большие данные
  • Основные задачи и методы анализа больших данных
  • Хранение и управление большими данными
  • Технологии хранения больших данных
  • Распределенные вычисления и параллельная обработка
  • Архитектура экосистемы анализа и обработки больших данных Hadoop
  • Машинное обучение для больших данных
  • Визуализация больших данных
  • Облачные вычисления и большие данные
  • Этические аспекты использования больших данных
  • Базы данных NoSQL
  • Графовые базы данных
  • Технология Apache Spark в обработке данных
  • Будущие тенденции в аналитике больших данных
Основная литература
  • Hadley Wickham, Garrett Grolemund. R for Data Science, O'Reilly, 2021
  • Wes McKinney. Python for Data Analysis, O'Reilly, 2022
  • Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee. Learning Spark, 2nd Edition,O'Reilly Media, Inc., 2020
  • Apache Hadoop, url: https://hadoop.apache.org/
  • Apache Spark, url https://spark.apache.org/
  • François Chollet. Deep Learning with Python, Manning Publications, 2021
  • Fundamentals of Data Visualization, url: https://clauswilke.com/dataviz/
  • Getting Started: Graph Database | Neo4j, url: https://medium.com/data-science/getting-started-graph-database-neo4j-df6ebc9ccb5b
Дополнительная литература
  • Ambuj Agrawal. No-Code Artificial Intelligence, Published by BPB Online, 2023
  • Mark Watson. Ambuj Agrawal. Practical Python Artificial Intelligence Programming, 2023