Аналитика больших данных
内容描述: Курс направлен на развитие навыков анализа больших объемов данных для решения научно-технологических задач по направлению диссертационного исследования. Докторант приобретает практические навыки решения экспериментальных и теоретических задач в области аналитики больших данных. Приобретённые практически навыки позволят представить результаты диссертационного исследования в научных журналах и отчетах НИР в виде прилагаемого к статье компьютерного исполняемого модуля вычислительной модели экспериментальных данных.
贷款数: 5
Пререквизиты:
- Введение в методы Data Mining
*СomplexityDiscipline(zh-CN)*:
*TypesOfClasses(zh-CN)* | *hours(zh-CN)* |
---|---|
*Lectures(zh-CN)* | 15 |
*PracticalWork(zh-CN)* | |
*LaboratoryWork(zh-CN)* | 30 |
*srop(zh-CN)* | 75 |
*sro(zh-CN)* | 30 |
*FormOfFinalControl(zh-CN)* | экзамен |
*FinalAssessment(zh-CN)* | экзамен |
零件: Компонент по выбору
循环次数: Профилирующие дисциплины
Цель
- Приобретение практических навыков проведения научных исследований с применением современных технологий анализа данных. Развитие навыков анализа больших данных для решения широкого круга приложений, включая анализ корпоративных данных, финансовых данных с мировых рынков хранилищ данных, моделирование хранения и обработки данных, прогнозирование сложных показателей.
Результат обучения: знание и понимание
- Понимать теорию и основы хранения, обработки и анализа больших данных, передовые инструменты для сбора, хранения, передачи и визуализации больших данных.
Результат обучения: применение знаний и пониманий
- Уметь обрабатывать и анализировать большие объемы данных с помощью современного программного обеспечения
Результат обучения: формирование суждений
- способность самостоятельно применять методы и средства познания, обучения и самоконтроля, осознавать перспективность интеллектуального, культурного, нравственного, физического и профессионального саморазвития и самосовершенствования, уметь критически оценивать свои достоинства и недостатк
Результат обучения: коммуникативные способности
- осуществлять коммуникации в профессиональной сфере и в обществе целом, в том числе на иностранном языке, анализировать существующую и разрабатывать самостоятельно техническую документацию, четко излагать и защищать результаты комплексной инженерной деятельности в области IT-технологий
Результат обучения: навыки обучения или способности к учебе
- готовность к смене социальных, экономических, профессиональных ролей, географической и социальной мобильности в условиях динамики перемен, продолжать обучение самостоятельно
*TeachingMethods(zh-CN)*
При проведении учебных занятий предусматривается использование следующих образовательных технологий: - Технология научно-исследовательской деятельности - Технология учебно-исследовательской деятельности - Коммуникативные технологии (дискуссии, пресс-конференция, мозговой штурм, учебные дебаты и пр.) - Информационно-коммуникационные (в том числе дистанционные) технологии
*AssessmentKnowledge(zh-CN)*
Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.
*Period2(zh-CN)* | *TypeOfTask(zh-CN)* | *Total(zh-CN)* |
---|---|---|
1 *Rating(zh-CN)* | Лабораторная работа 1 | 0-100 |
Лабораторная работа 2 | ||
Лабораторная работа 3 | ||
2 *Rating(zh-CN)* | Лабораторная работа 4 | 0-100 |
Лабораторная работа 5 | ||
Лабораторная работа 6 | ||
*TotalControl(zh-CN)* | экзамен | 0-100 |
*PolicyAssignmentTask(zh-CN)*
*TypeOfTask(zh-CN)* | 90-100 | 70-89 | 50-69 | 0-49 |
---|---|---|---|---|
Excellent | *Grade4(zh-CN)* | *Grade3(zh-CN)* | *Grade2(zh-CN)* |
*EvaluationForm(zh-CN)*
Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:
- 40% результата, полученного на экзамене;
- 60% результатов текущей успеваемости.
Формула подсчета итоговой оценки:
И= 0,6 | Р1+Р2 | +0,4Э |
2 |
где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.
Итоговая буквенная оценка и ее цифровой эквивалент в баллах:
Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:
Оценка по буквенной системе | Цифровой эквивалент | Баллы (%-ное содержание) | Оценка по традиционной системе |
---|---|---|---|
A | 4.0 | 95-100 | Отлично |
A- | 3.67 | 90-94 | |
B+ | 3.33 | 85-89 | Хорошо |
B | 3.0 | 80-84 | |
B- | 2.67 | 75-79 | |
C+ | 2.33 | 70-74 | |
C | 2.0 | 65-69 | Удовлетворительно |
C- | 1.67 | 60-64 | |
D+ | 1.33 | 55-59 | |
D | 1.0 | 50-54 | |
FX | 0.5 | 25-49 | Неудовлетворительно |
F | 0 | 0-24 |
Темы лекционных занятий
- Введение в науку о данных и большие данные. Характеристики больших данных и их источники.
- Основные задачи и методы анализа больших данных.
- Хранение и управление большими данными
- Технологии хранения больших данных
- Распределенные вычисления и параллельная обработка
- Архитектура экосистемы анализа и обработки больших данных Hadoop.
- Машинное обучение для больших данных
- Визуализация больших данных
- Облачные вычисления и большие данные
- Этические аспекты использования больших данных
- Базы данных NoSQL.
- Графовые базы данных.
- Технология Apache Spark в обработке данных
- Будущие тенденции в аналитике больших данных
Основная литература
- Hadley Wickham, Garrett Grolemund. R for Data Science, O'Reilly, 2021
- Wes McKinney. Python for Data Analysis, O'Reilly, 2022
- Jules S. Damji, Brooke Wenig, Tathagata Das, Denny Lee. Learning Spark, 2nd Edition,O'Reilly Media, Inc., 2020
- Apache Hadoop, url: https://hadoop.apache.org/
- Apache Spark, url https://spark.apache.org/
- François Chollet. Deep Learning with Python, Manning Publications, 2021
- Fundamentals of Data Visualization, url: https://clauswilke.com/dataviz/
- Getting Started: Graph Database | Neo4j, url: https://medium.com/data-science/getting-started-graph-database-neo4j-df6ebc9ccb5b
Дополнительная литература
- Ambuj Agrawal. No-Code Artificial Intelligence, Published by BPB Online, 2023
- Mark Watson. Ambuj Agrawal. Practical Python Artificial Intelligence Programming, 2023