Прикладные задачи анализа данных
内容描述: Курс направлен на решение прикладных задач из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов. На курсе студент приобретет практические навыки извлечения признаков из разнородных данных, оценки качества разработанных моделей, применения различных алгоритмов машинного обучения.
贷款数: 10
Пререквизиты:
- Алгоритмизация и технология программирования
*СomplexityDiscipline(zh-CN)*:
*TypesOfClasses(zh-CN)* | *hours(zh-CN)* |
---|---|
*Lectures(zh-CN)* | 30 |
*PracticalWork(zh-CN)* | 30 |
*LaboratoryWork(zh-CN)* | 60 |
*srop(zh-CN)* | 30 |
*sro(zh-CN)* | 150 |
*FormOfFinalControl(zh-CN)* | экзамен |
*FinalAssessment(zh-CN)* |
零件: Вузовский компонент
循环次数: Профилирующие дисциплины
Цель
- Дисциплина "Прикладные задачи анализа данных" является предложением курса Data Science и направлена на выполнение двух целей. Первая — научить прикладной статистике, которая связана с внедрением машинного обучения и анализом результатов. Сюда относится анализ и сравнение моделей, интерпретация моделей машинного обучения, планирование и анализ результатов A/B-тестов. Вторая — дать опыт решения сложных задач с помощью методов машинного обучения. А именно, рассматриваются задачи обработки естественного языка, работы с изображениями и сигналами, прогнозирования временных рядов, построение рекомендательных систем.
Задача
- формирование навыков использования статистических методов при анализе линейных моделей
- формирование навыков интерпретации моделей машинного обучения
- формирование навыков статистической проверки гипотез
- формирование навыков реализации A/B-тестирования
- формирование навыков статистических методов прогнозирования
- формирование навыков прогнозирования с помощью машинного обучения
- приобрести практические навыки построения рекомендательных систем
- приобрести практические навыки решения задач компьютерного зрения
- анализ звуковых сигналов, нейросетевые подходы
- формирование навыков анализа естественного языка
Результат обучения: знание и понимание
- Владеть методами прогнозирования временных рядов
- Знать основные метрики качества рекомендательных систем
- Владеть базовыми методами анализа текстов
Результат обучения: применение знаний и пониманий
- Уметь интерпретировать модели машинного обучения
- Уметь планировать и анализировать результаты A/B-тестов
- Уметь строить рекомендательные системы
- Уметь решать основные задачи анализа изображений и сигналов
- Уметь решать сложные задачи анализа текстов (машинный перевод и пр.)
Результат обучения: формирование суждений
- Формирование суждений о решении сложных задач анализа текстов (машинный перевод и пр.)
- Формирование суждений о построении рекомендательных систем
- Интерпретация моделей машинного обучения
Результат обучения: коммуникативные способности
- развитие и совершенствование коммуникативных способностей студентов;
- развитие навыков участия в конструктивном диалоге о роли и значимости систем искусственного интеллекта в современном мире, различных направлениях в системах искусственного интеллекта
Результат обучения: навыки обучения или способности к учебе
- формирование умений в области систем искусственного интеллекта для реализации научно-исследовательских работ
- выработка навыков построения рекомендательных систем
- способность содействовать, в рамках академических и профессиональных контекстов, технологическому, социальному или культурному развитию в интересах формирования общества, основанного на знаниях
*TeachingMethods(zh-CN)*
- лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа.
*AssessmentKnowledge(zh-CN)*
Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.
*Period2(zh-CN)* | *TypeOfTask(zh-CN)* | *Total(zh-CN)* |
---|---|---|
1 *Rating(zh-CN)* | ИДЗ №1 | 0-100 |
ИДЗ №2 | ||
ИДЗ №3 | ||
2 *Rating(zh-CN)* | ИДЗ №4 | 0-100 |
ИДЗ №5 | ||
ИДЗ №6 | ||
*TotalControl(zh-CN)* | экзамен | 0-100 |
*PolicyAssignmentTask(zh-CN)*
*TypeOfTask(zh-CN)* | 90-100 | 70-89 | 50-69 | 0-49 |
---|---|---|---|---|
Excellent | *Grade4(zh-CN)* | *Grade3(zh-CN)* | *Grade2(zh-CN)* |
*EvaluationForm(zh-CN)*
Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:
- 40% результата, полученного на экзамене;
- 60% результатов текущей успеваемости.
Формула подсчета итоговой оценки:
И= 0,6 | Р1+Р2 | +0,4Э |
2 |
где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.
Итоговая буквенная оценка и ее цифровой эквивалент в баллах:
Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:
Оценка по буквенной системе | Цифровой эквивалент | Баллы (%-ное содержание) | Оценка по традиционной системе |
---|---|---|---|
A | 4.0 | 95-100 | Отлично |
A- | 3.67 | 90-94 | |
B+ | 3.33 | 85-89 | Хорошо |
B | 3.0 | 80-84 | |
B- | 2.67 | 75-79 | |
C+ | 2.33 | 70-74 | |
C | 2.0 | 65-69 | Удовлетворительно |
C- | 1.67 | 60-64 | |
D+ | 1.33 | 55-59 | |
D | 1.0 | 50-54 | |
FX | 0.5 | 25-49 | Неудовлетворительно |
F | 0 | 0-24 |
Темы лекционных занятий
- Методы построения моделей сложных систем
- Критерии выбора аналитических платформ и пакетов Data Mining
- Основные этапы моделирования
- Методика анализа данных
- Data Mining, KDD и взаимосвязи между ними
- Аналитическая отчетность и многомерное представление данных
- Хранилище данных
- Алгоритмы, получившие наибольшее распространение для каждого типа задач
- Этапы подготовки данных
- Выдвижение гипотез
- Методы сбора и систематизации фактов
- Методы проведения экспертиз для выявления наиболее значимых факторов
- Понятия парциальной и комплексной обработки
- Анализ качества полученных моделей
- Основные этапы внедрения систем анализа данных
Основная литература
- Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2020. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // ЭБС Юрайт [сайт]. — URL: https://urait.ru/bcode/450166 (дата обращения:06.04.2022).
- Маккинли, Уэс Python и анализ данных / Уэс Маккинли ; перевод А. Слинкина. — 2-е изд. — Саратов : Профобразование, 2019. — 482 c. — ISBN 978-5-4488-0046-7. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/88752.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей
- Барсегян, А.А., Куприянов М. С. и др. Технологии анализа данных : Data Mining, Visual Mining, Text Minning, OLAP : учеб. - 2-е изд., перераб. и доп. -СПб. : БХВ-Петербург, 2017.
Дополнительная литература
- Шнарева, Г. В. Анализ данных : учебно-методическое пособие / Г. В. Шнарева, Ж. Г. Пономарева. — Симферополь : Университет экономики и управления, 2019. — 129 c. — ISBN 2227-8397. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/89482.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей
- Мельниченко, А. С. Математическая статистика и анализ данных : учебное пособие / А. С. Мельниченко. — Москва : Издательский Дом МИСиС, 2018. — 45 c. — ISBN 978-5-906953-62-9. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/78563.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей