Прикладные задачи анализа данных

Бакланова Ольга Евгеньевна

*InstructorProfile(zh-CN)*

内容描述: Курс направлен на решение прикладных задач из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов. На курсе студент приобретет практические навыки извлечения признаков из разнородных данных, оценки качества разработанных моделей, применения различных алгоритмов машинного обучения.

贷款数: 10

Пререквизиты:

  • Алгоритмизация и технология программирования

*СomplexityDiscipline(zh-CN)*:

*TypesOfClasses(zh-CN)* *hours(zh-CN)*
*Lectures(zh-CN)* 30
*PracticalWork(zh-CN)* 30
*LaboratoryWork(zh-CN)* 60
*srop(zh-CN)* 30
*sro(zh-CN)* 150
*FormOfFinalControl(zh-CN)* экзамен
*FinalAssessment(zh-CN)*

零件: Вузовский компонент

循环次数: Профилирующие дисциплины

Цель
  • Дисциплина "Прикладные задачи анализа данных" является предложением курса Data Science и направлена на выполнение двух целей. Первая — научить прикладной статистике, которая связана с внедрением машинного обучения и анализом результатов. Сюда относится анализ и сравнение моделей, интерпретация моделей машинного обучения, планирование и анализ результатов A/B-тестов. Вторая — дать опыт решения сложных задач с помощью методов машинного обучения. А именно, рассматриваются задачи обработки естественного языка, работы с изображениями и сигналами, прогнозирования временных рядов, построение рекомендательных систем.
Задача
  • формирование навыков использования статистических методов при анализе линейных моделей
  • формирование навыков интерпретации моделей машинного обучения
  • формирование навыков статистической проверки гипотез
  • формирование навыков реализации A/B-тестирования
  • формирование навыков статистических методов прогнозирования
  • формирование навыков прогнозирования с помощью машинного обучения
  • приобрести практические навыки построения рекомендательных систем
  • приобрести практические навыки решения задач компьютерного зрения
  • анализ звуковых сигналов, нейросетевые подходы
  • формирование навыков анализа естественного языка
Результат обучения: знание и понимание
  • Владеть методами прогнозирования временных рядов
  • Знать основные метрики качества рекомендательных систем
  • Владеть базовыми методами анализа текстов
Результат обучения: применение знаний и пониманий
  • Уметь интерпретировать модели машинного обучения
  • Уметь планировать и анализировать результаты A/B-тестов
  • Уметь строить рекомендательные системы
  • Уметь решать основные задачи анализа изображений и сигналов
  • Уметь решать сложные задачи анализа текстов (машинный перевод и пр.)
Результат обучения: формирование суждений
  • Формирование суждений о решении сложных задач анализа текстов (машинный перевод и пр.)
  • Формирование суждений о построении рекомендательных систем
  • Интерпретация моделей машинного обучения
Результат обучения: коммуникативные способности
  • развитие и совершенствование коммуникативных способностей студентов;
  • развитие навыков участия в конструктивном диалоге о роли и значимости систем искусственного интеллекта в современном мире, различных направлениях в системах искусственного интеллекта
Результат обучения: навыки обучения или способности к учебе
  • формирование умений в области систем искусственного интеллекта для реализации научно-исследовательских работ
  • выработка навыков построения рекомендательных систем
  • способность содействовать, в рамках академических и профессиональных контекстов, технологическому, социальному или культурному развитию в интересах формирования общества, основанного на знаниях
*TeachingMethods(zh-CN)*

- лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа.

*AssessmentKnowledge(zh-CN)*

Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.

*Period2(zh-CN)* *TypeOfTask(zh-CN)* *Total(zh-CN)*
1  *Rating(zh-CN)* ИДЗ №1 0-100
ИДЗ №2
ИДЗ №3
2  *Rating(zh-CN)* ИДЗ №4 0-100
ИДЗ №5
ИДЗ №6
*TotalControl(zh-CN)* экзамен 0-100
*PolicyAssignmentTask(zh-CN)*
*TypeOfTask(zh-CN)* 90-100 70-89 50-69 0-49
Excellent *Grade4(zh-CN)* *Grade3(zh-CN)* *Grade2(zh-CN)*
*EvaluationForm(zh-CN)*

Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:

  • 40% результата, полученного на экзамене;
  • 60% результатов текущей успеваемости.

Формула подсчета итоговой оценки:

И= 0,6 Р12 +0,4Э
2

 

где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.

Итоговая буквенная оценка и ее цифровой эквивалент в баллах:

Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:

Оценка по буквенной системе Цифровой эквивалент Баллы (%-ное содержание) Оценка по традиционной системе
A 4.0 95-100 Отлично
A- 3.67 90-94
B+ 3.33 85-89 Хорошо
B 3.0 80-84
B- 2.67 75-79
C+ 2.33 70-74
C 2.0 65-69 Удовлетворительно
C- 1.67 60-64
D+ 1.33 55-59
D 1.0 50-54
FX 0.5 25-49 Неудовлетворительно
F 0 0-24
Темы лекционных занятий
  • Методы построения моделей сложных систем
  • Критерии выбора аналитических платформ и пакетов Data Mining
  • Основные этапы моделирования
  • Методика анализа данных
  • Data Mining, KDD и взаимосвязи между ними
  • Аналитическая отчетность и многомерное представление данных
  • Хранилище данных
  • Алгоритмы, получившие наибольшее распространение для каждого типа задач
  • Этапы подготовки данных
  • Выдвижение гипотез
  • Методы сбора и систематизации фактов
  • Методы проведения экспертиз для выявления наиболее значимых факторов
  • Понятия парциальной и комплексной обработки
  • Анализ качества полученных моделей
  • Основные этапы внедрения систем анализа данных
Основная литература
  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2020. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // ЭБС Юрайт [сайт]. — URL: https://urait.ru/bcode/450166 (дата обращения:06.04.2022).
  • Маккинли, Уэс Python и анализ данных / Уэс Маккинли ; перевод А. Слинкина. — 2-е изд. — Саратов : Профобразование, 2019. — 482 c. — ISBN 978-5-4488-0046-7. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/88752.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей
  • Барсегян, А.А., Куприянов М. С. и др. Технологии анализа данных : Data Mining, Visual Mining, Text Minning, OLAP : учеб. - 2-е изд., перераб. и доп. -СПб. : БХВ-Петербург, 2017.
Дополнительная литература
  • Шнарева, Г. В. Анализ данных : учебно-методическое пособие / Г. В. Шнарева, Ж. Г. Пономарева. — Симферополь : Университет экономики и управления, 2019. — 129 c. — ISBN 2227-8397. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/89482.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей
  • Мельниченко, А. С. Математическая статистика и анализ данных : учебное пособие / А. С. Мельниченко. — Москва : Издательский Дом МИСиС, 2018. — 45 c. — ISBN 978-5-906953-62-9. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/78563.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей