Прикладные задачи анализа данных

Бакланова Ольга Евгеньевна

Портфолио преподавателя

Описание: Курс направлен на решение прикладных задач из различных областей анализа данных: анализ текста и информационный поиск, коллаборативная фильтрация и рекомендательные системы, бизнес-аналитика, прогнозирование временных рядов. На курсе студент приобретет практические навыки извлечения признаков из разнородных данных, оценки качества разработанных моделей, применения различных алгоритмов машинного обучения.

Количество кредитов: 10

Пререквизиты:

  • Алгоритмизация и технология программирования

Трудоемкость дисциплины:

Виды работ часы
Лекции 30
Практические работы 30
Лабораторные работы 60
СРОП 30
СРО 150
Форма итогового контроля экзамен
Форма проведения итогового контроля

Компонент: Вузовский компонент

Цикл: Профилирующие дисциплины

Цель
  • Дисциплина "Прикладные задачи анализа данных" является предложением курса Data Science и направлена на выполнение двух целей. Первая — научить прикладной статистике, которая связана с внедрением машинного обучения и анализом результатов. Сюда относится анализ и сравнение моделей, интерпретация моделей машинного обучения, планирование и анализ результатов A/B-тестов. Вторая — дать опыт решения сложных задач с помощью методов машинного обучения. А именно, рассматриваются задачи обработки естественного языка, работы с изображениями и сигналами, прогнозирования временных рядов, построение рекомендательных систем.
Задача
  • формирование навыков использования статистических методов при анализе линейных моделей
  • формирование навыков интерпретации моделей машинного обучения
  • формирование навыков статистической проверки гипотез
  • формирование навыков реализации A/B-тестирования
  • формирование навыков статистических методов прогнозирования
  • формирование навыков прогнозирования с помощью машинного обучения
  • приобрести практические навыки построения рекомендательных систем
  • приобрести практические навыки решения задач компьютерного зрения
  • анализ звуковых сигналов, нейросетевые подходы
  • формирование навыков анализа естественного языка
Результат обучения: знание и понимание
  • Владеть методами прогнозирования временных рядов
  • Знать основные метрики качества рекомендательных систем
  • Владеть базовыми методами анализа текстов
Результат обучения: применение знаний и пониманий
  • Уметь интерпретировать модели машинного обучения
  • Уметь планировать и анализировать результаты A/B-тестов
  • Уметь строить рекомендательные системы
  • Уметь решать основные задачи анализа изображений и сигналов
  • Уметь решать сложные задачи анализа текстов (машинный перевод и пр.)
Результат обучения: формирование суждений
  • Формирование суждений о решении сложных задач анализа текстов (машинный перевод и пр.)
  • Формирование суждений о построении рекомендательных систем
  • Интерпретация моделей машинного обучения
Результат обучения: коммуникативные способности
  • развитие и совершенствование коммуникативных способностей студентов;
  • развитие навыков участия в конструктивном диалоге о роли и значимости систем искусственного интеллекта в современном мире, различных направлениях в системах искусственного интеллекта
Результат обучения: навыки обучения или способности к учебе
  • формирование умений в области систем искусственного интеллекта для реализации научно-исследовательских работ
  • выработка навыков построения рекомендательных систем
  • способность содействовать, в рамках академических и профессиональных контекстов, технологическому, социальному или культурному развитию в интересах формирования общества, основанного на знаниях
Методы преподавания

- лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа.

Оценка знаний обучающегося

Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.

Период Вид задания Итого
1  рейтинг ИДЗ №1 0-100
ИДЗ №2
ИДЗ №3
2  рейтинг ИДЗ №4 0-100
ИДЗ №5
ИДЗ №6
Итоговый контроль экзамен 0-100
Политика оценивания результатов обучения по видам работ
Вид задания 90-100 70-89 50-69 0-49
Отлично Хорошо Удовлетворительно Неудовлетворительно
Форма оценки

Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:

  • 40% результата, полученного на экзамене;
  • 60% результатов текущей успеваемости.

Формула подсчета итоговой оценки:

И= 0,6 Р12 +0,4Э
2

 

где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.

Итоговая буквенная оценка и ее цифровой эквивалент в баллах:

Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:

Оценка по буквенной системе Цифровой эквивалент Баллы (%-ное содержание) Оценка по традиционной системе
A 4.0 95-100 Отлично
A- 3.67 90-94
B+ 3.33 85-89 Хорошо
B 3.0 80-84
B- 2.67 75-79
C+ 2.33 70-74
C 2.0 65-69 Удовлетворительно
C- 1.67 60-64
D+ 1.33 55-59
D 1.0 50-54
FX 0.5 25-49 Неудовлетворительно
F 0 0-24
Темы лекционных занятий
  • Методы построения моделей сложных систем
  • Критерии выбора аналитических платформ и пакетов Data Mining
  • Основные этапы моделирования
  • Методика анализа данных
  • Data Mining, KDD и взаимосвязи между ними
  • Аналитическая отчетность и многомерное представление данных
  • Хранилище данных
  • Алгоритмы, получившие наибольшее распространение для каждого типа задач
  • Этапы подготовки данных
  • Выдвижение гипотез
  • Методы сбора и систематизации фактов
  • Методы проведения экспертиз для выявления наиболее значимых факторов
  • Понятия парциальной и комплексной обработки
  • Анализ качества полученных моделей
  • Основные этапы внедрения систем анализа данных
Основная литература
  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2020. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // ЭБС Юрайт [сайт]. — URL: https://urait.ru/bcode/450166 (дата обращения:06.04.2022).
  • Маккинли, Уэс Python и анализ данных / Уэс Маккинли ; перевод А. Слинкина. — 2-е изд. — Саратов : Профобразование, 2019. — 482 c. — ISBN 978-5-4488-0046-7. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/88752.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей
  • Барсегян, А.А., Куприянов М. С. и др. Технологии анализа данных : Data Mining, Visual Mining, Text Minning, OLAP : учеб. - 2-е изд., перераб. и доп. -СПб. : БХВ-Петербург, 2017.
Дополнительная литература
  • Шнарева, Г. В. Анализ данных : учебно-методическое пособие / Г. В. Шнарева, Ж. Г. Пономарева. — Симферополь : Университет экономики и управления, 2019. — 129 c. — ISBN 2227-8397. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/89482.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей
  • Мельниченко, А. С. Математическая статистика и анализ данных : учебное пособие / А. С. Мельниченко. — Москва : Издательский Дом МИСиС, 2018. — 45 c. — ISBN 978-5-906953-62-9. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/78563.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей