Машинное обучение и анализ данных (ИМ) (ИМ)

Бакланова Ольга Евгеньевна

Портфолио преподавателя

Описание: Машинное обучение — наука, которая изучает методы поиска скрытых зависимостей в массивах данных. Эти методы всё активнее используются как в различных областях науки (в физике, экономике, журналистике, социальных науках и т.д.), так и во многих индустриальных областях. Обнаружение спама, распознавание объекта с помощью классического математического моделирования.

Количество кредитов: 5

Пререквизиты:

  • Система управления базами данных

Трудоемкость дисциплины:

Виды работ часы
Лекции 15
Практические работы
Лабораторные работы 30
СРОП 30
СРО 75
Форма итогового контроля экзамен
Форма проведения итогового контроля

Компонент: Компонент по выбору

Цикл: Профилирующие дисциплины

Цель
  • Курс направлен на формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Задача
  • Формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных
Результат обучения: знание и понимание
  • изучить основные алгоритмы машинного обучения
Результат обучения: применение знаний и пониманий
  • применять на практике алгоритмы машинного обучения
Результат обучения: формирование суждений
  • формовать суждения о применение алгоритмов машинного обучения на различных практических задач
Результат обучения: коммуникативные способности
  • развитие и совершенствование коммуникативных способностей студентов
Результат обучения: навыки обучения или способности к учебе
  • Способностью собирать, обрабатывать и интерпретировать данные современных научных исследований, необходимые для формирования выводов по соответствующим научным исследованиям
Методы преподавания

лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа

Оценка знаний обучающегося

Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.

Период Вид задания Итого
1  рейтинг Лабораторная работа №1 0-100
Лабораторная работа №2
Лабораторная работа №3
2  рейтинг Лабораторная работа №4 0-100
Лабораторная работа №5
Лабораторная работа №6
Итоговый контроль экзамен 0-100
Политика оценивания результатов обучения по видам работ
Вид задания 90-100 70-89 50-69 0-49
Отлично Хорошо Удовлетворительно Неудовлетворительно
Форма оценки

Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:

  • 40% результата, полученного на экзамене;
  • 60% результатов текущей успеваемости.

Формула подсчета итоговой оценки:

И= 0,6 Р12 +0,4Э
2

 

где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.

Итоговая буквенная оценка и ее цифровой эквивалент в баллах:

Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:

Оценка по буквенной системе Цифровой эквивалент Баллы (%-ное содержание) Оценка по традиционной системе
A 4.0 95-100 Отлично
A- 3.67 90-94
B+ 3.33 85-89 Хорошо
B 3.0 80-84
B- 2.67 75-79
C+ 2.33 70-74
C 2.0 65-69 Удовлетворительно
C- 1.67 60-64
D+ 1.33 55-59
D 1.0 50-54
FX 0.5 25-49 Неудовлетворительно
F 0 0-24
Темы лекционных занятий
  • Предмет и задачи машинного обучения и анализа данных
  • Основные принципы, задачи и подходы, использование в различных областях науки и индустрии
  • Основные этапы эволюции алгоритмов машинного обучения
  • Общий вид метрического классификатора
  • Алгоритм K ближайших соседей
  • Алгоритмы кластеризации с фиксированным количеством кластеров
  • Иерархическая кластеризация
  • Правила и анализ качества (точность, полнота)
  • Алгоритм построения деревьев решений
  • Перцептрон и разделяющая гиперплоскость
  • Логистическая регрессия
  • Нейронные сети и алгоритм обратного распространения градиента
  • Линейная регрессия
  • Голосование
  • Монте-Карло поиск
Основная литература
  • Андреас, Мюллер Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными / Мюллер Андреас. - М.: Альфа-книга, 2017. - 487 c.
  • Себастьян, Рашка Python и машинное обучение / Рашка Себастьян. - М.: ДМК Пресс, 2017. - 614 c.
  • Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2017. — 336 с
  • Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2016. — 498 с.
Дополнительная литература
  • Плас, Джейк Вандер Python для сложных задач. Наука о данных и машинное обучение. Руководство / Плас Джейк Вандер. - М.: Питер, 2018. - 759 c.
  • Макшанов А.В. Технологии интеллектуального анализа данных. — М.: Лань. 2019. 212 с.
  • Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс / В. Рафалович. — М.: SmartBook, 2018. — 352 c.