Машинное обучение и анализ данных (ИМ) (ИМ)

Бакланова Ольга Евгеньевна

*InstructorProfile(zh-CN)*

内容描述: Машинное обучение — наука, которая изучает методы поиска скрытых зависимостей в массивах данных. Эти методы всё активнее используются как в различных областях науки (в физике, экономике, журналистике, социальных науках и т.д.), так и во многих индустриальных областях. Обнаружение спама, распознавание объекта с помощью классического математического моделирования.

贷款数: 5

Пререквизиты:

  • Система управления базами данных

*СomplexityDiscipline(zh-CN)*:

*TypesOfClasses(zh-CN)* *hours(zh-CN)*
*Lectures(zh-CN)* 15
*PracticalWork(zh-CN)*
*LaboratoryWork(zh-CN)* 30
*srop(zh-CN)* 30
*sro(zh-CN)* 75
*FormOfFinalControl(zh-CN)* экзамен
*FinalAssessment(zh-CN)*

零件: Компонент по выбору

循环次数: Профилирующие дисциплины

Цель
  • Курс направлен на формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Задача
  • Формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных
Результат обучения: знание и понимание
  • изучить основные алгоритмы машинного обучения
Результат обучения: применение знаний и пониманий
  • применять на практике алгоритмы машинного обучения
Результат обучения: формирование суждений
  • формовать суждения о применение алгоритмов машинного обучения на различных практических задач
Результат обучения: коммуникативные способности
  • развитие и совершенствование коммуникативных способностей студентов
Результат обучения: навыки обучения или способности к учебе
  • Способностью собирать, обрабатывать и интерпретировать данные современных научных исследований, необходимые для формирования выводов по соответствующим научным исследованиям
*TeachingMethods(zh-CN)*

лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа

*AssessmentKnowledge(zh-CN)*

Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.

*Period2(zh-CN)* *TypeOfTask(zh-CN)* *Total(zh-CN)*
1  *Rating(zh-CN)* Лабораторная работа №1 0-100
Лабораторная работа №2
Лабораторная работа №3
2  *Rating(zh-CN)* Лабораторная работа №4 0-100
Лабораторная работа №5
Лабораторная работа №6
*TotalControl(zh-CN)* экзамен 0-100
*PolicyAssignmentTask(zh-CN)*
*TypeOfTask(zh-CN)* 90-100 70-89 50-69 0-49
Excellent *Grade4(zh-CN)* *Grade3(zh-CN)* *Grade2(zh-CN)*
*EvaluationForm(zh-CN)*

Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:

  • 40% результата, полученного на экзамене;
  • 60% результатов текущей успеваемости.

Формула подсчета итоговой оценки:

И= 0,6 Р12 +0,4Э
2

 

где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.

Итоговая буквенная оценка и ее цифровой эквивалент в баллах:

Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:

Оценка по буквенной системе Цифровой эквивалент Баллы (%-ное содержание) Оценка по традиционной системе
A 4.0 95-100 Отлично
A- 3.67 90-94
B+ 3.33 85-89 Хорошо
B 3.0 80-84
B- 2.67 75-79
C+ 2.33 70-74
C 2.0 65-69 Удовлетворительно
C- 1.67 60-64
D+ 1.33 55-59
D 1.0 50-54
FX 0.5 25-49 Неудовлетворительно
F 0 0-24
Темы лекционных занятий
  • Предмет и задачи машинного обучения и анализа данных
  • Основные принципы, задачи и подходы, использование в различных областях науки и индустрии
  • Основные этапы эволюции алгоритмов машинного обучения
  • Общий вид метрического классификатора
  • Алгоритм K ближайших соседей. Алгоритмы отбора эталонов
  • Алгоритмы кластеризации с фиксированным количеством кластеров. Алгоритмы кластеризации по плотности
  • Иерархическая кластеризация
  • Правила и анализ качества (точность, полнота). Анализ с помощью ROC кривой
  • Алгоритм построения деревьев решений. Критерий информационного выигрыша и критерий Джини. Леса решающих деревьев
  • Перцептрон и разделяющая гиперплоскость. Переход в пространство повышенной размерности. Метод опорных векторов.
  • Логистическая регрессия. Градиентный спуск
  • Нейронные сети и алгоритм обратного распространения градиента. Глубокое обучение, свертки и пулинг.
  • Линейная регрессия. Полиномиальная регрессия. Смещение и дисперсия. Гребневая регрессия
  • Голосование. Бутстраппинг. Бустинг, адаптивный бустинг, градиентный бустинг
  • Монте-Карло поиск. Алгоритм симулированного отжига. Генетический алгоритм
Основная литература
  • Андреас, Мюллер Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными / Мюллер Андреас. - М.: Альфа-книга, 2017. - 487 c.
  • Себастьян, Рашка Python и машинное обучение / Рашка Себастьян. - М.: ДМК Пресс, 2017. - 614 c.
  • Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2017. — 336 с
  • Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2016. — 498 с.
Дополнительная литература
  • Плас, Джейк Вандер Python для сложных задач. Наука о данных и машинное обучение. Руководство / Плас Джейк Вандер. - М.: Питер, 2018. - 759 c.
  • Макшанов А.В. Технологии интеллектуального анализа данных. — М.: Лань. 2019. 212 с.
  • Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс / В. Рафалович. — М.: SmartBook, 2018. — 352 c.