Машинное обучение и анализ данных (ИМ) (ИМ)
Описание: Машинное обучение — наука, которая изучает методы поиска скрытых зависимостей в массивах данных. Эти методы всё активнее используются как в различных областях науки (в физике, экономике, журналистике, социальных науках и т.д.), так и во многих индустриальных областях. Обнаружение спама, распознавание объекта с помощью классического математического моделирования.
Количество кредитов: 5
Пререквизиты:
- Система управления базами данных
Трудоемкость дисциплины:
| Виды работ | часы |
|---|---|
| Лекции | 15 |
| Практические работы | |
| Лабораторные работы | 30 |
| СРОП | 30 |
| СРО | 75 |
| Форма итогового контроля | экзамен |
| Форма проведения итогового контроля |
Компонент: Компонент по выбору
Цикл: Профилирующие дисциплины
Цель
- Курс направлен на формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Задача
- Формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных
Результат обучения: знание и понимание
- изучить основные алгоритмы машинного обучения
Результат обучения: применение знаний и пониманий
- применять на практике алгоритмы машинного обучения
Результат обучения: формирование суждений
- формовать суждения о применение алгоритмов машинного обучения на различных практических задач
Результат обучения: коммуникативные способности
- развитие и совершенствование коммуникативных способностей студентов
Результат обучения: навыки обучения или способности к учебе
- Способностью собирать, обрабатывать и интерпретировать данные современных научных исследований, необходимые для формирования выводов по соответствующим научным исследованиям
Методы преподавания
лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа
Оценка знаний обучающегося
Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.
| Период | Вид задания | Итого |
|---|---|---|
| 1 рейтинг | Лабораторная работа №1 | 0-100 |
| Лабораторная работа №2 | ||
| Лабораторная работа №3 | ||
| 2 рейтинг | Лабораторная работа №4 | 0-100 |
| Лабораторная работа №5 | ||
| Лабораторная работа №6 | ||
| Итоговый контроль | экзамен | 0-100 |
Политика оценивания результатов обучения по видам работ
| Вид задания | 90-100 | 70-89 | 50-69 | 0-49 |
|---|---|---|---|---|
| Отлично | Хорошо | Удовлетворительно | Неудовлетворительно |
Форма оценки
Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:
- 40% результата, полученного на экзамене;
- 60% результатов текущей успеваемости.
Формула подсчета итоговой оценки:
| И= 0,6 | Р1+Р2 | +0,4Э |
| 2 |
где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.
Итоговая буквенная оценка и ее цифровой эквивалент в баллах:
Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:
| Оценка по буквенной системе | Цифровой эквивалент | Баллы (%-ное содержание) | Оценка по традиционной системе |
|---|---|---|---|
| A | 4.0 | 95-100 | Отлично |
| A- | 3.67 | 90-94 | |
| B+ | 3.33 | 85-89 | Хорошо |
| B | 3.0 | 80-84 | |
| B- | 2.67 | 75-79 | |
| C+ | 2.33 | 70-74 | |
| C | 2.0 | 65-69 | Удовлетворительно |
| C- | 1.67 | 60-64 | |
| D+ | 1.33 | 55-59 | |
| D | 1.0 | 50-54 | |
| FX | 0.5 | 25-49 | Неудовлетворительно |
| F | 0 | 0-24 |
Темы лекционных занятий
- Предмет и задачи машинного обучения и анализа данных
- Основные принципы, задачи и подходы, использование в различных областях науки и индустрии
- Основные этапы эволюции алгоритмов машинного обучения
- Общий вид метрического классификатора
- Алгоритм K ближайших соседей
- Алгоритмы кластеризации с фиксированным количеством кластеров
- Иерархическая кластеризация
- Правила и анализ качества (точность, полнота)
- Алгоритм построения деревьев решений
- Перцептрон и разделяющая гиперплоскость
- Логистическая регрессия
- Нейронные сети и алгоритм обратного распространения градиента
- Линейная регрессия
- Голосование
- Монте-Карло поиск
Основная литература
- Андреас, Мюллер Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными / Мюллер Андреас. - М.: Альфа-книга, 2017. - 487 c.
- Себастьян, Рашка Python и машинное обучение / Рашка Себастьян. - М.: ДМК Пресс, 2017. - 614 c.
- Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2017. — 336 с
- Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2016. — 498 с.
Дополнительная литература
- Плас, Джейк Вандер Python для сложных задач. Наука о данных и машинное обучение. Руководство / Плас Джейк Вандер. - М.: Питер, 2018. - 759 c.
- Макшанов А.В. Технологии интеллектуального анализа данных. — М.: Лань. 2019. 212 с.
- Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс / В. Рафалович. — М.: SmartBook, 2018. — 352 c.