Машинное обучение и анализ данных (ИМ) (ИМ)
内容描述: Машинное обучение — наука, которая изучает методы поиска скрытых зависимостей в массивах данных. Эти методы всё активнее используются как в различных областях науки (в физике, экономике, журналистике, социальных науках и т.д.), так и во многих индустриальных областях. Обнаружение спама, распознавание объекта с помощью классического математического моделирования.
贷款数: 5
Пререквизиты:
- Система управления базами данных
*СomplexityDiscipline(zh-CN)*:
*TypesOfClasses(zh-CN)* | *hours(zh-CN)* |
---|---|
*Lectures(zh-CN)* | 15 |
*PracticalWork(zh-CN)* | |
*LaboratoryWork(zh-CN)* | 30 |
*srop(zh-CN)* | 30 |
*sro(zh-CN)* | 75 |
*FormOfFinalControl(zh-CN)* | экзамен |
*FinalAssessment(zh-CN)* |
零件: Компонент по выбору
循环次数: Профилирующие дисциплины
Цель
- Курс направлен на формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Задача
- Формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных
Результат обучения: знание и понимание
- изучить основные алгоритмы машинного обучения
Результат обучения: применение знаний и пониманий
- применять на практике алгоритмы машинного обучения
Результат обучения: формирование суждений
- формовать суждения о применение алгоритмов машинного обучения на различных практических задач
Результат обучения: коммуникативные способности
- развитие и совершенствование коммуникативных способностей студентов
Результат обучения: навыки обучения или способности к учебе
- Способностью собирать, обрабатывать и интерпретировать данные современных научных исследований, необходимые для формирования выводов по соответствующим научным исследованиям
*TeachingMethods(zh-CN)*
лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа
*AssessmentKnowledge(zh-CN)*
Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.
*Period2(zh-CN)* | *TypeOfTask(zh-CN)* | *Total(zh-CN)* |
---|---|---|
1 *Rating(zh-CN)* | Лабораторная работа №1 | 0-100 |
Лабораторная работа №2 | ||
Лабораторная работа №3 | ||
2 *Rating(zh-CN)* | Лабораторная работа №4 | 0-100 |
Лабораторная работа №5 | ||
Лабораторная работа №6 | ||
*TotalControl(zh-CN)* | экзамен | 0-100 |
*PolicyAssignmentTask(zh-CN)*
*TypeOfTask(zh-CN)* | 90-100 | 70-89 | 50-69 | 0-49 |
---|---|---|---|---|
Excellent | *Grade4(zh-CN)* | *Grade3(zh-CN)* | *Grade2(zh-CN)* |
*EvaluationForm(zh-CN)*
Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:
- 40% результата, полученного на экзамене;
- 60% результатов текущей успеваемости.
Формула подсчета итоговой оценки:
И= 0,6 | Р1+Р2 | +0,4Э |
2 |
где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.
Итоговая буквенная оценка и ее цифровой эквивалент в баллах:
Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:
Оценка по буквенной системе | Цифровой эквивалент | Баллы (%-ное содержание) | Оценка по традиционной системе |
---|---|---|---|
A | 4.0 | 95-100 | Отлично |
A- | 3.67 | 90-94 | |
B+ | 3.33 | 85-89 | Хорошо |
B | 3.0 | 80-84 | |
B- | 2.67 | 75-79 | |
C+ | 2.33 | 70-74 | |
C | 2.0 | 65-69 | Удовлетворительно |
C- | 1.67 | 60-64 | |
D+ | 1.33 | 55-59 | |
D | 1.0 | 50-54 | |
FX | 0.5 | 25-49 | Неудовлетворительно |
F | 0 | 0-24 |
Темы лекционных занятий
- Предмет и задачи машинного обучения и анализа данных
- Основные принципы, задачи и подходы, использование в различных областях науки и индустрии
- Основные этапы эволюции алгоритмов машинного обучения
- Общий вид метрического классификатора
- Алгоритм K ближайших соседей. Алгоритмы отбора эталонов
- Алгоритмы кластеризации с фиксированным количеством кластеров. Алгоритмы кластеризации по плотности
- Иерархическая кластеризация
- Правила и анализ качества (точность, полнота). Анализ с помощью ROC кривой
- Алгоритм построения деревьев решений. Критерий информационного выигрыша и критерий Джини. Леса решающих деревьев
- Перцептрон и разделяющая гиперплоскость. Переход в пространство повышенной размерности. Метод опорных векторов.
- Логистическая регрессия. Градиентный спуск
- Нейронные сети и алгоритм обратного распространения градиента. Глубокое обучение, свертки и пулинг.
- Линейная регрессия. Полиномиальная регрессия. Смещение и дисперсия. Гребневая регрессия
- Голосование. Бутстраппинг. Бустинг, адаптивный бустинг, градиентный бустинг
- Монте-Карло поиск. Алгоритм симулированного отжига. Генетический алгоритм
Основная литература
- Андреас, Мюллер Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными / Мюллер Андреас. - М.: Альфа-книга, 2017. - 487 c.
- Себастьян, Рашка Python и машинное обучение / Рашка Себастьян. - М.: ДМК Пресс, 2017. - 614 c.
- Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2017. — 336 с
- Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2016. — 498 с.
Дополнительная литература
- Плас, Джейк Вандер Python для сложных задач. Наука о данных и машинное обучение. Руководство / Плас Джейк Вандер. - М.: Питер, 2018. - 759 c.
- Макшанов А.В. Технологии интеллектуального анализа данных. — М.: Лань. 2019. 212 с.
- Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс / В. Рафалович. — М.: SmartBook, 2018. — 352 c.