Машинное обучение и анализ данных
内容描述: Дисциплина посвящена изучению алгоритмов, моделей и методов машинного обучения и способов их применения для решения практических задач; обработки и анализа больших данных; основ построения моделей и алгоритмов решения и оценки точности решения задач методами машинного обучения. Рассматриваются программные средства, современные языки программирования и библиотеки для анализа реальных наборов данных.
贷款数: 6
Пререквизиты:
- Линейные системы автоматического регулирования
*СomplexityDiscipline(zh-CN)*:
*TypesOfClasses(zh-CN)* | *hours(zh-CN)* |
---|---|
*Lectures(zh-CN)* | 30 |
*PracticalWork(zh-CN)* | |
*LaboratoryWork(zh-CN)* | 30 |
*srop(zh-CN)* | 30 |
*sro(zh-CN)* | 90 |
*FormOfFinalControl(zh-CN)* | экзамен |
*FinalAssessment(zh-CN)* | устный экзамен |
零件: Вузовский компонент
循环次数: Профилирующие дисциплины
Цель
- изучение современных методов и инструментов машинного обучения и анализа данных для решения конкретных задач в области построения автоматизированных и интеллектуальных систем управления техническими объектами.
Задача
- формирование целостного представления о методах машинного обучения для обработки и анализа больших данных;
- овладение умениями разработки программ на языках Python и MatLab, реализующих алгоритмы машинного обучения;
- овладение моделями и методами интеллектуального анализа данных и машинного обучения в задачах поиска информации, обработки и анализа данных;
- приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Результат обучения: знание и понимание
- показывать знания математических основ теории машинного обучения, основные классы алгоритмов машинного обучения.
Результат обучения: применение знаний и пониманий
- выбирать наиболее подходящие алгоритмы решения задач машинного обучения и оценивать качество построенных моделей
- применять методы интеллектуального анализа данных и машинного обучения в задачах поиска информации, обработки и анализа данных систем автоматизации техническими объектами
Результат обучения: формирование суждений
- анализировать, выделять особенности и комбинировать методы машинного обучения;
Результат обучения: коммуникативные способности
- сообщать тенденции в области автоматизации производственных систем, перспективные направления и возможности практического применения, как специалистам, так и не специалистам;
Результат обучения: навыки обучения или способности к учебе
- демонстрировать навыки исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
*TeachingMethods(zh-CN)*
технологии учебно-исследовательской деятельности
информационно-коммуникационные технологии
модульная технология обучения
*AssessmentKnowledge(zh-CN)*
Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.
*Period2(zh-CN)* | *TypeOfTask(zh-CN)* | *Total(zh-CN)* |
---|---|---|
1 *Rating(zh-CN)* | Лабораторная работа "Метрики качества задач классификации" | 0-100 |
Лабораторная работа "Метрики качества задач классификации" | ||
Лабораторная работа "Функции ошибок в машинном обучении" | ||
Лабораторная работа "Алгоритмы кластеризации" | ||
Рубежный контроль 1 | ||
2 *Rating(zh-CN)* | Лабораторная работа "Введение в обработку естественного языка" | 0-100 |
Лабораторная работа "Методы оптимизации в глубоком обучении" | ||
Лабораторная работа "Свёрточные сети и работа с изображениями" | ||
Лабораторная работа "Анализ и предсказание временных рядов" | ||
Рубежный контроль 2 | ||
*TotalControl(zh-CN)* | экзамен | 0-100 |
*PolicyAssignmentTask(zh-CN)*
*TypeOfTask(zh-CN)* | 90-100 | 70-89 | 50-69 | 0-49 |
---|---|---|---|---|
Excellent | *Grade4(zh-CN)* | *Grade3(zh-CN)* | *Grade2(zh-CN)* | |
Работа на лабораторных занятиях | Проявлена превосходная теоретическая подготовка. Необходимые навыки и умения полностью освоены. Результат лабораторной работы полностью соответствует её целям. | Проявлена хорошая теоретическая подготовка. Необходимые навыки и умения в основном освоены. Результат лабораторной работы в основном соответствует её целям. | Проявлена удовлетворительная теоретическая подготовка. Необходимые навыки и умения частично освоены. Результат лабораторной работы частично соответствует её целям. | Проявлена неудовлетворительная теоретическая подготовка. Необходимые навыки и умения не своены. Результат лабораторной работы не соответствует её целям. |
Собеседование по контрольным вопросам | В ответе качественно раскрыто содержание темы. Ответ хорошо структурирован. Прекрасно освоен понятийный аппарат. Продемонстрирован высокий уровень понимания материала. Превосходное умение формулировать свои мысли, обсуждать дискуссионные положения. | Основные вопросы темы раскрыты. Структура ответа в целом адекватна теме. Хорошо освоен понятийный аппарат. Продемонстрирован хороший уровень понимания материала. Хорошее умение формулировать свои мысли, обсуждать дискуссионные положения. | ема частично раскрыта. Ответ слабо структурирован. Понятийный аппарат освоен частично. Понимание отдельных положений из материала по теме. Удовлетворительное умение формулировать свои мысли, обсуждать дискуссионные положения. | Тема не раскрыта. Понятийный аппарат освоен неудовлетворительно. Понимание материала фрагментарное или отсутствует. Неумение формулировать свои мысли, обсуждать дискуссионные положения. |
*EvaluationForm(zh-CN)*
Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:
- 40% результата, полученного на экзамене;
- 60% результатов текущей успеваемости.
Формула подсчета итоговой оценки:
И= 0,6 | Р1+Р2 | +0,4Э |
2 |
где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.
Итоговая буквенная оценка и ее цифровой эквивалент в баллах:
Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:
Оценка по буквенной системе | Цифровой эквивалент | Баллы (%-ное содержание) | Оценка по традиционной системе |
---|---|---|---|
A | 4.0 | 95-100 | Отлично |
A- | 3.67 | 90-94 | |
B+ | 3.33 | 85-89 | Хорошо |
B | 3.0 | 80-84 | |
B- | 2.67 | 75-79 | |
C+ | 2.33 | 70-74 | |
C | 2.0 | 65-69 | Удовлетворительно |
C- | 1.67 | 60-64 | |
D+ | 1.33 | 55-59 | |
D | 1.0 | 50-54 | |
FX | 0.5 | 25-49 | Неудовлетворительно |
F | 0 | 0-24 |
Темы лекционных занятий
- Введение в теорию и практику машинного обучения. Что такое машинное обучение. Области науки о данных. Сферы применения машинного обучения. Этапы машинного обучения.
- Задачи машинного обучения. Пространство признаков. Формальное определение понятия «обучение». Общий алгоритм машинного обучения. Типы задач машинного обучения.
- Способы обучения и оценки его качества. Типы обучения. Как работает обучение с учителем. Почему модель способна работать с новыми данными.
- Типовые задачи при подготовке данных и обучении моделей. Учет пропусков. Кодирование нечисловых признаков. Приведение данных к единому масштабу и стандартизация. Разметка данных. Переобучение
- Математическое обеспечение теории машинного обучения. Обозначения. Случайная величина. Несмещенные оценки. Правило Байеса. Оценка параметров. Параметры и гиперпараметры. Классификация и регрессия. Обучение на основе моделей и на основе примеров. Поверхностное и глубокое обучение
- Модели и методы машинного обучения. Методы теории вероятностей. Статистические модели и методы.
- Фундаментальные алгоритмы. Линейная регрессия. Логистическая регрессия. Обучение дерева решений. Метод опорных векторов. Метод k ближайших соседей.
- Анатомия алгоритмов обучения. Строительные блоки алгоритмов обучения. Градиентный спуск. Особенности алгоритмов обучения.
- Проектирование признаков, переобучение и настройка гиперпараметров. Проектирование признаков. Выбор алгоритма обучения. Три набора. Недообучение и переобучение. Регуляризация. Оценка эффективности модели. Настройка гиперпараметров.
- Модели и методы нечеткой логики. Нечеткие системы. Нечеткая логика в анализе временных рядов. Метод моделирования нечетких временных рядов. Пример моделирования временного ряда в нечетком подходе. Извлечение знаний из временных рядов. Нечеткое сглаживание временного ряда. Нечеткая регрессия.
- Нейронные сети и глубокое обучение. Особенности нейронных сетей. Определение модели искусственной нейронной сети. Первая формальная модель и первая реализация нейронной сети. Многослойный персептрон. Сверточные. Карты. Рекуррентные сети. Самоорганизующиеся карты. Автокодировщики. Импульсные сети. Причины бурного развития ИНС сегодня. Борьба с переобучением в ИНС. Обратное распространение ошибки. Нечеткие нейронные сети.
- Проблемы и решения обучения моделей. Ядерная регрессия. Многоклассовая классификация. Одноклассовая классификация. Классификация с многими метками. Обучение ансамбля. Обучение маркировке последовательностей. Обучение преобразованию последовательностей в последовательности. Активное обучение. Обучение с частичным привлечением учителя. Обучение с первого раза. Обучение без подготовки.
- Продвинутые методики. Работа с несбалансированными наборами данных. Объединение моделей. Обучение нейронных сетей. Продвинутая регуляризация. Обработка нескольких входов. Обработка нескольких выходов. Перенос обучения. Эффективность алгоритмов.
- Обучение без учителя. Оценка плотности. Кластеризация. Сокращение размерности. Обнаружение аномалий
- Разработка приложений в сфере машинного обучения. Архитектура системы машинного обучения. Аппаратная и программная составляющая. Алгоритм создания системы машинного обучения.
Основная литература
- Бурков А. Машинное обучение без лишних слов. - СПб.: Питер, 2020. — 192 с.
- Основы машинного обучения : учебное пособие / О.В. Лимановская, Т.И. Алферьева ; Мин-во науки и высш. образования РФ.— Екатеринбург : Изд-во Урал. ун-та, 2020. — 88 с.
- Гладилин П.Е., Боченина К.О., Технологии машинного обучения– СПб: Университет ИТМО, 2020. – 75 с.
Дополнительная литература
- Теория и практика машинного обучения : учебное пособие / В. В. Воронина, А. В. Михеев, Н. Г. Ярушкина, К. В. Святов. – Ульяновск : УлГТУ, 2017. – 290 с.
- Mehryar Mohri, Afshin Rostamizadeh, Ameet Talwalkar. Foundations of Machine Learning. - MIT Press, 2018. – 504с.