Машинное обучение и анализ данных

Григорьева Светлана Владимировна

*InstructorProfile(zh-CN)*

内容描述: Дисциплина посвящена изучению алгоритмов, моделей и методов машинного обучения и способов их применения для решения практических задач; обработки и анализа больших данных; основ построения моделей и алгоритмов решения и оценки точности решения задач методами машинного обучения. Рассматриваются программные средства, современные языки программирования и библиотеки для анализа реальных наборов данных.

贷款数: 6

Пререквизиты:

  • Линейные системы автоматического регулирования

*СomplexityDiscipline(zh-CN)*:

*TypesOfClasses(zh-CN)* *hours(zh-CN)*
*Lectures(zh-CN)* 30
*PracticalWork(zh-CN)*
*LaboratoryWork(zh-CN)* 30
*srop(zh-CN)* 30
*sro(zh-CN)* 90
*FormOfFinalControl(zh-CN)* экзамен
*FinalAssessment(zh-CN)* устный экзамен

零件: Вузовский компонент

循环次数: Профилирующие дисциплины

Цель
  • изучение современных методов и инструментов машинного обучения и анализа данных для решения конкретных задач в области построения автоматизированных и интеллектуальных систем управления техническими объектами.
Задача
  • формирование целостного представления о методах машинного обучения для обработки и анализа больших данных;
  • овладение умениями разработки программ на языках Python и MatLab, реализующих алгоритмы машинного обучения;
  • овладение моделями и методами интеллектуального анализа данных и машинного обучения в задачах поиска информации, обработки и анализа данных;
  • приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Результат обучения: знание и понимание
  • показывать знания математических основ теории машинного обучения, основные классы алгоритмов машинного обучения.
Результат обучения: применение знаний и пониманий
  • выбирать наиболее подходящие алгоритмы решения задач машинного обучения и оценивать качество построенных моделей
  • применять методы интеллектуального анализа данных и машинного обучения в задачах поиска информации, обработки и анализа данных систем автоматизации техническими объектами
Результат обучения: формирование суждений
  • анализировать, выделять особенности и комбинировать методы машинного обучения;
Результат обучения: коммуникативные способности
  • сообщать тенденции в области автоматизации производственных систем, перспективные направления и возможности практического применения, как специалистам, так и не специалистам;
Результат обучения: навыки обучения или способности к учебе
  • демонстрировать навыки исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
*TeachingMethods(zh-CN)*

технологии учебно-исследовательской деятельности

информационно-коммуникационные технологии

модульная технология обучения

*AssessmentKnowledge(zh-CN)*

Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.

*Period2(zh-CN)* *TypeOfTask(zh-CN)* *Total(zh-CN)*
1  *Rating(zh-CN)* Лабораторная работа "Метрики качества задач классификации" 0-100
Лабораторная работа "Метрики качества задач классификации"
Лабораторная работа "Функции ошибок в машинном обучении"
Лабораторная работа "Алгоритмы кластеризации"
Рубежный контроль 1
2  *Rating(zh-CN)* Лабораторная работа "Введение в обработку естественного языка" 0-100
Лабораторная работа "Методы оптимизации в глубоком обучении"
Лабораторная работа "Свёрточные сети и работа с изображениями"
Лабораторная работа "Анализ и предсказание временных рядов"
Рубежный контроль 2
*TotalControl(zh-CN)* экзамен 0-100
*PolicyAssignmentTask(zh-CN)*
*TypeOfTask(zh-CN)* 90-100 70-89 50-69 0-49
Excellent *Grade4(zh-CN)* *Grade3(zh-CN)* *Grade2(zh-CN)*
Работа на лабораторных занятиях Проявлена превосходная теоретическая подготовка. Необходимые навыки и умения полностью освоены. Результат лабораторной работы полностью соответствует её целям. Проявлена хорошая теоретическая подготовка. Необходимые навыки и умения в основном освоены. Результат лабораторной работы в основном соответствует её целям. Проявлена удовлетворительная теоретическая подготовка. Необходимые навыки и умения частично освоены. Результат лабораторной работы частично соответствует её целям. Проявлена неудовлетворительная теоретическая подготовка. Необходимые навыки и умения не своены. Результат лабораторной работы не соответствует её целям.
Собеседование по контрольным вопросам В ответе качественно раскрыто содержание темы. Ответ хорошо структурирован. Прекрасно освоен понятийный аппарат. Продемонстрирован высокий уровень понимания материала. Превосходное умение формулировать свои мысли, обсуждать дискуссионные положения. Основные вопросы темы раскрыты. Структура ответа в целом адекватна теме. Хорошо освоен понятийный аппарат. Продемонстрирован хороший уровень понимания материала. Хорошее умение формулировать свои мысли, обсуждать дискуссионные положения. ема частично раскрыта. Ответ слабо структурирован. Понятийный аппарат освоен частично. Понимание отдельных положений из материала по теме. Удовлетворительное умение формулировать свои мысли, обсуждать дискуссионные положения. Тема не раскрыта. Понятийный аппарат освоен неудовлетворительно. Понимание материала фрагментарное или отсутствует. Неумение формулировать свои мысли, обсуждать дискуссионные положения.
*EvaluationForm(zh-CN)*

Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:

  • 40% результата, полученного на экзамене;
  • 60% результатов текущей успеваемости.

Формула подсчета итоговой оценки:

И= 0,6 Р12 +0,4Э
2

 

где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.

Итоговая буквенная оценка и ее цифровой эквивалент в баллах:

Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:

Оценка по буквенной системе Цифровой эквивалент Баллы (%-ное содержание) Оценка по традиционной системе
A 4.0 95-100 Отлично
A- 3.67 90-94
B+ 3.33 85-89 Хорошо
B 3.0 80-84
B- 2.67 75-79
C+ 2.33 70-74
C 2.0 65-69 Удовлетворительно
C- 1.67 60-64
D+ 1.33 55-59
D 1.0 50-54
FX 0.5 25-49 Неудовлетворительно
F 0 0-24
Темы лекционных занятий
  • Введение в теорию и практику машинного обучения. Что такое машинное обучение. Области науки о данных. Сферы применения машинного обучения. Этапы машинного обучения.
  • Задачи машинного обучения. Пространство признаков. Формальное определение понятия «обучение». Общий алгоритм машинного обучения. Типы задач машинного обучения.
  • Способы обучения и оценки его качества. Типы обучения. Как работает обучение с учителем. Почему модель способна работать с новыми данными.
  • Типовые задачи при подготовке данных и обучении моделей. Учет пропусков. Кодирование нечисловых признаков. Приведение данных к единому масштабу и стандартизация. Разметка данных. Переобучение
  • Математическое обеспечение теории машинного обучения. Обозначения. Случайная величина. Несмещенные оценки. Правило Байеса. Оценка параметров. Параметры и гиперпараметры. Классификация и регрессия. Обучение на основе моделей и на основе примеров. Поверхностное и глубокое обучение
  • Модели и методы машинного обучения. Методы теории вероятностей. Статистические модели и методы.
  • Фундаментальные алгоритмы. Линейная регрессия. Логистическая регрессия. Обучение дерева решений. Метод опорных векторов. Метод k ближайших соседей.
  • Анатомия алгоритмов обучения. Строительные блоки алгоритмов обучения. Градиентный спуск. Особенности алгоритмов обучения.
  • Проектирование признаков, переобучение и настройка гиперпараметров. Проектирование признаков. Выбор алгоритма обучения. Три набора. Недообучение и переобучение. Регуляризация. Оценка эффективности модели. Настройка гиперпараметров.
  • Модели и методы нечеткой логики. Нечеткие системы. Нечеткая логика в анализе временных рядов. Метод моделирования нечетких временных рядов. Пример моделирования временного ряда в нечетком подходе. Извлечение знаний из временных рядов. Нечеткое сглаживание временного ряда. Нечеткая регрессия.
  • Нейронные сети и глубокое обучение. Особенности нейронных сетей. Определение модели искусственной нейронной сети. Первая формальная модель и первая реализация нейронной сети. Многослойный персептрон. Сверточные. Карты. Рекуррентные сети. Самоорганизующиеся карты. Автокодировщики. Импульсные сети. Причины бурного развития ИНС сегодня. Борьба с переобучением в ИНС. Обратное распространение ошибки. Нечеткие нейронные сети.
  • Проблемы и решения обучения моделей. Ядерная регрессия. Многоклассовая классификация. Одноклассовая классификация. Классификация с многими метками. Обучение ансамбля. Обучение маркировке последовательностей. Обучение преобразованию последовательностей в последовательности. Активное обучение. Обучение с частичным привлечением учителя. Обучение с первого раза. Обучение без подготовки.
  • Продвинутые методики. Работа с несбалансированными наборами данных. Объединение моделей. Обучение нейронных сетей. Продвинутая регуляризация. Обработка нескольких входов. Обработка нескольких выходов. Перенос обучения. Эффективность алгоритмов.
  • Обучение без учителя. Оценка плотности. Кластеризация. Сокращение размерности. Обнаружение аномалий
  • Разработка приложений в сфере машинного обучения. Архитектура системы машинного обучения. Аппаратная и программная составляющая. Алгоритм создания системы машинного обучения.
Основная литература
  • Бурков А. Машинное обучение без лишних слов. - СПб.: Питер, 2020. — 192 с.
  • Основы машинного обучения : учебное пособие / О.В. Лимановская, Т.И. Алферьева ; Мин-во науки и высш. образования РФ.— Екатеринбург : Изд-во Урал. ун-та, 2020. — 88 с.
  • Гладилин П.Е., Боченина К.О., Технологии машинного обучения– СПб: Университет ИТМО, 2020. – 75 с.
Дополнительная литература
  • Теория и практика машинного обучения : учебное пособие / В. В. Воронина, А. В. Михеев, Н. Г. Ярушкина, К. В. Святов. – Ульяновск : УлГТУ, 2017. – 290 с.
  • Mehryar Mohri, Afshin Rostamizadeh, Ameet Talwalkar. Foundations of Machine Learning. - MIT Press, 2018. – 504с.