Машинное обучение и анализ данных
Beschreibung: Дисциплина посвящена изучению алгоритмов, моделей и методов машинного обучения и способов их применения для решения практических задач; обработки и анализа больших данных; основ построения моделей и алгоритмов решения и оценки точности решения задач методами машинного обучения. Рассматриваются программные средства, современные языки программирования и библиотеки для анализа реальных наборов данных.
Betrag der Credits: 6
Пререквизиты:
- Линейные системы автоматического регулирования
Arbeitsintensität der Disziplin:
Unterrichtsarten | Uhr |
---|---|
Vorträge | 30 |
Praktische Arbeiten | |
Laborarbeiten | 30 |
AASAL (Autonomes Arbeiten der Schüler unter Anleitung des Lehrers) | 30 |
SE (Studentisches Eigenarbeiten) | 90 |
Endkontrollformular | экзамен |
Form der Endkontrolle | устный экзамен |
Komponente: Вузовский компонент
Zyklus: Профилирующие дисциплины
Цель
- изучение современных методов и инструментов машинного обучения и анализа данных для решения конкретных задач в области построения автоматизированных и интеллектуальных систем управления техническими объектами.
Задача
- формирование целостного представления о методах машинного обучения для обработки и анализа больших данных;
- овладение умениями разработки программ на языках Python и MatLab, реализующих алгоритмы машинного обучения;
- овладение моделями и методами интеллектуального анализа данных и машинного обучения в задачах поиска информации, обработки и анализа данных;
- приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Результат обучения: знание и понимание
- показывать знания математических основ теории машинного обучения, основные классы алгоритмов машинного обучения.
Результат обучения: применение знаний и пониманий
- выбирать наиболее подходящие алгоритмы решения задач машинного обучения и оценивать качество построенных моделей
- применять методы интеллектуального анализа данных и машинного обучения в задачах поиска информации, обработки и анализа данных систем автоматизации техническими объектами
Результат обучения: формирование суждений
- анализировать, выделять особенности и комбинировать методы машинного обучения;
Результат обучения: коммуникативные способности
- сообщать тенденции в области автоматизации производственных систем, перспективные направления и возможности практического применения, как специалистам, так и не специалистам;
Результат обучения: навыки обучения или способности к учебе
- демонстрировать навыки исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Lehrmethoden
технологии учебно-исследовательской деятельности
информационно-коммуникационные технологии
модульная технология обучения
Bewertung des Wissens der Studierenden
Period | Art der Aufgabe | Gesamt |
---|---|---|
1 Bewertung | Лабораторная работа "Метрики качества задач классификации" | 0-100 |
Лабораторная работа "Метрики качества задач классификации" | ||
Лабораторная работа "Функции ошибок в машинном обучении" | ||
Лабораторная работа "Алгоритмы кластеризации" | ||
Рубежный контроль 1 | ||
2 Bewertung | Лабораторная работа "Введение в обработку естественного языка" | 0-100 |
Лабораторная работа "Методы оптимизации в глубоком обучении" | ||
Лабораторная работа "Свёрточные сети и работа с изображениями" | ||
Лабораторная работа "Анализ и предсказание временных рядов" | ||
Рубежный контроль 2 | ||
Endkontrolle | экзамен | 0-100 |
Die Bewertungspolitik der Lernergebnisse nach Arbeitstyp
Art der Aufgabe | 90-100 | 70-89 | 50-69 | 0-49 |
---|---|---|---|---|
Exzellent | Gut | Befriedigend | Ungenügend | |
Работа на лабораторных занятиях | Проявлена превосходная теоретическая подготовка. Необходимые навыки и умения полностью освоены. Результат лабораторной работы полностью соответствует её целям. | Проявлена хорошая теоретическая подготовка. Необходимые навыки и умения в основном освоены. Результат лабораторной работы в основном соответствует её целям. | Проявлена удовлетворительная теоретическая подготовка. Необходимые навыки и умения частично освоены. Результат лабораторной работы частично соответствует её целям. | Проявлена неудовлетворительная теоретическая подготовка. Необходимые навыки и умения не своены. Результат лабораторной работы не соответствует её целям. |
Собеседование по контрольным вопросам | В ответе качественно раскрыто содержание темы. Ответ хорошо структурирован. Прекрасно освоен понятийный аппарат. Продемонстрирован высокий уровень понимания материала. Превосходное умение формулировать свои мысли, обсуждать дискуссионные положения. | Основные вопросы темы раскрыты. Структура ответа в целом адекватна теме. Хорошо освоен понятийный аппарат. Продемонстрирован хороший уровень понимания материала. Хорошее умение формулировать свои мысли, обсуждать дискуссионные положения. | ема частично раскрыта. Ответ слабо структурирован. Понятийный аппарат освоен частично. Понимание отдельных положений из материала по теме. Удовлетворительное умение формулировать свои мысли, обсуждать дискуссионные положения. | Тема не раскрыта. Понятийный аппарат освоен неудовлетворительно. Понимание материала фрагментарное или отсутствует. Неумение формулировать свои мысли, обсуждать дискуссионные положения. |
Bewertungsbogen
Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:
- 40% результата, полученного на экзамене;
- 60% результатов текущей успеваемости.
Формула подсчета итоговой оценки:
И= 0,6 | Р1+Р2 | +0,4Э |
2 |
где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.
Итоговая буквенная оценка и ее цифровой эквивалент в баллах:
Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:
Оценка по буквенной системе | Цифровой эквивалент | Баллы (%-ное содержание) | Оценка по традиционной системе |
---|---|---|---|
A | 4.0 | 95-100 | Отлично |
A- | 3.67 | 90-94 | |
B+ | 3.33 | 85-89 | Хорошо |
B | 3.0 | 80-84 | |
B- | 2.67 | 75-79 | |
C+ | 2.33 | 70-74 | |
C | 2.0 | 65-69 | Удовлетворительно |
C- | 1.67 | 60-64 | |
D+ | 1.33 | 55-59 | |
D | 1.0 | 50-54 | |
FX | 0.5 | 25-49 | Неудовлетворительно |
F | 0 | 0-24 |
Темы лекционных занятий
- Введение в теорию и практику машинного обучения. Что такое машинное обучение. Области науки о данных. Сферы применения машинного обучения. Этапы машинного обучения.
- Задачи машинного обучения. Пространство признаков. Формальное определение понятия «обучение». Общий алгоритм машинного обучения. Типы задач машинного обучения.
- Способы обучения и оценки его качества. Типы обучения. Как работает обучение с учителем. Почему модель способна работать с новыми данными.
- Типовые задачи при подготовке данных и обучении моделей. Учет пропусков. Кодирование нечисловых признаков. Приведение данных к единому масштабу и стандартизация. Разметка данных. Переобучение
- Математическое обеспечение теории машинного обучения. Обозначения. Случайная величина. Несмещенные оценки. Правило Байеса. Оценка параметров. Параметры и гиперпараметры. Классификация и регрессия. Обучение на основе моделей и на основе примеров. Поверхностное и глубокое обучение
- Модели и методы машинного обучения. Методы теории вероятностей. Статистические модели и методы.
- Фундаментальные алгоритмы. Линейная регрессия. Логистическая регрессия. Обучение дерева решений. Метод опорных векторов. Метод k ближайших соседей.
- Анатомия алгоритмов обучения. Строительные блоки алгоритмов обучения. Градиентный спуск. Особенности алгоритмов обучения.
- Проектирование признаков, переобучение и настройка гиперпараметров. Проектирование признаков. Выбор алгоритма обучения. Три набора. Недообучение и переобучение. Регуляризация. Оценка эффективности модели. Настройка гиперпараметров.
- Модели и методы нечеткой логики. Нечеткие системы. Нечеткая логика в анализе временных рядов. Метод моделирования нечетких временных рядов. Пример моделирования временного ряда в нечетком подходе. Извлечение знаний из временных рядов. Нечеткое сглаживание временного ряда. Нечеткая регрессия.
- Нейронные сети и глубокое обучение. Особенности нейронных сетей. Определение модели искусственной нейронной сети. Первая формальная модель и первая реализация нейронной сети. Многослойный персептрон. Сверточные. Карты. Рекуррентные сети. Самоорганизующиеся карты. Автокодировщики. Импульсные сети. Причины бурного развития ИНС сегодня. Борьба с переобучением в ИНС. Обратное распространение ошибки. Нечеткие нейронные сети.
- Проблемы и решения обучения моделей. Ядерная регрессия. Многоклассовая классификация. Одноклассовая классификация. Классификация с многими метками. Обучение ансамбля. Обучение маркировке последовательностей. Обучение преобразованию последовательностей в последовательности. Активное обучение. Обучение с частичным привлечением учителя. Обучение с первого раза. Обучение без подготовки.
- Продвинутые методики. Работа с несбалансированными наборами данных. Объединение моделей. Обучение нейронных сетей. Продвинутая регуляризация. Обработка нескольких входов. Обработка нескольких выходов. Перенос обучения. Эффективность алгоритмов.
- Обучение без учителя. Оценка плотности. Кластеризация. Сокращение размерности. Обнаружение аномалий
- Разработка приложений в сфере машинного обучения. Архитектура системы машинного обучения. Аппаратная и программная составляющая. Алгоритм создания системы машинного обучения.
Основная литература
- Бурков А. Машинное обучение без лишних слов. - СПб.: Питер, 2020. — 192 с.
- Основы машинного обучения : учебное пособие / О.В. Лимановская, Т.И. Алферьева ; Мин-во науки и высш. образования РФ.— Екатеринбург : Изд-во Урал. ун-та, 2020. — 88 с.
- Гладилин П.Е., Боченина К.О., Технологии машинного обучения– СПб: Университет ИТМО, 2020. – 75 с.
Дополнительная литература
- Теория и практика машинного обучения : учебное пособие / В. В. Воронина, А. В. Михеев, Н. Г. Ярушкина, К. В. Святов. – Ульяновск : УлГТУ, 2017. – 290 с.
- Mehryar Mohri, Afshin Rostamizadeh, Ameet Talwalkar. Foundations of Machine Learning. - MIT Press, 2018. – 504с.