Machine Learning and Data Analysis
Description: Machine learning is a science that studies methods for finding hidden dependencies in data arrays. These methods are increasingly being used in various fields of science (physics, economics, journalism, social sciences, etc.), as well as in many industrial fields. Spam detection, object recognition using classical mathematical modeling.
Amount of credits: 5
Пререквизиты:
- Database management system
Course Workload:
| Types of classes | hours |
|---|---|
| Lectures | 15 |
| Practical works | |
| Laboratory works | 30 |
| SAWTG (Student Autonomous Work under Teacher Guidance) | 30 |
| SAW (Student autonomous work) | 75 |
| Form of final control | Exam |
| Final assessment method |
Component: Component by selection
Cycle: Profiling disciplines
Goal
- Курс направлен на формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Objective
- Формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных
Learning outcome: knowledge and understanding
- изучить основные алгоритмы машинного обучения
Learning outcome: applying knowledge and understanding
- применять на практике алгоритмы машинного обучения
Learning outcome: formation of judgments
- формовать суждения о применение алгоритмов машинного обучения на различных практических задач
Learning outcome: communicative abilities
- развитие и совершенствование коммуникативных способностей студентов
Learning outcome: learning skills or learning abilities
- Способностью собирать, обрабатывать и интерпретировать данные современных научных исследований, необходимые для формирования выводов по соответствующим научным исследованиям
Teaching methods
лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа
Assessment of the student's knowledge
Teacher oversees various tasks related to ongoing assessment and determines students' current performance twice during each academic period. Ratings 1 and 2 are formulated based on the outcomes of this ongoing assessment. The student's learning achievements are assessed using a 100-point scale, and the final grades P1 and P2 are calculated as the average of their ongoing performance evaluations. The teacher evaluates the student's work throughout the academic period in alignment with the assignment submission schedule for the discipline. The assessment system may incorporate a mix of written and oral, group and individual formats.
| Period | Type of task | Total |
|---|---|---|
| 1 rating | Лабораторная работа №1 | 0-100 |
| Лабораторная работа №2 | ||
| Лабораторная работа №3 | ||
| 2 rating | Лабораторная работа №4 | 0-100 |
| Лабораторная работа №5 | ||
| Лабораторная работа №6 | ||
| Total control | Exam | 0-100 |
The evaluating policy of learning outcomes by work type
| Type of task | 90-100 | 70-89 | 50-69 | 0-49 |
|---|---|---|---|---|
| Excellent | Good | Satisfactory | Unsatisfactory |
Evaluation form
The student's final grade in the course is calculated on a 100 point grading scale, it includes:
- 40% of the examination result;
- 60% of current control result.
The final grade is calculated by the formula:
| FG = 0,6 | MT1+MT2 | +0,4E |
| 2 |
Where Midterm 1, Midterm 2are digital equivalents of the grades of Midterm 1 and 2;
E is a digital equivalent of the exam grade.
Final alphabetical grade and its equivalent in points:
The letter grading system for students' academic achievements, corresponding to the numerical equivalent on a four-point scale:
| Alphabetical grade | Numerical value | Points (%) | Traditional grade |
|---|---|---|---|
| A | 4.0 | 95-100 | Excellent |
| A- | 3.67 | 90-94 | |
| B+ | 3.33 | 85-89 | Good |
| B | 3.0 | 80-84 | |
| B- | 2.67 | 75-79 | |
| C+ | 2.33 | 70-74 | |
| C | 2.0 | 65-69 | Satisfactory |
| C- | 1.67 | 60-64 | |
| D+ | 1.33 | 55-59 | |
| D | 1.0 | 50-54 | |
| FX | 0.5 | 25-49 | Unsatisfactory |
| F | 0 | 0-24 |
Topics of lectures
- Предмет и задачи машинного обучения и анализа данных
- Основные принципы, задачи и подходы, использование в различных областях науки и индустрии
- Основные этапы эволюции алгоритмов машинного обучения
- Общий вид метрического классификатора
- Алгоритм K ближайших соседей
- Алгоритмы кластеризации с фиксированным количеством кластеров
- Иерархическая кластеризация
- Правила и анализ качества (точность, полнота)
- Алгоритм построения деревьев решений
- Перцептрон и разделяющая гиперплоскость
- Логистическая регрессия
- Нейронные сети и алгоритм обратного распространения градиента
- Линейная регрессия
- Голосование
- Монте-Карло поиск
Key reading
- Андреас, Мюллер Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными / Мюллер Андреас. - М.: Альфа-книга, 2017. - 487 c.
- Себастьян, Рашка Python и машинное обучение / Рашка Себастьян. - М.: ДМК Пресс, 2017. - 614 c.
- Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2017. — 336 с
- Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2016. — 498 с.
Further reading
- Плас, Джейк Вандер Python для сложных задач. Наука о данных и машинное обучение. Руководство / Плас Джейк Вандер. - М.: Питер, 2018. - 759 c.
- Макшанов А.В. Технологии интеллектуального анализа данных. — М.: Лань. 2019. 212 с.
- Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс / В. Рафалович. — М.: SmartBook, 2018. — 352 c.