Machine Learning and Data Analysis

Baklanova Olga Evgenyevna

The instructor profile

Description: Machine learning is a science that studies methods for finding hidden dependencies in data arrays. These methods are increasingly being used in various fields of science (physics, economics, journalism, social sciences, etc.), as well as in many industrial fields. Spam detection, object recognition using classical mathematical modeling.

Amount of credits: 5

Пререквизиты:

  • Database management system

Course Workload:

Types of classes hours
Lectures 15
Practical works
Laboratory works 30
SAWTG (Student Autonomous Work under Teacher Guidance) 30
SAW (Student autonomous work) 75
Form of final control Exam
Final assessment method

Component: Component by selection

Cycle: Profiling disciplines

Goal
  • Курс направлен на формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.
Objective
  • Формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных
Learning outcome: knowledge and understanding
  • изучить основные алгоритмы машинного обучения
Learning outcome: applying knowledge and understanding
  • применять на практике алгоритмы машинного обучения
Learning outcome: formation of judgments
  • формовать суждения о применение алгоритмов машинного обучения на различных практических задач
Learning outcome: communicative abilities
  • развитие и совершенствование коммуникативных способностей студентов
Learning outcome: learning skills or learning abilities
  • Способностью собирать, обрабатывать и интерпретировать данные современных научных исследований, необходимые для формирования выводов по соответствующим научным исследованиям
Teaching methods

лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа

Assessment of the student's knowledge

Teacher oversees various tasks related to ongoing assessment and determines students' current performance twice during each academic period. Ratings 1 and 2 are formulated based on the outcomes of this ongoing assessment. The student's learning achievements are assessed using a 100-point scale, and the final grades P1 and P2 are calculated as the average of their ongoing performance evaluations. The teacher evaluates the student's work throughout the academic period in alignment with the assignment submission schedule for the discipline. The assessment system may incorporate a mix of written and oral, group and individual formats.

Period Type of task Total
1  rating Лабораторная работа №1 0-100
Лабораторная работа №2
Лабораторная работа №3
2  rating Лабораторная работа №4 0-100
Лабораторная работа №5
Лабораторная работа №6
Total control Exam 0-100
The evaluating policy of learning outcomes by work type
Type of task 90-100 70-89 50-69 0-49
Excellent Good Satisfactory Unsatisfactory
Evaluation form

The student's final grade in the course is calculated on a 100 point grading scale, it includes:

  • 40% of the examination result;
  • 60% of current control result.

The final grade is calculated by the formula:

FG = 0,6 MT1+MT2 +0,4E
2

 

Where Midterm 1, Midterm 2are digital equivalents of the grades of Midterm 1 and 2;

E is a digital equivalent of the exam grade.

Final alphabetical grade and its equivalent in points:

The letter grading system for students' academic achievements, corresponding to the numerical equivalent on a four-point scale:

Alphabetical grade Numerical value Points (%) Traditional grade
A 4.0 95-100 Excellent
A- 3.67 90-94
B+ 3.33 85-89 Good
B 3.0 80-84
B- 2.67 75-79
C+ 2.33 70-74
C 2.0 65-69 Satisfactory
C- 1.67 60-64
D+ 1.33 55-59
D 1.0 50-54
FX 0.5 25-49 Unsatisfactory
F 0 0-24
Topics of lectures
  • Предмет и задачи машинного обучения и анализа данных
  • Основные принципы, задачи и подходы, использование в различных областях науки и индустрии
  • Основные этапы эволюции алгоритмов машинного обучения
  • Общий вид метрического классификатора
  • Алгоритм K ближайших соседей
  • Алгоритмы кластеризации с фиксированным количеством кластеров
  • Иерархическая кластеризация
  • Правила и анализ качества (точность, полнота)
  • Алгоритм построения деревьев решений
  • Перцептрон и разделяющая гиперплоскость
  • Логистическая регрессия
  • Нейронные сети и алгоритм обратного распространения градиента
  • Линейная регрессия
  • Голосование
  • Монте-Карло поиск
Key reading
  • Андреас, Мюллер Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными / Мюллер Андреас. - М.: Альфа-книга, 2017. - 487 c.
  • Себастьян, Рашка Python и машинное обучение / Рашка Себастьян. - М.: ДМК Пресс, 2017. - 614 c.
  • Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2017. — 336 с
  • Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2016. — 498 с.
Further reading
  • Плас, Джейк Вандер Python для сложных задач. Наука о данных и машинное обучение. Руководство / Плас Джейк Вандер. - М.: Питер, 2018. - 759 c.
  • Макшанов А.В. Технологии интеллектуального анализа данных. — М.: Лань. 2019. 212 с.
  • Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс / В. Рафалович. — М.: SmartBook, 2018. — 352 c.