HomeUndergraduate and post graduate educational programs Educational program Дисциплина

Machine Learning and Data Analysis

Baklanova Olga Evgenyevna

Description: Machine learning is a science that studies methods for finding hidden dependencies in data arrays. These methods are increasingly being used in various fields of science (physics, economics, journalism, social sciences, etc.), as well as in many industrial fields. Spam detection, object recognition using classical mathematical modeling.

Amount of credits: 5

Пререквизиты:

Database management system

Course Workload:

Types of classes	hours
Lectures	15
Practical works
Laboratory works	30
SAWTG (Student Autonomous Work under Teacher Guidance)	30
SAW (Student autonomous work)	75
Form of final control	Exam
Final assessment method

Component: Component by selection

Cycle: Profiling disciplines

Goal

Курс направлен на формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных.

Objective

Формирование у студентов теоретических знаний и практических навыков по основам машинного обучения, овладение студентами инструментарием, моделями и методами машинного обучения, а также приобретение навыков исследователя данных (data scientist) и разработчика математических моделей, методов и алгоритмов анализа данных

Learning outcome: knowledge and understanding

изучить основные алгоритмы машинного обучения

Learning outcome: applying knowledge and understanding

применять на практике алгоритмы машинного обучения

Learning outcome: formation of judgments

формовать суждения о применение алгоритмов машинного обучения на различных практических задач

Learning outcome: communicative abilities

развитие и совершенствование коммуникативных способностей студентов

Learning outcome: learning skills or learning abilities

Способностью собирать, обрабатывать и интерпретировать данные современных научных исследований, необходимые для формирования выводов по соответствующим научным исследованиям

Teaching methods

лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа

Assessment of the student's knowledge

Teacher oversees various tasks related to ongoing assessment and determines students' current performance twice during each academic period. Ratings 1 and 2 are formulated based on the outcomes of this ongoing assessment. The student's learning achievements are assessed using a 100-point scale, and the final grades P1 and P2 are calculated as the average of their ongoing performance evaluations. The teacher evaluates the student's work throughout the academic period in alignment with the assignment submission schedule for the discipline. The assessment system may incorporate a mix of written and oral, group and individual formats.

Period	Type of task	Total
1 rating	Лабораторная работа №1	0-100
	Лабораторная работа №2
	Лабораторная работа №3
2 rating	Лабораторная работа №4	0-100
	Лабораторная работа №5
	Лабораторная работа №6
Total control	Exam	0-100

The evaluating policy of learning outcomes by work type

Type of task	90-100	70-89	50-69	0-49
Type of task	Excellent	Good	Satisfactory	Unsatisfactory

Evaluation form

The student's final grade in the course is calculated on a 100 point grading scale, it includes:

40% of the examination result;
60% of current control result.

The final grade is calculated by the formula:

FG = 0,6	MT₁+MT₂	+0,4E
	2

Where Midterm 1, Midterm 2are digital equivalents of the grades of Midterm 1 and 2;

E is a digital equivalent of the exam grade.

Final alphabetical grade and its equivalent in points:

The letter grading system for students' academic achievements, corresponding to the numerical equivalent on a four-point scale:

Alphabetical grade	Numerical value	Points (%)	Traditional grade
A	4.0	95-100	Excellent
A-	3.67	90-94	Excellent
B+	3.33	85-89	Good
B	3.0	80-84
B-	2.67	75-79
C+	2.33	70-74
C	2.0	65-69	Satisfactory
C-	1.67	60-64
D+	1.33	55-59
D	1.0	50-54
FX	0.5	25-49	Unsatisfactory
F	0	0-24	Unsatisfactory

Topics of lectures

Предмет и задачи машинного обучения и анализа данных
Основные принципы, задачи и подходы, использование в различных областях науки и индустрии
Основные этапы эволюции алгоритмов машинного обучения
Общий вид метрического классификатора
Алгоритм K ближайших соседей
Алгоритмы кластеризации с фиксированным количеством кластеров
Иерархическая кластеризация
Правила и анализ качества (точность, полнота)
Алгоритм построения деревьев решений
Перцептрон и разделяющая гиперплоскость
Логистическая регрессия
Нейронные сети и алгоритм обратного распространения градиента
Линейная регрессия
Голосование
Монте-Карло поиск

Key reading

Андреас, Мюллер Введение в машинное обучение с помощью Python. Руководство для специалистов по работе с данными / Мюллер Андреас. - М.: Альфа-книга, 2017. - 487 c.
Себастьян, Рашка Python и машинное обучение / Рашка Себастьян. - М.: ДМК Пресс, 2017. - 614 c.
Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2017. — 336 с
Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2016. — 498 с.

June 12, 2023 - National mourning day in the Republic of Kazakhstan