Introduction to Data Science

Baklanova Olga Evgenyevna

The instructor profile

Description: The course provides an opportunity to get acquainted with the subject area of ​​data science and develops skills in solving problems of data processing and visualization using the Python language. The course covers the basics of interactive work with Python in the Jupyter Notebook, provides the necessary minimum Python syntactic constructs for data processing tasks, and examines basic analytical packages: pandas, matplotlib, seaborn. The issues of loading data of different formats, data cleaning, exploratory analysis, and data visualization are considered.

Amount of credits: 6

Пререквизиты:

  • Information and communication technologies
  • Information and Communication Technologies (in english)

Course Workload:

Types of classes hours
Lectures 15
Practical works 45
Laboratory works
SAWTG (Student Autonomous Work under Teacher Guidance) 30
SAW (Student autonomous work) 90
Form of final control Exam
Final assessment method

Component: Component by selection

Cycle: Base disciplines

Goal
  • Данная дисциплина знакомит студентов с основными концепциями и методами анализа данных и машинного обучения. Студенты также научатся программировать на языке Python, познакомятся с базовыми приёмами извлечения и обработки данных с использованием алгоритмов машинного обучения.
Objective
  • изучить основные характеристики данных и способы их анализа
  • изучить элементы классификации данных и машинного обучения
  • изучить элементы классификации данных и машинного обучения
  • освоение основ статистического анализа, построение регрессионных зависимостей
  • реализация визуализации «больших данных»
  • обзор математических инструментов решения: нейронные сети, графы, нечеткие и К-значные логики
  • обзор математических инструментов решения: нейронные сети, графы, нечеткие и К-значные логики
Learning outcome: knowledge and understanding
  • понимание процессов сбора, обработки и интерпретации данных современных научных исследований, необходимых для формирования выводов по соответствующим научным исследованиям
Learning outcome: applying knowledge and understanding
  • Способен работать с информацией: находить, оценивать и использовать информацию из различных источников, необходимую для решения научных и профессиональных задач (в том числе на основе системного подхода)
  • Способен вести исследовательскую деятельность, включая анализ проблем, постановку целей и задач, выделение объекта и предмета исследования, выбор способа и методов исследования, а также оценку его качества
  • Способен выбирать адекватные задачам исследования методы исследования и применять их
  • Способен осуществлять поиск, сбор, обработку, анализ и хранение информации для решения поставленных задач
  • Способен проводить прикладной анализ явлений и процессов в сфере политики с использованием методов политической науки для поддержки процесса принятия практических решений
  • Способен проводить прикладной анализ явлений и процессов в сфере политики с использованием методов политической науки для поддержки процесса принятия практических решений
Learning outcome: formation of judgments
  • Формировать суждения о задачах и методах исследований
  • Формировать суждения о поиске, сборе, обработке, анализе и хранения информации для решения поставленных задач
  • Формировать суждения о прикладном анализе явлений и процессов в сфере политики с использованием методов политической науки для поддержки процесса принятия практических решений
Learning outcome: communicative abilities
  • Развитие и совершенствование коммуникативных способностей студентов
  • Развитие навыков участия в конструктивном диалоге о прикладном анализе явлений и процессов в сфере политики с использованием методов политической науки для поддержки процесса принятия практических решений
Learning outcome: learning skills or learning abilities
  • Формирование умений в области систем искусственного интеллекта для реализации научно-исследовательских работ
  • Способность содействовать, в рамках академических и профессиональных контекстов, технологическому, социальному или культурному развитию в интересах формирования общества, основанного на знаниях
  • Способностью собирать, обрабатывать и интерпретировать данные современных научных исследований, необходимые для формирования выводов по соответствующим научным исследованиям
Key reading
  • Миркин Б. Г. Введение в анализ данных. — М.: Юрайт. 2020. 175 с.
  • Нархид Н. Apache Kafka. Потоковая обработка и анализ данных / Н. Нархид. — СПб.: Питер, 2019. — 320 c.
  • Макшанов А.В. Технологии интеллектуального анализа данных. — М.: Лань. 2019. 212 с.
  • Чашкин, Ю.Р. Математическая статистика. Анализ и обработка данных: Учебное пособие / Ю.Р. Чашкин; Под ред. С.Н. Смоленский. — Рн/Д: Феникс, 2021. — 236 c.
  • Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2021. — 336 с
  • Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2021. — 498 с.)
Further reading
  • Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс / В. Рафалович. — М.: SmartBook, 2018. — 352 c.
  • Форман Дж. Много цифр: Анализ больших данных при помощи Excel / Дж. Форман. — М.: Альпина Паблишер, 2019. — 461 c.