Введение в Data Science

Бакланова Ольга Евгеньевна

Portfolio des Lehrers

Beschreibung: Курс дает возможность познакомиться с предметной областью науки о данных и формирует навыки решения задач обработки и визуализации данных с использованием языка Python. В курсе рассматриваются основы интерактивной работы с Python в блокноте Jupyter Notebook, дается необходимый минимум синтаксических конструкций Python для задач обработки данных, рассматриваются базовые аналитические пакеты: pandas, matplotlib, seaborn. Рассматриваются вопросы загрузки данных разных форматов, очистки данных, разведочного анализа, визуализации данных.

Betrag der Credits: 6

Пререквизиты:

  • Информационно-коммуникационные технологии

Arbeitsintensität der Disziplin:

Unterrichtsarten Uhr
Vorträge 15
Praktische Arbeiten 45
Laborarbeiten
AASAL (Autonomes Arbeiten der Schüler unter Anleitung des Lehrers) 30
SE (Studentisches Eigenarbeiten) 90
Endkontrollformular экзамен
Form der Endkontrolle

Komponente: Компонент по выбору

Zyklus: Базовые дисциплины

Цель
  • Данная дисциплина знакомит студентов с основными концепциями и методами анализа данных и машинного обучения. Студенты также научатся программировать на языке Python, познакомятся с базовыми приёмами извлечения и обработки данных с использованием алгоритмов машинного обучения.
Задача
  • изучить основные характеристики данных и способы их анализа
  • изучить элементы классификации данных и машинного обучения
  • изучить элементы классификации данных и машинного обучения
  • освоение основ статистического анализа, построение регрессионных зависимостей
  • реализация визуализации «больших данных»
  • обзор математических инструментов решения: нейронные сети, графы, нечеткие и К-значные логики
  • обзор математических инструментов решения: нейронные сети, графы, нечеткие и К-значные логики
Результат обучения: знание и понимание
  • понимание процессов сбора, обработки и интерпретации данных современных научных исследований, необходимых для формирования выводов по соответствующим научным исследованиям
Результат обучения: применение знаний и пониманий
  • Способен работать с информацией: находить, оценивать и использовать информацию из различных источников, необходимую для решения научных и профессиональных задач (в том числе на основе системного подхода)
  • Способен вести исследовательскую деятельность, включая анализ проблем, постановку целей и задач, выделение объекта и предмета исследования, выбор способа и методов исследования, а также оценку его качества
  • Способен выбирать адекватные задачам исследования методы исследования и применять их
  • Способен осуществлять поиск, сбор, обработку, анализ и хранение информации для решения поставленных задач
  • Способен проводить прикладной анализ явлений и процессов в сфере политики с использованием методов политической науки для поддержки процесса принятия практических решений
  • Способен проводить прикладной анализ явлений и процессов в сфере политики с использованием методов политической науки для поддержки процесса принятия практических решений
Результат обучения: формирование суждений
  • Формировать суждения о задачах и методах исследований
  • Формировать суждения о поиске, сборе, обработке, анализе и хранения информации для решения поставленных задач
  • Формировать суждения о прикладном анализе явлений и процессов в сфере политики с использованием методов политической науки для поддержки процесса принятия практических решений
Результат обучения: коммуникативные способности
  • Развитие и совершенствование коммуникативных способностей студентов
  • Развитие навыков участия в конструктивном диалоге о прикладном анализе явлений и процессов в сфере политики с использованием методов политической науки для поддержки процесса принятия практических решений
Результат обучения: навыки обучения или способности к учебе
  • Формирование умений в области систем искусственного интеллекта для реализации научно-исследовательских работ
  • Способность содействовать, в рамках академических и профессиональных контекстов, технологическому, социальному или культурному развитию в интересах формирования общества, основанного на знаниях
  • Способностью собирать, обрабатывать и интерпретировать данные современных научных исследований, необходимые для формирования выводов по соответствующим научным исследованиям
Основная литература
  • Миркин Б. Г. Введение в анализ данных. — М.: Юрайт. 2020. 175 с.
  • Нархид Н. Apache Kafka. Потоковая обработка и анализ данных / Н. Нархид. — СПб.: Питер, 2019. — 320 c.
  • Макшанов А.В. Технологии интеллектуального анализа данных. — М.: Лань. 2019. 212 с.
  • Чашкин, Ю.Р. Математическая статистика. Анализ и обработка данных: Учебное пособие / Ю.Р. Чашкин; Под ред. С.Н. Смоленский. — Рн/Д: Феникс, 2021. — 236 c.
  • Дэви Силен, Арно Мейсман, Мохамед Али, Основы Data Science и Big Data. Python и наука о данных. — СПб.: Питер, 2021. — 336 с
  • Юре Лесковец, Ананд Раджараман, Джеффри Д. Ульман, Анализ больших наборов данных. — М.: ДМК Пресс, 2021. — 498 с.)
Дополнительная литература
  • Рафалович В. Data mining, или интеллектуальный анализ данных для занятых. Практический курс / В. Рафалович. — М.: SmartBook, 2018. — 352 c.
  • Форман Дж. Много цифр: Анализ больших данных при помощи Excel / Дж. Форман. — М.: Альпина Паблишер, 2019. — 461 c.