Основы Data Science
Описание: Курс знакомит обучающихся с основными концепциями и методами анализа данных и машинного обучения. Содержание курса включает в себя методы и инструменты для сбора, хранения, обработки и визуализации данных, методы и приёмы извлечения и обработки данных из сети интернет и различных типов файлов. Курс предполагает знакомство с библиотеками Pandas и Scikit-learn — наиболее популярными инструментами для анализа данных и машинного обучения, используя язык программирования Python
Количество кредитов: 5
Пререквизиты:
- Проектирование баз данных
Трудоемкость дисциплины:
Виды работ | часы |
---|---|
Лекции | 15 |
Практические работы | |
Лабораторные работы | 30 |
СРОП | 30 |
СРО | 75 |
Форма итогового контроля | экзамен |
Форма проведения итогового контроля |
Компонент: Компонент по выбору
Цикл: Базовые дисциплины
Цель
- Основной целью изучения данной дисциплины является подготовка магистрантов к выполнению практических работ по науке о данных.
Задача
Результат обучения: знание и понимание
- знать основные концепции и методы Data Science, включая этапы работы с данными, основы статистики, машинного обучения и визуализации данных
Результат обучения: применение знаний и пониманий
- Уметь переводить реальную проблему в математические термины.
Результат обучения: формирование суждений
- Уметь формулировать задачу извлечения знаний как комбинацию методов фильтрации, анализа и исследования данных
Результат обучения: навыки обучения или способности к учебе
- Научится развивать сложное аналитическое мышление
Методы преподавания
Основная литература
- D.Cielen, A.. Meysman, Mohamed Ali Introducing Data Science. Big Data, Machine Learning, and more, using Python tools. Manning Publications Co, 2016, p.322
Дополнительная литература
- Han, J., Kamber, M., Pei, J. Data mining concepts and techniques. Morgan Kaufmann, 2011.