Разработка и внедрение систем больших данных
Описание: Курс посвящен изучению технологий хранения, обработки и анализа больших данных, методов построения информационных систем на основе нереляционных баз данных и распределенных систем хранения. Студенты изучат технологии для анализа очень больших наборов данных: кластеризация, интеллектуальный анализ текста и т. д.
Количество кредитов: 6
Пререквизиты:
- Современные среды и языки программирования
- Машинное обучение и анализ данных
Трудоемкость дисциплины:
Виды работ | часы |
---|---|
Лекции | 30 |
Практические работы | |
Лабораторные работы | 30 |
СРОП | 30 |
СРО | 90 |
Форма итогового контроля | экзамен |
Форма проведения итогового контроля |
Компонент: Компонент по выбору
Цикл: Профилирующие дисциплины
Цель
- Цель курса - получить представление о возможностях и ограничениях алгоритмов интеллектуального анализа данных и машинного обучения для изучения очень больших массивов данных и выявить перспективные приложения для интеллектуального анализа данных на рынке.
Задача
Результат обучения: знание и понимание
- Продемонстрировать углубленные знания в области интеллектуального анализа данных и алгоритмов машинного обучения концепций и методов анализа очень больших массивов данных.
Результат обучения: применение знаний и пониманий
- применять методы кластеризации, классификации, поиска ассоциаций, выбора признаков и визуализации на реальных данных.
Результат обучения: формирование суждений
- определить, существует ли решение для интеллектуального анализа данных для реальной проблемы
Результат обучения: коммуникативные способности
- продемонстрировать знание этических аспектов, связанных с интеллектуальным анализом данных и машинным обучением для анализа очень больших массивов данных
Результат обучения: навыки обучения или способности к учебе
- настройка процесса интеллектуального анализа данных для приложения, включая подготовку данных, моделирование и оценку
Основная литература
- Rajaraman, J. Leskovec and J. D. Ullman, Mining of Massive Datasets, 2nd Edition.