Разработка и внедрение систем больших данных
内容描述: Курс посвящен изучению технологий хранения, обработки и анализа больших данных, методов построения информационных систем на основе нереляционных баз данных и распределенных систем хранения. Студенты изучат технологии для анализа очень больших наборов данных: кластеризация, интеллектуальный анализ текста и т. д.
贷款数: 6
Пререквизиты:
- Современные среды и языки программирования
- Машинное обучение и анализ данных
*СomplexityDiscipline(zh-CN)*:
*TypesOfClasses(zh-CN)* | *hours(zh-CN)* |
---|---|
*Lectures(zh-CN)* | 30 |
*PracticalWork(zh-CN)* | |
*LaboratoryWork(zh-CN)* | 30 |
*srop(zh-CN)* | 30 |
*sro(zh-CN)* | 90 |
*FormOfFinalControl(zh-CN)* | экзамен |
*FinalAssessment(zh-CN)* |
零件: Компонент по выбору
循环次数: Профилирующие дисциплины
Цель
- Цель курса - получить представление о возможностях и ограничениях алгоритмов интеллектуального анализа данных и машинного обучения для изучения очень больших массивов данных и выявить перспективные приложения для интеллектуального анализа данных на рынке.
Задача
Результат обучения: знание и понимание
- Продемонстрировать углубленные знания в области интеллектуального анализа данных и алгоритмов машинного обучения концепций и методов анализа очень больших массивов данных.
Результат обучения: применение знаний и пониманий
- применять методы кластеризации, классификации, поиска ассоциаций, выбора признаков и визуализации на реальных данных.
Результат обучения: формирование суждений
- определить, существует ли решение для интеллектуального анализа данных для реальной проблемы
Результат обучения: коммуникативные способности
- продемонстрировать знание этических аспектов, связанных с интеллектуальным анализом данных и машинным обучением для анализа очень больших массивов данных
Результат обучения: навыки обучения или способности к учебе
- настройка процесса интеллектуального анализа данных для приложения, включая подготовку данных, моделирование и оценку
Основная литература
- Rajaraman, J. Leskovec and J. D. Ullman, Mining of Massive Datasets, 2nd Edition.