Математика и Python для анализа данных

Бакланова Ольга Евгеньевна

*InstructorProfile(zh-CN)*

内容描述: Курс направлен на развитие навыков и умений применения методов математического анализа, линейной алгебры, методов оптимизации, теории вероятностей для задач анализа данных, а также на получение базовых навыков работы со специальными библиотеками анализа данных языка Python.

贷款数: 6

Пререквизиты:

  • Информационно-коммуникационные технологии

*СomplexityDiscipline(zh-CN)*:

*TypesOfClasses(zh-CN)* *hours(zh-CN)*
*Lectures(zh-CN)* 30
*PracticalWork(zh-CN)*
*LaboratoryWork(zh-CN)* 30
*srop(zh-CN)* 30
*sro(zh-CN)* 90
*FormOfFinalControl(zh-CN)* экзамен
*FinalAssessment(zh-CN)* Экзамен

零件: Вузовский компонент

循环次数: Профилирующие дисциплины

Цель
  • Приобрести теоретические и практические навыки применения методов математического анализа, линейной алгебры, методов оптимизации, теории вероятностей для задач анализа данных, а также на получение базовых навыков работы со специальными библиотеками анализа данных языка Python.
Задача
  • 1. понимание и применение основных математических понятий, используемыми для анализа данных 2. применение на практике методов линейной алгебры, математического анализа, оптимизации и теории вероятностей 3. приобретение практического навыка работы с основными библиотека, которые применяются на практике для анализа данных: NumPy, SciPy, Matplotlib и Pandas 4. получение базовых практических навыков в анализе данных
Результат обучения: знание и понимание
  • 1 знание основных математических понятий, используемыми для анализа данных 2. знание библиотек NumPy, SciPy, Matplotlib и Pandas
Результат обучения: применение знаний и пониманий
  • 1. применение основных математических понятий, используемыми для анализа данных 2. применение на практике методов линейной алгебры, математического анализа, оптимизации и теории вероятностей 3. приобретение практического навыка работы с основными библиотека анализа данных 4. получение базовых практических навыков в анализе данных на языке Python
Результат обучения: формирование суждений
  • 1. формирование суждения о математических методах используемые для анализа данных 2. формирование суждения о методах линейной алгебры, математического анализа, оптимизации и теории вероятностей 3. формирование суждения о практическом применение библиотек NumPy, SciPy, Matplotlib и Pandas для анализа данных
Результат обучения: коммуникативные способности
  • 1. развитие и совершенствование коммуникативных способностей студентов; 2. развитие навыков участия в конструктивном диалоге о роли и значимости систем искусственного интеллекта в современном мире, различных направлениях в системах искусственного интеллекта
Результат обучения: навыки обучения или способности к учебе
  • 1. формирование умений в области систем искусственного интеллекта для реализации научно-исследовательских работ 2. выработка навыков применения методов линейной алгебры, математического анализа, оптимизации и теории вероятностей 3. способность содействовать, в рамках академических и профессиональных контекстов, технологическому, социальному или культурному развитию в интересах формирования общества, основанного на знаниях
*TeachingMethods(zh-CN)*

1. лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа.

*AssessmentKnowledge(zh-CN)*

Преподаватель проводит все виды работ текущего контроля и выводит соответствующую оценку текущей успеваемости обучающихся два раза в академический период. По результатам текущего контроля формируется рейтинг 1 и 2. Учебные достижения обучающегося оцениваются по 100-балльной шкале, итоговая оценка Р1 и Р2 выводится как средняя арифметическая из оценок текущей успеваемости. Оценка работы обучающегося в академическом периоде осуществляется преподавателем в соответствии с графиком сдачи заданий по дисциплине. Система контроля может сочетать письменные и устные, групповые и индивидуальные формы.

*Period2(zh-CN)* *TypeOfTask(zh-CN)* *Total(zh-CN)*
1  *Rating(zh-CN)* Практическая работа 1 0-100
Практическая работа 2
Практическая работа 3
Практическая работа 4
Практическая работа 5
Практическая работа 6
Практическая работа 7
2  *Rating(zh-CN)* Практическая работа 8 0-100
Практическая работа 9
Практическая работа 10
Практическая работа 11
Практическая работа 12
*TotalControl(zh-CN)* экзамен 0-100
*PolicyAssignmentTask(zh-CN)*
*TypeOfTask(zh-CN)* 90-100 70-89 50-69 0-49
Excellent *Grade4(zh-CN)* *Grade3(zh-CN)* *Grade2(zh-CN)*
Собеседование по контрольным вопросам демонстрирует системные теоретические знания, владеет терминологией, логично и последовательно объясняет сущность явлений и процессов, делает аргументированные выводы и обобщения, приводит примеры, показывает свободное владение монологической речью и способность быстро реагировать на уточняющие вопросы демонстрирует прочные теоретические знания, владеет терминологией, логично и последовательно объясняет сущность, явлений и процессов, делает аргументированные выводы и обобщения, приводит примеры, показывает свободное владение монологической речью, но при этом делает несущественные ошибки, которые исправляет самостоятельно или при незначительной коррекции преподавателем демонстрирует неглубокие теоретические знания, проявляет слабо сформированные навыки анализа явлений и процессов, недостаточное умение делать аргументированные выводы и приводить примеры, показывает недостаточно свободное владение монологической речью, терминологией, логичностью и последовательностью изложения, делает ошибки которые может исправить только при коррекции преподавателем. демонстрирует незнание теоретических основ предмета, несформированные навыки анализа явлений и процессов, не умеет делать аргументированные выводы и приводить примеры, показывает слабое владение монологической речью, не владеет терминологией, проявляет отсутствие логичности и последовательности изложения, делает ошибки, которые не может исправить даже при коррекции преподавателем, отказывается отвечать на занятии
Работа на практических занятиях выполнил лабораторную работу в полном объеме с соблюдением необходимой последовательности действий; в ответе правильно и аккуратно выполняет все записи, вычисления; правильно выполняет анализ ошибок. При ответе на вопросы правильно понимает сущность вопроса, дает точное определение и истолкование основных понятий; сопровождает ответ новыми примерами, умеет применить знания в новой ситуации; может установить связь между изучаемым и ранее изученным материалом, а также с материалом, усвоенным при изучении других дисциплин. выполнил требования к оценке «5», но допущены 2-3 недочета. Ответ обучающегося на вопросы удовлетворяет основным требованиям к ответу на 5, но дан без применения знаний в новой ситуации, без использования связей с ранее изученным материалом и материалом, усвоенным при изучении других дисциплин; допущены одна ошибка или не более двух недочетов, обучающийся может их исправить самостоятельно или с небольшой помощью преподавателя. выполнил работу не полностью, но не менее 50% объема практической работы, что позволяет получить правильные результаты и выводы; в ходе проведения работы были допущены ошибки. При ответе на вопросы обучающийся правильно понимает сущность вопроса, но в ответе имеются отдельные проблемы в усвоении вопросов курса, не препятствующие дальнейшему усвоению программного материала; допущено не более одной грубой ошибки и двух недочетов. выполнил работу не полностью или объем выполненной части работ не позволяет сделать правильных выводов. При ответе на вопросы демонстрирует не владение основными знаниями и умениями в соответствии с требованиями программы; допущены больше ошибок и недочетов, чем необходимо для оценки 3 или не может ответить ни на один из поставленных вопросов.
*EvaluationForm(zh-CN)*

Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:

  • 40% результата, полученного на экзамене;
  • 60% результатов текущей успеваемости.

Формула подсчета итоговой оценки:

И= 0,6 Р12 +0,4Э
2

 

где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.

Итоговая буквенная оценка и ее цифровой эквивалент в баллах:

Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:

Оценка по буквенной системе Цифровой эквивалент Баллы (%-ное содержание) Оценка по традиционной системе
A 4.0 95-100 Отлично
A- 3.67 90-94
B+ 3.33 85-89 Хорошо
B 3.0 80-84
B- 2.67 75-79
C+ 2.33 70-74
C 2.0 65-69 Удовлетворительно
C- 1.67 60-64
D+ 1.33 55-59
D 1.0 50-54
FX 0.5 25-49 Неудовлетворительно
F 0 0-24
Темы лекционных занятий
  • Математика и Python для анализа данных. Введение. История Python. Установка Python. Знакомство с IPython.
  • Программирование на Python. Типы данных в Python. Синтаксис языка Python. Чтение данных из файла. Запись данных в файл.
  • Основы математического анализа. Понятие функции действительной переменной. Представление о пределе функции. Геометрический смысл производной. Производная сложной функции. Экстремум. Выпуклость функции.
  • Знакомство с линейной алгеброй. Признаковое описание. Векторное пространство. Линейная независимость. Норма и скалярное произведение векторов. Нормированные пространства. Метрические пространства. Скалярное произведение.
  • Матрицы и основные матричные операции. Определение матриц. Матричные операции. Произведение матриц. Произведение матриц и линейные отображения. Сложение и умножение на число. Транспонирование матриц. Ранг и определитель. Системы линейных уравнений (СЛАУ). Теорема Кронекера-Капелли. Типы матриц. Понятие собственного вектора.
  • Функции многих переменных. Частные производные и градиент. Градиент в задачах оптимизации. Производная по направлению. Касательная плоскость и линейное приближение. Направление наискорейшего роста.
  • Методы оптимизации. Оптимизация негладких функций. Проблема оптимизации параметров алгоритма машинного обучения. Проблема локальных минимумов. Пример: градиентный спуск без градиента. Метод имитации отжига. Генетические алгоритмы. Алгоритм дифференциальной эволюции. Метод Нелдера-Мида.
  • Сингулярное разложение матриц. Матричные разложения. Спектральное разложение. Сингулярное разложение. Приближение матрицей меньшего ранга. Оценка ранга произведения матриц. Ранг матрицы и сжатие без потерь. Аппроксимация матрицей меньшего ранга. Преобразование признаков. Задача рекомендации. Сингулярное разложение и низкоранговое приближение.
  • Вероятность и случайные величины. Случайность в теории вероятностей и статистике. Свойства вероятности. Условная вероятность. Дискретные случайные величины. Непрерывные случайные величины.
  • Статистики. Оценка распределения по выборке. Характеристики распределений. Выборочное среднее. Выборочная медиана. Выборочная мода. Выборочная дисперсия. Центральная предельная теорема. Доверительные интервалы. Распределение Бернулли.
  • Библиотека Matplotlib. Установка Matplotlib с помощью менеджера pip. Построение графика. Несколько графиков на одном поле. Представление графиков на разных полях. Построение диаграммы для категориальных данных. Основные элементы графика.
  • Основы работы с модулем pyplot. Построение графиков. Текстовые надписи на графике. Работа с линейным графиком. Размещение графиков отдельно друг от друга. Работа с функцией subplots.
  • Настройка элементов графика. Работа с легендой. Компоновка графиков. Инструмент GridSpec. Текстовые элементы графика. Свойства класса Text. Цветовая полоса — colorbar.
  • Визуализация данных. Линейный график. Ступенчатый, стековый графики. Stem-график. Точечный график (Диаграмма рассеяния). Столбчатые и круговые диаграммы. Цветовая сетка. Цветовые карты (colormaps).
  • Построение 3D -графиков. Работа с mplot3d Toolkit. Линейный график. Точечный график (диаграмма рассеяния). Каркасная поверхность. Поверхность.
Основная литература
  • Маккинли. Уэс Python и анализ данных / Уэс Маккинли ; пер. А. А. Слинкин. - Москва : ДМК Пресс, 2015. - 481 с. : ил.
  • Максимова, О. Д. Математический анализ в примерах и задачах. Предел функции : учебное пособие для вузов / О. Д. Максимова. — 2-е изд., стер. — Москва : Издательство Юрайт, 2019. — 200 с.
  • Марчук, Г.И. Геронтология in silico. Становление новой дисциплины. Математические модели, анализ данных и вычислительные эксперименты / Г.И. Марчук. - М.: Бином. Лаборатория знаний, 2017. - 929 c.
  • Златопольский Д.М. Основы программирования на языке Python. – М.: ДМК Пресс, 2017. – 284 с.
  • Мэтиз, Э. Изучаем PYTHON.Программирование игр, визуализация данных, веб-приложения / Э. Мэтиз. - СПб.: Питер, 2017. - 496 c.
  • Федоров, Д. Ю. Программирование на языке высокого уровня Python : учебное пособие для прикладного бакалавриата / Д. Ю. Федоров. – 2-е изд., перераб. и доп. – Москва : Издательство Юрайт, 2019. – 161 с. – (Бакалавр. Прикладной курс).
  • 004 Z 51 Zelle John Python Programming an Introduction to Computer Science : учебник / John Zelle. - Third Edition, [б. м.], 2017. - 524 p. - Текст : непосредственный. Экземпляры: всего:1 - ЧЗ_ИНяз(1) ГРНТИ 20
  • 004.4 Е 729 Ермеков, Нурмухамбет Турлынович. Введение в программирование на языке Python : учебник / Н. Т. Ермеков, Б. Е. Таржибаева. - Алматы : ТОО "Лантар Трейд", 2020. - 202 с. - Текст : непосредственный. Экземпляры: всего:5 - КХ(1), ЧЗ(1), АУЛ(3) ГРНТИ 20
  • 004.432 М 474 Меликов П. И. Изучаем основы Python. Практический курс для дата-аналитиков : научное издание / П. И. Меликов. - Алматы : EDP Hub (Индипи Хаб), 2023. - 480 с. - Текст : непосредственный. Экземпляры: всего:1 - КХ(1) ГРНТИ 20
Дополнительная литература
  • Информационные технологии и вычислительные системы: Обработка информации и анализ данных. Программная инженерия. Математическое моделирование. Прикладные аспекты информатики / Под ред. С.В. Емельянова. - М.: Ленанд, 2015. - 104 c.
  • Гашев С. Н. Математические методы в биологии: анализ биологических данных в системе Statistica. — М.: Юрайт. 2020. 208 с.
  • Халафян А. А., Боровиков В. П., Калайдина Г. В. Теория вероятностей, математическая статистика и анализ данных. Основы теории и практика на компьютере. Statistica. Excel. Более 150 примеров решения задач. Учебное пособие. — М.: Ленанд. 2017. 320 с.
  • Миркин Б. Г. Введение в анализ данных. — М.: Юрайт. 2020. 175 с.