Математика и Python для анализа данных
Beschreibung: Курс направлен на развитие навыков и умений применения методов математического анализа, линейной алгебры, методов оптимизации, теории вероятностей для задач анализа данных, а также на получение базовых навыков работы со специальными библиотеками анализа данных языка Python.
Betrag der Credits: 6
Пререквизиты:
- Информационно-коммуникационные технологии
Arbeitsintensität der Disziplin:
| Unterrichtsarten | Uhr |
|---|---|
| Vorträge | 30 |
| Praktische Arbeiten | |
| Laborarbeiten | 30 |
| AASAL (Autonomes Arbeiten der Schüler unter Anleitung des Lehrers) | 30 |
| SE (Studentisches Eigenarbeiten) | 90 |
| Endkontrollformular | экзамен |
| Form der Endkontrolle | Экзамен |
Komponente: Вузовский компонент
Zyklus: Профилирующие дисциплины
Цель
- Приобрести теоретические и практические навыки применения методов математического анализа, линейной алгебры, методов оптимизации, теории вероятностей для задач анализа данных, а также на получение базовых навыков работы со специальными библиотеками анализа данных языка Python.
Задача
- 1. понимание и применение основных математических понятий, используемыми для анализа данных 2. применение на практике методов линейной алгебры, математического анализа, оптимизации и теории вероятностей 3. приобретение практического навыка работы с основными библиотека, которые применяются на практике для анализа данных: NumPy, SciPy, Matplotlib и Pandas 4. получение базовых практических навыков в анализе данных
Результат обучения: знание и понимание
- 1 знание основных математических понятий, используемыми для анализа данных 2. знание библиотек NumPy, SciPy, Matplotlib и Pandas
Результат обучения: применение знаний и пониманий
- 1. применение основных математических понятий, используемыми для анализа данных 2. применение на практике методов линейной алгебры, математического анализа, оптимизации и теории вероятностей 3. приобретение практического навыка работы с основными библиотека анализа данных 4. получение базовых практических навыков в анализе данных на языке Python
Результат обучения: формирование суждений
- 1. формирование суждения о математических методах используемые для анализа данных 2. формирование суждения о методах линейной алгебры, математического анализа, оптимизации и теории вероятностей 3. формирование суждения о практическом применение библиотек NumPy, SciPy, Matplotlib и Pandas для анализа данных
Результат обучения: коммуникативные способности
- 1. развитие и совершенствование коммуникативных способностей студентов; 2. развитие навыков участия в конструктивном диалоге о роли и значимости систем искусственного интеллекта в современном мире, различных направлениях в системах искусственного интеллекта
Результат обучения: навыки обучения или способности к учебе
- 1. формирование умений в области систем искусственного интеллекта для реализации научно-исследовательских работ 2. выработка навыков применения методов линейной алгебры, математического анализа, оптимизации и теории вероятностей 3. способность содействовать, в рамках академических и профессиональных контекстов, технологическому, социальному или культурному развитию в интересах формирования общества, основанного на знаниях
Lehrmethoden
1. лекции и онлайн-лекции, лабораторные занятия с применением слайдов и других средств мультимедиа.
Bewertung des Wissens der Studierenden
| Period | Art der Aufgabe | Gesamt |
|---|---|---|
| 1 Bewertung | Практическая работа 1 | 0-100 |
| Практическая работа 2 | ||
| Практическая работа 3 | ||
| Практическая работа 4 | ||
| Практическая работа 5 | ||
| Практическая работа 6 | ||
| Практическая работа 7 | ||
| 2 Bewertung | Практическая работа 8 | 0-100 |
| Практическая работа 9 | ||
| Практическая работа 10 | ||
| Практическая работа 11 | ||
| Практическая работа 12 | ||
| Endkontrolle | экзамен | 0-100 |
Die Bewertungspolitik der Lernergebnisse nach Arbeitstyp
| Art der Aufgabe | 90-100 | 70-89 | 50-69 | 0-49 |
|---|---|---|---|---|
| Exzellent | Gut | Befriedigend | Ungenügend | |
| Собеседование по контрольным вопросам | демонстрирует системные теоретические знания, владеет терминологией, логично и последовательно объясняет сущность явлений и процессов, делает аргументированные выводы и обобщения, приводит примеры, показывает свободное владение монологической речью и способность быстро реагировать на уточняющие вопросы | демонстрирует прочные теоретические знания, владеет терминологией, логично и последовательно объясняет сущность, явлений и процессов, делает аргументированные выводы и обобщения, приводит примеры, показывает свободное владение монологической речью, но при этом делает несущественные ошибки, которые исправляет самостоятельно или при незначительной коррекции преподавателем | демонстрирует неглубокие теоретические знания, проявляет слабо сформированные навыки анализа явлений и процессов, недостаточное умение делать аргументированные выводы и приводить примеры, показывает недостаточно свободное владение монологической речью, терминологией, логичностью и последовательностью изложения, делает ошибки которые может исправить только при коррекции преподавателем. | демонстрирует незнание теоретических основ предмета, несформированные навыки анализа явлений и процессов, не умеет делать аргументированные выводы и приводить примеры, показывает слабое владение монологической речью, не владеет терминологией, проявляет отсутствие логичности и последовательности изложения, делает ошибки, которые не может исправить даже при коррекции преподавателем, отказывается отвечать на занятии |
| Работа на практических занятиях | выполнил лабораторную работу в полном объеме с соблюдением необходимой последовательности действий; в ответе правильно и аккуратно выполняет все записи, вычисления; правильно выполняет анализ ошибок. При ответе на вопросы правильно понимает сущность вопроса, дает точное определение и истолкование основных понятий; сопровождает ответ новыми примерами, умеет применить знания в новой ситуации; может установить связь между изучаемым и ранее изученным материалом, а также с материалом, усвоенным при изучении других дисциплин. | выполнил требования к оценке «5», но допущены 2-3 недочета. Ответ обучающегося на вопросы удовлетворяет основным требованиям к ответу на 5, но дан без применения знаний в новой ситуации, без использования связей с ранее изученным материалом и материалом, усвоенным при изучении других дисциплин; допущены одна ошибка или не более двух недочетов, обучающийся может их исправить самостоятельно или с небольшой помощью преподавателя. | выполнил работу не полностью, но не менее 50% объема практической работы, что позволяет получить правильные результаты и выводы; в ходе проведения работы были допущены ошибки. При ответе на вопросы обучающийся правильно понимает сущность вопроса, но в ответе имеются отдельные проблемы в усвоении вопросов курса, не препятствующие дальнейшему усвоению программного материала; допущено не более одной грубой ошибки и двух недочетов. | выполнил работу не полностью или объем выполненной части работ не позволяет сделать правильных выводов. При ответе на вопросы демонстрирует не владение основными знаниями и умениями в соответствии с требованиями программы; допущены больше ошибок и недочетов, чем необходимо для оценки 3 или не может ответить ни на один из поставленных вопросов. |
Bewertungsbogen
Итоговая оценка знаний обучающего по дисциплине осуществляется по 100 балльной системе и включает:
- 40% результата, полученного на экзамене;
- 60% результатов текущей успеваемости.
Формула подсчета итоговой оценки:
| И= 0,6 | Р1+Р2 | +0,4Э |
| 2 |
где, Р1, Р2 – цифровые эквиваленты оценок первого, второго рейтингов соответственно; Э – цифровой эквивалент оценки на экзамене.
Итоговая буквенная оценка и ее цифровой эквивалент в баллах:
Буквенная система оценки учебных достижений обучающихся, соответствующая цифровому эквиваленту по четырехбалльной системе:
| Оценка по буквенной системе | Цифровой эквивалент | Баллы (%-ное содержание) | Оценка по традиционной системе |
|---|---|---|---|
| A | 4.0 | 95-100 | Отлично |
| A- | 3.67 | 90-94 | |
| B+ | 3.33 | 85-89 | Хорошо |
| B | 3.0 | 80-84 | |
| B- | 2.67 | 75-79 | |
| C+ | 2.33 | 70-74 | |
| C | 2.0 | 65-69 | Удовлетворительно |
| C- | 1.67 | 60-64 | |
| D+ | 1.33 | 55-59 | |
| D | 1.0 | 50-54 | |
| FX | 0.5 | 25-49 | Неудовлетворительно |
| F | 0 | 0-24 |
Темы лекционных занятий
- Математика и Python для анализа данных. Введение. История Python. Установка Python. Знакомство с IPython.
- Программирование на Python. Типы данных в Python. Синтаксис языка Python. Чтение данных из файла. Запись данных в файл.
- Основы математического анализа. Понятие функции действительной переменной. Представление о пределе функции. Геометрический смысл производной. Производная сложной функции. Экстремум. Выпуклость функции.
- Знакомство с линейной алгеброй. Признаковое описание. Векторное пространство. Линейная независимость. Норма и скалярное произведение векторов. Нормированные пространства. Метрические пространства. Скалярное произведение.
- Матрицы и основные матричные операции. Определение матриц. Матричные операции. Произведение матриц. Произведение матриц и линейные отображения. Сложение и умножение на число. Транспонирование матриц. Ранг и определитель. Системы линейных уравнений (СЛАУ). Теорема Кронекера-Капелли. Типы матриц. Понятие собственного вектора.
- Функции многих переменных. Частные производные и градиент. Градиент в задачах оптимизации. Производная по направлению. Касательная плоскость и линейное приближение. Направление наискорейшего роста.
- Методы оптимизации. Оптимизация негладких функций. Проблема оптимизации параметров алгоритма машинного обучения. Проблема локальных минимумов. Пример: градиентный спуск без градиента. Метод имитации отжига. Генетические алгоритмы. Алгоритм дифференциальной эволюции. Метод Нелдера-Мида.
- Сингулярное разложение матриц. Матричные разложения. Спектральное разложение. Сингулярное разложение. Приближение матрицей меньшего ранга. Оценка ранга произведения матриц. Ранг матрицы и сжатие без потерь. Аппроксимация матрицей меньшего ранга. Преобразование признаков. Задача рекомендации. Сингулярное разложение и низкоранговое приближение.
- Вероятность и случайные величины. Случайность в теории вероятностей и статистике. Свойства вероятности. Условная вероятность. Дискретные случайные величины. Непрерывные случайные величины.
- Статистики. Оценка распределения по выборке. Характеристики распределений. Выборочное среднее. Выборочная медиана. Выборочная мода. Выборочная дисперсия. Центральная предельная теорема. Доверительные интервалы. Распределение Бернулли.
- Библиотека Matplotlib. Установка Matplotlib с помощью менеджера pip. Построение графика. Несколько графиков на одном поле. Представление графиков на разных полях. Построение диаграммы для категориальных данных. Основные элементы графика.
- Основы работы с модулем pyplot. Построение графиков. Текстовые надписи на графике. Работа с линейным графиком. Размещение графиков отдельно друг от друга. Работа с функцией subplots.
- Настройка элементов графика. Работа с легендой. Компоновка графиков. Инструмент GridSpec. Текстовые элементы графика. Свойства класса Text. Цветовая полоса — colorbar.
- Визуализация данных. Линейный график. Ступенчатый, стековый графики. Stem-график. Точечный график (Диаграмма рассеяния). Столбчатые и круговые диаграммы. Цветовая сетка. Цветовые карты (colormaps).
- Построение 3D -графиков. Работа с mplot3d Toolkit. Линейный график. Точечный график (диаграмма рассеяния). Каркасная поверхность. Поверхность.
Основная литература
- Маккинли. Уэс Python и анализ данных / Уэс Маккинли ; пер. А. А. Слинкин. - Москва : ДМК Пресс, 2015. - 481 с. : ил.
- Максимова, О. Д. Математический анализ в примерах и задачах. Предел функции : учебное пособие для вузов / О. Д. Максимова. — 2-е изд., стер. — Москва : Издательство Юрайт, 2019. — 200 с.
- Марчук, Г.И. Геронтология in silico. Становление новой дисциплины. Математические модели, анализ данных и вычислительные эксперименты / Г.И. Марчук. - М.: Бином. Лаборатория знаний, 2017. - 929 c.
- Златопольский Д.М. Основы программирования на языке Python. – М.: ДМК Пресс, 2017. – 284 с.
- Мэтиз, Э. Изучаем PYTHON.Программирование игр, визуализация данных, веб-приложения / Э. Мэтиз. - СПб.: Питер, 2017. - 496 c.
- Федоров, Д. Ю. Программирование на языке высокого уровня Python : учебное пособие для прикладного бакалавриата / Д. Ю. Федоров. – 2-е изд., перераб. и доп. – Москва : Издательство Юрайт, 2019. – 161 с. – (Бакалавр. Прикладной курс).
- 004 Z 51 Zelle John Python Programming an Introduction to Computer Science : учебник / John Zelle. - Third Edition, [б. м.], 2017. - 524 p. - Текст : непосредственный. Экземпляры: всего:1 - ЧЗ_ИНяз(1) ГРНТИ 20
- 004.4 Е 729 Ермеков, Нурмухамбет Турлынович. Введение в программирование на языке Python : учебник / Н. Т. Ермеков, Б. Е. Таржибаева. - Алматы : ТОО "Лантар Трейд", 2020. - 202 с. - Текст : непосредственный. Экземпляры: всего:5 - КХ(1), ЧЗ(1), АУЛ(3) ГРНТИ 20
- 004.432 М 474 Меликов П. И. Изучаем основы Python. Практический курс для дата-аналитиков : научное издание / П. И. Меликов. - Алматы : EDP Hub (Индипи Хаб), 2023. - 480 с. - Текст : непосредственный. Экземпляры: всего:1 - КХ(1) ГРНТИ 20
Дополнительная литература
- Информационные технологии и вычислительные системы: Обработка информации и анализ данных. Программная инженерия. Математическое моделирование. Прикладные аспекты информатики / Под ред. С.В. Емельянова. - М.: Ленанд, 2015. - 104 c.
- Гашев С. Н. Математические методы в биологии: анализ биологических данных в системе Statistica. — М.: Юрайт. 2020. 208 с.
- Халафян А. А., Боровиков В. П., Калайдина Г. В. Теория вероятностей, математическая статистика и анализ данных. Основы теории и практика на компьютере. Statistica. Excel. Более 150 примеров решения задач. Учебное пособие. — М.: Ленанд. 2017. 320 с.
- Миркин Б. Г. Введение в анализ данных. — М.: Юрайт. 2020. 175 с.