Деректерді талдаудың қолданбалы міндеттері

Бакланова Ольга Евгеньевна

Оқытушының портфолиосы

Сипаттама: Курс деректерді талдаудың әртүрлі салаларынан қолданбалы мәселелерді шешуге бағытталған: мәтінді талдау және ақпараттық іздеу, бірлескен сүзу және ұсыныс жүйелері, бизнес-аналитика, уақыт қатарларын болжау. Курста студент гетерогенді мәліметтерден белгілерді алудың, әзірленген модельдердің сапасын бағалаудың және машиналық оқытудың әртүрлі алгоритмдерін қолданудың практикалық дағдыларын игереді.

Кредиттер саны: 10

Пререквизиты:

  • Алгоритмдеу және бағдарламалау технологиясы

Пәннің еңбек сыйымдылығы:

Жұмыс түрлері сағат
Дәрістер 30
Практикалық жұмыстар 30
Зертханалық жұмыстар 60
СӨЖО 30
СӨЖ 150
Қорытынды бақылау нысаны емтихан
Қорытынды бақылауды жүргізу нысаны

Компонент: ЖОО компоненті

Цикл: Кәсіптік пәндер

Мақсат
  • «Деректерді талдаудың қолданбалы мәселелері» пәні Data Science курсының ұсынысы болып табылады және екі мақсатты орындауға бағытталған. Біріншісі – қолданбалы статистиканы оқыту, ол машиналық оқытуды жүзеге асырумен және нәтижелерді талдаумен байланысты. Бұған үлгілерді талдау және салыстыру, машиналық оқыту үлгілерін түсіндіру және A/B сынақ нәтижелерін жоспарлау және талдау кіреді. Екіншісі – машиналық оқыту әдістерін қолдану арқылы күрделі есептерді шешу тәжірибесін беру. Атап айтқанда, табиғи тілді өңдеу, кескіндермен және сигналдармен жұмыс істеу, уақыттық қатарларды болжау, кеңес беру жүйесін құру мәселелері қарастырылады.
Міндет
  • сызықтық модельдерді талдауда статистикалық әдістерді қолдану дағдыларын қалыптастыру
  • машиналық оқыту үлгілерін интерпретациялау дағдыларын қалыптастыру
  • гипотезаларды статистикалық тексеру дағдыларын қалыптастыру
  • А/В тестілеуді жүзеге асыру дағдыларын қалыптастыру
  • болжаудың статистикалық әдістерінің дағдыларын қалыптастыру
  • машиналық оқытуды пайдалана отырып болжау дағдыларын қалыптастыру
  • кеңес беру жүйесін құруда практикалық дағдыларды меңгеру
  • компьютерлік көру есептерін шешуде практикалық дағдыларды меңгеру
  • дыбыс сигналын талдау, нейрондық желі тәсілдері
  • табиғи тілді талдау дағдыларын қалыптастыру
Оқыту нәтижесі: білу және түсіну
  • Уақыт қатарларын болжау әдістерін меңгеру
  • Рекомендациялық жүйелердің негізгі сапа көрсеткіштерін білу
  • Мәтінді талдаудың негізгі әдістерін меңгеру
Оқыту нәтижесі: білім мен ұғымды қолдану
  • Машиналық оқыту үлгілерін түсіндіре білу
  • A/B сынақтарының нәтижелерін жоспарлай және талдай білу
  • Ұсынушы жүйелерді қалай құру керектігін біліңіз
  • Бейне мен сигналды талдаудың негізгі міндеттерін шеше білу
  • Мәтінді талдаудың күрделі мәселелерін шеше білу (машиналық аударма және т.б.)
Оқыту нәтижесі: талқылай білуді қалыптастыру
  • Мәтінді талдаудың күрделі мәселелерін шешу туралы пайымдауды қалыптастыру (машиналық аударма және т.б.)
  • Рекомендациялық жүйелердің құрылысы туралы пайымдауларды қалыптастыру
  • Машиналық оқыту үлгілерін интерпретациялау
Оқыту нәтижесі: коммуникативтік қабілеттіліктер
  • оқушылардың коммуникативтік қабілеттерін дамыту және жетілдіру;
  • қазіргі әлемдегі жасанды интеллект жүйелерінің рөлі мен маңызы, жүйелердегі әртүрлі бағыттар туралы сындарлы диалогқа қатысу дағдыларын дамыту жасанды интеллект
Оқыту нәтижесі: Оқу дағдылары немесе сабаққа қабілеттілігі
  • ғылыми-зерттеу жұмыстарын орындау үшін жасанды интеллект жүйесі саласында дағдыларды қалыптастыру
  • кеңес беру жүйесін құру дағдыларын дамыту
  • білім қоғамын құру мүддесі үшін академиялық және кәсіби контексттерде технологиялық, әлеуметтік немесе мәдени дамуға үлес қосу мүмкіндігі
Оқыту әдістері

- лекциялар мен онлайн дәрістер, слайдтар мен басқа мультимедиялық құралдарды пайдалана отырып зертханалық сабақтар.

Білім алушының білімін бағалау

Оқытушы ағымдағы бақылау жұмыстарының барлық түрлерін жүргізеді және академиялық кезеңде екі рет білім алушылардың ағымдағы үлгеріміне тиісті баға береді. Ағымдағы бақылау нәтижелері бойынша 1 және 2 рейтинг қалыптастырылады. Білім алушының оқу жетістіктері 100 балдық шкала бойынша бағаланады, Р1 және Р2 қорытынды бағасы ағымдағы үлгерім бағасынан орташа арифметикалық ретінде шығарылады. Академиялық кезеңде білім алушының жұмысын бағалауды пән бойынша тапсырмаларды тапсыру кестесіне сәйкес оқытушы жүзеге асырады. Бақылау жүйесі жазбаша және ауызша, топтық және жеке формаларды біріктіре алады.

Кезең Тапсырма түрі Өлшем
1  рейтинг Жеке тапсырма №1 0-100
Жеке тапсырма №2
Жеке тапсырма №3
2  рейтинг Жеке тапсырма №4 0-100
Жеке тапсырма №5
Жеке тапсырма №6
Қорытынды бақылау емтихан 0-100
Жұмыс түрлері бойынша оқыту нәтижелерін бағалау саясаты
Тапсырма түрі 90-100 70-89 50-69 0-49
Өте жақсы Жақсы Қанағаттанарлық Қанағаттанарлықсыз
Бағалау нысаны

Пән бойынша білім алушының білімін қорытынды бағалау 100 баллдық жүйе бойынша жүзеге асырылады және:

  • Емтиханда алынған нәтиженің 40%;
  • Ағымдағы үлгерімнің 60% - ы.

Қорытынды бағаны есептеу формуласы:

И= 0,6 Р12 +0,4Э
2

 

мұндағы, Р1, Р2-тиісінше бірінші, екінші рейтингті бағалаудың сандық эквиваленттері;

Э - емтихандағы бағаның сандық баламасы.

Қортынды әріптік бағасы және оның балдық сандық эквиваленті:

Төрт балдық жүйе бойынша цифрлық баламаға сәйкес келетін білім алушылардың оқу жетістіктерін бағалаудың әріптік жүйесі:

Әріптік жүйе бойынша бағалар Балдардың сандық эквиваленті Балдар (%-тік құрамы) Дәстүрлі жүйе бойынша бағалар
A 4.0 95-100 Өте жақсы
A- 3.67 90-94
B+ 3.33 85-89 Жақсы
B 3.0 80-84
B- 2.67 75-79
C+ 2.33 70-74
C 2.0 65-69 Қанағаттанарлық
C- 1.67 60-64
D+ 1.33 55-59
D 1.0 50-54
FX 0.5 25-49 Қанағаттанарлықсыз
F 0 0-24
Дәріс сабақтарының тақырыптары
  • Күрделі жүйелердің модельдерін құру әдістері
  • Аналитикалық платформалар мен Data Mining пакеттерін таңдау критерийлері
  • Модельдеудің негізгі кезеңдері
  • Мәліметтерді талдау әдістемесі
  • Data Mining, KDD және олардың арасындағы байланыс
  • Аналитикалық есеп беру және көп өлшемді деректерді ұсыну
  • Деректер қоймасы
  • Есептің әрбір түрі үшін ең көп қолданылатын алгоритмдер
  • Мәліметтерді дайындау қадамдары
  • Гипотеза ұсыну
  • Фактілерді жинау және жүйелеу әдістері
  • Маңызды факторларды анықтау үшін сараптама әдістері
  • Жартылай және кешенді өңдеу туралы түсініктер
  • Алынған үлгілердің сапасын талдау
  • Мәліметтерді талдау жүйесін енгізудің негізгі кезеңдері
Негізгі әдебиет
  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2020. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // ЭБС Юрайт [сайт]. — URL: https://urait.ru/bcode/450166 (дата обращения:06.04.2022).
  • Маккинли, Уэс Python и анализ данных / Уэс Маккинли ; перевод А. Слинкина. — 2-е изд. — Саратов : Профобразование, 2019. — 482 c. — ISBN 978-5-4488-0046-7. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/88752.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей
  • Барсегян, А.А., Куприянов М. С. и др. Технологии анализа данных : Data Mining, Visual Mining, Text Minning, OLAP : учеб. - 2-е изд., перераб. и доп. -СПб. : БХВ-Петербург, 2017.
Қосымша әдебиеттер
  • Шнарева, Г. В. Анализ данных : учебно-методическое пособие / Г. В. Шнарева, Ж. Г. Пономарева. — Симферополь : Университет экономики и управления, 2019. — 129 c. — ISBN 2227-8397. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/89482.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей
  • Мельниченко, А. С. Математическая статистика и анализ данных : учебное пособие / А. С. Мельниченко. — Москва : Издательский Дом МИСиС, 2018. — 45 c. — ISBN 978-5-906953-62-9. — Текст : электронный // Электронно-библиотечная система IPR BOOKS : [сайт]. — URL: http://www.iprbookshop.ru/78563.html (дата обращения: 06.04.2022). — Режим доступа: для авторизир. пользователей