Data Science

Data Science

Стань востребованным Data Science разработчиком за 6 месяцев

Kaspi 0—0—12

50 000 тг. в месяц

Наши выпускники работают в:

Наши выпускники работают в:

1500+

1500+

обучено студентов

обучено студентов

658 000+

658 000+

cредняя зарплата

cредняя зарплата

3 558+

3 558+

вакансий на hh.kz

вакансий на hh.kz

Что такое Data Science?

Что такое Data Science?

Это 6-месячная интенсивная программа с интерактивными занятиями, которые проходят 3 раза в неделю с понедельника по пятницу, а также дополнительными сессиями с менторами по выходным. Вы будете изучать основы Data Science и Анализ Данных с использованием языка Python.

Программа

Программа

Модуль 1: Введение в Data Science

  • Введение в программирование

  • Введение в Data Science

  • Ревизия основных математических и статистических терминов

  • Основы Jupyter Notebook

  • Ревизия основных математических и статистических терминов

  • Введение в SQL: SELECT, WHERE, ORDER BY, GROUP BY

  • Основы Python: типы данных, переменные, циклы, условные операторы

  • Python для Data Science: pandas & NumPy

  • SQL: JOIN, подзапросы и оконные функции

  • Python: функции, модули и библиотеки

  • Python: pandas DataFrames, list comprehensions

Модуль 2: Анализ данных и статистика

  • Python: Исследование и визуализация данных с помощью

  • Описательная статистика: меры центральной тенденции и изменчивости

  • Нормальное распределение, Центрально-предельная теорема (ЦПТ - CLT)

  • Теория вероятностей: основные понятия, правила и распределения

  • Байесовская вероятность

  • Логическая статистика: выборка, проверка гипотез и p-значения

  • Доверительные интервалы и статистическая мощность

  • Линейная регрессия: подбор и оценка моделей

Модуль 3: Машинное обучение с Python

  • Введение в машинное обучение: supervised learning, unsupervised learning

  • Классические алгоритмы решения задач supervised learning

  • scikit-learn - supervised

  • Метрики оценки для моделей классификации и регрессии

  • Классические алгоритмы решения задач unsupervised learning

  • scikit-learn - unsupervised

  • Sampling — понятие о генерации подвыборок для обучения моделей

  • Undersampling

  • Oversampling

  • SMOTE

  • Выбор и оценка моделей

  • Оркестрирование моделей

  • Bagging и boosting

  • State-of-the-Art алгоритмы по решению задач машинного обучения

  • Умный тюнинг гиперпараметров модели

  • XGBoost vs LightGBM

  • Optuna / Neptune

Модуль 4: Проектная работа & Quality of Life или как облегчить себе работу (или жизнь)

  • Проектная работа

  • Git — система контроля версий

  • Github Copilot — ИИ помощник в разработке

  • Flask API — бэкенд в контексте Data Science

  • CRON — автоматизация скриптов .py

  • SMTP — автоматизированная отчетность

Наши менторы

Наши менторы

Арман Сулейменов

основатель, автор программ

Основатель и автор программ, главный лектор: со-основатель и CTO, Hora.AI (Индия, инвестор - глава поиска в Google), со-основатель и CEO, Zero To One Labs (ведущая студия мобильной разработки, 30 разработчиков, 40+ продуктов в портфолио).
Выпускник Принстонского Университета (Принстон, Нью-Джерси) по специальности
«Компьютерные науки». Финалист ACM ICPC World Finals (студенческого чемпионата
мира по программированию) в 2009 году (Стокгольм, Швеция) и 2011 году (Орландо,Флорида), преподаватель курсовых семинаров «Введение в компьютерные науки» в Принстонском Университете в течение 4 семестров в 2010-2012 годов.

Жасулан Шакенов

ментор

Senior Data Scientist в Magnum Cash & Carry. В
прошлом: Lead Data Scientist в Prime Source, Data Scientist в Kaspi.kz, Data-специалист в Kcell JSC.
Образование: МГУ (2013), KBTU (2017).

Нурали Узкалиев

ментор

Автор и главный лектор курса Data Science. Lead Data Scientist в
Kaspi.kz.
В прошлом: Data Scientist в Prime Source, Junior Software Engineer в UIB.
Образование: KBTU (2023), UIB (2020)

nFactorial Podcast

nFactorial Podcast