Получить доступ
Каталог
Нужна помощь?
Поделитесь мнением, задайте вопрос или сообщите об ошибке
Имя
E-mail
Телефон
warning
user
Направление
Школы
Искусственный интеллект
Аналитика и Data Science
Управление персоналом
Отменить
онлайн | С нуля |
старт
11 июня
Data Scientist с нуля в МГУ

Data Scientist
с нуля до PRO

Научитесь разрабатывать ML-модели
и обучать нейросети на практике
#
Реальные задачи от компаний-партнеров
#
Подходит новичкам без опыта в IT
#
9 проектов
в портфолио

Курс разработан совместно
с академиком РАН из МГУ им. Ломоносова

Алексей Львович Семенов

Заведующий кафедрой математической логики
и теории алгоритмов МГУ
№1
среди российских вузов
по версии Times Higher Education World Reputation Rankings 2024 года
Участник разработок ПО для ИИ и суперкомпьютеров, лауреат премии ЮНЕСКО в области цифровых технологий в образовании и премии им. А. Н. Колмогорова за выдающиеся достижения в области математики
Топ-100
лучших университетов мира в области естественных наук в рейтинге QS World University Rankings by Subject 2024
[1]

Чем занимается Data Scientist

[2]
Обрабатывает большие объемы неструктурированной информации
и превращает ее в упорядоченный
набор данных
[3]
Строит и тестирует математические модели. Находит закономерности, дает прогнозы и предлагает лучшие решения в разных сферах
Например, дата-сайентист может оценить будущий спрос на товары и услуги, построить систему распознавания лиц, или разработать рекомендательную систему

Ваши навыки после обучения

Вы сможете:

Программировать на Python
Работать с API
Работать в одном из двух направлений — ML- или CV-инженерии
Конвертирование бизнес-задачи
в технические и наоборот
Обрабатывать данные
Создавать математических и ML-модели

Инструменты:

Airflow
Docker
Linux
Git
Postgresql
mongodb
nosql
headoop
keras
plotly
matplotlib
Seaborn
Numpy
Pandas
Sql
python

Истории студентов,
окончивших курс

Раньше: инструктор по йоге
После курса: дата-сайентист в DSK Bank

«C собеседования я вышла с уверенностью, что упустила шанс. Но мне перезвонили, и вот я Data Scientist в самом крупном банке Болгарии.»

Отзыв о курсе Python-разработчик в skillfactory

Анна
Данилова

36 лет,
София, Болгария

Раньше: руководитель группы кредитных инспекторов
После курса: аналитик процессов в «Тинькофф Банк»

«Обучение быстро окупилось по деньгам, но не это главное — я занимаюсь тем, что мне интересно, с удовольствием езжу на работу, трачу часть своей жизни не впустую, а на любимое дело.»

Отзыв о курсе Python-разработчик в skillfactory

Даниил
Югай

26 лет,
Москва

Раньше: инструктор по скалолазанию
После курса: аналитик данных в компании «Спутник»

«На поиск работы у меня ушло два месяца. Я получил примерно 10 откликов, сделал около четырех тестовых заданий, прошел одно собеседование, после которого меня взяли на работу.»

Отзыв о курсе Python-разработчик в skillfactory

Борис
Казаков

26 лет,
Петровац, Черногория

Раньше: переводчик
После курса: «Эксмо-АСТ»: дата-сайентист и проджект-менеджер

«На хакатоне „Эксмо-АСТ“ я показала навыки и теперь совмещаю две роли: дата-сайентиста и проджект-менеджера»

Отзыв о курсе Python-разработчик в skillfactory

Асият
Щамхалова

36 лет,
София

Раньше: Procter and Gamble, финансист
После курса: AUTO1, джуниор дата-сайентист

«Я стал дата-сайентистом, и моя зарплата выросла в 3,5 раза»

Отзыв о курсе Python-разработчик в skillfactory

Виктор
Коваценко

25 лет,
Берлин, Германия

Раньше: Центральный институт авиационного моторостроения, специалист
После курса: Страховой дом ВСК, middle дата-сайентист

«Я прошел годовой курс за три с половиной месяца и стал middle дата-сайентистом»

Отзыв о курсе Python-разработчик в skillfactory

Сергей
Светлаков

25 лет,
Москва

Раньше: Johnson & Johnson, финансовый контролер

«Главное во всем — целенаправленно действовать, и все обязательно получится»

Отзыв о курсе Python-разработчик в skillfactory

Надежда
Ковалева

39 лет,
Краснодар

Раньше: заведующий складом в автотранспортном хозяйстве
После курса: «Юникс», менеджер по оптовым продажам автотоваров

«Я учился программированию в 90-х, но решил все вспомнить и теперь обучаю нейронные сети»

Отзыв о курсе Python-разработчик в skillfactory

Олег
Плюснин

48 лет,
Киров

Как построено обучение

Программа курса составлена вместе с опытными дата-сайентистами — они прошли путь от новичка до старшего специалиста

25 месяцев 520 часов практики 224 часа теории 7 проектов 2 финальных проекта

База

Введение

1 неделя
  • INTRO-1. Как учиться эффективно — онбординг по обучению
  • INTRO-2. Обзор профессии. Типы задач в Data Science. Этапы и подходы к разработке Data Science-проекта
Вы сможете
  • сформулировать для себя реальные цели обучения
  • узнать, в чем ценность DS для бизнеса
  • познакомиться с основными задачами дата-сайентиста
  • разобраться, как строится разработка любого DS-проекта

Проектирование разработки

5 недель
  • PYTHON-1. Основы Python
  • PYTHON-2. Погружение в типы данных
  • PYTHON-3. Условные операторы
  • PYTHON-4. Циклы
  • PYTHON-5. Функции и функциональное программирование
  • PYTHON-6. Практика
  • PYTHON-7. Бонус: гайд по стилю в среде Python
Вы сможете
  • работать с основными типами данных с помощью языка Python
  • применять в повседневной работе циклические конструкции, условные операторы и функции

Основы математики

7 недель
  • MATH-1. Числа и выражения
  • MATH-2. Уравнения и неравенства
  • MATH-3. Основные понятия теории функций
  • MATH-4. Основы геометрии: планиметрия, тригонометрия и стереометрия
  • MATH-5. Множества, логика и элементы статистики
  • MATH-6. Комбинаторика и основы теории вероятности
  • MATH-7. Решение задач
Вы научитесь:
  • совершать операции над числами
  • решать уравнения
  • использовать свойства функций и их графиков
  • решать математические задачи

Работа с данными

8 недель
1 проект
  • PYTHON-8. Инструменты Data Science
  • PYTHON-9. Библиотека NumPy
  • PYTHON-10. Введение в Pandas
  • PYTHON-11. Базовые приемы работы с данными в Pandas
  • PYTHON-12. Продвинутые приемы работы с данными в Pandas
  • PYTHON-13. Очистка данных
  • PYTHON-14. Визуализация данных
  • PYTHON-15. Принципы ООП в Python и отладка кода (дополнительный модуль)
Вы научитесь:
  • подготавливать, очищать и преобразовывать данные
  • анализировать данные с помощью популярных библиотек Matplotlib, Seaborn, Plotly

Проект 1. Аналитика датасета по закрытым вопросам

Подгрузка данных

6 недель
1 проект
  • PYTHON-16. Как выгружать данные из файлов разных форматов
  • PYTHON-17. Получение данных из веб-источников и API
  • SQL-0. Привет, SQL!
  • SQL-1. Основы SQL
  • SQL-2. Агрегатные функции
  • SQL-3. Соединение таблиц
  • SQL-4. Сложные объединения
Вы научитесь:
  • выгружать данные из разных форматов и источников при помощи SQL
  • использовать агрегатные функции, соединения таблиц и сложные объединения

Проект 2. Подгрузка новых данных. Уточнение анализа

Разведывательный анализ данных

7 недель
1 проект
  • EDA-1. Введение в разведывательный анализ данных. Алгоритмы и методы EDA
  • EDA-2. Математическая статистика в контексте EDA. Типы признаков
  • EDA-3. Проектирование признаков (Feature Engineering)
  • EDA-4. Статистический анализ данных на Python. Часть 1
  • EDA-5. Статистический анализ данных на Python.
  • EDA-6. Проектирование экспериментов
  • EDA-7. Kaggle-площадка
Вы научитесь:
  • проводить разведывательный анализ данных (EDA) с помощью библиотек Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas
  • работать на Kaggle, популярной платформе для участия в соревнованиях

Проект 3. EDA + Feature Engineering. Соревнование на Kaggle

Введение в машинное обучение

9 недель
1 проект
  • ML-1. Теория машинного обучения
  • ML-2. Обучение с учителем: регрессия
  • ML-3. Обучение с учителем: классификация
  • ML-4. Обучение без учителя: кластеризация и техники понижение размерности
  • ML-5. Валидация данных и оценка модели
  • ML-6. Отбор и селекция признаков
  • ML-7. Оптимизация гиперпараметров модели
  • ML-8. ML Cookbook
Вы научитесь:
  • обучать основные виды ML-моделей
  • проводить валидацию
  • интерпретировать результаты работы и выбирать важные признаки (feature importance)

Проект 4. Задача классификации

Основной блок

Математика и машинное обучение

6 недель
1 проект
  • MATH&ML-1. Линейная алгебра в контексте линейных методов. Часть 1
  • MATH&ML-2. Линейная алгебра в контексте линейных методов. Часть 2
  • MATH&ML-3. Математический анализ в контексте задачи оптимизации. Часть 1
  • MATH&ML-4. Математический анализ в контексте задачи оптимизации. Часть 2
  • MATH&ML-5. Математический анализ в контексте задачи оптимизации. Часть 3
Вы научитесь
  • решать практические задачи с помощью ручного счета и Python
  • производить векторные и матричные вычисления
  • работать с множествами
  • исследовать функции с помощью дифференциального анализа

Проект 5. Задача регрессии

Математика и машинное обучение

6 недель
1 проект
  • MATH&ML-6. Теория вероятностей в контексте наивного байесовского классификатора
  • MATH&ML-7. Алгоритмы на основе деревьев решений
  • MATH&ML-8. Бустинг и стекинг
  • MATH&ML-9. Кластеризация и техники понижения размерности. Часть 1
  • MATH&ML-10. Кластеризация и техники понижения размерности. Часть 2
  • Вы познакомитесь с основными понятиями теории вероятности и математической статистики, алгоритмами кластеризации.
  • Научитесь оценивать качество произведенной кластеризации и представлять результаты в графическом виде.

Проект 6. Сегментирование клиентов онлайн-магазина подарков

Дискретная математика

4 недели
  • MATH&MGU-1 Множества и комбинаторика
  • MATH&MGU-2 Логика
  • MATH&MGU-3 Графы. Часть 1
  • MATH&MGU-4 Графы. Часть 2

ML в бизнесе

8 недель
1 проект
  • MATH&ML-11. Временные ряды. Часть 1
  • MATH&ML-12. Временные ряды. Часть 2
  • MATH&ML-13. Рекомендательные системы. Часть 1
  • MATH&ML-14. Рекомендательные системы. Часть 2
  • PROD-1. Подготовка модели к продакшену
  • PROD-2. Прототип Streamlit + Heroku
  • PROD-3. Бизнес-понимание. Кейс
Вы научитесь:
  • использовать ML-библиотеки для решения задачи временных рядов и рекомендательных систем
  • обучать ML-модель и проводить ее валидацию
  • создавать работающий прототип и запускать модель в веб-интерфейсе
  • проводить A/B-тесты для оценки модели

Проект 7. Тема на выбор: временные ряды или рекомендательные системы

Уровень PRO

ML или CV

10 недель

Вам предстоит сделать выбор, по какому пути двигаться дальше.

Вы узнаете о каждой специализации и решите несколько практических задач, чтобы было проще определиться.

ML-инженер

29 недель
  • Введение в Deep Learning
  • Основы Data Engineering
  • Дополнительные главы Python и ML
  • Экономическая оценка эффектов и разработка MVP
  • ML в продакшене
  • Углубленное изучение ML-разработки
Вы научитесь:
  • решать углубленные задачи машинного обучения
  • работать с библиотеками Python
  • создавать MVP (минимально жизнеспособную версию продукта)

Выпускной проект по выбранной теме

CV-инженер

29 недель
  • Deep Learning в задачах Computer Vision
  • Базовые задачи Computer Vision
  • Проект: детектирование медицинских масок
  • Проект: сегментация космических аппаратов
  • Продвинутые задачи Computer Vision
  • Real life CV-специалиста и работа над дипломом
Вы научитесь:
  • решать задачи компьютерного зрения (классификация изображений, сегментация и детекция, генерация и стилизация)
  • выводить нейронные сети в продакшен

Выпускной проект по выбранной теме

«Моторика»

Пройдете стажировку от компании-партнера

В рамках стажировки вы усовершенствуете прототип протеза руки на базе оптических датчиков. Это отличная возможность применить полученные знания на практике и добавить проект в портфолио
Российский разработчик и производитель роботизированных функциональных тяговых
и бионических протезов рук для детей и взрослых

Кто обучает студентов

Куратор, преподаватели и менторы — опытные дата-сайентисты. Они составляют программу, следят за ее актуальностью
на рынке, продумывают и проверяют задания

Алексей Семенов

Академик РАН
Заведующий кафедрой математической логики и теории алгоритмов МГУ

Эмиль Магеррамов

Ведущий автор разделов ML и DS
Руководитель группы вычислительной химии в BIOCAD

Создает сервисы и модели машинного обучения, которые помогают химикам быстрее выпускать лекарства

Михаил Баранов

Автор раздела курса
Эксперт по Data Science

Компетенции: машинное обучение, большие данные, Python

Маргарита Бурова

Ведущий автор раздела MATH&ML
Эксперт по Data Science
Компетенции: Python, машинное обучение, статистика, анализ данных

Александр Рыжков

Автор раздела про Kaggle
Руководитель команды LightAutoML
Kaggle Grandmaster

Компетенции: ML/DS, Python, математика, статистика, Kaggle

Екатерина Трофимова

Автор модулей по EDA
Исследователь лаборатории методов анализа больших данных, факультет компьютерных наук НИУ ВШЭ

Компетенции: Python, PyTorch, CV, GNN

Мария Жарова

Data Scientist в Wildberries

Владимир Горюнов

Антон Киселев

Ведущий автор раздела «Введение в DS»
Head of Marketing Analytics, Playrix
Эксперт по данным с опытом 15+ лет

Компетенции: Data Science
Ментор Skillfactory на курсах по Data Science, Data Engineering и fullstack-разработке на Python

Леонид Саночкин

Ментор по NLP

Андрей Рысистов

Автор модулей по Python и ML
Эксперт DS, преподаватель Skillfactory, автор курсов, автор и соавтор нескольких научных исследований и работ.
Сфера интересов — искусственный интеллект в авиационных технических системах

Елена Мартынова

Научный сотрудник AIRI
10+ лет занимается исследованиями в области NLP
Ментор Skillfactory
Компетенции: BI, SQL, Python, аналитика
Ментор
Ментор
Ментор
Ментор

Алек Леков

Senior ML Engineer, МТС
Основные компетенции — временные ряды, Deep Learning и нейронные сети.
Занимается консалтингом в сфере AI
КУРАТОР КУРСА

Как проходит
обучение

В среднем оно занимает 10 часов в неделю — это 2 часа учебы в день по будням или 5 часов по выходным. Доступ к материалам курса остается навсегда

  • Формат
    • Теория на понятном языке и много практики внутри единой онлайн- платформы
    • Записанные лекции и задания для самостоятельной работы
    • Разбор сложных тем на вебинарах с менторами
    • Тренажеры с десятками заданий в каждом модуле программы
  • Обратная связь
    • Менторы и координаторы поддержат и ответят на вопросы
    • Менторы — опытные дата-сайентисты. Помогут разобраться в темах и проверят домашние задания.
    • Координаторы — команда заботы о студентах. Решат организационные вопросы, поддержат и помогут пройти обучение до конца.
  • IT-сообщество
    • На курсе у вас появятся связи, полезные для продвижения в сфере
    • Общий чат курса, чтобы общаться с другими студентами
    • Чат с ментором, чтобы прояснить непонятные темы и задания
    • Мероприятия и стажировки с партнерами, чтобы наработать опыт и показать свои скиллы работодателям
  • Центр карьеры
    • Поможем построить новую карьеру и будем с вами до самого оффера
    • Соберем сильное резюме и расскажем, где искать вакансии
    • Сформируем карьерный трек и подготовим к поиску работы
    • Потренируем проходить собеседования
    • Научим искать работу за рубежом
Записаться на курс
-5%
1 173 с/мес
1 235 с/мес
В рассрочку на 24 мес
Скидка по промокоду:
Кешбэк 30%: 8 444 балла на Lerna
Data Scientist с нуля до PRO
Длительность: 25 мес
Старт курса: 11 июня
Заполните контактные данные
Имя
Телефон
E-mail
Промокод
Название компании
Отправить заявку
Ознакомиться с условиями публичного договора
success
error
warning

Часто задаваемые
вопросы

  • Нужны ли мне знания в математике или других точных науках, чтобы изучать Data Science?

    Нет, вам не понадобится знаний, выходящих за рамки школьной программы. Мы будем учить той математике, которая пригодится. Если вы когда-то были знакомы с высшей математикой и статистикой, то вы сможете быстрее вспомнить материал.

  • В чем разница между дата-аналитиком и дата-сайентистом?

    Основное отличие в том, что аналитик работает с ретроспективными данными здесь и сейчас. Например, он может построить дашборд со всеми показателями компании, определить падающие метрики и дать рекомендации по их улучшению.

    Дата-сайентист тоже работает с данными, но, в отличе от аналитика, он создает модели, которые предсказывают будущее. Например, он может разработать модель, которая будет анализировать поведение покупателя на маркетплейсе и рекомендовать ему нужные товары.

  • Какое оборудование нужно для обучения?

    Ноутбук или стационарный компьютер на macOS или Windows версии Vista и выше. Желательный объем оперативной памяти — от 8 ГБ. Все инструкции по установке необходимого ПО вышлем до начала обучения.

  • Что будет, если я не успею выполнить задания или пропущу часть занятий?

    Уточните у координатора, можно ли перевестись на один из следующих потоков курса. Вы всегда можете обратиться к координатору и получить индивидуальную поддержку по любым организационным вопросам и проблемам.

  • Нужен ли английский для прохождения курса?

    Нет, все обучение — на русском языке. Иногда мы можем давать ссылки на англоязычные материалы, но только на дополнительные, а не основные.

  • Отрасли применения Data Science

    С помощью обучающих алгоритмов машинного обучения можно научить программы делать что угодно:

    1. Предлагать дополнительные товары, которые пользователь купит с наибольшей вероятностью, на основе его поведения на сайте и покупок. Таким образом увеличивать продажи и прибыль бизнеса. Этому вы научитесь в модулях по рекомендательным системам.

    2. Предсказывать события в клиентской базе. Таким образом можно заранее предпринять меры, которые сократят расходы или увеличат прибыль. Возьмем для примера страховую компанию, которая предоставляет услуги ДМС. Если она научит программу предсказывать, кто из клиентов в ближайшее время обратится за дорогостоящей медицинской услугой, то сможет предпринять меры, чтобы сократить расходы по ДМС. Например, позвонить клиенту и предложить ему проконсультироваться с хорошим врачом, чтобы не допустить развития болезни. Прогнозирование вы изучите в блоке «Введение в машинное обучение».

    3. Формировать заказы на поставку для магазинов сети с учетом динамики продаж, сезона, прогноза погоды и других параметров. Таким образом не допускать, чтобы в торговых точках было затоваривание или нехватка товара. Построению таких моделей посвящены разделы курса по анализу временных рядов.

    4. Сегментировать клиентов, чтобы делать им подходящие предложения. Возьмем для примера банк, который создал новый вид кредита. С помощью машинного обучения он может выявить в базе клиентов тех, кто вероятнее всего воспользуется таким кредитом. Решать такие задачи вы научитесь в блоке «Математика и углубленное машинное обучение».

    5. Области применения машинного обучения и Python практически безграничны: от контроля качества товаров до диагностики оборудования на производстве, от продаж до аналитики, от повышения персонализации до аудита. Вы сможете использовать возможности алгоритмов практически в любой сфере. Проекты нашей учебной программы не ограничены какой-то определенной индустрией — вы сможете понять весь спектр применения анализа данных.

  • Что потребуется для успешного обучения?

    Ноутбук с установленным Python (мы дадим инструкцию и поможем с установкой). Около 8-10 часов в неделю и желание получить новые знания.

  • Нужно ли быть программистом, чтобы освоить Data Science?

    Нет, не нужно. Мы научим вас программировать.

  • У меня не очень мощный компьютер. Я смогу заниматься?

    Сможете, конечно! Для занятий не нужен мощный домашний компьютер или дорогая видеокарта. Достаточно компьютера с выходом в интернет. Мы научим вас использовать облачные технологии для вычислений.

  • Сколько времени нужно будет уделять учебе? Я еще и работаю!

    От 8 часов в неделю. Если уже есть опыт в этой сфере, то занятия и выполнение заданий займут меньше времени. Можно заниматься в удобном для вас графике.

  • Что лучше: аналитик данных или Data Scientist?

    Думаем, неверно ставить вопрос таким образом. Лучше то, что вам больше нравится. Сферы специалистов похожи, но деятельность и результат разные.

    Основное отличие в том, что дата-аналитик работает с ретроспективными данными и помогает руководителям бизнеса принимать решения на их основе. А дата-сайентист смотрит в будущее и создает такие модели, которые могут упростить, модифицировать, улучшить процессы в работе компании.

  • Какое образование должно быть у аналитика данных?

    В аналитику можно прийти из любой сферы и изучать направление с нуля. Бонусом будет техническое и IT-образование.

  • Как долго учиться на аналитика данных?

    Обучение может длиться от пяти месяцев до пяти лет — это зависит от образовательного учреждения. Курс «Data Scientist с нуля до PRO» от Skillfactory рассчитан на 25 месяцев. За это время вы освоите продвинутую математику с азов, научитесь создавать ML-модели и работать с нейросетями, получите реальный опыт на практических проектах.

  • В чем разница между Data Science и Machine Learning?

    Направления отличаются целями и задачами. Data Science извлекает полезную информацию из данных и предоставляет выводы для принятия решений. Она исследует паттерны, использует статистику, визуализирует данные. Machine Learning фокусируется на создании моделей, способных автоматически делать прогнозы на основе данных.

  • В чем разница между Data Scientist и Data Engineer?

    У специалистов разные цели в работе. Data Scientist решает задачи бизнеса: строит прогнозные модели, проверяет гипотезы, делает выводы. Data Engineer отвечает за удобное и надежное хранение информации и быстрый доступ к ней. Это позволяет другим специалистам работать с корректными и актуальными данными.