Программа курса составлена вместе с опытными дата-сайентистами — они прошли путь от новичка до старшего специалиста
Проект 1. Аналитика датасета по закрытым вопросам
Проект 2. Подгрузка новых данных. Уточнение анализа
Проект 3. EDA + Feature Engineering. Соревнование на Kaggle
Проект 4. Задача классификации
Проект 5. Задача регрессии
Проект 6. Сегментирование клиентов онлайн-магазина подарков
Проект 7. Тема на выбор: временные ряды или рекомендательные системы
Вам предстоит сделать выбор, по какому пути двигаться дальше.
Вы узнаете о каждой специализации и решите несколько практических задач, чтобы было проще определиться.
Выпускной проект по выбранной теме
Выпускной проект по выбранной теме
В среднем оно занимает 10 часов в неделю — это 2 часа учебы в день по будням или 5 часов по выходным. Доступ к материалам курса остается навсегда
Нет, вам не понадобится знаний, выходящих за рамки школьной программы. Мы будем учить той математике, которая пригодится. Если вы когда-то были знакомы с высшей математикой и статистикой, то вы сможете быстрее вспомнить материал.
Основное отличие в том, что аналитик работает с ретроспективными данными здесь и сейчас. Например, он может построить дашборд со всеми показателями компании, определить падающие метрики и дать рекомендации по их улучшению.
Дата-сайентист тоже работает с данными, но, в отличе от аналитика, он создает модели, которые предсказывают будущее. Например, он может разработать модель, которая будет анализировать поведение покупателя на маркетплейсе и рекомендовать ему нужные товары.
Ноутбук или стационарный компьютер на macOS или Windows версии Vista и выше. Желательный объем оперативной памяти — от 8 ГБ. Все инструкции по установке необходимого ПО вышлем до начала обучения.
Уточните у координатора, можно ли перевестись на один из следующих потоков курса. Вы всегда можете обратиться к координатору и получить индивидуальную поддержку по любым организационным вопросам и проблемам.
Нет, все обучение — на русском языке. Иногда мы можем давать ссылки на англоязычные материалы, но только на дополнительные, а не основные.
С помощью обучающих алгоритмов машинного обучения можно научить программы делать что угодно:
1. Предлагать дополнительные товары, которые пользователь купит с наибольшей вероятностью, на основе его поведения на сайте и покупок. Таким образом увеличивать продажи и прибыль бизнеса. Этому вы научитесь в модулях по рекомендательным системам.
2. Предсказывать события в клиентской базе. Таким образом можно заранее предпринять меры, которые сократят расходы или увеличат прибыль. Возьмем для примера страховую компанию, которая предоставляет услуги ДМС. Если она научит программу предсказывать, кто из клиентов в ближайшее время обратится за дорогостоящей медицинской услугой, то сможет предпринять меры, чтобы сократить расходы по ДМС. Например, позвонить клиенту и предложить ему проконсультироваться с хорошим врачом, чтобы не допустить развития болезни. Прогнозирование вы изучите в блоке «Введение в машинное обучение».
3. Формировать заказы на поставку для магазинов сети с учетом динамики продаж, сезона, прогноза погоды и других параметров. Таким образом не допускать, чтобы в торговых точках было затоваривание или нехватка товара. Построению таких моделей посвящены разделы курса по анализу временных рядов.
4. Сегментировать клиентов, чтобы делать им подходящие предложения. Возьмем для примера банк, который создал новый вид кредита. С помощью машинного обучения он может выявить в базе клиентов тех, кто вероятнее всего воспользуется таким кредитом. Решать такие задачи вы научитесь в блоке «Математика и углубленное машинное обучение».
5. Области применения машинного обучения и Python практически безграничны: от контроля качества товаров до диагностики оборудования на производстве, от продаж до аналитики, от повышения персонализации до аудита. Вы сможете использовать возможности алгоритмов практически в любой сфере. Проекты нашей учебной программы не ограничены какой-то определенной индустрией — вы сможете понять весь спектр применения анализа данных.
Ноутбук с установленным Python (мы дадим инструкцию и поможем с установкой). Около 8-10 часов в неделю и желание получить новые знания.
Нет, не нужно. Мы научим вас программировать.
Сможете, конечно! Для занятий не нужен мощный домашний компьютер или дорогая видеокарта. Достаточно компьютера с выходом в интернет. Мы научим вас использовать облачные технологии для вычислений.
От 8 часов в неделю. Если уже есть опыт в этой сфере, то занятия и выполнение заданий займут меньше времени. Можно заниматься в удобном для вас графике.
Думаем, неверно ставить вопрос таким образом. Лучше то, что вам больше нравится. Сферы специалистов похожи, но деятельность и результат разные.
Основное отличие в том, что дата-аналитик работает с ретроспективными данными и помогает руководителям бизнеса принимать решения на их основе. А дата-сайентист смотрит в будущее и создает такие модели, которые могут упростить, модифицировать, улучшить процессы в работе компании.
В аналитику можно прийти из любой сферы и изучать направление с нуля. Бонусом будет техническое и IT-образование.
Обучение может длиться от пяти месяцев до пяти лет — это зависит от образовательного учреждения. Курс «Data Scientist с нуля до PRO» от Skillfactory рассчитан на 25 месяцев. За это время вы освоите продвинутую математику с азов, научитесь создавать ML-модели и работать с нейросетями, получите реальный опыт на практических проектах.
Направления отличаются целями и задачами. Data Science извлекает полезную информацию из данных и предоставляет выводы для принятия решений. Она исследует паттерны, использует статистику, визуализирует данные. Machine Learning фокусируется на создании моделей, способных автоматически делать прогнозы на основе данных.
У специалистов разные цели в работе. Data Scientist решает задачи бизнеса: строит прогнозные модели, проверяет гипотезы, делает выводы. Data Engineer отвечает за удобное и надежное хранение информации и быстрый доступ к ней. Это позволяет другим специалистам работать с корректными и актуальными данными.