Как стать специалистом Data Science
Что делает Data Scientist, какая зарплата у начинающего дата-сайентиста и какие навыки нужны, чтобы развиваться в этой профессии.
Data Scientist: кто это
Data Scientist решает задачи бизнеса, работая с большими данными. Он собирает запросы компании и моделирует машинное обучение, что помогает предсказать изменение ключевых показателей или выявить существующие особенности. Его функции пересекаются с программированием, машинным обучением и статистикой.
Вы сталкиваетесь с Data Science каждый день.
Например, навигатор не раз направлял вас или вашего таксиста по неожиданному маршруту, хотя вы знали короткий путь.
В основе приложения лежит система, которую настроил дата-сайентист: она каждую секунду выгружает актуальные данные по ситуации на дороге. Если вы поехали другим путем — значит, на привычном была авария, и навигатор сэкономил вам время.
Что делает специалист по Data Science
Дата-сайентист решает задачи компании так: уточняет желаемый результат, определяет способ получения данных, выгружает и структурирует их, — и выстраивает модель для работы с ними.
Например, в компании-ритейлере проходит совещание с командой бизнес-аналитиков. Коллеги сообщили о падении продаж в сегменте бытовой химии в конкретном регионе: за неделю компания потеряла 7 миллионов. Задача: определить причину падения спроса и помочь исправить ситуацию.
Data Scientist в ритейле делает следующее
-
Анализирует данные, связанные с продажами бытовой химии во всех регионах присутствия сети за последний месяц. Используя статистические методы, он также исследует потребительские тренды в ритейле на данный момент, плюс — оценивает эффективность маркетинговых кампаний сети.
-
Получает несколько выборок по регионам и еще несколько — по направлениям. Определяет нужные признаки данных, очищает и подготавливает их для обучения математических моделей.
-
Обучает модели на основе этих исторических данных для прогнозирования спроса на определенный ассортимент товаров.
-
Анализирует результаты моделей прогнозирования спроса и сравнивает их с фактическими значениями на данный момент. Делает выводы и рекомендации по оптимизации поставок и управлением запасами.
-
Отправляет свои выводы бизнес-аналитикам, ожидает деталей по срокам решения проблемы.
-
В сроки, указанные коллегами, берет в работу мониторинг показателей, чтобы зафиксировать изменения.
Эти задачи требуют глубокого погружения в большие данные и оптимального моделирования, поэтому они могут занять недели, а иногда и месяцы работы. Аналитик данных и бизнес-аналитик тоже работают с данными, однако их задачи чаще выполняются около недели, поскольку специалисты сфокусированы на уже имеющейся статистике, а не на масштабных прогнозах.
5 навыков дата-сайентиста
5 основных навыков, необходимых для работы в Data Science
-
Статистика, вероятностные модели.
-
Работа с машинным обучением и искусственным интеллектом. Знание алгоритмов классификации и кластеризации данных, владение нейросетями.
-
Программирование на Python, SQL.
-
Бизнес-ориентация.
-
Английский уровня С1 Advanced и выше для чтения профильной литературы.
Эти навыки реально освоить с нуля: на курсе «Специалист по Data Science» от Академии Eduson вы научитесь анализировать данные, обучать и тестировать модели за 9 месяцев. Мы обучаем полноценной профессии Data Scientist с помощью понятных видеоуроков и интерактивных тренажеров. Кураторы ответят на вопросы по обучению в течение года с момента старта, а доступ к курсу останется навсегда. По завершении курса получите удостоверение о повышении квалификации.
Какие навыки нужны Junior, Middle и Senior Data Scientist
Требования к Junior Data Scientist:
-
Знание основных концепций и методов анализа данных.
-
Понимание специфики баз данных, основ статистики и машинного обучения.
-
Базовое владение SQL, уверенное программирование на Python.
Требования к Middle Data Scientist:
-
Глубокое понимание математики и статистики.
-
Опыт работы с различными типами данных и их обработкой (минимум 2 проекта).
-
Уверенное владение SQL, программирование на Python и понимание A/B тестирования.
-
Способность разрабатывать и реализовывать модели машинного обучения практически без помощи тимлида.
-
Умение визуализировать данные и представлять результаты анализа наглядно и понятно.
Требования к Senior Data Scientist:
-
Глубокое знание математики, статистики и машинного обучения.
-
Опыт разработки сложных моделей машинного обучения и их оптимизации (минимум 5 проектов).
-
Уверенные навыки программирования на Python, продвинутое владение SQL.
-
Ведущая роль в проектах, управление командой и распределение задач. Способность обучать младших коллег.
Востребована ли профессия Data Scientist?
Крайне: согласно исследованиям, к 2030 году больше трети компаний будут привлекать специалистов Data Science к принятию стратегических решений. Зарплата сайентистов, соответственно, вырастет.
Data Science в действии
В 2020 транспортная компания UPS запустила систему ORION, которая сэкономила около 37 000 000 литров топлива (объем равен примерно 37 000 бензовозам). Благодаря использованию искусственного интеллекта и машинного обучения ORION проложила десятки тысяч экономичных маршрутов, которые сберегли топливо и уменьшили выбросы углекислого газа.
В 2016 году появилась компания по изучению технологии сна SleepScore Labs. Эксперты из Гарварда и Apple проанализировали данные миллионов часов сна — и создали приложение, которое распознает скрежет зубов и прочие атрибуты беспокойного сна, чтобы предоставить рекомендации по улучшению самочувствия.
Какая зарплата у дата-сайентиста
Junior — 97 400 рублей (источник)
Middle — 216 143 рублей (источник)
Senior — 447 000 рублей (источник)
Отличия дата-сайентиста от бизнес-аналитика и аналитика данных
Data Scientist, бизнес-аналитик и аналитик данных — это роли, связанные с анализом данных, но у них есть отличия в обязанностях и фокусе работы.
Data Scientist занимается анализом больших объемов данных с использованием статистических методов и алгоритмов машинного обучения. Основная задача Data Scientist — найти закономерности в изменении больших массивов данных, выдвинуть гипотезы и спрогнозировать результаты. Дата-сайентисты имеют глубокие технические знания по математике, статистике и программированию.
Бизнес-аналитик фокусируется на анализе данных, чтобы понять бизнес-процессы и предоставить рекомендации для улучшения качества решений и результатов. Основная задача бизнес-аналитика — определить бизнес-требования, найти причину изменения показателей и подготовить отчеты. Бизнес-аналитики имеют хорошее понимание бизнес-процессов, обладают стратегическим мышлением, а также навыками визуализации данных и коммуникации как с представителями бизнеса, так и с его клиентами.
Аналитик данных собирает, обрабатывает и анализирует данные из различных источников. Основная задача аналитика данных — получить нужные данные, провести статистический анализ, создать отчеты и далее отслеживать метрики для оценки результатов. Аналитики данных обладают навыками работы с базами данных, программированием и статистическим анализом.