Выбрать курс

Как стать специалистом Data Science

IT
7 минут
1279
11.09.2023
Вы узнаете:

Что делает Data Scientist, какая зарплата у начинающего дата-сайентиста и какие навыки нужны, чтобы развиваться в этой профессии.

Data Scientist: кто это

Data Scientist решает задачи бизнеса, работая с большими данными. Он собирает запросы компании и моделирует машинное обучение, что помогает предсказать изменение ключевых показателей или выявить существующие особенности. Его функции пересекаются с программированием, машинным обучением и статистикой.

Вы сталкиваетесь с Data Science каждый день.

Например, навигатор не раз направлял вас или вашего таксиста по неожиданному маршруту, хотя вы знали короткий путь.

В основе приложения лежит система, которую настроил дата-сайентист: она каждую секунду выгружает актуальные данные по ситуации на дороге. Если вы поехали другим путем — значит, на привычном была авария, и навигатор сэкономил вам время.

Что делает специалист по Data Science

Дата-сайентист решает задачи компании так: уточняет желаемый результат, определяет способ получения данных, выгружает и структурирует их, — и выстраивает модель для работы с ними.

Например, в компании-ритейлере проходит совещание с командой бизнес-аналитиков. Коллеги сообщили о падении продаж в сегменте бытовой химии в конкретном регионе: за неделю компания потеряла 7 миллионов. Задача: определить причину падения спроса и помочь исправить ситуацию.

Изображение

Data Scientist в ритейле делает следующее

  1. Анализирует данные, связанные с продажами бытовой химии во всех регионах присутствия сети за последний месяц. Используя статистические методы, он также исследует потребительские тренды в ритейле на данный момент, плюс — оценивает эффективность маркетинговых кампаний сети.

  2. Получает несколько выборок по регионам и еще несколько — по направлениям. Определяет нужные признаки данных, очищает и подготавливает их для обучения математических моделей.

  3. Обучает модели на основе этих исторических данных для прогнозирования спроса на определенный ассортимент товаров.

  4. Анализирует результаты моделей прогнозирования спроса и сравнивает их с фактическими значениями на данный момент. Делает выводы и рекомендации по оптимизации поставок и управлением запасами.

  5. Отправляет свои выводы бизнес-аналитикам, ожидает деталей по срокам решения проблемы.

  6. В сроки, указанные коллегами, берет в работу мониторинг показателей, чтобы зафиксировать изменения.

Эти задачи требуют глубокого погружения в большие данные и оптимального моделирования, поэтому они могут занять недели, а иногда и месяцы работы. Аналитик данных и бизнес-аналитик тоже работают с данными, однако их задачи чаще выполняются около недели, поскольку специалисты сфокусированы на уже имеющейся статистике, а не на масштабных прогнозах.

5 навыков дата-сайентиста

5 основных навыков, необходимых для работы в Data Science

  1. Статистика, вероятностные модели.

  2. Работа с машинным обучением и искусственным интеллектом. Знание алгоритмов классификации и кластеризации данных, владение нейросетями.

  3. Программирование на Python, SQL.

  4. Бизнес-ориентация.

  5. Английский уровня С1 Advanced и выше для чтения профильной литературы.

Эти навыки реально освоить с нуля: на курсе «Специалист по Data Science» от Академии Eduson вы научитесь анализировать данные, обучать и тестировать модели за 9 месяцев. Мы обучаем полноценной профессии Data Scientist с помощью понятных видеоуроков и интерактивных тренажеров. Кураторы ответят на вопросы по обучению в течение года с момента старта, а доступ к курсу останется навсегда. По завершении курса получите удостоверение о повышении квалификации.

Какие навыки нужны Junior, Middle и Senior Data Scientist

Требования к Junior Data Scientist:

  1. Знание основных концепций и методов анализа данных.

  2. Понимание специфики баз данных, основ статистики и машинного обучения.

  3. Базовое владение SQL, уверенное программирование на Python.

Требования к Middle Data Scientist:

  1. Глубокое понимание математики и статистики.

  2. Опыт работы с различными типами данных и их обработкой (минимум 2 проекта).

  3. Уверенное владение SQL, программирование на Python и понимание A/B тестирования.

  4. Способность разрабатывать и реализовывать модели машинного обучения практически без помощи тимлида.

  5. Умение визуализировать данные и представлять результаты анализа наглядно и понятно.

Требования к Senior Data Scientist:

  1. Глубокое знание математики, статистики и машинного обучения.

  2. Опыт разработки сложных моделей машинного обучения и их оптимизации (минимум 5 проектов).

  3. Уверенные навыки программирования на Python, продвинутое владение SQL.

  4. Ведущая роль в проектах, управление командой и распределение задач. Способность обучать младших коллег.

Востребована ли профессия Data Scientist?

Крайне: согласно исследованиям, к 2030 году больше трети компаний будут привлекать специалистов Data Science к принятию стратегических решений. Зарплата сайентистов, соответственно, вырастет.

Data Science в действии

В 2020 транспортная компания UPS запустила систему ORION, которая сэкономила около 37 000 000 литров топлива (объем равен примерно 37 000 бензовозам). Благодаря использованию искусственного интеллекта и машинного обучения ORION проложила десятки тысяч экономичных маршрутов, которые сберегли топливо и уменьшили выбросы углекислого газа.

Изображение

В 2016 году появилась компания по изучению технологии сна SleepScore Labs. Эксперты из Гарварда и Apple проанализировали данные миллионов часов сна — и создали приложение, которое распознает скрежет зубов и прочие атрибуты беспокойного сна, чтобы предоставить рекомендации по улучшению самочувствия.

Какая зарплата у дата-сайентиста

Junior — 97 400 рублей (источник)

Middle — 216 143 рублей (источник)

Senior — 447 000 рублей (источник)

Отличия дата-сайентиста от бизнес-аналитика и аналитика данных

Data Scientist, бизнес-аналитик и аналитик данных — это роли, связанные с анализом данных, но у них есть отличия в обязанностях и фокусе работы.

Data Scientist занимается анализом больших объемов данных с использованием статистических методов и алгоритмов машинного обучения. Основная задача Data Scientist — найти закономерности в изменении больших массивов данных, выдвинуть гипотезы и спрогнозировать результаты. Дата-сайентисты имеют глубокие технические знания по математике, статистике и программированию. 

Бизнес-аналитик фокусируется на анализе данных, чтобы понять бизнес-процессы и предоставить рекомендации для улучшения качества решений и результатов. Основная задача бизнес-аналитика — определить бизнес-требования, найти причину изменения показателей и подготовить отчеты. Бизнес-аналитики имеют хорошее понимание бизнес-процессов, обладают стратегическим мышлением, а также навыками визуализации данных и коммуникации как с представителями бизнеса, так и с его клиентами.

Аналитик данных собирает, обрабатывает и анализирует данные из различных источников. Основная задача аналитика данных — получить нужные данные, провести статистический анализ, создать отчеты и далее отслеживать метрики для оценки результатов. Аналитики данных обладают навыками работы с базами данных, программированием и статистическим анализом.

Вопросы и ответы

Какое обучение по Data Science лучше выбрать?

Нужно выбирать обучение, на котором вы освоите Python и SQL на видеоуроках и тренажерах, сможете попрактиковаться в реальных задачах и обратиться к куратору, если возникнут вопросы. Академия Eduson предлагает именно такой курс «Специалист по Data Science», который можно пройти в своем темпе с поддержкой куратора.

Можно ли освоить Data Science с нуля?

Да, можно стать дата-сайентистом без профильного высшего образования. На курсе «Специалист по Data Science» от Академии Eduson за 9 месяцев освоите все нужные навыки для старта в профессии, занимаясь 5-6 часов в неделю.