Люди давно поняли: данные дают ценную информацию, а ценная информация ведет к более правильным управленческим решениям. Значит, собирать данные — это правильно. Поэтому можно говорить, что данные, как технология, распространяются по миру с древних времен.
По некоторым данным, предоставленных компанией McKinsey, к 2019 году понадобится около 190 тысяч специалистов по данным только в США. Они же утверждают, что практически все менеджеры будущего должны будут обладать хотя бы обычными навыками работы с данными.

У многих в голове образ профессииdatascientistне совсем утвержден. Чаще всего представляется универсальный специалист, готовый решать аналитические задачи и умеет пользоваться компьютером. Но так ли это?
Чем же занимается DataScientist?
- Собирает большой объем неуправляемых данных и преобразовывает его в нужный формат
- Решает бизнес-задачи с использованием данных
- Изучает статистику работает над статистическими тестами и распределениями
- Использует различные методы (в основном аналитические:
- глубокое обучение — область изучения машинного обучения, которая использует данные для моделирования сложных абстракций,
- текстовая аналитика — процесс анализа неструктурированных данных, чтобы получить ключевые бизнес-идейи
- машинное обучение — отрасль искусственного интеллекта, основанная на математических алгоритмах и автоматизации)
- Знает такие языки программирования (R, Python, SAS) и базы данных MySQL
- Знает как визуализировать данные

Однако речь идет не только о программировании. Помимо вышеперечисленных задач, специалист data scientist должен быть связующим звеном между всеми участниками бизнес-процесса, то есть — говорить на одном языке как с аналитиками и разработчиками, так и с ключевыми сотрудниками и ее собственниками.
Приведем пример, как можно выявить дефекты и оптимизировать производственную цепочку с помощью Big Data.
GE Oil & Gas

General Electric Oil & Gas – одно из подразделений многоотраслевой корпорации GE, которое занимается производством высокотехнологичного оборудования для нефтегазового сектора. В условиях, когда снижаются цены на энергоресурсы, а сутки «простоя» могут обойтись в 7 миллионов долларов, жизненно важно минимизировать время незапланированной остановки производства, необходимо увеличивать эффективность нефтедобычи.
Благодаря сенсорам, установленным на продаваемом оборудовании, аналитики компании получают оперативную информацию о состоянии нефтедобычи, а для анализа массивов данных в 2012 году была разработана облачная платформа Predix, которая, используя алгоритмы машинного обучения, позволяла инженерам составлять расписания диагностических проверок, улучшать эффективность использования оборудования и снижать время «простоя», выявляя возможные неисправности до того, как они произойдут.
Результат: увеличение ежегодной добычи энергоресурсов и снижение убытков от неэффективного использования оборудования.
Таким образом, Data Scientist — человек, умеющий не только добывать информацию и её анализировать, но и обрабатывать большие массивы данных, совершая настоящее волшебство с помощью множества инструментов.
Оставьте комментарий