Реферат

Люди давно поняли: данные дают ценную информацию, а ценная информация ведет к более правильным управленческим решениям. Значит, собирать данные — это правильно. Поэтому можно говорить, что данные, как технология, распространяются по миру с древних времен. 

По некоторым данным, предоставленных компанией McKinsey, к 2019 году понадобится около 190 тысяч специалистов по данным только в США. Они же утверждают, что практически все менеджеры будущего должны будут обладать хотя бы обычными навыками работы с данными. 

Картинки по запросу Mckinsey

У многих в голове образ профессииdatascientistне совсем утвержден. Чаще всего представляется универсальный специалист, готовый решать аналитические задачи и умеет пользоваться компьютером. Но так ли это?

Чем же занимается DataScientist?

  • Собирает большой объем неуправляемых данных и преобразовывает его в нужный формат
  • Решает бизнес-задачи с использованием данных
  • Изучает статистику работает над статистическими тестами и распределениями
  • Использует различные методы (в основном аналитические: 
  • глубокое обучение — область изучения машинного обучения, которая использует данные для моделирования сложных абстракций, 
  • текстовая аналитика — процесс анализа неструктурированных данных, чтобы получить ключевые бизнес-идейи 
  • машинное обучение — отрасль искусственного интеллекта, основанная на математических алгоритмах и автоматизации)
  • Знает такие языки программирования (R, Python, SAS) и базы данных MySQL
  • Знает как визуализировать данные
Похожее изображение

Однако речь идет не только о программировании. Помимо вышеперечисленных задач, специалист data scientist должен быть связующим звеном между всеми участниками бизнес-процесса, то есть — говорить на одном языке как с аналитиками и разработчиками, так и с ключевыми сотрудниками и ее собственниками.

Приведем пример, как можно выявить дефекты и оптимизировать производственную цепочку с помощью Big Data.

GE Oil & Gas 

Картинки по запросу ge oil gas

General Electric Oil & Gas – одно из подразделений многоотраслевой корпорации GE, которое занимается производством высокотехнологичного оборудования для нефтегазового сектора. В условиях, когда снижаются цены на энергоресурсы, а сутки «простоя» могут обойтись в 7 миллионов долларов, жизненно важно минимизировать время незапланированной остановки производства, необходимо увеличивать эффективность нефтедобычи. 

Благодаря сенсорам, установленным на продаваемом оборудовании, аналитики компании получают оперативную информацию о состоянии нефтедобычи, а для анализа массивов данных в 2012 году была разработана облачная платформа Predix, которая, используя алгоритмы машинного обучения, позволяла инженерам составлять расписания диагностических проверок, улучшать эффективность использования оборудования и снижать время «простоя», выявляя возможные неисправности до того, как они произойдут. 

Результат: увеличение ежегодной добычи энергоресурсов и снижение убытков от неэффективного использования оборудования. 

Таким образом, Data Scientist — человек, умеющий не только добывать информацию и её анализировать, но и обрабатывать большие массивы данных, совершая настоящее волшебство с помощью множества инструментов.

Оставьте комментарий

Блог на WordPress.com. Тема: Baskerville 2, автор: Anders Noren.

Вверх ↑

Создайте подобный сайт на WordPress.com
Начало работы