Правда ли Data Science станет основной для любого бизнеса
Спрос на дата-саентистов растет почти столь же стремительно, как рынок профильных платформ. На это влияет развитие отдельных технологий и потребности бизнеса в ускорении. Data Science становится новой нормальностью, частью которой смогут стать очень многие компании. Единственное, что нужно сделать уже сегодня — решить проблему с дефицитом кадров.
Рынок Data Science растет космическими темпами
Еще в совсем недалеком прошлом, когда бизнес научился собирать данные, но еще не умел полноценно извлекать из них пользу, можно было часто услышать мнение о том, что большие данные под своим весом просто похоронят корпорации. Сейчас подобных возгласов все меньше, и причиной тому стало стремительное развитие Data Science («науки о данных», но этот термин в России не прижился).
Казалось бы относительно свежее понятие на самом деле присутствует в жизни почти каждого человека. Например, Data Science лежит в основе таргетинга рекламы Google, создания персонализированных рекомендаций на YouTube или Netflix. Важность этого подхода можно доказать абсолютными величинами: объем рынка платформ для Data Science в 2017 г. составлял $20,2 млрд, а темпы его среднего ежегодного роста (CAGR) в разрезе до 2025 г. будут на уровне космических 39,7%. К слову, рынок инструментов для аналитики больших данных, на котором так или иначе связанные с Data Science решения рано или поздно начнут доминировать, хоть и показывает чуть меньший CAGR (12,3%), но зато достигнет к 2027 г. объема в $105 млрд.
Причины такого роста лежат в способности Data Science и дата-саентистов с помощью широкого набора инструментария выводить из больших данных работающие бизнес-гипотезы и искать взаимосвязанные факторы. Зависимость бизнеса от этого направления очевидно стала колоссальной и будет только увеличиваться с годами. Определение нужд потребителя и возможность предложить ему нужный товар нужным способом, устранение рутины в офисах и браков на производствах, а также относительно приемлемый ценник самого внедрения.
Единственная стоящая проблема философии Data Science — сложная кадровая ситуация. Число вакансий выросло более чем в четыре раза за последние несколько лет. Дефицит тем более удивителен, что дата саентистам готовы хорошо платить (средний уровень оклада, если верить сайтам по трудоустройству, на уровне ₽170 тыс. для middle-специалиста), а обучение профессии — интеллектуально доступно даже для людей, не имеющих профильного математического или технического образования.
Науку о данных развивают искусственный интеллект и интернет вещей
Основными причинами развития Data Science стали прорывы в тех или иных технологиях, которые позволили более полно, чем, например, во второй половине прошлого десятилетия, использовать потенциал этого подхода. Одной из ключевых тенденций эксперты называют стремительное увеличение числа проектов с использованием искусственного интеллекта. ИИ теперь используется практически во всех сегментах и отраслях бизнеса и постоянно развивается. Развивая попутно и бизнес: искусственный интеллект способен повышать эффективность бизнес-процессов на десятки процентов, как и прибыли. Это достигается за счет более надежного и автоматизированного управления клиентскими данными. Помимо ИИ, на Data Science сказывается и автоматизированное машинное обучение, которое пока только набирает обороты.
Другим фактором роста стало то, что интернет вещей в последние годы наконец-то дошел до реальных применений. Инвестиции в эту область по итогам 2020 г. должны составить $1 трлн, и это далеко не предел. Увеличение количества умных и подключенных устройств порождает огромные объемы данных, которые уже нельзя просто складывать на полку дата-центра — слишком большую ценность они представляют. Особенно это справедливо для высоконагруженных отраслей, вроде промышленности.
Свою роль сыграла и постепенное расширение границ аналитики больших данных, которая является спутником Data Science. Компании стали получать больше ценных сведений о потребителях, очищать данные и отдавать их на постобработку Data Science-платформам. Особенная роль здесь отведена прогнозной аналитике, благодаря которой дата-саентисты могут строить образы компаний на краткосрочную и даже среднесрочную перспективы. Это применимо как к глобальным историям, вроде составления маркетинговых компаний, так и к локальным бизнес-процессам, вроде наполнения складов.
Еще одним фактором, пусть и не столь очевидным, эксперты называют развитие граничных вычислений. Edge Computing решает проблемы пропускной способности каналов, не давая их перегружать и снижая задержки поступления данных. Кроме того, расширяются возможности по их хранению и предварительной обработке непосредственно в точках сбора, чем воспользовались уже даже производители видеокамер.
При этом мир идет к расширению самой профессии дата-саентиста на смежные отрасли. В Data Science вся работа, как правило, строится на Python. Он сложен как язык, но владеющие им специалисты способны оперативнее и изящнее решать проблемы, связанные с безопасностью предприятий, что серьезно поднимает вес Data Science, как научной области. Востребованность таких сотрудников с течением времени будет расти экспоненциально.
Как стать дата-саентистом
В России уже не просто много серьезных проектов. Наша страна находится на передовой использования науки о данных. Драйверами развития тут становятся банки, обладающие достаточными бюджета и возможностью проверять действенность тех или иных инструментов в реальном времени и на реальных, практически не ограниченных данных. В «Сбербанке», например, открыто заявляют о том, что «платформы, которые позволяют решать сложные задачи в области Data Science простым людям, не имеющим профильного образования, находятся на подъеме». Инвестиции в это направление будут вливаться еще 5-10 лет, а к 2023 г. они составят $311 млрд, что сопоставимо с бюджетом всей Российской Федерации. В компании надеются, что «Сбербанк» станет технологическим лидером в этой области.
Интерес первых компаний страны вполне понятен: Data Science упоминается в программе «Цифровая экономика». Федеральный проект «Кадры для цифровой экономики» будет готовить ИТ-специалистов самого высокого уровня. Кто-то из гигантов готовит дата-саентистов только для себя, готовя их на закрытых внутренних курсах только для своих. Однако сама профессия, в которой можно работать изучив только самые азы, а после — постоянно развиваясь на реальных задачах, подразумевает привлечение более широкого круга соискателей.
Колоссально растущий спрос подтолкнул Mail.ru Group, НИТУ «МИСиС» и образовательную платформу в области Data Science — SkillFactory — заключить соглашение о создании совместной онлайн-магистратуры «Наука о данных». Цель этой программы — привлечение более тысячи молодых специалистов в области работы с большими данными, что заложено в «Кадрах для цифровой экономики».
Есть у SkillFactory и отдельный проект, благодаря которому науку о данных можно изучать в онлайне. Курс достаточно продолжителен по времени (24 месяца, но всего лишь 6 часов в неделю), а по его окончании можно рассчитывать на владение знаниями и навыками специалиста уровня Middle. Этот способ подходит всем ИТ-специалистам (или даже просто людям, решившим резко сменить профессию), ведь за время обучения удастся собрать внушительное портфолио, а проводить его можно без отрыва от нынешней работы.
Подобный подход ведущих компаний страны к решению проблемы дефицита кадров почти наверняка изменит рыночную ситуацию в ближайшие 2-3 года. Как отмечают эксперты, это окончательно закрепит Россию в списке мировых лидеров в области применения Data Science.
Узнать подробнее о профессии Data Scientist