Андрей Сысоев, Lenovo: К чему приведет рынок гонка высокопроизводительных вычислений
Технологическая мировая гонка сейчас разворачивается в области высокопроизводительных вычислений. О текущем состоянии мирового и российского рынка и перспективах применения высокопроизводительных вычислений в научном и коммерческом секторе в интервью CNews рассказал Андрей Сысоев, ведущий специалист по высокопроизводительным вычислительным технологиям Lenovo в России.
CNews: Что сейчас происходит на рынке высокопроизводительных вычислений в мире и России? Какие у него перспективы развития?
Андрей Сысоев: Ожидается, что этот рынок будет переживать бурный рост. По данным исследования Hyperion, к 2021 году объем рынка составит $17,4 млрд. А в 2018 году он оценивался в $13,7 млрд. Причиной такого роста станет расширение областей применения HPC (High Performance Computing — высокопроизводительные вычисления) в коммерческом секторе. Сейчас технологию в основном используют государственные или научные структуры с крупным финансированием и для решения отдельного ряда задач — например, для прогнозирования климатических катастроф или изучения генома человека.
Российский рынок высокопроизводительных вычислений растет медленнее мирового как в объеме вычислительных мощностей (сейчас в мировой топ-500 входят Ломоносов-2 из МГУ, СуперЭВМ из Росгидромета и Christofari от Сбербанка), так и в количестве проектов. Для сравнения, суперкомпьютеры из Китая составляют почти половину этого рейтинга. В то же время рынок можно назвать зрелым — заказчики достаточно ясно представляют, что такое HPC и для чего можно использовать эту технологию. На мой взгляд, на рост рынка значительно повлияет программа цифровой экономики и реализации нацпроектов.
CNews: Какие задачи сегодня можно решать с помощью HPC-технологий? В каких исследовательских программах с использованием данных технологий участвует Lenovo?
Андрей Сысоев: Для решения любых задач, которые требуют большого количества сложных вычислений, завязанных на значительных ресурсах, необходимы технологии HPC. Зачастую они используются в фундаментальной науке, физике, химии, гидро-, аэро- и газодинамике, CAD-CAE; а элементы параллельного программирования и вычислений незаменимы везде, где сложно или попросту невозможно воспроизвести эксперимент в естественных условиях.
Кроме того, высокопроизводительные вычисления активно используются в социологических исследованиях. Например, в Университете Аделаиды научные сотрудники, используя технологии HPC, анализируют язык пользователей Twitter для понимания различия уровня счастья пользователей в зависимости от их географического положения.
Более того, анализируя большие массивы данных с помощью высокопроизводительных вычислений, можно изучать поведенческие модели людей, общества в целом или даже распространение инфекционных заболеваний.
Lenovo активно использует HPC-технологии в разных сферах, в том числе — для решения жизненно важных проблем человечества. Например, в Испании наш суперкомпьютер MareNostrum 4 установлен в суперкомпьютерном центре в Барселоне — одном из ведущих вычислительных центров в Европе. Недавно там смогли создать прототип приложения для автоматической классификации генетических мутаций, которые могут осложнять онкологические заболевания у пациента.
Один из последних российских проектов — внедрение HPC-кластера Lenovo Scalable Infrastructure в Иркутской нефтяной компании, в которой он применяется для ускорения обработки данных геологических исследований.
Но в то же время нельзя сказать, что HPC — это нишевые решения. К области научных исследований прибавился пласт задач еще одного очень интересного направления — технологию применяют в системах видеоаналитики, компьютерного слуха, речи.
CNews: Какие преимущества может получить компания от использованием HPC? Насколько критичен сегодня отказ или невозможность применять HPC для бизнеса?
Андрей Сысоев: В первую очередь, это замена рутинных операций, которые выполняются вручную. Это может быть сортировка данных, заполнение таблиц и т.д. Оптимизация процессов в совокупности с более мощным оборудованием значительно ускоряет работу. Например, если раньше расчеты в рамках определенного исследования занимали три месяца, то сейчас этот срок реально сократить до одной недели.
Все зависит от сегмента рынка, в котором работают те или иные организации. Технологии находят своего пользователя как в потребительском сегменте, так и в сегменте уровня предприятия. HPC существенно повышают эффективность сервисов и продуктов, в основе которых лежит компьютерное зрение, распознавание лиц и символов, дополненная реальность.
Очень эффективно использование технологий НРС в финансовом секторе. Финансовые компании используют супервычисления для повышения точности анализа рисков — понимание таких факторов может позволить банку выделить необходимую, без излишков, сумму на случай возможных потерь от инцидентов, высвободив оставшийся капитал для инвестиционных целей. Также HPC применяются при анализе истории потенциального заемщика, индивидуально разработанного пакета услуг, принятия решений об установках банкоматов и их эффективности в зависимости от поставленных условий задачи.
Интересны направления исследований в области здорового питания, к примеру, алгоритм можно натренировать на определение калорийности пищи или степени готовности блюда.
CNews: Расскажите о решениях Lenovo для супервычислений.
Андрей Сысоев: Производством компонентов, из которых впоследствии строятся большие системы, занимается достаточно большое количество вендоров, однако не все из них готовы вкладывать средства именно в HPC/AI как готовые комплексы с соответствующим уровнем поддержки и компетенцией. Чаще всего производители предлагают отдельные блоки и узлы, из которых впоследствии локальные специалисты уже на месте разрабатывают дизайн и осуществляют внедрение кластерных вычислителей, оказывают техническую поддержку функциональных заказчиков. Это становится причиной больших затрат и простоев при наладке и последующем использовании.
Компания Lenovo как мировой лидер в производстве суперкомпьютеров идет другим путем и предлагает заказчикам готовые решения, которые включают полный спектр услуг от разработки и валидации, строительства на заводах компании и последующего внедрения, а также сопровождения в течение всего жизненного цикла использования HPC-вычислителей. Другими словами, мы сдаем под ключ готовые дома, а не строительные материалы и сопровождаем заказчика на всем цикле работы с решением.
Наша платформа Lenovo Scalable Infrastructure (LeSI) проходит многоэтапную проверку и сертификацию внутренними службами компании, предоставляя гарантию на уровне решения, а не на уровне компонентов.
CNews: Объем и мощность вычислений суперкомпьютеров — это колоссальная нагрузка на энергосистему компании. Есть ли у вас решения для энергоэффективности подобных вычислений?
Андрей Сысоев: Безусловно, современные тренды развития ведут к тому, что потребление электричества растет на единицу занимаемого пространства в аппаратном шкафу, что ведет к проблеме эффективного охлаждения столь горячих вычислительных устройств. Мы предлагаем заказчикам технологию жидкостного охлаждения, и я уверен, что в ближайшие годы этот подход станет стандартом отрасли.
Сейчас нашим заказчикам доступна технология Neptune — это комплексная система охлаждения дата-центров с помощью воды. Используя эту систему, мы можем поддерживать более горячие процессоры — понижая его температуру всего лишь на 1 градус Цельсия, мы снижаем частоту вращения вентилятора, экономя при этом как его ресурс, так и расход потребляемого им электричества до 60%!
Система состоит из трех технологий, которые можно использовать в комплексе или по отдельности. Во-первых, это модуль Thermal Transfer Module (TTM) для серверов с воздушным охлаждением. Он представляет собой полые трубки с жидкостью под высоким давлением, которые позволяют более эффективно отвести тепло от источника. Второй элемент — радиатор Rear Door Heat Exchanger (RDHx), который позволяет отвести от шкафа большее количество выделяемого тепла, что значительно упрощает проектирование ЦОДа и приносит экономию на дорогих системах кондиционирования воздуха. И третье решение — технология охлаждения горячей водой Direct Water Cooling (DWC), которая используется для отвода от вычислительного сервера до 95% тепла. При этом можно использовать самые горячие и производительные процессоры.
Кстати, самый энергоэффективный суперкомпьютер в мире SuperMUC-NG, построенный в суперкомпьютерном центре имени Лейбница в Мюнхене, создан на базе такой технологии.
CNews: Смогут ли компании, которые делают ставку на применение искусственного интеллекта (ИИ), обойтись без высокопроизводительных вычислений?
Андрей Сысоев: Все зависит от того, будет ли компания делать свой продукт, то есть обучать и тренировать алгоритм самостоятельно, или использовать уже готовые модели. Во втором варианте нет необходимости в тяжелых кластерах, можно обойтись и периферийными вычислениями. В 2019 году мы анонсировали сервер ThinkSystem SE350 для сегмента периферийных вычислений. Они неприхотливы к окружающей среде и могут быть использованы на улице или в запыленных местах, позволяют обрабатывать входные данные на лету, на границе между источником и оператором, принимающим решения.
CNews: Как суперкомпьютеры повлияют на развитие систем машинного обучения и искусственного интеллекта?
Андрей Сысоев: Подобно HPC, ИИ используется для решения некоторых насущных исследовательских проблем, имеющих последствия для человечества, и высокопроизводительной аналитики на предприятиях. Те же самые фундаментальные технологии, на которых работают HPC, теперь используют ИИ-системы.
Недавно Lenovo в партнерстве с компанией Intel на базе института Flatiron объявила о начале сотрудничества по объединению технологий НРС и ИИ с целью ускорения решений наиболее сложных мировых проблем. Кластер HPC с методами ИИ используется для обработки больших массивов научных данных в рамках интенсивных проектов, охватывающих астрофизику и геномику. В связи с тем, что кластер обладает огромной мощностью, мы применяем технологию охлаждения Neptune. В результате нашего сотрудничества с Intel ученым Flatiron уже сейчас доступны новые возможности для исследований. Раньше, например, исследователи могли секвенировать только около 2% геномных данных. Теперь же они работают с тысячами семейств одновременно, что позволяет точно определять аномальные гены или разрабатывать эффективные лекарства.