Переход без остановки: «Ингосстрах» сменил СХД «на лету»
На форуме Pure//Russia Live 2018, которым вендор СХД отметил 18 сентября первую годовщину работы на рынке РФ, одно из кресел почетных гостей заняла компания «Ингосстрах». Это первый российский клиент Pure Storage, для которого был выполнен сложнейший проект прозрачной миграции основной инфраструктуры СХД практически «на лету». Опытом развития крупного страхового бизнеса в условиях цифровой трансформации с CNews поделился Алексей Клепиков, вице-президент по информационным технологиям «Ингосстрах».
CNews: ИТ-проекты вашей компании можно рассматривать в качестве примеров практической цифровой трансформации. Бизнес «Ингосстраха» давно уже стал датацентричным, верно?
Алексей Клепиков: Да, это так. За последние полтора года рост ИТ составил не менее 100%. Планируем и дальше расти. Дело в том, что объем возможностей, который требуется нашим заказчикам, становится все больше и больше, и нужно быстро реагировать на изменения в потребностях рынка. В этом отношении страховые компании догоняют банки. И у нас есть реальный шанс их перегнать.
CNews: Откуда такой рост функциональности страховых услуг?
Алексей Клепиков: Наша основная работа – защищать клиентов от рисков. Наверное, мы единственные, кто желает своим клиентам, чтобы они всегда были здоровы, чтобы у них ничего не ломалось, чтобы у них не было никаких проблем. При этом вызов современного цифрового рынка заключается в том, что нужно не только быстро реагировать на изменения в потребностях наших клиентов, но еще и стараться формировать эти потребности. Поэтому мы постоянно придумываем новые продукты, включаем новые каналы коммуникаций. Сделать это непросто – такова уж специфика страхования. Например, догадаться, хороший водитель или плохой, по косвенным признакам совсем не просто – традиционная телематика способна распознавать лишь малую часть потенциально опасных ситуаций на дороге. Нужны средства телематики нового поколения, и страховым компаниям предстоит переходить на этот уровень цифровой обработки.
Уже сегодня в продвинутых авто есть функции беспилотного вождения, и автомобиль способен, скажем, распознать намерение пешехода перебежать дорогу и становить движение транспортного средства. Аналогичная ситуация – со здоровьем человека. Появляются интересные решения удаленного мониторинга состояния здоровья человека. Например, я видел наручные часы, которые «понимают», хорошее настроение у человека или плохое, или, возможно, он находится в стрессовом состоянии. Такие датчики новых поколений действительно способны изменить весь мир и область страховых услуг, в частности. На глобальном рынке стали появляться сервисы моментального урегулирования страховки от невылета: если рейс отменен, система сама это видит и автоматически выплачивает деньги. Вы вообще не напрягаетесь!
У нас в «Ингосстрахе» уже есть устойчиво растущая доля клиентов, которые покупают полисы полностью в удаленном режиме: человек просто фотографирует свою машину, потом делает видеообзор машины с мобильного телефона, а затем ему приходит SMS с информацией об оплате страховки. Точно также можно застраховать дом или квартиру. Удаленное урегулирование по ДТП – это уже реальность. Почему мы над всем этим думаем? Потому что такие сервисы нас, страховую компанию, приближают к вам, клиентам: вам не нужно физически посещать офисы, общаться с агентами. Мобильное приложение страховой услуги знает о вас все, что нужно, и сделает все, что требуется.
CNews: Очевидно, что ИТ-инфраструктура такой компании должна быть очень надежной.
Алексей Клепиков: Не очень надежной, а абсолютно надежной. Кстати, не все знают, что требования регулятора (Банка России) к страховым компаниям гораздо более жесткие, с точки зрения онлайн-доступности сервисов, чем аналогичные требования к банкам. Например, если мы более 20 минут не можем продавать полисы ОСАГО – это уже лицензионный риск, грозящий штрафами, а при повторных проблемах – отзывом лицензии. Эти требования проецируются на требования к работе ИТ-систем – их надежности и доступности сервисов, что обусловливает высокий уровень резервирования и высокую готовность резервных серверов. Для нас критически важно, чтобы во время выкладывания того или иного релиза ПО простои системы были минимальными. Кроме того, с февраля мы готовим отчетность в соответствии с международным стандартом XBRL. Напомню, что переход на формат деловой отчетности XBRL – один из стратегических проектов Банка России. Он подразумевает датацентричный подход к сдаче отчетности, в основе которого – модель данных, что позволяет исключить дублирование и снизить избыточность показателей, а также повысить прозрачность информации, достоверность и качество отчетности. Так вот, отчетность по XBRL – это весьма ресурсоемкий процесс. Так же мы ожидаем, что через какое-то время Банк России захочет внедрить в нашей отрасли процедуры типа закрытия банковского дня, потому что это поможет снижению рисков от того, что у той или иной страховой компании что-то пошло не так в течение отчетного периода.
CNews: Вы приняли решение о миграции корпоративной системы хранения данных на программно-аппаратные решения компании PureStorage. На вас произвела такое впечатление информация о продуктах, которые, к слову, признаются лидерами рынка независимыми исследователями, в частности, Gartner, в течение ряда лет?
Алексей Клепиков: Знаете, меня сложно очаровать даже качественными информационными материалами. Когда мы выбираем системы, партнеров, вендоров или конкретное оборудование в линейке вендора, мы очень внимательно анализируем, что это даст бизнесу, а потом обязательно берем его на тестирование. Понимаете: красивые слова говорят все, но реальные характеристики способны дать только тесты. Что касается PureStorage, я был приятно удивлен: реальность подтвердила обещания из маркетинговых брошюр, такое бывает далеко не всегда.
Надо понимать, что выбор вендора СХД – это всегда долгосрочная история. СХД не меняют каждый год, как минимум, три года мы должны отработать на новой системе. А с учетом сервисной программой Evergreen, обеспечивающей возможность постоянного апгрейда, выбор Pure Storage оказывается реально стратегическим решением: мы можем регулярно проводить апгрейд контроллеров, получая с каждым разом все больше функционала, скорости и т.д. на протяжении продолжительного жизненного цикла решения. Поскольку по факту это долгосрочное партнерство, важно заранее понять, «чем дышит» потенциальный партнер, это ведь большой риск – доверить свою промышленную среду новому вендору. Я побывал в штаб-квартире компании в Калифорнии, увидел их рабочие места, тестовые стенды и убедился, что они действительно умеют создавать передовые устройства хранения данных.
CNews: Когда это было?
Алексей Клепиков: Больше года назад. Pure Storage еще не пришла на наш рынок. А у нас тогда сложилась непростая ситуация. На тот момент у нас работала СХД компании Violin Memory (ныне Violin Systems), которая стала испытывать серьезные финансовые трудности, ее будущее было под вопросом, и этот факт составлял для нас большие риски. Мы понимали, что необходимо менять вендора СХД, но при этом очень опасались за производительность наших ИТ-систем. Риски потери производительности при смене вендора были для нас совершенно неприемлемы. Флэш-массивы Pure стали реальной альтернативой, которая дает не только высокую производительность, но и важную для наших критичных систем высокую надежность.
CNews: Надежность ИТ-инфраструктуры для датацентричного бизнеса требуется, в первую очередь, для обеспечения непрерывности бизнеса. Для каких задач компании это наиболее критично?
Алексей Клепиков: Сейчас, наверное, основной вызов для нас таков: при тех объемах изменений, которые мы производим, не допускать снижения качества работы сервисов. Мы сейчас разрабатываем практически в два раза больше программного обеспечения, и этот рост не привел к ухудшению качества. Это отличный результат, ведь рост объема программного кода всегда сопровождается увеличением количества ошибок, но система с этим справляется, мы внимательно следим за ситуацией в этой части.
Кроме того, очень важно при выкладке релизов не допускать прерывания сервиса. Мы выпускаем релизы каждую неделю, и еженедельно как минимум 100 задач выкладывается в промышленную среду. Часть из них – сервисные задачи, часть – инциденты, но по меньшей мере половина из них – это задачи, которых ожидает бизнес. При таких объемах деятельности критически важно, насколько надежно все это работает на момент выкладки. Поэтому одна из основных наших задач – максимально улучшать параметр доступности во время выкладок релизов. Это те вещи, которые заметны для конечного потребителя. А есть те, что скрыты от глаз внешнего наблюдателя.
Например, в нашей ИТ-системе есть разные среды: разработки, тестирования, а также preproduction-среда. Это полная копия текущей промышленной среды, именно на нее «накатывают» тот релиз, который будет выходить в продуктивную эксплуатацию. Для нее важна максимальная идентичность с промышленной средой. Это накладывает определенные требования к инфраструктуре: нельзя сделать среду preproduction чуть-чуть иной, ограниченной, ведь тогда тестирование в ней не даст полноценных результатов.
CNews: Объем хранимых данных для вас критичен?
Алексей Клепиков: У нас не слишком большая рабочая база данных – порядка 70 Тбайт. Но она очень быстро прирастает. С учетом того, что темпы внесения в нее новых данных растут практически в геометрической прогрессии, полагаю, что сотни терабайт – это ближайшее будущее. Поэтому главное для нас – это, конечно, надежность и доступность данных. Понятие надежности подразумевает, что если система выключится, то потом обязательно включится. А доступность означает: вы знаете, что система не отключается несмотря ни на что. Так вот, оборудование Pure Storage продемонстрировало особые преимущества в части доступности.
Фактически Pure Storage продает клиенту виртуальные терабайты, а не физические, которые находятся на all-flash-массиве. Вендор говорит: мы гарантируем вам некоторый уровень дедупликации данных, например, продаем 20 Тбайт с коэффициентом 3:1, и на самом деле вы покупаете 60 Тбайт, и платите за 60 Тбайт. Как это получается? Компания умеет делать классные алгоритмы и дает гарантии, что обещанный уровень ёмкости будет выдерживаться. Если же этого не случится, то это уже проблема Pure – добавить физической ёмкости.
Интересно, что Pure Storage продает вам не просто flash-массив с хорошим контроллером и более-менее внятным программным обеспечением на нем, а целый сервис хранения данных, который начинает на вас работать. Конечно, перед покупкой мы провели предварительное тестирование – делали большую заливку данных, чтобы «железке» было тяжело работать, эксплуатировали в достаточно жестких условиях – изучали всевозможные ситуации, когда что-то может пойти не так.
Очень понравился интерфейс администрирования – он простой, понятный и надежный. Потому что если он классный, но запутанный, есть реальный риск, что сервисный инженер, особенно, не очень опытный, может ошибиться. Я, честно говоря, не сразу поверил, что СХД с настройками в несколько кнопок способна хорошо справляться с массой непростых задач типа дедупликации и обеспечивать требуемую доступность.
CNews: Для сложных инфраструктурных систем типа СХД большое значение имеют средства мониторинга. Как с этим у Pure Storage?
Алексей Клепиков: Я побывал в штаб-квартире компании в субботу. Там практически никого не было, кроме сервисных инженеров круглосуточной техподдержки. Я увидел, как работает сервис удаленного мониторинга наших клиентских систем: прямого доступа к данным у них нет, однако они знают все о состоянии контроллеров, понимают, как они работают. В чем разница между просто мониторингом контроллера или мониторингом всего массива в целом и таким централизованным мониторингом всей системы СХД? Если возникли какие-то проблемы, система удаленного мониторинга понимает, что предшествовало этим проблемам. И если «увидит» подобную ситуацию у другого клиента, то может заранее предсказать, как будет развиваться ситуация в дальнейшем.
В нашей практике был такой случай, когда одно из устройств вызвало подозрение у централизованной системы мониторинга. Мы на своей стороне не видели никаких ухудшений SMART-статуса, коллеги же из поддержки Pure предложили заменить устройство на новое, мы согласились. В целом, за год у нас вообще не было никаких простоев и проблем с неработоспособностью каких-либо элементов СХД.
Интеллектуальный мониторинг СХД – это реально круто! Он сам догадывается, что и где находится, сам точно знает, что происходит, и если подозревает, что какая-то деталь стала работать хуже, происходит замена этой детали. И это все – в онлайне! Это очень современная вещь. Думаю, через некоторое время все перейдут на похожие системы.
CNews: Тренд умных систем налицо.
Алексей Клепиков: Конечно! Большая система сама должна понимать, что с ней происходит, какой у нее статус, и как развивается ее состояние. Отдельная «железка» не в состоянии понять, что если у нее какой-то отдельный параметр вышел за границу нормы, то это означает потенциально большую проблему. Передовые цифровые технологии позволяют всем устройствам, подключенным к системе мониторинга, располагать общими знаниями.
Умные технологии управления работают у нас и на уровне бизнес-приложений: сервис мониторинга приложений автоматически понимает, как работают корпоративные бизнес-системы, с помощью набора базовых агентов. В результате сегодня не мы пишем систему мониторинга, не мы задаем ей правила, а она сама догадывается об этом на основе «докладов» агентов. Она знает, например, когда появляются новые серверы или кто-то пытается вынести данные наружу. Это не DLP-система, не защита от утечек данных. Это просто система, которая знает, как идут бизнес-транзакции. Еще пример: если на одном физическом сервере – 10–15 NOD, и одна из них умрет, то обычный мониторинг отобразит небольшое падение, скажем, минус 7% общей доступности. Что именно произошло, понять очень сложно. А наш мониторинг дает конкретное сообщение: в конкретном приложении на конкретном сервере начинается торможение. Это, кстати, важно для качественного обслуживания наших заказчиков.
Клиент ведь может переживать из-за каждой транзакции! Для него не имеет значения, что это «всего лишь несколько процентов падения», ему хочется полностью доступной системы. И это его право. Поэтому мы с нашими заказчиками заключаем SLA-соглашения по доступности системы, по уровню сервиса, который мы гарантируем. Как ни крути, но высокая доступность стоит денег. «Шесть девяток», как у Pure Storage – их клиенты оплачивают. Вот почему мы постоянно работаем над улучшением этих показателей, ужесточаем показатели SLA.
CNews: Вы сталкиваетесь с проблемой, которая часто становится головной болью ИТ-директоров: как объяснить руководству компании, что необходимо опять выделить деньги, чтобы докупить ресурсы хранения?
Алексей Клепиков: Да, в инфраструктурном мире такое встречается. Если вывести за скобки ситуации с банальным отсутствием процессов Capacity Management и осознанным саботажем ИТ-директора в попытке доказать собственную незаменимость, то скажу так: ответственность надо делить с руководством компании. Я, как руководитель ИТ-службы, должен минимизировать риски, и если я выношу проект бюджета ИТ-департамента на правление Компании, и понимаю, что невыполнение некоторых элементов бюджета приведет к существенным рискам, то я буду эти риски перекладывать на тех людей, которые их создают. Правда, бывают ситуации, когда для бизнеса проще допустить риск простоя, зато не платить за ресурсы. Вопрос всегда в цене этого риска. Что касается «Ингосстраха», то час простоя нашей компании, стоит очень больших денег. Это очень хорошо понимает и руководство, и акционеры, которые очень разумно относятся к инвестициям в ИТ-инфраструктуру, это ведь основа надежности всего комплекса ИТ. Не важно, хорошая у вас программа или не очень, но если у вас нет сети, сервера или СХД, она не будет работать.
Кстати, это одна из причин, почему вы выбрали Pure Storage: доступность «шесть девяток» у других производителей за такие деньги не купишь.
CNews: Похоже, что при переходе на Pure Storage «Ингосстрах» не прогадал?
Алексей Клепиков: С точки зрения стоимости физического all-flash-массива такого качества, его стоимость у Pure – оптимальная по цене, если брать во внимание всю сумму показателей, включая количество операций ввода-вывода (IOPS), коэффициент дедупликации и прочие. Когда вы выбираете СХД, приходится находить некий баланс между ними. Так что выбор конкретного решения – это всегда сумма параметров, с точки зрения стоимости первичной покупки и при дополнительном доборе мощностей. В нашем случае Pure Storage честно выполняет все свои гарантийные обязательства, включая гарантированный уровень компрессии и дедупликации, и это очень важно.
В целом, с новой СХД мы приобрели и новые преимущества: гарантированную надежность, удаленный сервис мониторинга всей инфраструктуры хранения данных, очень высокий коэффициент дедупликации и компактное размещение, что тоже имеет значение для экономии места в ЦОДе.
Конечно, мы понимаем, что при входе на рынок цены у любого вендора несколько снижены. Вопрос в том, остаются ли они конкурентными, по сравнению с другими вендорами, на протяжении всей истории взаимоотношений с ним. Конечно, с любым вендором всегда нужно обсуждать вопросы скидок, и в этом отношении Pure – не исключение. Магическое или не магическое программное обеспечение, а скидки должны обсуждаться.
CNews: Платформу искусственного интеллекта, которая встраивается в продукты Pure Storage, тестировали?
Алексей Клепиков: Специализированное решение, интегрированное с платформой NVIDIA DGX-1 – это очень интересный продукт. С его помощью можно быстро создавать интеллектуальные модели, а потом запускать исполнение этих моделей с высокой производительностью в потоковом режиме. Правда, у нас задач такого рода нет. Для наших целей мы используем средства OLAP-аналитики, в частности, решения компании SAS, которые запускаются на достаточно простой компьютерной технике.
CNews: Можно ли сказать, что все задачи, связанные с созданием идеального фундамента ИТ-инфраструктуры компании «Ингосстрах» решены?
Алексей Клепиков: Конечно, нет. Мы успешно перешли на новую СХД, получили новые возможности надежного хранения данных и их высокой доступности. Но это не предел. Мы планируем далее улучшать доступность наших систем. Будем совершенствовать наши подходы к управлению мощностями. Работы впереди много. Вместе с Pure Storage нам еще работать и работать. В этом отношении они молодцы – стараются помочь советом, как лучше использовать их системы. Пожалуй, единственное, чего не хватает, это российского сообщества пользователей Pure Storage. Но ведь позади всего год присутствия на нашем рынке. Сделано много, надеюсь, что в скором времени и user group появится.