Сегодня мероприятие о новинках в составе HPE Primera проведет Алексей Казьмин, менеджер по продуктам СХД HPE, Hewlett Packard Enterprise.
Общая идея, которую HPE вкладывает в развитие систем хранения данных, опирается на два выбора, которые по мнению аналитиков Gartner должны сделать заказчики, пользующиеся информационными системами: либо свои ИТ-сервисы перенести в облако типа Amazon, Google, Azure, либо свои ИТ-сервисы оставить в своей инфраструктуре, но свою инфраструктуру сделать как облако.
Последнее нужно делать затем, чтобы публичные облачные провайдеры такие как Amazon установили дефакто стандарт того, как должна выглядеть архитектура любой ИС. Эта инфраструктура должна обеспечивать предсказуемые уровни обслуживания по доступности и производительности.
Второй тезис «как облако» – это прозрачная стоимость хранения данных, расширения емкости и продление поддержки. Времена самодельных зоопарков прошли. В России по статистике наши заказчики покупают расширенные уровни поддержки на оборудование HPE примерно также часто, как это делаю заказчики в Германии, Швейцарии, Австрии и других цивилизованных странах.
Третий тезис – это высокая скорость изменений и постоянное расширение функционала. Скажем, Amazon раз в год представляют на 10% больше сервисов чем годом ранее, причем вендор доступ к ним открывает сразу, только часть из них тарифицирует. От своей собственной инфраструктуры можно требовать того же.
Четвертый тезис – это удобство управления, стандартные и программируемые интерфейсы. Многие заказчики HPE уже автоматизируют управление своей инфраструктурой, выделение ресурсов, связку между разработчиками и «машинным отделением», чтобы все работало быстро и бесшовно.
Если смотреть на наш портфель сервисов и возможностей для хранилищ, можно отметить гарантии доступности и эффективной емкости. Если вы изначально купили систему с 5-ю годами поддержки и спустя 5 лет вы захотите ее продлить на 6-й и 7-й год, то вам эти года будут стоить столько же, сколько стоил каждый год в рамках первых пяти лет поддержки, здесь от вендора не будет никаких сюрпризов. На HPE Primera, HPE Nimble и 3PAR есть лицензии на все софтовые возможности «Все включено», в 3PAR есть отдельная лицензия «мультисистем» на репликацию, но в HPE Primera и HPE Nimble есть лицензия – «Ультра все включено», т.е. весь появляющийся функционал обеспечивается бесплатно.
Интеллектуальные системы хранения
Такими системами мы называем те, которые поддерживаются нашей глобальной системой HPE InfoSight.
Хочется назвать интеллектуальными системами хранения MSA и XP, однако пока мы не будем их так называть, возможности интеграции с HPE InfoSight там пока недостаточно развиты, но такая интеграция обязательно будет.
HPE Primera – это хайэнд для широкого рынка. Распределение ролей в портфеле ключевых систем хранения HPE строится на основе цены. Если взять классификацию компаний IDC, единственная которая считает адекватно долю рынка вендоров, то там любая система, которая для заказчика продается по цене $25 тысяч и меньше, это Entry Level, та которая продается от $25 тысяч до $250 тысяч – это Middle Range, что дороже $250 тысяч – это Hi End. Вендору HPE такая классификация не очень нравится, поскольку она не очень адекватно отражает положение вещей с СХД HPE. Мы придумали другую классификацию по возможностям обеспечения предсказуемых доступности и производительности, которые есть в СХД.
По этому признаку MSA, самая популярная в мире СХД в штуках продаж, попадает в самый нижний уровень - Tier 2, потому что в ней не очень много возможностей для обеспечения постоянной доступности и производительности, это просто очень быстрая двухконтроллерная СХД. Выше на полке лежат HPE Nimble и HPE 3PAR, они относятся к уровню Tier 1, эти системы хранения для приложений, для которых простой не желателен, но он допустим в рамках предсказуемых уровней обслуживания. HPE Nimble имеет гарантию доступности «шесть девяток», т.е. 30 секунд простоя в год. Но нужно еще и время на восстановление приложений. Но у вас могут быть приложения, у которых простой просто не допустим. Простой лакмусовой бумажкой, помогающей понять допустим простой или нет, можно посчитать стоимость часа простоя или прерывания любых бизнес-сервисов, если их простой стоит сравнимых денег со стоимостью самой СХД или в некоторых случаях со всей ИТ-инфраструктурой предприятия, то это точно СХД класса Tier 0.
HPE Primera должна обеспечивать 100%-ую доступность данных, при этом у вендора существует материальная ответственность за простой, возникший по его собственной вине. Пока не было ни одного случая в мире, чтобы кто-то к этой гарантии прибегал. Сейчас уже набралось примерно около 2 млн часов наработки HPE Primera у всех наших заказчиков по всему миру без единого простоя.
HPE Primera
Это наш новый флагман, который возглавляет портфель СХД среднего уровня.
HPE Primera впитала в себя ДНК или основной функционал и инженерное наследие HPE 3PAR, она во многом и выглядит как 3PAR, но с некоторыми дополнительными возможностями.
Но здесь любая операция, не требующая дописывания кода, может осуществляться заказчиком или партнером, при этом с гораздо более низкими требованиями к квалификации.
Естественно, HPE Primera совместима с HPE InfoSight. Что же Primera взяла от 3PAR? Она взяла архитектуру со всеми активными контроллерами и доступ осуществляется к любому тому сразу через все доступные контроллеры. В HPE Primera кэш-память общая для всех контроллеров (на запись и на обработку данных) и это позволяет меньшее количество раз перекладывать данные из одного кэша в другой и обратно, чем обеcпечивать большую производительность системы. В HPE Primera еще более расширилась полоса пропускания между контроллерами и она составляет 2 Тбит/с, один контроллер с другим может общаться на такой скорости, это необходимо для начала поддержки накопителей NVMe, которые были анонсированы в июле 2020 года. Дистрибьютор HPE компания Treolan уже заказала демосистему на NVMe-накопителях. Для нормальной поддержки NVMe полоса пропускания между контроллерами должна быть гораздо выше, чем это было в системах хранения предыдущего поколения. Еще Primera взяла от 3PAR специализированные микрочипы ASIC, в старших моделях Primera по несколько штук на каждый контроллер, они по-прежнему берут на себя самые ресурсоемкие задачи, но также еще и служат коммутаторами, которые связывают контроллеры между собой по прямой PCI-Express шине. Сделать что-то быстрее, чем прямая PCI-Express шина на данный момент невозможно, что, напомню, обеспечивает большую полосу пропускания. Еще одна особенность, которая появилась в прошивке версии 4.2, это встроенный искусственный интеллект.
Пользователей 3PAR в России уже тысячи, значит тысячи массивов находятся в эксплуатации, еще 7000-е 3PAR – несколько сотен находятся в эксплуатации, еще 8000-е и 9000-е тоже в эксплуатации. 3PAR не заканчивают свой жизненный цикл, он закончится только через несколько лет.
Сейчас вышло обновление для 8000-х, 9000-х и 20000-х массивов 3PAR для операционной системы 3PAR OS 3.3.1 MU5, в конце года появится следующее обновление, которое раскроет еще ряд новых возможностей, которые будут в первую очередь связаны с интеграцией HPE Primera в настроенную и инсталлированную базу 3PAR. Это даст возможность переносить полки расширения с 9000-х и 20000-х 3PAR в HPE Primera и подключать их туда по SAS. Возвращаясь к версии OS 3.3.1 MU5, в которой появилось несколько новых возможностей, среди них можно выделить возможность апгрейда контроллеров внутри семейства 8000. Например, 8200 -> 8400, 8440 или 8450, сохраняя шасси и диски на месте, но контроллеры должны изменяться, поскольку в контроллерах 8200 нет портов для кросс-линка между двумя парами контроллеров. Это уже доступно сейчас к заказу, в китах – сами контроллеры, но к ним нужно покупать сервис для апгрейда, но зато апгрейд происходит без остановки массивов, без остановки доступа к данным и контроллеры меняются по очереди, инвестиции в диски остаются.
HPE InfoSight
HPE InfoSight – это глобальная база знаний, постоянно собирающая телеметрию с десятков тысяч подключенных устройств и их окружений по всему миру, это сбор информации с систем хранения, серверов и виртуальных окружений через интеграцию с платформами Veeam и HipрerVe, пока только для систем HPE Nimble поддерживается HipрerVe, но для других систем также будет поддерживаться чуть позже.
Также InfoSight кроме прямого наблюдения за системами строит корреляции, зависимости и позволяет предсказывать негативные события, которые могут произойти в будущем, InfoSight об этом знает, поскольку это где-то уже было. Либо наоборот, если какое-то изменение повлечет за собой какое-то позитивное изменение, например, рост производительности, то эта аналитическая система сможет подсказать что для этого надо сделать конкретному заказчику. InfoSight остается самой большой в мире автоматизированной базой знаний (6 Пбайт чистой телеметрической информации без обработки).
Основное отличие от конкурирующих систем заключается в величине сырых данных, которые использует искусственный интеллект, величина базы очень важна для правильного машинного обучения. InfoSight следит практически за всей инфраструктурой, за сетями она сейчас следит опосредованно через платформу виртуализации, но в ближайшем будущем научится следить за ними напрямую, здесь имеется в виду в первую очередь портфель HPE ARUBA.
Если посмотреть на перспективы развития InfoSight, то, как видно из следующего слайда, этот продукт не почивает на лаврах.
В планах компании научить InfoSight присматривать не только за телеметрией «железа», но и за приложениями, т.е. перейти на самый высокий уровень ИТ-хозяйства. До нового года ожидаются обновления InfoSight, которые смогут выдавать информацию на основе накопленной телеметрии, которые будут интересны администраторам баз данных, администраторам приложений. В результате перед пользователями будет полная картина: если что-то пошло не так, то мы точно знаем, что это что-то обусловлено на уровне приложения, или на уровне виртуальной среды, или на уровне хостов, на уровне сетей передачи данных или на уровне хранилищ и отдельных ее компонентов.
В HPE Primera появилась новая возможность, которая теперь есть в версии прошивки 4.2. – это маленький офлайн InfoSight внутри каждого контроллера Primera, который по сути снимает самое важное ограничение, которое заключается в потребности системы хранения быть подключенной к Интернету.
Это не везде возможно по техническим причинам, по причинам организационного характера, по причине недоговоренности со службой информационной безопасности. В HPE Primera есть возможность довольно значительный пласт полезных функций InfoSight использовать без подключения к Интернету.
Интерфейс HPE Primera идет еще глубже в сам массив и сейчас механизм строится на двух разных реализациях машинного обучения. Во-первых, это нейронная сеть, обученная на базе InfoSight отлавливать тысячи наиболее распространенных сценариев – что может пойти не так в инфраструктуре, в СХД и о чем нужно предупредить пользователя и принять определенные корректирующие действия. Во-вторых, это независимая система с долгой и краткосрочной памятью, она обучается на локальной базе событий, чем дольше она работает, тем лучше она может предсказывать поведение приложений, отдельных компонентов инфраструктуры и выдавать прогноз с довольно высокой точностью, с гранулярность 30 секунд может указать время возникновения какого-то события.
Это не просто механизм рекомендаций и советов, это переход от советов к действию. Например, ИИ в Primera может, если он видит повышенные требования к производительности и ему разрешить, то он может приостанавливать работу некоторых фоновых процессов, которые забирают часть ресурсов контроллера и уменьшают производительность системы.
ИИ может сам определять, что в приоритете и регулировать работу системы. Далее по мере развития ИИ будет анализироваться больше данных и появляться больше механизмов для анализа данных внутри системы.
Аппаратная база HPE Primera
HPE Primera – это гораздо более производительный массив, чем 3PAR, если рассматривать сравнимые модели. Пока нет в линейке HPE Primera прямой замены 20000-м 3PAR, тем, в которых больше 4 контроллеров, но совершенно точно есть замена 8000-м и 9000-м.
Благодаря тому, что каждый контроллер Primera более производителен, чем контроллер 3PAR, поэтому в некоторых случаях можно приобрести Primera даже дешевле системы 3PAR той же емкости за счет того, что 650-я Primera примерно в два раза быстрее, чем массивы 8450, поэтому двухконтроллерную Primera можно купить примерно с той же производительностью, что и четырехконтроллерную 8450.
Если сказать про дальнейшие шаги в повышении производительности, то начиная с июля 2020 года вендор поддерживает установку NVMe-накопителей в Primera.
Пока есть некоторые ограничения по количеству NVMe-накопителей, которые можно поставить в текущие модели Primera, но в конце года ожидается пополнение в портфеле систем хранения Primera, эти модели будут уже all-NVMe. В конце года или в начале следующего появятся на рынке полки расширения, которые будут подключаться к основным массивам уже по NVMe и внутри будут стоять только NVMe-диски. Стоимость одного терабайта на NVMe-дисках такая же, как и на SAS-дисках.
Модульная архитектура аппаратной базы в HPE Primera – это еще одно наследование системы Nimble и еще важное отличие от систем 3PAR. В Primera есть два типа шасси – двухюнитовое и четырехюнитовое (соответственно 2 или 4 контроллера).
В портфеле 3 модели – 630-я, 650-я и 670-я.
Модульность ОС
Также модульную архитектуру имеет и операционная система, она, в частности, позволяет устанавливать обновления 4.2, которая обновляет довольно много модулей в системе.
Например, очень большое обновление ОС на версию 4.2 связано с работой системы снэпшотов, которые будут сниматься на порядок быстрее и меньше загружать основную систему. Даже такие серьезные обновления к ключевым модулям не требует остановки доступа к данным и перезагрузки всей системы, самое страшное что может случиться при обновлении Primera – это потребность перезагрузить контроллеры по очереди, при этом не теряя доступа к данным.
Если раньше в портфеле HPE лучшими друзьями были 3PAR и Synergy, то сейчас таковыми стали 3PAR, Primera, Nimble и Synergy. Все они вместе поддерживают REST API и на всех их доступна из одной консоли управления OneView, которая управляет вычислительными и сетевыми ресурсами, также доступен SAN-зонинг.
Наша компонуемая инфраструктура позволяет из конца в конец управлять всей инфраструктурой с помощью API, такого больше ни у одного вендора нет. Еще одна возможность, связанная с обеспечением доступности ИТ-сервисов, – это конечно возможность бэкапа.
Несмотря на то, что HPE Primera имеет стопроцентную доступность, но далеко не только СХД может выйти из строя, может упасть и какой-то ИТ-сервис. С всеми системами хранения HPE, такими как 3PAR, Primera, Nimble и дисками библиотеки StoreOnce бесплатно поставляется софт, который называется Recovery Manager Central (RMC). Он представляет собой виртуальную машину не требовательную к ресурсам и она может оркестрировать, управлять снятием мгновенных снимков силами самой системы хранения, делать это консистентно с очень большим перечнем приложений и эти снимки RMC может складывать либо на StoreOnce, на нашу дисковую библиотеку для хранения бэкапов и делает он это напрямую, за счет этого и появляются дикие цифры прироста производительности по сравнению с классическим ПО резервного копирования.
Также RMC может оркестрировать складывание бэкапов в облако Cloud Bank, это интерфейс связи с различными облаками, такими как публичные и любые облака, поддерживающие протокол S3. В Cloud Bank можно переложить бэкапы со StoreOnce. Если последняя – это оперативная дисковая библиотека для хранения бэкапов близко, чтобы к ним можно было вернуться оперативно, то Cloud Bank – это как раз та технология, где можно хранить долго и дешево. RMC может всем этим управлять. И также RMC может отправлять бэкапы в облако Cloud Volumes.
Почему еще Primera находится на самой верхней полке систем Tier 0?
Потому что в Primera доступна синхронная репликация сразу по трем площадкам, в Nimble по трем площадкам делается только асинхронная репликация, такое же есть и в 3PAR. Primera может делать асинхронные реплики примерно на порядок быстрее, чем это может сделать 3PAR. Естественно здесь есть ограничение со стороны каналов передачи данных, но делать копии раз в минуту и отправлять их в сжатом виде на внешнюю площадку можно, если канал позволяет.
Асинхронная репликация в любое облако может той самой третьей площадкой в дополнение к двум собственным.
Cloud Volumes Backup
Cloud Volumes Backup – это сеть ЦОДов HPE, которые физически подключены к ЦОДам основных облачных публичных провайдеров. Сейчас HPE сотрудничает с Amazon и Azure, ЦОДы трех компания стоят вплотную и напрямую подключены по толстой оптике к ЦОДам в США, Великобритании и в Сингапуре.
В ближайших планах вендора начать сотрудничество с Google, сеть ЦОДов Google достаточно широка, поэтому HPE планирует таким образом расширять свое географическое присутствие. Будет ли ЦОД Cloud Volumes располагать в России, пока об этом планы умалчивают, но тем не менее эту альтернативу вендор со счетов не сбрасывает. Пока Cloud Volumes можно рассматривать как облако Cloud Volumes Backup. Cloud Volumes состоит из двух частей: Cloud Volumes Blok – это классическое облачное хранилище, т.е. если у вас сам сервис работает в облаке Amazon, то за своими данными он может ходить не облако Amazon, а в наш ЦОДик, который расположен рядом, и хранить там свои данные. Вторая часть – это Cloud Volumes Backup, но у них есть ряд общих особенностей, например, вендор никаким образом не тарифицирует передачу данных между ЦОДами Cloud Volumes. Скажем, если вам хочется перевести виртуальную машину из ЦОДа, которая хостится в Великобритании, в ЦОД в Сингапуре, вы это сможете сделать, переведя саму виртуальную машину, перезапустив ее там. При этом данные перемещаются между ЦОДами HPE по нашим механизмам и никаким образом не тарифицируются. Перемещения данных между регионами в публичных облаках тарифицируются.
Как это работает с точки зрения бэкапов? Вы можете с помощью Recovery Manager Central бэкапится с наших хранилок в облако Cloud Volumes Backup. Для этого ничего менять не нужно, можно по тем же самым политикам в другое место складывать бэкапы. Зачем это нужно? С учетом очень доступной стоимости емкости в Cloud Volumes Backup и возможности оплачивать только ту емкость, которая используется, это может служить хорошей альтернативой какому-то архиву ленточек, куда вы выводите свои ленточки с бэкапа, которые нужно долго хранить. Есть замечания в том какие данные можно отправлять через границу, но в основном эти требования оговаривают: первая копия данных должна храниться на территории РФ, а дополнительные копии можно отправлять и через границу.
С хранилок HPE это можно делать через RMC, а с наших и других хранилок можно это сделать с помощью софта Veeam, Commvault, Verytas, Microfocus, можно также подключаться к Cloud Volumes с единственным пока отличием, что для Veeam, Commvault пока не требуются никакие специальные плагины. В чем плюс использования этого облака – закупка лицензии на емкость она весьма символических денег стоит, ее можно купить вместе приобретением новой хранилки HPE. Можно использовать Cloud Volumes Backup для миграции данных с любых старых хранилок через облако на новые хранилки.
Cloud Volumes использует протокол HPE - Catalist, который позволяет дедупликацию делать на источнике бэкапа, потом дедуплицированные данные отправляются в облако, иногда это позволяет на один-два порядка сжать объем передаваемых данных, сократить окно бэкапа, делать копии чаще и быстрее, меньше платить за трафик телекомпровайдера.
Гарантии
По словам Алексея Казьмина нужно чаще пользоваться гарантиями, одна из них - HPE Store More, по которой вендор заказчику гарантирует, что данные, хранящиеся на СХД будут сжаты и дедуплицированы, если, естественно, это возможно сделать. Под эту гарантию не попадают зашифрованные данные, уже чем-то сжатые, медиа-данные и т.д.
Эта гарантия доступна в двух вариантах: мгновенная гарантия, изображенная на слайде выше и точная гарантия, изображенная на следующем слайде. В России был только один кейс мгновенной гарантии, заказчик записал туда свои данные и ему немного не хватило до коэффициента, который указан на слайде.
Здесь речь шла о HPE Primera. Вендор по гарантии со своего сервисного склада заказчику отгрузил по два дополнительных диска, добавив сырую емкость, он помог заказчику вместить все те данные, которые он хотел вместить в свою СХД.