Денис Дубинин, менеджер по развитию бизнеса IT-решений Huawei Enterprise в России, рассказывает подробности о новом продукте в линейке систем хранения данных OceanStor компании - AFA СХД Dorado v6, запускающемся на российском рынке.
Коммерчески доступным решение станет в первых числах января 2020 года. Сейчас продукт проходит активное тестирование у ключевых заказчиков и партнеров. Физически несколько комплектов "железа" уже находится на территории России.
Прежде, чем говорить о продукте, хотелось бы сказать еще несколько слов о трендах на рынках систем хранения данных (СХД).
На графике показана так называемая "кривая интереса" Gartner. Она отражает различные фазы жизни нового продукта - первоначальное ажиотажное внимание в момент появления на рынке, когда продукт зачастую переоценивают, последующее "пике разочарований", а затем "плато эффективной работы", когда все разобрались с технологией и начинают ее использовать так, как она должна работать.
На графике показано, что в 2016 году all-flash решения выбрались на плато. Сейчас, в 2019 году, удивить кого-то флэшем или all-flash практически никого невозможно. Скажем, на бытовом рынке практически невозможно сегодня найти ноутбук с механическим диском, практически все, даже бюджетные модели, выходят в SSD-накопителем, пусть даже небольшой емкости. Впрочем, есть сегмент дисков 3.5", он жив пока никуда деваться не собирается.
Компания Google, рассказывает нам о надежности SSD накопителей. Все знают, что SSD-накопители, по крайней мере, построенные по NAND-технологии, в процессе записи изнашиваются. У микросхем памяти ограниченный цикл перезаписей, своего рода, заложенная временная бомба. То есть чем интенсивнее используется SSD, тем быстрее он выйдет из строя. Несмотря на этот "врожденный дефект", по статистике Google за последние 6 лет активной эксплуатации механических и SSD-накопителей, механические диски ломаются в 3-4 раза чаще. Причем в Google используют не только механические диски Enterprise класса, но и диски бытового класса. Это данные Google, а в Huawei отмечают, что по статистике этой компании механические диски отказывают в 10 раз чаще SSD.
Относительно стоимости. Голубая черта показывает стоимость хранения данных на механическом диске Enterprise класса. Желтая черта - стоимость хранения данных во Flash-памяти с важной оговоркой - с использованием технологии "уменьшения данных" (дедупликации-компрессии). В современных СХД этот механизм практически всегда используется, "всырую" сейчас редко эксплуатируют SSD. И если взять коэффициент дедупликации-уплотнения равным примерно 2, то после 2018 года стоимость хранения данных в СХД all-flash оказывается ниже, чем в системах, основанных на "классике" enterprise уровня.
Механический диск проиграл битву за производительность примерно 3 года тому назад. Сейчас хранить на механическом диске критически важную информацию становится уже не просто менее надежно, но и еще и дорого. Это дороже, даже если вам не нужна производительность.
Сейчас в 2" форм-факторе существуют уже 30ТБ диски. У механических дисков коммерчески доступные образцы только-только приближаются к 16ТБ. То есть SSD обеспечивает меньшие габариты при более высокой емкости.
Как давно Huawei работает на рынке AFA (all-flash систем)?
В 2009 году появились хранилища Dorado первого поколения. Сейчас мы представляем 6-е поколение. Первое поколение было специфичным. Тогда размер SSD составлял в среднем 100ГБ. Такой диск стоил порядка $18 тысяч. В коробке 2U было 24 таких SSD (всего на 2.4ТБ), система стоила порядка $0.5 млн. Тем не менее, заказчики на это решение находились, они были и в России. Люди были готовы платить за высокую производительность, такой 2U-модуль зачастую "рвал" high-end решения, занимающие несколько шкафов и потребляющие несколько тысяч кВт-часов электроэнергии.
И это была система, которая практически ничего не умела, кроме непосредственно хранения данных. Она не умела, в частности, репликации. Ее "конек" был - максимальная производительность!
В 2014 году Huawei презентовала свое гибридное решение OceanStor V3 (то есть в ней есть и SSD и традиционные диски). Ее особенность в том, что она умела практически все, что умели СХД других производителей, где-то на 99%. Иногда, конечно, какую-то функциональность реализовывала комбинация из двух других.
В 2017 году вышла система OceanStor Dorado V3, своего рода симбиоз системы Dorado первого поколения и СХД. Взяли скорость от первого поколения, взяли систему хранения Ocean Dorado v3. Это было первое решение Enterprise уровня на SSD с поддержкой всего набора необходимых возможностей, которые ожидали видеть от современного продукта админы, заказчики и пользователи.
В 2018 году был небольшой апгрейд системы, в нее включили поддержку NVME накопителей.
И вот, в 2019 году презентуем новое решение СХД, со встроенным AI - OceanStore Dorado v6.
В Gartner немного поменяли подход к составлению квадранта. Раньше здесь были только классические механические СХД, all-flash СХД. Теперь появился синтетический квадрант Primary Storage, это high end + all flash. И в 2019 году Huawei занял лидирующий квадрат (схема слева). То есть заказчики, которых опрашивали в Gartner, ставили решение Huawei вместе с лидерами рынка all-flash СХД.
Доля продаж на рынке продаж решений AFA Китая - Huawei. Это не так интересно, нам бы про рынок России, но об этом
мы уже говорили. Говорить о позициях Huawei на глобальном мировом рынке сейчас не очень уместно, поскольку Huawei лишилась доступа к рынку номер 1 по объему продаж, AFA СХД - к рынку США. Известные вам события отрезали для Huawei крупнейший рынок с точки зрения возможности продаж на нем. Поэтому если теперь говорить о глобальном рынке, то наши результаты будут хуже. Поэтому на диаграмме в центре показана экономика номер 2.
Китайский рынок AFA на сегодня второй по объему в мире после рынка США. Huawei занимает на нем более 33%, второе место у компании H3C. H3C расшифровывается как Huawei 3Com. Более десяти лет тому назад было совместное предприятие между Huawei и 3Com. 3Com это американский производитель сетевого оборудования. Соответственно и СП занималось производством сетевого оборудования. Затем компанию 3Com приобрела компания HP и долго ей владела. А затем, когда HP разделили на HP Enterprise и HP Inc., торговую марку 3Com выкупил принадлежащий китайскому правительству консорциум, который занимается производством IT оборудования в Китае.
Внутри Китая сейчас под маркой H3C продается продукция другого бренда - HP Enterprise, такое, своего рода "псевдоимпортзамещение", 18,9%.
Dell EMC с его 14,6% ни под кого не "шифруется".
То есть, обобщая, на китайском рынке AFA первое место у Huawei, остальные у крупных американских компаний. Можно отметить, что несмотря на торговые войны и прочие ограничения, китайский рынок в значительной мере открыт для американских компаний. Но не наоборот.
Если говорить о росте компании на глобальном рынке AFA, то у Huawei он самый значительный, на 234%. Другие компании тоже растут, поскольку это растущий рынок, но наш относительный результат - самый высокий.
Продукты AFA СХД Huawei постоянно получают призы за различные технологические возможности, и другие, например, за лучший дизайн, решение ежегодно тестируют различные лаборатории, тестируют наши заявления на соответствие действительности. Негативных отзывов нет, подтверждаются заявления Huawei о его продуктах.
У нас есть сертификат о том, что наше решение СХД сейсмоустойчиво и способно пережить землетрясение с магнитудой в 9 баллов. Могут падать дома, может частично разрушиться ЦОД, но наше решение СХД должно продолжить работу. Понятно, что при условии, если все еще поступает электроэнергия. В России нам задают вопросы, например, "выдержит ли ваше решение СХД" качку при установке на борту? Отдельно мы это не тестировали, но логика подсказывает, что если может выдержать землетрясение такой силы, то уж с качкой справится. Будет ли наше решение работать при установке на мобильное гусеничное шасси? Сохранит ли работоспособность при попадании снаряда? Здесь ответы не очевидны, таких проверок пока никто не проводил. Но в целом, сильную вибрацию, или оказавшись кверх-ногами, решение должно выдержать.
Понятно почему, в этом решении нет механической классики, диска со вращающимся шпинделем, подшипниками и гироскопическим моментом, здесь в основе всего лежит компактный накопитель с отсутствием подвижных частей. Единственная подвижная составляющая системы это вентиляторы. А это намного более устойчивая система, нежели чем вращающийся HDD.
Так выглядит продуктовая линейка Dorado v6. Она традиционно разбита на продукты начального уровня - 3000 v6, среднего 5000 v6 и 6000 v6 и хайэндовые решения 8000 v6 и 18000 v6.
Традиционно все наши СХД системы, начиная с самой младшей, и до самой старшей, имеют схожую функциональность. Практически все, что "умеет" старшая СХД, умеет и младшая СХД. Основные отличия - в максимальной производительности и в максимальной емкости. Кроме класса hi-end, который отличает не максимальная производительность, а максимальная надежность (отказоустойчивость).
Архитектура решения поменялась кардинальным образом. Если ранее, как правило, это были классические двухконтроллерные системы с различными дополнениями, улучшениями и адаптацией, то сейчас Dorado 8000 v6, старшая версия в high-end диапазоне, это изначально мультиконтроллерная, мультипортовая система, настроенная на отказоустойчивость.
Условно сейчас СХД состоит из четырех фабрик. Фабрика фронтэнда и интерконнекта, то есть отдельные модули, обслуживающие ввод-вывод со стороны серверов. Отдельная фабрика, связанная с фабрикой контроллеров. И эти контроллеры доступны для любых портов наружу, любой контроллер может достучаться до любого порта. Нет никаких специальных портов, доступных для какого-то конкретного контроллера, все максимально равномерно "размазано".
Третья фабрика это фабрика бэкэнда. Здесь та же ситуация. Каждый порт на бэкэнде может "достучаться" до любого контроллера. Нет никакой жесткой привязки.
Четвертая фабрика - это фабрика хранения, сами жесткие диски, которые могут "достучаться" до любого порта любого из 8 контроллеров в текущей ситуации.
Такая архитектура обеспечивает максимальную отказоустойчивость. Как это обеспечивается?
Важно отметить, что Dorado v6 собран не на PCIexpress, а на RDMA, подключении с прямым доступом в память. От PCIexpress пришлось отказаться из-за большого числа арбитраций, связанных с этой шиной. Она хорошо работает, когда идет от процессора до сетевой карты или до RAID-адаптера. Когда мы начинаем связывать контроллеры и процессоры через PCIexpress, вылезают самые разнообразные "накладные расходы". Тем более, что напрямую с памятью PCIe работать не умеет и приходится работать через процессор. Поэтому в новом решении используются коннекторы RDMA. Если совсем упрощенно, это оптимизированная разновидность Ethernet.
То есть весь интерконнект внутри контроллеров, с полками, с портами I/O, - это 100 Гбит/с RDMA. Наружу мы продолжаем "торчать" через fiber channel. На сегодня fiber channel это 95% подключений SUN-овских решений. В дальнейшем мы также собираемся внедрить туда 100 Гбит/c RDMA. Сейчас уже есть и 25 Гбит/c и 40 Гбит/c, и 100 Гбит/с решения, коммутаторы с сетевым решением существуют.
Будет вот такая архитектура.
У нас all-mash система. Что нам это дает? Например, нам это дает возможность сохранить работоспособность СХД даже при выходе из строя одновременно двух контроллеров. Это возможно потому, что у нас не 2 копии кэша, а 3, все в оперативной памяти. И что особенно важно, третья копия находится в отдельном энкложере, где стоит 4 контроллера. То есть СХД состоит из двух элементов, двух "шкафов", каждый на 4 контроллера. И. соответственно, в обязательном порядке, одна из копий кэша находится в другом шкафу. За счет этого мы можем пережить двойной отказ контроллеров (схема слева). Также можно пережить выход из строя целого шкафа (схема посередине). Да, упадет производительность, но данные не потеряются.
Наконец, нам доступен поочередный отказ 7 контроллеров из 8 (схема справа) с сохранением сервиса, если между выходами проходит хотя бы 30 минут.
Таким образом, решение. которое мы предлагаем в high-end линейки, является уникальным на рынке. Насколько мне известно, другие вендоры пока что не могут представить аналогичный уровень отказоустойчивости в том же классе устройств.
То, что сегодня можно увидеть на рынке - это классические двухконтроллерные системы (слева) или четырех-восьмиконтроллерные (посередине). У них отсутствуют фабрики бэкэнда и фронтэнда. Дисковые полки в классическом решении вешаются на контроллерную пару (слева), или на четерыхлимитную канистру или на так называемый движок (посередине). У нас (справа) все диски доступны всем контроллерам за счет full mash connectivity, полного подключения все со всеми. Поэтому наше решение способно переживать отказы сразу двух контроллеров или целиком шкафа (движка). И это сейчас отличает наше решение от других.
Конец первой части. Продолжение последует, возможно, следите за анонсами в телеге.
----