Что является наиболее важным для компании при выборе СХД под хранилище неструктурированных данных? Начальная цена закупки для корпоративного рынка не является показательной. Более важное значение имеет совокупная стоимость владения (Total cost of ownership, TCO), которая учитывает все затраты компании, в том числе стоимость покупки и расходы на эксплуатацию.

Для сравнительной оценки TCO для ряда СХД компания IT Brand Pulse провела исследование, в котором приняли участие восемь систем: три традиционных СХД (EMC, IBM и NetApp) с собственной аппаратной базой и пять программно-определяемых СХД (HPE, Red Hat, Scality, SUSE и VMware). Хранилища предназначались под массовые неструктурированные данные без строгих ограничений на скорость доступа.

«Благодаря размещению на серверах стандартной архитектуры программно-определяемые СХД ожидаемо оказались более дешевым решением, чем стандартные модели, — рассказал Фрэнк Берри, старший аналитик IT Brand Pulse. — Однако был и сюрприз: среди трех наиболее дорогих решений присутствуют два продукта, относящиеся также к классу программно-определяемых СХД».

Типы данных для корпоративных СХД и затраты на хранение

В 2016 г. компания Veritas провела исследование, опросив 2500 руководителей компаний в 22 странах мира. Цель исследования состояла в том, чтобы выяснить, какие данные хранятся в корпоративных хранилищах и для каких целей они используются.

Оказалось, что в среднем только 15% информации в корпоративных хранилищах можно отнести к актуальным бизнес-данным (Clean data). 33% данных относятся к разряду избыточных, устаревших или малозначимых (ROT Data — Redundant, Obsolete & Trivial). Назначение 52% данных не распознается при беглом анализе (Dark Data).

Получается, что доля неструктурированной информации в современных корпоративных хранилищах составляет не менее 85% от общего объема сохраненных данных. При этом согласно имеющимся оценкам IT Brand Pulse, общий объем неструктурированных данных в корпоративных хранилищах уже в 2017 г. достигнет 140 Эб.

Правильный выбор СХД под хранение данных сейчас актуален, как никогда раньше, считают в IT Brand Pulse. Но при предварительной оценке следует внимательно относиться к расчетам TCO. Необходимо учитывать все затраты: приобретение оборудования и ПО, сервисная и техническая поддержка, обучение сертифицированных специалистов, покупка запасных деталей.

Методика исследования

Сделать правильный выбор СХД сегодня непросто. Для этого приходится принимать во внимание различные используемые типы хранения данных: 1) облачное хранение как услуга (cloud storage-as-a-service), 2) традиционные СХД на жестких дисках, 3) программно-определяемые СХД на серверах стандартной архитектуры.

В исследовании IT Brand Pulse совокупная стоимость владения вычислялась как сумма затрат на приобретение оборудования, ежегодные лицензионные платежи за использование ПО, затраты на сервисное и техническое обслуживание, плата за обучение одного сертифицированного специалиста, затраты на покупку запасных частей при 5-летнем сроке эксплуатации.

Сценарий сравнения предусматривал начальное выделение под хранилище 250 Тб; затем объем ежегодно увеличивался на 25% вплоть до уровня 600 Тб к концу тестового периода. Правила эксплуатации предусматривали приобретение поддержки для обслуживания хранения данных с полным резервированием, сервисное обслуживание с выездом на площадку заказчика на следующий рабочий день. Данные записывались без сжатия, без дедупликации и иной оптимизации. В затратах для программно-определяемых систем также учитывалась аренда серверного оборудования.

Результаты исследования

Как и ожидалось, самым дорогим оказалось решение компании Dell EMC. Вслед за ним идут решения от Red Hat, VMware и HPE. По затратам на приобретение дисковых массивов однозначным лидерам стало решение IBM. Более того, если оценивать по итоговому значению TCO, решение IBM оказалось недалеко от призеров рейтинга — Scality и SUSE.

Dell EMC Unity 300 — TCO (5 лет): 330 865 долл.

На базе этой модели можно построить унифицированные гибридные массивы данных с поддержкой блочного и файлового типов доступа, виртуальных томов VMware VVols, протоколов NAS, iSCSI и Fibre Channel.

Однако у модели Dell EMC есть важное ограничение: ее возможности масштабирования ограничены установкой не более 150 дисков по 6 Тб в одно шасси. Из-за этого заказчику придется приобретать каждый год новый модуль СХД для заданных условиях эксплуатации. В результате Unity 300 оказалась самым дорогим решением в списке.

Зато СХД Unity 300 предоставляет множество дополнительных функций: автоматизированное управление жизненным циклом данных, компрессия и уплотнение данных «на лету», встроенное шифрование, низкоуровневая интеграция с экосистемой VMware и Microsoft.

Red Hat Ceph Storage — TCO (5 лет): 328 847 долл.

Эта СХД отличается простотой масштабирования, которое реализуется за счет установки дополнительных узлов на базе недорогих серверов стандартной архитектуры x86. Ее платформа объектного хранения обеспечивает оптимальную производительность и легкость наращивания объемов хранения.

ПО Red Hat Ceph Storage отнесено к классу Premium: затраты быстро растут по мере наращивания емкости хранилища. Такая ценовая политика привела к тому, что эта СХД заняла вторую строчку в списке самых дорогих решений в обзоре.

VMware VSAN — TCO (5 лет): 258 151 долл.

Архитектура многих современных дата-центров выстроена на VMware vSphere. Это является определяющим фактором в выборе предпочтений в пользу продуктов VMware, которым гарантированно обеспечена тесная интеграция с гипервизором.

VMware vSphere имеет высокую производительность в среде гиперконвергентных инфраструктур, использующих оптимизацию за счет применения флэш-накопителей. Это же решение отлично работает с серверами платформы x86 и всем стеком решений VMware.

Если бы затраты за сервисную поддержку СХД входили бы в стоимость лицензии VMware VSAN, то эта СХД имела бы лучшие позиции в рейтинге. Однако эти затраты вынесены в отдельную статью, поэтому требование 5-летней эксплуатации с нарастающим объемом хранилища привело к тому, что решение попало в группу СХД среднего ценового диапазона.

HPE StoreServ 8200 — TCO (5 лет): 253 426 долл.

Многие заказчики без сомнения выберут это решение, опираясь на высокое доверие к бренду и богатый набор предоставленных функций. Однако при использовании этого СХД под редко запрашиваемые данные затраты будут выше средних для моделей рейтинга.

NetApp FAS2554 — TCO (5 лет): 211 534 долл.

По результатам проведенного исследования эта модель оказалась лучшим решением с точки зрения простоты эксплуатации и плотности размещения данных. Эта СХД позволяет разместить до 1,1 Пб данных на 144 дисках высокой плотности записи с поддержкой протоколов iSCSI, NFS, pNFS и CIFS/SMB.

Несмотря на значительную экономию затрат при масштабировании хранилища, на суммарных затратах сказывается то, что решение относится к бренду NetApp, который не считается дешевым. Например, на покупку дополнительных дисков потребуется выложить примерно по 2000 долл., что в четыре раза больше по сравнению с покупкой дисков для серверов стандартной архитектуры, используемых для программно-определяемых СХД.

IBM Storwize v5010 — TCO (5 лет): 195 458 долл.

Гибридное хранилище с блочным доступом к данным, использующем НЖМД- и/или SSD-массивы. Помимо iSCSI можно использовать каналы доступа 16 Gb Fibre Channel, 12 Gb SAS и 10 GbE iSCSI/FCoE. Решение IBM допускает заполнение до 10 слотов с общей наполняемостью до 264 дисков.

Модель IBM v5010 предоставляет один из наиболее разнообразных наборов дополнительных функций. Однако если критерием выбора является максимальная емкость при наименьшей цене, то другие решения обходят эту СХД.

Scality RING — TCO (5 лет): 193 384 долл.

Scality была первой на рынке компанией, которая еще в 2009 г. предложила собственное веб-масштабируемое (web-scale) решение для хранения распределенных массивов неструктурированных данных. Ее нынешнее решение Scality RING относится к типу программно-определяемых СХД и предоставляет возможности файлового и объектного хранения в петабайтном масштабе. Данное решение предлагают сегодня взамен ленточных библиотек для хранения данных с длительным сроком жизни.

Решение заняло второе место в рейтинге, продемонстрировав одно из наиболее привлекательных значений TCO. Вся программная начинка для Scality RING приобретается сразу вместе с покупкой самого решения, что избавляет от дополнительных затрат во время последующей эксплуатации.

SUSE Enterprise Storage 4 — TCO (5 лет): 149 408 долл.

Это одно из недавно выпущенных решений. Оно также относится к типу программно-определяемых СХД. Благодаря горизонтальному масштабированию (scale-out architecture) эта модель является оптимальным выбором для хранения больших массивов информации.

SES 4 интересна тем, что является первым на рынке полностью готовым к промышленной эксплуатации Ceph-решением, которое поддерживает POSIX-совместимую файловую систему CephFS и может работать на серверах стандартной архитектуры. Оно отличается невысокими затратами на ежегодные лицензионные отчисления, а если заказчик сразу подключает сервис технической поддержки, то стоимость годовой лицензии автоматически включается в состав его пакета обслуживания.

Выводы

1. Широкое распространение программно-определяемых СХД, способных могут работать на серверах стандартной архитектуры, скоро заставит традиционных вендоров СХД отказаться от надбавки за бренд.

2. С приходом на рынок программно-определяемых СХД традиционные модели попали под сильное ценовое давление. Однако пока некоторые вендоры СХД нового типа придерживаются ценовой планки, близкой для традиционных СХД.

3. Опираясь на данные облачных провайдеров, использующих серверы стандартной архитектуры x86, компании могут переходить на выбор аналогичной платформы. В этом случае они смогут сократить свои затраты на СХД, размещаемые в частных облаках, до трети от затрат, которые несут при использовании традиционных СХД.