Как обеспечивается отказоустойчивость в облаке

30 Марта 2021

облачная инфраструктураСовременные реалии бизнеса требует максимально эффективного использования дискового пространства. Недостаточно просто разместить данные в облачный сервис и предоставить к ним доступ с применением популярных протоколов. Все чаще на первое место выходит вопрос поддержания высокой отказоустойчивости хранилища. Это означает, что нужно обеспечить постоянный доступ к базам данных и их мобильность.

К счастью, все эти задачи достаточно легко решаются при помощи современных облачных решений. Новые технологии позволяют наращивать ресурсы и увеличивать производительность инфраструктуры, не затрагивая бизнес-процессы. Многие компании, использующие cloud-технологии практические не ощущают разницы в подходах.

Давайте разбираться, каким образом осуществляется отказоустойчивость облачных серверов и действительно ли безопасно размещать инфраструктуру в подобных хранилищах.

Как поддерживается отказоустойчивость

Чаще всего для повышения эффективности облачного хранения применяется многоуровневая система. Этот подход предполагает, что далеко не все данные одинаково востребованы в текущий момент. Следовательно, необходимо варьировать активность доступа и хранить файлы на разных уровнях.

За счет создания иерархии данных можно добиться значительной экономии ресурсов. Для малоактивных и невостребованных файлов могут применяться более дешевые ресурсы. А информация, которая с большой вероятностью потребуется в ближайшее время, будет храниться на более производительном уровне. При необходимости можно автоматически или вручную настраивать доступность файлов и тем самым распределять нагрузку на облачные сервисы.

Такой подход в большинстве случаев является более рациональным, чем размещение баз данных на физическом оборудовании. Дополнительная отказоустойчивость облачных серверов достигается за счет катастрофоустойчивости. Этот термин означает, что облако продолжит выполнять свои функции даже при выходе из строя всего ЦОДа. Но, как правило, катаклизмы случаются крайне редко, поэтому подобный сценарий можно назвать маловероятным.

Кроме этого, дополнительная отказоустойчивость облачных хранилищ достигается благодаря новейшим технологиям репликации. За счет этого обеспечивается мобильность данных, а также возможность переноса ресурсов с одного сервера на другой без прекращения фактического доступа.

Если облака для вас
не просто теория
Широкий спектр услуг
по выделенным северам
и мультиклауд-решениям
Конфигурация VPS и бесплатный тест уже через 2 минуты
Организация вашей IT-инфраструктуры на основе мультиклауд-решения

Чаще всего облако базируется на нескольких серверах дата-центра уровня Tier III. Уровень Tier III позволяет обеспечить практически полную отказоустойчивость физической инфраструктуры, а это в свою очередь повышает доступность облачного хранилища.

Дополнительно может применяться принцип географической распределенности облака. В этом случае хранилище базируется на двух независимых площадках, которые находятся на расстоянии друг от друга. Например, это могут быть дата-центры одного поставщика в разных городах. На базе ЦОДов развертывается геораспределительный кластер, в основе которого лежат решения VMware.

В дата-центре присутствуют точки провайдеров связи, благодаря чему обеспечивается наилучшее качество соединения. Такой подход удобен и тем, что в случае отключения связи одним провайдером, всегда есть возможность быстро перестроить маршрутизацию и подключиться к сети через других провайдеров.

Эффективные инструменты

vm-ware облакоПодробнее рассмотрим вопрос о том, как обеспечивается отказоустойчивость облачного хранилища на VMware. Для этого применяется несколько инструментов:

  • Fault Tolerance. Этот функционал позволяет мгновенно переключить работу на копию виртуальной машины, если основной ресурс вдруг становится недоступен. По сути инструмент создает реплику ВМ, размещая ее на другом активном сервере. Плюс такого подхода заключается в том, что удается добиться минимального простоя. Переключение между основной и резервной машиной занимает считанные секунды. Конечно, есть и минусы подобного решения. Так как обе машины находятся в рабочем состоянии, это приводит к повышенному потреблению ресурсов. Как правило, копия занимает столько же ресурсов, сколько и основная ВМ. Накладывается и ряд ограничений на устройство с включенным Fault Tolerance – например, это касается использования снапшотов.
  • Site Recovery Manager. Этот инструмент применяется для предотвращения перегрузки хостингов. Он позволяет автоматически разместить ВМ на хостах с учетом нагрузки. При необходимости машины перемещаются «на ходу», что не влияет на доступность сервера. На VMware vSphere 6 с помощью такого инструмента можно выполнить миграцию машин даже между дата-центрами. Это программное обеспечение приобретается отдельно от vCenter Server. С его помощью возможно создавать резервные виртуальные машины и сайты, на которые будут восстанавливаться текущие ВМ в случае отказа.
  • High Availability. Этот инструмент многие называют одним из основных для обеспечения отказоустойчивости в облаке VMware. В этом случае создается копия виртуальной машины, которая запускается при зависании или отказе виртуального сервера. Сбои в системе обнаруживаются при помощи плагина VM Monitoring, который собирает всю информацию с ВМ. Работа инструмента возможна только в том случае, если ВМ хранятся на доступном для всех хостов хранилище. Нередко применяются различные программные решения (вроде virtual SAN).

Перечисленные решения могут использоваться в различных сценариях. Например, это может быть восстановление ресурса на резервной площадке, перенос инфраструктуры на новый сервер, развертывание тестовой среды. Управление инструментами осуществляется через единую консоль VSphere Client, что крайне удобно для пользователя.

Отказоустойчивость на физическом уровне

Для того чтобы добиться высокой отказоустойчивости облака, необходима надежная работа и самого физического оборудования, на котором размещается облачный сервер. На физическом уровне используются следующие решения:

  • Отказоустойчивость энергоснабжения. Достигается за счет подключения каждого элемента облака к двум линиям питания, независящим друг от друга. Система АВР помогает переключать нагрузку между основным и резервным питанием, исключая резкие скачки питания. При отсутствии основного питания используются дизель-роторные источники бесперебойного подключения.
  • Резервирование ресурсов. Этот подход предполагает резервирование ресурсов на другом хосте. Если основной сервер выходит из строя, то виртуальные машины сразу запускаются на резервном. В результате облако продолжает работать без сбоев и простоя, а все сервисы и ресурсы остаются доступными для пользователей.
  • Миграция в момент техобслуживания. В случае техобслуживания текущего хостинга используется автоматическая бесшовная миграция на другой. Этот процесс не влияет на работу облачных серверов, а значит не затрагивает инфраструктуру компании.

Дополнительная отказоустойчивость физической инфраструктуры достигается и на уровне приложений. Используются сервисы для динамической маршрутизации, балансировки трафика, трансляции API-команд на инфраструктуру и пр.

Рекомендации для отказоустойчивого облака

cloud-storage-bezopasnПри развертывании облачной инфраструктуры в облаке стоит учитывать ряд факторов, которые позволят добиться высокой отказоустойчивости:

  • Рассчитывать объем ресурсов, которые потребуются для отказоустойчивости. Многие упускают момент резервирования ресурсов как минимум в размере одного хоста, что в случае непредвиденных ситуаций отрицательно сказывается на отказоустойчивости среды.
  • Учитывать максимальную загрузку серверов и систем хранения. Серверы архитектуры не стоит загружать более чем на 70-80%, но это правило часто игнорируется. Большая нагрузка может привести к просадке производительности и временным простоям в работе сервисов.
  • Заранее рассчитать издержки на масштабирование. Стоит закладывать определенный резерв на случай роста вашей инфраструктуры. Конечно, облако предоставляет возможности масштабирования, но рост можно предсказать заранее и к нужному времени спланировать необходимые ресурсы.
  • Учитывать особенности используемого ПО. Некорректное программное обеспечение и приложения не могут напрямую повлиять на безопасность и отказоустойчивость облачного сервиса, однако они могут привести к замедлению работы и различным сбоям. Поэтому перед построением cloud-инфраструктуры стоит заранее понять, подойдет ли сервер для работы с определенным ПО.

Предложение от Xelent

Как видите, поддержание отказоустойчивости в облаке требует многоуровневого подхода к безопасности и надежности данных. Необходимо продумать как физический, так и аппаратный уровень отказоустойчивости, чтобы избежать простоя инфраструктуры и предотвратить потерю данных.

Если вам требуется создание надежной облачной ИТ-инфраструктуры, то наша компания Xelent готово предложить ряд решений на базе VMware. Выбирая наш дата-центр, вы получаете следующее:

  • Непрерывность бизнес-процессов за счет подключения каждого хоста к нескольким системам хранения данных.
  • Резервное копирование без затрат ресурсов клиента.
  • Доступность 24/7 за счет использования коммутаторов, подключенных к разным маршрутизаторам.
  • Круглосуточная техподдержка и помощь с настройкой облачной инфраструктуры.

Если у вас остались вопросы об услуге, то задавайте их нашему нашему менеджеру. Оставляйте заявку на сайте или звоните по указанным номерам!

Популярные услуги
Получить консультацию специалиста
Персональный ассистент
Cloud.Xelent