Построение бессерверных филиалов (часть 6). Непрерывность функционирования
Сеть, связывающая удаленные подразделения с центральной площадкой, становится критичным элементом в условиях консолидации всех ресурсов в ЦОД. Подразделение оказывается полностью зависимым от работоспособности центральной площадки и каналов связи с ней.
Приведем реальный пример: организация занимается розничной торговлей, есть множество удаленных площадок – магазинов. За день случается разрыв связи с оператором примерно у сотни площадок (около трети от общего числа). Существующим техническим средствам необходимо от 1 до 3 минут для детектирования отказа и повторного подключения; в течение этого времени магазин испытывает трудности с обслуживанием клиентов.
Чтобы парировать риски, связанные с отказом WAN, естественным шагом будет подключение площадок к двум (или более) операторам.
Как в таких случаях поступают? Заключают договор со вторым оператором WAN и подводят второй канал на каждую площадку. После чего ставится задача специалисту, ответственному за функционирование КСПД (сетевому администратору): обеспечить работу с двумя WAN-каналами. Администратор размышляет и, отталкиваясь от своих знаний, опыта, предпочтений и возможностей существующих устройств, выбирает решение и внедряет его.
Далее приведены типовые варианты, встречавшиеся нам на практике.
Сценарий Active-Standby: альтернативный канал в режиме горячего резерва.
Один канал выбирается в качестве основного. Переключение на второй канал может выполняться:
— вручную, изменяя статические маршруты после звонка из подразделения «Не работает»;
— автоматически за счет контроля доступности для статических маршрутов;
— автоматически за счет применения динамической маршрутизации с различными метриками для основного и резервного пути.
Сценарий Active-Standby фактически не задействует второй канал, за который тем не менее начисляется абонентская плата.
Сценарий Active-Active: каналы используются параллельно
Для того, чтобы задействовать оба канала одновременно, применяются:
— статическое распределение на основе PBR (Policy-based Routing) по адресу источника и назначения;
— балансировка на основе ECMP (Equal Cost MultiPath), если поддерживается применяемым протоколом динамической маршрутизации;
— балансировка на основе распределения входного и выходного трафика по разным каналам.
Сценарий Active-Active встречается с трудностями при наличии устройств с сохранением состояния (stateful) на пути трафика, например, если выход в WAN обслуживается межсетевыми экранами. Для таких устройств критична симметричность прохождения трафика: входящие и исходящие пакеты в рамках каждой сессии должны передаваться по одному и тому же WAN-каналу. Если этого не обеспечить, то stateful-устройства не смогут корректно обработать сессию, что приведет в случае межсетевых экранов попросту к невозможности установить соединение. Нередко наступив на такие грабли, организация отказывается от параллельного использования каналов и возвращается к сценарию Active-Standby.
Кроме того, общий недостаток рассмотренных вариантов – при выборе канала не учитываются требования приложений и флуктуации характеристик каналов. Во внимание принимается только факт доступности удаленной площадки через тот или иной WAN-канал. Невозможно заметить деградацию сервиса в WAN и, например, отправить чувствительный трафик по другому пути. Динамические протоколы маршрутизации, статика с контролем доступности, туннели IPsec с DPD – все эти механизмы контролируют связность и реагируют только на серьезные проблемы, которые приводят к потере нескольких контрольных пакетов подряд. Например, если в течение 40 секунд из четырех отправленных OSPF hello-пакетов доставлен хотя бы один, то OSPF-соседство не прервется, и путь по-прежнему будет активным, несмотря на высокий уровень потерь в нем.
Таким образом, базовые механизмы выбора маршрута встречаются с трудностями. Хотелось бы их усовершенствовать для применения в схеме с несколькими WAN-операторами. Какие дополнительные механизмы потребуются? Это функционал, называемый WAN Path Selection:
— мониторинг функционирования каждого WAN-канала путем синтетических запросов и анализа проходящего трафика для оценки задержек и потерь (в т.ч. позволяет выявить перегрузки и сброс трафика в сети оператора);
— для каждой сессии – выбор пути через WAN с учетом текущих характеристик каналов и требований данного приложения к задержкам и потерям;
— обеспечение симметричности прохождения информационных потоков каждой сессии (запросов и ответов) для корректного функционирования устройств с контролем состояния сессий.
WAN Path Selection позволяет параллельно использовать несколько путей через различных операторов с динамическим распределением трафика в зависимости от требований приложений и текущих характеристик каналов.
Зачастую функции WAN Path Selection совмещаются с WOC (WAN Optimization Controller).
В таком виде WOC/WPS фактически виртуализирует WAN: скрывает детали реализации WAN (характеристики и число каналов) и позволяет упростить логическую топологию КСПД.
Резюме
При построении бессерверных филиалов возникают две ключевые проблемы:
— время отклика при работе зачастую превышает комфортный порог;
— отказ WAN приводит к недоступности приложений и требует ручного вмешательства для исправления ситуации.
Для решения первой проблемы используются функции распознавания приложений, замера характеристик их функционирования, формирования очередей с необходимыми параметрами обслуживания, ограничения полосы для фонового трафика и управления окном TCP – такой набор механизмов может быть реализован даже в асимметричном схеме, при установке WOC только на центральной площадке. Симметричная схема позволяет добавить функции уменьшения избыточности в передаваемых данных (сжатие, дедупликация, кэширование) и оптимизации протоколов.
Для решения второй проблемы используются функции WAN Path Selection: замер характеристик WAN-каналов и динамическое распределение сессий между несколькими путями с учетом требований приложений и текущих характеристик каждого канала.
Еще по теме:
- Как задавать целевое состояние сети
- Построение бессерверных филиалов (часть 2). Проблемные точки при работе через WAN
- Некоторые вопросы коммутации в ЦОД (политики, BPDU, physical vs vswitch)
- Балансировка нагрузки между серверами приложений. Сценарии
- Построение бессерверных филиалов (часть 5). Применение WOC для обеспечения уровня обслуживания в симметричной схеме
Комментариев пока нет
Добавить комментарий