Андрей Ивашов: Более 20% отказов дата-центров происходит в момент ошибок при обслуживании

Количество оборудования дата-центров увеличивается, разветвленную инфраструктуру все сложнее контролировать. Не удивительно, что многие корпоративные и коммерческие ЦОДы задумываются о внедрении систем управления. О возможностях и экономической эффективности таких решений мы побеседовали с Андреем Ивашовым, руководителем по развитию бизнеса компании Schneider Electric.

Количество оборудования дата-центров увеличивается, разветвленную инфраструктуру все сложнее контролировать. Не удивительно, что многие корпоративные и коммерческие ЦОДы задумываются о внедрении систем управления. О возможностях и экономической эффективности таких решений мы побеседовали с Андреем Ивашовым, руководителем по развитию бизнеса компании Schneider Electric.

От «латания дыр» к управлению долгосрочной надежностью

CNews: Какую инфраструктуру контролирует система управления дата-центром?

Андрей Ивашов: Вендоры специализируются на разных аспектах управления ЦОДом. Мы концентрируемся на инженерной инфраструктуре. Например, решения Schneider Electric из категории DCIM — Data Center Infrastructure Management — контролируют системы электроснабжения и охлаждения, а также обеспечивают физическую безопасность объекта. Наши системы мониторинга становятся источником данных о состоянии инженерного слоя во внешние системы, ответственные за сервисы более высокого уровня – к примеру, в CMDB, Service Desk и другие.

CNews: Как зависят цифровые сервисы и приложения от инженерного оборудования?

Андрей Ивашов: Современный дата-центр упрощённо можно представить в виде карточного домика, в основании которого находится инженерная инфраструктура, на ней – следующий уровень (сеть, серверы), выше – системы виртуализации, обеспечивающие работу конкретных приложений, услуг. Таким образом, надежность функционирования целевой нагрузки, т.е. ПО и услуг, зависит от всех нижележащих уровней и не может быть выше, чем надежность инженерной инфраструктуры.

В отличие от большой части вендоров, мы стремимся внедрять наши решения DCIM таким образом, чтобы обеспечить информацию о том, от какого инженерного оборудования на физическом уровне зависит каждый компонент услуги. К примеру, система может оценить, сохранится ли необходимый показатель резервирования для конкретных цифровых приложений при обслуживании того или иного компонента электроснабжения.

CNews: ЦОД строится с использованием современного оборудования. Не достаточно ли оно надежное и умное, чтобы работать автономно? Можно ли обойтись без системы управления?

Андрей Ивашов: Наше оборудование систем охлаждения и электропитания оснащено современными контроллерами и великолепно работают автономно и в группе, управляя режимами и производительностью. Благодаря широкому спектру встроенных функций, оборудование самостоятельно высылает оповещения о граничных параметрах или авариях. Однако неизвестно, как быстро ответственные лица увидят эти оповещения, насколько точно и своевременно на них отреагируют.

Внедрение DCIM снимает эти вопросы. Система и оперативно информирует целевую группу специалистов, и эскалирует оповещения. Кроме этого, анализ событий и возможность использования регламентов позволяют принимать взвешенные, адекватные решения и в неожиданных ситуациях, и когда планируются «долгоиграющие» изменения – те, которые программируют, определяют поведение инженерной системы в будущем.

Конечно, в маленьком дата-центре все оборудование на виду, здесь можно вручную вести журнал событий и изменений в таблицах Excel, но когда команда ЦОДа проводит десятки операций в день, без специализированных средств мониторинга и автоматизации обойтись сложно, это неизбежно приведет к ошибкам. Даже если сотрудники успешно устраняют последствия нештатных ситуаций, они с трудом отслеживают тренды и не всегда предотвращают повторение аварий. С появлением автоматизированной системы команда ЦОДа переходит от сиюминутного «латания дыр» к управлению долгосрочной надежностью, а это существенно снижает риски и стоимость эксплуатации.

CNews: Какие задачи стремятся решить заказчики, внедряя системы управления дата-центрами?

Андрей Ивашов: Самая распространенная мотивация заказчиков связана с тем, что с каждым годом на одного квалифицированного сотрудника приходится все больше систем, приложений, серверов и инженерного оборудования. На одной площадке концентрируются устройства разных типов от разных производителей, порой из разных эпох. Катастрофическая нагрузка на людей усугубляет негативное влияние человеческого фактора, растет вероятность ошибок. При этом количество квалифицированных сотрудников на рынке труда отнюдь не увеличивается.

Андрей Ивашов: С появлением автоматизированной системы команда ЦОДа переходит от «латания дыр» к управлению долгосрочной надежностью

Облачные сервисы открывают новые возможности

CNews: Какие перспективные технологии используются в системах управления ЦОДами?

Андрей Ивашов: Помимо традиционных, расположенных на объекте решений (On-Premise), мы можем предложить заказчикам ряд облачных сервисов. Именно в облаках возможно применение таких технологий, как машинное обучение и анализ больших данных. Облачные инструменты помогают персоналу дата-центра принимать своевременные решения и предупредить множество проблем и отказов, которые раньше воспринимались как неизбежные.

К примеру, проанализировав работу большого количества различных источников бесперебойного питания, облачный софт может рассчитать рейтинг жизнеспособности конкретного ИБП. На основе этих данных пользователь установит оптимальный срок замены оборудования, не дожидаясь отказа, который прежде считался не вполне предсказуемым.

CNews: А до появления облачных сервисов системы DCIM не имели функции предиктивной аналитики?

Андрей Ивашов: Наши On-Premise-решения давно умеют делать определенные прогнозы, касающиеся состояния оборудования. Я бы упомянул даже встроенные контроллеры, которые, например, могут отслеживать градиент нагрузки вентиляторов и предупреждать о необходимости замены фильтров. А системы для ЦОДов, такие иконы рынка ИБП как APC Symmetra, имеют встроенный алгоритм, который моделирует химические процессы, происходящие в батареях, причем система точно прогнозирует, по какому графику снижается их емкость. Но здесь нет Больших Данных, это классический предиктивный анализ, который встроен в каждое из устройств.

А в облачной системе мы используем мета-данные с тысяч объектов, подключенных по всему миру, поэтому любой прогноз получается на порядок более точным. Чтобы было понятнее, можно провести аналогию с движением автомобиля. В ЦОДе без системы мониторинга оборудование эксплуатируется до момента отказа, как водитель-лихач, который проскакивает стоп-линию и «краснеющий» жёлтый свет с риском аварии. Система On-Premise гарантирует безопасность, но требует прекращать движение вдали до светофора. Облачная версия поможет остановиться строго на стоп-линии без каких-либо рисков и своевременно начать двигаться далее.

CNews: Насколько пользователи готовы к внедрению облачных сервисов?

Андрей Ивашов: В отличие от северной Америки и ряда западных стран, многие российские заказчики относятся к Cloud-решениям с предубеждением. Не каждый готов хранить информацию о своих активах в облаке и зависеть от канала связи. Тем не менее, популярность облачных сервисов будет расти, поскольку они предоставляют уникальные возможности, становятся более надёжными и позволяют экономить на развертывании своей инфраструктуры.

Система управления исключит человеческий фактор

CNews: С чем связан экономический эффект от внедрения систем управления? Как быстро они окупаются?

Андрей Ивашов: Правильно спроектированный ЦОД обладает определенным уровнем надежности и эффективности. Но на практике дата-центр подвергается разным факторам риска. Его эксплуатируют живые люди, которым может не хватать квалификации или рабочего времени. Из соображений экономии для ЦОДа могут приобретать оборудование вендоров второго-третьего эшелона, которое не обеспечивает заявленных характеристик или даже было разработано не для ЦОДов.

Кроме того, мощности дата-центра не всегда загружаются полностью или равномерно, как было запланировано, и это тоже плохо, потому что стоимость эксплуатации на единицу вычислений возрастает. Мне кажется, мало кто об этом думает, но неэффективная эксплуатация ЦОДа в течение длительного времени приводит к таким же потерям, как и кратковременные отказы. Задача DCIM – оценить, как используется физическая инфраструктура, оптимизировать мощности, а также создать регламенты, которые помогут не увеличивать риски и стоимость эксплуатации в долгосрочной перспективе. С помощью такой системы можно аргументировать модернизацию оборудования, консолидацию серверов и другие необходимые изменения.

Оценить сроки окупаемости системы довольно сложно, ведь мы не знаем, сколько ошибок, проистекающих из человеческого фактора, она помогла предотвратить. Скажу только, что по статистике (Ponemon Institute, 2017), более 20% отказов происходит непосредственно в момент ошибок при обслуживании. По наблюдениям сервисной службы «Шнейдер Электрик», к этим 22% можно смело добавлять 40%, связанных с человеческим фактором, запрограммировавшим чью-то ошибку в будущем. Знаете, как если кто-то ставит кружку на край стола.

Если заказчика интересует не только долгосрочный эффект, но и быстрая окупаемость, то параллельно с приобретением системы управления целесообразно провести аудит и внедрить средства измерений, которые помогут устранить потери в системе охлаждения, неэффективный расход электроэнергии или неполную загрузку стоек. В этом случае вернуть инвестиции можно буквально за несколько месяцев. Также регламенты DCIM помогают стабильно соблюдать правила эффективной эксплуатации инженерной инфраструктуры, которые сотрудники изучают на специализированных тренингах.

CNews: Требует ли система управления постоянного присутствия оператора? Возможна ли, на ваш взгляд, безлюдная эксплуатация дата-центра?

Андрей Ивашов: Система управления не заменяет человека, скорее, это мостик между оборудованием и эксплуатирующей командой. Конечно, система может проработать несколько часов без участия персонала, но, на мой взгляд, круглосуточное присутствие на объекте дисциплинированного, здравомыслящего, обученного сотрудника – это благо. Тем более, в России, где стоимость рабочей силы невелика.

Однако сейчас набирают популярность граничные вычисления (Edge Computing), сервера для них устанавливают прямо в производственных помещениях. Очевидно, что к каждому из таких локальных ЦОДов невозможно приставить ИТ-специалиста, а, значит, в некоторых случаях безлюдная эксплуатация неизбежна.

CNews: Влияет ли внедрение системы управления ЦОДом на уровень кибербезопасности объекта?

Андрей Ивашов: В настоящий момент в состав DCIM мы не включаем специфические средства для противодействия киберугрозам. Ряд потенциальных угроз система помогает предотвратить благодаря функциям контроля доступа к стойкам по карточкам и видеонаблюдению. Эти средства препятствуют физическому проникновению злоумышленников к объектам инфраструктуры. Можно упомянуть то, что централизованный мониторинг доступности оборудования, обновление встроенного ПО и даже отказ от дефолтных паролей уже являются неплохим шагом в строну повышения устойчивости. Часто в процессе внедрения АСДУ или мониторинга мы помогаем заказчикам обратить внимание на то, что часть элементов ЦОДа легко уязвимы. Если это применимо, то мы помогаем доработать модель угроз. Пример типичной ситуации – когда элементы системы охлаждения находятся на крыше здания, куда имеют доступ другие арендаторы.

Конкурентоспособность в долгосрочной перспективе

CNews: В чем отличия решений Schneider Electric от аналогичных продуктов, представленных на рынке?

Андрей Ивашов: Еще раз подчеркну: стоимость кратковременных отказов дата-центра сопоставима с потерями от неэффективной работы в течение длительного времени. Поэтому мы сосредоточены на том, чтобы обеспечить ЦОДу конкурентоспособность в долгосрочной перспективе. Другие вендоры об этом, как правило, не говорят.

Schneider Electric развивает комплексную систему DCIM уже около 10 лет, а системы мониторинга — еще дольше. За эти годы мы модернизировали интерфейсы, увеличили производительность, но главное — аккумулировали опыт огромного числа внедрений. Наши решения адаптированы для быстрого запуска и пригодны для работы в ЦОДах разного масштаба. Их функционал значительно шире, чем у аналогов.

CNews: Что бы вы посоветовали тем, кто планирует внедрять систему управления дата-центром? Как выбрать партнера и продукт?

Андрей Ивашов: Прежде всего, нужно собраться всей командой и сформулировать свои цели и потребности, обозначить болевые точки, а после этого обратиться за консультацией к вендору. Мы покажем, с помощью каких инструментов можно решить перечисленные задачи, объясним, сколько времени на это уйдет и какие ресурсы потребуются со стороны заказчика. Часто мы реализуем пилотные проекты, которые позволяют в тестовом режиме попробовать наши инструменты. После этого клиент может принять взвешенное решение о полном или частичном внедрении системы.

Мы рекомендуем начинать с покупки отдельных модулей, чтобы персонал учился работать в системе постепенно, без лишних стрессов и перегрузок. Наш опыт показывает, что внедрение продукта может быть болезненным, если руководство насаждает его слишком интенсивно. А вот когда технические специалисты понимают, в чем реальная польза системы для них, новый инструмент не вызывает сопротивления.

Предложение производителя установить систему мониторинга за несколько дней должно настораживать. Скорее всего, речь о коробочном продукте. Чтобы адаптировать такое решение под потребности конкретного объекта, потребуется много времени и ресурсов. Наша система тоже позволяет самостоятельно настраивать визуализацию, пороговые значения, оповещения и так далее, но мы понимаем, что многие команды на первых порах не смогут эффективно справиться с этой задачей, поэтому готовы взять на себя помощь во внедрении.

статьи
Более 20% отказов дата-центров происходит в момент ошибок при обслуживании Количество оборудования дата-центров увеличивается, разветвленную инфраструктуру все сложнее контролировать. Не удивительно, что многие корпоративные и коммерческие ЦОДы задумываются о внедрении систем управления. О возможностях и экономической эффективности таких решений мы побеседовали с Андреем Ивашовым, руководителем по развитию бизнеса компании Schneider Electric. Периферийные вычисления: трансформация принципов построения ИТ в процессе цифровизации бизнеса Одним из ключевых трендов, оказывающих существенное влияние на развитие ИТ-рынка, стала цифровая трансформация бизнеса. Она сопровождается повсеместным проникновением информационных технологий в процессы компаний и влечет за собой рост требований к поддерживающей их ИТ-инфраструктуре. В этой статье мы расскажем о некоторых полезных технологиях и способах их реализации. Что там, за облаками? Облачные технологии не стали абсолютно универсальным инструментом для решения любых ИТ-задач. Это привело к развитию специализированных технологий, одна из которых периферийные вычисления. Как построить цифровую реальность Пока эксперты спорят и уточняют определение термина «цифровая экономика», работы в этом направлении на российском рынке набирают обороты. Рынок периферийных вычислений вырастет в пять раз к 2023 Мировой рынок периферийных вычислений вырастет к 2023 году до $4,6 млрд. Рост обеспечит широкое внедрение в повседневную жизнь интернета вещей, виртуальной и дополненной реальности, а также переход на новый стандарт связи 5G. Безопасность дата-центров: «облака» сгущаются Про технологическую культуру, роль государства в предотвращении информационных угроз и ответственность за безопасность пойдет речь в статье Архитектура EcoStruxure для предприятий АПК Решения Schneider Electric по обеспечению безопасности и управлению задействованы на крупнейшем перерабатывающем заводе в мире. Schneider Electric и перспективы развития коммерческих ЦОДов Увеличение спроса на централизованные площадки для размещения серверной инфраструктуры влечёт за собой и рост продаж всего сопутствующего оборудования: систем энергообеспечения, кондиционирования, контроля и управления.
Алексей Солдатов,
генеральный директор DataPro
мнение эксперта
У России есть шансы выйти на международный рынок коммерческих ЦОДов, однако для этого нужна помощь государства. Сегодня в этом секторе наблюдается острый дефицит предложения. Те, кто быстро построит здания мирового уровня, смогут занять на нем существенное место, считают Алексей Солдатов, генеральный директор DataPro, и Роман Шмаков, вице-президент подразделения SecurePower в России и СНГ компании Schneider Electric.
Александр Саванович,
вице-президент по сервису компании Schneider Electric в России и СНГ
мнение эксперта
Развитие сервисов становится одним из приоритетных направлений бизнеса всех технологических компаний. Какие услуги предоставляет своим заказчикам Schneider Electric и как будет развиваться сервисное подразделение компании в России?
Наталия Макарочкина,
старший вице-президент подразделения Secure Power в зоне International компании Schneider Electric
мнение эксперта
Перемещение вычислений к месту создания обрабатываемых данных является прямым следствием цифровизации бизнеса. Они должны быть как можно ближе заказчику. Особенно это касается автономных систем, действующих в режиме реального времени.
Роман Шмаков,
вице-президент подразделения Secure Power компании Schneider Electric в России и СНГ
мнение эксперта
Для развития Edge Computing потребуется относительно автономная, удаленно контролируемая архитектура, так как периферийные узлы находятся вне физического доступа со стороны службы заказчика. Здесь крайне важно иметь сквозную интегрированную систему мониторинга и управления, чтобы понимать состояние инфраструктуры, повышать ее операционную эффективность.
Тимур Алтышев,
директор департамента по работе с ключевыми сегментами подразделения Secure Power компании Schneider Electric
мнение эксперта
Глобальная цифровизация ведёт к тому, что практически все элементы инженерной инфраструктуры либо уже имеют встроенные датчики, либо могут быть ими оснащены, поэтому количество элементов, которые необходимо мониторить, либо управлять ими, становится слишком большим, чтобы работать с каждым в отдельности.
Дмитрий Желтков,
директор департамента по работе с заказчиками коммерческого сектора подразделения Secure Power компании Schneider Electric.
мнение эксперта
В условиях перехода многих компаний в коммерческие ЦОДы, вопросы бесперебойного электропитания ИТ-систем переносятся с площадки заказчика на сторону внешнего дата-центра. Однако, актуальным остается вопрос бесперебойной работы инженерных систем, не связанных с ИТ. ИБП для таких систем имеют свою специфику, и к их выбору следует подходить с особым вниманием.
Для вашего бизнеса
инфографика Открыть инфографику
кейсы