Внедрение службы мониторинга снижает количество инцидентов и время их устранения. В ближайшее время планируется добавить также функцию оценки потерь бизнеса от каждого инцидента.
По оценкам МТС, ситуационный центр находит более 95% инцидентов ранее, чем их замечают разработчики. В итоге простои критичных для бизнеса группы ИТ-систем снизились более чем на 25%. До 40% критических инцидентов теперь решаются техническими специалистами компании еще до того, как появятся зарегистрированные жалобы пользователей. Это положительно сказывается на клиентском опыте и снижает нагрузку на контактные службы оператора.
В Mission Control Center внедряют модель реагирования на события, которая применяется в авиации - она определяет логику эскалаций и информирования в рамках устранения критических инцидентов.
Благодаря использованию подходов Site Reliability Engineering (SRE) и различных инструментов платформы наблюдаемости состояние ландшафта ИТ-экосистемы получается отслеживать в режиме реального времени.
Центр позволил не только сократить время простоя из-за технических инцидентов, но и снизить вероятность критических сбоев. На сегодня уже более 150 продуктов экосистемы МТС контролируется через Mission Control Center.
«Надежность и стабильность работы всех продуктов компании всегда важно оценивать экономически. Сегодня мы переходим от обеспечения эксплуатации информационных систем к решению задач обеспечения надежности бизнес-сервисов. Mission Control Center является ключевым элементом, который позволяет поддерживать качество продуктов экосистемы на высочайшем уровне, необходимом нашему бизнесу», — отметил первый вице-президент по технологиям МТС Павел Воронин.
--
Комментариев нет:
Отправить комментарий