Обзор The State of AIOps 2023

В начале 2023 года вышел отчет по состоянию AIOps — The State of AIOps 2023 от компании OpsRamp. В нем рассматриваются факторы внедрения AIOps, ключевые сценарии применения и получаемые эффекты, а также анализируется, какие ожидания от технологии оправдались, с какими барьерами столкнулись организации и какие риски они видят при дальнейшем масштабировании. Авторы дают определение AIOps — это использование больших данных (Big Data) и методов машинного обучения (Machine Learning) для автоматизации процессов эксплуатации IT, таких как корреляция событий, обнаружение аномалий и определение причинно-следственных связей инцидентов. Отчет основан на опросе 265 руководителей, отвечающих за системы мониторинга в компаниях с выручкой от 25 млн долларов и численностью более 500 сотрудников. В отчете также рассматриваются сходства и различия во внедрении AIOps между Enterprise компаниями и поставщиками услуг (MSPs).

Что интересного мы отметили в отчете:
  1. Основные препятствия для устойчивого роста и прибыльности. Для поставщиков управляемых услуг ключевыми барьерами остаются повышение операционной эффективности (68%), рост удовлетворенности клиентов и снижение оттока (64%), а также найм и удержание сотрудников (61%). Далее следуют развитие дифференцированных сервисных предложений (54%), поддержание продуктивности распределенной рабочей силы (48%) и партнерства для выхода на рынок (36%);
  2. Ключевые задачи IT эксплуатации в 2023 году. Для Enterprise компаний приоритетами стали автоматизация эксплуатации (66%), повышение эффективности и продуктивности команд и процессов эксплуатации (61%) и расширение использования AI и машинного обучения (60%). Также отмечаются улучшение управляемости процессов (51%), понимание зависимостей приложений (43%) и снижение времени обнаружения и устранения инцидентов (30%);
  3. Как организации обнаруживают инциденты и сбои. Большинство организаций по-прежнему опираются на специализированные инструменты мониторинга инфраструктуры: их используют 51% Enterprise компаний и 72% поставщиков управляемых услуг. У MSP значительно выше доля ручной обработки инцидентов (58% против 21% у Enterprise компаний) и применения традиционной фильтрации событий по правилам (52%), тогда как у Enterprise компаний эти подходы встречаются редко. Корреляция событий на базе AIOps используется ограниченно — 6% у Enterprise компаний и 40% у MSP, что показывает, что даже при внедрении AIOps многие организации продолжают полагаться на классические инструменты и ручные процессы;
  4. Основные сложности управления инцидентами. Для Enterprise компаний главными проблемами остаются понимание зависимостей между приложениями и инфраструктурой при сбоях (62%), определение вероятной первопричины инцидента (56%) и сокращение времени восстановления критичных сервисов (50%). Также отмечаются избыточные рутинные задачи и перегрузка алертами и событиями. У поставщиков управляемых услуг картина схожа, но выражена сильнее: понимание зависимостей отмечают 66%, быстрое восстановление сервисов — 65%, анализ первопричин — 49%. Дополнительно MSP чаще сталкиваются с рутиной и перегрузкой алеутами, что указывает на более высокую операционную нагрузку и необходимость автоматизации процессов управления инцидентами;
  5. Критерии выбора поставщика AIOps. Для Enterprise компаний ключевыми факторами выбора являются технологические возможности решения (64%), отраслевой опыт поставщика (56%) и оценки аналитиков (51%). Далее следуют результаты пилотов (48%) и модели ценообразования (43%), тогда как рекомендации партнеров (37%) и отзывы клиентов (34%) играют вспомогательную роль. Медийное присутствие практически не влияет на выбор. У поставщиков управляемых услуг приоритеты схожи, но сильнее выражена роль технологий (69%) и ценовой модели (52%). Также важны отраслевой опыт (55%) и оценки аналитиков (53%). Отзывы клиентов и пилоты имеют среднюю значимость, а рекомендации партнеров и медийное освещение остаются второстепенными факторами;
  6. Драйверы внедрения AIOps. Для Enterprise компаний основными причинами внедрения AIOps являются повышение доступности и производительности сервисов и приложений (59%), автоматизация эксплуатации для роста эффективности команд (58%), а также автоматизация процессов управления и ускорение поиска первопричин инцидентов (по 53%). Менее выраженными драйверами выступают использование аналитики для проактивного управления и улучшение понимания зависимостей приложений и инфраструктуры. У поставщиков управляемых услуг приоритеты в целом совпадают, но выражены сильнее: повышение доступности сервисов (66%), автоматизация операций (57%) и процессов управления (55%) остаются ключевыми мотиваторами. Также важны ускорение анализа первопричин и использование аналитики трендов (по 48%), а понимание зависимостей систем (46%) играет более заметную роль, чем у Enterprise компаний;
  7. Ключевые функции AIOps решений. Для Enterprise компаний и поставщиков управляемых услуг приоритеты практически совпадают. Наиболее важными считаются встроенный мониторинг и нативная инструментализация (56%), визуализация инцидентов с лентами событий и таймлайнами (51%), а также видимость влияния инцидентов на сервисы и бизнес-контекст (51%). Также значимы интеграция с ITSM процессами управления инцидентами (49%), наличие моделей аналитики (35%) и поддержка гибридных сценариев развертывания (34%). Простота внедрения и использования рассматривается как менее критичный фактор;
  8. Как команды используют инструменты AIOps. Для Enterprise компаний основным сценарием использования AIOps остаются интеллектуальные уведомления и алертинг (70%), далее следуют анализ первопричин через корреляцию событий (57%), обнаружение аномалий и угроз (52%) и автоматическое устранение инцидентов (50%). Оптимизация емкости и ресурсов используется значительно реже (27%). У поставщиков управляемых услуг картина схожа: интеллектуальные алерты применяют 66%, автоматическое устранение инцидентов — 57%, анализ первопричин — 55%, а обнаружение аномалий — 49%. При этом оптимизация емкости используется чаще, чем у Enterprise компаний (42%), что отражает более выраженный фокус MSP на эффективности использования инфраструктуры;
  9. Операционные эффекты использования AIOps. Для Enterprise компаний основными результатами применения AIOps являются сокращение числа открытых инцидентов (63%), уменьшение времени обнаружения и восстановления сервисов (56%) и автоматизация рутинных задач (50%). Также заметным эффектом считается корреляция алертов (46%), что снижает шум мониторинга. У поставщиков управляемых услуг картина практически совпадает: снижение числа инцидентов отмечают 67%, сокращение MTTD и MTTR — 57%, автоматизацию задач — 53%, а уменьшение шума алертов — 47%. В целом результаты показывают, что ключевая ценность AIOps для обеих групп связана прежде всего со снижением операционной нагрузки и ускорением реакции на инциденты;
  10. Опасения при использовании AIOps. Для Enterprise компаний главными рисками остаются качество и точность данных (62%), экономическая эффективность и возврат инвестиций (48%), а также нехватка компетенций в области анализа данных и машинного обучения (47%). Также отмечаются риски ошибок и потери контроля над процессами (43%) и опасения сокращения рабочих мест (34%), тогда как длительность внедрения воспринимается как менее значимая проблема (20%). У поставщиков управляемых услуг приоритеты схожи, но выражены сильнее: точность данных волнует 70%, дефицит компетенций — 60%, риск ошибок и потери контроля — 44%, а экономическая эффективность — 43%. Опасения сокращения рабочих мест (38%) и длительности внедрения (18%) остаются второстепенными, что показывает, что основное внимание организаций сосредоточено на качестве данных и доступности экспертизы для работы с AIOps.
Основные результаты из отчета The State of AIOps 2023 приведены ниже:
Если вам важно внедрять и масштабировать новые технологии эксплуатации, включая AIOps, обращайтесь к нам за помощью. Мы помогаем Enterprise компаниям и поставщикам услуг оценивать готовность к внедрению, проводить исследования и анализ текущих практик эксплуатации, наблюдаемости и управления инцидентами, собирать и интерпретировать данные, выбирать инструменты и формировать целевую операционную модель. Мы поддерживаем команды в адаптации новых технологий, выстраивании процессов и взаимодействия между платформенными, эксплуатационными и продуктовыми командами, чтобы инновации действительно снижали операционную нагрузку и приносили измеримый эффект.

Не забывайте подписываться на наш канал Enabling.team Insights, чтобы оставаться в курсе технологических трендов.