В начале 2026 года компания Grafana Labs опубликовала отчет по состоянию наблюдаемости —
Observability Survey 2026 . Данный отчет уже четвертый по счету и подготовлен на базе опроса в котором приняло участие 1363 респондентов из компаний различного масштаба, представляющие более чем десяток отраслей и широкий спектр ролей (SRE, Developer, Platform engineer, Engineering manager, CTO, etc), что делает его крупнейшим опросом о состоянии Observability.
С 2025 года авторы изменили формат публикации результатов и предложили несколько способов работы с данными и получения инсайтов. Исследование доступно в виде основного текстового отчета с ключевыми диаграммами и в виде
интерактивного дашборда в Grafana с десятком панелей для визуализации данных и углубленного анализа, включая возможность фильтрации по отрасли, региону, роли и размеру компании для сравнения с сопоставимыми организациями.
Что интересного мы отметили в отчете:
- Внедрение новых направлений Observability. Наиболее зрелым направлением является объединенный мониторинг приложений и инфраструктуры, 46% используют в Production, еще 18% находятся на стадии POC и 20% изучают. Безопасность и SLOs также широко применяются, по 32% в Production, при 18-22% на стадии POC и около 22-27% на этапе изучения. Business Observability применяется в Production в 30% случаев, при 18% POC и 24% изучения. Digital Experience Monitoring имеет 26% использования в Production, 17% POC и 23% изучения. FinOps распределен более равномерно, 23% Production, 19% POC, 21% изучение и 23% не рассматривают. Observability для LLM приложений имеет наименьшую зрелость;
- Основные проблемы Observability. Наиболее частой проблемой является сложность и избыточные накладные расходы на внедрение и поддержку инструменто (39%). Далее проблемы с шумом и соотношением сигнал шум (34%), высокая стоимость (31%), сложность прогнозирования затрат (27%), зависимость от вендора (26%), необходимость обосновывать ценность для руководства (24%) и сложности с внедрением внутри компании (22%);
- Критерии выбора Observability инструментов. Наиболее значимым фактором является стоимость (65%). Далее идут удобство использования (50%), совместимость с другими инструментами и использование Open Source технологий (27-25%), кривая обучения (24%), уверенность в способности платформы соответствовать будущим требованиям (17%), AI возможности (15%), корреляция сигналов (14%), знакомство и распространенность внутри организации (13%), простота перехода на другой инструмент (12%), автоматические инсайты (10%);
- Удовлетворенность состоянием Observability. 45% респондентов в основном удовлетворены текущим состоянием Observability, еще 12% полностью удовлетворены. 34% скорее не удовлетворены и 10% не удовлетворены. При этом 29% оценивают скорость развития Observability инструментов как высокую, 36% занимают нейтральную позицию, 33% считают ее умеренной и около 3% не удовлетворены;
- Роль Observability в организации. На уровне CTO и C-level роль Observability считается критически важной в 31% случаев, на уровне руководителей 20%, на уровне разработчиков 15%, на уровне Observability команды 13%, на уровне VP 11%;
- Модель использования Observability. 29% используют преимущественно Self Managed решения, 22% полностью Self Managed, 21% в основном SaaS, 17% только SaaS, 12% используют смешанную модель;
- Экономия времени и средств за счет централизованного Observability. 77% респондентов отмечают экономию, 23% не фиксируют эффекта;
- Основные препятствия для ускорения реакции на инциденты. Наиболее частая проблема это перегрузка алертами (30%). Далее идут сложности координации между командами (16%), отсутствие культуры и процессов обучения на инцидентах (15%), ограниченность данных по инцидентам (13%) и отсутствие выстроенного процесса реагирования (13%);
- Использование бизнес метрик. Основные сценарии это оценка риска, соответствие требованиям и безопасность (35%), коммерческая эффективность (32%), надежность и эксплуатация сервисов (23%), бизнес процессы (9%), затраты и использование ресурсов (6%), а также данные, аналитика и AI (4%);
- Важность Open Source и открытых стандартов в Observability стратегии. 41% респондентов оценивают их как очень важные, еще 20% как критически важные. Нейтральную позицию занимают 20%, умеренную важность отмечают 16%, низкую важность 4%;
- Инвестиции в Prometheus. 15% не используют инструмент, 8% находятся на этапе изучения, 10% экспериментируют. Использование в отдельных Production workloads составляет 20%, в большинстве Production workloads — 18%, во всех Production workloads — 21%;
- Инвестиции в OpenTelemetry. 15% не используют, 17% изучают, 18% экспериментируют. Использование в отдельных Production workloads составляет 20%, в большинстве Production workloads — 11%, во всех production workloads — 10%;
- Использование телеметрических сигналов в OpenTelemetry. Метрики используются примерно в 57% случаев, трассировки 50%, логи 49%, а профили 10%. Динамика по метрикам: 70% отмечают рост использования, 29% без изменений, 2% снижение. Динамика по логам: 65% рост, 33% без изменений, 2% снижение. Динамика по трассировкам: 70% рост, 28% без изменений, 2% снижение. Динамика по профилям: 60% рост, 35% без изменений, 5% снижение;
- Роль OpenTelemetry в решении задач Observability. Наиболее часто отмечается упрощение внедрения и эксплуатации (41%), а также снижение сложности смены вендоров и Backend технологий (37%). Далее поддержка трассировок (31%), эффективность затрат (29%), масштабируемость для обработки больших объемов телеметрии (28%), поддержка метрик (18%), логирования (12%), профилирования (4%);
- Планируемые расходы на Observability. 50% респондентов ожидают увеличение расходов в следующем году, 39% планируют сохранить текущий уровень, 10% ожидают снижение. Основной фактор это расширение использования observability практик и инструментов (63%). Далее ожидание более высокого возврата инвестиций (31%), рост затрат на вендоров (26%), недостаточная видимость (19%), изменения в конфигурации или смена вендора (16%), проблемы управления (11%), поддержка со стороны руководства (9%);
- Причины снижения расходов на Observability. Основной фактор это повышение эффективности эксплуатации (37%). Далее идут бюджетные ограничения и смена конфигурации или вендора (34%), опасения со стороны руководства (18%), недостаточный возврат инвестиций (11%), отсутствие заметных результатов (8%);
- Причины сохранения расходов на Observability на текущем уровне. Основные причины это удовлетворенность текущей конфигурацией (37%), бюджетные ограничения (37%) и повышение эффективности внутренних процессов (31%). Далее идут недостаточная ценность для расширения (16%) и сдержанность со стороны руководства (9%);
- Ценность AI в Observability платформах. Наибольшую значимость имеют сценарии, связанные с выявлением аномалий до возникновения инцидентов (Anomaly detection, Incident prevention): 56% респондентов оценивают их как очень ценные и еще 20% как критически важные. Сопоставимые оценки получают автоматическая генерация дашбордов, алертов и запросов — 55% и 13%, а также анализ первопричин и корреляций (RCA, Correlation analysis) — 53% и 20%. Прогнозирование и выявление трендов (Forecasting, Trend analysis) — 52% и 15%, помощь новым пользователям в понимании системы (User onboarding, System understanding) — 49% и 14%. 41% оценивают автономные действия AI как очень ценные и 8% как критически важные, при доле скепсиса в 15%;
- Ограничения использования AI. Наиболее частым ограничением является необходимость ручного ввода контекста (26%). Далее следуют нестабильность и частые сбои (18%), а также невозможность настройки под специфические процессы (18%). Прочие ограничения составляют 16%. Отсутствие ограничений отмечают 13%, неспособность обучаться на обратной связи — 9%. Возможность объяснять логику работы и выводы оценивается как важная в 30% случаев, как очень важная — в 27%, и как критически важная в 22%.
Основные инсайты из опроса и отчета Observability Survey 2026 ниже: