В июле 2024 года компания Gartner выпустила ежегодный отчет
Hype Cycle for Monitoring and Observability 2024 в котором представлены ключевые технологии и практики мониторинга и наблюдаемости.
Gartner — международная исследовательская и консалтинговая компания, специализирующаяся на рынках информационных технологий и известная своими регулярными аналитическими отчётами в форматах Magic Quadrant и Hype Cycle.
Методология
Gartner Hype Cycle даёт представление о том, на какой стадии развития находятся технологии и как они будут развиваться со временем, что помогает планировать их внедрение. Для визуализации зрелости технологий используется модель, которая отражает пять ключевых стадий жизненного цикла:
- Триггер инноваций (Innovation Trigger): появление новой технологии, которая вызывает интерес и активное обсуждение, но ещё не имеет доказанной ценности;
- Пик завышенных ожиданий (Peak of Inflated Expectations): быстрый рост внимания к технологии, сопровождающийся историями успеха и многочисленными неудачами внедрения;
- Пропасть разочарования (Trough of Disillusionment): снижение интереса к технологии после того, как первые проекты не оправдали ожиданий;
- Склон просветления (Slope of Enlightenment): накопление успешных примеров использования технологии и понимание того, как её применять в компаниях;
- Плато продуктивности (Plateau of Productivity): массовое внедрение технологии, подтверждение её бизнес-ценности и широкая применимость.
Технологии на стадии триггера инноваций (
Innovation Trigger):
- Autonomic Systems — создание самоуправляемых систем, способных самостоятельно обнаруживать и устранять проблемы;
- Central Observability Teams — формирование централизованных команд для развития и поддержки наблюдаемости на уровне организации;
- Low-Code Observability — использование low-code инструментов для настройки наблюдаемости;
- Augmented FinOps — применение аналитики и AI для оптимизации затрат на мониторинг и наблюдаемость;
- Monitoring as Code — описание конфигураций мониторинга и алертов в виде кода с версионированием и автоматизацией;
- Autonomous Workload Optimization — автоматизация оптимизации производительности и ресурсов рабочих нагрузок;
- IT Sustainability Management — управление энергоэффективностью и экологическим воздействием IT систем;
- Service Response — анализ и управление временем отклика сервисов и пользовательских запросов;
- Observability-Driven Development — использование данных наблюдаемости как основы для проектирования и развития систем;
- Transfer Learning — повторное использование обученных моделей для ускорения анализа и интерпретации телеметрии;
- Telemetry Pipelines — построение масштабируемых конвейеров сбора, обработки и доставки телеметрических данных.
Технологии на стадии пика завышенных ожиданий (
Peak of Inflated Expectations):
- OpenTelemetry — применение открытого стандарта для унифицированного сбора метрик, логов и трассировок;
- Digital Platform Conductor Tools — использование инструментов для координации и управления цифровыми платформами;
- Internal Developer Portals — создание внутренних порталов для доступа к инструментам мониторинга и наблюдаемости;
- Data Observability — контроль качества, полноты и актуальности данных в аналитических и операционных системах;
- API Observability — наблюдаемость за API с фокусом на производительность, надежность и пользовательский опыт;
- eBPF — использование eBPF для низкоуровневого и высокопроизводительного наблюдения за системами;
- Observability — внедрение комплексных подходов к анализу поведения распределенных систем.
Технологии на стадии пропасти разочарования (
Trough of Disillusionment):
- Generative AI — применение генеративных моделей для анализа, корреляции и объяснения инцидентов;
- Cloud-Native Service Provider Monitoring — использование встроенных средств мониторинга облачных провайдеров;
- DEX Tools — использование инструментов для измерения, анализа и улучшения цифрового опыта сотрудников;
- Digital Experience Monitoring — наблюдаемость за реальным пользовательским опытом в цифровых продуктах;
- Performance Engineering — системная работа с производительностью приложений и инфраструктуры;
- Site Reliability Engineering — применение инженерных практик для обеспечения надежности сервисов;
- Log Monitoring and Analysis — сбор и анализ логов для диагностики и расследования инцидентов;
- Chaos Engineering — проведение экспериментов для проверки устойчивости систем к отказам;
- Event Intelligence Solutions — применение AI и аналитики для корреляции, подавления и интерпретации событий;
- Service Mesh — внедрение инфраструктурного уровня для управления взаимодействием между сервисами;
- Intent-Based Networking — описание требуемого поведения сети на декларативном уровне с автоматическим применением изменений.
Технологии на стадии склона просветления (
Slope of Enlightenment):
- NDR (Network Detection and Response) — обнаружение и реагирование на аномалии и угрозы на сетевом уровне;
- Automated Incident Response — автоматизация процессов реагирования на инциденты.
Технологии на стадии плато продуктивности (
Plateau of Productivity) отсутствуют.
Основные технологии из отчета
Hype Cycle for Monitoring and Observability 2024 приведены ниже: