В сентябре 2025 года сообщество InfoQ выпустило ежегодный отчёт
AI, ML and Data Engineering Trends в котором представлены ключевые тенденции в области искусственного интеллекта, машинного обучения и инженерии данных.
InfoQ — это международное сообщество для инженеров, архитекторов и технических лидеров, которое проводит конференции QCon и Dev Summit, выпускает статьи, подкасты и аналитические отчёты о развитии технологий, инженерной культуры и практик в индустрии. В 2025 году список мероприятий пополнился новой конференцией —
QCon AI, сфокусированной на практиках
AI-driven engineering и их влиянии на разработку, архитектуру и инженерные процессы.
Отчёт подготовлен редакцией InfoQ совместно с ведущими экспертами индустрии, среди которых
Savannah Kunovsky, Anthony Alford, Daniel Dominguez,
Vinod Goje и
Srini Penchikala. Для визуализации технологий в отчете используется модель Джеффри Мура —
Crossing the Chasm, которая показывает, какие практики находятся на стадии экспериментов у новаторов (
Innovators), какие начинают активно внедрять (
Early Adopters), какие становятся массовыми (
Early Majority), а какие уже закрепились как стандарт в индустрии (
Late Majority).
Практики на стадии экспериментов (
Innovators):
- Model Context Protocol (MCP) — стандартизация обмена контекстом между моделями и инструментами;
- Multimodal AI — объединение текста, изображений, аудио и видео в единой модели;
- Agentic AI / Orchestration — построение и оркестрация AI агентов для выполнения сложных задач;
- Physical AI — внедрение AI в роботизированные и физические системы;
- Reasoning Models — разработка моделей с расширенными возможностями рассуждения и планирования;
- AI DevOps — применение DevOps-практик к жизненному циклу AI/ML;
- AI-powered hardware — разработка и применение специализированного оборудования для AI;
- AI in Robotics (Embodied AI) — внедрение AI в робототехнику;
- LangOps / LLMOps — эксплуатация и управление большими языковыми моделями;
- Knowledge Graphs — построение и использование графов знаний;
- Brain-Computer Interfaces — создание интерфейсов прямого взаимодействия мозга и компьютера;
- Robotics — развитие робототехнических платформ;
- Edge inference and model training — запуск и обучение моделей на edge устройствах;
- Large-scale distributed deep learning — проведение распределённого обучения глубоких моделей в крупных масштабах.
Практики, которые начинают активно внедрять (
Early Adopters):
- Small Language Models (SLMs) — использование малых языковых моделей для специализированных задач;
- Explainable AI — построение интерпретируемых и объяснимых моделей AI;
- Automated Machine Learning (AutoML) — автоматизация построения и оптимизации ML-моделей;
- Retrieval-Augmented Generation (RAG) — генерация ответов AI с использованием внешних источников данных;
- Generative AI / Large Language Models (LLMs) — применение генеративных моделей и больших языковых моделей;
- Cloud-agnostic computing for AI — выполнение AI-вычислений без привязки к облачному провайдеру;
- Data Contracts — заключение контрактов на данные для повышения качества и согласованности;
- Data Observability — внедрение практик наблюдаемости и контроля качества данных;
- Virtual Reality (VR/AR/MR/XR) — применение технологий виртуальной и дополненной реальности в продуктах с AI;
- Cognitive Services — использование готовых когнитивных сервисов (обработка речи, текста, изображений);
- Graph Data Analytics — проведение аналитики на основе графов данных;
- IoT Platforms — внедрение IoT платформ для интеграции устройств и данных с AI.
Практики, которые становятся массовыми (
Early Majority):
- Synthetic data generation — генерация синтетических данных для обучения моделей;
- MLOps — применение практик эксплуатации и сопровождения ML-моделей;
- Vector Databases — использование векторных баз данных;
- AI coding assistants — использование AI-ассистентов для разработки;
- Image Recognition (Computer Vision) — применение технологий компьютерного зрения для распознавания изображений;
- Natural Language Processing (NLP) — использование методов обработки естественного языка;
- Deep Learning — разработка и использование моделей глубокого обучения;
- Open Table Formats (OTFs) — внедрение открытых форматов таблиц (Iceberg, Delta, Hudi);
- Data Mesh — построение децентрализованной архитектуры управления данными;
- Digital Assistants — внедрение цифровых ассистентов в продукты и сервисы;
- Apache Beam — использование унифицированного фреймворка для пакетной и потоковой обработки данных.
Практики, ставшие стандартом в индустрии (
Late Majority):
- Distributed computation (например, Storm) — выполнение распределённых вычислений в кластерах;
- Stream processing (включая «as a service») — использование потоковой обработки данных и сервисных моделей;
- Lakehouses — внедрение архитектур, объединяющих Data Lake и Data Warehouse;
- Apache Flink — применение движка потоковой обработки данных;
- Recommendation engines — разработка и внедрение рекомендательных систем;
- Streaming data analytics — использование аналитики потоковых данных;
- Resource negotiators (YARN, K8s) — применение планировщиков ресурсов (YARN, Kubernetes);
- Data Lake as a Service — использование Data Lake в сервисной модели;
- NoSQL Databases — применение нереляционных баз данных;
- In-memory data grids — использование распределённых хранилищ данных в памяти;
- Big Data technologies (Hadoop, Spark) — применение технологий больших данных для аналитики и хранения.
Основные технологии из отчета
InfoQ AI, ML and Data Engineering Trends 2025 приведены ниже: