От «иногда работает» до «чаще работает, чем нет»: все типы моделей совершили качественный рывок. Появились reasoning-способности, мультимодальные speech-to-speech модели (включая перевод в реальном времени), архитектура mixture-of-experts и новые приемы оптимизации.
Бум новых модальностей: взрывной рост качества генерации изображений и видео. Нейросети научились «видеть» и создавать видео с учетом физики реального мира. Хотя артефакты вроде «фон движется не в ту сторону» или странности с дверями всё еще встречаются, они становятся скорее исключением.
Проблемы LLM остаются прежними: галлюцинации, вероятностная природа (недетерминированность), отсутствие «здравого смысла», неумение отступать, отстутствие самостоятельной генерализации решений и высокая стоимость.
Лучшей модели нет и, похоже, не будет: их становится всё больше, и каждая хороша в чем-то своем. Иногда эффективнее сделать цепочку из 2–3 запросов к дешевой модели, чем один — к флагманской.
Быстрые против умных: с появлением reasoning-моделей закрепилось разделение на «умные, но медленные» и «быстрые». Конкуренция среди быстрых моделей пока ниже, так как индустрия сфокусирована на топовых бенчмарках.
От «магии промптов» к проектированию контекста: произошел переход к инженерному подходу — RAG, инструментам (tools), MCP и другим техникам формирования контекста под конкретную задачу.
Все компании строят агентов: многие (если не большинство) пока находятся на стадии экспериментов и создания инфраструктуры (процессов, инструментов и данных).
Люди всё еще эффективнее: копайлоты пока стабильнее полностью автономных агентов. Даже в программировании на специализированных моделях «вайб-кодинг» редко выходит за рамки PoC и небольших утилит.
Автономных агентов в продакшене мало: реальные результаты видны лишь там, где задачи либо просты (первая линия поддержки), либо органичны для LLM (анализ и генерация текстов).
Мультиагентные системы — пока экзотика: связок из специализированных оркестрируемых агентов почти нет в массовых продуктах. Хотя такая архитектура кажется более перспективной, чем один универсальный агент.
Демократизация и экономика ИИ: снижение относительной стоимости инференса (благодаря DeepSeek и open-source моделям) и развитие локальных решений постепенно ломают монополию облачных гигантов.
Курс на единого ассистента: крупные игроки начинают объединять разрозненные инструменты в универсальных помощников.
Стандартизация: появляются протоколы вроде MCP, A2A, A2UI. Де-факто стандартом взаимодействия стал OpenAI Chat Completions API.
On-device генерация: пока не мейнстрим, но тренд задан (Windows Copilot+, Apple Intelligence). В браузерах технология Web Neural Network API всё еще в статусе черновика.