Підсумки 2025 у GenAI

date: 2026-01-03

tags: [#ai, #llm, #agents, #sdlc, #development, #future ]

draft: false

---

Від «іноді працює» до «частіше працює, ніж ні»: усі типи моделей зробили якісний ривок. З’явилися reasoning-здатності, мультимодальні speech-to-speech моделі (включаючи переклад у реальному часі), архітектура mixture-of-experts та нові прийоми оптимізації.
Бум нових модальностей: вибухове зростання якості генерації зображень та відео. Нейромережі навчилися «бачити» та створювати відео з урахуванням фізики реального світу. Хоча артефакти на кшталт «фон рухається не в той бік» або дивацтва з дверима все ще трапляються, вони стають скоріше винятком.
Проблеми LLM залишаються незмінними: галюцинації, імовірнісна природа (недетермінованість), відсутність «здорового глузду» та висока вартість.
Найкращої моделі немає і, схоже, не буде: їх стає все більше, і кожна хороша у чомусь своєму. Іноді ефективніше зробити ланцюжок із 2–3 запитів до дешевої моделі, ніж один — до флагманської.
Швидкі проти розумних: з появою reasoning-моделей закріпився поділ на «розумні, але повільні» та «швидкі». Конкуренція серед швидких моделей поки що нижча, оскільки індустрія сфокусована на топових бенчмарках.
Від «магії промптів» до проектування контексту: відбувся перехід до інженерного підходу — RAG, інструментів (tools), MCP та інших технік формування контексту під конкретну задачу.
Усі компанії будують агентів: багато хто (якщо не більшість) поки що перебувають на стадії експериментів та створення інфраструктури (процесів, інструментів та даних).
Люди все ще ефективніші: копайлоти поки що стабільніші за повністю автономних агентів. Навіть у програмуванні на спеціалізованих моделях «вайб-кодинг» редко виходить за межі PoC та невеликих утиліт.
Автономних агентів у продакшені мало: реальні результати видно лише там, де завдання або прості (перша лінія підтримки), або органічні для ШІ (аналіз та генерація текстів).
Мультиагентні системи — поки що екзотика: зв’язок зі спеціалізованих оркестрованих агентів майже немає в масових продуктах. Хоча така архітектура здається перспективнішою, ніж один універсальний агент.
Демократизація та економіка ШІ: зниження відносної вартості інференсу (завдяки DeepSeek та open-source моделям) та розвиток локальних рішень поступово ламають монополію хмарних гігантів.
Курс на єдиного асистента: великі гравці починають об’єднувати розрізнені інструменти в універсальних помічників.
Стандартизація: з’являються протоколи на кшталт MCP, A2A, A2UI. Де-факто стандартом взаємодії став OpenAI Chat Completions API.
On-device генерація: поки що не мейнстрім, але тренд заданий (Windows Copilot+, Apple Intelligence). У браузерах технологія Web Neural Network API все ще у статусі чернетки.