Резултати от 2025 в GenAI

date: 2026-01-03

tags: [#ai, #llm, #agents, #sdlc, #development, #future ]

draft: false

---

От „понякога работи“ до „по-често работи, отколкото не“: всички типове модели направиха качествен скок. Появиха се способности за разсъждение (reasoning), мултимодални speech-to-speech модели (включително превод в реално време), архитектура mixture-of-experts и нови техники за оптимизация.
Бум на нови модалности: експлозивен ръст в качеството на генериране на изображения и видео. Невронните мрежи се научиха да „виждат“ и да създават видео, съобразено с физиката на реалния свят. Въпреки че все още се срещат артефакти като „фонът се движи в грешната посока“ или странности с вратите, те се превръщат по-скоро в изключение.
Проблемите на LLM остават същите: халюцинации, вероятностна природа (недетерминираност), липса на „здрав разум“ и высокая цена.
Няма най-добър модел и изглежда няма и да има: те стават все повече и всеки е добър в нещо специфично. Понякога е по-ефективно да се направи верига от 2–3 заявки към евтин модел, отколкото една към флагмански такъв.
Бързи срещу умни: с появата на reasoning моделите се затвърди разделението на „умни, но бавни“ и „бързи“. Конкуренцията среди бързите модели засега е по-ниска, тъй като индустрията е фокусирана върху топ бенчмарковете.
От „магия на промптите“ към проектиране на контекста: извърши се преход към инженерен подход — RAG, инструменти (tools), MCP и други техники за формиране на контекст за конкретна задача.
Всички компании изграждат агенти: мнозина (ако не и повечето) все още са в етап на експерименти и създаване на инфраструктура (процеси, инструменти и данни).
Хората все още са по-ефективни: копайлотите засега са по-стабилни от напълно автономните агенти. Дори в програмирането със специализирани модели, „вайб-кодингът“ рядко излиза извън рамките на PoC и малки инструменти.
Автономните агенти в продукция са малко: реални резултати се виждат само там, където задачите са или прости (първа линия на поддръжка), или органични за LLM (анализ и генериране на текстове).
Мултиагентните системи засега са екзотика: връзки от специализирани оркестрирани агенти почти липсват в масовите продукти. Въпреки че такава архитектура изглежда по-обещаваща от един универсален агент.
Демократизация и икономика на ИИ: намаляването на относителната цена на инференса (благодарение на DeepSeek и open-source моделите) и развитието на локални решения постепенно разбиват монопола на облачните гиганти.
Курс към единен асистент: големите играчи започват да обединяват разпръснати инструменти в универсални помощници.
Стандартизация: появяват се протоколи като MCP, A2A, A2UI. Де-факто стандарт за взаимодействие стана OpenAI Chat Completions API.
On-device генерация: все още не е мейнстрийм, но трендът е зададен (Windows Copilot+, Apple Intelligence). В браузърите технологията Web Neural Network API все още е в статус на чернова.