| korchasa@*ops

---

title:

date: 2024-09-13

draft: false

---

OpenAI пуснаха o1 за комплексни задачи

— Моделът стана по-умен, защото първо мисли, а после отговаря. Ние не виждаме този процес, само сгъстено описание на резултата. Вътре има Chain-of-Thought и, изглежда, някаква критика и агрегация на резултата, умножени по дообучение на всичко това. — o1 е много добра в математика, физика и код, следва инструкциите добре, но знае по-малко за света около нас. — Моделът решава сложни задачи по математика и програмиране на нивото на медалисти от международни олимпиади. По физика е на ниво докторант (около 75–80% верни отговори). — Новата o1 не трябва да се промптва специално. Тя сама ще направи всичко под капака. — Моделът е достъпен за всички платени абонати на ChatGPT Plus с лимит: 30 съобщения седмично за големия модел и 50 за малкия. Цените ще хапят, защото е по-скъп и по ресурси на токен, и по брой токени (за разсъжденията). — OpenAI вече тестват подобрен модел, но засега не го пускат. Изглежда ще има по-голям контекст и повече време за мислене.

https://openai.com/index/introducing-openai-o1-preview/

Изводи:

Възможно е да има разделение на модели на “управляеми” и “всичко-в-едно” за решаване на различни класове задачи. Някъде трябва да се мисли над нещо сложно, а другаде просто да се прави и да има поне някакъв контрол. Например, сапорт агенти.
Засега не виждам никакво приложение за себе си, освен ChatGPT. Твърде скъпо за моите задачи. Но трябва да тествам.
Ще трябва да се върна към експерименти с групи агенти. Поне е забавно 🙂