OpenAI пуснаха o1 за комплексни задачи

— Моделът стана по-умен, защото първо мисли, а после отговаря. Ние не виждаме този процес, само сгъстено описание на резултата. Вътре има Chain-of-Thought и, изглежда, някаква критика и агрегация на резултата, умножени по дообучение на всичко това. — o1 е много добра в математика, физика и код, следва инструкциите добре, но знае по-малко за света около нас. — Моделът решава сложни задачи по математика и програмиране на нивото на медалисти от международни олимпиади. По физика е на ниво докторант (около 75–80% верни отговори). — Новата o1 не трябва да се промптва специално. Тя сама ще направи всичко под капака. — Моделът е достъпен за всички платени абонати на ChatGPT Plus с лимит: 30 съобщения седмично за големия модел и 50 за малкия. Цените ще хапят, защото е по-скъп и по ресурси на токен, и по брой токени (за разсъжденията). — OpenAI вече тестват подобрен модел, но засега не го пускат. Изглежда ще има по-голям контекст и повече време за мислене.

https://openai.com/index/introducing-openai-o1-preview/

Изводи:

  • Възможно е да има разделение на модели на “управляеми” и “всичко-в-едно” за решаване на различни класове задачи. Някъде трябва да се мисли над нещо сложно, а другаде просто да се прави и да има поне някакъв контрол. Например, сапорт агенти.
  • Засега не виждам никакво приложение за себе си, освен ChatGPT. Твърде скъпо за моите задачи. Но трябва да тествам.
  • Ще трябва да се върна към експерименти с групи агенти. Поне е забавно 🙂