| korchasa@*ops

---

title:

date: 2024-09-13

draft: false

---

OpenAI викотили o1 для комплексних задач

— Модель стала розумнішою завдяки тому, що спочатку думає, а потім відповідає. Ми цього процесу не бачимо, лише стиснутий опис результату. Усередині в неї Chain-of-Thought і, мабуть, якась критика та агрегація результату, помножена на донавчання всьому цьому. — o1 крута в математиці, фізиці й коді, добре дотримується інструкцій, але знає менше про навколишній світ. — Модель розв’язує складні задачі з математики та програмування на рівні медалістів міжнародних олімпіад. У фізиці вона на рівні аспіранта (приблизно 75–80% правильних відповідей). — Новий o1 не потрібно спеціально промптити. Вона сама все зробить під капотом. — Модель доступна всім платним підписникам ChatGPT Plus з лімітом: 30 повідомлень на тиждень для великої моделі і 50 для малої. Ціни будуть дуже кусатися, бо вона затратніша і за ресурси на токен, і за кількість токенів (на міркування). — OpenAI вже тестують покращену модель, але поки її не випускають. Схоже, буде збільшений контекст і час на роздуми.

https://openai.com/index/introducing-openai-o1-preview/

Висновки:

Можливо, відбудеться розділення моделей на “керовані” та “все-в-одному” для розв’язання різних класів задач. Десь потрібно думати над чимось складним, а десь просто робити і хочеться хоч якогось контролю. Наприклад, агенти саппорту.
Поки не бачу для себе жодного застосування, окрім ChatGPT. Занадто дорого для моїх задач. Але треба тестувати.
Потрібно буде повернутися до експериментів із групами агентів. Як мінімум це весело 🙂