OpenAI викотили o1 для комплексних задач
— Модель стала розумнішою завдяки тому, що спочатку думає, а потім відповідає. Ми цього процесу не бачимо, лише стиснутий опис результату. Усередині в неї Chain-of-Thought і, мабуть, якась критика та агрегація результату, помножена на донавчання всьому цьому. — o1 крута в математиці, фізиці й коді, добре дотримується інструкцій, але знає менше про навколишній світ. — Модель розв’язує складні задачі з математики та програмування на рівні медалістів міжнародних олімпіад. У фізиці вона на рівні аспіранта (приблизно 75–80% правильних відповідей). — Новий o1 не потрібно спеціально промптити. Вона сама все зробить під капотом. — Модель доступна всім платним підписникам ChatGPT Plus з лімітом: 30 повідомлень на тиждень для великої моделі і 50 для малої. Ціни будуть дуже кусатися, бо вона затратніша і за ресурси на токен, і за кількість токенів (на міркування). — OpenAI вже тестують покращену модель, але поки її не випускають. Схоже, буде збільшений контекст і час на роздуми.
https://openai.com/index/introducing-openai-o1-preview/
Висновки:
- Можливо, відбудеться розділення моделей на “керовані” та “все-в-одному” для розв’язання різних класів задач. Десь потрібно думати над чимось складним, а десь просто робити і хочеться хоч якогось контролю. Наприклад, агенти саппорту.
- Поки не бачу для себе жодного застосування, окрім ChatGPT. Занадто дорого для моїх задач. Але треба тестувати.
- Потрібно буде повернутися до експериментів із групами агентів. Як мінімум це весело 🙂