OpenAI викотили o1 для комплексних задач

— Модель стала розумнішою завдяки тому, що спочатку думає, а потім відповідає. Ми цього процесу не бачимо, лише стиснутий опис результату. Усередині в неї Chain-of-Thought і, мабуть, якась критика та агрегація результату, помножена на донавчання всьому цьому. — o1 крута в математиці, фізиці й коді, добре дотримується інструкцій, але знає менше про навколишній світ. — Модель розв’язує складні задачі з математики та програмування на рівні медалістів міжнародних олімпіад. У фізиці вона на рівні аспіранта (приблизно 75–80% правильних відповідей). — Новий o1 не потрібно спеціально промптити. Вона сама все зробить під капотом. — Модель доступна всім платним підписникам ChatGPT Plus з лімітом: 30 повідомлень на тиждень для великої моделі і 50 для малої. Ціни будуть дуже кусатися, бо вона затратніша і за ресурси на токен, і за кількість токенів (на міркування). — OpenAI вже тестують покращену модель, але поки її не випускають. Схоже, буде збільшений контекст і час на роздуми.

https://openai.com/index/introducing-openai-o1-preview/

Висновки:

  • Можливо, відбудеться розділення моделей на “керовані” та “все-в-одному” для розв’язання різних класів задач. Десь потрібно думати над чимось складним, а десь просто робити і хочеться хоч якогось контролю. Наприклад, агенти саппорту.
  • Поки не бачу для себе жодного застосування, окрім ChatGPT. Занадто дорого для моїх задач. Але треба тестувати.
  • Потрібно буде повернутися до експериментів із групами агентів. Як мінімум це весело 🙂