OpenAI выкатили o1 для комплексных задач
— Модель стала умнее благодаря тому, что сначала думает, а потом отвечает. Мы этого процесса не видим, только сжатое описание результата. Внутре у ней Chain-of-Thought и, видимо, какая-то критика и аггрегация результата, помноженная на дообучение этому всему. — o1 крутая в математике, физике и коде, хорошо следует инструкциям, но знает меньше об окружающем мире. — Модель решает сложные задачи по математике и программированию на уровне медалистов международных олимпиад. В физике она на уровне аспиранта (примерно 75-80% правильных ответов). — Новый o1 не нужно специально промптить. Она сама всё сделает под капотом. — Модель доступна всем платным подписчикам ChatGPT Plus с лимитом: 30 сообщений в неделю для большой модели и 50 для маленькой. Цены будут очень кусаться, потому что она затратнее и по ресурсам на токен и по количеству токенов(на рассуждения) — OpenAI уже тестируют улучшенную модель, но пока её не выпускают. Видимо будет увеличенный контекст и время на раздумья.
https://openai.com/index/introducing-openai-o1-preview/
Выводы:
- Возможно, произойдет разделение моделей на “управляемые” и “все в одном”, для решения разных классов задач. Где-то нужно думать над чем-то сложным, а где-то просто делать и хочется хоть какой-то контроль. Например, агенты саппорта.
- Пока не вижу никакого применения для себя, кроме ChatGPT. Слишком дорого для моих задач. Но надо тестировать.
- Нужно будет вернуться к экспериментам с группами агентов. Как минимум это весело 🙂