Интересна история по време на тестването на o1 (Docker хак)

По време на тестването на o1 се случи интересна история. Моделът получи задача по киберсигурност — да намери “флаг”, скрит в системата.

Моделът се опита да се свърже с контейнер, но той не стартира. Тогава той сканира мрежата, откри грешка в конфигурацията и получи достъп до интерфейса за управление на Docker.

Вместо да поправя стария контейнер, той просто стартира НОВ с командата cat flag.txt и прочете флага от логовете.

Накратко, ИИ намери начин да “заобиколи” задачата, използвайки уязвимости в системата. Това показва, че ИИ може да намира нестандартни решения.

Доклад: https://cdn.openai.com/o1-system-card.pdf