Последние исследования показывают, что механизмы внимания в трансформерах демонстрируют значительные дефициты исполнительного контроля. Эти нарушения препятствуют способности моделей точно выполнять задачи, требующие сложных рассуждений.
Последние исследования показывают, что механизмы внимания в трансформерах демонстрируют значительные дефициты исполнительного контроля. Эти нарушения препятствуют способности моделей точно выполнять задачи, требующие сложных рассуждений.