Разработчици успешно реализираха високоскоростна архитектура Transformer, работеща върху FPGA с честота 80 MHz, достигайки скорост от 56 000 токена в секунда. Тази реализация демонстрира значителен потенциал за хардуерно ускорена оптимизация на KV кеша в среди с ограничени ресурси.