Рекуррентная Джемма
RecurrentGemma — это открытая модель, основанная на Griffin , архитектуре гибридной модели, которая сочетает в себе закрытые линейные повторения с вниманием к локальному скользящему окну.
Как и Gemma, RecurrentGemma хорошо подходит для различных задач по созданию текста, включая ответы на вопросы, обобщение и рассу��ден��я. ��днако уникальная архитектура RecurrentGemma предлагает следующие дополнительные преимущества:
-
Уменьшено использование памяти
Более низкие требования к памяти позволяют генерировать более длинные образцы на устройствах с ограниченной памятью, таких как одиночные графические процессоры или процессоры. -
Более высокая пропускная способность
RecurrentGemma может выполнять логический вывод при значительно больших размерах пакетов, а это означает, что она может генерировать значительно больше токенов в секунду, особенно при создании длинных последовательностей. -
Высокая производительность
RecurrentGemma соответствует производительности Gemma, но требует меньше памяти и обеспечивает более быстрый вывод.