bartowski опубликовал файл GGUF для квантования IQ4_NL на базе Gemma-4 26B-A4B-it MoE

robot
Генерация тезисов в процессе

ME News сообщение, 4 апреля (UTC+8), недавно пользователь @outsource_ опубликовал сообщение о том, что квантованный GGUF-файл IQ4_NL на базе модели Google Gemma-4 26B-A4B-it MoE был выпущен. Эта модель в общей сложности насчитывает около 26 миллиардов параметров, а активация — около 4 миллиардов параметров. Квантованный файл был подготовлен bartowski, с использованием imatrix из llama.cpp для доработки и квантования. Имя квантованного файла: gemma-4-26B-A4B-it-IQ4_NL.gguf, размер — 14.70 GB. (Источник: InFoQ)

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить