Серверы Lenovo AI впервые реализуют локальное развертывание DeepSeek Full Blood Big Model менее чем 1TB, поддерживают 100 параллельных запросов

GoldenOctober2024

Данные Jinshi 3 марта сообщили, что недавно концерн Lenovo объявил о том, что на сервере Lenovo Wentian WA7780 G3 впервые в отрасли была реализована одноплатная установка глубокой модели DeepSeek-R1/V3 671B с использованием памяти, меньшей, чем 1TGB (фактически 768GB), чтобы обеспечить плавный опыт для 100 одновременных пользователей. По данным Lenovo, в стандартной тестовой среде с 512 токенами этот система может поддерживать стабильный вывод 10 токенов в секунду для 100 одновременных пользователей, сокращая время отклика на первый токен до менее 30 секунд.

DEEPSEEK-2.49%

G3-1.72%

Посмотреть Оригинал

Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».

3 Лайков

Награда
3
1
Поделиться

комментарий

0/400

Нет комментариев

Тема
#BTC#
193704 посты
#ETH#
120732 посты
#PI#
103756 посты
4#GateioInto11#
76136 посты
5#ContentStar#
63921 посты
6#BOME#
59030 посты
7#GT#
56088 посты
8#DOGE#
52758 посты
9#MAGA#
51294 посты
10#SLERF#
50250 посты

Закрепить

Карта сайта