За даними Jinshi на 3 березня, недавно група Lenovo оголосила про вперше в галузі самостійне розгортання великої моделі DeepSeek-R1/V3 671B на сервері Lenovo WAT7780 G3, здатному забезпечити плавний досвід для 100 паралельних користувачів з об'ємом пам'яті менше 1TGB (фактично 768GB). За даними Lenovo, система витримала стандартне тестування на 512 токенів, підтримуючи стабільний вихід 10 токенів в секунду для 100 паралельних користувачів і скорочуючи час відповіді першого токену до 30 секунд.
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
Сервери штучного інтелекту Lenovo вперше реалізували локальне розгортання глибокошукача DeepSeek з повним обсягом в менше 1 ТБ, підтримують 100 одночасних запитів.
За даними Jinshi на 3 березня, недавно група Lenovo оголосила про вперше в галузі самостійне розгортання великої моделі DeepSeek-R1/V3 671B на сервері Lenovo WAT7780 G3, здатному забезпечити плавний досвід для 100 паралельних користувачів з об'ємом пам'яті менше 1TGB (фактично 768GB). За даними Lenovo, система витримала стандартне тестування на 512 токенів, підтримуючи стабільний вихід 10 токенів в секунду для 100 паралельних користувачів і скорочуючи час відповіді першого токену до 30 секунд.