O servidor Lenovo AI alcançou pela primeira vez a implementação local do modelo DeepSeek de grande porte com menos de 1TB, suportando 100 operações simultâneas.
A data de 3 de março da Golden 10 News, recentemente, o Grupo Lenovo anunciou que com base no servidor Lenovo WATian WA7780 G3, pela primeira vez na indústria, foi realizado o implantação única do grande modelo DeepSeek-R1/V3 671B, com menos de 1TGB de memória de vídeo reconhecida pela indústria (na realidade, 768GB), proporcionando uma experiência fluida para 100 usuários simultâneos. Segundo os dados de teste da Lenovo, em um ambiente de teste padrão de 512 TOKEN, o sistema suporta 100 usuários simultâneos que recebem continuamente uma saída estável de 10 TOKEN por segundo, com o tempo de resposta do token principal comprimido para menos de 30 segundos.
O conteúdo serve apenas de referência e não constitui uma solicitação ou oferta. Não é prestado qualquer aconselhamento em matéria de investimento, fiscal ou jurídica. Consulte a Declaração de exoneração de responsabilidade para obter mais informações sobre os riscos.
O servidor Lenovo AI alcançou pela primeira vez a implementação local do modelo DeepSeek de grande porte com menos de 1TB, suportando 100 operações simultâneas.
A data de 3 de março da Golden 10 News, recentemente, o Grupo Lenovo anunciou que com base no servidor Lenovo WATian WA7780 G3, pela primeira vez na indústria, foi realizado o implantação única do grande modelo DeepSeek-R1/V3 671B, com menos de 1TGB de memória de vídeo reconhecida pela indústria (na realidade, 768GB), proporcionando uma experiência fluida para 100 usuários simultâneos. Segundo os dados de teste da Lenovo, em um ambiente de teste padrão de 512 TOKEN, o sistema suporta 100 usuários simultâneos que recebem continuamente uma saída estável de 10 TOKEN por segundo, com o tempo de resposta do token principal comprimido para menos de 30 segundos.