Новая генерация архитектуры чипов для сверхвычислений на базе ИИ официально представлена, показатели производительности достигли значительного прорыва. По сравнению с предыдущим поколением, стоимость на этапе вывода модели снизилась в десять раз, что является поворотным моментом для экономичности масштабного развертывания моделей. Одновременно количество необходимых GPU для обучения сократилось на 75%, что означает, что компании могут выполнять те же вычислительные задачи с меньшим количеством аппаратных средств. Энергоэффективность увеличилась в пять раз, что значительно снижает потребление энергии и тепловыделение при одинаковой вычислительной мощности.
Инновации в технической архитектуре также вызывают восхищение — впервые на уровне стойки реализована возможность защищённых вычислений, пропускная способность межGPU-соединений достигла впечатляющих 260 ТБ/с, что позволяет поддерживать сценарии сверхмасштабных параллельных вычислений. Вся платформа была полностью переработана: отказ от традиционных кабельных рукавов и вентиляторов в пользу более компактной и эффективной аппаратной организации. Основной движок состоит из шести модульных компонентов, обеспечивающих большую гибкость в настройке и расширении. Выпуск этого поколения продуктов без сомнения изменит структуру затрат и методы развертывания AI-вычислительных мощностей.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
21 Лайков
Награда
21
9
Репост
Поделиться
комментарий
0/400
BtcDailyResearcher
· 01-09 14:58
Одна десятая стоимости? Теперь друзья из майнинговых ферм должны паниковать
---
260ТБ/с пропускной способности... это число вызывает у меня головокружение, но кажется, кто-то снова собирается сокращать штат
---
Энергоэффективность увеличилась в пять раз? Это просто спасение для тех, кто платит за электроэнергию, начинают задумываться о смене чипов
---
Еще один раунд итераций и очередная перетряска, эта скорость действительно не дает за ней уследить
---
GPU нужно урезать на 75%... эй, акции производителей видеокарт собираются падать?
---
Модульный дизайн звучит неплохо, только боюсь, что это очередной маркетинговый ход, нужно смотреть реальные тесты
---
Если это действительно так эффективно, как рекламируют, вся структура рынка AI-вычислений должна измениться
---
Сокращение затрат до одной десятой — это действительно нереально, как же тяжело было раньше покупать чипы
---
Впервые слышу о вычислениях с уровнем серверных шкафов, кажется, нас снова ждут потери
---
Поторопитесь с ускорением итераций, кажется, каждые три месяца нужно обновлять технологический стек
Посмотреть ОригиналОтветить0
AirdropHermit
· 01-09 10:02
Черт возьми, одна десятая стоимости? Это правда, кажется, на этот раз всё взорвется
Это увеличит эффективность в пять раз, крупные игроки должны будут безумно скупать
260ТБ/с... эта цифра звучит неправдоподобно, действительно ли это возможно
Стоимость вычислений сокращена прямо в десять раз, у малых предприятий наконец есть шанс
GPU на 75% меньше, при этом сохраняется такая же мощность, кто это выдержит?
Рамки уровня могут обеспечить конфиденциальные вычисления, эта архитектура продумана довольно тщательно
Если не присоединиться к этой волне, кажется, можно потерять деньги
Посмотреть ОригиналОтветить0
GateUser-6bc33122
· 01-07 00:38
Одна десятая стоимости? Теперь у стартапов с большими моделями действительно есть шанс
Посмотреть ОригиналОтветить0
RektHunter
· 01-06 15:51
Блин, стоимость вывода снижена в десять раз? Теперь и малые компании смогут работать с большими моделями, монополия на вычислительные мощности должна рухнуть
260TB/s это число просто огонь, коммуникация между GPU такая классная... но реально ли это будет стабильно работать?
На 75% меньше GPU, это какая-то концепция, те деньги на электричество и железо что сэкономятся... ладно, не буду об этом думать, опять будет хайп
Если это действительно настолько мощно, то структура индустрии должна измениться
Посмотреть ОригиналОтветить0
SandwichTrader
· 01-06 15:50
Одна десятая часть стоимости? Теперь большие модели действительно начнут переживать ценовую войну
---
260TB/s — цифра впечатляет, но справится ли охлаждение?
---
GPU сокращён на 75%, это означает, что наконец-то малые и средние предприятия смогут работать с ИИ?
---
Модульность и конфиденциальные вычисления — эта архитектура выглядит не так просто
---
Энергоэффективность увеличена в пять раз? Получается, раньше всё зря электричество тратили, ха-ха
---
Говорят о переструктурировании затрат, но это просто борьба за рынок, старая история
---
260TB/s — это правда или нет, с такой скоростью любая задача будет выполняться молниеносно
---
Снижение стоимости в десять раз звучит убедительно, но действительно ли упали цены на оборудование
---
Отказ от вентиляторов и новое решение охлаждения — это надёжно или снова будут проблемы
---
Наконец-то кто-то занялся оптимизацией стоимости, предыдущие решения были просто дорогущие
Посмотреть ОригиналОтветить0
tokenomics_truther
· 01-06 15:44
260 ТБ/с?Это число звучит неправдоподобно, но если действительно удастся сократить затраты на вычисления до десятины, у майнеров появится шанс
Посмотреть ОригиналОтветить0
MEVictim
· 01-06 15:41
Одна десятая стоимости? Если бы это было правдой, это давно должно было появиться, и не просто на бумаге
Посмотреть ОригиналОтветить0
OnchainArchaeologist
· 01-06 15:39
Одна десятая стоимости? Теперь запуск крупных моделей не так дорого, наконец-то можно вздохнуть свободно
GPU сокращены на 75%, это правда... затраты компаний прямо в два раза снизились
Пропускная способность 260 ТБ/с — это безумие, теперь поток данных больше не будет узким местом
Энергоэффективность увеличена в пять раз, охлаждение наконец не требует такой экстремальной системы, это круто
Модульный дизайн с воображением, в будущем есть большой потенциал для кастомизации
Стоимость вывода снижена до одной десятой, это обновление действительно меняет правила игры
Новая генерация архитектуры чипов для сверхвычислений на базе ИИ официально представлена, показатели производительности достигли значительного прорыва. По сравнению с предыдущим поколением, стоимость на этапе вывода модели снизилась в десять раз, что является поворотным моментом для экономичности масштабного развертывания моделей. Одновременно количество необходимых GPU для обучения сократилось на 75%, что означает, что компании могут выполнять те же вычислительные задачи с меньшим количеством аппаратных средств. Энергоэффективность увеличилась в пять раз, что значительно снижает потребление энергии и тепловыделение при одинаковой вычислительной мощности.
Инновации в технической архитектуре также вызывают восхищение — впервые на уровне стойки реализована возможность защищённых вычислений, пропускная способность межGPU-соединений достигла впечатляющих 260 ТБ/с, что позволяет поддерживать сценарии сверхмасштабных параллельных вычислений. Вся платформа была полностью переработана: отказ от традиционных кабельных рукавов и вентиляторов в пользу более компактной и эффективной аппаратной организации. Основной движок состоит из шести модульных компонентов, обеспечивающих большую гибкость в настройке и расширении. Выпуск этого поколения продуктов без сомнения изменит структуру затрат и методы развертывания AI-вычислительных мощностей.