Gate 廣場|2/27 今日話題: #BTC能否重返7万美元?
🎁 帶話題發帖,抽 5 位幸運兒送出 $2,500 仓位體驗券!
Jane Street 被起訴後,持續多日的“10 點砸盤”疑似消失。BTC 目前在 $67,000 附近震盪,這波反彈能否順勢衝回 $70,000?
💬 本期熱議:
1️⃣ 你認為訴訟與“10 點拋壓”消失有關嗎?市場操縱阻力是否減弱?
2️⃣ 衝擊 $70K 的關鍵壓力區在哪?
3️⃣ 你會在當前價位分批布局,還是等待放量突破再進場?
分享觀點,瓜分好禮 👉️ https://www.gate.com/post
📅 2/27 16:00 - 3/1 12:00 (UTC+8)
DeepSeek R1 AI 測試:英偉達 Blackwell 每兆瓦吞吐量是 Hopper 的 50 倍
IT之家2月18日消息,英偉達於2月16日發布博文,宣布其Blackwell Ultra AI架構(GB300NVL72)在能效與成本上實現顯著突破,通過DeepSeek-R1模型測試,相比前代Hopper GPU,其每兆瓦吞吐量提升50倍,百萬tokens成本降低至35分之一。
此外,英偉達還預告了下一代Rubin平台,預計其每兆瓦吞吐量將比Blackwell再提升10倍,進一步推動AI基礎設施的演進。
IT之家註:每兆瓦吞吐量(Tokens/Watt)是衡量AI晶片能效比的核心指標,指每消耗一瓦特電力能處理多少Token(文本單位)。數值越高,代表能效越好,運營成本越低。
英偉達在博文中指出,性能飛躍的關鍵,是升級技術架構。Blackwell Ultra通過NVLink技術,將72個GPU連接成統一的計算單元,互聯帶寬高達130TB/s,遠超Hopper時代的8芯片設計。此外,全新的NVFP4精度格式配合極致的協同設計結構,進一步鞏固了其在吞吐性能上的統治地位。
AI推理成本方面,相比Hopper架構,新平台將每百萬Token的成本削減至35分之一;即便與上一代Blackwell(GB200)相比,GB300在長上下文任務中的Token成本也降低至1.5分之一,注意力機制處理速度翻倍,適配程式庫維護等高負載場景。
OpenRouter的《推理狀態報告》指出,與軟體編程相關的AI查詢量在過去一年中激增,佔比從11%攀升至約50%。這類應用通常需要AI代理在多步工作流程中保持即時回應,並具備跨程式庫推理的長上下文處理能力。
英偉達為應對這一挑戰,通過TensorRT-LLM、Dynamo等團隊的持續優化,進一步提升了混合專家模型(MoE)的推理吞吐量。例如,TensorRT-LLM庫的改進,讓GB200在低延遲工作負載上的性能在短短四個月內提升了5倍。