福利加碼,Gate 廣場明星帶單交易員二期招募開啟!
入駐發帖 · 瓜分 $20,000 月度獎池 & 千萬級流量扶持!
如何參與:
1️⃣ 報名成為跟單交易員:https://www.gate.com/copytrading/lead-trader-registration/futures
2️⃣ 報名活動:https://www.gate.com/questionnaire/7355
3️⃣ 入駐 Gate 廣場,持續發布交易相關原創內容
豐厚獎勵等你拿:
首帖福利:首發優質內容即得 $30 跟單体验金
雙周內容激勵:每雙周瓜分 $500U 內容獎池
排行榜獎勵:Top 10 交易員額外瓜分 $20,000 登榜獎池
流量扶持:精選帖推流、首頁推薦、周度明星交易員曝光
活動時間:2026 年 2 月 12 日 18:00 – 2 月 24 日 24:00(UTC+8)
詳情:https://www.gate.com/announcements/article/49849
刷到一個公司Taalas,一家AI晶片公司,團隊只有二十多人,卻已經融資超過2億美元。
首款產品HC1走了一條極端路線:用Mask ROM工藝將Llama3.18B的權重直接固化在硅片金屬層裡,計算單元和模型參數在同一塊硅上,幾乎放棄可編程性,換來吞吐、延遲和能效的極限優化。
現在他們固化的是Llama3.18B,體驗了一下,回答問題不可靠,很不穩。
但問題在於它快得離譜,體驗上非常反直覺,能把Groq碾成渣渣,單芯片17,000tokens/s的輸出能力,眨眼的功夫就能產生幾萬字,這個比資料庫查詢能力都牛逼。
如果未來的大模型真的只剩幾家頭部在迭代,模型結構逐漸穩定,權重更新頻率放緩,那麼為某一個確定模型專門做一顆晶片,可能一點都不瘋狂。
我們現在默認模型會一直劇烈變化,所以算力必須通用。
但如果模型開始趨於標準化呢?
把權重刻進硅片裡,然後用極致專用架構換取吞吐,把成本直接壓下來。
現在看模型格局開始集中化,頭部模型的結構變化一旦穩下來,那確實值得有一條圍繞自己結構設計的專用晶片線。
那這條路線的爆發力,可能會非常誇張。
如果是這樣的話,有一個反共識的疑問,GPU形態真的會是永遠的終局嗎?