Google veröffentlicht neuen TurboQuant-Algorithmus: Kann AI-Speicheranforderungen um das 6-fache reduzieren, Speicherbestände fallen massiv

動區BlockTempo

Google veröffentlicht den TurboQuant-Komprimierungsalgorithmus, der behauptet, den Speicherbedarf von KI um mindestens das Sechsfache zu reduzieren; nach Bekanntwerden stürzten Speicheraktien kollektiv ab, doch Analysten haben unterschiedliche Meinungen.
(Vorgeschichte: Google plant, bis 2029 auf Quantenverschlüsselung umzusteigen, sechs Jahre vor dem Regierungsziel, die Kryptoindustrie muss aufholen)
(Hintergrund: Wall Street Journal: Trump plant, Zuckerberg, Huang Renxun und Ellison in den PCAST zu berufen, um die „US AI National Team“ zu formen)

Ein neuer Algorithmus lässt Speicheraktien komplett abstürzen? Google Research hat am 25. den TurboQuant-Komprimierungsalgorithmus offiziell vorgestellt, der behauptet, die KV-Cache großer Sprachmodelle (LLMs) auf nur 3 Bit zu quantisieren, ohne die Modellgenauigkeit zu beeinträchtigen, und den Speicherbedarf mindestens um das Sechsfache zu reduzieren.

Nach Bekanntwerden fiel Micron am 25. im Tagesverlauf zeitweise um 6,1 %, schloss bei 382,09 USD und erreichte den niedrigsten Stand seit drei Wochen. Andererseits sanken Sandisk um 3,5 %, Seagate um 2,59 %, Western Digital um 1,63 %, was die Speicherbranche insgesamt erschütterte.

Die asiatischen Märkte standen heute ebenfalls unter Druck: Samsung Electronics fiel beim Börsenstart um 3,6 %, SK Hynix um 4,5 %. Die Investoren ziehen eine klare Logik: Wenn KI-Modelle nicht mehr so viel Speicher benötigen, könnte die bisher durch Komponentenknappheit gestützte starke Preisstellung bald ins Wanken geraten.

TurboQuant-Technik im Detail: Zwei-Phasen-Fehlerelimination, 8-fache Geschwindigkeit

Der KV-Cache (Key-Value Cache) ist das Kernstück, mit dem LLMs „merken“, welche Daten bereits verarbeitet wurden. Er speichert die vorherigen Attention-Daten, sodass das Modell bei der Generierung jedes Tokens keine wiederholte Berechnung durchführen muss. Mit zunehmendem Kontextfenster wird der KV-Cache jedoch zu einem bedeutenden Flaschenhals im Speicher.

TurboQuant zielt genau auf dieses Problem ab. Google erklärt, dass herkömmliche Vektor-Quantisierungsmethoden in der Speicherhaltung zusätzlichen Overhead von etwa 1 bis 2 Bit pro Wert verursachen, den TurboQuant durch einen zweistufigen Prozess vollständig eliminiert:

Erster Schritt: Verwendung der PolarQuant-Methode zur Rotation der Datenvektoren für hochqualitative Kompression

Zweiter Schritt: Anwendung des Quantized Johnson-Lindenstrauss-Algorithmus zur Eliminierung verbleibender Fehler

In Benchmark-Tests mit NVIDIA H100-GPUs zeigte TurboQuant bei 4 Bit eine achtfache Leistungssteigerung bei der Berechnung der Attention-Werte im Vergleich zu unquantisierten 32-Bit-Schlüsseln, und der KV-Cache wurde mindestens um das Sechsfache im Speicher reduziert.

Noch wichtiger ist, dass dieser Algorithmus kein Training oder Feinabstimmung erfordert, äußerst geringe Laufzeitkosten hat und direkt in Produktionsumgebungen sowie bei groß angelegten Vektor-Suchsystemen eingesetzt werden kann. Das offizielle Paper soll im April auf der „ICLR 2026“ veröffentlicht werden.

Jensen-Paradoxon: Könnte der Speicherbedarf sogar steigen?

Doch nicht alle teilen die Ansicht vom „Ende des Speichers“.

Einige Analysten bringen das Jensen-Paradoxon ins Spiel: Wenn technischer Fortschritt die Ressourcenkosten senkt, steigt die Gesamtnachfrage, weil Ressourcen leichter zugänglich sind. Befürworter argumentieren, dass, wenn TurboQuant die KI-Inferenz deutlich erleichtert, dies die Verbreitung von KI-Modellen beschleunigen und letztlich den Speicherbedarf erhöhen könnte, anstatt ihn zu verringern.

Lynx Equity Strategies-Analysten schreiben in einem Bericht: „Die von Google beschriebene Methode wird in den nächsten 3 bis 5 Jahren kaum die Nachfrage nach Speicher und Flash-Speicher verringern, da das Angebot weiterhin extrem knapp ist.“ Daher hält die Firma an einem Zielpreis von 700 USD für Micron fest.

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.
Kommentieren
0/400
Keine Kommentare