谷歌 (GOOGL.US) 無預警釋出全新 AI 記憶體壓縮技術「TurboQuant」,掀起全球科技圈震盪。該技術可在不影響準確性的前提下,將大型語言模型運行時快取記憶體占用壓縮至少 6 倍,效能提升達 8 倍。消息一出,除引爆開發者社群熱議,也拖累美股記憶體族群走跌。市場關注,長期困擾科技巨頭的算力與記憶體瓶頸,是否將因這項軟體突破出現結構性鬆動。
TurboQuant 如何實現「無損壓縮」
究竟 TurboQuant 是如何達成這種看似魔法般的壓縮效果?根據 Google 官方的技術文件,這是一種專為支援鍵值快取(KV Cache)壓縮和向量搜尋而設計的創新方法。
它解決了 AI 模型在處理長上下文資訊時,記憶體消耗隨文本長度呈幾何級數增長的痛點。TurboQuant 的運作核心在於兩個關鍵步驟的協作作用。
首先是名為「PolarQuant」的高品質壓縮階段。研究團隊巧妙地先對資料向量進行隨機旋轉,這個步驟雖然聽起來簡單,卻能有效地簡化數據的幾何結構。透過旋轉,原本複雜分佈的數據變得更易於處理,使開發者能將標準的高品質量化器精準地應用於向量的每個部分。
這個階段利用了絕大部分的壓縮能力,成功保留了原始向量中最重要的語義特徵與概念。
緊接著是「消除隱藏誤差」的微調階段。即便第一階段已保留了主體,仍可能留下微小的數學偏差,這往往是造成 AI 模型精確度下降的主因。
TurboQuant 此時會撥出極少量的剩餘壓縮能力(僅 1 位元),將 QJL 演算法應用於補償這些微小殘差。QJL 階段猶如一位嚴謹的數學校對員,負責消除偏誤,確保最終的注意力評分(Attention Scores)依然精準。
實驗數據顯示,在 Gemma 和 Mistral 等開源模型上,TurboQuant 在問答、代碼生成與摘要等任務中均展現出近乎完美的表現,同時實現了記憶體空間的極度瘦身。
谷歌的「DeepSeek 時刻」
這項技術的發布,讓許多業內人士想到了知名美劇《矽谷》中那種能顛覆產業的壓縮技術。Cloudflare 執行長 Matthew Prince 等科技領袖甚至將其形容為 Google 的「DeepSeek 時刻」。這意味著 Google 正在透過極致的效率優化,大幅拉到 AI 的運算成本。
如果 AI 推理不再需要堆疊大量的 HBM 記憶體與高性能 GPU,那麼人工智慧的普及門檻將大幅降低,這對致力於建立 AI 基礎設施的巨頭如 Meta、Microsoft 而言無疑是重大利好。
然而,對於記憶體晶片製造商來說,這無疑是一記警鐘。市場普遍擔憂,隨著長上下文推理對單體記憶體容量需求的降低,記憶體晶片的「超級週期」可能提前結束。
美股記憶體類股週三 (25 日) 集體跳水,包括美光(Micron)、西部數據(Western Digital)及希捷(Seagate)在內的硬體巨頭跌幅均在 4% 至 6% 之間;隨後的亞洲盤交易中,SK 海力士與三星電子也同步走弱。
市場情緒明確反映出一種恐懼:AI 的未來是否不再需要那麼多昂貴的硬體?
大摩提出相反觀點
就在市場一片看空記憶體需求之際,華爾街投行巨頭摩根士丹利卻潑了一盆冷水,提出了截然不同的看法。大摩分析認為,TurboQuant 對市場的短期衝擊可能被過度誇大了。
首先,從技術層面看,Google 宣稱的「8 倍性能提升」很大程度上是與過時的 32-bit 模型相比,而現行主流的推理模型早已廣泛運用 4-bit 量化技術,因此實際的感受幅度或許並未如此驚人。
更深層的邏輯在於,TurboQuant 壓縮的是推理階段的「鍵值快取(KV Cache)」,而非模型權重本身所佔用的 HBM(高頻寬記憶體),更與大規模的模型訓練任務無關。這意味著並非「整體儲存需求」減少了 6 倍,而是相同的硬體現在可以支持 4 到 8 倍更長的對話長度。
這引出了經濟學中著名的「傑文斯悖論」(Jevons Paradox):當技術進步提高了某種資源的利用效率時,由於成本降低導致需求激增,最終該資源的總消耗量反而會上升。
大摩指出,就像瓦特改良蒸汽機後煤炭需求反而飆升一樣,TurboQuant 讓 AI 推理變得便宜、快速且能處理更長的資訊,這將激發出更多原本受限於成本而無法實現的應用場景。
當企業發現原本只能在昂貴雲端集群運行的模型,現在可以遷移到本地設備或低成本伺服器時,AI 部署的規模將會爆炸性增長。正如去年的 DeepSeek 震撼並未摧毀硬體需求,反而帶動了新一波效率競賽,Google 的這項突破,最終可能演變成推動記憶體與算力需求進一步攀升的另一具助燃火箭。
總結而言,TurboQuant 確實展示了軟體演算法在挑戰硬體極限方面的巨大潛力。即便它暫時引發了記憶體股的恐慌,但長遠來看,這項技術更有可能扮演「開啟新應用大門」的角色。
當 AI 變得更輕盈、更聰明、成本更低,全球對於運算資源的渴望,或許才正要進入下一個更高頻率的階段。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網