谷歌 (GOOGL.US) AI 開放模型 Gemma 不斷壯大,全新推出 Gemma 3n,旨在手機、筆記型電腦和平板電腦上「流暢」運行,可以處理音頻、文本、圖片和影片。
Gemma 產品經理 Gus Martins 透露,Gemma 3n 可以在記憶體小於 2GB 的裝置上運行,採用 Gemini Nano 同款架構,但效能表現更出色。他強調:「Gemma 3n 為設備端 AI 應用帶來了驚人的表現力。」
Gemma 3n 的最大亮點在於採用了 GoogleDeepMind 開發的 Per-Layer Embeddings(PLE)技術,顯著降低了模型的記憶體需求。儘管其參數量分別為 5B 和 8B,但記憶體佔用僅相當於 2B 和 4B 模型。
谷歌宣稱,Gemma 3n 的記憶體佔用分別低至 2GB 和 3GB。此外,透過 PLE、KVC 共享和進階啟動量化等技術,Gemma 3n 在行動裝置上的反應速度提升 1.5 倍,品質也優於 Gemma 3 4B 版本。
Gemma 3n 在非英語語言處理上也有突破,尤其在日語、德語、韓語、西班牙語和法語中表現優異,在多語言基準測試 WMT24++ 中,該模型得分高達 50.1%。
此外,用戶無需任何設置,目前可透過 Google AI Studio 直接在瀏覽器中使用 Gemma 3n;開發者則可透過 Google AI Edge 整合本地功能,支援文字和圖像理解與生成,未來還將擴展更多能力。
近年來,高效到可以離線運行且無需雲端運算的模型在人工智慧領域日益受到青睞。它們不僅比大型模型更便宜,而且無需將資料傳輸到遠端資料中心,從而保護了隱私。
除了 Gemma 3n,谷歌也透過其健康 AI 開發者基金會計畫發布了 MedGemma。據該公司稱,MedGemma 是其在分析健康相關文字和圖像方面功能最強大的開放模型。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網