Google Chrome 部署本地化 Large Language Model 組件

導言

Google 已開始分發一個大型數據文件,旨在為 Chrome 用戶提供裝置端 artificial intelligence 功能。

正文

此現象涉及安裝一個名為 「weights.bin」 的文件,其體積約為 4GB 。該組件是 Gemini Nano 的核心部分,Gemini Nano 是一個本地化 large language model (LLM) ,旨在無需依賴雲端基礎設施即可執行詐騙檢測及寫作輔助等任務。轉向本地執行旨在提升處理速度並強化數據安全性,因為此舉消除了對持續網絡連接的依賴,並減少了用戶數據在傳輸過程中的暴露風險。 電腦科學家 Alexander Hanff 的技術分析指出,該文件被存放於 「OptGuideOnDeviceModel」 目錄中。文件體積龐大是由於其中包含訓練參數(特別是 weights),模型利用這些參數在預測文本操作中確定後續 token 序列的概率。 相關持份者的關注焦點在於,啟動時缺乏關於儲存需求的明確通知。雖然 Google 承認模型尺寸可能會在更新期間波動,但此資訊被置於詳細指南之中,而非作為主要警示呈現。因此,磁盤容量有限的用戶可能會面臨非預期的儲存空間耗盡。此外,由於該文件具有持久性 —— 即瀏覽器會在文件被刪除後自動重新安裝 —— 用戶必須在系統設定中手動關閉 「On-device AI」 選項,才能確保將其永久移除。

結論

Gemini Nano 的整合提供了更強大的本地 AI 能力,但其對儲存空間的高要求,可能會與部分用戶的資源限制產生分歧。