Google發布Gemini 3.1 Flash-Lite:最快最便宜的Gemini 3模型
Google推出Gemini 3.1 Flash-Lite預覽版,每百萬輸入token僅$0.25,響應速度比Gemini 2.5 Flash快2.5倍。支持可調節推理深度(thinking levels),適用於大規模翻譯、內容審覈、UI生成等高吞吐任務。已加入Gemini API免費層。
此次發佈體現了科技巨頭在人工智能領域持續加大投入的趨勢。該公司在技術路線圖中將此作爲重要里程碑,預計將推動整個生態系統的發展。開發者社區對此反應積極,相關SDK和API文檔已同步更新,便於第一時間集成使用。
Google發布Gemini 3.1 Flash-Lite:極致性價比重新定義AI模型市場
Google推出Gemini 3.1 Flash-Lite預覽版,定價僅為每百萬輸入token $0.25,回應速度比上代Gemini 2.5 Flash快2.5倍,成為Gemini 3系列中速度最快、成本最低的模型。這項發布直接向市場傳遞了明確訊號:高品質AI能力正變得觸手可及。
技術亮點深度解析
Flash-Lite最大的創新在於支援可調節推理深度(thinking levels)。開發者可依據任務複雜度自由選擇推理力道——簡單任務使用淺層推理以獲得極速回應,複雜任務啟用深度推理確保品質。這種彈性在實際應用中意義重大:大規模翻譯專案可以在速度和品質之間找到最佳平衡點,內容審核系統可以根據風險等級調整檢測深度,UI程式碼生成可以快速迭代原型設計。此外,該模型在多模態理解方面也有不俗表現,支援文字、圖像和程式碼的混合處理。
商業策略與定價衝擊
該模型已加入Gemini API免費層級,Google顯然以極致低價策略搶佔開發者生態。$0.25/M tokens的定價對競品造成巨大壓力,在需要大量API呼叫的企業場景中尤為顯著。對於日處理數百萬請求的企業而言,這意味著AI營運成本的數量級降低。
市場影響與未來展望
Flash-Lite的推出進一步加劇了AI模型的價格戰,整個產業正朝「AI即公用事業」的方向演進。對開發者而言,更低的門檻意味著更多實驗與創新的可能性。預計將推動AI應用在中小企業中的普及。