Google發布Gemini 3.1 Flash-Lite：最快最便宜的Gemini 3模型

Google推出Gemini 3.1 Flash-Lite預覽版，每百萬輸入token僅$0.25，響應速度比Gemini 2.5 Flash快2.5倍。支持可調節推理深度（thinking levels），適用於大規模翻譯、內容審覈、UI生成等高吞吐任務。已加入Gemini API免費層。

此次發佈體現了科技巨頭在人工智能領域持續加大投入的趨勢。該公司在技術路線圖中將此作爲重要里程碑，預計將推動整個生態系統的發展。開發者社區對此反應積極，相關SDK和API文檔已同步更新，便於第一時間集成使用。

Google發布Gemini 3.1 Flash-Lite：極致性價比重新定義AI模型市場

Google推出Gemini 3.1 Flash-Lite預覽版，定價僅為每百萬輸入token $0.25，回應速度比上代Gemini 2.5 Flash快2.5倍，成為Gemini 3系列中速度最快、成本最低的模型。這項發布直接向市場傳遞了明確訊號：高品質AI能力正變得觸手可及。

技術亮點深度解析

Flash-Lite最大的創新在於支援可調節推理深度（thinking levels）。開發者可依據任務複雜度自由選擇推理力道——簡單任務使用淺層推理以獲得極速回應，複雜任務啟用深度推理確保品質。這種彈性在實際應用中意義重大：大規模翻譯專案可以在速度和品質之間找到最佳平衡點，內容審核系統可以根據風險等級調整檢測深度，UI程式碼生成可以快速迭代原型設計。此外，該模型在多模態理解方面也有不俗表現，支援文字、圖像和程式碼的混合處理。

商業策略與定價衝擊

該模型已加入Gemini API免費層級，Google顯然以極致低價策略搶佔開發者生態。$0.25/M tokens的定價對競品造成巨大壓力，在需要大量API呼叫的企業場景中尤為顯著。對於日處理數百萬請求的企業而言，這意味著AI營運成本的數量級降低。

市場影響與未來展望

Flash-Lite的推出進一步加劇了AI模型的價格戰，整個產業正朝「AI即公用事業」的方向演進。對開發者而言，更低的門檻意味著更多實驗與創新的可能性。預計將推動AI應用在中小企業中的普及。