DeepSeek V4發布:1兆參數開源多模態模型,百萬Token上下文窗口
DeepSeek發布V4,2025年1月以來首個重大模型,跨入多模態能力包括文字、圖片、影片生成。約一兆參數、百萬Token上下文窗口,與華為和寒武紀共同針對中國AI晶片優化。開源發布挑戰西方前沿模型和中國國內競爭對手。
DeepSeek的多模態野心
DeepSeek發布V4,2025年1月V3以來首次重大更新。約一兆參數(+49%),首次具備文字、圖片、影片生成的多模態能力,百萬Token上下文窗口。與華為和寒武紀共同針對中國AI晶片優化,在美國出口管制下減少對Nvidia GPU的依賴。開源發布讓全球開發者可自由使用和微調。對中國AI生態而言,國產晶片優化是里程碑。