谷歌全新萬能AI模型Gemini Omni橫空出世,文生視頻驚艷亮相
谷歌發布了全新的Gemini Omni多模態AI模型,稱號能夠幾乎在任何數據形式之間進行轉換——從文本到視頻、圖像到音樂、語音到文字。在The Verge的實測中,該模型展示了令人驚嘆的生成能力,包括根據文字描述生成逼真的視頻片段,以及多種跨模態的創意轉換。谷歌表示這一模型是其多模態AI戰略的里程碑,未來將廣泛應用於內容創作、娛樂和科學研究等領域。
谷歌發布了全新的Gemini Omni多模態AI模型,稱號能夠幾乎在任何數據形式之間進行轉換——從文本到視頻、圖像到音樂、語音到文字。在The Verge的實測中,該模型展示了令人驚嘆的生成能力,包括根據文字描述生成逼真的視頻片段,以及多種跨模態的創意轉換。谷歌表示這一模型是其多模態AI戰略的里程碑,未來將廣泛應用於內容創作、娛樂和科學研究等領域。