Gemini:谷歌多模態AI模型Gemini,支援文字和影象的組合推理

Link:gemini
Gemini是谷歌DeepMind推出的新一代人工智慧系統。它能夠進行多模態推理,支援文字、影象、影片、音訊和程式碼之間的無縫互動。Gemini在語言理解、推理、數學、程式設計等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲端計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、程式碼生成等領域。

需求人群:

[
"輔助創意設計和寫作",
"提高生產力",
"輔助編碼和程式生成",
"進行復雜的多模態推理"
],

使用場景示例:

透過文字和影象提示Gemini玩石頭剪刀布遊戲

讓Gemini根據繪畫描述生成音樂搜尋查詢

用影象序列提示Gemini猜電影名稱

產品特色:

影象描述

視覺推理

多模態遊戲

程式碼生成

文字影象交織生成

返回頂端