

Phenaki
簡介 :
Phenaki是一個可以根據一系列文本提示生成逼真視頻的模型。它通過將視頻壓縮為離散令牌的小表示來學習視頻表達。模型使用時間上的因果注意力來生成視頻令牌,並根據預先計算的文本令牌來條件生成視頻。與之前的視頻生成方法相比,Phenaki可以根據一系列提示(例如時間可變的文本或故事)生成任意長的視頻。它的定位是在開放領域中生成視頻。該模型還具有超出現有視頻數據集範圍的泛化能力。為了更好地滿足用戶需求,Phenaki還提供了交互式示例和其他應用場景。
需求人群 :
適用於生成各種場景的視頻,可以用於創意製作、廣告、教育等領域。
產品特色
根據文本生成逼真視頻
支持時間可變的文本提示
可以生成任意長的視頻
具有泛化能力
提供交互式示例
精選AI產品推薦
國外精選

Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。
AI模型
11.4M