

Google Imagen 2
簡介 :
Imagen提供先進的生成式媒體能力。Gemini模型非常適用於高級推理和通用用例,而任務特定的生成AI模型可以幫助企業提供專業能力。今天預覽的文本到動態圖片功能使Imagen在企業工作負載中更加強大。這允許營銷和創意團隊根據文本提示生成動態圖片,如GIF等。初始時,動態圖片將以每秒24幀(fps)的速度交付,分辨率為360x640像素,持續時間為4秒,計劃進行持續增強。考慮到該模型專為企業應用設計,它擅長主題,如自然、食物圖像和動物。它可以生成一系列的攝像機角度和動作,同時支持整個序列的一致性。Imagen的動態圖片生成功能配備了安全過濾器和數字水印,以維護創作者和用戶之間的信任承諾。此外,我們還通過高級照片編輯功能更新了Imagen 2.0的圖像生成能力,包括修補和擴展。現在在Vertex AI上通用的這些功能,使用戶可以輕鬆地刪除圖像中不需要的元素、添加新元素,並擴展圖像邊界,以創造更廣闊的視野。此外,我們基於Google DeepMind的SynthID技術的數字水印功能現已通用,使客戶能夠生成隱形水印並驗證Imagen系列模型生成的圖像和動態圖像。
需求人群 :
適用於企業營銷、創意團隊等
使用場景
生成企業廣告動態圖像
編輯和修復企業圖片素材
擴展和標記圖片邊界
產品特色
高級生成式媒體能力
文本到動態圖片功能
高級照片編輯功能
數字水印功能
支持多種主題和攝像機角度生成
精選AI產品推薦

Sora
Sora是一個基於大規模訓練的文本控制視頻生成擴散模型。它能夠生成長達1分鐘的高清視頻,涵蓋廣泛的視覺數據類型和分辨率。Sora通過在視頻和圖像的壓縮潛在空間中訓練,將其分解為時空位置補丁,實現了可擴展的視頻生成。Sora還展現出一些模擬物理世界和數字世界的能力,如三維一致性和交互,揭示了繼續擴大視頻生成模型規模來發展高能力模擬器的前景。
AI視頻生成
17.2M

Animate Anyone
Animate Anyone旨在通過驅動信號從靜態圖像生成角色視頻。我們利用擴散模型的力量,提出了一個專為角色動畫量身定製的新框架。為了保持參考圖像中複雜外觀特徵的一致性,我們設計了ReferenceNet來通過空間注意力合併詳細特徵。為了確保可控性和連續性,我們引入了一個高效的姿勢指導器來指導角色的動作,並採用了一種有效的時間建模方法,以確保視頻幀之間的平滑跨幀過渡。通過擴展訓練數據,我們的方法可以為任意角色製作動畫,與其他圖像到視頻方法相比,在角色動畫方面取得了出色的結果。此外,我們在時尚視頻和人類舞蹈合成的基準上評估了我們的方法,取得了最先進的結果。
AI視頻生成
11.8M