

Fuyu 8B
簡介 :
Fuyu-8B是由Adept AI訓練的多模態文本和圖像轉換模型。它具有簡化的架構和訓練過程,易於理解、擴展和部署。它專為數字代理設計,可以支持任意圖像分辨率,回答關於圖表和圖形的問題,回答基於UI的問題,並對屏幕圖像進行細粒度定位。它的響應速度很快,可以在100毫秒內處理大型圖像。儘管針對我們的用例進行了優化,但它在標準圖像理解基準測試中表現良好,如視覺問答和自然圖像字幕。請注意,我們發佈的模型是一個基礎模型,我們希望您根據具體的用例進行微調,例如冗長的字幕或多模態聊天。在我們的經驗中,該模型對於少樣本學習和各種用例的微調都表現良好。
需求人群 :
適用於圖像和文本生成的場景
使用場景
生成coco風格的字幕
回答關於圖像的問題
回答關於圖表的問題
產品特色
支持圖像和文本生成
支持任意圖像分辨率
回答關於圖表和圖形的問題
回答基於UI的問題
對屏幕圖像進行細粒度定位
精選AI產品推薦

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。
AI模型
11.4M
中文精選

剪映dreamina
剪映Dreamina是抖音旗下的AIGC工具,用戶可以根據文本內容生成由AI生成的創意圖,支持修整圖片大小比例和模板類型。未來會用於抖音的圖文或短視頻的內容創作,豐富抖音在AI創造方面的內容庫。
AI圖像生成
9.1M