Stable Diffusion

# Stable Diffusion

Animagine XL 4.0

Animagine XL 4.0

Animagine XL 4.0 是一款基於Stable Diffusion XL 1.0微調的動漫主題生成模型。它使用了840萬張多樣化的動漫風格圖像進行訓練，訓練時長達到2650小時。該模型專注於通過文本提示生成和修改動漫主題圖像，支持多種特殊標籤，可控制圖像生成的不同方面。其主要優點包括高質量的圖像生成、豐富的動漫風格細節以及對特定角色和風格的精準還原。該模型由Cagliostro Research Lab開發，採用CreativeML Open RAIL++-M許可證，允許商業使用和修改。

LatentSync

LatentSync 是由字節跳動開發的一款基於音頻條件的潛在擴散模型的唇部同步框架。它能夠直接利用 Stable Diffusion 的強大能力，無需任何中間運動表示，即可建模複雜的音視頻關聯。該框架通過提出的時間表示對齊（TREPA）技術，有效提升了生成視頻幀的時間一致性，同時保持了唇部同步的準確性。該技術在視頻製作、虛擬主播、動畫製作等領域具有重要應用價值，能夠顯著提高製作效率，降低人工成本，為用戶帶來更加逼真、自然的視聽體驗。LatentSync 的開源特性也使其能夠被廣泛應用於學術研究和工業實踐，推動相關技術的發展和創新。

TryOffDiff

TryOffDiff是一種基於擴散模型的高保真服裝重建技術，用於從穿著個體的單張照片中生成標準化的服裝圖像。這項技術與傳統的虛擬試穿不同，它旨在提取規範的服裝圖像，這在捕捉服裝形狀、紋理和複雜圖案方面提出了獨特的挑戰。TryOffDiff通過使用Stable Diffusion和基於SigLIP的視覺條件來確保高保真度和細節保留。該技術在VITON-HD數據集上的實驗表明，其方法優於基於姿態轉移和虛擬試穿的基線方法，並且需要較少的預處理和後處理步驟。TryOffDiff不僅能夠提升電子商務產品圖像的質量，還能推進生成模型的評估，並激發未來在高保真重建方面的工作。

SD3.5-Large-IP-Adapter

SD3.5 Large IP Adapter

SD3.5-Large-IP-Adapter是一個基於Stable Diffusion 3.5 Large模型的IP適配器，由InstantX Team研發。該模型能夠將圖像處理工作類比於文本處理，具有強大的圖像生成能力，並且可以通過適配器技術進一步提升圖像生成的質量和效果。該技術的重要性在於其能夠推動圖像生成技術的發展，特別是在創意工作和藝術創作領域。產品背景信息顯示，該模型是由Hugging Face和fal.ai贊助的項目，並且遵循stabilityai-ai-community的許可協議。

BharatDiffusion

Bharatdiffusion

BharatDiffusion是一個基於AI的圖像生成模型，專門針對印度的多樣化景觀、文化和遺產進行微調，能夠生成反映印度豐富文化和特色的高質量圖像。該模型使用Stable Diffusion技術處理所有圖像生成，確保內容與印度的多樣性和活力相呼應。

sd-ppp

sd-ppp是一個允許用戶在Adobe Photoshop和各種Stable Diffusion界面（如SD/SDForge/ComfyUI）之間進行通信的插件。它支持多層操作，包括文本層和圖像層，能夠處理多個文檔和多個Photoshop實例，並允許用戶在文檔的特定區域工作。該插件對於設計師和藝術家來說是一個強大的工具，因為它可以簡化工作流程，提高創作效率，並允許他們利用Stable Diffusion的強大功能來增強他們的設計和藝術作品。

Stable Diffusion

Comfyui_Object_Migration

Comfyui Object Migration

Comfyui_Object_Migration是一個實驗性項目，專注於Stable Diffusion (SD)模型。該項目通過使用DIT模型的自注意力能力，實現了在單次生成的圖像中，同一對象或角色保持高度一致性。項目通過簡化預處理邏輯，開發出了一種高效的遷移方法，能夠引導模型關注所需內容，提供驚人的一致性。目前已開發出適用於服裝的遷移模型，能夠實現卡通服裝到現實風格或現實服裝到卡通風格的遷移，並通過權重控制激發設計創造力。

SD3.5-LoRA-Linear-Red-Light

SD3.5 LoRA Linear Red Light

SD3.5-LoRA-Linear-Red-Light是一個基於文本到圖像生成的AI模型，通過使用LoRA（Low-Rank Adaptation）技術，該模型能夠根據用戶提供的文本提示生成高質量的圖像。這種技術的重要性在於它能夠以較低的計算成本實現模型的微調，同時保持生成圖像的多樣性和質量。該模型基於Stable Diffusion 3.5 Large模型，並在此基礎上進行了優化和調整，以適應特定的圖像生成需求。

RealAnime

RealAnime - Detailed V1 是一個基於Stable Diffusion的LoRA模型，專門用於生成逼真的動漫風格圖像。該模型通過深度學習技術，能夠理解並生成高質量的動漫人物圖像，滿足動漫愛好者和專業插畫師的需求。它的重要性在於能夠大幅度提高動漫風格圖像的生成效率和質量，為動漫產業提供強大的技術支持。目前，該模型在Tensor.Art平臺上提供，用戶可以通過在線方式使用，無需下載安裝，方便快捷。價格方面，用戶可以通過購買Buffet計劃來解鎖下載權益，享受更靈活的使用方式。

FLUX.1-dev-Controlnet-Canny-alpha

FLUX.1 Dev Controlnet Canny Alpha

FLUX.1-dev-Controlnet-Canny-alpha是一個基於控制網絡的圖像生成模型，屬於Stable Diffusion系列。它使用先進的Diffusers技術，通過文本到圖像的轉換為用戶提供高質量的圖像生成服務。此模型特別適用於需要精確控制圖像細節和風格的場景。

flux-RealismLora

Flux RealismLora

flux-RealismLora是由XLabs AI團隊發佈的基於FLUX.1-dev模型的LoRA技術，用於生成逼真的圖像。該技術通過文本提示生成圖像，支持多種風格，如動畫風格、幻想風格和自然電影風格。XLabs AI提供了訓練腳本和配置文件，以方便用戶進行模型訓練和使用。

Amuse

Amuse 2.0 Beta是一款由AMD推出的桌面客戶端軟件，專為AMD Ryzen™ AI 300系列處理器和Radeon™ RX 7000系列顯卡用戶設計，提供AI圖像生成和優化體驗。它結合了Stable Diffusion模型和AMD XDNA™超級分辨率技術，無需複雜安裝和配置，即可實現高質量的AI圖像生成。

Stability Matrix

Stability Matrix

Stability Matrix 是一個用戶友好的桌面客戶端，旨在簡化 Stable Diffusion 的圖像生成過程。它通過一鍵安裝和無縫的模型集成，幫助用戶輕鬆管理和生成圖像，無需深入的技術知識。該工具支持多種操作系統，並能有效管理模型資源，降低用戶的學習曲線。Stability Matrix 提供穩定性和靈活性，特別適合圖像創作者、設計師及數字藝術家使用。

Tensor.Art

Tensor.Art是一個免費的在線圖像生成器和模型託管平臺，提供多種AI工具和功能，支持用戶通過文本描述生成圖像，以及自定義和微調AI模型。平臺背景強大，擁有先進的Stable Diffusion技術，支持多種節點和工作流的複雜組合，適用於從初學者到專業設計師的不同需求。

EasySdxlWebUi

EasySdxlWebUi是一個開源項目，旨在簡化SdxlWebUi的安裝和使用過程，使得用戶可以更加方便地利用Stable Diffusion web UI和forge等工具進行圖像生成。項目支持多種擴展功能，允許用戶通過web界面進行參數設置和圖像生成，同時也支持自定義和自動化安裝，適合需要快速上手和高效生成圖像的用戶。

Consistent character

Consistent Character

cog-consistent-character 是一個基於 AI 的圖像生成模型，允許用戶創建給定角色在不同姿勢下的圖像。它利用了 Stable Diffusion 技術，通過 ComfyUI 提供了一個用戶友好的界面，使得即使是沒有編程背景的用戶也能輕鬆生成高質量的圖像。

TTPLanet_SDXL_Controlnet_Tile_Realistic

Ttplanet SDXL Controlnet Tile Realistic

這是一個基於SDXL的ControlNet Tile模型,使用Hugging Face Diffusers訓練集,適用於Stable Diffusion SDXL ControlNet。它最初是為我自己的逼真模型訓練,用於終極放大過程以提高圖像細節。使用合適的工作流程,它可以為高細節、高分辨率的圖像修復提供良好的結果。由於大多數開源沒有SDXL Tile模型,我決定分享這個模型。該模型支持高分辨率修復、風格遷移和圖像修復等功能,可以為你提供高質量的圖像處理體驗。

ip-composition-adapter

Ip Composition Adapter

該適配器為Stable Diffusion 1.5設計,用於將一般圖像組合注入到模型中,同時大部分忽略風格和內容。例如一個人擺手的肖像會生成一個完全不同的人在擺手的圖像。該適配器的優勢是允許控制更加靈活,不像Control Nets那樣會嚴格匹配控制圖像。產品由POM with BANODOCO構思,ostris訓練併發布。

diffusion-client

Diffusion Client

diffusion-client是一個用於安卓的Stable Diffusion客戶端。它提供了強大的圖像生成能力,包括文本到圖像、圖像到圖像、圖像修復等功能。該APP支持多種模型,內置控制網調節生成效果。另外,該APP具有歷史記錄管理、標籤提取等高級功能,同時支持擴展插件,可鏈接到Civitai等模型。

Creative Upscaler

Creative Upscaler

Creative Upscaler是一個基於AI的圖片生成器,可以讓任何人快速輕鬆地創建高質量的藝術作品。它整合了多種前沿的機器學習算法,如Stable Diffusion、DALL-E 2、VQGAN+CLIP等,支持生成各種風格的圖像。用戶只需要提供文字描述,Creative Upscaler就可以自動生成圖片。同時,它還有創造性的圖像上樣器功能,可以把低分辨率圖片轉換成高清大圖。Creative Upscaler完全免費使用,擁有龐大活躍的社區,是探索AI藝術的最佳選擇。

Stable Diffusion WebUI Forge

Stable Diffusion WebUI Forge

Stable Diffusion WebUI Forge基於Stable Diffusion WebUI和Gradio開發,旨在優化資源管理、加速推理。相比原版WebUI在1024px分辨率下的SDXL推理,Forge可提升30-75%的速度,最大分辨率提升2-3倍,最大batch size提升4-6倍。Forge保持了原版WebUI的所有功能,同時新增了DDPM、DPM++、LCM等採樣器,實現了Free U、SVD、Zero123等算法。使用Forge的UNet Patcher,開發者可以用極少的代碼實現算法。Forge還優化了控制網絡的使用,實現真正的零內存佔用調用。

Stable Cascade

Stable Cascade是一個基於Würstchen架構的文本到圖像生成模型,相比其他模型使用更小的潛在空間進行訓練和推理,因此在訓練和推理速度上都有顯著提升。該模型可以在消費級硬件上運行,降低了使用門檻。Stable Cascade在人類評估中表現突出,無論是在提示對齊還是圖像質量上都超過了其他模型。總體而言,這是一個高效、易用、性能強勁的文生圖AI模型。

Taiyi-Diffusion-XL

Taiyi Diffusion XL

Taiyi-Diffusion-XL是一個開源的基於Stable Diffusion訓練的雙語文生圖生成模型,支持英文和中文的文本到圖像生成,相比之前的中文文生圖模型有了顯著提升。它可以根據文本描述生成照片般逼真的圖像,支持多種圖像風格,具有較高的生成質量和多樣性。該模型採用創新的訓練方式,擴展了詞表、位置編碼以支持長文本和中文,並在大規模雙語數據集上進行訓練,確保了其強大的中英文生成能力。

Comfy Textures

Comfy Textures是一個Unreal Engine插件,它將編輯器與ComfyUI集成,允許您使用生成式擴散模型快速創建和調整場景的紋理。支持單視點和多視點紋理投影,可以用於透視和正交攝像機。還支持紋理編輯和圖像到圖像工作流。可以無縫工作於Unreal Engine 5.x和4.x。

Flush AI

Flush AI是一個端到端的AI藝術創作雲工作室,提供穩定擴散模型託管、模型微調、多模態工作流構建等功能,讓用戶無需關心GPU配置,即可輕鬆創建AI藝術作品。用戶可以免費試用,並按需選擇定價計劃,靈活快速地進行AI創作。

DiffusionLight

DiffusionLight是一項利用擴散模型在單張輸入圖像中估算照明效果的技術。它利用訓練好的Stable Diffusion XL模型繪製一個鏡面反射球,然後將球體展開得到全景照明圖。該技術解決了現有基於神經網絡的方法依賴有限HDR全景數據集導致在真實複雜場景下效果不佳的問題。關鍵創新在於發現了擴散噪聲圖和鏡面反射球生成質量之間的關係,迭代生成高質量鏡面球;以及通過LoRA 進行多曝光訓練,使LDR模型也可以輸出HDR格式。該技術可產生逼真的照明估計,特別適用於野外場景。

VibePrompts

VibePrompts是一個AI prompt在線交易平臺。用戶可以在這裡購買和出售針對不同AI模型優化過的prompts,如Midjourney、Stable Diffusion等。平臺提供了大量經過專業打磨的高質量prompts,能夠幫助用戶快速獲得想要的創意結果。平臺易於使用,提供直觀的搜索和自定義功能,讓prompt的選擇和購買過程變得無縫而高效。VibePrompts已幫助大量用戶實現創意目的,是提升項目質量的絕佳平臺。

sd4j

sd4j是一個使用ONNX Runtime的Stable Diffusion推理Java實現,以C#實現進行了優化移植,帶有重複生成圖像的圖形界面,並支持負面文本輸入。旨在演示如何在Java中使用ONNX Runtime,以及獲得良好性能的ONNX Runtime的最佳實踐。我們將使其與ONNX Runtime的最新版本保持同步,並隨著通過ONNX Runtime Java API提供的性能相關ONNX Runtime功能的出現進行適當更新。所有代碼都可能會發生變化,因為這是一個代碼示例,任何API都不應該被視為穩定的。

AIEmojiGenerator

Aiemojigenerator

AI Emoji Generator利用Stable Diffusion的強大能力,將文本轉化為獨特的表情符號,這一創新工具免費供大家使用,支持任意文本輸入快速創作個性化表情符號,一次點擊即可輕鬆製作獨特表情符號。它完美結合了科技和創造力,支持個性化表情符號的無障礙生產。無論是增強數字交流還是探索表情符號的藝術,AI Emoji Generator都開拓了創意表達的新可能。

NVIDIA FREE Stable Diffusion XL

NVIDIA FREE Stable Diffusion XL

Stable Diffusion XL(SDXL)是一個生成對抗網絡模型,能夠用更短的提示生成富有表現力的圖像,並在圖像中插入文字。它基於 Stability AI 開發的 Stable Diffusion 模型進行了改進,使圖像生成更加高質量和可控,支持用自然語言進行本地化圖像編輯。該模型可用於各種創意設計工作,如概念藝術、平面設計、視頻特效等領域。

精選AI產品推薦

騰訊混元圖像 2.0

騰訊混元圖像 2.0

騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型，顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構，使得圖像生成速度可達到毫秒級，避免了傳統生成的等待時間。同時，模型通過強化學習算法與人類美學知識的結合，提升了圖像的真實感和細節表現，適合設計師、創作者等專業用戶使用。

Lovart

Lovart 是一款革命性的 AI 設計代理，能夠將創意提示轉化為藝術作品，支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程，節省時間並提升創意靈感。Lovart 當前處於測試階段，用戶可加入等候名單，隨時體驗設計的樂趣。

FastVLM

FastVLM 是一種高效的視覺編碼模型，專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器，減少了高分辨率圖像的編碼時間和輸出的 token 數量，使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力，適用於各種應用場景，尤其在需要快速響應的移動設備上表現優異。

KeySync

KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題，同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果，適用於自動配音等實際應用場景。

Manus

Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品，能夠直接交付完整的任務成果，而不僅僅是提供建議或答案。它採用 Multiple Agent 架構，運行在獨立虛擬機中，能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現，展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’，幫助用戶高效完成各種複雜任務。

Trae國內版

Trae是一款專為中文開發場景設計的AI原生IDE，將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能，顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白，滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具，旨在為專業開發者提供強大的技術支持，目前尚未明確公開價格，但預計會採用付費模式以匹配其高端定位。

開發與工具

Pika

Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。

LiblibAI

LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase