# Gradio

Translation Agent WebUI
Translation Agent WebUI
translation-agent-webui是一個基於Gradio的Web界面,用於Andrewyng翻譯代理。它支持自動檢測輸入文本語言、標記化文本單詞、突出顯示翻譯差異,並支持多種AI翻譯API,包括groq、openai、cohere、ollama、together AI和Huggingface Inference API等。這個工具的主要優點是用戶友好的界面和對多種語言的支持,使得翻譯任務更加便捷和高效。產品背景信息顯示,該工具是基於開源模型LlaMax3構建的,該模型在102種語言上有廣泛的訓練集。
翻譯
52.7K
AdvancedLivePortrait-WebUI
Advancedliveportrait WebUI
AdvancedLivePortrait-WebUI是一個基於Gradio框架開發的Web界面,用於即時人像動畫編輯。該技術允許用戶通過上傳圖片來編輯人物的面部表情,實現了高效的肖像動畫製作。它基於LivePortrait算法,利用深度學習技術進行面部特徵的捕捉和動畫製作,具有操作簡便、效果逼真的優點。產品背景信息顯示,它是由jhj0517開發的開源項目,適用於需要進行人像動畫製作的專業人士和愛好者。目前該項目是免費的,並且開源,用戶可以自由使用和修改。
圖片編輯
68.2K
Computer Use - OOTB
Computer Use OOTB
Computer Use - OOTB是一個無需Docker即可使用的Anthropic Claude計算機使用接口。它支持任何平臺,目前主要在Windows上進行了測試。該項目提供了一個基於Gradio的用戶友好界面,允許用戶通過互聯網從任何設備遠程控制計算機,無需在移動設備上安裝應用程序。產品的主要優點包括簡化的安裝過程、跨平臺支持以及基於雲的API調用,使得用戶可以輕鬆地利用Anthropic Claude的強大功能。
個人助理
59.1K
PANDASAI APP
PANDASAI APP
PANDASAI APP是一個利用生成式人工智能(LLMs)與Pandas數據框進行交互的應用。該應用使用gradio作為前端界面,並通過pandasai作為Python高級包裝器,使得數據框可以進行對話式交互。pandasai提供了openai、HuggingFace和Azure等API的生成式AI能力,用戶可以根據自己的需求配置後端平臺。該應用的主要優點包括能夠上傳csv文件並詢問有關數據的問題,以及像與人類交互一樣與數據進行交互。
數據分析
56.6K
Virtual Try-On Application
Virtual Try On Application
這是一個使用Flask、Twilio的WhatsApp API和Gradio的虛擬試穿模型構建的虛擬試穿原型應用。用戶可以通過WhatsApp發送圖片來虛擬試穿服裝,並將結果發送回用戶。該應用利用了Twilio Sandbox進行WhatsApp消息的發送和接收,以及Gradio API來處理虛擬試穿模型,為用戶提供了一個創新的在線購物體驗。
電商
56.0K
gradio-bot
Gradio Bot
gradio-bot是一個可以將Hugging Face Space或Gradio應用轉化為Discord機器人的工具。它允許開發者通過簡單的命令行操作,將現有的機器學習模型或應用快速部署到Discord平臺上,實現自動化交互。這不僅提高了應用的可達性,還為開發者提供了一個與用戶直接交互的新渠道。
AI聊天機器人
47.2K
AI-Powered Meeting Summarizer
AI Powered Meeting Summarizer
AI-Powered Meeting Summarizer是一個基於Gradio的網站應用,能夠將會議錄音轉換為文本,並使用whisper.cpp進行音頻到文本的轉換,以及Ollama服務器進行文本摘要。該工具非常適合快速提取會議中的關鍵點、決策和行動項目。
AI會議助手
53.5K
ElevenlabsDubbingGradio
Elevenlabsdubbinggradio
ElevenLabs Video Dubbing Application 是一個用戶友好的界面,用於使用 ElevenLabs API 配音視頻。該應用允許用戶上傳視頻文件或提供視頻網址(來自 YouTube、TikTok、Twitter 或 Vimeo 等平臺),並將其配音成各種語言。應用使用 Gradio 提供易於使用的 Web 界面。
AI視頻編輯
48.3K
Chat With Your Docs
Chat With Your Docs
Chat With Your Docs 是一個Python應用程序,允許用戶與多種文檔格式(如PDF、網頁和YouTube視頻)進行對話。用戶可以使用自然語言提問,應用程序將基於文檔內容提供相關回答。該應用利用語言模型生成準確答案。請注意,應用僅回應與加載的文檔相關的問題。
AI聊天機器人
56.3K
Stable Diffusion web UI
Stable Diffusion Web UI
Stable Diffusion web UI是一個基於Stable Diffusion模型的Web界面,使用Gradio庫實現,提供了多種圖像生成功能,包括txt2img和img2img模式,一鍵安裝和運行腳本,以及高級的圖像處理選項,如Outpainting、Inpainting、Color Sketch等。它支持多種硬件平臺,包括NVidia、AMD、Intel和Ascend NPUs,並提供了詳細的安裝和運行指南。
AI圖像生成
53.8K
精選AI產品推薦
中文精選
騰訊混元圖像 2.0
騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
80.6K
國外精選
Lovart
Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
63.8K
FastVLM
Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
51.1K
KeySync
Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
48.3K
Manus
Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M
Trae國內版
Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
137.7K
國外精選
Pika
Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選
LiblibAI
Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase