# 自定义模型

国外精选
Stable Diffusion 3.5
Stable Diffusion 3.5
Stable Diffusion 3.5是Stability AI推出的一款图像生成模型,具有多种变体,包括Stable Diffusion 3.5 Large和Stable Diffusion 3.5 Large Turbo。这些模型可高度定制,能在消费级硬件上运行,并且根据Stability AI社区许可协议,可以免费用于商业和非商业用途。该模型的发布体现了Stability AI致力于让视觉媒体变革的工具更易于获取、更前沿、更自由的使命。
图片生成
82.5K
国外精选
Eddie AI
Eddie AI
Eddie AI是一个创新的视频编辑平台,它利用人工智能技术帮助用户快速、轻松地编辑视频。这个平台的主要优点是它的用户友好性和高效率,它允许用户像与另一个编辑交谈一样与AI对话,提出他们想要的视频剪辑类型。Eddie AI的背景信息显示,它旨在通过使用自定义的AI编辑/故事模型来扩展视频编辑的规模,这表明它在视频制作领域具有潜在的革命性影响。
AI视频编辑
57.1K
WebLLM
Webllm
WebLLM是一个高性能的浏览器内语言模型推理引擎,利用WebGPU进行硬件加速,使得强大的语言模型操作可以直接在网页浏览器内执行,无需服务器端处理。这个项目旨在将大型语言模型(LLM)直接集成到客户端,从而实现成本降低、个性化增强和隐私保护。它支持多种模型,并与OpenAI API兼容,易于集成到项目中,支持实时交互和流式处理,是构建个性化AI助手的理想选择。
AI模型
54.4K
PuLID-Flux ComfyUI implementation
Pulid Flux ComfyUI Implementation
PuLID-Flux ComfyUI implementation 是一个基于ComfyUI的图像处理模型,它利用了PuLID技术和Flux模型来实现对图像的高级定制和处理。这个项目是cubiq/PuLID_ComfyUI的灵感来源,是一个原型,它使用了一些方便的模型技巧来处理编码器部分。开发者希望在更正式地重新实现之前测试模型的质量。为了获得更好的结果,推荐使用16位或8位的GGUF模型版本。
AI图像生成
55.8K
parsera
Parsera
Parsera是一个轻量级的Python库,专门设计用于与大型语言模型(LLMs)结合,以简化网站数据抓取的过程。它通过使用最少的令牌来提高速度并降低成本,使得数据抓取变得更加高效和经济。Parsera支持多种聊天模型,并且可以自定义使用不同的模型,如OpenAI或Azure。
AI开发助手
53.3K
custom-pilot
Custom Pilot
Custom Pilot 是一个 Visual Studio Code 扩展框架,允许用户轻松地将自定义的代码补全模型集成到 VS Code 中。它支持使用任何遵循 OpenAI API 格式的 API 服务器,特别是需要提供 /v1/models 和 /v1/completions 两个端点。用户可以在扩展的侧边栏面板中设置 API 服务器的 URL、选择推理模型,并输入 API 密钥(如果需要)。此外,Custom Pilot 还可以与 LM Studio 配合使用,允许用户在本地机器上离线运行大型语言模型(LLMs),并通过 VS Code 进行代码补全。
AI开发助手
48.9K
国外精选
Tensor.Art
Tensor.art
Tensor.Art是一个免费的在线图像生成器和模型托管平台,提供多种AI工具和功能,支持用户通过文本描述生成图像,以及自定义和微调AI模型。平台背景强大,拥有先进的Stable Diffusion技术,支持多种节点和工作流的复杂组合,适用于从初学者到专业设计师的不同需求。
图片生成
83.1K
ComfyUI-Fast-Style-Transfer
Comfyui Fast Style Transfer
ComfyUI-Fast-Style-Transfer是一个基于PyTorch框架开发的快速神经风格迁移插件,它允许用户通过简单的操作实现图像的风格转换。该插件基于fast-neural-style-pytorch项目,目前只移植了基础的推理功能。用户可以自定义风格,通过训练自己的模型来实现独特的风格迁移效果。
AI图像生成
60.7K
Azure 认知服务语音
Azure 认知服务语音
Azure 认知服务语音是微软推出的一款语音识别与合成服务,支持超过100种语言和方言的语音转文本和文本转语音功能。它通过创建可处理特定术语、背景噪音和重音的自定义语音模型,提高听录的准确度。此外,该服务还支持实时语音转文本、语音翻译、文本转语音等功能,适用于多种商业场景,如字幕生成、通话后听录分析、视频翻译等。
AI语音识别
59.6K
Featherless
Featherless
Featherless是一个AI模型提供商,专注于为订阅者提供持续扩展的Hugging Face模型库。它支持LLaMA-3等模型架构,提供个性化和隐私保护的服务,不记录用户聊天或提示。Featherless提供了两种定价计划,基础版每月10美元,高级版每月25美元,分别提供最大15B和72B模型的访问权限。
AI模型
52.7K
Hume.AI
Hume.ai
Hume AI专注于开发能够理解人类情感和表情的技术,提供表情测量API和自定义模型API,以预测和改善人类福祉。
情感陪伴
686.1K
国外精选
Ollama
Ollama
Ollama是一款本地大语言模型工具,让用户能够快速运行Llama 2、Code Llama和其他模型。用户可以自定义和创建他们自己的模型。Ollama目前支持macOS和Linux,Windows版本即将推出。该产品定位于为用户提供本地化的大语言模型运行环境,以满足用户个性化的需求。
模型训练与部署
283.5K
FieldDay
Fieldday
FieldDay是一个自动收集图像、训练自定义视觉AI模型、并将模型嵌入任意APP的工具。用户可以利用手机摄像头收集自定义数据集,通过几次迭代完善算法,在几分钟内创建定制的视觉AI应用。FieldDay提供对象识别、数据集管理等功能。FieldDay使任何人都能创造定制的视觉AI应用。
AI模型
47.2K
Google Cloud AutoML
Google Cloud AutoML
Google Cloud AutoML能够基于结构化数据自动构建和部署高级的自定义机器学习模型,使用简单的图形界面,开发者无需深入的机器学习知识就可以训练出高质量的模型,并可以轻松部署模型并调整规模。涵盖图像分类、对象检测、文本分类等多个领域。
AI模型
46.9K
YourGPT
Yourgpt
YourGPT是一个下一代AI和GPT套件,旨在帮助您实现更快、更智能的目标。我们的产品和工具旨在优化您的工作流程,提升您的能力。利用YourGPT,您可以充分发挥人工智能的潜力,自信地实现您的目标。主要功能包括:AI聊天机器人、Q&A Master、TuneUp等。您可以通过我们的产品加速您的业务发展、提高客户支持水平,并为您的业务赋能。
聊天机器人
47.2K
精选AI产品推荐
中文精选
NoCode
Nocode
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。该平台提供实时预览和一键部署功能,非常适合非技术背景的用户,帮助他们将想法转化为现实。
开发平台
98.3K
优质新品
ListenHub
Listenhub
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。其主要优点包括自然对话和超真实人声效果,使得用户能够随时随地享受高品质的听觉体验。ListenHub 不仅提升了内容生成的速度,还兼容移动端,便于用户在不同场合使用。产品定位为高效的信息获取工具,适合广泛的听众需求。
音频生成
81.1K
国外精选
Lovart
Lovart
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。其重要性在于打破传统设计流程,节省时间并提升创意灵感。Lovart 当前处于测试阶段,用户可加入等候名单,随时体验设计的乐趣。
AI设计工具
100.7K
FastVLM
Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。它通过创新的 FastViTHD 混合视觉编码器,减少了高分辨率图像的编码时间和输出的 token 数量,使得模型在速度和精度上表现出色。FastVLM 的主要定位是为开发者提供强大的视觉语言处理能力,适用于各种应用场景,尤其在需要快速响应的移动设备上表现优异。
AI模型
83.4K
国外精选
Smart PDFs
Smart PDFs
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。它适合需要快速获取文档要点的用户,如学生、研究人员和商务人士。该工具使用 Llama 3.3 模型,支持多种语言,是提高工作效率的理想选择,完全免费使用。
文章摘要
51.3K
KeySync
Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。它解决了传统唇同步技术中的时间一致性问题,同时通过巧妙的遮罩策略处理表情泄漏和面部遮挡。KeySync 的优越性体现在其在唇重建和跨同步方面的先进成果,适用于自动配音等实际应用场景。
视频编辑
79.2K
AnyVoice
Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。其主要优点包括超真实的声音效果、多语言支持、快速生成能力以及语音定制功能。该产品适用于多种场景,如内容创作、教育、商业和娱乐制作等,旨在为用户提供高效、便捷的语音生成解决方案。目前产品提供免费试用,适合不同层次的用户。
音频生成
651.1K
中文精选
LiblibAI
Liblibai
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。
AI模型
8.0M
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase