自定义模型

# 自定义模型

Stable Diffusion 3.5

Stable Diffusion 3.5

Stable Diffusion 3.5是Stability AI推出的一款图像生成模型，具有多种变体，包括Stable Diffusion 3.5 Large和Stable Diffusion 3.5 Large Turbo。这些模型可高度定制，能在消费级硬件上运行，并且根据Stability AI社区许可协议，可以免费用于商业和非商业用途。该模型的发布体现了Stability AI致力于让视觉媒体变革的工具更易于获取、更前沿、更自由的使命。

Eddie AI

Eddie AI是一个创新的视频编辑平台，它利用人工智能技术帮助用户快速、轻松地编辑视频。这个平台的主要优点是它的用户友好性和高效率，它允许用户像与另一个编辑交谈一样与AI对话，提出他们想要的视频剪辑类型。Eddie AI的背景信息显示，它旨在通过使用自定义的AI编辑/故事模型来扩展视频编辑的规模，这表明它在视频制作领域具有潜在的革命性影响。

WebLLM

WebLLM是一个高性能的浏览器内语言模型推理引擎，利用WebGPU进行硬件加速，使得强大的语言模型操作可以直接在网页浏览器内执行，无需服务器端处理。这个项目旨在将大型语言模型（LLM）直接集成到客户端，从而实现成本降低、个性化增强和隐私保护。它支持多种模型，并与OpenAI API兼容，易于集成到项目中，支持实时交互和流式处理，是构建个性化AI助手的理想选择。

PuLID-Flux ComfyUI implementation

Pulid Flux ComfyUI Implementation

PuLID-Flux ComfyUI implementation 是一个基于ComfyUI的图像处理模型，它利用了PuLID技术和Flux模型来实现对图像的高级定制和处理。这个项目是cubiq/PuLID_ComfyUI的灵感来源，是一个原型，它使用了一些方便的模型技巧来处理编码器部分。开发者希望在更正式地重新实现之前测试模型的质量。为了获得更好的结果，推荐使用16位或8位的GGUF模型版本。

parsera

Parsera是一个轻量级的Python库，专门设计用于与大型语言模型（LLMs）结合，以简化网站数据抓取的过程。它通过使用最少的令牌来提高速度并降低成本，使得数据抓取变得更加高效和经济。Parsera支持多种聊天模型，并且可以自定义使用不同的模型，如OpenAI或Azure。

custom-pilot

Custom Pilot 是一个 Visual Studio Code 扩展框架，允许用户轻松地将自定义的代码补全模型集成到 VS Code 中。它支持使用任何遵循 OpenAI API 格式的 API 服务器，特别是需要提供 /v1/models 和 /v1/completions 两个端点。用户可以在扩展的侧边栏面板中设置 API 服务器的 URL、选择推理模型，并输入 API 密钥（如果需要）。此外，Custom Pilot 还可以与 LM Studio 配合使用，允许用户在本地机器上离线运行大型语言模型（LLMs），并通过 VS Code 进行代码补全。

Tensor.Art

Tensor.Art是一个免费的在线图像生成器和模型托管平台，提供多种AI工具和功能，支持用户通过文本描述生成图像，以及自定义和微调AI模型。平台背景强大，拥有先进的Stable Diffusion技术，支持多种节点和工作流的复杂组合，适用于从初学者到专业设计师的不同需求。

ComfyUI-Fast-Style-Transfer

Comfyui Fast Style Transfer

ComfyUI-Fast-Style-Transfer是一个基于PyTorch框架开发的快速神经风格迁移插件，它允许用户通过简单的操作实现图像的风格转换。该插件基于fast-neural-style-pytorch项目，目前只移植了基础的推理功能。用户可以自定义风格，通过训练自己的模型来实现独特的风格迁移效果。

Azure 认知服务语音

Azure 认知服务语音

Azure 认知服务语音是微软推出的一款语音识别与合成服务，支持超过100种语言和方言的语音转文本和文本转语音功能。它通过创建可处理特定术语、背景噪音和重音的自定义语音模型，提高听录的准确度。此外，该服务还支持实时语音转文本、语音翻译、文本转语音等功能，适用于多种商业场景，如字幕生成、通话后听录分析、视频翻译等。

Featherless

Featherless是一个AI模型提供商，专注于为订阅者提供持续扩展的Hugging Face模型库。它支持LLaMA-3等模型架构，提供个性化和隐私保护的服务，不记录用户聊天或提示。Featherless提供了两种定价计划，基础版每月10美元，高级版每月25美元，分别提供最大15B和72B模型的访问权限。

Hume.AI

Hume AI专注于开发能够理解人类情感和表情的技术，提供表情测量API和自定义模型API，以预测和改善人类福祉。

Ollama

Ollama是一款本地大语言模型工具，让用户能够快速运行Llama 2、Code Llama和其他模型。用户可以自定义和创建他们自己的模型。Ollama目前支持macOS和Linux，Windows版本即将推出。该产品定位于为用户提供本地化的大语言模型运行环境，以满足用户个性化的需求。

模型训练与部署

FieldDay

FieldDay是一个自动收集图像、训练自定义视觉AI模型、并将模型嵌入任意APP的工具。用户可以利用手机摄像头收集自定义数据集,通过几次迭代完善算法,在几分钟内创建定制的视觉AI应用。FieldDay提供对象识别、数据集管理等功能。FieldDay使任何人都能创造定制的视觉AI应用。

Google Cloud AutoML

Google Cloud AutoML

Google Cloud AutoML能够基于结构化数据自动构建和部署高级的自定义机器学习模型,使用简单的图形界面,开发者无需深入的机器学习知识就可以训练出高质量的模型,并可以轻松部署模型并调整规模。涵盖图像分类、对象检测、文本分类等多个领域。

YourGPT

YourGPT是一个下一代AI和GPT套件，旨在帮助您实现更快、更智能的目标。我们的产品和工具旨在优化您的工作流程，提升您的能力。利用YourGPT，您可以充分发挥人工智能的潜力，自信地实现您的目标。主要功能包括：AI聊天机器人、Q&A Master、TuneUp等。您可以通过我们的产品加速您的业务发展、提高客户支持水平，并为您的业务赋能。

聊天机器人

精选AI产品推荐

NoCode

NoCode 是一款无需编程经验的平台，允许用户通过自然语言描述创意并快速生成应用，旨在降低开发门槛，让更多人能实现他们的创意。该平台提供实时预览和一键部署功能，非常适合非技术背景的用户，帮助他们将想法转化为现实。

ListenHub

ListenHub 是一款轻量级的 AI 播客生成工具，支持中文和英语，基于前沿 AI 技术，能够快速生成用户感兴趣的播客内容。其主要优点包括自然对话和超真实人声效果，使得用户能够随时随地享受高品质的听觉体验。ListenHub 不仅提升了内容生成的速度，还兼容移动端，便于用户在不同场合使用。产品定位为高效的信息获取工具，适合广泛的听众需求。

Lovart

Lovart 是一款革命性的 AI 设计代理，能够将创意提示转化为艺术作品，支持从故事板到品牌视觉的多种设计需求。其重要性在于打破传统设计流程，节省时间并提升创意灵感。Lovart 当前处于测试阶段，用户可加入等候名单，随时体验设计的乐趣。

FastVLM

FastVLM 是一种高效的视觉编码模型，专为视觉语言模型设计。它通过创新的 FastViTHD 混合视觉编码器，减少了高分辨率图像的编码时间和输出的 token 数量，使得模型在速度和精度上表现出色。FastVLM 的主要定位是为开发者提供强大的视觉语言处理能力，适用于各种应用场景，尤其在需要快速响应的移动设备上表现优异。

Smart PDFs

Smart PDFs 是一个在线工具，利用 AI 技术快速分析 PDF 文档，并生成简明扼要的总结。它适合需要快速获取文档要点的用户，如学生、研究人员和商务人士。该工具使用 Llama 3.3 模型，支持多种语言，是提高工作效率的理想选择，完全免费使用。

KeySync

KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。它解决了传统唇同步技术中的时间一致性问题，同时通过巧妙的遮罩策略处理表情泄漏和面部遮挡。KeySync 的优越性体现在其在唇重建和跨同步方面的先进成果，适用于自动配音等实际应用场景。

AnyVoice

AnyVoice是一款领先的AI声音生成器，采用先进的深度学习模型，将文本转换为与人类无法区分的自然语音。其主要优点包括超真实的声音效果、多语言支持、快速生成能力以及语音定制功能。该产品适用于多种场景，如内容创作、教育、商业和娱乐制作等，旨在为用户提供高效、便捷的语音生成解决方案。目前产品提供免费试用，适合不同层次的用户。

LiblibAI

LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase