图像

# 图像

Unlucid AI

Unlucid AI是一款免费的AI工具，让用户利用无限制的AI技术创作、编辑和动画视频。其主要优点在于提供创造力无限的数字梦想空间，无需限制地释放想象力。

ImgSearch

ImgSearch是一款提供免费高质量AI生成图片的网站，通过AI技术生成图片，为用户提供方便快捷的库存图片搜索服务。

Kontext AI

Kontext AI的FLUX Kontext是一项具有上下文感知能力的技术，可用于图像生成和编辑。其主要优点包括快速、准确的生成和编辑图像，支持复杂的编辑工作流程，结合了传统文本到图像模型和流式生成建模。

AdpexAI

AdpexAI是一体化AI工具，通过文本、图片或视频输入生成并编辑高分辨率、专业级图像与视频。无需设计技能，使用方便快捷。AdpexAI致力于推动AI技术在设计领域的应用，为用户提供高质量的图像和视频编辑服务。

Funy AI

Funy AI是一个全能的AI创意工具平台，包括人脸交换、AI视频生成、AI艺术生成等功能。其主要优点是易于使用、高精度、节省时间、多功能性、免费使用。Funy AI的定位是为所有人提供高质量的创意内容创作工具。

bestcoloringpages

Bestcoloringpages

Best Coloring Pages提供AI生成的着色页面，覆盖了简单轮廓图案供幼儿使用，可爱和酷炫的图案适合儿童，复杂的图案适合青少年和成人缓解压力。这个网站提供高质量的PDF下载，同时支持照片和文本转换成着色页面。

Face Swap Free

FaceswapFree是一款免费的AI人脸交换工具，使用强大的AI技术快速、准确地交换面孔。该工具的主要优点在于免费、无需注册，支持多种媒体格式，快速处理并提供高质量的交换结果。

Juy Ai

AI图像放大器和照片增强器利用先进的人工智能技术自动改善图片质量，修复模糊和噪点，增强细节，是一个免费在线工具。

AICartoonGenerator.org

Aicartoongenerator.org

AI Cartoon Generator 是一款基于先进人工智能技术的在线工具，能够将普通照片快速转化为各种风格的卡通形象。其核心技术依赖于深度学习算法，能够精准识别照片中的面部特征和表情，并将其转化为具有艺术感的卡通图像。该工具的主要优点包括操作简单、速度快、支持多种风格，并且能够生成高分辨率的图像，适合社交媒体、个人头像或商业用途。产品目前提供免费版本，同时也有付费高级功能，定位为面向普通用户和创意工作者的图像生成工具。

M2RAG

M2RAG是一个用于多模态上下文中的检索增强生成的基准测试代码库。它通过多模态检索文档来回答问题，评估多模态大语言模型（MLLMs）在利用多模态上下文知识方面的能力。该模型在图像描述、多模态问答、事实验证和图像重排等任务上进行了评估，旨在提升模型在多模态上下文学习中的有效性。M2RAG为研究人员提供了一个标准化的测试平台，有助于推动多模态语言模型的发展。

Magma-8B

Magma-8B 是微软开发的一款多模态 AI 基础模型，专为研究多模态 AI 代理而设计。它结合了文本和图像输入，能够生成文本输出，并具备视觉规划和代理能力。该模型使用了 Meta LLaMA-3 作为语言模型骨干，并结合 CLIP-ConvNeXt-XXLarge 视觉编码器，支持从无标签视频数据中学习时空关系，具有强大的泛化能力和多任务适应性。Magma-8B 在多模态任务中表现出色，特别是在空间理解和推理方面。它为多模态 AI 研究提供了强大的工具，推动了虚拟和现实环境中复杂交互的研究。

Album AI

Album AI是一个实验性项目，它使用gpt-4o-mini作为视觉模型，自动识别相册中图像文件的元数据，并利用RAG技术实现与相册的对话。它既可以作为传统相册使用，也可以作为图像知识库，辅助大型语言模型进行内容生成。

AI图像检测识别

Imajinn AI

Imajinn AI是一款使用最新的人工智能技术将您的照片和图像转化为令人惊叹的艺术作品的工具。您可以使用Imajinn AI生成任何人或任何地方的惊人图像，包括个人资料图片、产品图片、品牌和样式。您甚至可以通过Imajinn AI进行自定义AI模型的微调，以生成与众不同的图像。

Imagen 3 by Google

Imagen 3 By Google

Imagen 3是我们质量最高的文本到图像模型，能够生成具有更好细节、更丰富光照和更少干扰性伪影的图像。Imagen 3通过改进文本理解能力，可以生成多种视觉风格的图像，并捕捉长文本提示中的小细节。Imagen 3可用于生成快速草图到高分辨率图像等不同类型任务，并提供多个优化版本。

Viva

Viva 是一个免费的 AI 生成工具和社区，提供 Text-to-Image、Image-to-Image、Text-to-Video、Image-to-Video 等功能，以及强大的 AI 编辑工具。用户可以扩展图像、重新绘制任何内容，使图像和视频更加高质量和 4K。Viva 使 AI 创作更简单、高效。海外产品 viva 发布了首个开放给全部用户使用的 Sora 同架构视频生成模型，而且现阶段免费。文生视频单次可以生成一条 5 秒的视频，图生视频是 4 秒视频目前运动幅度最大的视频生成模型，同时图像分辨率也是现在可以用的视频生成产品中最大的。文生视频的效果比图生视频要更好，同时如果要是用的话建议把运动幅度调到 20 左右比较合适。 viva 优势领域就是可以生成比较好的竖屏视频，目前很多视频模型的演示都是横屏视频，竖屏的表现并不好，但是短视频又是视频内容的大头，所以竖屏视频的生成质量是个很重要的指标。但是一致性有一部分测试中保持的不是很好，同时没有表现出 Sora 那样强大的物理特性模拟以及 3D 一致性。

Pet Prints AI

Pet Prints AI是一个可以将您宠物的照片转化为艺术作品的在线服务。它使用AI技术生成真实逼真的宠物图像，并提供多种风格供选择。您可以从现有的照片中选择，无需花费昂贵的摄影师费用。Pet Prints AI提供高质量的打印品，让您的宠物成为永恒的杰作。

image Upscaling

Image Upscaling

Image Upscale是一个提供图像放大、文本转图像、压缩和格式转换功能的AI工具。它可以提高工作效率，轻松创建令人惊叹的视觉效果。

CartoonGen

CartoonGen是一个AI卡通生成器，可以通过上传图像或输入文本描述来生成独特的卡通图片。它提供高质量的卡通图片，并且非常简单易用。

Ilus AI

Ilus AI是一款AI插画生成器，可以帮助用户快速生成美丽、风格一致的插画作品。它采用先进的人工智能技术，可以自动绘制出逼真的插画作品。该产品的主要优点包括：1. 快速生成插画作品，节省时间和精力；2. 风格一致，可以保持整体的视觉统一性；3. 提供多种预设模型和样式选择，满足不同的创作需求；4. 支持用户自定义训练和优化，可以生成符合特定风格的插画作品；5. 导出插画作品的多种格式，方便在不同平台上使用。

Stream of Consciousness

Stream Of Consciousness

Stream of Consciousness是一个记录并分享艺术家思维的项目，通过创作和分享图像来展示创造力。它提供了一个深入艺术家思维的窗口，让人们了解艺术创作的过程和灵感的来源。

Illusion Diffusion Web

Illusion Diffusion Web

Illusion Diffusion是一款免费创新的AI工具，通过Stable Diffusion和Controlnet AI模型，将普通照片转化为艺术品，提供文本提示来生成视觉错觉和超现实图像。

Rixai AI

Rixai AI使用先进的人工智能技术，将文字转化为图片，帮助您可视化想法。它使用深度学习技术如GANs或VAEs基于您的输入生成图片。

easywithai.com

Easy With AI是一个拥有互联网上最大的AI工具和资源收藏的平台。您可以在50多个不同的类别中查找和搜索AI工具。Easy With AI为各种用户提供了便利和丰富的AI工具资源，包括AI写作助手、社交媒体工具、电子邮件工具、AI内容检测工具、客户服务工具、网站建设工具、电子商务工具、图像工具、音频工具、视频工具、音乐生成器、视频生成器、播客工具、演示制作工具、设计工具、直播工具、聊天机器人、语音工具、移动应用、转录工具、会议助手、建筑工具、生产力工具、教育工具、AI Chrome扩展和更多。您可以根据您的需求和兴趣，在Easy With AI上找到适合您的AI工具。

swinir

SwinIR 是一款基于 Swin Transformer 进行图像恢复的官方 PyTorch 实现，在经典、轻量级和真实世界图像超分辨率、灰度 / 彩色图像去噪以及 JPEG 压缩伪影去除等任务中取得了最先进的性能。它由浅层特征提取、深层特征提取和高质量图像重建组成，具有卓越的性能和参数优化。

PS2 Filter AI | Photo To PS2 Filter

PS2 Filter AI | Photo To PS2 Filter

PS2 Filter AI将经典的PlayStation 2美学带入您的照片和影片中，通过模仿PS2游戏的视觉风格和图形，为您的内容赋予懷舊、復古的遊戲外观。PS2 Filter AI具有易于使用的界面，支持即时转换，与各种文件格式和设备兼容。免费版和高级版可供选择。

Bookmarks Ninja

Bookmarks Ninja

Image Search是一个在线图像搜索工具，您可以通过上传图像进行搜索。它具有快速高效的搜索引擎和准确的搜索结果。无论您想要找到相似的图片、识别图片中的物体，还是查找特定主题的图片，Image Search都可以帮助您。

SV3D Online

SV3D Online是一款稳定的在线3D视频合成工具，能够将单个图像转化为引人入胜的3D视角和网格。

GoEnhance

GoEnhance AI 是一个视频到视频、图像增强和升级的平台。它可以将您的视频转换为多种不同风格的动画，包括像素和扁平动漫。通过 AI 技术，它能够将图像增强并升级到极致的细节。无论是个人创作还是商业应用，GoEnhance AI 都能为您提供强大的图像和视频编辑工具。

Claude 3 Haiku

Claude 3 Haiku是Anthropic公司最新推出的企业级AI模型。它拥有业界领先的视觉能力和卓越的基准测试表现,是广泛企业应用场景的灵活解决方案。该模型现可通过Claude API和claude.ai网站的Claude Pro订阅获取。速度是企业用户急需解决的痛点,他们需要快速分析大量数据并及时生成输出,比如客户支持任务。Claude 3 Haiku的处理速度是同等水平模型的3倍,对于32K以下token的提示可处理21K token(约30页)每秒。它还能生成迅速的输出,为响应灵敏、体验流畅的聊天交互和并行执行多个小任务提供支持。Haiku的定价模式(输入输出token比率1:5)是针对通常需要较长提示的企业工作负载而设计的。企业可依赖Haiku以一半的成本快速分析大量文档,如季度报告、合同或法律案例。例如,Claude 3 Haiku只需1美元就能处理和分析400个最高法院案例或2500张图像。除了速度和经济实惠,Claude 3 Haiku还注重企业级的安全性和稳健性。我们进行严格测试以降低有害输出和模型逃逸的可能性,确保模型尽可能安全。其他防护层包括持续系统监控、终端加固、安全编码实践、强数据加密协议和严格的访问控制等。我们还定期进行安全审计,与经验丰富的渗透测试人员合作,主动识别和解决漏洞。更多相关措施信息可查阅Claude 3的模型卡。

Masked Diffusion Transformer (MDT)

Masked Diffusion Transformer (MDT)

MDT通过引入掩码潜在模型方案来显式增强扩散概率模型（DPMs）在图像中对象部分之间关系学习的能力。MDT在训练期间在潜在空间中操作，掩蔽某些标记，然后设计一个不对称的扩散变换器来从未掩蔽的标记中预测掩蔽的标记，同时保持扩散生成过程。MDTv2进一步通过更有效的宏网络结构和训练策略提高了MDT的性能。

精选AI产品推荐

NoCode

NoCode 是一款无需编程经验的平台，允许用户通过自然语言描述创意并快速生成应用，旨在降低开发门槛，让更多人能实现他们的创意。该平台提供实时预览和一键部署功能，非常适合非技术背景的用户，帮助他们将想法转化为现实。

ListenHub

ListenHub 是一款轻量级的 AI 播客生成工具，支持中文和英语，基于前沿 AI 技术，能够快速生成用户感兴趣的播客内容。其主要优点包括自然对话和超真实人声效果，使得用户能够随时随地享受高品质的听觉体验。ListenHub 不仅提升了内容生成的速度，还兼容移动端，便于用户在不同场合使用。产品定位为高效的信息获取工具，适合广泛的听众需求。

Lovart

Lovart 是一款革命性的 AI 设计代理，能够将创意提示转化为艺术作品，支持从故事板到品牌视觉的多种设计需求。其重要性在于打破传统设计流程，节省时间并提升创意灵感。Lovart 当前处于测试阶段，用户可加入等候名单，随时体验设计的乐趣。

FastVLM

FastVLM 是一种高效的视觉编码模型，专为视觉语言模型设计。它通过创新的 FastViTHD 混合视觉编码器，减少了高分辨率图像的编码时间和输出的 token 数量，使得模型在速度和精度上表现出色。FastVLM 的主要定位是为开发者提供强大的视觉语言处理能力，适用于各种应用场景，尤其在需要快速响应的移动设备上表现优异。

Smart PDFs

Smart PDFs 是一个在线工具，利用 AI 技术快速分析 PDF 文档，并生成简明扼要的总结。它适合需要快速获取文档要点的用户，如学生、研究人员和商务人士。该工具使用 Llama 3.3 模型，支持多种语言，是提高工作效率的理想选择，完全免费使用。

KeySync

KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。它解决了传统唇同步技术中的时间一致性问题，同时通过巧妙的遮罩策略处理表情泄漏和面部遮挡。KeySync 的优越性体现在其在唇重建和跨同步方面的先进成果，适用于自动配音等实际应用场景。

AnyVoice

AnyVoice是一款领先的AI声音生成器，采用先进的深度学习模型，将文本转换为与人类无法区分的自然语音。其主要优点包括超真实的声音效果、多语言支持、快速生成能力以及语音定制功能。该产品适用于多种场景，如内容创作、教育、商业和娱乐制作等，旨在为用户提供高效、便捷的语音生成解决方案。目前产品提供免费试用，适合不同层次的用户。

LiblibAI

LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase