Photomaker : 定制逼真人像照片

Photomaker

AI图像生成 AI模型 #图像生成 #个性化 #人像照片 #文本到图像普通产品开源

简介 :

PhotoMaker是一种高效的个性化文本到图像生成方法，主要将任意数量的输入ID图像编码成堆叠ID嵌入，以保留ID信息。这种嵌入作为统一的ID表示，不仅可以全面地封装相同输入ID的特征，还可以容纳不同ID的特征以供后续整合。此举为更有趣和实际有价值的应用铺平了道路。此外，为了驱动我们的PhotoMaker的训练，我们提出了一个面向ID的数据构建流水线来组装训练数据。在通过提议的流水线构建的数据集的滋养下，我们的PhotoMaker表现出比基于测试时间微调的方法更好的ID保留能力，同时提供了显著的速度改进、高质量的生成结果、强大的泛化能力和广泛的应用。

需求人群 :

用于快速创建人像照片/头像，支持个性化定制

总访问量： 29.7M

占比最多地区： US(17.94%)

本站浏览量： 2.2M

使用场景

在艺术作品、旧照片中带入现实

实现年龄或性别变化

身份混合

产品特色

将几张相同身份的输入图像转换为堆叠的ID嵌入

在推理阶段，构成堆叠ID嵌入的图像可以来自不同的ID