DiffPortrait3D
D
Diffportrait3d
紹介 :
DiffPortrait3Dは、条件付き拡散モデルです。野外で撮影された一枚の人物写真のみを用いても、リアルで3D整合性のある新たな視点の画像を合成できます。具体的には、一枚のRGB入力画像を与えると、新たなカメラ視点からレンダリングされた、自然で本物らしい顔のディテールを合成することを目標としつつ、同時に、人物のアイデンティティと表情を維持します。本手法は、ポーズの異なるカメラ視点、極端な表情、様々な画風など、あらゆる人物写真に良好に適用できます。その核心においては、大規模画像データセットで事前学習された2D拡散モデルの生成能力を、レンダリングのバックボーンとして活用し、外観とカメラ姿勢を分離した、指向性のあるアテンション制御によってノイズ除去を導きます。そのため、まず、参照画像から、凍結したUNetのセルフアテンション層に外観コンテキストを注入します。次に、新たな条件制御モジュールによってレンダリングビューを操作します。このモジュールは、同一視点のクロスサブジェクト条件画像を見ることで、カメラ姿勢を解釈します。さらに、学習可能なクロスビューアテンションモジュールを挿入することでビューの一貫性を強化し、推論時に新たな3D感知ノイズ生成プロセスを用いることで、その一貫性をさらに高めます。我々は、困難な野外および多視点ベンチマークにおいて、最先端の結果を定性的、定量的に示しました。
ターゲットユーザー :
["人物画像の修復と編集","人物画像の新たな視点合成","人物アニメーション制作"]
総訪問数: 502.6M
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 66.0K
使用シナリオ
正面顔の写真から横顔の画像を合成する
笑顔の正面顔から、大笑いしている横顔の画像を合成する
スケッチ画像からリアルな3Dの新たな視点画像を合成する
製品特徴
一枚の写真から新たな視点画像を合成する
アイデンティティと表情情報を維持する
野外で撮影された一枚の人物写真に対応
極端な表情と様々な絵画様式に対応
事前学習済みの2D拡散モデルをバックボーンとして使用
外観コンテキストを注入してノイズ除去を導く
条件制御モジュールを使用してレンダリングビューを操作する
学習可能なクロスビューアテンションモジュールを追加
3D感知ノイズ生成によって一貫性を強化する
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase