プロンプトを超えて:分布外の3D形状に対する無条件逆変換
Beyond Prompts: Unconditional 3D Inversion for Out-of-Distribution Shapes
要約
テキスト駆動の生成モデル逆変換は、3Dコンテンツ操作の中核的なパラダイムですが、テキストプロンプトへの感度低下という課題があります。本論文は、最先端のテキスト・ツー・3D生成モデルにおいて、生成過程が”sink traps”と呼ばれる領域に陥り、プロンプト修正に対して鈍感になる現象を報告します。これはモデルの幾何学的表現能力の限界ではなく、分布外テキスト誘導に対する感度の問題であることを示唆しています。著者らは生成軌跡の分析を通じ、モデルの無条件生成先行情報(unconditional generative prior)を活用することで、複雑な幾何形状を生成可能であることを発見しました。提案手法はlatent sinkを回避し、幾何学的表現力と言語感度を分離することで、分布外の3D形状に対する堅牢なテキストベース編集を実現するとしています。