@techreport{oai:ipsj.ixsq.nii.ac.jp:00225994, author = {孫, 卓凡 and 堀田, 大地 and 池畑, 諭 and 相澤, 清晴 and Zhuofan, Sun and Daichi, Horita and Satoshi, Ikehata and Kiyoharu, Aizawa}, issue = {50}, month = {May}, note = {近年,テキストから 3 次元オブジェクトを生成するフレームワーク (Text-to-3D) が提案されている.Text-to-3D は画像生成と異なり,モデルの訓練に使えるキャブション付き 3 次元データが限られている.そのため,最近の text-to-3D アプローチでは,事前に学習された画像生成用拡散モデルや CLIP を用いて,3 次元シーンからレンダリングされた画像に基づいて 3 次元シーンを最適化するフレームワークが主流である.既存の text-to-3D 手法では,3 次元シーンが Neural Radiance Fields (NeRF) で表され,NeRF を最適化することで,テキストからの 3D オブジェクトの生成が実現できる.しかし,これらの NeRF をベースにした手法による生成結果のメッシュを抽出して観測すると,凸凹のノイズがメッシュの表面に現れることが多い.その結果,下流アプリケーションに導入した場合,品質の低下につながる.本研究ではこの問題を解決するために,3 次元シーンの表面再構成によく用いられる 3 次元表現である符号付き距離場(SDF)を既存の text-to-3D フレームワークに取り組んで,その効果を検証した. 拡散モデルによるガイダンスと CLIP によるガイダンスの両方の場合において,生成結果に基づく定性評価及びユーザスタディによる定量評価を行い,ニューラル符号付き距離場による 3 次元シーン表現を導入することで,従来の NeRF ベースアプローチと比べてより滑らかな表面をもつメッシュ生成結果が得られることを実証した.}, title = {符号付き距離場を用いた滑らかな表面をもつText-to-3D生成}, year = {2023} }