@inproceedings{oai:ipsj.ixsq.nii.ac.jp:00220065, author = {関根, 理敏 and 新原, 敦介 and 明神, 智之 and 今谷, 恵理}, book = {ソフトウェアエンジニアリングシンポジウム2022論文集}, month = {Aug}, note = {一般にAIのモデルの品質は利用するデータに依存するため,データの品質評価手法の確立することが重要である.データ品質を定量的に評価するため,誤判別等のリスクの要因となるデータの様々な属性情報を抽出し,評価することが必要である.そこで本稿では,あるデータに対して複数の観点で特徴抽出が可能な手法である多面的クラスタリング変分オートエンコーダ(Multi-Facet Clustering Variational Autoencoders(MFCVAE))を利用して,帳票の手書き文字データセットの品質評価を行った.その結果,MFCVAEのモデルから得られた特徴量を利用することで,文字の種別だけでなく,文字の太さやノイズの有無等に依存した特徴量を分析することが可能で,多種多様な属性情報の抽出や,属性情報に対応する類似データの取得に有力な手法であることが分かった.今後の課題として,ユーザがより解釈しやすい特徴量の抽出方法の確立や,現場での適用・評価に向けたツール化等が挙げられる.}, pages = {145--146}, publisher = {情報処理学会}, title = {データセットの多種多様な属性情報抽出に向けた多面的クラスタリング変分オートエンコーダの手書き文字データへの適用}, volume = {2022}, year = {2022} }