@techreport{oai:ipsj.ixsq.nii.ac.jp:00241653, author = {江原, 遥}, issue = {33}, month = {Dec}, note = {リーダビリティ,語/文の難度,Common European Framework of Reference for Languages (CEFR) レベルなど自然言語処理の教育応用にとって重要な尺度は,難度やレベルなどの順序尺度でアノテートされる.教育応用のため,語や文の埋め込みベクトルを特徴量として難度予測等を行う手法は多く提案されている.しかし,様々な埋め込みベクトル空間がある中で,扱いたい難度アノテーションに適したものを見つけることは難しい.難度アノテーションと埋め込みベクトル空間の親和性を測るため,本研究では,埋め込みベクトル空間と難度アノテーションの集合の間に数学的な「互換性」という新しい概念を提案する.互換性は,直感的には,「埋め込み空間上の語/文が,アノテートされた難しさの順序通りに並んで見える方向が埋め込み空間上に存在する」事を表す.互換性と埋め込み空間の次元や難度アノテーション集合の個数の関係性を示す.また,非互換な場合でも,定量的な「非互換度合い」を最適化問題として定式化し現実的な時間で一意的に計算できること,非互換度合いを最も小さくするような方向を用いて埋め込み空間に沿わないアノテーションを抽出することが可能であることを示す.さらに,この非互換度合いを求める問題は適切な条件のもとでは,埋め込み空間内に「最も簡単な点」と解釈できる点の存在を仮定し,その座標を求める問題と等価であることも示す.実験により,提案手法が,アノテーションに適した埋め込み空間の選択,埋め込み空間に沿わないアノテーションの特定などに利用できること,また,「最も簡単な点」の座標から逆テキスト生成を用いて例を生成するなど,教育の基礎・応用に関わる様々な目的で有用であることを示す.}, title = {埋め込みベクトル空間と難度アノテーションの互換性定理}, year = {2024} }