@techreport{oai:ipsj.ixsq.nii.ac.jp:02007745, author = {島田,真緒 and 木山,朔 and 凌,志棟 and 小町,守 and 小木曽,智信 and 高村,大也 and 持橋,大地}, issue = {19}, month = {Feb}, note = {本研究では、KWICによって検索された対象単語の文脈表現を変換する関数を学習し、事前学習済み言語モデルに基づく動的単語埋め込みを近似して分析する手法を提案する。KWIC (Keyword-in-Context)とは、コーパス内において指定したキーワードとその前後の文脈を固定長で局所的に取り出す文脈付きの索引の形式であり、言語学的分析において広く用いられている。しかし、実応用上の場面においては、大量のKWIC用例の全容を解釈することは困難である。そこで本研究では、検索されたKWIC用例から単語埋め込みを動的に計算し、埋め込み空間上でKWICを可視化することにより、解釈性を向上することを目的とする。変換関数の学習時には、入力としてKWIC形式で取得した文脈単語列を用い、事前学習済みの静的単語埋め込みで符号化した上で、出現順に連結した表現を採用する。これらの埋め込み表現を変換関数に入力し、正解として与えた事前学習済み言語モデルを近似する単語埋め込みを出力する。評価実験では、複数の対象単語に対してその語の出現文脈をKWIC形式で取得し、本手法を適用した。得られた動的単語埋め込みに基づき、辞書により定義された語義数をクラスタ数として設定して可視化を行い、BERTによる単語埋め込みとの一致度を定量的に評価した。実験の結果、本手法は計算効率と実用性に優れており、KWIC形式に対応した動的単語埋め込みが高速に得られることを示した。また、埋め込み空間上での可視化を通じて、大量のKWIC用例に対する解釈性を高められることを示した。}, title = {Neural KWIC:KWIC形式用例からの動的単語埋め込みの獲得と分析}, year = {2026} }