@techreport{oai:ipsj.ixsq.nii.ac.jp:00183796,
 author = {佐久間, 仁 and 吉永, 直樹},
 issue = {14},
 month = {Oct},
 note = {異なる言語の単語を同一の意味空間に写像した多言語単語分散表現は,英語を始めとする言語資源の豊かな言語において学習した高精度の解析モデルを言語資源の乏しい言語の解析に転用するのに役に立つため注目を集めている.しかしながら,既存の多言語単語分散表現の学習手法の多くは対訳辞書や対訳コーパスなどの対訳資源を手がかりとして利用するため,適用可能な言語が制限される問題がある.そこで本研究では,異言語間の単語について,借用語や翻字,さらには語源を同じくする語などで表層に共通性が見られることを手がかりとして,単一言語コーパスのみから多言語単語分散表現を学習する方法を模索する.具体的には,出現文脈に加えて単語自身を構成する部分文字列を考慮した分散表現獲得手法を利用して,1) 個々の言語ごとに独立に学習した単語分散表現を,語の表層類似性を手がかりとして学習した直交行列で写像することで,多言語分散表現を獲得する手法と 2) 単一言語コーパスを連結して得られる複数言語コーパスから多言語単語分散表現を同時に学習する手法を提案する.実験ではこれらの手法の有用性を検証するために,同一言語内で意味的に近い語が意味空間でも近くなるとこを確認する言語内評価と,言語を越えて意味的に近い語が意味空間でも近くなることを確認する言語間評価を行った.},
 title = {単語の表層類似性を用いた多言語単語分散表現の教師なし学習手法},
 year = {2017}
}