ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. シンポジウム
  2. シンポジウムシリーズ
  3. じんもんこんシンポジウム
  4. 2016

文字単位の多対多自動アライメントを用いた日本語歴史コーパスのルビアノテーションの自動修正

https://ipsj.ixsq.nii.ac.jp/records/176231
https://ipsj.ixsq.nii.ac.jp/records/176231
14cc3d3d-cdf0-478e-8a6f-ed48b8e973e5
名前 / ファイル ライセンス アクション
IPSJ-CH2016020.pdf IPSJ-CH2016020.pdf (456.3 kB)
Copyright (c) 2016 by the Information Processing Society of Japan
オープンアクセス
Item type Symposium(1)
公開日 2016-12-02
タイトル
タイトル 文字単位の多対多自動アライメントを用いた日本語歴史コーパスのルビアノテーションの自動修正
タイトル
言語 en
タイトル Automatic Modification for Information of Ruby in Corpus of Historical Japanese using an Automatic many-to-many Character Alignment
言語
言語 jpn
キーワード
主題Scheme Other
主題 日本語学,コーパス,通時コーパス,日本語歴史コーパス,ルビ,自然言語処理,アライメント
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
国立国語研究所 コーパス開発センター
著者所属(英)
en
Center for Corpus Development, National Institute for Japanese Language and Linguistics
著者名 岡, 照晃

× 岡, 照晃

岡, 照晃

Search repository
著者名(英) Terauaki, Oka

× Terauaki, Oka

en Terauaki, Oka

Search repository
論文抄録
内容記述タイプ Other
内容記述 本論文では,国立国語研究所で整備している日本語歴史コーパスのルビアノテーション修正について述べる.現在のルビのアノテーションは国語研の規定する言語単位である短単位との整合がとれておらず,コーパス検索に不便である.そこで文字単位の多対多自動アライメント手法を使用し,ルビアノテーションをモノルビに修正する手法を提案する.この手法により,97.4%という高い正解率でルビアノテーションの修正が行えることが分かった.またこのアライメントのスコアを利用することで79%の適合率で近世の口語資料から当て字ルビの50%を検出できることができることが分かった.
論文抄録(英)
内容記述タイプ Other
内容記述 In this paper, we describe modification of annotations of ruby in Corpus of Historical Japanese, that is creating in National Institute for Japanese Language and Linguistics. Since the annotations are not corresponding with annotations of Short Unit Word unit, current ruby annotations are inconvenience for retrieving the corpus. Therefore, we introduce automatic many-to-many character aliment technique to modify the ruby annotations into mono-ruby annotations. By using this method, we achieved 97.4% of automatic modification accuracy. Furthermore, we confirm that we can discriminate “Ateji” rubes from rubes in historical documents written in spoken language of Edo era by utilizing the alignment scores.
書誌情報 じんもんこん2016論文集

巻 2016, p. 133-138, 発行日 2016-12-02
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-20 05:56:59.486806
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3