WEKO3
アイテム
未知語を考慮した形態素解析のための単語ラティスの効率的な生成方法
https://ipsj.ixsq.nii.ac.jp/records/92284
https://ipsj.ixsq.nii.ac.jp/records/9228477149811-bc74-4310-8e78-811f80b9cab7
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2013 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2013-05-16 | |||||||
タイトル | ||||||||
タイトル | 未知語を考慮した形態素解析のための単語ラティスの効率的な生成方法 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 解析・テキスト処理 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学生産技術研究所 | ||||||||
著者所属 | ||||||||
東京大学生産技術研究所 | ||||||||
著者名 |
鍜治伸裕
× 鍜治伸裕
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 現在,形態素解析処理を実現するための手法として,単語ラティス上の経路の再順位付けにもとづくものが広く用いられている.しかし,この枠組みにおいて未知語を考慮した形態素解析を行う場合,入力文長に対して 2 乗のオーダの計算量が単語ラティスの生成に必要となってしまう.そのため,何らかの方法で,これを高速化することが実用上重要となる.本論文では,単語ラティス生成のために従来提案されていた枝刈りアルゴリズムは十分に効率的ではないこと,および,我々が考案した段階的アルゴリズムによって形態素解析処理がおよそ 10 倍高速化されることを示す.さらに,段階的アルゴリズムが生成する単語ラティスの大きさについて理論的な考察を行い,その妥当性を実験によって明らかにする. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2013-NL-211, 号 12, p. 1-8, 発行日 2013-05-16 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |