Item type |
Symposium(1) |
公開日 |
2015-12-12 |
タイトル |
|
|
タイトル |
異なる文体の混在するテキストに対する複数辞書切り替えによる解析手法の提案 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Proposal for a Morphological Analysis of Texts Mixing Different Styles by Selecting between Multiple Dictionaries |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
人間文化研究機構 国立国語研究所 |
著者所属(英) |
|
|
|
en |
|
|
National Institute for Japanese Language and Linguistics |
著者名 |
間淵, 洋子
小木曽, 智信
|
著者名(英) |
Yoko, MABUCHI
Toshinobu, OGISO
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
国立国語研究所では現在,形態論情報を付与した『太陽コーパス』を構築している.文語から口語への文体移行期に刊行された総合雑誌『太陽』には,文語と口語という性質の大きく異なる複数の文体が混在する文章が多く含まれるため,文語文用解析辞書と旧仮名遣いの口語文用解析辞書のいずれかを指定して用いる従来の形態素解析手法では,精度を保つことが困難である.そこで,本コーパスの構築にあたっては,テキストが有する文体情報を利用し,複数の辞書を切り替えて,部分ごとに適応する辞書によって解析する手法を試みた.この手法の有用性を確認するため,評価用のデータを作成し,従来手法との解析精度を比較した結果,提案する複数辞書切り替え手法によって,解析精度が向上することを確認できた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
The National Institute for Japanese Language and Linguistics is presently constructing the morphologically annotated ‘Taiyo Corpus’. In contrast with many other historical Japanese corpora, this corpus includes many texts mixing two different writing styles: classical and colloquial. For the construction of this corpus we propose a new morphological analysis method using multiple dictionaries. By the proposed method, we select and apply the dictionary appropriate to the writing style in every text block. Comparison shows that the precision of the proposed analysis exceeds that of previous analyses. |
書誌情報 |
じんもんこん2015論文集
巻 2015,
p. 125-130,
発行日 2015-12-12
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |