WEKO3
アイテム
再現性を考慮した文字列に基づく統計的言語モデル
https://ipsj.ixsq.nii.ac.jp/records/57732
https://ipsj.ixsq.nii.ac.jp/records/57732415ed6b3-3f2f-4db2-a84d-4ec43a93d739
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1997 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1997-12-11 | |||||||
タイトル | ||||||||
タイトル | 再現性を考慮した文字列に基づく統計的言語モデル | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Natural Language Models Based on Repetitional String | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東北大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
東北大学大学院工学研究科 | ||||||||
著者所属 | ||||||||
東北大学大型計算機センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Tohoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Engineering, Tohoku University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Computer Center, Tohoku University | ||||||||
著者名 |
森, 大毅
× 森, 大毅
|
|||||||
著者名(英) |
Hiroki, Mori
× Hiroki, Mori
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本報告では,知識に依存しない,高い曖昧性削減能力を持つ新しい言語モデルを提案する.このモデルは superwordと呼ぶ文字列の集合の上の n?gramとして定義され,従来の単語や文字列の n?gramモデルを包含するものになっている.superwordは訓練テキスト中の文字列の再現性のみに基づいて定義される概念であり,Forward?Backwardアルゴリズムによって学習される.実験の結果,superwordに基づくモデルと文字のtrigramモデルを複数融合させたモデルの優位性が示され,形態素解析に基づく方法を上回る性能が得られた. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this report, a new, knowledge-free language model with great ability in reducing ambiguity. This model is defined as n-gram of string which is referred to "superword," and belongs to a superclass of traditional word or string n-gram models' class. The concept of superword is based on only one principle-repetitionality in training text. The probabilistic distribution of the model is learned through the forward-backward algorithm. Experimental results showed that the performance of superword model combined with character trigram model was superior to the traditional word model based on morphological analysis. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1997, 号 120(1997-SLP-019), p. 81-86, 発行日 1997-12-11 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |