WEKO3
アイテム
未登録語を含む文の一解析法
https://ipsj.ixsq.nii.ac.jp/records/49648
https://ipsj.ixsq.nii.ac.jp/records/4964832f15359-442e-4fef-a4b1-d1e05fb59bd1
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1989 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1989-06-29 | |||||||
タイトル | ||||||||
タイトル | 未登録語を含む文の一解析法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A Parsing Method for Sentences with undefined words | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
日立ソフトウェアエンジニアリング株式会社 | ||||||||
著者所属 | ||||||||
日立エスケイソフトウェア株式会社 | ||||||||
著者所属 | ||||||||
日立ソフトウェアエンジニアリング株式会社 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi Software Engineering Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi SK Software Co., Ltd. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Hitachi Software Engineering Co., Ltd. | ||||||||
著者名 |
塚田, 孝則
× 塚田, 孝則
|
|||||||
著者名(英) |
Takanori, Tsukada
× Takanori, Tsukada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | データベース用の自然言語インタフェースなどのアプリケーションでは辞書に登録されていない単語(未登録語)を検索キーワードとして含む文を扱う場合がある。しかし日本語の文は分かち書きされないので英語などに比べ未登録語の位置を推定するのが難しい。本論文で述べる方式は構文解析アルゴリズムSAXで未登録語を扱えるようにするために次のような拡張を行ったものである。すなわち、まず形態素解析と構文解析を融合し、文を一文字づつ解析するようにした。次に文の解析が途中で失敗した場合にはバックトラックをして最後の文字を特別な非終端記号”補助記号”として解析し直すようにした。そして、文中のバックトラックした部分を未登録語と認識するようにした。また本方式は形態素解析、構文解析、意味解析を融合したシステムになっているため、未登録語の抽出に文法や意味知識を用いることができる。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In the applications like natural language interfaces with databeses, it is necessary to parse sentences with words not listed in the dictionary (undefined words). Since Japanese sentences are not written word-by-word, it is more difficult to locate underfined words in Japanese than in English. The method described in this paper modifies the parsing algorithm SAX in the following ways: Morphological and syntactic analysis phases are integrated together to parse character-by-character, not word-by-word. Second, when the parser fails, it backtracks and parses the last terminal as a special nonterminal "HELP". Finally, the parser recognizes the backtracked part of the sentence as an undefined word. As this method integrates all morphological, syntactic, and semantic analysis phases, it can utilizes the grammar and the semantic knowledge to recognize undefined words. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 1989, 号 54(1989-NL-073), p. 43-50, 発行日 1989-06-29 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |