WEKO3
アイテム
WWW 検索エンジンを用いた質問文内の用語特定手法
https://ipsj.ixsq.nii.ac.jp/records/47811
https://ipsj.ixsq.nii.ac.jp/records/47811ab917b12-21bd-479a-8a23-c276330deea4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-07-25 | |||||||
タイトル | ||||||||
タイトル | WWW 検索エンジンを用いた質問文内の用語特定手法 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | A method to specify terms in a question sentence by WWW search engine | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
徳島大学大学院先端技術科学教育部システム創生工学専攻 | ||||||||
著者所属 | ||||||||
徳島大学大学院ソシオテクノサイエンス研究部 | ||||||||
著者所属 | ||||||||
徳島大学高度情報化基盤センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
College of Systems Innovation Engineering, Systems Innovation Engineering, Graduate School of Advanced Technology and Science, The University of Tokushima | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Institute of Technology and Science, The University of Tokushima | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Center for Advanced Information Technology, The University of Tokushima | ||||||||
著者名 |
北條, 奈緒美
× 北條, 奈緒美
|
|||||||
著者名(英) |
Naomi, HOJO
× Naomi, HOJO
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年、ユーザが入力した質問文に対して大量の知識源から回答を得る質問応答システムの研究が注目されている。特に、インターネットの普及により、Google に代表されるWWW 検索エンジンを用いて、WWW 空間から回答を探す技術が研究されている。これらのシステムでは、質問文内から抽出されたキーワードを WWW 検索エンジンに入力し、検索結果から回答を出力する。本稿では、質問文からキーワードを抽出する際に起こる、用語の過分割問題に着目し、WWW 検索エンジンを用いた質問文内の用語特定手法を提案する。本手法では、学習用質問文内の各用語に対して、WWW 検索エンジンの検索結果(サマリ)から継続度、品詞、文字種などの特徴員を抽出し、Support Vector Machine (SVM) を用いて用語判定モデルを作成する。そして、解析用質問文内の各用語候補に対しても同様の方法で特徴員を抽出した後、用語判定モデルを用いて用語を特定する。実際に、NTCIR4-QAC2 の質問文に対して用語特定を行った結果、従来手法に比べて約 55%の質問文に対して用語特定による精度向上が認められた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Recently, Question-Answer(QA) systems using the WWW search engine have been developed by the spread of the Internet technology. These systems extract keywords from the question sentence and search the answer from retrieval results obtained by keywords on the WWW search engine. In this paper, We pay attention to the overdivision of the term when keywords are extracted from the question sentence, and propose the method to specify the term in the question sentence by WWW search engine. On this method, the concatenation level that uses the summary, the part of speech, and the character kind for each term candidate are extracted as the feature. And, This method specifies terms of term candidates by Support Vector Machine(SVM). Actually, From experimental resalts using 140 question sentences of NTCIR-QAC2, it was found that the accuracy of the term specific improved compared with the conventional method. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10115061 | |||||||
書誌情報 |
情報処理学会研究報告自然言語処理(NL) 巻 2007, 号 76(2007-NL-180), p. 97-102, 発行日 2007-07-25 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |