WEKO3
アイテム
Webコーパスを用いた人物の呼称抽出
https://ipsj.ixsq.nii.ac.jp/records/18902
https://ipsj.ixsq.nii.ac.jp/records/1890266b25fca-ad14-49ef-a8db-f4a8eccfb8f4
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2006 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2006-07-13 | |||||||
タイトル | ||||||||
タイトル | Webコーパスを用いた人物の呼称抽出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Mnemonic Name Extraction about a Person from Web Corpus | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 | ||||||||
著者所属 | ||||||||
筑波大学大学院システム情報工学研究科 筑波大学計算機科学研究センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Systems and Information Engineering, University of Tsukuba,Center for Computional Science, University of Tsukuba | ||||||||
著者名 |
外間, 智子
北川, 博之
× 外間, 智子 北川, 博之
|
|||||||
著者名(英) |
Tomoko, Hokama
Hiroyuki, Kitagawa
× Tomoko, Hokama Hiroyuki, Kitagawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Web 掲示板やWeblog といったツールが普及するにつれ、Web は、世の中の関心を反映する新しいメディアとしても注目されるようになってきた。Web からの情報抽出・知識抽出の代表的なものに、評判情報の抽出がある。評判情報抽出のようにある特定のオブジェクト(組織、製品、人物など)に着目する場合、まずそのオブジェクトがどのように参照されているかという情報を基に、オブジェクトに関するWeb ページを収集する必要がある。ここで問題となるのが、一般的なWeb 文書では、あるオブジェクトは公的・正式な名称だけでなく様々な呼び名で参照される、という点である。本研究ではオブジェクトの正式名以外の「参照のされ方」を「呼称」と呼ぶ。例えば、人物であれば姓、名、所属と肩書の組合せ、ニックネームなどが考えられるだろう。本研究は、オブジェクトのうち「人物」に着目し、人物の呼称を抽出することを目的とする。本論文では、人物のフルネームが出現するパターンを手がかりにWeb コーパスより人物の呼称を抽出する手法を提案し、実際の人物を対象に行った評価実験について述べる。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | The web has gained much attention as new media recently due to the proliferation of tools such as bulletin boards and weblogs. Reputation information extraction is one of the major research topics in information extraction and knowledge extraction from the web. Collecting web pages about a target object is needed for reputation information extraction. A big problem for collecting web pages is that objects are refered to by various ways in general web documents. For example, a person may be refered to by the full name, the first name, affiliation and title, or nicknames. In this paper, we propose a method for extracting these mnemonic names of a person from the Web coupus and show experimental results for some people. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2006, 号 78(2006-DBS-140), p. 145-152, 発行日 2006-07-13 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |