ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 情報基礎とアクセス技術(IFAT)
  3. 2012
  4. 2012-IFAT-105

キーワードの表記揺れを含む大規模記事データベースからの代表キーワード集合選択方式

https://ipsj.ixsq.nii.ac.jp/records/80107
https://ipsj.ixsq.nii.ac.jp/records/80107
fad4d33d-d17a-4edc-a5f1-8d10534e298d
名前 / ファイル ライセンス アクション
IPSJ-IFAT12105009.pdf IPSJ-IFAT12105009.pdf (1.0 MB)
Copyright (c) 2012 by the Information Processing Society of Japan
オープンアクセス
Item type SIG Technical Reports(1)
公開日 2012-01-13
タイトル
タイトル キーワードの表記揺れを含む大規模記事データベースからの代表キーワード集合選択方式
タイトル
言語 en
タイトル Main Keywords Set Selection Method from Orthographical Variants of Large Article Database
言語
言語 jpn
キーワード
主題Scheme Other
主題 言い換え・応用
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
九州大学
著者所属
九州大学
著者所属(英)
en
Kyushu University
著者所属(英)
en
Kyushu University
著者名 川端, 健士 金子, 邦彦

× 川端, 健士 金子, 邦彦

川端, 健士
金子, 邦彦

Search repository
著者名(英) Kenji, Kawabata Kunihiko, Kaneko

× Kenji, Kawabata Kunihiko, Kaneko

en Kenji, Kawabata
Kunihiko, Kaneko

Search repository
論文抄録
内容記述タイプ Other
内容記述 記事データベースからキーワード抽出をし、代表キーワードの選定を行ってキーワード辞書を独自に作成することによって大規模な記事集合の中から必要な情報へとたどり着くことを実現したい.今回は投稿型のWEB上の魚類図鑑であるWEB魚図鑑の4668件の記事からキーワード辞書の作成を行った。MeCabを用いて名詞を抽出し、重複を除去して9545語の名詞が得られた。その中には表記ゆれを含むキーワードが154語確認できた.これらの表記ゆれから一語の代表キーワードを決定するために独自のフローチャートを組んで、代表キーワードが決定できるようにフィルタを考案した。また、各キーワードの特徴量を論理値と数値で表現した表を作成し、表記ゆれを含むキーワードからの代表キーワードを決定するフローチャートが“True”、“False”の2値表現を7項目と数値3項目を用いることで動作することを確認した.こうして名詞全体からWEB魚図鑑におけるキーワードとして4946語を選ぶことができた.
論文抄録(英)
内容記述タイプ Other
内容記述 We would like to accomplish to get a requiring article from large article database by using keyword dictionary which extracted from the article database. In this paper, we made a keyword dictionary of WEB Fish Encyclopedia which is composed by many contributors and has4668 files. We operated MeCab to get only nouns, and removed duplicate nouns. We obtained 9545 nouns from WEB Fish Encyclopedia. In these files, we found 154 words of orthographical variants. We designed some filters to establish our own flowchart to extract one representation. We also checked that we can run the flowchart by expressing orthographical variants with “True” or “False” for 7 items and numbers for 3items. We selected 4946 keywords from WEB fish Encyclopedia which contains 4668 text files.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10114171
書誌情報 研究報告情報基礎とアクセス技術(IFAT)

巻 2012-IFAT-105, 号 9, p. 1-5, 発行日 2012-01-13
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-21 19:57:30.394372
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3