WEKO3
アイテム
議会会議録に含まれる法律名の表記揺れ問題解決に向けたエンティティリンキングの試み
https://ipsj.ixsq.nii.ac.jp/records/198846
https://ipsj.ixsq.nii.ac.jp/records/198846140d77c6-73a0-42ae-98a0-b4d0d76e4071
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2019 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2019-08-22 | |||||||||||
タイトル | ||||||||||||
タイトル | 議会会議録に含まれる法律名の表記揺れ問題解決に向けたエンティティリンキングの試み | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
北海道大学大学院情報科学院 | ||||||||||||
著者所属 | ||||||||||||
小樽商科大学 | ||||||||||||
著者所属 | ||||||||||||
北海道大学大学院情報科学研究院 | ||||||||||||
著者名 |
桧森, 拓真
× 桧森, 拓真
× 木村, 泰知
× 荒木, 健治
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 国会では,委員会や本会議において法律案に関する議論が行われている.数多くの議員が法律案の名称を何度も発言することから,法律案の名称は,省略されることや異なる表現で呼ばれることがあり,同一の法律案を示しているのかを判断することが困難な場合がある.例えば,「働き方改革法案」 には 「働き方改革関連法」 「働き方改革一括法」 などの表記揺れが存在する.そこで,本研究では,議会会議録に含まれる法律名の表記揺れの問題を解決するために,エンティティリンキングを行う.実験では,辞書ベース,Wikipedia2Vec をベースラインとし,提案手法との比較を行う.提案手法では,ベースラインである Wikipedia2Vec に加え,メンションの各候補エンティティと,メンションを含む一文の分散表現とのコサイン類似度,メンションとエンティティの文字列の差分の LenghScore,メンションとエンティティの間で一致している文字数に応じた Penalty に基づきスコアを算出し,最もスコアの高いエンティティを出力する.実験の結果,国会データでは,提案手法が F 値において 0.713 を示し,0.198 ポイントベースラインを上回り,地方議会会議録データでは,F 値において 0.719 を示し,0.030 ポイントベースラインを上回る結果となった. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10115061 | |||||||||||
書誌情報 |
研究報告自然言語処理(NL) 巻 2019-NL-241, 号 5, p. 1-8, 発行日 2019-08-22 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8779 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |