WEKO3
アイテム
BERT-NERによるテンプレート分類とPatent-Tokenizerを用いた和文特許文章の文章生成
https://ipsj.ixsq.nii.ac.jp/records/230160
https://ipsj.ixsq.nii.ac.jp/records/2301600a1a5ac4-0e63-4413-9475-c51eb0d80c1b
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2023 by the Information Processing Society of Japan
|
Item type | National Convention(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2023-02-16 | |||||||
タイトル | ||||||||
タイトル | BERT-NERによるテンプレート分類とPatent-Tokenizerを用いた和文特許文章の文章生成 | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 人工知能と認知科学 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
資源タイプ | conference paper | |||||||
著者所属 | ||||||||
筑波大 | ||||||||
著者名 |
高根沢, 光輔
× 高根沢, 光輔
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,弁理士の特許文書作成をサポートするシステムを目指し,特許文書に含まれる頻出文章を自動的に生成する手法を提案する. 従来の汎用文章生成モデルでは特許文書に含まれる多様な未知語を上手にトークン化することができず,適切な文章を生成できないという問題点があった. 本研究では,特許文章に特化し学習させ,特許文章の未知語となる特性に考慮したトークナイザーを導入することで,本問題の解決を図った. 評価実験では,特許文書に含まれる正解文章の一部を入力とし,次文生成を行った.結果として,存在しない単語・フレーズが生成されるという従来手法の問題を提案手法を用いることで改善できることが示された. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00349328 | |||||||
書誌情報 |
第85回全国大会講演論文集 巻 2023, 号 1, p. 747-748, 発行日 2023-02-16 |
|||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |