WEKO3
アイテム
認識誤りを含むトランスクリプションを対象にしたキーワード検索
https://ipsj.ixsq.nii.ac.jp/records/225579
https://ipsj.ixsq.nii.ac.jp/records/2255796f6bd11d-395f-4fb0-a751-363219023154
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]()
2025年3月21日からダウンロード可能です。
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
非会員:¥660, IPSJ:学会員:¥330, DC:会員:¥0, DLIB:会員:¥0 |
Item type | SIG Technical Reports(1) | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2023-03-21 | |||||||||||
タイトル | ||||||||||||
タイトル | 認識誤りを含むトランスクリプションを対象にしたキーワード検索 | |||||||||||
言語 | ||||||||||||
言語 | jpn | |||||||||||
キーワード | ||||||||||||
主題Scheme | Other | |||||||||||
主題 | 情報アクセス技術 | |||||||||||
資源タイプ | ||||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||||||
資源タイプ | technical report | |||||||||||
著者所属 | ||||||||||||
徳島大学情報センター | ||||||||||||
著者所属 | ||||||||||||
徳島大学情報センター | ||||||||||||
著者所属 | ||||||||||||
徳島大学情報センター | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Center for Administration of Information Technology, Tokushima University | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Center for Administration of Information Technology, Tokushima University | ||||||||||||
著者所属(英) | ||||||||||||
en | ||||||||||||
Center for Administration of Information Technology, Tokushima University | ||||||||||||
著者名 |
谷岡, 広樹
× 谷岡, 広樹
× 王, 博源
× 佐野, 雅彦
|
|||||||||||
論文抄録 | ||||||||||||
内容記述タイプ | Other | |||||||||||
内容記述 | 近年,深層学習を用いた音声認識技術はめざましく発展しており,オンライン会議等の議事録作成を自動化するために,AI による議事録自動作成機能(トランスクリプション)が利用されるケースが増えてきている.会議終了後,AI により自動的に文字起こしされた議事録を,できるだけ人手による訂正をせずにデータベース化しておき,キーワード検索などにより情報の閲覧を可能としたい.訂正を行わずに会議の文字起こしされたテキストを誤りを含んだまま保存しておくことは,大きなストレージを必要としないことや,誤りを含んでいたとしても,ユーザが内容を比較的素早く確認できるといった利点がある.そこで,我々は誤りを含むテキストをデータベース化してキーワード検索により閲覧できるシステムを開発することを考えた.ここで問題となるのが,音声認識機能により文字起こしされた議事録には誤りが含まれるため,文字列によるキーワード検索で検索できない場合があることである.音声認識機能による誤った文字列は,発言した単語の音素ベクトルと類似している可能性が高いという仮説を元に,音素ベクトルの編集距離を用いてキーワード検索を行うことを提案する.また,トランスクリプションによりコーパスに対して,キーワード検索の実験を行った結果,再現率,適合率共に向上することが確認されたので報告する. | |||||||||||
書誌レコードID | ||||||||||||
収録物識別子タイプ | NCID | |||||||||||
収録物識別子 | AN10539261 | |||||||||||
書誌情報 |
研究報告ドキュメントコミュニケーション(DC) 巻 2023-DC-128, 号 2, p. 1-2, 発行日 2023-03-21 |
|||||||||||
ISSN | ||||||||||||
収録物識別子タイプ | ISSN | |||||||||||
収録物識別子 | 2188-8892 | |||||||||||
Notice | ||||||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||||||
出版者 | ||||||||||||
言語 | ja | |||||||||||
出版者 | 情報処理学会 |