WEKO3
アイテム
古典的な可読性指標の言語モデル複雑性としての解釈と多言語可読性指標等への応用
https://ipsj.ixsq.nii.ac.jp/records/226019
https://ipsj.ixsq.nii.ac.jp/records/22601960d1c6ca-4e8f-4f37-9c77-ffdd8a5d1648
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2023 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | SIG Technical Reports(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-05-13 | |||||||
| タイトル | ||||||||
| タイトル | 古典的な可読性指標の言語モデル複雑性としての解釈と多言語可読性指標等への応用 | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
| 資源タイプ | technical report | |||||||
| 著者所属 | ||||||||
| 東京学芸大学 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Tokyo Gakugei University | ||||||||
| 著者名 |
江原, 遥
× 江原, 遥
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | Flesch-Kincaid Gradel Level(FKGL)などの,テキストの読みやすさ(可読性)を計測するための古典的な可読性指標は,英語の可読性評価において広く用いられ,人文科学においても多用されてきた.しかし,それらの中では一文あたりの平均単語数などの,いかにも英語という特定言語だけに依存するように見えるヒューリスティックな式が用いられていた.このため,例えば,FKGL の他言語版などに実験的な有用性だけではなく理論的な意味づけを与えることや,指標の値を言語間で比較することが難しかった.一方,近年の計算言語学では大規模言語モデルの研究が進み,テキストの難しさ(複雑性)を表す指標も,パープレキシティなどの言語モデルから算出される指標を用いることで,特定の言語に依存しない形でテキストの複雑性を表現できる.本研究では,古典的な可読性指標の式に対して,ある簡単な言語モデルの複雑性としての解釈を与える.この解釈により,例えば FKGL の日本語版など,古典的な可読性指標の他言語への拡張に理論的な意味付けを与えることが可能となり,可読性指標の他言語化などに応用できる事を示す.本研究は,言語依存のヒューリスティクスに依存していた従来の可読性指標の再構築に向けた,重要な一歩と位置付けられる. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN1010060X | |||||||
| 書誌情報 |
研究報告人文科学とコンピュータ(CH) 巻 2023-CH-132, 号 17, p. 1-2, 発行日 2023-05-13 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 2188-8957 | |||||||
| Notice | ||||||||
| SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||