WEKO3
アイテム
日本文の読みやすさの評価式
https://ipsj.ixsq.nii.ac.jp/records/37773
https://ipsj.ixsq.nii.ac.jp/records/37773c386f383-28be-4481-88cb-164f52cbbe61
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1988 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1988-05-09 | |||||||
タイトル | ||||||||
タイトル | 日本文の読みやすさの評価式 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Derivation of a Readability Formula of Japanese Texts | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
東京大学理学部情報科学科 | ||||||||
著者所属 | ||||||||
東京大学理学部情報科学科 | ||||||||
著者所属 | ||||||||
東京大学理学部情報科学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information Science, Faculty of Science, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information Science, Faculty of Science, University of Tokyo | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Information Science, Faculty of Science, University of Tokyo | ||||||||
著者名 |
建石, 由佳
× 建石, 由佳
|
|||||||
著者名(英) |
Tateisi, Yuka
× Tateisi, Yuka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 日本文の表面の情報から、構文や意味によらないでその文章の読みやすさを評価する式を、読みやすさと関係のある表面情報のうちの4種類、すなわち(1)文の平均の長さ(文字数)、(2)各文字種(英字、ひらがな、漢字、カタカナ)について、その文字種の連(同一文字種の文字の一続き)の相対頻度、(3)文字種ごとの連の平均の長さ、(4)読点の数の句点の数に対する比、から線型式により求めた。主成分分析により、読みやすさに関係のある成分を見つけ、その計算式を評価式とした。この成分はサンプルとしてとった科学技術系の日本文におけるスコアの分布が、読みやすさについての経験的知識とよく一致した。また、このスコアを読みやすさの指標に使えることを、クローズ法と、それにかかる時間の計測とを用いた実験により確かめた。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | A readability formula is obtained that can be used by computer programs for style checking of Japanese texts that need not syntactic or semantic information. The formula is derived as a linear combination of the surface characteristics of the text that are related to its readability: (1) the average number of characters per sentence, (2) for each type of characters (Roman alphabets, kanzis, hiraganas, katakanas), relative frequencies of runs (maximal strings) that consists only of that type of characters, (3) the average number of characters per each type of runs, and (4) tooten (comma) to kuten (period) ratio. To find the proper weighting, principal component analysis (PCA) was applied to these characteristics taken from 77 sample texts. We have found a component which is related to the readability. Its scores match to the empirical knowledges of reading ease. We have also obtained experimental confirmation that the component is an adequate measure for stylistic ease of reading, by the cloze procedure and by the examination on the average time taken to fill out one blank of the cloze texts. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AA1221543X | |||||||
書誌情報 |
情報処理学会研究報告ヒューマンコンピュータインタラクション(HCI) 巻 1988, 号 25(1988-HI-018), p. 1-8, 発行日 1988-05-09 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |