WEKO3
アイテム
収集語彙の母集団覆内率推定値の誤差の分散推定法の改善
https://ipsj.ixsq.nii.ac.jp/records/15918
https://ipsj.ixsq.nii.ac.jp/records/15918ea315bb0-f6ec-473a-a26f-9ea4f31f1b3e
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 1984 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Journal(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 1984-07-15 | |||||||
| タイトル | ||||||||
| タイトル | 収集語彙の母集団覆内率推定値の誤差の分散推定法の改善 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | An Advanced Evaluation Method for Tableware Cover Ratio Estirnation Precision | |||||||
| 言語 | ||||||||
| 言語 | jpn | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | 論文 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
| 資源タイプ | journal article | |||||||
| 著者所属 | ||||||||
| (株)日立製作所システム開発研究所/現在 日立マイクロコンピュータエンジニアリング(株) | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| Systems Development Laboratory, Hitachi, Ltd | ||||||||
| 著者名 |
松岡, 濶
× 松岡, 濶
|
|||||||
| 著者名(英) |
Hiroshi, Matsuoka
× Hiroshi, Matsuoka
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 仮名漢字変換システムや機械翻訳システムなどの自然言語処理システムにおいて 用語辞書などのテーブルウェアは そのシステムの処理精度に大きく影響を与える一つの要因である.処理中の未格納語へのヒット率(テーブルウェアの覆外率と呼ぶ)が小さいことが強く要求される.無作為に集められた語の集合が母集団に対してもつ覆外率D_<0 N>の推定には D_<0 N>=C_<1 N+1>/(N+1)なる推定式が用いられる.ここにC_<1 N>は語彙調査で1回出現語の数であり Nは標本の大きさである.この推定式の誤差w_Nの分散V[w_N]についてはRobbinsの粗い評価式がある.また辞書の大きさに関係する異なり語数k_Nの分散V[k_N]については水谷の理論式がある.本報告では語彙調査で得られる統計量だけからV[w_N]およびV[k_N]を推定する方法を提案し モンテカルロ法によって提案推定式の検証を行った.検証に用いた母集団の場合 提案推定式によって 覆外率の推定誤差の標準偏差σ[w_N]の精度はRobbinsの評価式から1桁以上改善されること また異なり語数の標準偏兼σ[k_N]の上界は真値からの相対誤差が20%以下であることを示した.提案推定式の適用はν回出現語数C_<ν N>(ν≧2)がC_<1 N>を超えない程度の大きさの場合に限られるが 語の出現率分布関数の形にはよらない推定式である. | |||||||
| 書誌レコードID | ||||||||
| 収録物識別子タイプ | NCID | |||||||
| 収録物識別子 | AN00116647 | |||||||
| 書誌情報 |
情報処理学会論文誌 巻 25, 号 4, p. 560-569, 発行日 1984-07-15 |
|||||||
| ISSN | ||||||||
| 収録物識別子タイプ | ISSN | |||||||
| 収録物識別子 | 1882-7764 | |||||||