WEKO3
アイテム
平仮名列の自動分かち書き
https://ipsj.ixsq.nii.ac.jp/records/16246
https://ipsj.ixsq.nii.ac.jp/records/16246a9e3473e-e51d-4e53-bf41-423fe9a3996c
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1981 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1981-05-15 | |||||||
タイトル | ||||||||
タイトル | 平仮名列の自動分かち書き | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Segmentation of Hiragana Strings Appearing in the Japanese Sentence | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 論文 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
著者所属 | ||||||||
日本ユニバック(株) | ||||||||
著者所属 | ||||||||
(株)リソース | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Nippon Univac Kaisha, Ltd | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Resource Sharing Company | ||||||||
著者名 |
田中, 康仁
× 田中, 康仁
|
|||||||
著者名(英) |
Yasuhito, Tanaka
× Yasuhito, Tanaka
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | この研究の目的は日本語の解析の最初に発生する分ち書きの問題を解決するための一手法である.分かち書きは一般に文字種(漢字 平仮名 片仮名 英字 数字 記号等)の変わり目で機械的に行われる.この時に発生する平仮名列に注目し この性質を分析して分かち書きを行うものである.分かち書きの方法は次のように行う.平仮名列の中には慣用的な表現が多くあるのでこれを集め辞書とし 文章中に発生する平仮名列を最長一致法により平仮名列辞書で右側より分割し 残った平仮名列はテーブルを参照することにより 語尾であるとか その他の文法的接続検証等を行う.分かち書きされた平仮名列は対応する平仮名列辞書により よりこまかく分割され 品詞情報を付ける.このような方法により232万件の平仮名列を処理することにより約3万2千項目の平仮名列辞書があれば分かち書きできることがわかった.これだけの量を処理したことによって平仮名列辞書に新しく追加しなければならない件数は処理する平仮名列の0.3%?04%程度である.このような実験から平仮名列の中に繰り返し使われる平仮名列を使い分かち書きを行うことができる.分かち書き処理を行うごとに平仮名列辞書を充実させ人手に頼る部分を少なくすることができる.この実験は日本科学技術情報センターの抄録テープによって行った. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 22, 号 3, p. 242-247, 発行日 1981-05-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |