@article{oai:ipsj.ixsq.nii.ac.jp:00016246, author = {田中, 康仁 and 古賀, 勝夫 and Yasuhito, Tanaka and Katsuo, Koga}, issue = {3}, journal = {情報処理学会論文誌}, month = {May}, note = {この研究の目的は日本語の解析の最初に発生する分ち書きの問題を解決するための一手法である.分かち書きは一般に文字種(漢字 平仮名 片仮名 英字 数字 記号等)の変わり目で機械的に行われる.この時に発生する平仮名列に注目し この性質を分析して分かち書きを行うものである.分かち書きの方法は次のように行う.平仮名列の中には慣用的な表現が多くあるのでこれを集め辞書とし 文章中に発生する平仮名列を最長一致法により平仮名列辞書で右側より分割し 残った平仮名列はテーブルを参照することにより 語尾であるとか その他の文法的接続検証等を行う.分かち書きされた平仮名列は対応する平仮名列辞書により よりこまかく分割され 品詞情報を付ける.このような方法により232万件の平仮名列を処理することにより約3万2千項目の平仮名列辞書があれば分かち書きできることがわかった.これだけの量を処理したことによって平仮名列辞書に新しく追加しなければならない件数は処理する平仮名列の0.3%?04%程度である.このような実験から平仮名列の中に繰り返し使われる平仮名列を使い分かち書きを行うことができる.分かち書き処理を行うごとに平仮名列辞書を充実させ人手に頼る部分を少なくすることができる.この実験は日本科学技術情報センターの抄録テープによって行った.}, pages = {242--247}, title = {平仮名列の自動分かち書き}, volume = {22}, year = {1981} }