ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(ジャーナル)
  2. Vol.22
  3. No.3

平仮名列の自動分かち書き

https://ipsj.ixsq.nii.ac.jp/records/16246
https://ipsj.ixsq.nii.ac.jp/records/16246
a9e3473e-e51d-4e53-bf41-423fe9a3996c
名前 / ファイル ライセンス アクション
IPSJ-JNL2203008.pdf IPSJ-JNL2203008.pdf (461.4 kB)
Copyright (c) 1981 by the Information Processing Society of Japan
オープンアクセス
Item type Journal(1)
公開日 1981-05-15
タイトル
タイトル 平仮名列の自動分かち書き
タイトル
言語 en
タイトル Automatic Segmentation of Hiragana Strings Appearing in the Japanese Sentence
言語
言語 jpn
キーワード
主題Scheme Other
主題 論文
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
日本ユニバック(株)
著者所属
(株)リソース
著者所属(英)
en
Nippon Univac Kaisha, Ltd
著者所属(英)
en
Resource Sharing Company
著者名 田中, 康仁 古賀, 勝夫

× 田中, 康仁 古賀, 勝夫

田中, 康仁
古賀, 勝夫

Search repository
著者名(英) Yasuhito, Tanaka Katsuo, Koga

× Yasuhito, Tanaka Katsuo, Koga

en Yasuhito, Tanaka
Katsuo, Koga

Search repository
論文抄録
内容記述タイプ Other
内容記述 この研究の目的は日本語の解析の最初に発生する分ち書きの問題を解決するための一手法である.分かち書きは一般に文字種(漢字 平仮名 片仮名 英字 数字 記号等)の変わり目で機械的に行われる.この時に発生する平仮名列に注目し この性質を分析して分かち書きを行うものである.分かち書きの方法は次のように行う.平仮名列の中には慣用的な表現が多くあるのでこれを集め辞書とし 文章中に発生する平仮名列を最長一致法により平仮名列辞書で右側より分割し 残った平仮名列はテーブルを参照することにより 語尾であるとか その他の文法的接続検証等を行う.分かち書きされた平仮名列は対応する平仮名列辞書により よりこまかく分割され 品詞情報を付ける.このような方法により232万件の平仮名列を処理することにより約3万2千項目の平仮名列辞書があれば分かち書きできることがわかった.これだけの量を処理したことによって平仮名列辞書に新しく追加しなければならない件数は処理する平仮名列の0.3%?04%程度である.このような実験から平仮名列の中に繰り返し使われる平仮名列を使い分かち書きを行うことができる.分かち書き処理を行うごとに平仮名列辞書を充実させ人手に頼る部分を少なくすることができる.この実験は日本科学技術情報センターの抄録テープによって行った.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN00116647
書誌情報 情報処理学会論文誌

巻 22, 号 3, p. 242-247, 発行日 1981-05-15
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7764
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-22 23:57:32.295726
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3