ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 論文誌(ジャーナル)
  2. Vol.61
  3. No.2

近代の歴史的資料を対象とした機械学習による文境界推定

https://ipsj.ixsq.nii.ac.jp/records/203134
https://ipsj.ixsq.nii.ac.jp/records/203134
40355f6b-4dad-4fec-bb73-f391e41de517
名前 / ファイル ライセンス アクション
IPSJ-JNL6102006.pdf IPSJ-JNL6102006.pdf (659.4 kB)
Copyright (c) 2020 by the Information Processing Society of Japan
オープンアクセス
Item type Journal(1)
公開日 2020-02-15
タイトル
タイトル 近代の歴史的資料を対象とした機械学習による文境界推定
タイトル
言語 en
タイトル Machine Learning-based Sentence Boundary Detection for Modern Japanese Texts
言語
言語 jpn
キーワード
主題Scheme Other
主題 [特集:人文科学とコンピュータ] 近代文語,文境界推定,近代語コーパス,UniDic
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_6501
資源タイプ journal article
著者所属
首都大学東京
著者所属
首都大学東京
著者所属
国立国語研究所
著者所属
首都大学東京
著者所属(英)
en
Tokyo Metropolitan University
著者所属(英)
en
Tokyo Metropolitan University
著者所属(英)
en
The National Institute for Japanese Language and Linguistics
著者所属(英)
en
Tokyo Metropolitan University
著者名 白井, 良介

× 白井, 良介

白井, 良介

Search repository
松村, 雪桜

× 松村, 雪桜

松村, 雪桜

Search repository
小木曽, 智信

× 小木曽, 智信

小木曽, 智信

Search repository
小町, 守

× 小町, 守

小町, 守

Search repository
著者名(英) Ryosuke, Shirai

× Ryosuke, Shirai

en Ryosuke, Shirai

Search repository
Yukio, Matsumura

× Yukio, Matsumura

en Yukio, Matsumura

Search repository
Toshinobu, Ogiso

× Toshinobu, Ogiso

en Toshinobu, Ogiso

Search repository
Mamoru, Komachi

× Mamoru, Komachi

en Mamoru, Komachi

Search repository
論文抄録
内容記述タイプ Other
内容記述 本稿では,機械学習を用いて近代の歴史的資料に対して文境界を検出する手法を提案する.近代の歴史的資料は明確な文境界が必ずしも存在しないため,これまで人手作業による文境界の付与が行われてきたが,膨大な資料に対してなかなか作業が進んでいない現状がある.そこで我々は機械学習を用いて文境界を検出する手法を提案する.この手法により膨大な量の資料に対して文境界の一次的なアノテーションを施すことができることに加えて,形態素解析の精度を向上させたことが本研究の貢献である.また,モデルの訓練に日本語の近代語のデータを使用して,複数の機械学習手法を比較して近代の歴史的資料を対象とした文境界推定を行うのは本研究が初めてである.
論文抄録(英)
内容記述タイプ Other
内容記述 In this study, we propose a method to detect sentence boundaries for modern Japanese texts using machine learning. For modern Japanese texts, sentence boundaries are not explicitly marked so that human annotation is inevitable, but the annotation process is far from complete due to enormous number of materials. Therefore, we propose a method to detect sentence boundaries using machine learning. The main contribution of this study is that this method can support the annotation task as a primary annotation. We also show that the accuracy of morphological analysis can be improved by performing sentence boundary detection. Moreover, this is the first work to detect sentence boundaries targeting modern Japanese texts by using modern Japanese data for model training and comparing multiple machine learning methods.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN00116647
書誌情報 情報処理学会論文誌

巻 61, 号 2, p. 152-161, 発行日 2020-02-15
ISSN
収録物識別子タイプ ISSN
収録物識別子 1882-7764
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 20:39:23.097503
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3