WEKO3
アイテム
語長変換を考慮したコーパス管理システム
https://ipsj.ixsq.nii.ac.jp/records/11550
https://ipsj.ixsq.nii.ac.jp/records/1155088409a1e-43fc-4a85-b6a6-33d607795acb
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2002 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | Journal(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2002-07-15 | |||||||
タイトル | ||||||||
タイトル | 語長変換を考慮したコーパス管理システム | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Maintenance Schema of Japanese POS Tagged Corpora | |||||||
言語 | ||||||||
言語 | jpn | |||||||
キーワード | ||||||||
主題Scheme | Other | |||||||
主題 | 特集:音声言語情報処理とその応用 | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||
資源タイプ | journal article | |||||||
その他タイトル | ||||||||
その他のタイトル | 音声言語コーパスとその応用 | |||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属 | ||||||||
千葉大学文学部 | ||||||||
著者所属 | ||||||||
奈良先端科学技術大学院大学情報科学研究科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Faculty of Letters, Chiba University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Information Science, Nara Institute of Science and Technology | ||||||||
著者名 |
浅原, 正幸
米田, 隆一
山下, 亜希子
伝, 康晴
松本, 裕治
× 浅原, 正幸 米田, 隆一 山下, 亜希子 伝, 康晴 松本, 裕治
|
|||||||
著者名(英) |
Masayuki, Asahara
Ryuichi, Yoneda
Akiko, Yamashita
Yasuharu, Den
Yuji, Matsumoto
× Masayuki, Asahara Ryuichi, Yoneda Akiko, Yamashita Yasuharu, Den Yuji, Matsumoto
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本論文では,現在開発している関係データベースを用いたコーパス管理システムについて述べる.日本語の辞書管理やコーパス管理において,一貫した語の単位(1語として認定される語の長さ)は大きな問題の1つである.この問題に対し,関係データベース上に辞書とコーパスとで語の単位を同期して管理する手法を提案する.また分野により必要とされる語の単位は異なり,1つの語の単位定義を異分野間で共有することは難しい.提案する手法では,1つの元コーパスデータに対し,複数の語の単位の情報を保持することが可能である.異なる語の単位定義間の関係を保持するために複合語の定義には構成語の依存構造を導入し,依存木による複合語の分類を可能にした.これにより,各分野で必要な語の単位を依存木の構造により区別することが可能 になった. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | In this paper, we present a use of a relational database fordeveloping and maintaining linguistic resources.In languages that do not provide word delimitation in texts(e.g. Chinese and Japanese), consistent definition of words in thelexicon is a critical issue to build POS tagged texts.When we change the definition of word delimitation in the lexicon, weneed to also modify the tagged corpora to make them consistent with thelexicon. We propose a use of relational database schema to performthese modifications in tandem.In addition, in the Japanese language, definition of word delimitation is by itself difficult, since it varies depending on the research fields. To accommodate more than one definition ofword delimitation, we compose a compound word lexicon in the database.The compound word lexicon includes dependency structures of components. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN00116647 | |||||||
書誌情報 |
情報処理学会論文誌 巻 43, 号 7, p. 2091-2097, 発行日 2002-07-15 |
|||||||
ISSN | ||||||||
収録物識別子タイプ | ISSN | |||||||
収録物識別子 | 1882-7764 |