WEKO3
アイテム
読み正解コーパスのXML化とXSLTの利用
https://ipsj.ixsq.nii.ac.jp/records/57524
https://ipsj.ixsq.nii.ac.jp/records/57524c0cb2839-c003-451f-872a-21fc11fbd2a3
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-06-02 | |||||||
タイトル | ||||||||
タイトル | 読み正解コーパスのXML化とXSLTの利用 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Text Corpus Annotated with Appropriate Pronounciations : an Application of XML and XSLT | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
京都高度技術研究所/通信総合研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
ASTEM RI/CRL KARC | ||||||||
著者名 |
山田, 篤
× 山田, 篤
|
|||||||
著者名(英) |
Atsushi, Yamada
× Atsushi, Yamada
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 近年、日本語のテキストコーパスの整備が進み、利用可能な言語資源が蓄積されつつある。本稿では、日本語ディクテーション基本ソフトウェアの開発の一環として行われた大規模テキストコーパスへの読み付与と、形態素解析済の読み正解コーパスの整備について述べる。はじめに、形態素解析システムと読み付与の関係と、既存の形態素解析システムで処理し切れながった問題について述べる。次に、読み正解コーパスを、特定の形態素解析システムの出カ形式に依存しないExtensible Markup Language (XML)で記述することを提案する。XMLの採用により、再利用性を向上させるとともに、XSL Transformations (XSLT)などの利用により、コーパス作成作業における各種ツールの共有化が期待できる。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | As a part of the research and development activities for developing Japanese dictation toolkit, we have annotated appropriate pronounciations to text corpus and developed some tools for the annotation. Developing tailered morphological analysis dictionary resolved some problems for constructing appropriate pronounciations annotated corpus, and postprocessing tools the rest. Using Extensible Markup Language (XML), which is independent of any format of Japanese morphological analysis system, we can reuse the annotated corpus in many ways. XSL Transformations (XSLT) helps us to transform XML documents into other forms. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 2000, 号 54(2000-SLP-031), p. 17-22, 発行日 2000-06-02 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |