Item type |
FIT(1) |
公開日 |
2011-09-07 |
タイトル |
|
|
タイトル |
E-045 中期ウイグルテキストの音節分割アルゴリズム規則の設計(言語分析・多言語,E分野:自然言語・音声・音楽) |
タイトル |
|
|
言語 |
en |
|
タイトル |
E-045 Design of Syllable Segmentation Algorithm Rule of Middle Uygur Text |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
中期ウイグル語音節 |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
アルゴリズム規則 |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_5794 |
|
資源タイプ |
conference paper |
著者所属 |
|
|
|
長岡技術科学大学 |
著者所属 |
|
|
|
長岡技術科学大学 |
著者所属 |
|
|
|
長岡技術科学大学 |
著者所属 |
|
|
|
長岡技術科学大学 |
著者所属 |
|
|
|
長岡技術科学大学 |
著者名 |
ウメルジアン, ウスマン
木村, 哲也
山田, 耕一
猿渡, 隼斗
三上, 喜貴
|
著者名(英) |
Omarjan, Osman
Kimura, Tetsuya
Yamada, Koichi
Saruwatari, Hayato
Mikami, Yoshiki
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
中期ウイグル語は、中央アジアに住んでいるウイグル人の一部が紀元7世紀から19世紀の終わりまでに使っていた言語である。この時代の間使われた中期ウイグル文字は、音を表現する文字で、表音文字(英:Phonogram)のカテゴリーに所属する。中期ウイグル文字列は、アルファベットで定義されて、母音、子音、分音符号、グリフと複雑なリガチャーの組み合わせにより構成されている。中期ウイグル語テキストには、独立系グリフが多く使われており、単語中に空白区(スペース)が使われている単語があり、単語を自動推定することが難しい。音節分割は単語を自動推定するために重要なプロセスであり、中期ウイグル語テキストの独立形文字、独立形グリフと独立形リガチャーを結合した単語の音節分割が必要である。一方で、中期ウイグル語の開音節の一部が現代ウイグル語の閉音節に変わるなど音韻上の変化があり、中期ウイグル語の音節構造解析などへの量的分析が行いづらい状況にある。中期ウイグル語と現代ウイグル語は上記の問題を除けは、同じ言語であり相互互換可能だが、そのためのテキスト処理が必要である。本研究では、中期ウイグル語テキストの音節分割ソフトウェア(Syllable Segmentation of Uygur Text 1.0 professional Edition)と音節分割アルゴリズム基礎の設計を行った。その現状を報告する。 |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AA1242354X |
書誌情報 |
情報科学技術フォーラム講演論文集
巻 10,
号 2,
p. 313-318,
発行日 2011-09-07
|
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |