WEKO3
アイテム
コンテキスト依存の重み付けを用いたレーベンシュタイン距離に基づく古英語のレマ化
https://ipsj.ixsq.nii.ac.jp/records/223290
https://ipsj.ixsq.nii.ac.jp/records/2232909cdfe6a9-8751-4ea6-b2d2-8a6bc5315f0d
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
Copyright (c) 2022 by the Information Processing Society of Japan
|
|
| オープンアクセス | ||
| Item type | Symposium(1) | |||||||
|---|---|---|---|---|---|---|---|---|
| 公開日 | 2022-12-09 | |||||||
| タイトル | ||||||||
| タイトル | コンテキスト依存の重み付けを用いたレーベンシュタイン距離に基づく古英語のレマ化 | |||||||
| タイトル | ||||||||
| 言語 | en | |||||||
| タイトル | Lemmatization of Old English Using Levenshtein Edit Distance with Context Sensitive Weighting | |||||||
| 言語 | ||||||||
| 言語 | eng | |||||||
| キーワード | ||||||||
| 主題Scheme | Other | |||||||
| 主題 | Old English,Rule-Based NLP,Edit Distance,Lemmatization,古英語,ルールベース自然言語処理,編集距離,レマ化 | |||||||
| 資源タイプ | ||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_5794 | |||||||
| 資源タイプ | conference paper | |||||||
| 著者所属 | ||||||||
| 東京大学大学院 人文社会系研究科 | ||||||||
| 著者所属(英) | ||||||||
| en | ||||||||
| University of Tokyo | ||||||||
| 著者名 |
川浪, 拓也ティモスィー
× 川浪, 拓也ティモスィー
|
|||||||
| 著者名(英) |
Timothy, Kawanami-Hanpeter
× Timothy, Kawanami-Hanpeter
|
|||||||
| 論文抄録 | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | 本研究では統一的な正書法を持たない歴史的言語に対する自然言語処理手法として,コンテキスト依存の重み付けを用いたレーベンシュタイン距離と最小限の語彙情報を組み合わせた古英語のレマ化アルゴリズムを提案する.現存するデータ量に限りがある歴史的言語に対して,ルールベースの手法の妥当性を確かめるため,10世紀後半に古英語で記述されたÆlfric の聖人伝の一つである‘DeSancta Eugenia’を対象とした検証を行なった結果,約72%の精度が得られた.この結果はゲルマン語派の他の歴史的言語に対して編集距離を用いた綴り字の平準化を行なった先行研究と同等の精度である. | |||||||
| 論文抄録(英) | ||||||||
| 内容記述タイプ | Other | |||||||
| 内容記述 | This study implements an Old English lemmatizer that utilizes edit distance with context sensitive weighting combined with a minimal list of lexical items. The lemmatizer exemplifies a rule-based method for natural language processing of historical languages that exhibit spelling variation due to a lack of standardized orthography. To verify the effectiveness of rule-based methods for historical languages that lack large data sets, the lemmatizer is evaluated against Ælfric’s ‘De Sancta Eugenia,’ a late 10th century hagiography written in Old English. An accuracy of approximately 72% is achieved. These results are comparable to that of other studies that have conducted spelling normalization of historical Germanic languages using edit distance. | |||||||
| 書誌情報 |
じんもんこん2022論文集 巻 2022, p. 179-186, 発行日 2022-12-02 |
|||||||
| 出版者 | ||||||||
| 言語 | ja | |||||||
| 出版者 | 情報処理学会 | |||||||