ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. シンポジウム
  2. シンポジウムシリーズ
  3. じんもんこんシンポジウム
  4. 2022

コンテキスト依存の重み付けを用いたレーベンシュタイン距離に基づく古英語のレマ化

https://ipsj.ixsq.nii.ac.jp/records/223290
https://ipsj.ixsq.nii.ac.jp/records/223290
9cdfe6a9-8751-4ea6-b2d2-8a6bc5315f0d
名前 / ファイル ライセンス アクション
IPSJ-CH2022028.pdf IPSJ-CH2022028.pdf (760.2 kB)
Copyright (c) 2022 by the Information Processing Society of Japan
オープンアクセス
Item type Symposium(1)
公開日 2022-12-09
タイトル
タイトル コンテキスト依存の重み付けを用いたレーベンシュタイン距離に基づく古英語のレマ化
タイトル
言語 en
タイトル Lemmatization of Old English Using Levenshtein Edit Distance with Context Sensitive Weighting
言語
言語 eng
キーワード
主題Scheme Other
主題 Old English,Rule-Based NLP,Edit Distance,Lemmatization,古英語,ルールベース自然言語処理,編集距離,レマ化
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_5794
資源タイプ conference paper
著者所属
東京大学大学院 人文社会系研究科
著者所属(英)
en
University of Tokyo
著者名 川浪, 拓也ティモスィー

× 川浪, 拓也ティモスィー

川浪, 拓也ティモスィー

Search repository
著者名(英) Timothy, Kawanami-Hanpeter

× Timothy, Kawanami-Hanpeter

en Timothy, Kawanami-Hanpeter

Search repository
論文抄録
内容記述タイプ Other
内容記述 本研究では統一的な正書法を持たない歴史的言語に対する自然言語処理手法として,コンテキスト依存の重み付けを用いたレーベンシュタイン距離と最小限の語彙情報を組み合わせた古英語のレマ化アルゴリズムを提案する.現存するデータ量に限りがある歴史的言語に対して,ルールベースの手法の妥当性を確かめるため,10世紀後半に古英語で記述されたÆlfric の聖人伝の一つである‘DeSancta Eugenia’を対象とした検証を行なった結果,約72%の精度が得られた.この結果はゲルマン語派の他の歴史的言語に対して編集距離を用いた綴り字の平準化を行なった先行研究と同等の精度である.
論文抄録(英)
内容記述タイプ Other
内容記述 This study implements an Old English lemmatizer that utilizes edit distance with context sensitive weighting combined with a minimal list of lexical items. The lemmatizer exemplifies a rule-based method for natural language processing of historical languages that exhibit spelling variation due to a lack of standardized orthography. To verify the effectiveness of rule-based methods for historical languages that lack large data sets, the lemmatizer is evaluated against Ælfric’s ‘De Sancta Eugenia,’ a late 10th century hagiography written in Old English. An accuracy of approximately 72% is achieved. These results are comparable to that of other studies that have conducted spelling normalization of historical Germanic languages using edit distance.
書誌情報 じんもんこん2022論文集

巻 2022, p. 179-186, 発行日 2022-12-02
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 12:22:29.744151
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3