ログイン 新規登録
言語:

WEKO3

  • トップ
  • ランキング
To
lat lon distance
To

Field does not validate



インデックスリンク

インデックスツリー

メールアドレスを入力してください。

WEKO

One fine body…

WEKO

One fine body…

アイテム

  1. 研究報告
  2. 自然言語処理(NL)
  3. 2024
  4. 2024-NL-260

文字言語モデルからの単語言語モデルの教師なし合成

https://ipsj.ixsq.nii.ac.jp/records/235093
https://ipsj.ixsq.nii.ac.jp/records/235093
265fee9e-23bb-4ac2-8f94-c57951c0cb39
名前 / ファイル ライセンス アクション
IPSJ-NL24260002.pdf IPSJ-NL24260002.pdf (1.4 MB)
 2026年6月21日からダウンロード可能です。
Copyright (c) 2024 by the Information Processing Society of Japan
非会員:¥660, IPSJ:学会員:¥330, NL:会員:¥0, DLIB:会員:¥0
Item type SIG Technical Reports(1)
公開日 2024-06-21
タイトル
タイトル 文字言語モデルからの単語言語モデルの教師なし合成
タイトル
言語 en
タイトル Unsupervised Synthesis of Word Language Models from Pretrained Character Language Models
言語
言語 jpn
キーワード
主題Scheme Other
主題 LLM基礎
資源タイプ
資源タイプ識別子 http://purl.org/coar/resource_type/c_18gh
資源タイプ technical report
著者所属
京都大学
著者名 村脇, 有吾

× 村脇, 有吾

村脇, 有吾

Search repository
論文抄録
内容記述タイプ Other
内容記述 Transformer に基づく事前訓練文字言語モデルから単語言語モデルへの教師なし合成の実現可能性を示す.教師なし単語分割における興味の中心は学習を実現する帰納バイアスを明らかにすることだが,ニューラル言語モデルに基づく場合,アーキテクチャ上の制約から有限語彙を前提とするにもかかわらず,教師なし単語分割においては語彙を事前に決定できないという問題への取り組みを中心に据えざるを得ない.本稿では,この問題を解決するために多段階の訓練手続きを提案する.提案手法は単語境界における確率的不確実性を取っ掛かりとして利用しており,幼児の初期学習との関連が示唆される.
論文抄録(英)
内容記述タイプ Other
内容記述 We demonstrate the feasibility of transforming a Transformer-based pretrained character language model into a word language model without explicit supervision on word segmentation. While the main interest in unsupervised word segmentation lies in identifying the inductive biases that facilitate language acquisition, neural language models face technical challenges due to their architectural constraints requiring a fixed vocabulary, despite the inability to predefine this vocabulary in unsupervised settings. To address this issue, we propose a multi-stage training procedure. Our method leverages the stochastic uncertainty pertaining to word boundaries to bootstrap the process, suggesting a connection to early learning in infants.
書誌レコードID
収録物識別子タイプ NCID
収録物識別子 AN10115061
書誌情報 研究報告自然言語処理(NL)

巻 2024-NL-260, 号 2, p. 1-14, 発行日 2024-06-21
ISSN
収録物識別子タイプ ISSN
収録物識別子 2188-8779
Notice
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc.
出版者
言語 ja
出版者 情報処理学会
戻る
0
views
See details
Views

Versions

Ver.1 2025-01-19 09:36:49.836672
Show All versions

Share

Mendeley Twitter Facebook Print Addthis

Cite as

エクスポート

OAI-PMH
  • OAI-PMH JPCOAR
  • OAI-PMH DublinCore
  • OAI-PMH DDI
Other Formats
  • JSON
  • BIBTEX

Confirm


Powered by WEKO3


Powered by WEKO3