@techreport{oai:ipsj.ixsq.nii.ac.jp:02004369, author = {帖佐,宗浩 and 西田,悠人 and 大羽,未悠 and 渡辺,太郎}, issue = {16}, month = {Sep}, note = {人間の乳幼児はその言語獲得の初期段階において,“I-wanna-do-it”といった表現に対して“I”,“wanna”,“do”,“it”のような要素ごとの区切りを見出すことなく,全体としてひとつの意味を持つ「かたまり」(ホロフレーズ)として認識・使用することが知られている.他方で,近年のニューラル言語モデル(NLM)と人間の言語獲得を対比する一連の研究では,主として事前に設定された語彙を所与とした学習が行われてきている,しかし、語彙を与えた状態では、語の区切りをどのように認識していくかという言語獲得のより基盤的な問いに迫るには限界がある。そこで本研究では,NLMの学習初期においてどのような「かたまり」が認識されているかを検証する.子どもに向けた発話を収集した英語コーパスを用いて,事前の語彙を仮定しない文字レベルNLMを構築し,モデルの分岐エントロピーの局所的な増加部分を分節とみなすという仮定のもとに,NLMにおける単語の分節化の過程を観察した.実験の結果,少なくとも本研究の設定のもとでは,人間の乳幼児が認識・使用するようなホロフレーズは,NLMの学習初期においてひとつの「かたまり」として認識される傾向はほとんど認められなかった.}, title = {ニューラル言語モデルの学習初期における単語の分節化}, year = {2025} }