WEKO3
アイテム
知覚情報からの概念構造の抽出にもとづく音声入力による言語獲得
https://ipsj.ixsq.nii.ac.jp/records/57584
https://ipsj.ixsq.nii.ac.jp/records/575845bb55273-2bb6-458a-8963-2eaf42cf5832
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 1999 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 1999-10-29 | |||||||
タイトル | ||||||||
タイトル | 知覚情報からの概念構造の抽出にもとづく音声入力による言語獲得 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Spoken language acquisition based on the conceptual pattern analysis in perceptual information | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
ソニーコンピュータサイエンス研究所 | ||||||||
著者所属 | ||||||||
ソニーコンピュータサイエンス研究所 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Sony Computer Science Labs. Inc. | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Sony Computer Science Labs. Inc. | ||||||||
著者名 |
岩橋, 直人
× 岩橋, 直人
|
|||||||
著者名(英) |
Naoto, Iwahashi
× Naoto, Iwahashi
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | 本報告では、パターン認識により非言語的な知覚情報から概念情報を抽出し、これを用いて音声を通して言語を獲得するアルゴリズムについて述べる。アルゴリズムでは、センサーによる観測信号は知覚特性を考慮した特徴量空間に射影される。語彙項目はこの知覚特徴量空間、文法は許容される規則のパラメータ空間での、確率モデルによりそれぞれ表現される。これらの確率モデルは音声と非言語的知覚情報との関連性にもとづいて学習される。入力音声の構文構造は知覚情報の中の概念間の関係を分析することにより推測する。学習された文法は、概念の確率モデル間の類似性にもとづいて汎化される。ベイジアン学習等の統計的学習手法を用いることで、学習データ中の言語ノイズ、音声処理と知覚情報処理における入力の曖昧性と出力の不確実性、学習データ量の少なさに対して、頑健性を高めている。言語獲得の基本原理として、状況をまたいだ学習、および単語の意味の排他性の原理を部分的に用いている。インプリメントしたアルゴリズムは音声認識処理と動的グラフィックシーンからの概念抽出処理を含むものとなっており、予備的な実験の結果も示される。 | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | This paper describes a machine learning algorithm for spoken language acquisition by using concepts extracted from nonliguistic perceptual information, based on a pattern recognition technique. The algorithm projects the raw sensor-observed signals into perceptually appropriate feature spaces. Lexicon and grammar are respectively represented in stochastic form in the feature space and in the possible grammar parameter space. Their learning is based on the association between speech and perceptual information. The syntactic structure is inferred from the conceptual structure obtained by analyzing the conceptual patterns in the perceptual information. The grammar is generalized according to the similarity of concept distributions in the feature space. The algorithm is robust against noise, ambiguity, and sparseness in the learning data because it uses statistical learning, such as Bayesian learning In the learning process, cross-situational learning and the principle of exclusivity applied between word meanings are partly implemented in a statistical way, The implemented algorithm includes the processes of the speech recognition and the analysis of graphical scenes containing stationary or moving objects. A preliminary experiment is also described here. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10442647 | |||||||
書誌情報 |
情報処理学会研究報告音声言語情報処理(SLP) 巻 1999, 号 91(1999-SLP-028), p. 1-8, 発行日 1999-10-29 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |