Item type |
Journal(1) |
公開日 |
2024-10-15 |
タイトル |
|
|
タイトル |
オンライン会議における相手に与える印象を変化させるためのリアルタイム語尾フィルタ |
タイトル |
|
|
言語 |
en |
|
タイトル |
Real-time Word Filters for Changing Impressions on Others in Online Conferences |
言語 |
|
|
言語 |
jpn |
キーワード |
|
|
主題Scheme |
Other |
|
主題 |
[特集:ユビキタスコンピューティングシステム(XII)] オンライン会議,印象変化,語尾ピッチ,語尾フィルタ |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_6501 |
|
資源タイプ |
journal article |
ID登録 |
|
|
ID登録 |
10.20729/00239897 |
|
ID登録タイプ |
JaLC |
著者所属 |
|
|
|
神戸大学 |
著者所属 |
|
|
|
公立はこだて未来大学 |
著者所属 |
|
|
|
神戸大学 |
著者所属 |
|
|
|
神戸大学 |
著者所属(英) |
|
|
|
en |
|
|
Kobe University |
著者所属(英) |
|
|
|
en |
|
|
Future University Hakodate |
著者所属(英) |
|
|
|
en |
|
|
Kobe University |
著者所属(英) |
|
|
|
en |
|
|
Kobe University |
著者名 |
西原, 宗太郎
渡邉, 拓貴
寺田, 努
塚本, 昌彦
|
著者名(英) |
Soutaro, Nishihara
Hiroki, Watanabe
Tsutomu, Terada
Masahiko, Tsukamoto
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
オンライン会議ではマイクやカメラを通じた音声と映像のみによるコミュニケーションとなるため,話し手の感情や雰囲気を正確に伝達することが困難である.音声によるコミュニケーションは,話の内容そのものを指す言語情報と,発話音声のアクセントや音量の強弱,声の高さ,間,発話の速さといった発言内容以外の情報を指す周辺言語の2つの情報で構成される.周辺言語の中でも語尾の音の高さを指す語尾ピッチは話し手の性格と印象を聞き手に類推させる上で重要な役割を果たす.そのため,聞き手に与える印象を操作するために,話し手の語尾の音の高さ,長さを適切に変化させることは有用だと考えられる.そこで本研究では,オンライン会議においてユーザが相手に与えたい印象を設定すると,システムがその設定に基づいてユーザ発話の語尾を自動で補正し,ユーザは通常どおり発話するだけで意図する印象を聞き手に与えられるオンライン会議向け語尾フィルタを提案する.提案手法の有効性を評価するため,提案システムにおける語尾フィルタの理想的な使用状況を再現した映像を被験者に視聴してもらい,ユーザに対して抱いた印象についてのアンケート評価を行った.結果として,「語尾ピッチ上げ」が加工なしに比べ有意に元気に感じ,「語尾ピッチ下げ」が加工なしに比べ有意に元気さが減少した.また,特定話者に対する語尾フィルタに用いるパラメータの適切な値の調査を行った結果,ユーザの印象を変化させるためには,「語尾ピッチ上げ」ではピッチ変化率を1.1倍以下に,「語尾ピッチ下げ」ではピッチ変化率を0.95倍以上に,「語尾伸ばし」では1.2倍以上1.8倍以下に設定すべきことが確認できた. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
In online conferencing systems, users can use only microphones and cameras; thus, it is challenging to accurately convey their emotions and moods. Communication with voice consists of two types of information: linguistic information and peripheral languages, such as accent, volume, pitch, pause, and speed of speech. Among peripheral languages, the pitch of the ending of a word helps listeners infer the speaker's character and impression. Therefore, we assume that it is helpful to change the speaker's pitch and length of the ending of a word to manipulate the speaker's impressions. This study proposed a system to enable the user's pitch and length of ending of a word to change automatically based on the user's preference: what impression the user wants to tell, and the user only needs to speak as usual. To investigate the system's effectiveness, we conducted a questionnaire evaluation using videos that reproduced the ideal use of the system. As a result, in the “energetic,” “pitch rising” was significantly greater than unprocessed, and “pitch falling” was significantly smaller than unprocessed. Furthermore, we evaluated to determine the appropriate system parameters. Evaluation results confirmed that the ratio of pitch rising should be less than 1.1 times, the ratio of pitch falling should be greater than 0.95 times, and the ratio of stretching should be more than 1.2 times and less than 1.8 times to change the user's impressions. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN00116647 |
書誌情報 |
情報処理学会論文誌
巻 65,
号 10,
p. 1533-1544,
発行日 2024-10-15
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
1882-7764 |
公開者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |