@techreport{weko_195881_1, author = "大石,康智 and 木村,昭悟 and 川西,隆仁 and 柏野,邦夫 and David,Harwath and James,Glass", title = "画像を説明する多言語音声データを利用したクロスモーダル探索", year = "2019", institution = "日本電信電話株式会社コミュニケーション科学基礎研究所, 日本電信電話株式会社コミュニケーション科学基礎研究所, 日本電信電話株式会社コミュニケーション科学基礎研究所, 日本電信電話株式会社コミュニケーション科学基礎研究所, Spoken Language Systems Croup, MIT Computer Science and Artificial Intelligence Laboratory, Spoken Language Systems Croup, MIT Computer Science and Artificial Intelligence Laboratory", number = "42", month = "may" }