WEKO3
アイテム
動画像の特徴量を用いた意味的構造の自動検出
https://ipsj.ixsq.nii.ac.jp/records/19759
https://ipsj.ixsq.nii.ac.jp/records/1975953251870-69c5-4409-b594-d2ae846fe8d8
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2000 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2000-01-24 | |||||||
タイトル | ||||||||
タイトル | 動画像の特徴量を用いた意味的構造の自動検出 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Automatic Detection of the Semantic Structure from Video by Using N - gram Model | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
神戸大学大学院自然科学研究科 | ||||||||
著者所属 | ||||||||
神戸大学都市安全研究センター | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Graduate School of Science and Technology, Kobe University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Research Center for Urban Safety and Security, Kobe University | ||||||||
著者名 |
谷澤, 和昭
× 谷澤, 和昭
|
|||||||
著者名(英) |
Kazuaki, Tanizawa
× Kazuaki, Tanizawa
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | できごとや情景といった意味的情報に基づいて動画像データにアクセスするためには,内容に基づいたインデックス付けが必要である.インデックス付けで重要な問題は,動画像データの中からある決まった意味的情報を表している動画像区間をどのようにして特定するかという点である.本稿では,意味的なまとまりを持つ動画像区間を連続した動画像ショット列として定義し,定義に基づいてショットに分割された動画像データから情報として特徴量を自動的に抽出し,音声言語の確率モデルであるN-gramモデルを導入して動画像区間を発見する手法を提案する.また,N-gramモデルの応用として,部分的な動画像から原形となった動画像の全体を特定する実験について考察する. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | For indexing video data based on contents, it is necessary to access video data based on semantic information like a certain event and scene. The most important process in indexing is to determine a paticular appropriate video interval with specific semantic information. This is called semantic structure. In this paper, we propose an algorithm for discovering semantic structures of video data. This algorithm is to discover semantic video intervals as consecutive sequences of video shots. We show the system to extract the amount of characteristics of video data from video shots, and to retrieve paticular video interval from shot information by using a probability model which is proposed in the field of speech recognition. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN10112482 | |||||||
書誌情報 |
情報処理学会研究報告データベースシステム(DBS) 巻 2000, 号 10(1999-DBS-120), p. 75-82, 発行日 2000-01-24 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |