WEKO3
アイテム
ベイズ符号化アルゴリズムを用いたテキストデータ圧縮
https://ipsj.ixsq.nii.ac.jp/records/31696
https://ipsj.ixsq.nii.ac.jp/records/31696c5a29b40-1f84-4d1b-9adf-c7c726288679
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
Copyright (c) 2007 by the Information Processing Society of Japan
|
|
オープンアクセス |
Item type | SIG Technical Reports(1) | |||||||
---|---|---|---|---|---|---|---|---|
公開日 | 2007-01-23 | |||||||
タイトル | ||||||||
タイトル | ベイズ符号化アルゴリズムを用いたテキストデータ圧縮 | |||||||
タイトル | ||||||||
言語 | en | |||||||
タイトル | Text Data Compression by Bayes Coding Algorithm | |||||||
言語 | ||||||||
言語 | jpn | |||||||
資源タイプ | ||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_18gh | |||||||
資源タイプ | technical report | |||||||
著者所属 | ||||||||
早稲田大学理工学部経営システムエ学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学部経営システムエ学科 | ||||||||
著者所属 | ||||||||
早稲田大学理工学部経営システムエ学科 | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Industrial Management System Engineering, School of Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Industrial Management System Engineering, School of Science and Engineering, Waseda University | ||||||||
著者所属(英) | ||||||||
en | ||||||||
Department of Industrial Management System Engineering, School of Science and Engineering, Waseda University | ||||||||
著者名 |
中野, 晶
小泉, 大城
松嶋, 敏泰
× 中野, 晶 小泉, 大城 松嶋, 敏泰
|
|||||||
著者名(英) |
Akira, Nakano
Daiki, Koizumi
Toshiyasu, Matsushima
× Akira, Nakano Daiki, Koizumi Toshiyasu, Matsushima
|
|||||||
論文抄録 | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | ベイズ符号は,情報源の確率分布のクラスは既知であり,そのパラメータは未知である場合のユニバーサル情報源符号化法で,ベイズ基準の下で冗長度を最小にする符号である.Contextnee情報源に対してベイズ符号を実現する手法として,逐次型ベイズ符号化アルゴリズムがあり,その必要メモリ量を削減したアルゴリズムとして改良型ベイズ符号化アルゴリズムがある.これらを用いてテキストデータを圧縮した際,モデルやパラメータの事前分布の不適合性より既存の圧縮ソフトウェアのbzip2などに圧縮性能で劣ることや,圧縮時の必要メモリ量が莫大なことなどから実用化には至っていない本研究では,ベイズ符号の実用化に向けて,必要メモリ量に制約をおいた上で,テキストデータに適合する事前分布を導入することにより圧縮性能を向上させることを目的とする. | |||||||
論文抄録(英) | ||||||||
内容記述タイプ | Other | |||||||
内容記述 | Bayes code is one of universal source coding algorithms, such that a class of the probabilistic model of source is known but its parameter is unknown. Bayes code provides Bayes optimality in terms of the redundancy. Bayes coding algorithm for the context tree sources has been proposed, and modified version of this algorithm to reduce the required memory has also been proposed. When text data is compressed by these algorithms, however, there are two problems. One is that the compression ratio is worse than conventional data compression algorithm such as bzip2, because the prior distribution of model or parameter does not fit text data. The other is that it needs enormous memory under the compression. This paper tries to improve Bayes coding algorithm in term of the compression ratio by using the other prior distribution, as well as constraint the limit of memory requirement, toward the implementation of text compression by Bayes coding algorithm. | |||||||
書誌レコードID | ||||||||
収録物識別子タイプ | NCID | |||||||
収録物識別子 | AN1009593X | |||||||
書誌情報 |
情報処理学会研究報告アルゴリズム(AL) 巻 2007, 号 5(2007-AL-110), p. 15-22, 発行日 2007-01-23 |
|||||||
Notice | ||||||||
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. | ||||||||
出版者 | ||||||||
言語 | ja | |||||||
出版者 | 情報処理学会 |