Item type |
SIG Technical Reports(1) |
公開日 |
2015-06-05 |
タイトル |
|
|
タイトル |
文字列ラベルを用いたダブル配列表現 |
タイトル |
|
|
言語 |
en |
|
タイトル |
Double-array Representation with String Labels |
言語 |
|
|
言語 |
jpn |
資源タイプ |
|
|
資源タイプ識別子 |
http://purl.org/coar/resource_type/c_18gh |
|
資源タイプ |
technical report |
著者所属 |
|
|
|
徳島大学大学院先端技術科学教育部 |
著者所属 |
|
|
|
徳島大学大学院先端技術科学教育部 |
著者所属 |
|
|
|
徳島大学大学院先端技術科学教育部 |
著者所属 |
|
|
|
徳島大学大学院先端技術科学教育部 |
著者所属(英) |
|
|
|
en |
|
|
Department of Information Science and Intelligent Systems, Tokushima University |
著者所属(英) |
|
|
|
en |
|
|
Department of Information Science and Intelligent Systems, Tokushima University |
著者所属(英) |
|
|
|
en |
|
|
Department of Information Science and Intelligent Systems, Tokushima University |
著者所属(英) |
|
|
|
en |
|
|
Department of Information Science and Intelligent Systems, Tokushima University |
著者名 |
神田, 峻介
泓田, 正雄
森田, 和宏
青江, 順一
|
著者名(英) |
Shunsuke, Kanda
Masao, Fuketa
Kazuhiro, Morita
Jun-ichi, Aoe
|
論文抄録 |
|
|
内容記述タイプ |
Other |
|
内容記述 |
トライは枝に文字を付随した順序木であり,情報検索や自然言語処理等において効率的なキー集合の管理を実現する.このトライを表現するデータ構造として,高速性に秀でたダブル配列が提案されている.ダブル配列の記憶量はトライのノード数に依存するため,ノード数を削減することで記憶効率は向上する.少ないノード数でトライを実現するため,MP トライ (Minimal-Prefix Trie) や DAWG (Directed Acyclic Word Graph) が提案されており,ダブル配列はこれらデータ構造も効率的に表現することができる,一方,MP トライや DAWG にも,枝に文字列ラベルを付随することができれば削減できるノードが数多く存在する.しかし,ダブル配列により文字列ラベルを表現する手法は提案されていない.本稿では,ラベルのサイズに応じた複数の配列を導入することにより,文字列ラベルを表現する新しいダブル配列構造を提案する.また,実験により提案手法の有効性を示す. |
論文抄録(英) |
|
|
内容記述タイプ |
Other |
|
内容記述 |
A trie is an ordered tree structure with a character on each edge. The trie provides an efficient management of a keyword set in natural language processing, information retrieval systems and so on. The double-array with a high-speed performance has been proposed to represent the trie efficiently. As its space usage depends on the number of trie nodes, the space usage decreases by reducing nodes. To reduce the number of trie nodes, a Minimal-Prefix (MP) trie and a Directed Acyclic Word Graph (DAWG) have been proposed, and the double-array can represent the data structures efficiently. On the other hand, the data structures include many nodes that can be reduced by giving a string label to each edge. However, the double-array with the string labels have not been proposed. This paper proposes a new double-array structure with the string labels by using multiple arrays depending on label sizes. Moreover, we show its effectiveness by experiments. |
書誌レコードID |
|
|
収録物識別子タイプ |
NCID |
|
収録物識別子 |
AN1009593X |
書誌情報 |
研究報告アルゴリズム(AL)
巻 2015-AL-153,
号 22,
p. 1-8,
発行日 2015-06-05
|
ISSN |
|
|
収録物識別子タイプ |
ISSN |
|
収録物識別子 |
2188-8566 |
Notice |
|
|
|
SIG Technical Reports are nonrefereed and hence may later appear in any journals, conferences, symposia, etc. |
出版者 |
|
|
言語 |
ja |
|
出版者 |
情報処理学会 |