摘要: 与传统数据库对XML数据的处理不同,对XML流数据的处理不仅受实时性的约束,还受存储空间的限制.在Hole-Filler模型的基础上,首先利用XML的查询统计信息,定义了路径频率树,提出了基于兄弟关系的XML流数据剪切分片策略及其算法.在此基础上,提出了基于父子关系的XML流数据剪切分片策略及算法.这两个基于路径频率树的剪切算法有效地提高了XML片段的利用率,增强了XML片段的内聚性.实验结果表明,基于路径频率树的XML剪切算法在剪切时间、查询时间、空间消耗等方面都表现出较好的性能.
中图分类号:
霍欢;韩东红;回晓云;王国仁;. 基于路径频率树的XML流数据剪切分片技术[J]. 东北大学学报(自然科学版), 2008, 29(5): 657-660+676.
Huo, Huan (1); Han, Dong-Hong (1); Hui, Xiao-Yun (1); Wang, Guo-Ren (1) . PDT-based document fragmentation of XML streaming data[J]. Journal of Northeastern University, 2008, 29(5): 657-660+676.