摘要: 频繁项的查询是一项非常重要的技术,但在新兴的不确定数据领域却是一项新的研究课题.基于不确定数据,提出了一种新的频繁项定义,并提出了两条过滤规则,可以有效地减少检测数据的数量.最后提出高效的频繁项查询算法UFI,该算法通过找到概率求解中的递推规律,极大提高了单点检测效率.实验结果显示:提出的方法可以有效地减少候选集,降低搜索空间,改善在不确定数据上的查询性能.
中图分类号:
王爽;杨广明;朱志良;. 基于不确定数据的频繁项查询算法[J]. 东北大学学报(自然科学版), 2011, 32(3): 344-347.
Wang, Shuang (1); Yang, Guang-Ming (1); Zhu, Zhi-Liang (1) . Frequent items detection of uncertain data[J]. Journal of Northeastern University, 2011, 32(3): 344-347.