摘要: 已有的Top-k高效用项集挖掘为了保持向下封闭性,利用项集的事务效用代替其真实效用,使得项集效用被估计得过大,导致剪枝效果不好,挖掘效率较低.针对这一问题,提出了索引效用的概念,在此基础上建立两级索引,并进行索引剪枝,增强了挖掘中剪枝的效果,提高了Top-k高效用项集挖掘的效率;此外,通过建立效用矩阵,支持对项集效用的快速计算,进一步提高了挖掘效率.不同类型数据集上的实验验证了所提出的Top-k高效用项集挖掘方法的有效性和高效性.
中图分类号:
林树宽, 王晓丛, 乔建忠, 王蕊. 基于索引效用的Top-k高效用项集挖掘方法[J]. 东北大学学报:自然科学版, 2016, 37(1): 24-28.
LIN Shu-kuan, WANG Xiao-cong, QIAO Jian-zhong, WANG Rui. A Top-k High Utility Itemset Mining Method Based on the Index Utility[J]. Journal of Northeastern University Natural Science, 2016, 37(1): 24-28.