东北大学学报:自然科学版 ›› 2016, Vol. 37 ›› Issue (7): 931-936.DOI: 10.12068/j.issn.1005-3026.2016.07.005
王少鹏1, 闻英友1,2, 赵宏1,2
WANG Shao-peng1, WEN Ying-you1,2, ZHAO Hong1,2
摘要: 针对当前关于数据流加权最大频繁项集WMFI(weighted maximal frequent itemsets)的研究无法有效地处理频繁阈值和加权频繁阈值不一致情况下WMFI的挖掘问题,提出了完全加权最大频繁项集FWMFI(full weighted maximal frequent itemsets)的概念.为了减少naive算法在处理滑动窗口下完全加权最大频繁项集挖掘时存在的冗余运算,提出了FWMFI-SW(FWMFI mining based on sliding window over data stream)算法.所提出的算法通过基于频繁约束条件的优化策略减少了naive算法中MaxW优化策略的无效调用次数;采用编辑距离比率作为WMFP-SW-tree的重构判别函数,可以有效减少该树的重构次数.实验结果表明FWMFI-SW算法是有效的,且比naive算法更有时间优势.
中图分类号: