东北大学学报:自然科学版 ›› 2016, Vol. 37 ›› Issue (9): 1245-1249.DOI: 10.12068/j.issn.1005-3026.2016.09.007
吕艳霞, 王翠荣, 王聪, 于长永
LYU Yan-xia, WANG Cui-rong, WANG Cong, YU Chang-yong
摘要: 在大数据环境下,由于隐私保护、数据丢失等原因,数据普遍存在不确定性;数据流系统中数据不断地到达系统,只扫描一遍且不能一次性全部获得;所以要构建一个增量分类模型来处理不确定数据流分类.本文基于VFDT算法提出了WBVFDTu算法,该算法在学习和分类阶段都可快速而有效地分析不确定信息.在学习期间,采用Hoeffding分解定理构造决策树模型;在分类期间,在决策树的叶子节点利用加权贝叶斯分类算法提高模型的分类准确率和算法的执行效率.最终证明该算法能够非常快速地学习不确定数据流,提高分类的准确率.
中图分类号: