东北大学学报:自然科学版 ›› 2019, Vol. 40 ›› Issue (6): 795-800.DOI: 10.12068/j.issn.1005-3026.2019.06.007
刘军1, 冷芳玲2, 李世奇2, 鲍玉斌2
LIU Jun1, LENG Fang-ling2, LI Shi-qi2, BAO Yu-bin2
摘要: 在现有的开源分布式文件存储系统HDFS上,构建一个智能大数据存储系统IHDFS.该系统提出了大数据去重模块、大数据放置模块、大数据智能迁移模块和大数据编码模块,构造了智能分布式文件存储系统,可以提高用户访问效率,节省集群的存储空间.实验结果表明,数据去重模块很好地节省了存储空间;数据放置模块合理地分配文件上传的存储层,使数据上传速度提高一倍;数据智能迁移模块提高了用户在高等存储层上文件的命中率,提高了用户获取数据的效率;数据编码模块节省了集群的储存空间,节省了大约原来存储空间的三分之一.
中图分类号: