摘要: 分层无量纲化方法能够有效去除指标量纲影响的同时解决异常指标造成的数据分布不均衡、区分度低等问题.然而,该方法的使用需要人为指定区间数,使得无量纲化结果受人为因素的干扰,失去客观性.针对该问题,考虑原始数据的分布特征,提出了密度分层无量纲化方法.该方法按照数据分布的疏密程度进行区间划分,客观确定分层级数,同时兼顾分层无量纲化方法的优点,计算相对简单且减少了人为干扰.此外,通过随机模拟发现,该方法对于异常值具有较好的抗干扰性,且无量纲化结果的均衡性受原始数据规模影响.
中图分类号:
易平涛, 袁建荣, 李伟伟. 基于数据分布特征的分层无量纲化方法及其均衡性分析[J]. 东北大学学报(自然科学版), 2023, 44(6): 889-897.
YI Ping-tao, YUAN Jian-rong, LI Wei-wei. Hierarchical Dimensionless Method Based on Data Distribution Characteristics and Its Equilibrium Analysis[J]. Journal of Northeastern University(Natural Science), 2023, 44(6): 889-897.