东北大学学报(自然科学版) ›› 2023, Vol. 44 ›› Issue (9): 1234-1244.DOI: 10.12068/j.issn.1005-3026.2023.09.003
乔百友1, 郝元卿1, 唐忠1, 汪锐2
QIAO Bai-you1, HAO Yuan-qing1, TANG Zhong1, WANG Rui2
摘要: 现有非线性相关分析方法准确性低、计算代价大,因而不适合大规模、高维度台风轨迹数据相关分析.针对这一问题,首次将希尔伯特-施密特独立准则经验估计(Hilbert-Schmidt independent criterion empirical estimation, HSIC0)引入到台风移动轨迹相关研究中,提出了一种基于标准化互信息(normalized mutual information,NMI)结合HSIC0的多因素相关分析方法.该方法首先利用NMI来过滤掉台风数据中相关性低的冗余因素,然后采用XGBoost机器学习模型来剔除掉无效因素,从而降低后续计算代价.在此基础上,采用基于HSIC0的多因素相关分析方法对台风数据进行了分析,挖掘出了相关性较强的台风移动轨迹影响因素组合,从而提高了台风移动轨迹的预测精度.真实台风数据集上的一系列实验结果表明,提出的方法在MSE,MAE,R○2指标上均优于NMI、Pearson相关系数、距离相关系数等分析方法.
中图分类号: