东北大学学报(自然科学版) ›› 2023, Vol. 44 ›› Issue (1): 33-39.DOI: 10.12068/j.issn.1005-3026.2023.01.005
王瀛1,2, 王泽浩3, 李红4, 黄文军4
WANG Ying1,2, WANG Ze-hao3, LI Hong4, HUANG Wen-jun4
摘要: 为了从来源不同的威胁情报中提取关键信息,方便政府监管部门开展安全风险评估,针对威胁情报文本中英文混杂严重以及专业词汇生僻导致识别困难的问题,在BiGRU-CRF模型基础上,提出了一种融合边界特征以及迭代膨胀卷积神经网络(IDCNN)的威胁情报命名实体识别方法.该方法根据人工构造的规则词典将边界清晰的实体例如英文单词进行转化以减少模型在处理较长文本时容易造成的信息损失,通过IDCNN和双向门控循环单元(BiGRU)进一步提取了文本的局部和全局特征.通过在威胁情报语料库上进行实验,结果表明所提的方法模型在相关评价指标上均优于其他模型,F值达到87.4%.
中图分类号: