东北大学学报(自然科学版) ›› 2003, Vol. 24 ›› Issue (1): 23-26.

• 论著 • 上一篇    下一篇

基于统计的汉英法律文献亚句子级对齐

吕学强;李清隐;任飞亮;姚天顺   

  1. 东北大学信息科学与工程学院 ;东北大学信息科学与工程学院 ;东北大学信息科学与工程学院 ;东北大学信息科学与工程学院 辽宁沈阳 110004
  • 收稿日期:2013-06-23 修回日期:2013-06-23 出版日期:2003-01-15 发布日期:2013-06-23
  • 基金资助:
    国家自然科学基金资助项目(60083006);;国家重点基础研究发展规划资助项目(G19980305011)·

  • Received:2013-06-23 Revised:2013-06-23 Online:2003-01-15 Published:2013-06-23

摘要: 基于统计的句子对齐是根据双语句子的长度在所有可能的对齐中找出概率最大的一个·提出两种对齐汉英语料的参数计算方法,使对齐模型中的评价函数满足标准正态分布·参数s2的值是对训练语料中的所有点(l1,(l2-cl1)2)进行线性回归分析所得直线的斜率,s2的另一种求法是直接计算方差·实验结果表明汉英法律文献亚句子级对齐的正确率为98 8%,召回率为99 2%·

关键词: 双语语料库, 汉英法律文献, 亚句子级对齐, 统计方法, 评价函数, 参数计算, 标准正态分布