2. 华北理工大学 建筑工程学院, 河北 唐山 063210
2. School of Civil and Architectural Engineering, North China University of Science and Technology, Tangshan 063210, China
Dempster-Shafer(D-S)证据理论具有强大不确定信息推理和系统预测能力, 在假设信息可靠的基础上进行证据信任更新, 通过信息合成将多个证据相互支持与优势互补以取得优化结果.由于实际应用环境的复杂性, 证据间常存在不同程度的冲突(信息不一致)现象, 同时产生了由高度冲突引起的D-S证据理论合成约束问题.
Zadeh[1]首先提出D-S证据理论中的高度冲突问题, 指出证据在高度冲突时的合成结果可能会出现与实际常理相悖;Yager[2]认为所有冲突不能提供有用信息, 从而将冲突信任函数分配给未知项m(Θ)来消除冲突影响;Lefevre等[3-4]则认为冲突也是一种信息, 仅对冲突信息简单处理会造成系统信息损失, 提出将冲突信息从证据中隔离分析后再进行合理融合.部分学者根据证据特征函数BPA的特点, 将能够测度概率函数差异的信息距离引入度量, 如Martin等[5]通过Jousselme信息距离、李杨等[6-7]使用K-L信息距离等作为证据冲突的度量.传统冲突系数k和信息距离都是以一种独立因子进行证据间冲突程度测度, 统称为一元度量方法.有学者提出将不同度量组合进行证据冲突判定的思路, 以冲突系数k与Jousselme距离组合形式的二元度量方法为主, 蒋雯等[8]用简单平均法将两种不同的度量组合在一起, 这些二元度量方法都是建立在简单算法合成的基础上, 虽然分类组合能够契合相对复杂的冲突情况, 但未能从实质上解决冲突度量的不一致问题.
本文从证据冲突的现有定义及几种常用度量方法出发, 引入信息熵作为表征证据焦元内部离散程度的不确定度, 在现有二元度量方法的基础上, 提出一种新的基于证据不确定度的冲突度量方法;通过扩大度量差异, 增加对高度冲突信息识别显著性, 为进一步证据融合提供可靠信息保障.
1 证据冲突定义及描述Zadeh[1]首先提出在高度证据冲突时的D-S理论悖论后, Liu[9]最先给出了证据冲突的定义.在D-S理论中, 两个信度的冲突可以定性地认为是:一个信息源强烈地支持某个假设命题, 而另外一个信息源强烈地支持另一个假设命题, 并且这两个命题互补兼容.
1.1 D-S证据理论与冲突系数k假设一个非空集合Θ, 用以描述构成空间中具有互斥和可穷举的全部元素, Θ={A1, A2, …, AN}称为识别框架.一个元素个数为N的集合包括2N个互斥子集, 记为2Θ.在D-S理论中, 证据质量(Mass)用支持命题的信任度表示, 则D-S证据融合结果为[1]
(1) |
式中k为冲突系数, 在Dempster组合中用于表示被合成证据间的矛盾程度, (1-k)为剔除冲突干扰的归一化因子.
(2) |
式(1) 中, m(C)为m1,m2正交组合后产生的新证据赋值;C=Ai1∩Bj2, 当Ai1⊆Bj2时,Ci=Ai1, 表示焦元信息在证据间的一致部分;当Ai1∩Bj2=∅时, 表示焦元信息的不一致,即冲突.传统冲突系数k通过证据焦元的非相交程度描述冲突, k=1时为完全冲突, 0 < k < 1时为非完全冲突.
1.2 信息距离Zadehd[1]构造典型事例指出传统冲突系数k不能完全表征证据间的不一致, 使得能够测度概率函数差异的各种距离如Jousselme信息距离[5]、K-L信息距离[6-7]等成为证据冲突的一种度量方法.因目前无法证明各种距离测度方法彼此间的相对优势, 本文以Jousselme信息距离作为证据冲突距离测度的代表方法.
定义1[2] 由D-S证据理论, 在完备框架Θ下两证据的BPA函数为m1(x)=m1(Ai), m2(x)=m2(Bj), i=1, …, k; j=1, …, k.则两组证据Jousselme信息距离为
(3) |
式中:|·|为求模计算;∅为空集, 定义
假定有两个完全相同的证据: m1=m2=(0.6, 0.3, 0.1), 代入式(2), (3) 计算得出k=0.54, difJ=0, 两种不同度量表征的冲突程度不一致, 对证据冲突的识别提出了新的问题.
在传统冲突系数k和距离信息度量的基础上, 蒋雯等[8]采用(k, difJ)的二元度量方法, 通过算术组合进行合成冲突以弥补单一方法的不足.本文以当前研究较多的冲突系数k, Jousselme距离信息为组合形式, 对两种证据冲突的二元度量举例介绍.
定义2 为了综合证据间的包容性和差异性, 蒋雯等在文献[8]中给出一种以冲突系数k和Jousselme距离信息简单平均的二元冲突度量:
(4) |
定义2指出证据冲突由两种度量共同表征, 同时小时冲突较小, 同时大时冲突大, 一大一小时则判断冲突不大.
定义2仅在算法上进行了简单的组合, 缺少度量与冲突实质相关性分析的基础, 在证据冲突度量一致时体现有效性, 但对冲突不一致的复杂情况显然不能给出合理解释.
3 证据度量因子和不确定度 3.1 证据度量因子的选择现有两组证据报告为
计算得出k1=0.66, k2=0.34, 而difJ1=difJ2=0.由此可见, 证据冲突在不同度量时的不一致不但受到证据间焦元的非相交性和差异性的影响, 还和证据自身焦元的离散特征有关.
3.2 证据不确定度从信息价值角度, 证据焦元的概率赋值越集中, 即焦元间的差异越大, 证据的信息效用越高, 证据内部的冲突越小;相反, 焦元越平均, 说明证据不确定性越高, 证据存在内部矛盾.由此可知, 各焦元赋值相同的信度函数等同于完全不确定的证据, 在没有其他证据辅助下不能为决策提供有效信息.需要注意的是, 这里的完全不确定区别于m(∅)的完全不知道, 不确定是价值信息, 不确定度的大小代表信息价值的大小, 而m(∅)则是非价值信息.
证据焦元为[0,1]内的离散值, 用于描述数据离散主要有标准差和信息熵.本文选用信息熵(entropy)描述证据内焦元差异程度.为使度量更具可比性, 采用最大信息熵(焦元为均值1/n时数据离散程度最大, 信息熵最大)进行规一化处理, 给出基于信息熵的证据不确定度定义.
定义3 在完备框架Θ下, 当证据M:m(x)=m(Ai)(i=1, …, k), Ai为证据焦元, 则
(5) |
称为基于信息熵的证据不确定度(内部冲突度).规一化的证据不确定度值域为[0,1], 使用相对指标使证据不确定程度表征更具可比性.
本文认为:证据不确定度的增大导致不同度量的不一致问题.因此, 在冲突识别时, 应考虑对不确定度较高证据的度量和识别.
为此, 本文尝试给出一种基于证据不确定度的冲突度量模式, 通过内部矛盾影响因素与不同度量方法证据间差异进行综合考虑, 将证据冲突的涵义从证据间差异扩展为证据内、外两个视角, 以解决不同度量下冲突一致和不一致情况的度量组合问题.
4 基于不确定度的冲突度量与识别 4.1 基于不确定度的证据冲突多元度量本文在二元度量的基础上引入证据不确定度作为加权因子, 通过加权因子调整证据自身冲突对两种冲突度量的不同影响, 给出新的基于不确定度的多元度量冲突方法.
定义4 两证据在完备框架Θ下BPA为mi(A), mj(B), 其证据间传统冲突系数和Jousselme信息距离分别为kij和difJ, 则两证据的冲突为
(6) |
式中w1, w2为基于证据不确定度的冲突加权因子.假设两证据mi,mj不确定度VHi≥VHj, 得到归一化权重系数如下:
w1+w2=1, 且w1≥w2, 即通过不确定度VHi赋权“扩大”在度量不一致时冲突系数k的作用, 同时通过(1-VHj)“缩小”difJ的影响.
1) 当VHi=VHj→0时, w1=0, w2=1, con=difJ;
2) 当VHi=VHj→1时, w1=1, w2=0, con=k;
3) 当VHi=VHj→0.5时, w1=w2=0.5, con=(k+difJ)/2.
由此, 传统冲突系数k, 信息距离difJ与二元度量都是本文给出方法的特例情况.
基于不确定度的多元冲突度量更加符合本文对证据冲突从自身矛盾和证据间差异的内涵分析, 弥补了各种度量方法的自身缺陷, 在体现证据自身特征的基础上, 实现了证据冲突在不同度量下一致、不一致情况的有效合成, 使多元度量比原有一元、二元度量更具普遍适用性.
4.2 基于差异度的多元度量冲突识别证据数量较多的冲突识别系统, 在证据间的两两比较中, 会发生由于一个或几个“突出”冲突证据与其他证据在冲突度量后, 产生多个“较大”冲突值的现象, 从而降低了对“高度”冲突识别的有效性.为此, 本文给出了一种基于加大最大冲突与其他冲突差异的识别方法(简称“最大差异度”法), 具体操作如下.
1) 将得到的一组两两间证据按冲突大小进行排序;
为方便起见, 假定证据1与其他证据间的冲突排序如下:
con(m12)>con(m13)>con(m14)>con(m15)>…
2) 排除最大冲突证据, 求出剩余其他证据冲突的平均值;
根据假定maxcon(m12), 则
3) 计算各证据间冲突与平均冲突的差异度
(7) |
设定冲突识别门限εcon, 当εij < εcon时为低度证据冲突, 则该组证据中没有高度冲突, 冲突识别结束, 可以进行信息融合;当εij≥εcon时为高度证据冲突, 将该类证据进行隔离分析和处理.这种证据冲突识别方法, 降低某个“特别”高度证据对其他证据的冲突度量的影响, 在扩大证据冲突差异性的基础上加强了冲突识别的有效性.
5 验证分析在一个目标监测系统中, 假设辨识框架Θ={A, B, C}.设系统收集的8个证据, 其BPA函数m(A), m(B)和m(C)分别如下, 且满足
m1(A)=0.5, m1(B)=0.2, m1(C)=0.3;
m2(A)=0.01, m2(B)=0.89, m2(C)=0.1;
m3(A)=0.55, m3(B)=0.1, m3(C)=0.35;
m4(A)=0.55, m4(B)=0.1, m4(C)=0.35;
m5(A)=0.45, m5(B)=0.15, m5(C)=0.4;
m6(A)=0.1, m6(B)=0.8, m6(C)=0.1;
m7(A)=0.6, m7(B)=0.15, m7(C)=0.25;
m8(A)=0.5, m8(B)=0.25, m8(C)=0.25.
按照本文给出方法, 完成在证据信息融合前的证据冲突识别, 具体步骤如下:
1) 证据不确定度的识别.将8组证据代入式(5) 求得不确定度如下:
假定系统给定有效识别信度为0.5, 设证据M:m(x)=m(Ai)(i=1, 2, 3), 其中max(Al)=0.5, 其他两个焦元满足m(Aj)+m(Ak)=0.5, 且
2) 证据冲突的多元度量.将8组证据分别代入传统冲突系数k(式(2))和信息距离difJ(式(3))中, 取得两组冲突识别矩阵如下:
将证据不确定度和两组证据冲突矩阵的值代入式(6), 得到新的多元度量证据冲突矩阵如下:
对以上三组矩阵做三维图并与文献[8]的二元度量(式(4))构图进行比较(图 1~图 4).
① 传统冲突系数k(图 1)和信息距离difJ(图 2)在对同一组证据的冲突度量时存在较大的识别差异, 显然difJ的识别度高于k.
② 以不确定度为权重的合成方法同时兼顾了证据自身对证据间冲突的影响, 更加符合证据冲突的实质性, 同时解决了不同度量冲突不一致的问题;但在证据冲突的识别上没有明显的特征优势, 图 3与图 1较为接近.
③图 4为根据蒋雯二元度量直接简单平均k和difJ取得的构图, 在冲突识别度上较图 3略有优势, 体现了两种度量对证据冲突的综合影响;但简单的算术合成没有解决冲突不一致的问题.
3) 基于差异度的证据冲突识别.为了突出本文度量方法con的识别优势, 在多元度量的基础上应用“最大差异度”法进行冲突特征的识别处理.
将多元度量冲突矩阵代入式(7), 得到各证据间冲突与平均冲突的差异度矩阵:
由于εij=0(i=j)没有实际价值, 假设本系统中证据冲突差异度识别门限εcon=0.2, 即当证据冲突与平均冲突差异值在+20%以上时, 视为高度冲突(识别门限根据系统实际情况设定).矩阵中ε12, ε23, ε24, ε25, ε27, ε36, ε46, ε56, ε67>0.2, 得出系统存在显著特征不一致的证据为m2, m6.
将以上冲突差异度矩阵以三维图像表示为图 5.
图 5的证据冲突识别较之图 3具有更为显著的识别效果.由验证分析, 本文基于不确定度多元度量的主要优势体现为
① 通过度量合成有效地弥补了原有度量方法的不足, 多元度量能够有效表征证据间的冲突程度,并体现了度量的普适性.
② 将不确定度作为冲突合成的加权因子, 从证据内、外视角对冲突产生的原因进行了表述,并给出了具体量化方法, 使得多元度量更符合冲突的本质涵义.
③ 基于最大冲突差异度的冲突度量处理实现了证据冲突识别的显著化;得出的“冲突一致性”可以为证据判别提供有效的附加信息.
6 结论1) 证据的内部矛盾与证据间冲突度量的非一致性存在相互关系, 即证据内部矛盾越大证据间冲突度量越一致, 反之同理.
2) 描述证据内部矛盾的证据不确定度, 将证据冲突的内涵扩展为证据内和证据间不一致的共同作用.
3) 基于不确定度的高度冲突特征识别方法解决了以往度量冲突不一致的问题, 能够反映冲突发生的内涵,以及对于冲突实质的合理分析.
4) “最大冲突差异度”的处理进一步加强了对高度证据冲突的识别能力, 为信息融合提供了证据保障和有效的处理思路.
[1] | Zadeh L A. Review of books:a mathematical theory of evidence[J]. AI Magazine, 1984, 5(3): 81–83. |
[2] | Yager R R. On the D-S framework and new combination rules[J]. Information Sciences, 1987, 41(2): 93–138. DOI:10.1016/0020-0255(87)90007-7 |
[3] | Lefevre E, Colot O, Vannoorenberghe P. Belief functions combination and conflict management[J]. Information Fusion, 2002, 3(2): 149–162. DOI:10.1016/S1566-2535(02)00053-2 |
[4] | Xu G P, Tian W F, Qian L, et al. A novel conflict reassignment method based on grey relational analysis(GRA)[J]. Pattern Recognition Letters, 2007, 28(15): 2080–2087. DOI:10.1016/j.patrec.2007.06.004 |
[5] | Martin A, Jousselme A-L, Osswald C.Conflict measure for the discounting operation on belief functions[C]// International Conference on Information Fusion.Cologne, 2008:1-8. |
[6] |
李杨, 郭亚军, 杨友良.
基于K-L信息距离的证据冲突特征识别与应用[J]. 系统工程理论与实践, 2014, 34(8): 2071–2077.
( Li Yang, Guo Ya-jun, Yang You-liang. Identification and application of the evidence conflict based on K-L information distance[J]. Systems Engineering—Theory & Practice, 2014, 34(8): 2071–2077. DOI:10.12011/1000-6788(2014)8-2071 ) |
[7] | Li Y, Nan F. A multi-source information fusion method of nonidentical evidence conflicts[J]. Metallurgical and Mining Industry, 2015, 7(12): 338–345. |
[8] |
蒋雯, 彭进业, 邓勇.
一种新的证据冲突表示方法[J]. 系统工程与电子技术, 2010, 32(3): 562–565.
( Jiang Wen, Peng Jin-ye, Deng Yong. New representation method of evidential conflict[J]. Systems Engineering and Electronics, 2010, 32(3): 562–565. ) |
[9] | Liu W R. Analyzing the degree of conflict among belief functions[J]. Artificial Intelligence, 2006, 1(7): 909–924. |