基于改进变精度贝叶斯粗糙集的感性知识获取

引用本文 [复制中英文]

胡名彩, 郭伏, 叶国全. 基于改进变精度贝叶斯粗糙集的感性知识获取[J]. 东北大学学报:自然科学版, 2018, 39(12): 1794-1799.

HU Ming-cai, GUO Fu, YE Guo-quan. Kansei Knowledge Acquisition Based on the Improved Variable Precision Bayesian Rough Set[J]. Journal of Northeastern University Nature Science, 2018, 39(12): 1794-1799. DOI: 10.12068/j.issn.1005-3026.2018.12.024.

[复制英文]

基金项目

国家自然科学基金资助项目(71471033, 71771045)；东北大学“双一流”学科建设资助项目(02050021940101)

作者简介

胡名彩(1992-), 男, 江西吉安人, 东北大学博士研究生;
郭伏(1964-), 女, 辽宁开原人, 东北大学教授, 博士生导师。

文章历史

收稿日期：2017-09-11

Contents Abstract Full text Figures/Tables PDF

基于改进变精度贝叶斯粗糙集的感性知识获取

胡名彩, 郭伏, 叶国全

东北大学工商管理学院, 辽宁沈阳 110169

收稿日期：2017-09-11

基金项目：国家自然科学基金资助项目(71471033, 71771045)；东北大学“双一流”学科建设资助项目(02050021940101)。

作者简介：胡名彩(1992-), 男, 江西吉安人, 东北大学博士研究生;
郭伏(1964-), 女, 辽宁开原人, 东北大学教授, 博士生导师。

摘要：变精度贝叶斯粗糙集方法是感性知识获取中处理用户群个性化感性差异的一种柔性方法, 针对其在感性规则提取阶段可能产生的组合爆炸问题, 提出了一种基于顺序覆盖策略的改进算法.该算法以感性决策类的近似区域作为输入, 以选取覆盖能力最大的合取项为贪心搜索策略实现规则特化.在此基础上, 通过迭代学习逐步完成对近似区域的覆盖和决策规则集的提取.最后, 通过基础实例和烤面包机外观设计实例验证了改进方法的有效性.

关键词：感性工学知识获取决策规则贝叶斯粗糙集顺序覆盖策略

Kansei Knowledge Acquisition Based on the Improved Variable Precision Bayesian Rough Set

HU Ming-cai, GUO Fu, YE Guo-quan

School of Business Administration, Northeastern University, Shenyang 110169, China

Corresponding author: GUO Fu, E-mail: fguo@mail.neu.edu.cn

Abstract: The variable precision Bayesian rough set(VPBRS)approach is a flexible method for Kansei knowledge acquisition to accommodate the individual differences within a user group. In order to handle the possible combinatorial explosion at the stage of Kansei rule extraction, an improved algorithm based on sequential covering strategy is proposed. Basically, the approximation regions of Kansei decision classes are taken as the input, and the selection of conjunctive items with maximum covering ability is taken as the greedy search strategy for rule specialization. On this basis, the approximation region is covered step by step through iterative learning, and the decision rule set is extracted. A basic example and a design example of toaster appearance are conducted, whose results show that the improved VPBRS approach is effective.

Key words: Kansei engineering knowledge acquisition decision rule Bayesian rough sets sequential covering strategy

进入体验经济时代, 对美学、感觉和印象等用户自我情感价值的体现成为产品设计成功的关键^[1].感性工学因其提供了获取用户群感性需求并转译为具体产品设计要素的实施框架^[2]而广泛受到学术界和企业界的研究与应用^[3-4].感性知识是量化感性意象与产品设计要素间关系的逻辑推理结构, 其不仅可以直接指导产品开发, 而且可以通过进一步建立专家系统实现快速自动化以及智能设计^[5].考虑感性需求的不稳定性、主观不精确性以及个性化等特点带来的挑战, 感性知识获取一直是感性工学研究的热点和难点.

已有的感性研究广泛采用软计算技术对感性与产品设计要素间不精确的关联关系进行建模.这些研究采用语义差异量表收集用户评价数据并仅仅采用评分均值作为相应产品样本在特定感性意象上的水平估计(测量).其基本假设是用户在每个意象上的评分服从正态分布, 而且评价值的方差应随着所设计产品样本的参数的改变而保持为常数^[6].然而, 用户的感性评价过程是极主观和个人化的, 上述“恒方差假设”往往难以得到验证.最新研究表明, 感性评分实际上更表现为非正态的概率分布^[7].

个性化感性这一科学问题^[2]的重要性受到广泛认可, 但其困难程度也是明显的.研究表明, 即使在精心定义的用户群内, 诸如个人生活经历、个人价值取向和文化环境等内外部因素都可能使个人感性评价的差异变得显著^[8].另一方面, 调控设计和制造环节来匹配每个潜在用户的个性化需求实际上是不可能的.因此, 合理的方案是度量并适应用户群内部的个性化差异带来的影响.然而, 该问题仍未得到充分的研究.

考虑已有的尝试, 普遍的思路是提高“平均值测量”的鲁棒性.比如Hong等^[6]采用的均方根误差标准, Li等^[9]引入的田口方法中的信噪比.这类方案在处理感性均值的同时还考虑了评分值方差的影响.然而, 这些研究仍将评分均值作为感性水平的估计, 评分差异只是作为“噪声”并最小化其影响.考虑在用户群中可能无法找到一个评价方式与“平均值水平”相符的用户, 仅仅采用了平均值参与感性水平估计的做法仍受到质疑^[10].Diego-Mas等^[10]提出了面向单个用户的感性反应模型.其基本假设是如果某个用户群评价产品的方式显得足够一致, 那么该用户群内所有用户的感性反应就可以由一个代表性用户来代表.该方案避免了“平均值水平”, 但代表性用户的选择过程仍然很主观.重要的是, 单个用户的评价数据难以体现统计效力.相比之下, Nishino等^[11]提出的基于变精度贝叶斯粗糙集(variable precision Bayesian rough set, VPBRS)方法显得更为有效.该方法结合了概率推理与粗糙近似, 在感性水平估计中完全考虑了每位用户对每个产品样本在每个感性意象上的评价值, 并可处理由个性化差异带来的各种数据不一致性.多年来, VPBRS方法已被广泛应用于咖啡口味、童鞋、啤酒罐和汽车内饰等设计项目中, 并被纳入感性工学的理论框架中^[12].但面对较大规模的多属性决策表时, 传统VPBRS方法在感性规则提取上存在组合爆炸的风险.针对此问题, 本文提出了一种基于顺序覆盖策略的改进方法, 并通过两个算例说明了新方法的有效性.

1 感性知识获取 1.1 知识获取思想

感性工学的执行过程主要分为:1)产品的语义属性空间的生成; 2)产品的设计属性空间的生成; 3)语义属性(感性意象)空间和设计属性空间的关联; 4)关系有效性的测试; 5)关系模型的建立^[2].该框架的基础假设为特定产品的特定设计属性会引起用户特定的感性反应.从决策的角度考虑, 语义属性和设计属性可以被分别当作决策属性和条件属性.因此, 一个通常的感性工学问题就可以转化为一个多准则决策问题.本文以粗糙集理论为背景, 面向由4元组S=(U, C∪D, V, f)所表征的感性决策表.其中, U表示所有评价记录组成的非空论域, C和D分别表示条件属性(设计要素)和决策属性(感性意象), V表示属性值域, 信息函数f:U×(C∪D)→V表示记录x在属性q上的取值f(x, q)∈V_q.在粗糙集理论中, 知识被定义为一种分类的能力.因此, 感性知识获取即转变为从决策表S中挖掘具有分类能力的决策规则集.

1.2 变精度贝叶斯粗糙集方法

如前所述, 考虑个性化感性差异的显著影响, 本文选择VPBRS方法作为感性知识获取的基础.VPBRS方法^[11]分为两个阶段:1)基于贝叶斯概率和信息增益计算感性决策类的近似区域, 即完成产品样本的划分; 2)基于区分函数和评价指标从近似区域中提取决策规则集.

记E_i表示产品i(i=1, …, m)对应的评价记录所组成的子论域, 决策类D_j表示感性意象评分等级j(j=1, …, n)所对应的子论域.估计D_j的先验概率以及D_j在产品论域E_i上的条件概率分别为

(1)

(2)

其中, |·|表示集合的基数.

将先验概率P(D_j)和后验概率P(D_j|E_i)间的差异定义为产品的一种信息增益:

(3)

那么, 可以通过参数β将决策类的下近似(正)区域、负区域和边界区域分别定义为

(4)

(5)

(6)

以正区域为例, 进一步构建区分矩阵, 其元素定义为

(7)

其中:s表示正区域内的产品序号; t表示非正区域内的产品序号; ∨a_k=v_sk表示区分产品E_s和E_t的属性取值的析取.之后, 通过如下的区分函数即可提取决策规则:

(8)

在后续的知识纯化中, 可根据如下定义的评价指标对决策规则进行筛选:

(9)

(10)

其中:Cond_r表示规则r覆盖的产品集; Cer(r; D_j)和Cov(r; D_j)分别表示规则r对决策类D_j具有的置信度和覆盖率.

2 基于顺序覆盖策略的改进VPBRS方法

在VPBRS方法的第二阶段中, 虽然区分函数的逻辑运算可简化决策规则, 但区分函数的求解是一个组合问题.为了避免组合爆炸, 已有策略是:1)利用遗传算法等启发式算法对初始决策表进行属性约简; 2)基于约简核属性重新构建决策表, 并生成详尽规则集; 3)采用置信度、覆盖率、支持度、强度等规则评价指标筛选并提取强规则集^[12].事实上, 这也是当前应用粗糙集开展相关感性研究所采取的主要策略.该策略适用于1.1节中所描述的感性决策问题, 并能避免组合爆炸问题.然而, 有效的感性知识可能同时涵盖约简核属性和少数非约简核属性, 这是该策略所无法获取的.此外, 属性约简算法选取的不同和设定的强规则提取指标的不同将导致感性知识获取结果的差异和不确定性.

本文基于顺序覆盖策略(sequential covering strategy, SCS)^[13], 探索一种快速的并能有效避免组合爆炸的感性规则提取算法.SCS的基本思想是:学习并构建一条覆盖最多训练对象的规则, 从训练域中移除该规则所覆盖的所有对象; 如此迭代学习并逐步构建规则集, 直至实现对整个训练域的覆盖.该策略已被广泛应用于AQ算法族, CN2, LEM, LEM2, IREP, RIPPER等一系列著名的规则学习算法^[13].本文所提出的感性规则提取算法受LEM2^[14]算法形式所启发, 故简称为扩展的LEM2算法(E-LEM2).E-LEM2算法旨在改进VPBRS方法的第二阶段, 即规则提取.因此, VPBRS方法的第一阶段计算得到的近似区域将作为E-LEM2算法的输入.以正区域为例, 以伪代码的形式对E-LEM2算法进行说明, 见表 1.

表 1 E-LEM2算法的步骤 Table 1 Procedures of E-LEM2 algorithm

表 1中, 正区域B_j内的各产品样本在各设计要素上的设计水平取值构成了基本条件属性(即属性-取值对), EC表示生成的基本条件属性库, C代表设计要素集, V_c代表设计要素c的设计水平的值域(行6).E-LEM2算法以贪心的方式实现条件属性组r(合取式)的增长(行8~13), 该过程即规则的特化; Cond_r表示r覆盖的产品样本集, 当r符合终止条件(行7), 即被提取作为相应迭代步中的最佳规则.其中, 关键的评估函数evaluate被定义为(行10).具有最大evaluate值的基本条件属性ec被提取作为最优的合取项(行9~12);如遇等值情况, 则提取覆盖最多对象的基本条件属性, 即evaluate=|Cond_x∩B_j|.结合决策后件、规则置信度和规则覆盖率, 感性规则得以最终生成(行16).其中, 置信度Cer(r; D_j)和覆盖率Cov(r; D_j)的计算方法分别见式(9)和式(10).

值得强调的是, 由于E-LEM2提取的是最小决策规则, 故无需应用规则置信度和覆盖率进行检验并提取强规则集, 此处对该评价指标的计算旨在辅助决策者解译规则.此外, E-LEM2算法采用了贪心搜索的规则特化方式, 因此无法保证所提取的最小决策规则集是全局最小的.

为了说明改进方法的有效性, 研究了一个对照的基础实例和一个产品设计实例.其中, 所有的决策规则挖掘过程均通过Matlab编程语言实现.

3 算例 3.1 基础实例

通过文献[11]中的算例对比传统VPBRS方法及其改进方法的感性规则提取结果.在该算例(详细数据见文献[11])中, 产品样本集E={1, 2, 3, 4}, 设计要素集A={a₁, a₂, a₃}, 值域V_a1= V_a2= V_a3={0, 1}, 评价因子d的值域为V_d={0, 1, 2}.在信息增益参数β=0.2的情况下, 各决策类的下近似区域分别为:POS^0.2(D₀)={1, 4}, POS^0.2(D₁)={2}和POS^0.2(D₂)={3}.采用上述两种方法分别对区域POS^0.2(D₀)和POS^0.2(D₁)进行规则挖掘, 结果见表 2.

表 2 VPBRS方法及其改进方法的感性规则提取结果 Table 2 Extraction results of Kansei rules by VPBRS and its improved approach

容易发现, VPBRS方法挖掘得到的是详尽决策规则集.而去除该详尽规则集中的各类冗余规则(即r₁和r₂相比r₃是冗余的; r₅, r₆和r₇相比r₄是冗余的)后, 其最小形式与改进方法的挖掘结果一致.这体现了本文改进方法的简洁有效.

3.2 产品设计实例——烤面包机的外观设计

通过烤面包机外观设计实例进一步说明提出的改进方法的潜在应用.

通过查阅厨具类设计杂志、企业网站、相关感性产品研究等资料, 获取了50个描述烤面包机外观的初始感性意象词.采用亲和图法提取出代表性的感性意象词集D={时尚的, 简洁的, 耐用的, 创新的, 精致的}.通过对收集的代表性烤面包机样本进行形态分析, 解构出13个设计要素以及对应的总计26个设计水平.这些设计要素涵盖了外观的主特征(主视面长宽比、轮廓线形状)、附加特征(功能性按钮的造型)以及相关特征(功能性按钮与机身外壳材质的统一与否).

为了简化描述, 设计要素由集合C={A, F, G, H, I, J, K, L, M, N, O, P, Q}代表.通过正交试验设计, 获得16款烤面包机外观的设计配置方案.使用Rhinoceros 4.0三维建模软件建立实体模型, 并使用KeyShot 4.0进行色彩及材质的渲染.最终, 以视频形式将16款烤面包机外观的三维旋转场景呈现给32名具有实际的烤面包机使用经历的用户.用户通过由5个代表性感性意象构建的7级语义差异量表完成了对16款产品样本的评价.每名用户在每个样本的每个感性意象上的评分见表 3, 限于篇幅, 表 3仅展示了部分数据.

表 3 烤面包机外观设计实例数据 Table 3 Sample data of toaster appearance design

产品序号	被试序号	感性意象得分(决策属性)					设计要素编码(条件属性)
产品序号	被试序号	时尚的	简洁的	耐用的	创新的	精致的	A	F	G	H	I	J	K	L	M	N	O	P	Q
1	1	2	6	4	6	5	1	1	2	2	2	2	1	1	2	1	1	1	2
⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮
1	32	4	5	5	5	3	1	1	2	2	2	2	1	1	2	1	1	1	2
⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮
16	1	6	3	5	2	6	2	2	2	1	2	1	2	1	2	1	2	1	1
⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮	⋮
16	32	5	5	5	4	4	2	2	2	1	2	1	2	1	2	1	2	1	1

表 3 烤面包机外观设计实例数据 Table 3 Sample data of toaster appearance design

剔除表 3中的部分无效记录后最终得到505条评价记录.采用改进VPBRS方法的挖掘(信息增益参数根据各决策表的实际情况取值为0.2或0.1)结果见表 4.限于篇幅, 表 4仅展示了从各感性意象的正向决策类中获取的感性知识.

表 4 基于改进VPBRS方法获取的感性知识 Table 4 Aquired Kansei knowledge based on the improved VPBRS approach

对表 4中的规则进行解译即可直接用于设计决策.比如, 规则#1表明当机身外壳主视面采用白色, 且Logo处于主视面中间偏上的位置时, 其对于90.3%的用户来说是时尚的; 反过来, 时尚的烤面包机外观中有33.3%满足上述配置.对比规则#1至#9发现设计要素主视面颜色(H)的出现频率最高, 这表明在配置外观设计要素时, 颜色对感知的影响要高于其他形态类设计要素, 这符合人的视觉感知规律, 并与Shieh等^[5]的研究结论一致.进一步解译发现, 主视面采用白色有助于促进用户对“时尚的”、“简洁的”和“创新的”的感知; 当主视面采用黑色则能促进用户对“耐用的”和“优雅的”的感知.后续应用中, 可调查更多元的颜色设计水平以获取更丰富的感性知识.此外, 形态类设计要素中, 反映外观整体间相互关系的设计要素(O, P和Q)对用户感知起到了重要作用, 这与Chang等^[15]的研究结论一致.

表 5 八折交叉验证的结果 Table 5 Test results of eight-fold cross-validation

本文采用八折交叉验证法检验E-LEM2算法所获取的感性知识的泛化能力.总计16款烤面包机样本被随机分割为训练集和测试集.对于每折, 14款样本对应的评价记录被用于知识获取, 剩余的2款样本用于测试.以测试样本中先验概率高的决策类作为其实际的感性水平估值.根据能否分类以及预测结果与测试样本实际定位一致与否对测试结果进行统计, 以感性意象“时尚的-古朴的”为例, 其八折交叉验证的结果见表 5.其中, 感性知识的分类准确率达到了81.25%, 分类覆盖率达到了93.75%.

综合其余4个感性意象的结果, 测试集分类准确率均值为77.5%, 分类覆盖率均值为90%, 这在本文中处于可接受的范围.过于精简的决策规则集将导致无法准确分类或覆盖某些新增的产品样本, 实际应用中, 可结合数据特点, 灵活调整信息增益参数以获取合理规模的感性知识.

4 结论

本文针对传统VPBRS方法在感性规则提取阶段可能产生的组合爆炸问题, 提出了一种基于顺序覆盖策略的改进算法E-LEM2.该算法应用贪心搜索快速实现规则特化, 并通过迭代学习逐步完成对目标区域的覆盖.该算法直接从感性决策类的近似区域中获取了决策规则集, 因而无须开展属性约简和强规则提取.此外, 由于只需输入近似区域中的产品信息, E-LEM2算法可以推广到其他粗糙集方法的规则提取中.基础实例的结果验证了改进方法与VPBRS方法所获取的规则集的最小形式保持一致.烤面包机外观设计实例的结果进一步验证了改进方法所获取的感性知识具有一定的泛化能力.

受近似区域的计算方法的限制, VPBRS方法仍只能处理二决策类的感性评价数据, 未来研究将进一步探索多决策类问题下的感性知识获取.

参考文献

[1]	Meiselman H L. A review of the current state of emotion research in product development[J]. Food Research International, 2015, 76: 192–199. DOI:10.1016/j.foodres.2015.04.015
[2]	Nagamachi M. Kansei engineering:a new ergonomic consumer-oriented technology for product development[J]. International Journal of Industrial Ergonomics, 1995, 15(1): 3–11. DOI:10.1016/0169-8141(94)00052-5
[3]	Vieira J, Osório J M A, Mouta S, et al. Kansei engineering as a tool for the design of in-vehicle rubber keypads[J]. Applied Ergonomics, 2017, 61: 1–11. DOI:10.1016/j.apergo.2016.12.019
[4]	赵晓煜, 曹忠鹏, 张昊. 基于感性工学的服务场景设计方法[J]. 东北大学学报(自然科学版), 2011, 32(9): 1360–1363. ( Zhao Xiao-yu, Cao Zhong-peng, Zhang Hao. Method for designing servicescape based on Kansei engineering[J]. Journal of Northeastern University(Natural Science), 2011, 32(9): 1360–1363. )
[5]	Shieh M D, Yeh Y E, Huang C L. Eliciting design knowledge from affective responses using rough sets and Kansei engineering system[J]. Journal of Ambient Intelligence and Humanized Computing, 2016, 7(1): 107–120. DOI:10.1007/s12652-015-0307-6
[6]	Hong S W, Han S H, Kim K J. Optimal balancing of multiple affective satisfaction dimensions:a case study on mobile phones[J]. International Journal of Industrial Ergonomics, 2008, 38(3/4): 272–279.
[7]	Yan H B, Ma T, Sriboonchitta S, et al. A stochastic dominance based approach to consumer-oriented Kansei evaluation with multiple priorities[J]. Annals of Operations Research, 2017, 256(2): 329–357. DOI:10.1007/s10479-016-2249-6
[8]	Jokinen J P. Emotional user experience:traits, events, and states[J]. International Journal of Human-Computer Studies, 2015, 76: 67–77. DOI:10.1016/j.ijhcs.2014.12.006
[9]	Li Y, Zhu L. Optimisation of product form design using fuzzy integral-based Taguchi method[J]. Journal of Engineering Design, 2017, 28(7/8/9): 480–504.
[10]	Diego-Mas J A, Alcaide-Marzal J. Single users' affective responses models for product form design[J]. International Journal of Industrial Ergonomics, 2016, 53: 102–114. DOI:10.1016/j.ergon.2015.11.005
[11]	Nishino T, Nagamachi M, Tanaka H.Variable precision Bayesian rough set model and its application to human evaluation data[C]// Rough Sets, Fuzzy Sets, Data Mining, and Granular Computing.Berlin: Springer-Verlag, 2005: 294-303.
[12]	Nishino T. Rough set theory and Kansei/affective engineering[M]. Boca Raton: CRC Press, 2010: 207-226.
[13]	Błaszczyński J, Słowiński R, Szelag M. Sequential covering rule induction algorithm for variable consistency rough set approaches[J]. Information Sciences, 2011, 181(5): 987–1002. DOI:10.1016/j.ins.2010.10.030
[14]	Grzymala-Busse J W. LERS:A system for learning from examples based on rough sets[M]. Berlin: Springer, 1992: 3-18.
[15]	Chang Y M, Chen C W. Kansei assessment of the constituent elements and the overall interrelations in car steering wheel design[J]. International Journal of Industrial Ergonomics, 2016, 56: 97–105. DOI:10.1016/j.ergon.2016.09.010