当消费者打算购买价值较高的商品时, 其往往关注电商网站上关于商品的大量在线评价信息, 而且在线评价信息已经成为消费者购买决策的重要依据[1-3].由于在线评价信息体量大, 消费者对其关注的商品难以查看所有的相关在线评价信息并进行统计分析或综合评价, 因此, 为了支持消费者购买决策, 需要开发辅助决策支持模型或模块来确定并形成备选商品的推荐排序, 显然, 这是一个值得关注的重要研究问题.目前, 关于基于在线评价信息的商品购买推荐排序方法方面的研究还不多见, 但可以看到一些相关研究成果.例如, Li等[4]采用社会网络分析方法构建了一个基于商品在线评价信息商品综合评价模型; Yang等[5]给出一种基于在线评级、文本评论和比较投票信息的商品电子口碑排序方法; Najmi等[6]给出了一种综合情感分析、产品特征分析、产品品牌和在线评论有用性分析的商品排序方法; Liu等[7]运用直觉模糊集多属性决策方法, 给出了一种基于在线评论的商品排序方法; Chen等[8]基于在线评论给出一种集成主题模型、TOPSIS和多维度测量方法的商品排序方法; Kang等[9]采用情感分析方法分析了移动服务的在线评论, 并利用VIKOR方法对移动服务的客户满意度进行排序; 梁霞等[10]从商品在线评论中提取商品属性并确定属性权重, 然后通过对评论中的情感词进行分析给出一种商品选择方法; Mate[11]从在线评论中自动确定商品的重要特征并统计特征词出现的频率, 然后采用情感分析方法确定消费者对商品特征的情感倾向, 通过结合特征词的频率和关于特征在线评论的情感倾向构建了一个商品特征排名框架对商品特征进行排名; Wang等[12]通过情感分析提取在线评论中产品特征-意见对, 将特征-意见对作为变量构建反映在线评论和消费意向的计量经济学模型, 并基于该模型确定基于在线评论的产品特征排序; 习扬等[13]基于在线评价信息提出了一种商品属性权重确定及商品排序方法.从已有的研究成果可以看到, 已有研究大多是考虑在线评论信息的情形[6-10], 而对于消费者关注的备选商品, 支持购买决策的基于在线评价信息的商品推荐排序方法方面的研究仍显得缺乏.需要指出的是, 已有的关于利用在线评价信息对商品进行排序的方法所考虑的在线评价信息均是针对商品的整体给出的, 如文献[4]没有考虑在线评价信息是针对商品的属性给出的情形.另外, 即使文献[5]所使用的在线评价信息是针对属性给出的, 但该文献给出的方法中涉及到在线比较投票和文本评论等多种形式的信息, 无法直接用于解决基于多属性在线评价信息的商品购买推荐排序问题; 虽然文献[13]基于在线评价信息确定了属性权重并对商品进行了排序, 但其权重确定方法中只考虑了正理想点与方案的距离, 并没有考虑负理想点的情形.基于此, 本文着重研究基于在线评价信息的商品推荐排序方法.
1 问题描述考虑一种基于多属性在线评价信息的商品购买推荐排序问题, 相关的数学符号说明如下:
A={A1, A2, …, Am}:消费者关注的m个备选商品的集合, 其中Ai表示第i个备选商品, i=1, 2, …, m.
C={C1, C2, …, Cn}:消费者关注的备选商品n个属性的集合, 其中Cj表示第j个属性, j=1, 2, …, n.
ω=(ω1, ω2, …, ωn):属性的权重向量, 其中ωj表示属性Cj的权重或重要程度, 满足
Ki:参与商品Ai在线评价的用户数, i=1, 2, …, m.
H={h1, h2, …, hv}:评价标度的集合, 其中hg表示在线评价过程中用户针对备选商品属性可以使用的第g个评价标度, g=1, 2, …, v, 通常, g越大所对应的评价标度越高.
hijlε:第l个参与备选商品Ai关于属性Cj的在线评价的用户依据评价标度集H给出的备选商品Ai关于属性Cj的评价值, hijlε∈H,i=1, 2, …, m; j=1, 2, …, n; l=1, 2, …, Ki; ε∈{1, 2, …, v}.
本文要解决的问题是:针对消费者所关注的若干备选商品及备选商品的若干属性, 如何依据相关网站提供的针对备选商品属性的在线评价信息和消费者根据其对各属性的重视程度给出的属性权重信息, 确定一个备选商品购买推荐排序方法来支持消费者购买适合的商品.
2 推荐排序方法针对商品的多个属性的在线评价信息, 由于众多用户是依据评价标度集对商品的各个属性进行评价, 得到的针对商品各属性的评价值往往具有多种可能, 所以针对商品各属性的评价结果会呈现离散概率分布的形式, 即评价结果可被视为一个离散型随机变量.为支持消费者购买决策, 本文给出一种基于多属性在线评价信息的商品购买决策推荐排序方法, 下面详细介绍本文提出方法的计算过程.
首先, 计算各备选商品评价结果的概率分布.记kijg为在线评价时使用评价标度hg对备选商品Ai关于属性Cj进行评价的用户数, 满足0≤kijg≤Ki,
(1) |
其中, φg(hijlε)为指示值函数, 其计算公式为
(2) |
记备选商品Ai关于属性Cj的在线评价结果为xij, 则Ai关于Cj的在线评价结果为hg的“概率”, 即xij等于hg的概率为
(3) |
其中, pijg∈[0, 1]且
依据式(1)~式(3), 可得到备选商品Ai关于属性Cj的在线评价结果xij的概率分布为
(4) |
根据式(4), 可得到P(xij)相应的累积分布函数Fij(x)为
(5) |
然后, 基于式(5)和消费者给出的属性权重向量ω, 可构建加权累积分布函数决策矩阵G=[Gij(x)]m×n, 其中, Gij(x)的计算公式为
(6) |
基于构建的加权累积分布函数决策矩阵G, 可确定正、负理想商品的加权累积分布向量.G(x)+=(G1(x)+, G2(x)+, …, Gm(x)+),G(x)-=(G1(x)-, G2(x)-, …, Gm(x)-)分别表示正、负理想商品所对应的加权累积分布向量, 其中Gj(x)+和Gj(x)-分别表示针对属性Cj的正、负理想商品的加权累积分布函数, j=1, 2, …, n.依据文献[14]可知, Gj(x)+和Gj(x)-可分别由式(7)和式(8)确定, 即
(7) |
(8) |
其中, min和max分别是对∀x∈H的最小函数值和最大函数值的算子.
记D(Gij(x), Gj(x)+)和D(Gij(x), Gj(x)-)分别表示备选商品Ai关于属性Cj的评价结果xij的加权累积分布函数Gij(x)与正、负理想商品的加权累积分布函数Gj(x)+和Gj(x)-的距离, 其计算公式分别为
(9) |
(10) |
其中, Fij(hg),Fj(hg)+和Fj(hg)-分别表示累积分布函数Fij(x),Fj(x)+和Fj(x)-在x=hg处的取值, g=1, 2, …, v.进一步地, 依据式(5)~式(8), 式(9)和式(10)可以被分别写成
(11) |
(12) |
依据D(Gij(x), Gj(x)+)和D(Gij(x), Gj(x)-), 分别计算备选商品Ai的加权累积分布向量与正、负理想商品的加权累积分布向量G(x)+和G(x)-间的距离Di+和Di-, 其计算公式分别为
(13) |
(14) |
进一步地, 依据式(5)~式(8), 式(13)和式(14)可以被分别写成
(15) |
(16) |
最后, 依据Di+和Di-, 可计算各备选商品Ai与负理想商品的贴近度Z(Ai),
(17) |
显然, Z(Ai)越大, 商品Ai越好.因此, 依据贴近度Z(Ai)的大小, 可对所有商品进行推荐排序.
3 实例分析以消费者购买轿车为例来说明所给出的基于多属性在线评价信息的商品购买推荐排序方法的潜在应用.假设某消费者准备购买一辆轿车, 通过查阅汽车之家网站(www.autohome.com.cn), 其关注了君越(A1)、雅阁(A2)、速派(A3)和阿特兹(A4)这4款轿车及关于这4款轿车动力性(C1)、操控性(C2)、油耗(C3)和性价比(C4)的在线评价情况, 并根据其对这4个属性的重视程度给出了属性权重向量为ω=(0.2, 0.25, 0.25, 0.3).备选轿车关于各属性的在线评价信息是由众多用户依据评价标度集H={h1=1, h2=2, h3=3, h4=4, h5=5}给出的, 其中1表示最差, 5表示最好.为了支持该消费者购买轿车决策, 下面给出采用前文方法的计算过程和主要结果.
首先, 使用八爪鱼采集器(www.bazhuayu.com)从汽车之家网站采集关于备选轿车属性的在线评价信息, 得到4款备选轿车的在线评价用户数分别为758, 833, 857和787.运用式(1)和式(2)可得每款备选轿车针对每个属性使用各评价标度进行评价的用户数, 结果如表 1所示.依据表 1和式(3)可计算4款备选轿车针对每个属性的在线评价信息在各评价标度下的概率, 结果如表 2所示.
其次, 依据表 2、式(4)和式(5)可计算得到4款备选轿车针对4个属性评价结果xij的累积分布函数Fij(x)(i=1, 2, 3, 4;j=1, 2, 3, 4).这里以轿车A4(阿特兹)为例, 针对4个属性的评价结果x4j的累积分布函数F4j(x)分别为
然后, 依据Fij(x)和消费者给出的属性权重向量ω, 可构建加权累积分布函数决策矩阵G=[Gij(x)]4×4.
这里同样以轿车A4(阿特兹)为例, 针对4个属性的评价结果x4j的加权累积分布函数G4j(x)分别为
进一步地, 依据式(7)和式(8)确定正、负理想轿车的加权累积分布向量G(x)+和G(x)-, 如表 3所示.
在此基础上, 依据式(9)~式(16)计算4款备选轿车的加权累积分布向量分别与正、负理想轿车的加权累积分布向量G(x)+和G(x)-的距离Di+和Di-分别为D1+=0.492 3, D2+=0.005 8, D3+=0.426 0, D4+=0.287 4;D1-=0.023 9, D2-=0.513 9, D3-=0.093 7, D4-=0.232 4.依据式(17)计算每款备选轿车与负理想轿车的相对贴近度分别为Z(A1)=0.046 3, Z(A2)=0.988 8, Z(A3)=0.180 4, Z(A4)=0.447 1.依据Z(Ai)值的大小, 可对所有备选轿车进行推荐排序, 有A2≻A4≻A3≻A1, 因此该消费者可以选择购买A2(雅阁).
4 结语本文给出了支持消费者购买决策的基于多属性在线评价信息的商品购买推荐排序方法, 该方法是将备选商品各属性的在线评价信息转化为关于属性评价标度的概率分布形式, 通过构建商品各属性在线评价结果的累积分布函数和加权累积分布函数决策矩阵, 进而给出基于理想点的商品购买推荐排序方法.该方法概念清晰、计算过程简单, 有较强的可操作性和实际应用价值.
[1] |
Liu X L, Guo Q, Hou L, et al.
Ranking online quality and reputation via the user activity[J]. Physica A:Statistical Mechanics and Its Applications, 2015, 436: 629–636.
DOI:10.1016/j.physa.2015.05.043 |
[2] |
Oh H K, Kim S W, Park S J, et al.
Can you trust online ratings? a mutual reinforcement model for trustworthy online rating systems[J]. IEEE Transactions on Systems, Man, and Cybernetics:Systems, 2015, 45(12): 1564–1576.
DOI:10.1109/TSMC.2015.2416126 |
[3] |
Engler T H, Winter P, Schulz M.
Understanding online product ratings:a customer satisfaction model[J]. Journal of Retailing and Consumer Services, 2015, 27: 113–120.
DOI:10.1016/j.jretconser.2015.07.010 |
[4] |
Li Y L, Wu C, Luo P.
Rating online commodities by considering consumers' purchasing networks[J]. Management Decision, 2014, 52(10): 2002–2020.
DOI:10.1108/MD-04-2014-0188 |
[5] |
Yang X, Yang G F, Wu J N.
Integrating rich and heterogeneous information to design a ranking system for multiple products[J]. Decision Support Systems, 2016, 84: 117–133.
DOI:10.1016/j.dss.2016.02.009 |
[6] |
Najmi E, Hashmi K, Malik Z, et al.
CAPRA:a comprehensive approach to product ranking using customer reviews[J]. Computing, 2015, 97(8): 843–867.
DOI:10.1007/s00607-015-0439-8 |
[7] |
Liu Y, Bi J W, Fan Z P.
Ranking products through online reviews:a method based on sentiment analysis technique and intuitionistic fuzzy set theory[J]. Information Fusion, 2017, 36: 149–161.
DOI:10.1016/j.inffus.2016.11.012 |
[8] |
Chen K, Kou G, Shang J, et al.
Visualizing market structure through online product reviews:integrate topic modeling, TOPSIS, and multi-dimensional scaling approaches[J]. Electronic Commerce Research and Applications, 2015, 14(1): 58–74.
|
[9] |
Kang D, Park Y.
Review-based measurement of customer satisfaction in mobile service:sentiment analysis and VIKOR approach[J]. Expert Systems with Applications, 2014, 41(4): 1041–1050.
DOI:10.1016/j.eswa.2013.07.101 |
[10] |
梁霞, 姜艳萍, 高梦.
基于在线评论的产品选择方法[J]. 东北大学学报(自然科学版), 2017, 38(1): 143–147.
( Liang Xia, Jiang Yan-ping, Gao Meng. Product selection methods based on online reviews[J]. Journal of Northeastern University(Natural Science), 2017, 38(1): 143–147. DOI:10.3969/j.issn.1005-3026.2017.01.029 ) |
[11] |
Mate C.
Product aspect ranking using sentiment analysis:a survey[J]. International Research Journal of Engineering and Technology, 2015, 3(1): 124–128.
|
[12] |
Wang W, Wang H, Song Y.
Ranking product aspects through sentiment analysis of online reviews[J]. Journal of Experimental & Theoretical Artificial Intelligence, 2016, 29(2): 1–20.
|
[13] |
习扬, 樊治平.
使用在线评价信息的属性权重确定及方案排序方法[J]. 控制与决策, 2016, 31(11): 1998–2004.
( Xi Yang, Fan Zhi-ping. A method for determining attribute weights and ranking alternatives based on online evaluation information[J]. Control and Decision, 2016, 31(11): 1998–2004. ) |
[14] |
Fan Z P, Zhang X, Liu Y, et al.
A method for stochastic multiple attribute decision making based on concepts of ideal and anti-ideal points[J]. Applied Mathematics and Computation, 2013, 219(24): 11438–11450.
DOI:10.1016/j.amc.2013.05.039 |