有限需求信息下基于最大熵原理的风险厌恶库存模型

引用本文 [复制中英文]

邱若臻, 苑红涛, 冯俏. 有限需求信息下基于最大熵原理的风险厌恶库存模型[J]. 东北大学学报:自然科学版, 2016, 37(10): 1512-1516.

QIU Ruo-zhen , YUAN Hong-tao , FENG Qiao . Risk Aversion Inventory Model Based on Maximum Entropy Approach Under Limited Demand Information[J]. Journal Of Northeastern University Nature Science, 2016, 37(10): 1512-1516. DOI: 10.3969/j.issn.1005-3026.2016.10.030.

[复制英文]

基金项目

国家自然科学基金资助项目(71372186);教育部人文社会科学研究一般项目(11YJC630165);中央高校基本科研业务费专项资金资助项目(N150604005)

文章历史

收稿日期: 2015-06-29

Contents Abstract Full text Figures/Tables PDF

有限需求信息下基于最大熵原理的风险厌恶库存模型

邱若臻, 苑红涛, 冯俏

东北大学工商管理学院, 辽宁沈阳 110167

收稿日期: 2015-06-29

基金项目: 国家自然科学基金资助项目(71372186);教育部人文社会科学研究一般项目(11YJC630165);中央高校基本科研业务费专项资金资助项目(N150604005).

摘要: 针对风险厌恶的库存决策者，建立了基于条件风险值(CVaR)的单周期库存模型.在仅知需求区间、均值和方差信息情况下，采用最大熵原理估计了两种条件下的需求分布.结果显示，在仅知需求区间、均值和方差信息时，决策者应分别采用均匀和指数分布作为潜在的需求分布.在此基础上，进一步推导了基于CVaR的库存订货策略及其绩效情况.模拟结果表明，同真实需求分布下的最优情况相比，基于最大熵原理的库存策略虽然会导致绩效损失，但损失比例很小，表明基于最大熵原理的订货策略具有良好的鲁棒性.

关键词：库存模型最大熵原理风险厌恶条件风险值鲁棒性

Risk Aversion Inventory Model Based on Maximum Entropy Approach Under Limited Demand Information

QIU Ruo-zhen, YUAN Hong-tao, FENG Qiao

School of Business Administration, Northeastern University, Shenyang 110167, China

Corresponding author: QIU Ruo-zhen, E-mail: rzqiu@mail.neu.edu.cn

Abstract: A single period inventory model based on the conditional value-at-risk (CVaR) was developed for risk aversion decision-maker. Only considering demand interval, mean and variance information, the maximum entropy approach was used to estimate the demand distribution for both of the two demand uncertainties. The results showed that the decision-maker should adopt the uniform and exponential distribution as the potential demand distribution when only knowing the demand interval, and mean and variance information. On this basis, the CVaR-based inventory strategies and performances were deduced. The simulated results showed that the inventory strategy derived from the estimated distribution by maximum entropy will lead to a certain performance loss, however the loss ratio is very limited. It indicates that the ordering strategy based on the maximum entropy has good robustness.

Key Words: inventory model maximum entropy approach risk aversion conditional value-at-risk robustness

传统库存问题研究大多假设模型中需求参数服从某一已知分布，通过优化期望利润或成本方式获取最优策略.然而，对于模型参数的任一错误假设，都可能引起最终绩效的严重偏差^[1].这就促使企业决策者在日常运营中采取一种鲁棒策略^[2].文献[3]将供应链鲁棒性定义为在供应链运作过程中引起扰动的事件发生过程中或发生之后，供应链仍能在其关键绩效指标方面有良好表现的属性.对于有限需求信息下的库存问题，目前研究主要集中于两种鲁棒优化方法.第一种是相对保守的最大最小方法^[4].第二种是最大最小后悔值方法，该方法通过优化最优绩效与鲁棒决策下的绩效差值来获得具有更低保守性的鲁棒解^[5].

实证研究表明，由于决策者对不确定性导致的绩效风险的偏好态度不同，在实际运作中采取的运作策略并不总是与传统基于期望利润/成本等方法制定的策略一致^[6].基于此，一些学者将鲁棒优化与风险理论结合进行相关研究^[7].

近年来，一些学者尝试采用信息论中的熵理论度量不确定性问题^[8-9].文献[10]采用最大熵方法研究了有限需求信息下的报童问题.本文在上述文献基础上，研究了有限需求信息下，基于条件风险值的库存运作问题.特别地，假设仅知需求区间、均值和方差信息情况，采用最大熵原理估计两种条件下的需求分布，并给出了相应的库存策略.进一步，对比分析了当获知需求真实分布时，基于最大熵原理的库存策略的有效性.

1 基于CVaR的风险厌恶库存模型

考虑单周期环境下，销售某一季节性商品的风险厌恶零售商库存控制问题.零售商作为市场终端，面临不确定的随机需求y.这里假设零售商仅知需求区间、需求均值和方差信息，随机需求的分布形式未知.在销售季节开始前，零售商以单位价格w向供应商订购x单位的产品.在销售期末，对于未满足市场需求的部分，零售商将招致单位产品损失s；而对于超出市场需求的部分，零售商以单位残值v将其处理.在销售期末，零售商的利润函数为

(1)

其中：Z(·)为零售商的利润；t⁺=max{t, 0}.不失一般性，假设r>w>v.在风险中性条件下，零售商最优决策为x^*=arg maxE[Z(x, y)]，其中，E[·]是期望算子.本文考虑风险厌恶零售商，采用条件风险值(CVaR)作为绩效指标.令g(x, y)=-Z(x, y)，表示零售商损失.则在给定x情况下，零售商损失g(x, y)不超过阈值α的概率为

(2)

其中，f(·)是随机变量的概率密度函数.在给定置信水平β∈(0, 1)时，零售商损失的风险值定义为

(3)

在此基础上，相应的条件风险值定义为

(4)

其中，β表示决策者风险厌恶水平，β越大，表明决策者风险厌恶程度越高；β=0对应于风险中性情况.根据文献[11]，式(4)等价于

(5)

其中.文献[11]进一步指出，是关于(x, α)的凸函数，因此，式(5)等价于

(6)

2 有限需求信息下基于最大熵原理的需求分布估计

本文假设需求是连续的，且服从某一未知分布f(·).在此条件下，采用熵度量随机需求的概率不确定性.根据文献[10]，连续需求分布的熵值定义为

(7)

2.1 仅知区间信息下的需求分布估计

假设随机需求在区间[A, B](0≤A < B)内服从某一未知分布f(·)，则基于最大熵原理的需求分布的估计问题等价于

(8)

(9)

通过引入拉格朗日乘子λ，可求得在熵最大时，f(y)为常数，且f(·)为均匀分布的概率密度函数，即

(10)

2.2 仅知均值和方差信息下的需求分布估计

假设连续随机需求均值和方差分别为E(y)=μ和D(y)=σ², 则基于最大熵原理的需求分布估计问题等价于

(11)

(12)

(13)

(14)

同上，通过引入拉格朗日乘子λ₁, λ₂和λ₃，求得随机需求的概率密度为

(15)

其中，t, n, m为实数.

3 基于最大熵估计分布的条件风险值及最优订货策略 3.1 仅知区间信息下的条件风险值及最优策略

令y∈[A, B]，根据最大熵原理，零售商采用式(10)所示的需求概率密度，性质1成立.

性质1 在式(10)所示的概率密度下，风险厌恶零售商优化问题(6)的最优解为

(17)

并且，.

证明考虑函数，在仅知需求区间信息和式(10)所示的概率密度下，

(18)

1)当y≤x时，g(x, y)=(v-r)y+(w-v)x，由g(x, y)≥α，得.令, r-v=b，则g(x, y)=-by+hbx, y≤hx-, 0 < h < 1, b>0.

①当，即时，y∈[A, x].

②当，即时，.

2)当y>x时，g(x, y)=sy-(r+s-w)x，由g(x, y)≥α，得.令φ，则.

①当，即时，.

②当，即时，y∈[x, B].

注意到，，因此，b(1-h)=s(φ-1).综合上述1)和2)两种情况，式(6)等价于如下两个优化问题：

(19)

(20)

(21)

(22)

函数是关于(x, α)的凸函数，式(19)对α求偏导数，得，因此，关于α递减.又，即α≤-sx(φ-1)，当α=-sx(φ-1)=-x(r-w)时，取得最小值.关于x的一阶条件为，得x=.对于式(21)，令，得α^*=-(r-w)x+.由式(22)得-bx(1-h)=-x(r-w)≤α, 说明α^*恰好满足约束条件.将α^*代入式(21)，并令，得x^*=B+.实际上，可以证明当约束条件式(20)和(22)取等号时，式(19)和(21)具有相等的目标函数值.又因为问题(19)和(20)的最优值在约束条件(20)取等号时取得，而问题(21)和(22)的最优值在α^*处取得，因此，只需优化问题(21)和(22)即可.综上所述，得问题(6)的最优解如性质1所示.证毕.

由性质1中式(16)可以看出，随着零售商风险厌恶程度(β)的增加，最优订货量x^*呈递减趋势，而α呈增加趋势.根据式(3)，α是零售商损失的风险值VaR_β(x)，即，在给定置信水平β下，零售商损失不会超过某一界限的阈值，说明风险厌恶程度高的零售商将通过降低订货来规避损失的增加.

3.2 仅知需求均值和方差信息下的条件风险值及最优策略

假设零售商仅知需求均值E(y)=μ和方差D(y)=σ²，根据最大熵原理，零售商选择式(15)作为需求概率密度，即f(y)=e^ty²+ny+m, t, n, m为实数，需求累积分布函数为F(y).在约束条件(12)~(14)下，性质2成立.

性质2 当仅知需求均值和方差信息时，在式(15)所示的概率密度下，风险厌恶零售商优化问题(6)的最优解为

(23)

(24)

其中：F^-1(·)是需求累积分布函数的反函数.零售商损失的条件风险值为.

证明遵循与3.1节相同的分析过程，在仅知需求均值和方差信息下，问题(6)等价于如下两个优化问题：

(25)

(26)

(27)

(28)

可以证明，当约束条件式(26)和(28)取等号时，式(25)和式(27)具有相等的目标函数值.特别地，当式(26)取等号时，式(25)取最小值.因此，要求解问题(6)，只需求解问题式(27)和式(28)即可.根据式(27)的一阶条件，分别令和，求得风险厌恶零售商损失的条件风险值及最优策略如性质2所示.证毕.

由性质2可以看出，随着β的增加，D随之增加，而C随之减少，又因为r-v>s，r+s-w>w-v，因此，最优订货量x^*呈递减趋势，而α^*随之增加.说明风险厌恶程度高的零售商将通过降低订货来规避更高的损失.

4 数值算例与分析

为了验证基于最大熵估计需求分布下的零售商最优策略的有效性，针对问题(6)进行数值计算.进一步，为了比较分析需求真实分布和基于最大熵原理估计的需求分布下系统绩效情况，假设随机需求真实分布为正态分布.模型参数赋值如下：r=10, w=3, v=2, s=1.不失一般性，根据文献[10]，令A=0, B=200, μ=75.4, σ=44.06.

1)当仅知y∈[A, B]时，根据最大熵原理，需求分布如式(10)所示，根据性质1，零售商最优订货量、风险值及条件风险值随β的变化趋势如图 1所示.由图 1可以看出，随着β的增加，零售商订货量递减，而相应的风险值和条件风险值递增，说明零售商风险程度越高，将通过降低订货来规避可能的高损失.进一步，为了对比分析基于最大熵原理的零售商最优绩效与真实分布下的最优绩效，假设需求在区间y∈[A, B]上服从正态分布，此时，.根据第3节中求解方法，得，其中，.由图 2可知，当需求真实分布为正态分布时，基于最大熵原理的订货量将低于正态分布下的最优订货量.两种分布下的订货量都随β的增加而减少，说明随着β的增加，风险厌恶零售商将通过降低订货量来规避更大的风险.特别地，当真实需求分布为正态分布时，采取基于最大熵原理的订货量策略将导致一定的绩效损失.β越高，绩效损失值越大.绩效损失值可以认为是零售商为了获得真实的需求分布信息所愿意支付的最高成本.

图 1 基于最大熵原理的零售商最优策略及CVaR Fig.1 Retailer's optimal strategies and its CVaR based on the maximum entropy

图 2 基于最大熵原理和正态分布的订货量及CVaR绩效损失 Fig.2 Order quantities and CVaR performance loss based on the maximum entropy and normal distribution

2)当仅知道需求均值μ和方差σ²信息时，根据约束(12)~(14), 求得t=-0.000177444，n=0.0226361，m=-5.49087.根据性质2，零售商最优订货量、风险值及条件风险值随β的变化趋势如图 3所示.由图 3可知，随着β的增加，零售商订货量递减，而相应的风险值和条件风险值递增，说明零售商风险程度越高，零售商为了降低风险，减少损失，零售商将通过降低订货量来规避可能的高损失.

图 3 基于最大熵原理的零售商最优策略及CVaR Fig.3 Retailer's optimal strategies and its CVaR based on the maximum entropy

同理，为了比较基于最大熵原理的订货策略的有效性，假设需求服从正态分布，E(y)=μ，.从而得，其中，G=.由图 4可知，随着β的增加，基于最大熵原理下的订货量和真实分布为正态分布下的订货量都随之降低，说明决策者的风险厌恶程度越高，订货量越低.当真实分布为正态分布时，采取基于最大熵原理的订货量策略将导致一定的绩效损失.特别地，随着β的增加，绩效损失值将增大，但与图 2相比，图 4的绩效损失增加比较平缓，而且绩效差值明显小于图 2.这是因为真实分布为正态分布，与最大熵原理估计出来的需求分布比较接近，即，基于最大熵原理的估计分布与实际情况接近，这就有利于零售商在信息缺失的情况下做出比较正确的订货策略，从而降低风险.

图 4 基于最大熵原理和正态分布的订货量及CVaR绩效损失 Fig.4 Order quantities and CVaR performance loss based on the maximum entropy and normal distribution

5 结论

本文在仅知随机需求的部分信息条件下，研究了基于最大熵原理的风险厌恶库存控制问题.结果表明，由于完备需求信息的缺失，基于最大熵原理的订货策略会导致部分绩效损失，但损失比例很小，说明基于最大熵的零售商库存策略具有良好的鲁棒性，从而为需求不确定环境下的库存控制提供了有效的决策支持.进一步，可考虑零售商和供应商之间的博弈问题，研究有限需求信息下基于最大熵的供应链协调问题.

参考文献

[1]	Roy B. Robustness in operational research and decision aiding:a multi-faceted issue[J]. European Journal of Operational Research , 2010, 200 (7) : 629–638.
[2]	Bertsimas D, Thiele A. Robust and data-driven optimization:modern decision making under uncertainty[J]. Tutorials in Operations Research , 2006, 2 (1) : 95–122.
[3]	Vlajic J V, van der Vorst J G A J, Haijema R. A framework for designing robust food supply chains[J]. International Journal of Production Economics , 2012, 137 (1) : 176–189. DOI:10.1016/j.ijpe.2011.11.026
[4]	Scarf H, Arrow K J, Karlin S. A min-max solution of an inventory problem[J]. Studies in the Mathematical Theory of Inventory and Production , 1958, 10 (2) : 201–209.
[5]	Perakis G, Roels G. Regret in the newsvendor model with partial information[J]. Operations Research , 2008, 56 (1) : 188–203. DOI:10.1287/opre.1070.0486
[6]	Jammernegg W, Kischka P. Risk preferences and robust inventory decisions[J]. International Journal of Production Economics , 2009, 118 (3) : 269–274.
[7]	Fertis A, Baes M, Luthi H J. Robust risk management[J]. European Journal of Operational Research , 2012, 222 (3) : 663–672. DOI:10.1016/j.ejor.2012.03.036
[8]	Simonian J, Davis J. Robust value-at-risk:an information-theoretic approach[J]. Applied Economics Letters , 2010, 17 (16) : 1551–1553. DOI:10.1080/13504850903085019
[9]	Eren S, Maglaras C. A maximum entropy joint demand estimation and capacity control policy[J]. Production & Operations Management , 2014, 24 (3) : 438–450.
[10]	Andersson J, Jörnsten K, Nonås S L, et al. A maximum entropy approach to the newsvendor problem with partial information[J]. European Journal of Operational Research , 2013, 228 (2) : 190–200.
[11]	RockafellarR T, Uryasev S. Conditional value-at-risk for general loss distributions[J]. Journal of Banking & Finance , 2002, 26 (7) : 1443–1471.