传统库存问题研究大多假设模型中需求参数服从某一已知分布,通过优化期望利润或成本方式获取最优策略.然而,对于模型参数的任一错误假设,都可能引起最终绩效的严重偏差[1].这就促使企业决策者在日常运营中采取一种鲁棒策略[2].文献[3]将供应链鲁棒性定义为在供应链运作过程中引起扰动的事件发生过程中或发生之后,供应链仍能在其关键绩效指标方面有良好表现的属性.对于有限需求信息下的库存问题,目前研究主要集中于两种鲁棒优化方法.第一种是相对保守的最大最小方法[4].第二种是最大最小后悔值方法,该方法通过优化最优绩效与鲁棒决策下的绩效差值来获得具有更低保守性的鲁棒解[5].
实证研究表明,由于决策者对不确定性导致的绩效风险的偏好态度不同,在实际运作中采取的运作策略并不总是与传统基于期望利润/成本等方法制定的策略一致[6].基于此,一些学者将鲁棒优化与风险理论结合进行相关研究[7].
近年来,一些学者尝试采用信息论中的熵理论度量不确定性问题[8-9].文献[10]采用最大熵方法研究了有限需求信息下的报童问题.本文在上述文献基础上,研究了有限需求信息下,基于条件风险值的库存运作问题.特别地,假设仅知需求区间、均值和方差信息情况,采用最大熵原理估计两种条件下的需求分布,并给出了相应的库存策略.进一步,对比分析了当获知需求真实分布时,基于最大熵原理的库存策略的有效性.
1 基于CVaR的风险厌恶库存模型考虑单周期环境下,销售某一季节性商品的风险厌恶零售商库存控制问题.零售商作为市场终端,面临不确定的随机需求y.这里假设零售商仅知需求区间、需求均值和方差信息,随机需求的分布形式未知.在销售季节开始前,零售商以单位价格w向供应商订购x单位的产品.在销售期末,对于未满足市场需求的部分,零售商将招致单位产品损失s;而对于超出市场需求的部分,零售商以单位残值v将其处理.在销售期末,零售商的利润函数为
|   | (1) | 
其中:Z(·)为零售商的利润;t+=max{t, 0}.不失一般性,假设r>w>v.在风险中性条件下,零售商最优决策为x*=arg maxE[Z(x, y)],其中,E[·]是期望算子.本文考虑风险厌恶零售商,采用条件风险值(CVaR)作为绩效指标.令g(x, y)=-Z(x, y),表示零售商损失.则在给定x情况下,零售商损失g(x, y)不超过阈值α的概率为
|   | (2) | 
其中,f(·)是随机变量的概率密度函数.在给定置信水平β∈(0, 1)时,零售商损失的风险值定义为
|   | (3) | 
在此基础上,相应的条件风险值定义为
|   | (4) | 
其中,β表示决策者风险厌恶水平,β越大,表明决策者风险厌恶程度越高;β=0对应于风险中性情况.根据文献[11],式(4)等价于
|   | (5) | 
其中


|   | (6) | 
本文假设需求是连续的,且服从某一未知分布f(·).在此条件下,采用熵度量随机需求的概率不确定性.根据文献[10],连续需求分布的熵值定义为
|   | (7) | 
假设随机需求在区间[A, B](0≤A < B)内服从某一未知分布f(·),则基于最大熵原理的需求分布的估计问题等价于
|   | (8) | 
|   | (9) | 
通过引入拉格朗日乘子λ,可求得在熵最大时,f(y)为常数,且f(·)为均匀分布的概率密度函数,即
|   | (10) | 
假设连续随机需求均值和方差分别为E(y)=μ和D(y)=σ2, 则基于最大熵原理的需求分布估计问题等价于
|   | (11) | 
|   | (12) | 
|   | (13) | 
|   | (14) | 
同上,通过引入拉格朗日乘子λ1, λ2和λ3,求得随机需求的概率密度为
|   | (15) | 
其中,t, n, m为实数.
3 基于最大熵估计分布的条件风险值及最优订货策略 3.1 仅知区间信息下的条件风险值及最优策略令y∈[A, B],根据最大熵原理,零售商采用式(10)所示的需求概率密度,性质1成立.
性质1 在式(10)所示的概率密度下,风险厌恶零售商优化问题(6)的最优解为
|   | (17) | 
并且,
证明  考虑函数
|   | (18) | 
1)当y≤x时,g(x, y)=(v-r)y+(w-v)x,由g(x, y)≥α,得


①当

②当


2)当y>x时,g(x, y)=sy-(r+s-w)x,由g(x, y)≥α,得


①当


②当

注意到,

|   | (19) | 
|   | (20) | 
|   | (21) | 
|   | (22) | 
函数













由性质1中式(16)可以看出,随着零售商风险厌恶程度(β)的增加,最优订货量x*呈递减趋势,而α呈增加趋势.根据式(3),α是零售商损失的风险值VaRβ(x),即,在给定置信水平β下,零售商损失不会超过某一界限的阈值,说明风险厌恶程度高的零售商将通过降低订货来规避损失的增加.
3.2 仅知需求均值和方差信息下的条件风险值及最优策略假设零售商仅知需求均值E(y)=μ和方差D(y)=σ2,根据最大熵原理,零售商选择式(15)作为需求概率密度,即f(y)=ety2+ny+m, t, n, m为实数,需求累积分布函数为F(y).在约束条件(12)~(14)下,性质2成立.
性质2 当仅知需求均值和方差信息时,在式(15)所示的概率密度下,风险厌恶零售商优化问题(6)的最优解为
|   | (23) | 
|   | (24) | 
其中:


证明 遵循与3.1节相同的分析过程,在仅知需求均值和方差信息下,问题(6)等价于如下两个优化问题:
|   | (25) | 
|   | (26) | 
|   | (27) | 
|   | (28) | 
可以证明,当约束条件式(26)和(28)取等号时,式(25)和式(27)具有相等的目标函数值.特别地,当式(26)取等号时,式(25)取最小值.因此,要求解问题(6),只需求解问题式(27)和式(28)即可.根据式(27)的一阶条件,分别令

由性质2可以看出,随着β的增加,D随之增加,而C随之减少,又因为r-v>s,r+s-w>w-v,因此,最优订货量x*呈递减趋势,而α*随之增加.说明风险厌恶程度高的零售商将通过降低订货来规避更高的损失.
4 数值算例与分析为了验证基于最大熵估计需求分布下的零售商最优策略的有效性,针对问题(6)进行数值计算.进一步,为了比较分析需求真实分布和基于最大熵原理估计的需求分布下系统绩效情况,假设随机需求真实分布为正态分布.模型参数赋值如下:r=10, w=3, v=2, s=1.不失一般性,根据文献[10],令A=0, B=200, μ=75.4, σ=44.06.
1)当仅知y∈[A, B]时,根据最大熵原理,需求分布如式(10)所示,根据性质1,零售商最优订货量、风险值及条件风险值随β的变化趋势如图 1所示.由图 1可以看出,随着β的增加,零售商订货量递减,而相应的风险值和条件风险值递增,说明零售商风险程度越高,将通过降低订货来规避可能的高损失.进一步,为了对比分析基于最大熵原理的零售商最优绩效与真实分布下的最优绩效,假设需求在区间y∈[A, B]上服从正态分布,此时,




|   | 图 1 基于最大熵原理的零售商最优策略及CVaR Fig.1 Retailer's optimal strategies and its CVaR based on the maximum entropy | 
|   | 图 2 基于最大熵原理和正态分布的订货量及CVaR绩效损失 Fig.2 Order quantities and CVaR performance loss based on the maximum entropy and normal distribution | 
2)当仅知道需求均值μ和方差σ2信息时,根据约束(12)~(14), 求得t=-0.000177444,n=0.0226361,m=-5.49087.根据性质2,零售商最优订货量、风险值及条件风险值随β的变化趋势如图 3所示.由图 3可知,随着β的增加,零售商订货量递减,而相应的风险值和条件风险值递增,说明零售商风险程度越高,零售商为了降低风险,减少损失,零售商将通过降低订货量来规避可能的高损失.
|   | 图 3 基于最大熵原理的零售商最优策略及CVaR Fig.3 Retailer's optimal strategies and its CVaR based on the maximum entropy | 
同理,为了比较基于最大熵原理的订货策略的有效性,假设需求服从正态分布,E(y)=μ,




|   | 图 4 基于最大熵原理和正态分布的订货量及CVaR绩效损失 Fig.4 Order quantities and CVaR performance loss based on the maximum entropy and normal distribution | 
本文在仅知随机需求的部分信息条件下,研究了基于最大熵原理的风险厌恶库存控制问题.结果表明,由于完备需求信息的缺失,基于最大熵原理的订货策略会导致部分绩效损失,但损失比例很小,说明基于最大熵的零售商库存策略具有良好的鲁棒性,从而为需求不确定环境下的库存控制提供了有效的决策支持.进一步,可考虑零售商和供应商之间的博弈问题,研究有限需求信息下基于最大熵的供应链协调问题.
| [1] | Roy B. Robustness in operational research and decision aiding:a multi-faceted issue[J]. European Journal of Operational Research , 2010, 200 (7) : 629–638. | 
| [2] | Bertsimas D, Thiele A. Robust and data-driven optimization:modern decision making under uncertainty[J]. Tutorials in Operations Research , 2006, 2 (1) : 95–122. | 
| [3] | Vlajic J V, van der Vorst J G A J, Haijema R. A framework for designing robust food supply chains[J]. International Journal of Production Economics , 2012, 137 (1) : 176–189. DOI:10.1016/j.ijpe.2011.11.026 | 
| [4] | Scarf H, Arrow K J, Karlin S. A min-max solution of an inventory problem[J]. Studies in the Mathematical Theory of Inventory and Production , 1958, 10 (2) : 201–209. | 
| [5] | Perakis G, Roels G. Regret in the newsvendor model with partial information[J]. Operations Research , 2008, 56 (1) : 188–203. DOI:10.1287/opre.1070.0486 | 
| [6] | Jammernegg W, Kischka P. Risk preferences and robust inventory decisions[J]. International Journal of Production Economics , 2009, 118 (3) : 269–274. | 
| [7] | Fertis A, Baes M, Luthi H J. Robust risk management[J]. European Journal of Operational Research , 2012, 222 (3) : 663–672. DOI:10.1016/j.ejor.2012.03.036 | 
| [8] | Simonian J, Davis J. Robust value-at-risk:an information-theoretic approach[J]. Applied Economics Letters , 2010, 17 (16) : 1551–1553. DOI:10.1080/13504850903085019 | 
| [9] | Eren S, Maglaras C. A maximum entropy joint demand estimation and capacity control policy[J]. Production & Operations Management , 2014, 24 (3) : 438–450. | 
| [10] | Andersson J, Jörnsten K, Nonås S L, et al. A maximum entropy approach to the newsvendor problem with partial information[J]. European Journal of Operational Research , 2013, 228 (2) : 190–200. | 
| [11] | RockafellarR T, Uryasev S. Conditional value-at-risk for general loss distributions[J]. Journal of Banking & Finance , 2002, 26 (7) : 1443–1471. | 
 2016,  Vol. 37
 2016,  Vol. 37
