该问题的决策树如下图所示。 36 14 -8 20 16 0 14 10 3 图6—1
图中符号意义如下:
□——表示决策点。从该点引出方案分支,每一个分支表示一个行动方案,分支上注明方案名(如大批量生产)或代号(如A1)。
○——每个方案分支的端点都对应一个“○”,称为方案节点。节点上方的数字表示该方案的期望收益值。从各方案节点引出的分支称为状态分支(也称概率分支),每一个分支代表一个状态,分支上注明状态名(如需求量大)或代号(如S1)及其 第六章——11
出现的概率(写在括号内)。
△——表示结果点(或称为树梢),其旁边的数字表示各方案在相应状态下的损益值(收益或机会损失)。
利用决策树进行决策的具体步骤如下:
(1)画出决策树。按从左到右的顺序画决策树,画决策树的过程本身就是对决策问题的再分析过程。
(2)按从右到左的顺序计算各方案的期望值,并将结果写在相应方案节点的上方。
(3)选择期望收益最大(或期望损失最小)的方案作为最优方案,并将其对应的期望值写在决策点上。
图1所描述的是一个单级决策问题。有些决策问题包括两级以上的决策,即所谓的多级决策(也称序贯决策)问题。这类决策问题用决策树法可以费用有效地加以解决。
(二)决策树法举例
例6.7 某企业需要在是否引进新产品之间进行决策,即开始时有引进新产品和不引进新产品两种方案。若引进新产品,又面临其它企业的竞争。估计有其他企业参与竞争的概率为0.8,没有企业参与竞争的概率为0.2。在无竞争的情况下,企业有给产品确定高价、中价和低价三种方案,其相应的收益分别为500、300和100万元。在有竞争情况下,企业也有给产品确定高价、中价和低价三种方案,但此时各方案的收益大小要受到竞争企业的产品定价的影响,有关数据如表6—11。
试用决策树法进行决策。 解:首先画出决策树如图2
决策计算从右向左进行,具体如下: 节点5:0.3×150+0.5×0+0.2×(-200)=5(万元) 节点6:0.1×250+0.6×100+0.3×(-50)=70(万元) 节点7:0.1×100+0.2×50+0.7×(-100)=-50(万元) 第六章——12 150 0 -200 250 100
-50 100 50 -100 图 6—2
节点3(二级决策点):max{5,70,-50}=70(万元)。即在有竞争的情况下,本企业给产品制定中价为最优方案,期望收益为70万元。
节点4(二级决策点):max{500,300,100}=500(万元)。即在无竞争的情况下,本企业给产品制定高价为最优方案,收益为500万元。 节点2:0.8×70+0.2×500=156(万元) 节点1(一级决策点):max{156,0}=156(万元),即企业应采取引进新产品的方案,该方案相应的期望收益为156万元。
从上述讨论可以看出,决策树方法可以通过一个简单的决策过程,使决策者可以有顺序、有步骤地周密考虑各有关因素,从而进行决策。对于较复杂的多级决策问题,可以画出树形图,以便集体讨论、集体决策。
第六章——13
第四节 信息的价值与贝叶斯决策 一、全信息的价值
所谓全信息就是关于自然状态的准确信息。当决策者获得了全信息,决策者就能正确地作出决策。例如,在表6—10所描述的决策中,当决策者已知会出现状态S1(需求量大)时,就是作出大批量生产的决策方案(A1),当决策者准确知道
将出现需求量一般时,就会作出中批量生产的决策,当决策者准确知道将出现需求量小时,就会作出小批量生产的决策。
若决策者掌握了全信息,就会给决策者带来额外的收益,这个额外的收益就是全信息的价值。全信息的价值来源于决策者总能作出正确的决策,从不会后悔。在这种情况下,决策者的期望收益称为全信息期望收益,其数学描述为
rj*=max{rij} i EPPI=∑jP(Sj)?rj*
式中,rj*为在状态Sj下作出正确决策的收益值。EPPI就是全信息期望收益。 在决策者未获得全信息的情况下,决策只能根据期望收益最大准则来选择方案。若所选方案的期望收益为ER*,则全信息的价值为
EPVI=EPPI-ER*
例6.8 对于表6—10所描述的决策问题,计算其全信息的价值。 r1* =36; r2* =16; r3*=3 EPPI=0.3×36+0.5×16+0.2×3=19.4(万元)
在未获得信息的情况下,只能作出方案A1的决策,其期望收益为 ER*=max{16.2,14,9.8}=16.2=ER(A1)
这样 EPVI=EPPI-ER*=19.4-16.2=3.2(万元)
这3.2万元就是本问题完全信息的价值,它一方面说明完全信息能给决策者带来更大的收益,另一方面说明决策在现有情况下,无论怎样去补充信息,最大能增加3.2万元的收益。而这3.2万元正好是最小期望损失准则下的最小期望损失值,读者可以根据表6—6中数据进行验证。
既然信息可以给决策者带来额外的收益,决策者当然想尽可能的获取全面的信息。然而获取信息往往要付出代价,若获取完全信息的代价小于全信息价值,决策者就应投资获取全信息,反之,决策者就不应投资获取全信息。
对于随机事件,要知道其全部信息,需要知道该事件的总体。而这往往是不可能的,因此全信息实际上是不存在的。一般说来,研究或购买只能得到部分信息,然而这一部分信息也是有价值的。在具有部分信息的情况下应如何决策,这就是下面要说的贝叶斯决策。
第六章——14 二、贝叶斯决策
在实际决策中人们为了获取信息,往往采取各种“试验”手段(抽样调查、抽样检验、购买信息、专家咨询等),但这样获取的信息不能准确预测未来将出现的状态,因此称这种信息为不完全信息或样本信息。一般来说,样本信息也可以给决策者带来额外收益,该额外收益就是样本信息的价值。
对于风险决策问题,根据以往的经验或统计资料可以估计出各自然状态出现的概率,如表6—10中各自然状态的概率。这种由过去经验或专家估计所获得的各自
然状态的概率称为先验概率。如果决策者通过“试验”等手段,获得了自然状态出现概率的新信息作为补充信息,用它来修正原来的先验概率估计,得到修正后的各状态的概率,这种概率称之为后验概率。后验概率通常要比先验概率准确可靠,可作为决策者进行决策分析的依据。由于这种概率的修正是借助于贝叶斯定理完成的,所以这种情况下的决策称之为贝叶斯决策。具体步骤是: (1)先由过去的资料和经验获得状态发生的先验概率;
(2)根据调查或试验得到各状态下试验事件的条件概率,并利用贝叶斯公式计算出各状态的后验概率,即 P(SjBk)=P(Sj)P(Bk|Sj) ∑P(S)P(Bi
inj=1, ,n;k=1, ,l k|Si)
式中 P(Sj)为状态Sj的先验概率; P(Bk|Sj)为试验获取的信息,其意义为在状态为Sj条件下出现事件Bk的概率;P(Sj|Bk)为试验事件为Bk时状态Sj的后验概率(条件概率)。P(Bk)=∑P(Si)P(Bk|Si)为全概率公式。
i=1n
(3)利用后验概率代替先验概率进行决策分析。
例6.9 对于表6—10所描述的决策问题,决策者为了掌握更多的信息,决定花费 1.5万元请咨询公司调查该新产品的销路情况。调查结果为:在需求量大的情况下,该新产品销路好与不好的概率分别为0.8和0.2;在需求量一般的情况下,该新产品销路好与不好的概率各为0.5;在需求量小的情况下,该新产品销路好与不好的概率分别为0.3和0.7。这些数据列于表6—12。 问:(1)花费1.5万元进行调查是否合算; (2)应如何根据调查结果进行决策。
第六章——15
解:根据所获信息,利用贝叶斯公式,可以得到修正后的各自然状态的概率(后验概率)。
在信息为销路好时,有
P(B1) = P(S1)×P(B1|S1)+P(S2)×P(B1|S2)+P(S3)×P(B1|S3) = 0.3×0.8+0.5×0.5+0.2×0.3 = 0.55 因此有