2013建模美赛B题思路 数学建模美赛B题论文
摘要
水资源是极为重要生活资料,同时与政治经济文化的发展密切相关,北京市是世界上水资源严重缺乏的大都市之一。本文以北京为例,针对影响水资源短缺的因素,通过查找权威数据建立数学模型揭示相关因素与水资源短缺的关系,评价水资源短缺风险并运用模型对水资源短缺问题进行有效调控。
首先,分析水资源量的组成得出影响因素。主要从水资源总量(供水量)和总用水量(需水量)两方面进行讨论。影响水资源总量的因素从地表水量,地下水量和污水处理量入手。影响总用水量的因素从农业用水,工业用水,第三产业及生活用水量入手进行具体分析。
其次,利用查得得北京市2001-2008年水量数据,采用多元线性回归,建立水资源总量与地表水量,地下水量和污水处理量的线性回归方程
y?=-4.732+2.138x1+0.498x2+0.274x3
根据各个因数前的系数的大小,得到风险因子的显著性为rx1>rx2>rx3(x1, x2,x3分别为地表水、地下水、污水处理量)。
再次,利用灰色关联确定农业用水、工业用水、第三产业及生活用水量与总用水量的关联程度ra=0.369852,rb= 0.369167,rc=0.260981。从而确定其风险显著性为ra>rb>rc。
再再次,由数据利用曲线拟合得到农业、工业及第三产业及生活用水量与年份
32
之间的函数关系,a=0.0019(t-1994)-0.0383(t-1994)-0.4332(t-1994)+20.2598;
b=0.014(t-1994)2-0.8261t+14.1337;
c=0.0383(t-1994)2-0.097(t-1994)+11.2116; D=a+b+c;预测出2009-2012年用水总量。
最后,通过定义缺水程度S=(D-y)/D=1-y/D,计算出1994-2008的缺水程度,绘制出柱状图,划分风险等级。我们取多年数据进行比较,推测未来四年地表水量和地下水量维持在前八年的平均水平,污水处理量为近三年的平均水平,得出2009-2012年的预测值,并利用回归方程
y?=-4.732+2.138x1+0.4982x2+0.274x3
计算出对应的水资源总量。通过预测的总用水量,水资源总量和缺水程度公式
S=(D-y)/D=1-y/D
计算出2009-2012年的缺水程度,根据划分的风险等级,判断出2009-2012年水资源风险等级均为中风险。
我们根据建立的模型,确定出农业用水量和地表水是最主要的风险因子,参考无法量化的风险因子如人口规模、产业结构、管理制度、水利工程设施等因素
的影响,根据所述的模型,把计算数据进行适当修正,提出一些合理化的建议,从而把风险降到最低,并报告北京市水行政主管部门。
关键词:多元线性回归 灰色关联分析 曲线拟合 缺水程度 风险因子
一、问题重述
水资源,是指可供人类直接利用,能够不断更新的天然水体。主要包括陆地上的地表水和地下水。
风险,是指某一特定危险情况发生的可能性和后果的组合。
水资源短缺风险,泛指在特定的时空环境条件下,由于来水和用水两方面存在不确定性,使区域水资源系统发生供水短缺的可能性以及由此产生的损失。
近年来,我国、特别是北方地区水资源短缺问题日趋严重,水资源成为焦点话题。
以北京市为例,北京是世界上水资源严重缺乏的大都市之一,其人均水资源占有量不足300m3,为全国人均的1/8,世界人均的1/30,属重度缺水地区,附表中所列的数据给出了1979年至2000年北京市水资源短缺的状况。北京市水资源短缺已经成为影响和制约首都社会和经济发展的主要因素。政府采取了一系列措施, 如南水北调工程建设, 建立污水处理厂,产业结构调整等。但是,气候变化和经济社会不断发展,水资源短缺风险始终存在。如何对水资源风险的主要因子进行识别,对风险造成的危害等级进行划分,对不同风险因子采取相应的有效措施规避风险或减少其造成的危害,这对社会经济的稳定、可持续发展战略的实施具有重要的意义。
《北京2009统计年鉴》及市政统计资料提供了北京市水资源的有关信息。利用这些资料和你自己可获得的其他资料,讨论以下问题:
1评价判定北京市水资源短缺风险的主要风险因子是什么?
影响水资源的因素很多,例如:气候条件、水利工程设施、工业污染、农业用水、管理制度,人口规模等。
2建立一个数学模型对北京市水资源短缺风险进行综合评价, 作出风险等级划分并陈述理由。对主要风险因子,如何进行调控,使得风险降低? 3 对北京市未来两年水资源的短缺风险进行预测,并提出应对措施。
4 以北京市水行政主管部门为报告对象,写一份建议报告。 二、问题分析
水资源对于经济文化发展和人民的生活水平密切相关,由于在特定的时空条件下,水资源由来水和用水两方面问题组成。来水可描述为水资源总量,具体由地表水资源总量,地下水资源总量,污水处理量三方面构成。用水量描述为总用水量,具体由农业用水,工业用水,第三产业及生活等其他用水三方面构成。从这两个方面入手,可以把握水资源的来源和去向,运用数学建模的方法进行分析,找出主要的风险因子。
第一步:对于水资源总量,主要有地表水,地下水和污水处理量等因素构成,这些量是能够进行量化的,可以根据权威数据,利用多元线性回归的方法对上述因素进行探讨,建立其与水资源总量的回归方程,从而反映出各因素与水资源总量之间的关系。经统计检验认为回归结果显著后,可用于预测和控制。
第二步:对于农业用水,工业用水,第三产业及生活等其他用水因素,虽然此因素能够量化,但考虑到其具有变化性和不可预知性,考虑依据往年的数据进行曲线的拟合,求出其拟合函数。最终运用灰色关联分析的方法确定其中的主要风险因子的具体影响程度。
第三步:将总用水量和供水量进行合成,得出差值。根据定义的缺水程度进行计算,得出北京市各年份的缺水程度表。
第四步:对北京市水资源风险进行综合评估,并做出等级划分。对主要的风险因子进行调控,使风险等级降低,并预测北京市未来两年水资源的短缺风险。
第五步:对于未从根本上影响总用水量和水资源总量的量进行定性讨论,并结合实际给出可行性措施,缓解缺水程度。
第六步:参照实际提出合理化建议。 三、模型假设
1. 假设气象条件对供水量的影响如降雨量最终全部进入地表水资源; 2. 假设地下水资源总量不会因为渗漏减少,且在运输的过程中不损失; 3. 假设再生水全部进入地下水资源总量;
4. 假设各个因素对水资源总量或用水总量作用的大小与其对风险度的作用大小具有一致性。
5. 风险度的大小可以用缺水的严重程度来度量。 6. 假设模型中所引用数据是真实有效的; 7. 假设客观因素不会一起突变
四、 符号说明
1 y为水资源总量
2. x1, x2,x3分别为地表水,地下水,污水处理量 3. y?α为回归方程所给出的值成为回归值
4. a,b,c分别为表示农业用水、工业用水、第三产业及生活等其他用水量 5. D为总用水量 6. S为定义的缺水程度 7. r为影响程度大小 8. t为年份
9. xi(k)为参考序列 10. yi(k)为各标准化序列 11. ρ为分辨系数 12. f为自由度 五、模型的建立与求解
5.1 地表水资源总量、地下水资源总量和污水处理量对水资源总量的影响 5.1.1 多元线性回归分析
由于地表水资源总量、地下水资源总量和污水处理量与供水量关系的不确定,采用多元线性回归分析的方法,确定这三个因素与供水量之间的函数关系式。选取2001-2008年供水量与其部分影响因素数据如表1.
项 目 全年水资源总量 地表水资源量 地下水资源量 污水处理总量 2001 19.2 7.8 15.7 5.24 2002 16.1 5.3 14.7 6.59 2003 18.4 6.1 14.8 7.85 2004 21.4 8.2 16.5 9.31 2005 23.2 7.6 18.5 11.83 2006 24.5 6.0 18.5 12.08 2007 23.8 7.6 16.2 12.88 2008 34.2 12.8 21.4 12.02 表1 2001-2008年供水量与其部分影响因素数据
设供水量为y,影响水资源总量的因素为地表水资源总量、地下水资源总量和污水处理量分别记为x1, x2,x3。
则建立3元线性回归模型y=β0+β1x1+β2x2+β3x3+ε,其中ε是随机误差服从正态分布N(0,δ),β0,β1,β2,β3为回归系数。
利用2001-2008年表一的实测数据代入上式,于是有
y=β0+β1x1α+β2x2α+β3x3α+ε(α=1,2……,8)
设b0,b1,b2,b3分别为参数β0,β1,β2,β3的估算值,则得回归方程 y?=b0+b1x1+b2x2+b3x3
y?α= b0+b1x1α+b2x2α+b3x3α (α=1,2……,8)
式中yα(α=1,2……,8)为样本值;y?α为回归方程所给出的值成为回归值,称y
α
-y?α(α=1,2……,8)为残差,它可划为样本值和回归值的偏差。
根据最小二乘法使残差平方和达到最小,即 Q=Σ
α=1
(yα-y?α)2
为最小,根据微积分的极限原理b0,b1,b2,b3必须满足
i=0(i=0,1,2,3)
将此正规方程组化简为(XTX)B?=XTY 其中
解得估算值
=(XTX)-1(XTY)=
这样计算得到i代入回归方程的回归方程如下
y?=-4.732+2.138x1+0.498x2+0.274x3
把(x1α,x2α,x3α)代入上式解出各个回归值(y?1,y?2…,y?8) 计算 → 自由度为fu=p=3 计算 =30 自由度为fα=n-p-1=8-3-1=4 总的离差平方和Syy=U+Q 检验回归方程的显著性等同于检验假设
H0 :β1=0,β2=0,β3=0. 作统计计量 F ====8.04
用α=0.05查表临界值F0.05(3,4)=6.59易见8.04>6.59,因此拒绝H0 即回归方程效果显著