? ? 对于有些内部规律复杂、无法分析内在机理的问题,我们建模、拟合的通常做法就是搜集大量的数据,用统计方法建立模型——统计回归模型。 ? ? 关键点有:
1. 做散点图,大致判断函数趋势(比如有明显的线性增长),确定方程形式,待定系数。
2. 用MATLAB统计工具箱regress拟合,得出结果;重点:如何由MATLAB输出结果下结论(如置信区间不要包含零点,R^2、F)。
3. (考虑实际问题制约)适当引入变量简化问题,如10.1中引入价格差(p297最后一段说明)。
4. 利用好回归变量的预测(置信)区间。
5. 改进回归模型:逐渐考虑回归变量之间的交互作用——在方程中引入二次项、交叉项。若MATLAB拟合输出信息表明有改进,则说明模型更符合实际。还可加上作图对比前后模型(p300)。
6. 残差分析(p305,但这页我未看懂具体做法,待交流),及分析得出的结论,我们应该怎样改进模型。
7. p307评注内容:0-1变量法、残差分析法、异常值应剔除。 8. 线性化(p309),及非线性MATLAB求解(p310);p315最后两段。 9. 自相关的考虑(10.4节):若存在自相关性(具有滞后性,即前期对后期有影响的时间序列),普通回归模型将失去意义。我们必须先检测是否存在自相关(D-W检验、广义差分法),同时注意若高阶自相关,则必须改进直至不存在自相关为止。
10. 逐步回归:因素较多时,排除次要因素,用来选择影响因素显着的变量。
第11章 马氏链模型
关键词:离散随机过程 无后效性 转移概率 状态选取
基本概念
? ? 这一章介绍了处理离散随机过程的重要工具——马氏链模型,及若干个应用。总体从浅到深,阐述了马氏链的主要思想。
1. 无后效性/Markov性: 系统在每个时期所处的状态时随机的,这个时期到下个时期状态按照一定概率进行转移,且下个时期状态只取决于 1)这个时期状态 2)转移概率,与以前各时期状态无关。
2. 马氏链(Markov Chain)模型通常描述: 已知现在,将来与历史无关,具有无后效性的,时间状态均离散的随即转移过程。
3. 一些确定性系统的状态转移问题也能用马氏链处理。
一、健康与疾病
? ? 主要介绍马氏链基本概念、要素: 系统的状态,状态概率,转移概率,马氏链基本方程,状态概率向量,转移概率矩阵。本章讨论时齐的(转移概率与时段n无关)马氏链。
? ? 同时介绍2种主要类型——
? ? 1)正则链:从任意状态出发,经过有限次转移都能达到另外的任意状态(如何判断是正则链、相应定理);
? ? 2)吸收链:首先引入吸收状态,顾名思义吧,就是某个状态的转移概率=1,即进了这个状态就出不来了,被“吸收”掉。??吸收链是(至少)存在一个吸收状态,使马氏链从每个费吸收状态出发,能有限次到某个吸收状态。 二、钢琴销售的存贮策略
? ? 动态随机存贮。一个简化的存贮模型,关键是从中理解状态变量、需求量、转移矩阵的设置和求解。 判断转移矩阵P为正则链后,用公式求出稳态概率分布w,就是达到稳态后的情况,然后用全概率公式算出失去销售机会的可能性。 这个模型虽然简单,但却是动态存储马氏链的浅显易懂的好例子,其中结合实际问题具体分析是最值得学习的。 三、基因遗传
? ? 用马氏链模型研究遗传过程,关键是建模的过程——即选取系统的状态,这在“随机交配”和“近亲繁殖”中需用不同的设法。??随机交配过程推导的结果是 (p^2, 2pq, q^2) 分布将保持下去,即遗传学中的Hardy-Weinberg平稳定律;然而,近亲繁殖中,得到的转移矩阵发现是一个“吸收链”——即如果近亲结婚的话,若干代繁殖终将变成全是优种/全是劣种,并保持下去。这两个结论(虽然在理想化假设下)与我们之前的认识是很一致的,从中加深了马氏链的理解。 四、等级结构
? ? 这个模型是用马氏链研究一个群体中各个个体等级分布变化情况,目标是研究等级分布变化规律,假设总人数不变。然后用某种途径让群体等级分布达到想要的稳定状态。
? ? 重点在于变量的设置,以及还是状态设置、模型建立过程。??建模过后,先用“调入比例”这一现实中可控的量进行稳定控制,其中有“稳定域”的构造、分析。
然后是具体如何用调入比例,进行动态调节,实则转化为了一步步优化问题,动态调节的过程是一步接一步的,有重复循环的操作规律。这里也很好地体现了马氏链的“离散”特性,以及给编程创造了机会。 五、资金流通
? ? 基本与等级结构一样,一系列推导最后总结出步骤,先判断稳定能否达到,若能达到,则由公式算出每年应如何投放资金。??与等级模型不同在于:各地区资金进出可正可负;所有地区资金总和可以变化。
第11章小结:
? ? 虽然只有短短5节,但是几个模型由浅入深,循序渐进,学习中有逐渐清晰的感觉。过程的推导复杂度适中,具体问题具体分析的思想很经典。这章算是马氏链模型的基础,虽是基础但案例、思想也足够典型,是今后解决离散随机过程很有力的工具。
第12章 动态优化模型
关键词:泛函极值 变分法 动态规划 最短路
基本概念
? ? 本章介绍动态优化,优化目标,虽然优化目标仍然是数值,但最优策略是一个函数。连续过程归结于求泛函的极值问题(几个模型中一直体现),方法有古典变
分法、最优控制论。几个例子都是能用古典变分法解决的,而离散过程则用动态规划求解。
? ? 第一节先用“速降线”和“短程线”两个17世纪末的物理模型引出变分法基本概念,和后面要用的结果;同时介绍泛函、泛函极值概念。
? ? 这一章的数学知识、推导比较繁杂(尤其是对于没接触过泛函等概念的学生),2、3、4、5节(生产计划制订、国民收入增长、渔船出海、赛跑速度)均是连续动态优化的典型问题,许多都是归结于泛函极值的问题。尤其是“渔船出海”,实属一个经济学的典例,这个经济策略分析中再次很好地体现了数学技巧、实际问题结合的巧妙。
? ? 第6节多阶段最优生产计划属于离散动态优化,用动态规划求解,转化为最短路问题,当中对最短路问题的算法做出了详细解释。 分别对确定需求、随机需求的生产计划制订方法给出了推导思路。