实验五 回归分析
一、实验目的
回归分析是数理统计中的一个重要分支,在工农业生产和科学研究中有着广泛的应用。通过本次实验要求掌握一元线性回归和一元非线性回归。
二、实验原理
回归分析是处理变量之间相关关系的一种数理统计方法。即用应用数学的方法,对大量的观测数据进行处理,从而得出比较符合事物内部规律的数学表达式。
1、一元线形回归方程 a、回归方程的求法
$y?y?b(x?x)
1其中x?N1y?x ,?iNi?1N?y
ii?1Nb、回归方程的稳定性
回归方程的稳定性是指回归值$y的波动大小。波动愈小,回归方程的稳定性愈好。
?2$y????b0?x?b?2x?b0b?$y2221(x?x)2? Nlxx2、回归方程的方差分析及显著性检验
(1)回归问题的方差分析
观测值y1,y2...,yN之间的差异,是由两个方面原因引起的:①自变量x取值的不同;②其他因素(包括试验误差)的影响。
N个观测值之间的变差,可用观测值y与其算术平均值y的离差平方和来表示,称为总的离差平方和。记作
S??(yt?y)2?lyy
i?1NS?U?Q
U??(μyt?y)2称为回归平方和,它反映了在y总的变差中由于x和y
i?1N的线性关系而引起变化的部分。
Q??(yt?μyt)2成为残余平方和,既所有观测点距回归直线的残余误差
i?1N平方和。它是除了x对y的线性影响之外的一切因素对y的变差作用。 (2)回归方程显著性检验
回归方程显著性检验通常采用F检验法。
F?U/?U Q/?Q重复实验的情况
为了检验一个回归方程拟合得好坏,可以做重复实验,从而获得误差平方和和失拟平方和,用误差平方和对失拟平方和进行F检验,就可以确定回归方程拟合得好坏。
S?U?QL?QE
U?mblxy??Ql?mlyy?U??nm 2?QE???(yti?yi)?t?1i?1??S?U?QL?QE?
三、实验内容
采用回归分析算法用matlab编程实现下列题目的要求。
1、材料的抗剪强度与材料承受的正应力有关。对某种材料实验数据如下: 正应力x/pa 抗剪强度y/pa 26.8 26.5 25.4 27.3 28.9 24.2 23.6 27.1 27.7 23.6 23.9 25.9 24.7 26.3 28.1 22.5 26.9 21.7 27.4 21.4 22.6 25.8 25.6 24.9 假设正应力的数值是精确的,求①减抗强度与正应力之间的线性回归方程。②当正应力为24.5pa时,抗剪强度的估计值是多少?
2、在制定公差标准时,必须掌握加工的极限误差随工件尺寸变化的规律。例如,对用普通车床切削外圆进行了大量实验,得到加工极限误差Δ与工件直径D的统计资料如下: D/mm 5 Δ/μm 8 10 11 50 19 100 23 150 27 200 29 250 32 300 33 350 35 400 37 求极限误差Δ与工件直径D0关系的经验公式? 3、在4种不同温度下观测某化学反应生成物含量的百分数,每种在同一温度下重复观测3次,数据如下:
温度x/0c 150 77.4 76.7 78.2 200 84.1 84.5 83.7 250 88.9 89.2 89.7 300 94.8 94.7 95.9 生成物含量的百分数y 求y对x的线性回归方程,并进行方差分析和显著性检验。
4、用x光机检查镁合金铸件内部缺陷时,为了获得最佳的灵敏度,透视电压y应随透视件的厚度x而改变,经实验获得下表所示一组数据,假设透视件的厚度x无误差,试求透视电压y随厚度x变化的经验公式。 x/mm 12 y/kv
13 14 15 16 18 20 22 24 26 52.0 55.0 58.0 61.0 65.0 70.0 75.0 80.0 85.0 91.0 四、实验数据处理 ? 题目一
1、程序
x=[26.8 25.4 28.9 23.6 27.7 23.9 24.7 28.1 26.9 27.4 22.6 25.6]
%自变量序列数据
y=[26.5 27.3 24.2 27.1 23.6 25.9 26.3 22.5 21.7 21.4 25.8 24.9]
%因变量序列数据
X=[ones(size(x')), x']
[b,bint,r,rint,stats]= regress(y',X,0.05) %调用一元回归分析函数 2、在matlab中运行结果
3、小结:
由以上程序运行的结果得到减抗强度与正应力之间的线性回归方程为y=0.4298+7.5367x+0.0206x2+2.6885x3, 当正应力x为24.5pa时,抗剪强度的估计值y=39734.9pa。
? 题目二
1、程序
x=[5 10 50 100 150 200 250 300 350 400]
%自变量序列数据 y=[8 11 19 23 27 29 32 33 35 37] %因变量序列数据 X=[ones(size(x')), x']
[b,bint,r,rint,stats]= regress(y',X,0.05) 2、在matlab中运行结果
极限误差Δ与工件直径y=0.8997+71.7633x+11.2884x3。
D0关系经验公式