2014年数学建模B作业:非参、灰色、时间序列分析
非参数统计
Ⅴ-1 某制造商想要比较两种不同的生产方法所花费的生产时间是否有差异。随
机地选取了11个工人,每一个工人都分别使用两种不同的生产方法来完成一项相同的任务,在样本中的每一个工人都做了观察。数据见表,试用Wilcoxon秩和检验这两种方法有无差异? 工人编号 方法1 方法2 1 10.2 9.5 2 9.6 9.8 3 9.2 8.8 4 10.6 10.1 5 9.9 10.3 6 10.2 9.3 7 10.6 10.5 8 10.0 10.0 9 11.2 10.6 10 10.7 10.2 11 10.6 9.8
解:提出原假设,这两组方法没有显著性差异,用配对实验的符号检验法,相应代码如下:
data ex; input x1 x2@@; y=x1-x2; cards; 10.2
9.5
9.6 9.8 9.2 8.8 10.6 10.2 10.6 10 10 11.2 10.7 10.6 ;
proc univariate; var y; run;
10.6 10.2 9.8 10.1 9.3 10.5
9.9 10.3
运行结果如下:
从结果中可以看出,sign统计量为3,其显著性为0.1094,大于0.05,故接受原假设,认为这两组方法没有显著性差异。
Ⅴ-2 为培训大学生志愿者为社区服务,设计了4种培训方案,记作为A,B,C,D.
将报名的30名大学生随机地分为4组,分别接受不同培训。训练一周后,按规定的要求考试,评定的成绩如下,试用非参数检验方法检验这四种培训方案的有效性是否存在显著差异? 培训方案A 60,75,62,76,73,98,86 培训方案B 72,52,68,82,74,64,87 培训方案C 61,85,78,66,70,59,69,79 培训方案D 63,58,65,71,84,77,80,89
解:提出原假设,这四种培训方案方法没有显著性差异,相应代码如下:
data ex;
do a=1 to 4;input n@@; do i=1 to n; input x@@; output;end;end; cards;
7 60 75 62 76 73 98 86 7 72 52 68 82 74 64 87 8 61 85 78 66 70 59 69 79 8 63 58 65 71 84 77 80 89 ;
proc npar1way wilcoxon;class a;var x; run;
运行结果如下:
从结果中可以看出,Chi-Square统计量为0.5537,其显著性为0.9069,大于0.05,故接受原假设,认为四种培训方案方法没有显著性差异。
Ⅴ-3 双胞胎智力的相关分析
某研究所对10对双胞胎儿童的智力进行调查,试计算其Pearson、Spearman和Kendall相关系数并对其进行相关性检验。
双胞胎编号 先出生儿童X 1 9.0 2 16.6 3 16.2 4 11.3 5 16.2 后出生儿童Y 7.8 19.3 20.1 7.1 13.0 6 7 8 9 10
解:
7.1 7.8 4.0 11.2 1.3 4.8 8.9 7.4 10.0 1.5 求其Pearson,Spearman和Kendall相关系数,代码如下:
DATA new; INPUT x y@@; CARDS; 9.0 7.8 16.6 16.2 11.3 16.2
19.3 20.1 7.1 13.0
7.1 4.8 7.8 8.9 4.0 7.4 11.2 ;
PROC CORR pearson spearman kendall; VAR x y; RUN;
10.0
1.3 1.5
结果如下:
Pearson Correlation Coefficients, N = 10 Prob > |r| under H0: Rho=0
x y
x 1.00000 0.88081 0.0008
y 0.88081 1.00000 0.0008
Spearman Correlation Coefficients, N = 10 Prob > |r| under H0: Rho=0
x y
x 1.00000 0.82067
0.0036
y 0.82067 1.00000 0.0036
Kendall Tau b Correlation Coefficients, N = 10 Prob > |r| under H0: Rho=0
x y
x 1.00000 0.67420 0.0071
y 0.67420 1.00000 0.0071
可见,x与y的Pearson相关系数为0.88081,概率为0.0008,达到极显著水平;Spearman相关系数为0.82067,概率为0.0036,达到极显著水平;Kendall相关系数0.67420,概率为0.0071达到极显著水平;故,x与y显著相关。
灰色系统作业:
Ⅴ-4 陕西省农业总产值数据如下:
已知下表数据 年份 总产值 1985 62.9 1986 58.8 1987 61.4 1888 87.2 1989 104.9 1990 124.8 1991 110.7 1992 129.0 1993 155.3 1994 219.03 请建立灰色系统GM(1,1)模型,并预测1995-1997三年的农业总产值。
(0)(0)(1)解:有原始时间1985-1994序列x(k),对x(k)生成1-AGO序列x(k)另外
可得Yn见表:
x(0)(k)、1-AGO序列x(1)(k)、Yn
k
1
2
3
4
5
6
7
8
9
10
x(0)(k) 62.9 58.8 61.4 87.2 104.9 124.8 110.7 129 155.3 219.03 895
1114.03
x(1)(k) 62.9 121.7 183.1 270.3 375.2 500 610.7 739.7
Yn
58.8 61.4 87.2 104.9 124.8 110.7 129 155.3 219.03
利用MATLAB编程得:
function [X,c,error1,error2]=example9_11() %利用MATLAB编程预测2003年中国蔬菜产量, %并对预测结果做残差检验和后验差检验,程序如下: X0=[62.9 ]; k=3;
[X,c,error1,error2]=GM11(X0,k) plot(1985:1994,X0,'g*-') hold on
plot(1985:1997,X) %%
function [X,c,error1,error2]=GM11(X0,k)
% 建立函数[X,c,error1,error2]=example9_3_2_3(X0,k)
% 其中X0为输入序列,k为预测长度,
% X为预测输出序列,c为后验差检验数,error1为残差,error2为相对误差 format long; n=length(X0); X1=[];
X1(1)=X0(1); for i=2:n
X1(i)=X1(i-1)+X0(i); %计算累加生成序列 end
for i=1:n-1
B(i,1)=-0.5*(X1(i)+X1(i+1)); %计算B,Yn
B(i,2)=1;
Y(i)=X0(i+1); end
alpha=(B'*B)^(-1)*B'*Y'; %做最小二乘估计 a=alpha(1,1);
b=alpha(2,1);
d=b/a; %计算时间响应函数参数 c=X1(1)-d; X2(1)=X0(1); X(1)=X0(1);
for i=1:n-1
X2(i+1)=c*exp(-a*i)+d;
X(i+1)=X2(i+1)-X2(i); %计算预测序列 end
for i=(n+1):(n+k)
X2(i)=c*exp(-a*(i-1))+d; %计算预测序列 X(i)=X2(i)-X2(i-1);
58.8
61.4 87.2 104.9
219.03
124.8
110.7
129.0 155.3