matlab中基本统计和回归命令(可编辑)
例3 设某商品的需求量与消费者的平均收
入、商品价格的统计数 据如下,建立回归模型,预测平均收入为1000、 价格为6时 的商品需求量. 法一 直接用多元二项式回归: x1
[1000 600 1200 500 300 400 1300 1100 1300 300]; x2 [5 7 6 6 8 7 5 4 3 9];
y [100 75 80 70 50 65 90 100 110 60]'; x [x1' x2']; rstool x,y,'purequadratic' 在画面左下方的下拉式菜单中选”all”, 则beta、 rmse和residuals都传送到Matlab工作区中. 在左边图形下方的方框中输入 1000,右边图形下方的方框中输入6。 则画面左边的“Predicted Y”下 方的数据变为88.47981,即预测出平均收入为1000、价格为6时的商品需求量
为88.4791. 在Matlab工作区中输入命令: beta, rmse 结果为: b 110.5313 0.1464 -26.5709 -0.0001
1.8475 stats 0.9702 40.6656 0.0005 法二 将
化为多元线性回归: 非线性回 归 (1)确定回归系数的命令: [beta,r,J] nlinfit(x,y,’model’, beta0) (2)非线性回归命令:nlintool
(x,y,’model’, beta0,alpha) 1、回归: 残差 Jacobian矩阵 回归系数 的初值 是事先用m-文件定义的非线性函数 估计出的回归系数 输入数据x、y 分别为 矩阵和n维列向量,对一元非线性回归,x为n
维列向量。 2、预测和预测误差估计: [Y,DELTA] nlpredci(’model’, x, beta,r,J) 求nlinfit 或nlintool所得的回归函数在x处的预测值Y及预 测值的显著性为1-alpha的置信区间Y DELTA. * * 一、数据的录入、保存和
调用 例1 上海市区社会商品零售总额和全民所有制职工工资总额的 数据如下 统计工具箱中的基本统计命令 1、年份数据以1为增量,用产生向量
的方法输入。 命令格式: x a:h:b t 78:87 2、分别以 x和y代表变量职工工资总额和商品零售总额。 x [23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4]
y [41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0] 3、将变量t、
x、y的数据保存在文件data中。 save data t x y 4、进行统计分析 时,调用数据文件data中的数据。 load data 1、输入矩阵: data [78,79,80,81,82,83,84,85,86,87,88;
23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;
41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0] 2、将矩阵data
的数据保存在文件data1中:save data1 data 3、进行统计分析时,先用命令: load data1 调用数据文件data1中的数据,再用以下命令分别将矩阵data 的第一、二、三行的数据赋给变量t、x、y: t data 1,: x data 2,: y data 3,: 若要调用矩阵data的第j列的数据,可用命令: data :,j 二、基本统计量 对随机变量x,计算其基本统计量的命令如下: 均
值:mean x 中位数:median x 标准差:std x 方差:var x 偏 度:skewness x 峰度:kurtosis x 三、常见概率分布的函数 Matlab 工具箱对每一种分布都提供五类函数,其命令字符为: 概率密度:pdf 概 率分布:cdf 逆概率分布:inv 均值与方差:stat 随机数生成:rnd (当 需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起
来,并输入自变量(可以是标量、数组或矩阵)和参数即可.) 在Matlab中输 入以下命令: x -6:0.01:6; y normpdf x ; z normpdf x,0,2 ; plot x,y,x,z
1、密度函数:p normpdf x,mu,sigma 当mu 0,sigma 1时可缺省 如对均值 为mu、标准差为sigma的正态分布,举例如下: 3、逆概率分布:x norminv P,mu,sigma . 即求出x ,使得P X x P.此命令可用来求分位数. 2、概率分布:
P normcdf x,mu,sigma 4、均值与方差:[m,v] normstat mu,sigma 例5 求 正态分布N 3,52 的均值与方差. 命令为:[m,v] normstat 3,5 结果为:m 3,v 25 5、随机数生成:normrnd mu,sigma,m,n .产生m?n阶的正态
分布随机数矩阵. 例6 命令:M normrnd [1 2 3;4 5 6],0.1,2,3 结果为: M 0.9567 2.0125 2.8854
3.8334 5.0288 6.1191 此命令产生了2?3的正态分布随
机数矩阵,各数分别服从N 1,0.12 , N 2,22 , N 3, 32 , N 4,0.12 , N 5, 22 ,N 6, 32 1、给出数组data的频数表的命令为: [N,X] hist data,k 此命令将区间[min data , data ]分为k个小区间(缺省为10),返回数组data
落在每一个小区间的频数N和每一个小区间的中点X. 2、描绘数组data的频数
直方图的命令为: hist data,k 四、频 数 直 方 图 的 描
绘 五、参数估计 1、正态总体的参数估计 设总体服从正态分布,则其 点估计和区间估计可同时由以下命令获得:
[muhat,sigmahat,muci,sigmaci] normfit X,alpha 此命令在显著
性水平alpha下估计数据X的参数(alpha缺省时设定为0.05),返回值muhat
是X的均值的点估计值,sigmahat是标准差的点估计值, muci是均值的区间估
计,sigmaci是标准差的区间估计. 2、其它分布的参数估计 有两种处理办法: 一.取容量充分大的样本(n 50),按中心极限定理,它近似地 服从正态分布; 二.使用Matlab工具箱中具有特定分布总体的估计命令. (1)[muhat, muci] expfit X,alpha ----- 在显著性水平alpha下,求指数分布的数据X的均值的
点估计及其区间估计. (2)[lambdahat, lambdaci] poissfit X,alpha ----- 在显著性水平alpha下,求泊松分布的数据X 的参数的点估计及其区间估计. (3)[phat, pci] weibfit X,alpha ----- 在显著性水平alpha下,求Weibull 分布的数据X 的参数的点估计及其区间估计. 六、假设检验 在总体服 从正态分布的情况下,可用以下命令进行假设检验. 1、总体方差sigma2已知时,
总体均值的检验使用 z-检验 [h,sig,ci] ztest x,m,sigma,alpha,tail 检验数据 x 的关于均值的某一假设是否成立,其中sigma 为已知方差, alpha
为显著性水平,究竟检验什么假设取决于 tail 的取值: tail 0,检验假设 “x 的均值等于 m ” tail 1,检验假设“x 的均值大于 m ” tail -1,检 验假设“x 的均值小于 m ” tail的缺省值为 0, alpha的缺省值为 0.05. 返回值 h 为一个布尔值,h 1 表示可以拒绝假设,h 0 表示不可以拒绝假设,
sig 为假设成立的概率,ci 为均值的 1-alpha 置信区间. 例7 Matlab统计 工具箱中的数据文美国1993年一月份和二月份的汽油平均价格
(price1,price2分别是一,二月份的油价,单位为美分),它是容量为20的双样本.假设一月份
油价的标准偏差是一加仑四分币(? 4),试检验一月份油价的均值是否等于115.
解 作假设:m 115. 首先取出数据,用以下命令: load gas 然