(四)多元分布
在这个课程里面,我不将多维的随机变量拆分成多个一维的随机变量来表述,而是将各个维度组合成一个随机变量向量。多元随机变量分布需要掌握联合分布、边缘分布和条件分布。
联合分布和单变量PDF类似,如果将其对随机变量某个取值范围做积分就可以得到随机变量最终取值落在该区间内的概率。
边缘分布是只考虑多维随机变量中的某一维,其他维度不考虑情况下的PDF 条件分布是固定随机变量在其他维度的取值,再考虑剩余那个维度上的PDF。
如图是一个二维正态分布(两个维度间相关系数为0.3)的示意图。两个小图分别是第一和第二维度的边缘分布PDF图(都是标准正态分布PDF)。右上角的大图是依据此二维正态联合分布生成的随机数。从随机数的疏密程度可以看出联合分布PDF函数在该区域的大小。
研究这些分布不是我们的目的,只是达到目的的手段。我们所需要做的事情是生成符合各种分布的随机数。由分布的不同类型——连续型和离散型,常规型(Matlab中有内置函数)和特殊型(Matlab中无内置函数),一维分布和多维分布——我们接下来就各种情况分别讲述如何在Matlab中生成各种各样的随机数。
十六、一维随机数
两个注意事项:
1.生成随机数有两种选择,可以每次只生成一个随机数,直接用此数计算f(x),然后循环重复此过程,最后求平均值;另一种方法是每次生成全部循环所需的随机数,利用Matlab矩阵运算语法计算f(x),不需要写循环,直接即可求平均值。前一种方法代码简单,但速度慢;后一种方法代码相对更难写。此处一定要掌握如何生成随机数组成的向量和矩阵(单个随机数就是一个1*1的矩阵),在后面章节的例子里面一般会有两个版本的代码分别讲述这两种生成方法。
2.生成了一维的随机数后,可以用hist()函数查看这些数服从的大致分布情况。
(一)Matlab内部函数
a. 基本随机数
Matlab中有两个最基本生成随机数的函数。 1.rand()
生成(0,1)区间上均匀分布的随机变量。基本语法: rand([M,N,P ...])
生成排列成M*N*P... 多维向量的随机数。如果只写M,则生成M*M矩阵;如果参数为[M,N]可以省略掉方括号。一些例子:
rand(5,1) %生成5个随机数排列的列向量,一般用这种格式 rand(5) %生成5行5列的随机数矩阵
rand([5,4]) %生成一个5行4列的随机数矩阵 生成的随机数大致的分布。 x=rand(100000,1); hist(x,30);
由此可以看到生成的随机数很符合均匀分布。(视频教程会略提及hist()函数的作用) 2.randn()
生成服从标准正态分布(均值为0,方差为1)的随机数。基本语法和rand()类似。 randn([M,N,P ...])
生成排列成M*N*P... 多维向量的随机数。如果只写M,则生成M*M矩阵;如果参数为[M,N]可以省略掉方括号。一些例子:
randn(5,1) %生成5个随机数排列的列向量,一般用这种格式 randn(5) %生成5行5列的随机数矩阵
randn([5,4]) %生成一个5行4列的随机数矩阵 生成的随机数大致的分布。 x=randn(100000,1); hist(x,50);
由图可以看到生成的随机数很符合标准正态分布。
b. 连续型分布随机数
如果你安装了统计工具箱(Statistic Toolbox),除了这两种基本分布外,还可以用Matlab内部函数生成符合下面这些分布的随机数。
3.unifrnd()
和rand()类似,这个函数生成某个区间内均匀分布的随机数。基本语法
unifrnd(a,b,[M,N,P,...])
生成的随机数区间在(a,b)内,排列成M*N*P... 多维向量。如果只写M,则生成M*M矩阵;如果参数为[M,N]可以省略掉方括号。一些例子:
unifrnd(-2,3,5,1) %生成5个随机数排列的列向量,一般用这种格式 unifrnd(-2,3,5) %生成5行5列的随机数矩阵
unifrnd(-2,3,[5,4]) %生成一个5行4列的随机数矩阵 %注:上述语句生成的随机数都在(-2,3)区间内. 生成的随机数大致的分布。 x=unifrnd(-2,3,100000,1); hist(x,50);
由图可以看到生成的随机数很符合区间(-2,3)上面的均匀分布。
4.normrnd()
和randn()类似,此函数生成指定均值、标准差的正态分布的随机数。基本语法 normrnd(mu,sigma,[M,N,P,...])
生成的随机数服从均值为mu,标准差为sigma(注意标准差是正数)正态分布,这些随机数排列成M*N*P... 多维向量。如果只写M,则生成M*M矩阵;如果参数为[M,N]可以省略掉方括号。一些例子:
normrnd(2,3,5,1) %生成5个随机数排列的列向量,一般用这种格式 normrnd(2,3,5) %生成5行5列的随机数矩阵
normrnd(2,3,[5,4]) %生成一个5行4列的随机数矩阵
%注:上述语句生成的随机数所服从的正态分布都是均值为2,标准差为3. 生成的随机数大致的分布。 x=normrnd(2,3,100000,1); hist(x,50);
如图,上半部分是由上一行语句生成的均值为2,标准差为3的10万个随机数的大致分布,下半部分是用小节“randn()”中最后那段语句生成10万个标准正态分布随机数的大致分布。
注意到上半个图像的对称轴向正方向偏移(准确说移动到x=2处),这是由于均值为2的结果。
而且,由于标准差是3,比标准正态分布的标准差(1)要高,所以上半部分图形更胖(注意x轴刻度的不同)。
5.chi2rnd()
此函数生成服从卡方(Chi-square)分布的随机数。卡方分布只有一个参数:自由度v。基本语法
chi2rnd(v,[M,N,P,...])
生成的随机数服从自由度为v的卡方分布,这些随机数排列成M*N*P... 多维向量。如果只写M,则生成M*M矩阵;如果参数为[M,N]可以省略掉方括号。一些例子:
chi2rnd(5,5,1) %生成5个随机数排列的列向量,一般用这种格式 chi2rnd(5,5) %生成5行5列的随机数矩阵
chi2rnd(5,[5,4]) %生成一个5行4列的随机数矩阵
%注:上述语句生成的随机数所服从的卡方分布的自由度都是5
生成的随机数大致的分布。 x=chi2rnd(5,100000,1); hist(x,50);
6.frnd()
此函数生成服从F分布的随机数。F分布有2个参数:v1, v2。基本语法 frnd(v1,v2,[M,N,P,...])
生成的随机数服从参数为(v1,v2)的卡方分布,这些随机数排列成M*N*P... 多维向量。如果只写M,则生成M*M矩阵;如果参数为[M,N]可以省略掉方括号。一些例子:
frnd(3,5,5,1) %生成5个随机数排列的列向量,一般用这种格式 frnd(3,5,5) %生成5行5列的随机数矩阵
frnd(3,5,[5,4]) %生成一个5行4列的随机数矩阵
%注:上述语句生成的随机数所服从的参数为(v1=3,v2=5)的F分布 生成的随机数大致的分布。 x=frnd(3,5,100000,1); hist(x,50);
从结果可以看出来, F分布集中在x正半轴的左侧,但是它在极端值处也很可能有一些取值。
7.trnd()
此函数生成服从t(Student's t Distribution,这里Student不是学生的意思,而是Cosset.W.S.的笔名)分布的随机数。t分布有1个参数:自由度v。基本语法
trnd(v,[M,N,P,...])
生成的随机数服从参数为v的t分布,这些随机数排列成M*N*P... 多维向量。如果只写M,则生成M*M矩阵;如果参数为[M,N]可以省略掉方括号。一些例子:
trnd(7,5,1) %生成5个随机数排列的列向量,一般用这种格式 trnd(7,5) %生成5行5列的随机数矩阵
trnd(7,[5,4]) %生成一个5行4列的随机数矩阵
%注:上述语句生成的随机数所服从的参数为(v=7)的t分布 生成的随机数大致的分布。 x=trnd(7,100000,1); hist(x,50);
可以发现t分布比标准正太分布要“瘦”,不过随着自由度v的增大,t分布会逐渐变胖,当自由度为正无穷时,它就变成标准正态分布了。
接下来的分布相对没有这么常用,同时这些函数的语法和前面函数语法相同,所以写得就简略一些——在视频中也不会讲述,你只需按照前面那几个分布的语法套用即可,应该不会有任何困难——时间足够的话这是一个不错的练习机会。
8.betarnd()
此函数生成服从Beta分布的随机数。Beta分布有两个参数分别是A和B。下图是A=2,B=5 的beta分布的PDF图形。
生成beta分布随机数的语法是: betarnd(A,B,[M,N,P,...])
9.exprnd()
此函数生成服从指数分布的随机数。指数分布只有一个参数: mu, 下图是mu=3时指数分布的PDF图形
生成指数分布随机数的语法是: betarnd(mu,[M,N,P,...])
10.gamrnd()
生成服从Gamma分布的随机数。Gamma分布有两个参数:A和B。下图是A=2,B=5 Gamma分布的PDF图形