概率论与数理统计实验

概率论与数理统计实验 实验2随机数的产生数据的统计描述

实验目的 学习随机数的产生方法直观了解统计描述的基本内容。实验内容 1、随机数的产生 2、统计的基本概念。 3、计算统计描述的命令。 4、计算实例。

一、随机数的产生 定义：设随机变量X~F(x),则称随机变量X的抽样序列{Xi}为分布F(x)的随机数 10常用分布随机数的产生在Matlab软件中，可以直接产生满足各种常用分布的随机数，命令如下：

调用格式： 1、y=random(‘name’, A1, A2, A3, m, n) 其中：’name’为相应分布的名称，A1, A2, A3为分布参数，m为产生随机数的行数，n为列数。 2、直接调用。如： y=binornd(n, p, 1,10) 产生参数位n，p的1行10 列的二项分布随机数

1、均匀分布U(a,b) • 1)unifrnd (a,b)产生一个[a,b] 均匀分布的随机数 • 2)unifrnd (a,b,m, n)产生m行n列的均匀分布随机数矩阵当只知道一个随机变量取值在（a，b）内，但不知道（也没理由假设）它在何处取值的概率大，在何处取值的概率小，就只好用U（a，b）来模拟它。

y1=7.7008 y2=3.3868 5.6411 4.9159 7.3478 6.5726 4.7388 2.1110 6.9284 4.6682 5.6926 y3=[6.7516 6.4292 4.4342 7.5014 7.3619； 7.5309 3.0576 7.6128 4.4616 2.3473] 例1、产生U(2,8)上的一个随机数，10个随机数， 2行5列的随机数。命令：(1) y1=unifrnd(2,8) (2) y2=unifrnd(2,8,1,10) (3) y3=unifrnd(2,8,2,5)

2、正态分布随机数 1)R = normrnd(μ, σ,)：产生一个正态分布随机数 2)R = normrnd(μ, σ,m,n)产生m行n列的正态分布随机数例2、产生N(10,4)上的一个随机数，10个随机数， 2行5列的随机数. 命令 (1) y1=normrnd(10,2) (2) y2=normrnd(10,2,1,10) (3) y3=normrnd(10,2,2,5)

当研究对象视为大量相互独立的随机变量之和，且其中每一种变量对总和的影响都很小时，可以认为该对象服从正态分布。当研究对象视为大量相互独立的随机变量之和，且其中每一种变量对总和的影响都很小时，可以认为该对象服从正态分布。机械加工得到的零件尺寸的偏差、射击命中点与目标的偏差、各种测量误差、人的身高、体重等，都可近似看成服从正态分布。

3、指数分布随机数 1) R = exprnd(λ)：产生一个指数分布随机数 2)R = exprnd(λ,m,n)产生m行n列的指数分布随机数例3、产生E(0.1)上的一个随机数，20个随机数， 2行6列的随机数。命令 (1) y1=exprnd(0.1) (2) y2=exprnd(0.1,1,20) (3) y3=exprnd(0.1,2,6)

结果 (1) y1=0.0051 (2) y2=[0.1465 0.0499 0.0722 0.0115 0.0272 0.0784 0.3990 0.0197 0.0810 0.0485 0.0233] (3) y3=[0.1042 0.4619 0.1596 0.0505 0.1615 0.0292； 0.0207 0.1974 0.1616 0.1301 0.4182 0.0809]

排队服务系统中顾客到达率为常数时的到达间隔、故障率为常数时零件的寿命都服从指数分布。排队服务系统中顾客到达率为常数时的到达间隔、故障率为常数时零件的寿命都服从指数分布。指数分布在排队论、可靠性分析中有广泛应用。例顾客到达某商店的间隔时间服从参数为0.1的指数分布指数分布的均值为1/0.1=10。指两个顾客到达商店的平均间隔时间是10个单位时间.即平均10个单位时间到达1个顾客. 顾客到达的间隔时间可用exprnd(10)模拟。

4、二项分布随机数 • R = binornd(n, p)：产生一个二项分布随机数 • 2) R = binornd(n,p,m,n)产生m行n列的二项分布随机数例4、产生B(10,0.8)上的一个随机数，15个随机数， 3行6列的随机数。命令 (1) y1=binornd(10,0.8) (2) y2=binornd(10,0.8,1,15) (3) y3=binornd(10,0.8,3,6)

20、其他分布随机数的产生方法 定理设X的分布函数为F(x)，连续且严格单调上升，它的反函数存在，且记为F-1(x)，则① F(X)~U(0,1) ②若随机变量U~U(0,1),则F-1(U) 的分布函数为F(x)。此定理给出的构造分布函数为F(x)的随机数的产生方法为：取U(0,1)随机数Ui,(i=1,2…),令Xi=F-1(Ui),则Xi ,(i=1,2…),就是F(x)随机数，如果Ui独立，则Xi也互相独立。

（一）直接抽样法（反函数法） （1）连续分布的直接抽样法设连续型随机变量X的分布函数为F(x)，则产生随机数的方法为：取U(0,1)随机数Ui,(i=1,2…),令Xi=F(Ui),则Xi ,(i=1,2…),就是F(x)随机数，如果Ui独立，则Xi也互相独立。

（2）离散分布的直接抽样法 设分布律为P(X=xi)= pi , i=1, 2, ...，其分布函数为F(x) ① 产生均匀随机数R，即R~U(0,1) ② 则X~F(x)

（二）变换抽样法 （三）值序抽样法（四）舍选抽样法（五）复合抽样法（合成法）（六）近似抽样法详见：高惠璇北京大学出版社《统计计算》

例5、设X分布函数为 解：Y的分布函数为其反函数为

设则生成n=20的1行10列随机数命令： U=unifrnd(0,1,1,10); Y=1-(1-U).^(1/20);

例6生成单位圆上均匀分布的1行10000列随机数，并画经验分布函数曲线。例6生成单位圆上均匀分布的1行10000列随机数，并画经验分布函数曲线。 Randnum=unifrnd(0,2*pi,1,10000); %(0,2pi)上均匀分布随机数 xRandnum=cos(Randnum);%横坐标 yRandnum=sin(Randnum);%丛坐标 plot(xRandnum,yRandnum);

例6频率的稳定性 1、事件的频率在一组不变的条件下，重复作n次试验，记m是n次试验中事件A发生的次数。频率f=m/n 2.频率的稳定性在重复试验中，事件A的频率总在一个定值附近摆动，而且，随着重复试验次数的增加，频率的摆动幅度越来越小，呈现出一定的稳定性.

掷一枚硬币，记录掷硬币试验中频率P*的波动情况。掷一枚硬币，记录掷硬币试验中频率P*的波动情况。 p为正面向上的概率，n为试验次数 (1)模拟产生n个0-1分布随机数randnum(n) (2)对模拟产生的随机数， xrandnum (i)表示第i次试验的结果，1表示正面向上，0表示反面向上。 (3)统计前i次试验中正面向上的次数，并计算频率（4）作图(关于频率和试验次数的图像）

在Matlab中编辑.m文件输入以下命令： function binomoni(p,n) pro=zeros(1,n); %频率向量 randnum = binornd(1,p,1,n);%产生二项分布随机数 a=0; for i=1:n a=a+randnum(1,i);%频数 pro(i)=a/i;%频率 end pro=pro; num=1:n; plot(num,pro,num,p)

在Matlab命令行中输入以下命令： binomoni(0.5,1000)

平均值（或均值，数学期望）： 二、常用统计量 1、表示位置的统计量—平均值和中位数中位数：将数据由小到大排序后位于中间位置的那个数值. • 平均值：mean(x) • 中位数：median(x) • 若x为矢量，返回平均值和中位数，若x为矩阵，结果为行向量，每个元素对应x中列元素的平均值和中位数

样本方差： 2、表示变异（离散）程度的统计量 —方差、标准差、极差它是各个数据与均值偏离程度的度量标准差：是方差的开方极差：样本中最大值与最小值之差. • 标准差：std(x) • 方差：var(x) • 极差：range(x)

例7：产生5组正态分布随机数，每组100个，计算均值、中位数、标准差、极差、方差。例7：产生5组正态分布随机数，每组100个，计算均值、中位数、标准差、极差、方差。 • x=normrnd(0,1,100,5); mean1=mean(x) median1=median(x) std1=std(x) var1=var(x) rang1=range(x)

3.表示分布形状的量—偏度和峰度 分布偏度：其估计量为：其中

正态分布偏度为0，偏度反映分布的对称性，g1 >0称为右偏态，此时数据位于均值右边的比位于左边的多；g1 <0称为左偏态，情况相反；而g1接近0则可认为分布是对称的. • 命令：y=skewness(x) • 若x为矢量，返回样本偏度，若x为矩阵，结果为行向量，每个元素对应x中列元素的样本偏度。

分布峰度 其估计量为：其中

峰度是分布形状的另一种度量，正态分布的峰度为3，若g2比3大很多，表示分布有沉重的尾巴，说明样本中含有较多远离均值的数据，因而峰度可用作衡量偏离正态分布的尺度之一 • 命令：y=kurtosis(x) • 若x为矢量，返回x的样本峰度，若x为矩阵，结果为行向量，每个元素对应x中列元素的样本峰度。

例8：产生5组正态分布随机数，每组100个，计算样本偏度和峰度。例8：产生5组正态分布随机数，每组100个，计算样本偏度和峰度。 • x=normrnd(0,1,100,5); • skewness1=skewness(x) • kurtosis1=kurtosis(x) • 例9：产生5组指数分布随机数，每组100个，计算样本偏度和峰度。 • x=exprnd(10,100,5); • skewness1=skewness(x) • kurtosis1=kurtosis(x)

定义： 设x1，x2，…，xn是总体的容量为n的样本值，将其按由小到大的顺序排列，并重新编号，记为三、分布函数的近似求法（直方图） 1、经验分布函数（累计频率直方图） Empirical Cumulative Distribution Function 总体分布函数的近似则经验分布函数为：

2、频率直方图——近似概率密度函数 下面介绍频率直方图和经验分布函数的做法

1、整理资料： 把样本值x1，x2，…，xn进行分组，先将它们依大小次序排列，得在包含的区间[a，b]内插入m-1个等分点：记t0=a,tm=b。第i个小区间为注意要使每一个区间 (i=1，2，…，m) 内都有样本观测值x i（i=1，2，…，n-1）落入其中.

统计出样本观测值在每个区间 中出现的次数它就是这区间或这组的频数，计算频率累计频数为累计频率为 2、求出各组的频数和频率：

记：其中d为区间长度，以小区间为底，以为高作长方形(i=1,2,…,m) 这样画出一排竖着的长方形极为频率直方图若以为高既得累计频率直方图 3、作图：

4、频数直方图的描绘 (1)、描绘数组data的频数直方图的命令为： hist(data, k) (2)、描绘附加带有正态密度曲线的直方图命令为： histfit(data , k) (3)、描绘数组data的经验分布函数的命令为： cdfplot(data)

例10 一道工序用自动化车床连续加工某种零件，由于刀具损坏等会出现故障.故障是完全随机的，并假定生产任一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录，故障出现时该刀具完成的零件数如下：作频数直方图及经验分布函数图

459 362 624 542 509 584 433 748 815 505 612 452 434 982 640 742 565 706 593 680 926 653 164 487 734 608 428 1153 593 844 527 552 513 781 474 388 824 538 862 659 775 859 755 49 697 515 628 954 771 609 402 960 885 610 292 837 473 677 358 638 699 634 555 570 84 416 606 1062 484 120 447 654 564 339 280 246 687 539 790 581 621 724 531 512 577 496 468 499 544 645 764 558 378 765 666 763 217 715 310 851

解 x=[459 362 624 542 509 584 433 748 815 505612 452 434 982 640 742 565 706 593 680926 653 164 487 734 608 428 1153 593 844527 552 513 781 474 388 824 538 862 659775 859 755 49 697 515 628 954 771 609402 960 885 610 292 837 473 677 358 638699 634 555 570 84 416 606 1062 484 120447 654 564 339 280 246 687 539 790 581621 724 531 512 577 496 468 499 544 645764 558 378 765 666 763 217 715 310 851]

hist(x,10) histfit(x,10)

作经验分布函数图 cdfplot(x)

例11、产生参数为10的指数分布随机数500个， 并画出直方图和经验分布函数图。产生随机数 • x=exprnd(10,100,1); 作直方图 hist(x,9) 作经验分布函数图 cdfplot(x)

概率论与数理统计实验

概率论与数理统计实验

Presentation Transcript