不重复随机抽样又称不重置随机抽样或无放回随机抽样,它是指在抽取样本时,从总体中随机抽取一个单位,观察记录以后就不再放回总体,下一次从剩下的N -1 个单位中抽取第二个单位,依次类推,最后从剩下的N -n+1 个单位中抽取第n 个单位。不重复随机抽样每次抽取的结果会影响下一次抽取,因而每个单位的中选概率在各次抽取中是不同的。从N 个单位中随机抽取n 个单位组成样本,如果不考虑顺序,共有种抽法。
(一)变量总体的样本分布
在不重复随机抽样条件下,变量总体的样本分布是样本的概率分布,反映样本分布的形状及样本统计量接近总体参数的程度。
假设全及总体为4 名工人,分别是A、B、C、D,4 名工人的日产量分别为60 件、70 件、80 件、90 件,采用不重复抽样办法随机抽选出2 名工人作为样本以此来观察在不重复条件下,所有可能样本与全及总体之间的关系。
1.所有可能样本的构成
已知N= 4,n= 2,采用不重复抽样法,所有可能的样本数目为= 12,排列如图6-7 所示。
图 6-7 不重复抽样时所有可能的样本排列
2.所有可能样本的分布与全及总体单位分布的关系
不重复抽样时所有可能样本的样本平均数计算如图6-8 所示。
图6-8 不重复抽样时所有可能样本的样本平均数计算
编制分布数列并分别计算概率,然后绘制概率分布散点图,如图6-9 所示。
图6-9 不重复抽样时所有可能样本的概率分布散点图
由散点图可以看出,所有可能样本分布呈现正态分布,其单位分布与全及总体一致,具有代表性。
3.数学期望值
数学期望值计算如下。
(1)对于未分组资料:
(2)对于分组资料:
样本单位数为=Σf,则
在以上案例中,总体平均数
所有可能样本的样本平均数分布如图6-10 所示。
图6-10 所有可能样本的样本平均数分布
数学期望值计算如图6-11 所示。
图6-11 数学期望值计算
由此可见,在不重复随机抽样中,样本平均数的平均数与全及总体的总体平均数也相等,即样本平均数的数学期望值等于总体平均数。
4.抽样平均误差与总体方差的关系
研究抽样平均误差与全及总体方差的关系,其目的在于推导不重复抽样时的平均抽样误差计算公式。
(1)方差分布。
在不重复随机抽样条件下,将所有可能样本的样本平均数的方差与总体方差进行比较。
总体方差:
样本容量为n=2=75 件,所有可能样本的样本平均数的方差计算如图6-12 所示。
图6-12 所有可能样本的样本平均数的方差计算
所有可能样本的样本平均数的方差:
显然,不重复随机抽样时所有可能样本的样本平均数的方差41.67 件2 小于总体方差125 件2。(www.zuozong.com)
再将不重复随机抽样时所有可能样本的样本平均数的方差与重复随机抽样时的样本平均数的方差、总体方差进行比较:
显然,不重复随机抽样时所有可能样本的样本平均数的方差比重复随机抽样的要小,且比总体方差要小。
设所有可能的样本为x1,x2,…,xn,在不重复随机抽样的情况下,x1,x2,…,xn 之间不是相互独立的,而是具有互斥性的。推导过程如下:
其中xj -
)有n(n -1)个乘积,则
从公式的推导过程来看,不重复随机抽样平均方差等于重复随机抽样平均方差乘以
以上公式中的称为校正因子,一定是大于0 而小于1的正数;不重复随机抽样方差的数值一定小于重复随机抽样方差的数值。
以上案例中,所有可能样本的平均方差可用公式计算:
与用所有可能样本的样本平均数计算出的平均方差结果相等。
(2)抽样平均误差。
对公式等号两边同时开平方,得抽样平均误差
以上案例中,根据所有可能样本的样本平均数计算标准差:
根据抽样平均误差计算标准差:
用抽样平均误差公式计算的结果与用所有可能样本的样本平均数计算的标准差结果相等,因此,平均抽样误差可以代表所有可能样本的标准差。
当N 足够大时,1 可以忽略不计,公式中的,则
一般情况下,总体单位数很大,抽样比率很小,则
接近于1,因此,上式可近似看作
。在实际工作中,在没有掌握总体单位数的情况下或者总体单位数N 很大(N ≥500)时,一般用重复抽样平均误差公式来计算而不用不重复抽样的平均误差。
【例6-3】 从某中学10000名学生中随机抽取500名进行身高测量,得平均身高为158 cm,标准差为10 cm。计算平均抽样误差。
解 在重复随机抽样条件下,平均抽样误差
在不重复随机抽样条件下,平均抽样误差
(二)属性总体的样本分布与总体成数的关系
在不重复随机抽样条件下,成数的样本分布是指样本成数的概率分布。在掌握不重复随机抽样平均数的平均误差的基础上,成数的方差和标准差只需将变量换成成数即可。
设p 为样本成数,P 为总体成数,则有如下计算方法。
(1)样本成数的抽样分布数学期望值为:E(p)= P。
(2)所有可能样本的成数的方差与总体方差之间的关系为:
(3)样本成数的平均抽样误差,用μp 表示:
【例6-4】 有一批食品共60000 袋,从中随机抽取300 袋,发现有6 袋不合格。求合格率和抽样平均误差。
解 ①合格率计算:
②抽样平均误差计算如下。
在重复随机抽样条件下:
在不重复随机抽样条件下:
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。