当前位置:首页 期刊杂志

不同抽样估计方法在我国出版物发行网点总数估计中效果的比较

时间:2024-04-25

李秀清

摘 要:文章选取2014年我国分地区出版物发行网点数量的数据,按照25%的经验比例抽取了8个省市自治区作为样本,分别运用简单随机抽样、分层抽样、PPS抽样来估计2014年我国出版物发行网点总量。计算结果表明,PPS抽样误差率最小,估计精度最高,效果最好,简单随机抽样次之,分层抽样的误差率最高,估计效果最差。

关键词:出版物发行;简单随机抽样;PPS 抽样;分层抽样;效果比较

本文根据我国2014年分地区出版物发行网点数量,应用三种不同的抽样估计方法,估计我国2014年出版物发行网点的总数量,以期对我国出版物发行状况有一个更客观、合理的反映。

一、简单随机抽样

简单随机抽样又称纯随机抽样,即从总体N(31)中抽取n(8)个样本单位时,总体中的每个单位具有相同的概率被抽中,也就是保证等概率。

(一)抽取原理。根據我国2014年各省市自治区出版物发行机构的数据,从31个总体中按照随机原则抽取25%作为样本,即下表所示的8个省市自治区。

(二)估计过程。文章的目的是用已抽取8个样本地区的数据估计全国31个地区总的出版物发行网点数,则n=8,N=31。

即总体平均数的估计值:

点估计量:

估计方差:

总体总量的估计:

二、分层抽样

分层抽样是先将总体的单位按某种特征分为若干次级次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。可以提高总体指标估计的精确度。分组减小了各抽样层变异性的影响,抽样保证了所抽取的样本具有足够的代表性。

(一)抽样方法及原理

将我国31个省按地域分为中部、西部、东部,分别为:

中部:山西,吉林,黑龙江,安徽,江西,河南,湖南,湖北。

东部:北京,天津,河北,辽宁,上海,江苏,浙江,福建,广东,山东,海南。

西部:四川,重庆,贵州,云南,西藏,陕西,甘肃,宁夏,青海,新疆,广西,内蒙古。

按照等比例抽样方法,从中部随机抽取2个样本,从西部和东部各随机抽取3个样本,样本数据如表2所示:

(二)估计量

总体平均数的估计值:

三、PPS抽样方法

(一)抽样原理。PPS抽样方法是指放回的按规模大小成比例的概率抽样。它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。PPS是按概率比例抽样,是指在多阶段抽样中,尤其在二阶段抽样中,初级抽样单位被抽中的概率取决于其初级抽样单位的规模大小,初级抽样单位规模越大,被抽中的机率就越大;初级抽样单位规模越小,被抽中的机率就越小。PPS抽样就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。

将我国2013年各省发行网点合计数进行升序排序后(从上至下依次为、 …)再累加并进行编码(1~、~ … ~),结果如表3所示:

(二)估计量

1、样本单位的抽取。本文采用规模累计等距抽样的方法,从N(31)个总体中抽取其25%的样本即n(8)个样本。总体为我国分地区出版物发行网点的总数,由上表可知总体的全距为1722307,由可得组距为21538(172307/8),在1~21538中随机抽取一个数字12306,在编码中找其所属范围及对应的地区;在前一个随机数的基础上加组距21538再找其所属范围及对应省份;依次类推,抽取的样本分别为山西、福建、辽宁、山东、上海、北京、浙江、江苏。如表4所示:

2、估计量

根据公式 及 得:

字母含义: :2014年我国分地区出版物发行网点估计总量; :2013年我国各省出版物发行网点在全国发行网点中所占的比重;:估计的2014年我国各省出版物发行网点的方差

四、估计效果的比较

由表5可知,对我国出版物发行网点总量进行估计,得出PPS抽样的估计精度最高,为97.3%;简单随机抽样的次之,为77.27%;分层抽样的估计精度最低,仅为51.86%。

参考文献:

[1]王虎屏.新形势下的城乡出版物发行网点建设[A].新形势下的城乡出版物发行网点建设[C].2013:4.

[2]姚贞.出版物发行网点建设必须纳入公共服务设施规划[N].中国新闻出版报,2011-07-21(004).

[3]张玉.PPS抽样方法在我国出口贸易预测中的应用[J].经济研究导刊,2011(2):156-157.

[4]中华人民共和国国家统计局.中国统计年鉴—2015[M].北京:中国统计出版社,2015.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!