摘要:抽样调查作为一种最常用的非全面调查方法,以其独有的特点和处理方法在统计实践中发挥着不可替代的作用。目前,抽样调查的方法很多,其中简单随机抽样、分层抽样、系统抽样和整群抽样是最基本和最典型的抽样方法,在现实中应用也很广泛。为了充分发挥抽样调查的作用,有必要对抽样调查典型方法的应用和推广作进一步的对比分析。本文在介绍国内有关抽样调查的前沿理论的基础上,详细阐述我国目前调查实践中典型抽样方法应用的现状,同具体对比分析四种典型抽样方法的适用条件、步骤、特性及其相互之间的关系等。
关键词:抽样方法;现状;定性比较
一、我国典型抽样调查方法的研究现状
20世纪40年代以后,随着抽样调查理论的不断发展和完善,抽样调查在世界各国得到了广泛的应用和推广,其范围涵盖了社会、经济、科技等各领域和人口、工业、农业、市场、交通运输、医疗等各个方面,成为世界各国统计调查的基本手段之一。
我国目前关于抽样调查理论与方法的相关研究结论主要有以下几方面:许碧娟[5]曾阐述了抽样调查要想在我国得到进一步的推广要注意的几个问题,例如地位的确立、政府方面的制度建设等。吴远芬[12]发表文章阐述我国目前抽样调查中的一些局限,例如,认识上的不重视、行政干预、数据衡量尺度上的多维化等等。任英华[4]总结了我国在推广抽样调查过程中存在的制约因素和解决措施。胡健颖[1]曾系统的讲述了抽样调查的相关理论及其六种主要的抽样方法的相关概念,同时给出了这些理论应用的条件和方法。
现在抽样调查已成为国际上通用的一种统计调查方法,而且抽样调查的应用水平已成为评价一国统计工作水平高低的标志之一。在我国,过去由于适应计划经济的要求,一直强调全面统计报表的主体地位和主要作用,对抽样调查研究的不多,应用也局限于国家统计系统的农村农产量、城市居民住户、物价调查等少数领域。实行改革开放政策以来,随着社会主义市场经济的发展,社会经济成份复杂了,不确定因素增多了,统计数字受主客观因素的影响,而出现误差的现象日益严重,并且市场经济对信息的及时性要求大大提高了,全面统计报表取得的信息远不能适应各级领导和企业经营决策的需要,因而机动灵活的抽样调查方法就得到应有的重视。可以说社会主义市场经济的建立为我国全面实施推广抽样调查提供了客观基础,以抽样调查为主体的适应市场经济要求的新调查方法体系的建立,为推广抽样调查创造了有利条件。改革开放以来国家先后组建了城乡社会经济调查队和企业调查队,不少省、市、县根据需要建立了地方调查队,在不少领域开展了抽样调查,并取得了一定的经验和效果,为在我国全面推广抽样调查奠定了基础。
20 世纪80 年代以后,我国抽样调查理论的研究和应用迎来了一个全新的发展时期,先后成立农村抽样调查队、城市抽样调查队和企业调查队,分别承担了经常性的有关城市、农村及企业的各种社会经济情况的抽样调查。在联合国统计司的帮助下,又先后进行了第一期和第二期深入的妇女生育力调查。此外我国还在学生体质、交通运输等众多领域进行抽样调查,取得了令人满意的调查结果。
然而,目前我国抽样调查技术的应用仍然主要集中在宏观统计和官方统计的范围,几支专业调查队也仅仅涉及农产量调查、住户调查、物价调查、企业调查等有限领域,远未发挥专业调查队的潜力;另外,在市场统计体系、社会保障统计体系等众多领域的抽样调查还未开始进行;批发、贸易、零售统计采用抽样调查方法的试点工作刚刚开展,工业、商业、固定资产投资、第三产业等领域的抽样调查刚开始进行,仍需进一步努力。
随着认识的深入,我国经济和社会领域对于统计技术的实际应用已经开始重视,尤其是对于典型的抽样技术的应用,以其独特的优点,在质量控制体系、审计、社会研究等众多的课题领域都起到了重要的作用。要发展社会主义市场经济条件下的统计模式,扩大总体的统计范围,就必然要求扩大抽样调查的应用范围,推广典型抽样方法的应用,在实际应用中不断完善和提高理论研究水平,良性循环,只有这样才能从根本上保证抽样调查的在整个调查体系中的主体地位。
二、典型抽样调查方法介绍
抽样方法原则上可分为概率抽样和非概率抽样两大类。非概率抽样尽管在某些场合下是有用的,但它却经不起抽样理论的发展的检验,是因为这类方法不包含任何随机抽选的因素。因此本论文只介绍理论完善、应用广泛的概率抽样,并把其等同于一般的抽样或抽样调查。
典型的概率抽样方法包括以下几种形式:
1.简单随机抽样(或纯随机抽样)。从N个单位的总体中抽取n个单位组成样本,若N个单元每一个被抽中的机会或概率都相等,则这种方法就是简单随机抽样。这是一种完全按随机原则从总体中抽取抽样单位的抽样方法,利用这种方法得到的样本称为简单随机样本。简单随机样本的抽选方法有抽签法、随机数表、利用计算机产生随机数等,但本质上都是通过控制随机数的抽选方法来保证按随机原则取样。
2.系统抽样。它是事先将总体单位按一定顺序排列,先随机抽取一个单元作为样本的第一个单元,即起始单元,然后按某种确定的规则抽取其他样本的单元的一种抽样方法。系统抽样有两种基本的取样方法,直线等距抽样和循环等距抽样。直线等距抽样的具体做法是先假设总体单位数为N,样本容量为n,记K=N÷n,称为抽样间隔,将总体单位从1到N编号,从1到K中取一个随机数字,记为R,则与R对应的单位为第一个被抽中的样本单元,以后每隔K个单元取一个,直到抽出n个单元为止。而循环等距抽样是将总体的N个单元排成首尾相接的圆形,从1到N中随机抽取一个数字记为R,与R对应的单元为第一个入样单元,之后每隔K个单元抽取一个,直到抽出n个样本单元为止。
3.分层抽样(或类型抽样)。它是先将全部总体单位按某种特征或某种规则划分为不同的层,然后再在每一层中随机或机械等距地抽取被调查单位。分层抽样中,各层的样本可以采用同一种抽样方法,也可以采用不同的抽样方法。例如,某市学生的学习成绩调查,可先按(学生所隶属的)学校将学生分成若干组,然后再在每个组(即学校)中随机或等距抽取调查单位;对某校学生的健康状况进行调查时,可先将该校部学生划分成若干个年龄段,然后再对每个年龄段中的学生进行抽样。 4.整群抽样。整群抽样是将总体划分为若干群,然后以群为抽样单元,从总体中随机抽取一部分群,对选中的群中的所有基本单元进行调查的一种抽样技术。从方法上看,整群抽样是由一阶抽样向多阶抽样过度的桥梁。在第一阶段抽样中,如果抽出群后即对其中的所有单元进行调查,就是单阶段整群抽样。如果抽出群单元后,进一步从中按低一级的单元抽取子样本,即两阶段抽样。依次,也可以进一步三阶段抽样等。最后一个阶段抽取的单元可以是最终基本单元,也可以仍然是群体。
然而,在进行实际的抽样调查时,上述的各种方法也可以根据具体情况结合起来使用,以确保调查结果的准确性,同时又可以尽可能地节省时间和费用。
三、典型抽样调查方法的定性比较
1.简单随机抽样是一种最基本的抽样方法,它的特点是简单直观,在抽样框完整时,可以直接从中抽取样本。由于各单元的入样概率相同,用样本统计量对目标量进行估计及计算抽样误差都可以直接简单算术平均,比较方便。但简单随机抽样在实际应用中也存在一些局限:首先,它要求编制一个包含所有总体单元的抽样框,当N很大时,构造这样的抽样框并不容易;其次,根据这种方法抽出的单元很分散,给实施抽样调查增加了难度;最后,这种方法没有利用其他辅助信息以提高估计的效率。所以在规模较大的调查中,很少直接采用简单随机抽样,一般是将这种方法与其他抽样方法结合在一起使用。简单随机抽样是其他抽样方法的基础,它研究问题的思路和基本结论都成为其他抽样方法的研究前题。
2.分层抽样以分组法为基础,把具有相似特征或标志的单位归为一组,自然就缩小了组内被调查单位之间的差异程度,再通过加权平均可以缩小全部调查单位之间的差异程度,因而其结果具有较高的准确性。此外,分组往往是以客观存在或某些明显的标志为依据,因而也容易实施。这些显著的优点使得分层抽样在实践中被广泛地采用,特别是当总体的单位数目很大、单位之间的差异较大时必须使用它。如果层内样本是采取简单随机抽样方法抽取的(即分层随机抽样),则对于每一个层内样本来说,具有与简单随机抽样相同的性质。
3.系统抽样的最大优点是简便易行,简化抽样手续,这种方法可以保证被抽中的每一单元在总体中的分配比较均匀,缩小各单元之间的差异程度,提高抽样调查结果的可靠性,并且容易实施,还能节省大量的时间。但它也有突出的局限性:首先,如果总体单元的排列存在周期性的变化,而抽样者对此缺乏了解或者缺乏处理的经验,抽取样本的代表性可能就会很差。其次,系统抽样的方差估计比较麻烦,一般系统抽样都没有设计意义下的无偏估计量,并在很多实际应用中所采用的系统抽样都不是严格的概率抽样,这就给方差估计带来很大的困难。系统抽样可以看成是一种特殊的整群抽样,也可以看成是一种特殊的分层抽样。
4.整群抽样的特点在于每次抽取的不是一个单位或个体,而是一群单位。例如,对某市的教育质量进行调查时,以自然形成或客观存在的班、年级或学校作为抽样对象,在被抽中的班、年级或学校中对全部学生即单位或个体加以调查。这种方法有以下特点:首先是抽样框编制简单,只需编制群的抽样框;其次是这种方法比较简单易行实施便利,也可以节省费用。但调查结果的准确性较差,抽样误差较大有时并不能代表总体特征。它主要适用于具有某种特殊结构的总体,这种特殊结构就是,总体中各个群的结构相似,例如一般家庭成员中都有男性、女性,如果估计男女性别比例,以家庭为群,采取整群抽样,估计的精度要比直接抽取个人进行估计的精度高。
整群抽样与简单随机抽样之间的差别仅在于抽样单位的不同,如果把研究标志的群总值或群内均值看成基本单位的标志值,那么整群样本就与简单随机抽样的样本具有相同的性质,可以把整群抽样看成是以群为抽样单位的简单随机抽样;在系统抽样中,如果抽样单位是基本单位,而且总体的排列顺序是随机的,即各个抽样单位的标志值与抽样单位的排列序号之间没有相关关系,则等距抽样可以看作是一种简单随机抽样;如果按等距抽样的方法构造“群”,并且从总体的N群中采取简单随机抽样方法抽取一群作为样本,这样的整群抽样实际上就是等距抽样,因此,等距抽样也可以看成是样本容量为1的特殊的整群抽样。
然而,抽样方法除了以上的四种,经常用到的还有多阶段抽样、二重抽样以及复杂抽样等多种形式。在实际的抽样调查的处理中,经常会将几种方法综合起来应用,因为实际的数据是复杂的,并不是能够满足某个具体方法的使用条件,只有将两种或者以上的方法混合起来,才能在抽取样本量一定的情况下进一步的提高估计精度,例如分层抽样与简单随机抽样的结合,分层抽样与多阶段抽样的结合等。