
5.2 抽样过程
抽样过程包括五个紧密相关的步骤:定义目标总体,确定抽样框架,选择抽样方法,确定样本量和抽取样本单位(见图5-1)。样本设计和营销研究过程的其他步骤是密不可分的,因此应该与研究项目中的其他决策一起统筹考虑。

图5-1 抽样过程
5.2.1 定义目标总体
定义总体是抽样的第一步,也是非常重要的一步,只有将总体定义清楚了,后面的各个步骤才能够进行下去,否则将无从下手。
目标总体(target population)是某项研究所要推论的所有个体的集合,是通过研究要对其进行描述和推论的总体。抽样总体(sampling population)是从中实际抽取样本的所有个体的集合,通常依据抽样框架加以定义。应该根据内容、范围和时间三重标准定义目标总体。例如,某空调制造商拟进行一项售后服务满意度调查,其总体的定义如下:
目标总体:在调查前6个月以内接受过该公司售后服务的所有国内用户。在这个例子中,时间标准是调查参照时点前6个月以内;内容是接受过售后服务的用户;范围限定在国内用户。
抽样总体:在调查前6个月以内接受过该公司售后服务并保留了联系方式的所有国内用户。可能有部分用户接受过售后服务但没有保留下有效的联系方式,因此在调查时无法与其联系。如果没有留下联系方式的用户比例很高,那么抽样总体将不能很好地代表目标总体。
目标总体必须定义清楚,含糊的目标总体定义将会导致研究无效,甚至导致误解。例如某宠物食品公司在推出一种新口味猫粮前,对养猫的女士进行了调查。在让她们看了样品及其产品说明后,询问她们是否喜欢该产品,结果大多数宠物主人都说喜欢。但是,产品投放市场后销量却不佳,因为猫不喜欢吃。该公司显然将研究总体弄错了,目标总体应该是猫而不是人!
抽样单位(sampling unit)是抽样过程中的某一阶段可供抽取的基本单位。例如,在进行全国城市消费者调查时,第一、二、三阶段的抽样单位分别是城市、区、小区,最终的抽样单位是户。除了家庭或个人以外,营销研究常见的抽样单位还有机构(厂商、经销商等)、产品、品牌、刊物、栏目、节目等。
定义目标总体并非像外行们想象的那么简单。假如北京现代汽车公司进行一项用户调查,应如何定义目标总体呢?是否应包括集团用户?如果包括的话,应该调查谁?是乘车的领导还是开车的司机?应不应该包括出租车公司?
5.2.2 确定抽样框架
抽样框架(sampling frame)是抽样总体的可操作性定义,是抽样的基础。抽样框架可用所有样本总体成员的完整名单来定义,也可用界定样本总体成员资格的规则来定义。营销研究中常用的抽样框架包括:派出所的户籍目录,电话号码本,行业协会出版的公司名录,专业邮寄公司提供的邮寄名单,信用卡公司提供的持卡人名单,公司内部的客户数据库,网站的注册用户数据库等。在无法事先编制完整的调查对象名单时,应当制定明确的规则,用来确定调查对象的资格。
应当尽量保证抽样框架和目标总体之间的高度一致性,以减少抽样框架误差。此外,为了确定某一个体是否属于抽样总体,常有必要使用过滤问题。除了研究项目的具体要求以外,营销研究通常要求研究对象:
·过去3个月内没有接受过任何产品或广告调查;
·本人及家庭成员不在有关的公司工作。
如果抽样单位与所要研究的个体不同,例如当以户为单位抽样但调查对象是个人时,必须明确指定抽样单位内的个体应该如何选择。在入户人员访谈和电话访谈中,仅仅指定地址或者电话号码可能还不够,还需要有明确的抽取受访者个人的规则。在使用概率抽样方法时,必须从每个家庭中所有符合条件的人当中随机选出一个人作为受访对象。随机选择的一个简单的方法是“下一个生日”法。访谈人员询问家中符合条件的人里谁下一个过生日,然后将那个人包括进样本中。
在编制抽样框架时应当注意的问题如下:
·遗漏:抽样框架中遗漏部分样本单位,例如不完整的客户记录。
·聚堆:缺乏个体样本单位信息,例如当研究对象是个人但只有以户为单位的抽样框架时。
·重复:同一样本单位重复出现,例如售后服务记录中,同一个用户的联系电话反复出现。
·混杂:抽样框架中包括部分非样本总体成员,例如抽样总体由个人消费者构成,而电话号码簿中混有单位电话。
例5-1
中国大中城市女性减肥品市场分层研究:抽样总体的定义
目标总体:2003年中国大中城市女性减肥品的现有消费者和潜在消费者。
抽样总体:10个代表城市中,JZ公司销售人员在其产品销售终端可以接触到的年龄在20—50周岁之间的女性减肥品的现有消费者和潜在消费者。
为了保证调查对象符合研究的要求,使用了甄别问卷,设计了一系列过滤问题:
0-1【出示卡片1】请问你本人或你家中是否有人在卡片上列举的地方工作呢?
市场研究公司,广告公司 ……………………………………… X
社情民意调查机构,咨询公司 ………………………………… X→终止访问
减肥产品的生产/批发/销售部门……………………………… X
以上均无 ………………………………………………………… 1
0-2请问在过去半年内您有没有接受过有关减肥产品的市场调查呢?
有 ………………………………………………………………… 1→终止访问
没有 ……………………………………………………………… 2
0-3 【出示卡片2】请问您的年龄属于哪一个年龄段呢?
20岁以下………………………………………………………… 1→终止访问
20—25岁………………………………………………………… 2
26—30岁………………………………………………………… 3
31—40岁………………………………………………………… 4
41—50岁………………………………………………………… 5
50岁以上………………………………………………………… 6→终止访问
0-4请问您过去1年内有没有使用过有关减肥方面的产品呢?
使用过……………………………………………… 1→跳问1—1(检查配额)
没有使用过………………………………………… 2→继续问0—5
0-5请问您未来一年内是否可能会使用有关减肥方面的产品呢?
可能会使用 ……………………………………… 1→检查配额,继续问1—1
肯定不会使用 …………………………………… 2→终止访问
这个例子中的过滤问题,确保每个被抽中的样本都属于研究定义的目标总体,即20—50周岁之间的女性减肥品的现有消费者和潜在消费者。
5.2.3 选择抽样方法
抽样方法(sampling methods)可分为非概率抽样和概率抽样两大类(见图5-2):

图5-2 抽样方法的分类
非概率抽样(nonprobability sampling)是依赖研究人员的个人判断而非随机原则选择样本个体。非概率样本简便、易行,但其总体不明确,每个样本单位被抽中的概率不详,因此无法运用概率论和统计方法来推断总体,也无法计算抽样误差。这种抽样方法常用于探索性研究和预调查。
概率抽样(probability sampling)是根据事先确定的非零概率从总体中抽取一定数量的样本单位。这种抽样方法允许研究人员估算用样本估计值推断总体参数时可能产生的误差。描述性研究一般宜采用概率抽样方法。
下面两节将分别对非概率抽样和概率抽样方法作进一步介绍。