社会及行为科学研究法(一):总论与量化研究法
上QQ阅读APP看书,第一时间看更新

五 量化研究的特殊研究设计内容

(一)量化研究的研究设计大要

具体来说,若拟要进行的研究是属于量化研究,则研究设计应该涵盖下列的各项内容(Black, 1999; Creswell, 2009):

1.绪论

(1)提出研究议题(包括研究议题及其重要性);

(2)陈述研究目的和研究范畴的界定(delimitation);

(3)评述或建构理论观点;

(4)确定研究问题或建立研究假设。

2.文献回顾。

3.方法

(1)确定研究设计的类型;

(2)说明研究母体、研究样本(包括抽样方法)和研究对象(选择和安排);

(3)说明资料收集工具、变项测量和收集程序;

(4)说明资料分析方法的选择与分析程序。

4.陈述研究中预期的伦理议题。

5.若可能的话,提供研究的初步结果或先导研究(pilot study)结果。

6.附录中提供访问问题表、观察记录表、研究时间表和研究预算编列表。

虽是归纳为六项量化研究之研究设计特殊内容,但是每一项都不能缺少,而且不同内容项目的前后关联性强,前面项目的确定,会影响后面项目的内容。任何一项的内容有问题,都会影响整个研究结果的质量,因此,研究者需要按照项目顺序,来来回回地反复思考和设计其内容,以确保量化研究之研究品质。

(二)量化研究控制变异数之设计

前面已经讨论,控制变异数是量化研究设计目的之一,所以是研究设计的重要内容。一般而言,控制变异数可以透过下列三项研究设计的工作来达成:极大化实验变项的变异数(maximization of experimental variance)、控制无关的变项(control of extraneous variables)和极小化误差变异数(minimization of error variance)(Kerlinger&Lee, 2000)。所谓极大化实验变项的变异数是指:研究者进行实验设计时,必须让与研究假设有关的自变项(或称为焦点变项)对依变项的影响所产生之变异(数)达到最大,具体的做法是将研究的焦点变项之类别差异尽可能拉到最大。譬如,研究者想探讨两种教学法的教学效果差异,则在教学法的选择上,必须要能让这两种教学法的差异尽量拉大,足以让其对依变项的影响被区辨出来。又假如研究者想探讨个人之人力资本对其劳动市场所得的影响,则在研究设计中的人力资本类别就不能太接近(如初中vs.高中),而应该尽量拉大人力资本的差异(如中学vs.大学),以有效呈现焦点变项对依变项的可能影响。若采用焦点变项之类别(或数值)太接近的设计,则可能没办法有效地区辨出焦点变项(不同类别或不同数值之间)对依变项的影响效果。

控制无关变项是指进行研究设计时,应该将与研究假设有关的焦点变项以外,会干扰研究结果,但又不是研究者所关心的变项加以控制,以纯化焦点变项的影响。参考方块3-3说明四种常用的控制无关变项的研究设计方式。一般而言,观察研究的统计控制分析中,研究者会透过比较“有控制干扰变项”和“没有控制干扰变项”的不同分析结果,掌握研究焦点变项对依变项影响效果的改变情形,以确认研究焦点变项对依变项的影响上,该干扰变项扮演何种影响机制。不过,有时候实验控制与统计控制需要同时使用。有些采用实验设计的方式控制干扰变项的影响,也需要配合适当的统计分析方法,才能达到研究问题的有效回答。譬如,配对方法的研究设计,需要选用适合配对分析的统计方法,否则配对方法的研究设计方式也可能无法得到正确的研究结果。

参考方块 3-3:控制无关变项的研究设计方式

研究中需要“控制无关的变项”之影响,就是控制前述的干扰变项的影响,以纯化焦点变项的影响效果。常见的控制干扰变项的研究设计方式有下列四种:

1.消除法:研究者可采用样本设计,针对可能的干扰变项,选择特定样本作为研究对象,以消除这个干扰变项的影响。这种方式有其研究进行的方便性,但是这样的研究设计会影响到研究结果的推论力(generalization power)。譬如,性别是不同教学法的教学效果之可能干扰变项,研究者可以单独选择男生或女生作为研究对象,这样就可以排除或控制性别对研究结果的干扰。但是,单一性别的研究结果,推论的范围就仅及于研究的性别,不能推论到另一性别群体,这样的研究结果当然会有推论上的限制。

2.随机化法(randomization):研究者将被研究者“随机分派”到实验组和对照组,是实验研究常采取的研究设计,这就是随机化的处理。随机化是一种同时可以控制多个可能干扰变项影响的方法。随机分派研究对象后,研究者会假定(assume)实验组和对照组的被研究者,在多个可能的干扰变项的特质上都是没有差异的。如此,研究者就可以确信:实验变项或焦点变项的影响效果是因为研究者对实验组和对照组,采用不同的实验处理(treatment)所造成的差异效果,而不是由于没有控制到的干扰变项在组间差异所造成的。若是由被研究者自己选择拟参与的研究组别,则可能产生一种自我选择(self selection)的问题。而自我选择可能使得进入实验组和对照组的被研究者的特性不同,而导致实验变项或焦点变项影响效果的判定问题。但是,有些研究并不适合采用实验设计,所以,随机化的研究设计方式不见得适用于每一个量化研究。另外,随机分派研究对象后,假定分派后的群体在背景特性上是没有差异的,但是有些时候,即使已经采取了随机分派,还是发现实验组和对照组的某些背景特性仍有差异存在。

3.纳入设计法(build-in method):研究者可以将干扰变项纳入研究设计中,以有效掌握干扰变项效果,并加以排除,以确认实验变项或焦点变项的影响效果。譬如,前述的性别对教学法效果之研究,是一个可能的干扰变项,则研究者也可以在研究设计时,将性别纳入研究设计中,使性别成为另一个研究变项。如此,研究者在分析不同教学法的效果时,就可以有效地排除性别变项的可能影响,以确认真正的研究焦点变项的影响效果。将可能的干扰变项转变为另一个研究变项,纳入研究设计中,再将其可能的影响效果予以排除,以确认真正的焦点变项之影响效果,这是“纳入设计法”的优点。不过,“纳入设计”也有缺点。一旦干扰变项多,而每一个干扰变项又都要以“纳入设计”的方式来安排,则会复杂化研究设计,增加被研究对象数目的需求,而导致实验或研究成本的增加。

4.配对法(matching method):依据可能的干扰变项,将被研究对象加以配对(干扰变项相同者)后,再随机分派到实验组和对照组,也是一种控制干扰变项的可能方法。但是研究者需要考虑的干扰变项愈多,配对方法就会愈难进行,也会愈难配对成功。确实会干扰实验变项或焦点变项影响效果的变项,研究者才需要考虑配对法的使用,否则会浪费许多研究成本。同时,配对的变项考虑愈多,可能会浪费愈多无法配对成功的研究对象。如果能确定少数的干扰变项,比较容易影响焦点变项的影响效果,再据以在研究设计上进行配对,比较容易达成配对的研究设计。

量化研究控制变异数的第三种方法是极小化误差变异数,这是使研究之依变项测量误差变异数为最小的工作。一般而言,一个变项的误差变异数是指变项测量时,随机变动(random fluctuations)所产生的变异。随机误差有时正、有时负,有时上、有时下,有时这样、有时那样,最后倾向平衡,所以随机误差的平均数倾向于0。但是,有不少因素会造成一个变项的测量误差变异数,如由于个人差异所产生的变异数,可称之为系统性变异数(systematic variance)。如果系统性变异数没有被有效地界定和控制,则它可能被归为误差变异数。不同的因素可能产生不同性质的系统性变异数,而不同性质的系统性变异数加总在一起,有可能还维持误差变异数的随机特性,也有可能不符合随机特性。

除了系统性变异数之外,误差变异数还有另一种来源是测量误差(errors of measurement),可能是在资料收集时,由受访者的猜测、不留心、短暂疲劳、遗忘、一时的情绪等造成。测量误差可以透过:①有控制的资料收集情境,减低测量误差;②提高测量信度达成研究依变项误差变异数的极小化。实验或研究的情境愈没有掌握的情况,变项的测量误差就可能会愈大。研究的严谨和田野资料收集情境的掌握,对变项测量误差的下降是很重要的;还有可以增加变项测量信度有关的方法,也可以减少测量误差。

若采用量化研究,研究者可以根据需要,采用不同的设计方法以控制变异数,达到实验变项或焦点变项影响效果的正确估计。

(三)观察研究之因果推论设计——反事实因果推论

焦点变项的“因果效应”或“影响效果”之探究,是社会科学研究中常见之研究目的,再加上许多社会科学研究常常无法以实验设计的方式加以研究,因此,研究者以观察研究进行焦点变项的因果推论时,往往需要采用反事实因果推论(counterfactuals and causal inference),以减少因果推论的偏误。

实验设计研究的随机指派假定:被随机分派到实验组和对照组的被研究者,其特性变项或共变项(covariates)是没有差异的(或说是平衡的)。但这个假定条件,在一般的观察研究中不一定成立。观察研究的焦点变项之不同状态,可能是被研究者自我选择后的结果。同时,影响自我选择的共变项(包括特质或背景条件),也可能影响其依变项,使得进行“因果效应”或“影响效果”探究时,所需要的“焦点变项之状态或指派与结果变项是独立”之条件可能不满足。譬如,一个学生参加补习与否,受到学生个人动机、能力、家庭收入或父母教育等共变项的影响,而这些因素又可能影响学生的成绩表现。因此,要探讨“学生补习与否对其学习结果到底有没有影响,有多大影响”时,由于补习与否和学习结果,可能同时受到前述共变项的影响,因此,直接进行有补习者和没有补习者之比较,将其差异界定为补习的效果,就可能产生估计偏误。若将观察研究的焦点变项之影响效果分析,直接采用和实验研究一样的分析方式,则其影响效果的估计可能存在两种偏误:一是选择偏误,另一是处理偏误(treatment bias)。参考方块3-4内容为选择偏误和处理偏误的扼要说明。

参考方块 3-4:选择偏误和处理偏误

选择偏误的产生是由于被研究者进入焦点变项的不同状态时,受到一些可见和不可见共变项影响而产生的。如果被研究者的焦点变项,其所属类别是受到共变项的影响,使得焦点变项不同状态的群组,其背景特性或共变项是有差异的,而造成焦点变项影响效果的估计偏差。

不过,处理偏误则是指进入焦点变项不同状态的人,即使焦点变项转换状态是可能的话(即假定个人反事实状态可以存在),其在不同状态下,所产生的结果变项也是有差异的问题。换言之,处理偏误是由于“焦点变项之状态的发生与结果变项的反应具有独立性”的条件不成立,所产生的焦点变项影响效果的估计偏差。即有补习的这群人,如果他不补习(假定这种状态可能存在),所产生的补习效果与原本没有补习的那群人(假如他们也可能再去补习)的补习效果,还是有所差别。换言之,这原本在焦点变项不同状态的不同群体,即使其焦点变项的状态可能改变的话(事实上是不可能),其焦点变项的影响效果也是有所差异的,这就是所谓的处理偏误。

在观察研究中,研究者若要探究焦点变项的影响效果,为了避免上述的估计偏误,研究者有必要在研究设计中采用“反事实因果推论”的方式,以正确地回答“影响效果”的研究问题(Morgan & Winship, 2007)。基本上,在反事实因果架构下,影响效果的推估是接受处理者的处理效果(effect of treatment of the treated)或说“焦点变项属于某一特定状态者”的影响效果,而不是全部母体的处理效果(effect of treatment for the entire population)。譬如,补习效果的推估,是透过研究样本中“确实有补习的人”所进行的推论,而不是任何一个人假定他/她可以补习和不补习的假设性影响效果。另外,在反事实因果架构下,所能估计的是平均处理效果(average treatment effect)或平均的焦点变项影响效果,而不是每一个人的处理效果或焦点变项的影响效果。

观察研究若要进行因果效应的推论,为了避免或降低焦点变项影响效果的估计偏误,研究者需要在反事实因果架构下,采用倾向几率值配对法(propensity score matching method),掌握根据焦点变项不同状态分群后,其特性共变项可能之差异问题(Rosenbaum & Rubin, 1983a; 1984)。在反事实因果架构下,倾向几率值配对法是把有一个焦点变项为一种状态(以A状态表示,如补习)的被研究者与一个或多个焦点变项为另一种状态(以B状态表示,如不补习)的被研究者加以配对。配对时让A状态的被研究者和B状态的被研究者,在实验前或研究开始前的可观察变项特性(共变项)是相同的。进而将B状态的被研究者视为A状态的“反事实”状态者,而能让研究者进行焦点变项影响效果的估计。

前面已经讨论实验研究和观察研究最大的差异,在于实验研究的随机分派,研究者假定实验组和控制组,在实验前可观察特性和不可观察特性(共变项)都是没有差异的(或是平衡的)。但是观察研究所建构的倾向几率值配对设计,只可能期望可观察到的特性变项是没有差异的(平衡的),无法期望不可观察到的特性变项,在配对后也是平衡的。因此,若是焦点变项的不同状态是受到不可观察到的共变项影响的话,即使研究者采取倾向几率值配对方法,还是无法避免其焦点变项影响效果的可能估计偏误。

运用反事实因果架构,需要考虑焦点变项状态的定义和适合进行配对的共变项。研究者在进行倾向几率值配对时,只能选用在研究进行之前的共变项,尤其是不随时间变动(time invariant)的特性变项,如性别、出生年和族群等。焦点变项A状态和焦点变项B状态的成员,在研究进行之前,其特性确实是平衡的。不过,反事实因果架构也有潜在缺点:焦点变项A状态的被研究者,不见得能找到合适的B状态被研究者与之配对,而损失了一些被研究者的资料。

由所有可观察到和不可观察到的共变项所影响的焦点变项状态(如A状态)发生几率,称为真倾向几率值(true propensity score)。每个被研究者都有一个这样的真倾向几率值,只是它是一个未知的、潜藏的参数(unknown or latent parameter)。如果能针对真倾向几率值加以配对,将可预期达到所有共变项(包括可观察变项和不可观察变项)的平衡,则焦点变项的不同状态群体,其依变项的差异将会是平均焦点变项的影响效果的不偏估计值。但事实上,真倾向几率值是不可得的,所以研究者仅能根据会影响焦点变项的可观察到的共变项,使用logit回归模式(logit regression)或probit模式(probit model)加以估计,而得到一个估计的倾向几率值(estimated propensity score)。再使用这个估计的倾向几率值进行被研究者的配对。

在反事实架构下的倾向几率值配对法,理想状态下是根据可观察到,且会影响焦点变项的所有可观察到的共变项皆相同者,将焦点变项A状态者与B状态者加以配对,这就是所谓的完全一致配对(exact matching)。但事实上,社会科学研究资料的样本大小都有所限制,要针对所有可观察到的共变项,且采用完全一致配对困难度是很高的。一种权变的方法是:创造一个被研究者进入焦点变项的一种状态的几率之综合测量(summary measure),也就是所谓的估计之倾向几率值。再根据估计的倾向几率值相同者或相近者,将焦点变项A状态者与B状态者加以配对。换言之,将所有影响焦点变项状态之可观察到的共变项,转换为一个综合性的几率,表示一个被研究者其焦点变项属于某一状态的几率。所有可观察到的共变项之差异被转换为估计的倾向几率值这个几率值,而几率值相同或相近者,即表示可观察到的共变项之综合特性是相同或相近的,因此,研究者可以据以将不同状态的被研究者加以配对,并将其中一种状态的群体视为另一状态群体的“反事实状态”群体。

在反事实架构下的倾向几率值配对法进行的方式大致如下:

(1)以会影响焦点变项状态的所有可观察到的,或有测量的共变项为自变项的logit回归模式或probit模式,预测被研究者其焦点变项属于某一状态(如A状态)的几率。通常共变项的选择,都是以研究文献的回顾结果为基础。

(2)利用第一步骤估计的logit回归模式或probit模式,计算出每个被研究者之焦点变项属于该设定状态(A状态)的预测几率,这个预测几率就是每个被研究者的估计倾向几率值。

(3)根据第二步骤计算出的估计倾向几率值,将焦点变项A状态和B状态的被研究者加以配对。配对的方式有多种。不过,常采用的是最近距离配对法。同时,在配对过程中,允许一个焦点变项为一种状态的被研究者可以配对多个另一种状态的被研究者。另外,通常会采用限制配对者的估计倾向几率值之差异,至少要少于一个特定数值的范围,如可以设定2个百分点。

(4)配对后,所有使用于第一步骤中的可观察共变项都要再经过检验,以确定配对后两组之共变项特性具有平衡性,亦即没有差异。因为根据估计的倾向几率值配对,只是预期配对后两组会有平衡的特性。事实上是不是真的达到平衡,则需要进一步检验。

(5)进行配对后两组的结果变项之比较,以估计焦点变项的影响效果。

除了上述的倾向几率值配对法之外,分层法(strata method)也是常用的配对方法。分层法是将影响焦点变项的所有可观察共变项,加以交叉汇编成为分层(strata),再将所有被研究对象分到各个分层里。如果有K个可观察共变项会影响焦点变项呈现,且每个共变项皆为两类别,则组合后可分为2K分层,再将所有被研究者按其可观察共变项特性,分配到各分层里。每个分层里的被研究者,其可观察共变项特性或背景条件是一样的,所以,研究者可以在每一个分层里,进行焦点变项的影响效果检验。但是,若影响焦点变项类别呈现的可观察共变项太多,或是共变项的类别多时,都会造成交叉汇编的分层数太多,容易造成分层里的被研究者数目不够多,或有些分层里根本没有被研究者存在,或有些分层里的被研究者,只存在焦点变项的一种状态而已,这些都会导致在有些分层里,无法进行焦点变项的影响效果检验和推论。

克服上述问题的方法,是不采用所有可观察变项的组合分层,改采用倾向分数的四分位(quantiles)、五分位(quintiles)作为分层,以避免上述分层过细、过多,而导致分层内样本数可能不足的问题。研究者再针对各分群,分别进行各分群内的焦点变项之影响效果的检验(Rosenbaum & Rubin, 1984)。最后,再根据各分群的焦点变项之影响效果,做出综合的分析结论。

观察研究中,当研究者想要探讨焦点变项的影响效果或进行因果推论,将反事实因果推论架构下的倾向几率值配对法或分层分析法纳入研究设计中,是降低或避免研究结论产生“选择偏误”的方法。参考方块3-5为一个反事实因果推论的经验研究实例。

参考方块 3-5:反事实因果推论研究实例

Brand与Xie(2010)两位作者使用倾向分数分群法探讨美国大学教育的经济报酬。换言之,探讨有无完成大学教育的经济报酬之差异。在这个研究中,是否完成大学教育被视为研究处理(treatment)。过去大学教育的经济报酬的探讨,其理论基础都是基于正向选择假说(positive selection hypothesis),但是Brand与Xie在此篇研究中提出了另一个理论观点:负向选择假说(negative selection hypothesis)。正向选择假说是主张:如果经济因素是教育取得(大学教育)的主要决定因素,则最有可能完成大学教育者会是大学教育的最大获益者。而负向选择假说则认为:由于选择机制和对所得的期望的差异性,导致最不可能完成大学教育者,会是大学教育的最大获益者。是否完成大学教育,不能像实验研究设计随机分派,而且可能受到可观察共变项和不可观察共变项的影响。因此,研究者需要采用反事实因果推论的研究设计,来探讨有无完成大学教育的经济报酬之差异的研究问题。

为了探讨负向选择假说是否成立,两位作者采用了特别的研究程序,以回应其研究好奇。两位作者采用了三步骤程序:

1.引用可忽略性假定条件(ignorability assumption),在控制相当多个可观察的共变项(影响完成大学教育与否的共变项)后,有完成大学教育者和没有完成大学教育者两群之间不再有额外具有差异的干扰变项。在可忽略性条件下,以倾向分数(每个人完成大学教育的几率)捕捉或表达完成大学教育者和未完成大学教育者所有可观察共变项的系统性差异。

2.依据倾向几率值高低加以分群,分群后估计每个分群的完成大学教育的经济报酬效果。再进一步使用分层线性模型(hierarchical linear model)检验完成大学教育的经济报酬效果的趋势或样态(pattern)。这一创新性的步骤,可以让研究者确认大学教育的效果到底是正向选择效果,还是负向选择效果。

3.再使用可忽略性条件,进行辅助性分析(auxiliary analysis)对分析结果加以解释。也同时进行敏感度分析,研究者省略了一些重要的共变项,以检验可忽略性假定条件的可能违反情形。上述的分析都是将男性和女性分开处理。

再者,倾向几率值分群法的进行程序如下:

1.以logit回归估计并预测样本中每个观察体的完成大学教育的几率,也就是每个人完成大学教育的倾向几率值。

2.根据倾向几率值的高低,将受访者分为数群组(strata)(针对不同的样本分别分为五群组、六群组、九群组和六群组),并使每一群组内之完成大学教育者和未完成大学教育者的共变项是没有差异的,也就是平衡的。

3.在共变项具平衡性的倾向几率值分群中,以最小平方法估计完成大学教育的经济报酬效果。

4.使用分层线性模型或是多层次分析法,探究不同倾向几率值分组间的完成大学教育的经济报酬效果的异质性趋势或样态。

详细的研究内容,请参阅Brand & Xie(2010)。