基于语法化理论的汉语兼类虚词习得顺序研究
上QQ阅读APP看书,第一时间看更新

2 语法化顺序与汉语兼类虚词习得顺序研究

2.1 语法化顺序

2.1.1 语法化及其单向性

语法化(grammaticalization)是指“词汇单位或结构式在某个特定的语言环境里获得语法功能,或者语法项发展出新的语法功能”这样一种演变过程。(Traugott,2001;转引自吴福祥,2003a)包括实词逐渐虚化为没有实在意义的语法成分和短语或词组逐渐凝结为一个单词的过程(江蓝生,2000)。前者即中国传统语言学所说的实词虚化,后者也可以看做短语的词汇化(lexicalization)。本书研究的单音节兼类虚词的语法化是实词虚化,双音节兼类虚词大都经历了词汇化和语法化两个过程,不过这两个过程互相伴随,很难区分,而且两者的演变机制相同,动因上也有很大的一致性,都属于语言演变的大框架。(王灿龙,2005)因此我们侧重从语法化的角度理解它们。

语法化研究在国外于20世纪70年代后重新兴起,其研究重心从历时转向共时,目的是希望从共时和历时相结合的角度出发,用语法化来解释共时层面上难以理解的语法现象,并进一步探索语法的演变过程。国内汉语语法化的研究一直是最近20年来语法学界的热点问题,相关研究全面、深入,成果斐然。由于本书的研究重点不是语法化本身,而是要把它作为兼类虚词习得顺序研究的理论基础,因此这里只对相关概念和观点做一简单的介绍。

关于语法化的动因,一般认为,语法化现象的发生是由话语交际中某种语用/认知策略促动的,本质上是语言使用的产物。导致语法化过程发生的主要语用/认知动因是隐喻和转喻。(吴福祥,2003a)隐喻体现为一个语言成分基于意义感知的相似性而发生变化,在性质上具有类同性(analogical)和像似性(iconic);转喻体现为一个语义成分基于意义感知的邻接性(contiguity)而发生变化,在性质上具有相关性和标引性(indexical)。

关于语法化的机制,国外的相关研究比较充分。沈家煊(1998)曾评介了五种,分别是隐喻(metaphor)、推理(inference)、泛化(generalization)、和谐(harmony)与吸收(absorption of context)。隐喻是用一个具体概念来理解一个抽象概念的认知方式,是由一个认知域投射到另一个认知域;推理是指语用推理,即听话人依靠语境从说话人有限的话语中推导出没有说出而实际要表达的意思(隐含义),如果一种话语形式经常传递某种隐含义,这种隐含义就逐渐“固化”,最后成为那种形式固有的意义,这种后起的意义甚至可能取代原有的意义;泛化是一个实词的语义部分消失从而造成自身适用的范围扩大;吸收是指虚词会把所处的上下文的意义吸收到自身身上。其中推理机制是虚化的最重要的机制,它贯穿于虚化的全过程;泛化基本上也贯穿始终,但是语素变得越虚就越不易再继续泛化;隐喻机制只在虚化的早期阶段起作用,发生在实词变为较虚实词的阶段;和谐和吸收两种机制只在虚化的晚期起作用,发生在虚词变为更虚成分的阶段。

国内也有很多学者进行了相当深入的研究。解惠全(1987)认为实词的虚化以意义为依据,以句法地位为途径。词义的虚化与词义引申的道理大体相同,而且同词义引申密切相关。因为词义引申在多数情况下是由具体到抽象,而词义虚化则常常是在引申的基础上进一步的抽象化,虚化是引申的继续或延续。双音虚词的形成,多与实词的虚化有密切的联系。刘坚等(1995)认为诱发实词虚化的因素有句法位置、词义变化、语境因素等。当一个动词经常在句子中充当次要动词,它的这种句法位置被固定下来之后,其词义就会慢慢抽象化、虚化,再发展下去,其语法功能就会发生变化,由词汇单位变成语法单位。词义的演变、虚化,也会影响词的功能的改变,使之用于新的语法位置、结构关系上,从而产生一个新的虚词。词的意义和功能总是在一定的语境之中才得到体现,语境影响也是一个值得注意的因素。此外,重新分析(reanalysis)也是语法化过程中的一个重要环节。重新分析指没有改变表层表达形式的结构变化,它是一种认知行为,作用是从认知的角度把词义的虚化、功能变化的过程以结果的形式表现出来并加以确认。洪波(1998)认为,汉语实词虚化的机制有两种,一是认知因素,一是句法语义因素,其中后者是主要的。虚化可以分为结构语法化和功能语法化,双音节虚词既发生了结构语法化,又发生了功能语法化。(洪波、董正存,2004)

关于语法化的一般原则,沈家煊(1994)概括为9条,即并存原则、歧变原则、择一原则、保持原则、降类原则、滞后原则、频率原则、渐变原则和单向(循环)原则。其中歧变原则是指一个词朝一个方向变为一种语法成分后,还可以朝另一个方向演变为另一种语法成分。如沈家煊(2004)的研究表明,短语“不过”语法化为副词“不过”之后,又虚化出连词用法。降类原则是说词义的虚化总是伴随着词性的降格,即由主要词类(如名词、动词)变为次要词类(如介词、连词);滞后原则指的是语形的变化总是滞后于语义的变化,结果就是语言中普遍存在一词多义现象,即一个词形既表示实义又表示虚义,或者既表示较虚义又表示更虚义;渐变原则是说语法化是个连续的渐变的过程,一个实词会经历多个不同的虚化阶段或过程。每一次虚化都可能增加一个新的意义,这些不同的意义共同形成了一个虚化链(grammaticalization chain)。在虚化链中,两极单位之间的差别很大,但相邻单位之间的区别却是细微的。也就是说,一个词由A义转变为B义,一般总是存在着一个既有A义又有B义的中间阶段,即A>A/B>B。如时间副词“在”是由引介处所的介词“在”演变而来的,但“我在这里想明天的工作怎么安排”中的“在”可以理解为表示处所,也可以理解为表示“正在进行”。

单向原则或曰单向性(unidirectionality)是历时语法化研究中的一个基本假设,是语法化的一个最重要的共性特征。吴福祥(2003b)对此曾有专文讨论。所谓单向性,指的是语法化的演变过程是以“词汇成分>语法成分”或“较少语法化>较多语法化”这种特定方向进行的。换句话说,语法化是有序的,在形态—句法、语义和语用方面表现为以下三个序列(改造自吴福祥,2003b):

形态—句法:实词>虚词>附着形式>屈折形式>零形式

语   义:具体义>较少抽象义>更多抽象义

语   用:客观性>较少主观性>更多主观性

单向性在形态—句法方面表现为黏着性逐渐增强。不过在汉语这种缺乏屈折变化的语言中,实词虚化到一定程度往往转为词内成分,如“是”在经历判断动词到焦点标记的语法化过程之后,又会进一步语法化为词内成分,和别的虚词素组合成虚词“X是”。

单向性在语义方面表现为抽象性逐渐增强。因为语义虚化首先是一种抽象化的演变,一方面,抽象化使得某一语素的应用范围更广,另一方面,该语素也就显得缺乏较具体的意义。虚化也是一种创造性的概念的转换。原始概念一般较目标概念具体,由原始概念转换到目标概念的过程,也就是抽象化和虚化的过程。(孙朝奋,1994)

单向性在语用方面表现为主观性逐渐增强,因为虚化也是一种主观化(subjectification)过程。语言的主观性(subjectivity)指的是在话语中多少总是含有说话人“自我”的表现成分,包括说话人的视角(perspective)、情感(affect)和认识(epistemic modality)。“视角”就是说话人对客观情状的观察角度,“情感”包括感情、情绪、意向和态度等,“认识”主要跟情态有关。含有说话人主观态度和信念的形式和结构逐渐衍生出可识别的语法成分,就是主观化。主观化是指语言为表现这种主观性而采用的相应的结构形式或经历相应的演变过程,它既是一个“共时”的概念,又是一个“历时”的概念。Traugott (1995)从历时的角度看待主观化,认为主观化是一种语义—语用的演变,即“意义变得越来越依赖于说话人对命题内容的主观信念和态度”,它和语法化一样是一个渐变的过程。在这一变化过程中,说话人的语用推理(pragmatic inference)起了重要的作用,语用推理反复使用的结果就是形成主观性表达成分。而语用推理的产生则是由于说话人在会话时总想用有限的词语传递尽量多的信息,包括说话人的态度和感情。主观化可以说是无处不在,语法化中的主观化表现在互相联系的多个方面,如由命题功能变为言谈功能,由客观意义变为主观意义,由非认识情态变为认识情态等。实词表达的意义一般是客观的,虚化以后就可能具有主观性或者主观化。

关于单向性,近年来的语法化研究中存在着争论。吴福祥(2003b)在对相关看法进行评介之后认为,单向性是一种强烈的倾向而非绝对的原则。应当承认单向性有反例,但反例具有可解释性,其存在并不影响将单向性作为一种演变的共性而做出概括。

2.1.2 语法化顺序及其确定

语法化的单向性意味着语法化有程度的区别。语法化程度是共时语法化研究中常常用到的一个概念,指的是在一个语言的共时平面上不同的语法范畴之间往往具有语法化程度高低的差别。(吴福祥,2003a)关于如何判定语法化程度,国内外学者们已经做过比较充分的研究。沈家煊(1994)指出,判断一个成分语法化的程度是高是低,一个重要的依据是看它在历时上形成的时间先后,因为按单向原则,语法化总是由实变虚,由虚变得更虚。不考虑历时的因素,单从共时层面也可以判定语法成分的虚化程度。其标准主要是认知因素。Diehl (1975)曾把广义的空间关系分为四个等级,认为“社会空间”的语法化程度最低,“逻辑空间”的语法化程度最高; Heine等人(1991)把语法化看作若干认知域之间的转移过程,各个基本的认知域存在一个由具体到抽象的等级(转引自沈家煊,1994)。沈家煊(1994)还认为,在共时平面上判定语法化程度,可依据的标准大体可归纳为:(1)表示空间的成分语法化程度最低; (2)三维(空间)低于一维(时间),一维低于零维(如性质、原因、方式等); (3)与名词有关的低于与小句有关的,如介词低于连词。他同时转述Heine和Traugott等人的观点,认为从认知上看,语法化程度是抽象高于具体;从语法功能上看,Halliday区分的人际功能的语法化程度最高,其次是语篇功能,然后是概念功能。吴福祥(2003a)认为辖域(scope)也是判定语法化程度的一个参数,如果两个语法范畴的辖域(scope)有大小之别,那么辖域大的语法范畴语法化程度高于辖域小的范畴。

我们认为,前述单向性在形态—句法、语义和语用三个方面表现出来的三个序列,反映的实际上就是语法化程度的高低顺序。由于汉语缺乏形态变化,虚词的语法化在形态—句法上的表现一般为到词内成分为止,因此语法化顺序主要表现在语义的抽象化程度和主观化程度两个方面。抽象化或主观化程度越高,语法化程度也就越高。我们把这种由低到高的语法化程度序列称为语法化程度顺序,简称语法化顺序。

就本书研究的兼类虚词来说,语法化顺序并不是“较少语法化>较多语法化”“较少抽象义>更多抽象义”或者“较少主观性>更多主观性”这么简单。因为一个实词或意义实在的词汇成分会经历多个虚化的过程,增加一个过程,就增加一个新义,因而一个形式可以有多种意义,即一词多义甚至是一词多类(兼类)。这些意义之间可以形成一个虚化概念网(孙朝奋,1994),或一个(几个)虚化链。如图2-1、图2-2所示:

img
img

图2-1、图2-2中A代表一个实词或意义实在的词汇成分,其他字母代表由A派生出来的虚词意义。在图2-1 (改造自孙朝奋,1994)中,B是由A派生出来的,C、D、E都是由B派生出来的,但它们互相之间没有派生关系,F则是由D派生出来的。在图2-2 (孙朝奋,1994)中,B、C都是由A派生出来的,D、E是B派生出来的,F则是由C派生出来的。更为复杂的情况是,图2-1中的C、D、E和F中可能有一个意义由于句法原因变成了另外一个词类,图2-2中的B和C也可能不属于同一个词类。前者如“在”,B为又A (动词)虚化而来的引介处所的介词,C为引介时间的用法,D为引介范围的用法,E则为由B语法化而来的表示动作进行的时间副词(详见第3章);后者如“和”,B为由动词“和”语法化而来的连词用法,C则是由动词“和”语法化而来的介词用法(详见第4章),D、E为连词“和”的次类用法。

在图2-1中,B和C、B和E,甚至B、D和F三者之间的语法化程度一般比较容易判断;图2-2中的B和D、B和E、C和F之间的情况也是如此。因为一方面,从共时平面看,它们之间形成了一个虚化链,在语义上存在直接的关联,这种关联是有序的,可以叫做语义关联顺序(高顺全,2006),它反映的也是语法化顺序;另一方面,从历时平面看,既然它们之间存在派生关系,那么也一定存在历时的先后顺序,我们把这种顺序称为历时发展顺序。一般来说,后出现的意义语法化程度高于先出现的意义。例如“在”引介处所的用法先秦时已经出现,而表示动作进行是清代以后才有的用法,后者的语法化程度当然高于前者;“和”连接名词性成分的用法唐代已经出现,但连接动词性成分的用法直到近代才出现,后者的语法化程度自然也高于前者。

如果属于同一词类,有直接引申关系的两个义项的语法化程度比较容易判断,一般只看语义关联顺序即可。因为语义关联顺序和语义的抽象化程度顺序是一致的。例如介词“在”可以引介处所,也可以引介时间,后者两者之间的语义关联顺序和抽象化程度顺序都是“处所>时间”。此时甚至不需要看历时发展顺序(由于文献语料的局限性,甚至无法找出其历时先后顺序——这两个用法都产生于先秦)。但对那些没有直接语义关联的两个或更多的义项来说,历时发展顺序就是一个更有效的判断标准。比如“在”引介时间和引介范围这两个用法之间虽然没有直接的关联,但后者产生的时间要晚得多,在这种情况下,历时上的先后可以作为判定两者之间的语法化程度的参考依据。不过,语法化程度的判定不能完全依赖于历时考察。一方面,由于语料不充分等原因可能会导致历时证据缺乏;另一方面,实词的虚化网络犹如一颗语义树,主干的上部是语法化程度最高的部分,但主干的下部也可能冒出新枝,这一新枝在时间上可能会和主干的上部分枝同时产生,也可能晚于上部分枝。

如果不属于一个词类,兼类虚词的两个或更多的意义和用法的语法化程度如何判断?

这个问题比较复杂。首先,兼类虚词的类变至少有两种语法化模式。一是单向演变,如“在”的演变模式是“动词→介词(引介处所)→副词”;二是双向演变或平行演变,如“和”的演变模式是“动词→连词/介词”(江蓝生,2012)。此外,有些兼类虚词的语法化表现为一种“快捷模式”。所谓快捷模式,指的是有些兼类虚词的两个词类的产生并非正常的单向演变的结果,而是虚词同义替代、同义复合或双音化的结果,其产生往往表现为一种突变。如副词“就”的大部分用法都出现于元明时期,但其中不少用法是替代或继承近义的“即”和“便”的结果;“就是”是在很大程度上是“就”双音化的结果,其副词用法和连词用法都是很晚才产生的,但连词用法是对“即是”“便是”的继承和替代,不是由副词“就是”发展而来的;又如“因为”,其介词用法是“因+为N (+ VP)”重新分析的结果,而连词“因为”是同义连词“为”和“因”复合的结果(详见第4章),连词“因为”的产生反而在介词“因为”之前;再如“尽管”,其连词用法不是副词用法演变的结果,而是对连词“只管”的替代。

在上述三种模式中,单向演变是最常见、最典型的模式。就这种模式来说,语义关联和历时发展两个标准在判断语法化程度时一般是有效的。例如引介处所的介词“在”和时间副词“在”之间的语法化程度高低很容易判断,因为可以借助语义关联顺序和历时发展顺序两个标准,而且结果是一致的。但介词“在”还有引介时间、引介范围、表示条件等多个小类用法,它们和副词“在”之间的语法化程度如何判断?此时语义关联顺序几乎不起作用,不过历时发展顺序尚有一定的参考作用,因为引介时间和范围的“在”先于副词“在”出现。可是表示条件的“在”和时间副词“在”历时产生的年代相去不远,此时历时顺序标准也变得无能为力。

这是否意味着表示条件的介词“在”和时间副词“在”之间的语法化程度无法判断?我们不这么认为。因为在语义关联(语义的抽象化程度)和历时发展这些标准之外,还有一个主观化程度标准。虽然表示条件的介词“在”和时间副词“在”之间没有直接的语义关联,也无法比较历时先后,但前者具有较强的主观性,后者则基本上是客观表达,可以根据这一点认为前者的语法化程度高于后者。

引进主观化程度标准可以解决一些问题,但同时也会带来一些矛盾。因为:第一,语言成分的抽象化程度和主观化程度并不总是并行的,比如对于副连兼类虚词来说,副词的抽象化程度低于连词,但主观化程度却不一定;第二,主观化程度顺序不仅可能和语义关联顺序(抽象化顺序)矛盾,也可能和历时发展顺序矛盾。以“可”为例,其语法化模式是“助动词→副词→连词”(连词“可”由表示强调的副词“可”演变而来),如果根据语义关联、抽象化程度和历时先后顺序,副词“可”和连词“可”的语法化顺序应该是副词“可”>连词“可”;如果按照主观化程度标准,顺序则完全相反。如果考虑到副词“可”的其他小类用法,情况会更加复杂。

抽象化和主观化都属于语义虚化。能不能强行把抽象化程度和主观化程度放在一起比较虚词包括兼类虚词的语法化程度?也许能。沈家煊(2004)认为,“主观态度相对于客观事态是比较虚灵的东西。如果词语A比词语B带有更多的主观性(包括说话人的视角、认识、情感等),我们说词语A比B虚灵。传统语义学用semantic bleaching (语义淡化)指称实词虚化不够确切,虚化后词义的信息量可能增大,主观性也增强”。

汉语有不少副连兼类虚词如“可”“可是”和“不过”等都属于这种情况:副词用法具有很强的主观性,连词用法则主要表示分句之间的逻辑关系意义。不论从语义关联还是从历时先后的角度看,它们的语法化顺序都是“副词用法>连词用法”,从抽象化的角度看也是如此。但如果从主观化的角度看,其语法化顺序则应该是“连词用法>副词用法”。

这种情况也许与副词属于语法范畴而连词主要属于逻辑范畴有关。逻辑范畴与语法范畴既相区别又相联系,奥托·叶斯柏森曾指出,“如果是逻辑学范畴,那么它们显然具有普遍性,即为各种语言所共有;如果是语言学范畴,那么这些范畴或者至少其中的某些范畴是为一种语言或几种语言所特有。一方面,逻辑范畴是人们对客观事物各个方面一般特性的反映在头脑中的积淀,语法范畴则是人们为了交际的需要而长期约定俗成的;另一方面,逻辑范畴是深藏于头脑里的认识成果,为了表达出来与人交流,从逻辑范畴中外化为不同的语法范畴。”

汉语连接小句的连词显然与逻辑范畴有关。从这一角度看,连词的意义具有较高的抽象性,相较于同形的副词用法来说,它又是比较客观的(不同的连词如“可是”与“不过”之间存在主观性的差异问题)。如果认为主观性比抽象性在判断语法化程度高低时更为重要,那么在描述兼类虚词的语法化程度顺序时就会主要基于主观化程度。但这样做的结论是某些兼类虚词连词用法的语法化程度低于副词用法,这和语法化的单向性原则是相悖的。除非认为这种现象是单向性的反例,我们倾向于这么看——正如吴福祥(2003b)所说,单向性反例是存在的,但也是可以解释的。像“可”“可是”这样主观性很强的副词多是情态副词或评注性副词(张谊生,2000),具有高谓语性质,如果根据辖域大小判定语法化程度(吴福祥,2003a),其辖域并不小于相应的连词用法(辖域为所在小句)。另外(也许更有说服力)一个解释是,语法化程度也可以理解为一个语言成分的形式或意义更像是语法成分或语法范畴,而连接小句的连词表示的是逻辑事理意义,更像是逻辑范畴。

如果这一看法可行,那么就可以把语法化程度简单地理解为一个语言成分意义的抽象化和主观化程度,抽象意义的语法化程度高于具体意义,主观意义的语法化程度高于客观的抽象意义。各种意义之间的语法化顺序表现为:

具体意义>抽象意义>主观意义

基于上述思考,我们认为,对于兼类而且多义的虚词来说,多个不同意义之间的语法化程度大致可以分为三个等级描写,语法化顺序可以是一个等级顺序(低>中>高)。在判断不同意义之间语法化程度的时候,可以综合使用语义关联顺序(抽象化程度顺序)、历时发展顺序和主观化程度顺序三个标准。具体来说,我们在描写兼类虚词及其多个意义和用法之间的语法化顺序时的步骤和程序如下。

第一步:对兼类虚词的意义和用法进行分类,并尽可能地描写各个意义之间的语义关联。

第二步:根据历时语料,描写各个意义和用法的历时发展顺序。

第三步:综合语义关联和历时发展两个顺序,对那些没有主观性或主观性较弱的意义,主要根据语义抽象化程度和历时先后标准判断语法化程度;如果两个义项一个有主观性(或主观性较强),一个没有主观性(或主观性较弱),则主要根据主观性的有无或强弱,判断语法化程度的高低。

第四步:把所有的意义和用法放在一起比较,确定它们在语法化等级中的相对位置,同时比较兼类虚词两个或更多类别的语法化程度的差异。

总的来说,我们采取的是共时和历时相结合、客观性和主观性相结合的方法,即首先描述其在现代汉语共时层面的各个意义和用法,揭示其语义关联顺序,然后从历时的角度描述其历时发展顺序,最后把两者结合起来,并通过比较语义抽象化程度和主观化程度的高低,得出兼类虚词多个意义和用法语法化顺序。

2.2 习得顺序

2.2.1 习得顺序和习得标准

第二语言习得顺序的研究兴起于20世纪70年代。已有的语言习得研究表明,第二语言习得遵循一定的自然顺序即习得顺序。习得顺序包含两方面的内容,一是指习得不同语法项目时的先后顺序,学习者总是先习得某些规则后再习得另外一些规则,一般称之为“习得顺序”;二是指对某一特定语法项目的习得也遵循固定的顺序,有人称为“习得次序”,两者对应的英文术语分别是order of acquisition和sequence of acquisition。

本书研究的习得顺序包括两方面的内容:兼类虚词不同词类之间的习得顺序是order,某一词类内部不同用法之间的先后是sequence,不过我们认为两者之间并没有本质的区别,因此统称为习得顺序。本书着重研究兼类虚词不同词类之间的习得顺序,即学习者先习得兼类虚词的哪一个词性的意义和用法,同时也对某一词类的意义和用法进行再分类,研究其小类用法或者说不同义项之间的习得顺序。

习得顺序早期的代表性研究是关于英语语法语素和德语语序的习得顺序。Dulay&Burt (1974)等人的研究都发现了不随学习者年龄、母语背景、学习环境等因素的不同而变化的英语语法语素习得顺序。Krashen (1985)据此提出了自然顺序假说(natural order hypothesis),认为二语习得存在着一个可以预测的共同顺序。关于德语语序的习得,Pienemann (1989)等人的研究表明,学习者都要经历几个共同的阶段(独词句>典型语序>副词前置>动词分离>倒置>动词殿后),不同阶段习得的结构之间存在着蕴含关系,掌握前一阶段的结构是完成后一阶段习得的先决条件。Pienemann等人的结论是,语言结构某些方面的习得存在着不受外在因素(如年龄、母语背景、学习环境等)影响的共同顺序。

习得顺序的研究建立在对语料分析的基础上。语料包括自然样本和诱发样本两种。前者指学习者在自然状态下产生的语言材料,后者指根据研究目的设置相应的任务诱发学习者产生的语料。自然语料是学习者主动产生的,能够比较真实自然地反映学习者使用目的语的情况。(冯丽萍、孙红娟,2010)早期的习得研究分析的语料多是诱发语料,近年来,随着各种中介语语料库的建立,使用自然语料在习得顺序研究中逐渐成为主流。

习得顺序研究的一个重要问题是习得标准的确定。以往研究常用的标准有两个,一个是正确率标准(accuracy criterion),一个是初现率标准(emergence criterion)。前者比后者更为常用。

正确率标准实际上是以目的语作为参照标准来评价二语习得的阶段性结果。一般以百分比的形式出现,计算方法是“正确使用次数/所有使用次数”。Dulay&Burt (1974)认为正确率达到90%才算习得,Andersen (1978)的标准是80%,而Ellis (1988)的标准则是75% (转引自冯丽萍、孙红娟,2010)。国内施家炜(1998)也以80%作为习得的标准。与正确率标准不同,初现率标准关注的是习得的起点。初现指某一形式在中介语中第一次系统地出现,并且具有能产性。初现率标准是以某一个语法现象在中介语中第一次“有系统”而非“公式化”的出现和使用作为参数来确定这个语法现象习得过程的开始(张燕吟,2003)。

正确率标准和初现率标准各有优点,也都有不足的地方。张文认为后者更可靠,更有意义。因为正确率的标准存在任意性:“如果习得者没有达到80%的习得标准,但达到了79%,那么他的习得情况又是如何呢? 这1%之差能说明什么问题呢?”刘颂浩(2007)的评价则比较客观。他认为使用初现率标准会出现只有起点和部分过程没有终点的情况,这和准确率只有终点缺乏过程实际上是半斤八两;初现率的关键是“系统”和“能产”,但“能产”也需要有具体的指标,不管如何规定,都和准确率的具体指标一样存在一定的任意性。初现更关注习得的开始阶段,其规定就可能会偏松,从而导致高估学习者能力的情况。如果初现指的是开始习得而不是已经习得,那么仍然需要回答达到什么标准才算是习得这个问题。

我们认为,中介语虽然是一个独立的系统,但它发展的方向却是向目的语逐步靠拢。具体到某一个语言项目来说,判断是否习得的标准应该是它在多大程度上接近目的语。正确率的高低实际上反映的是中介语与目的语的接近程度。从这个意义上说,正确率标准有其合理之处。初现率只关注第一次系统地出现,却不关心学习者的输出是否正确(如果关注的话,仍得给出一个正确率标准),而中介语初期的正确率往往很低,在这种情况下,即使有了一定系统性和能产性,最多也只能说明学习者开始有了某一语法项目的规则意识,不代表已经习得。如果只是为了确定初现的时间,当然可以对学习者语言不规则、不成熟的地方不加考虑,但是确定了初现时间之后该做什么呢?学习者语言是怎么逐步变得规则和成熟的呢?要考察这一变化的过程,恐怕还得以目的语为参照,描写其正确率逐步增加的过程。

中介语的含义不仅在于它的独立性,还在于它和目的语之间存在差距。正确率的高低在一定程度上反映了中介语和目的语之间差距的大小。差距是一个程度的问题,因此对习得情况的评价不能简单地根据是否达到一个百分比值来判断“已经习得”或者“尚未习得”。换句话说,对是否习得的评价标准或者评价描述应该是有弹性的、分等级的。也许这样的描述更加合适:如果某一语言项目的正确率达到90%,就可以认为习得情况良好或者已经习得;如果正确率达到80%,就可以认为习得情况较好或者基本习得;如果正确率低于80%,就说明习得情况较差或者尚未较好地习得。

中介语和目的语之间的差距不仅仅表现在正确率上。以目的语做参照标准,中介语的差距还表现在输出频率、输出比例和输出分布上。如果通过中介语语料库考察自然语言样本,学习者的输出情况也是习得情况的一种表现。跟本族人相比,学习者有些语言项目的输出可能严重不足,也可能明显过度。如“可是”兼属副词和连词,据我们的统计,其副词用法的输出严重不足,连词用法的输出则明显过度。这两种倾向都是差距的表现。此外,学习者某一用法的输出可能存在窄化或公式化的倾向,在这种情况下,即使输出频率不低而且输出比例接近本族人,也不能认为是已经习得。如副词“可”有表示感叹语气的用法,但如果中介语输出的都是“可A了”,就说明学习者还只是把它作为一个语块(chunk)记忆而尚未习得其中“可”的意义。在这方面,正确率标准在研究习得顺序时采用了频率分析和分布分析的方法,初现率标准则主张确定初现的时间时应该综合考虑出现频率(token frequency)和类型频率(type frequency)因素,前者反映使用次数,后者反映使用分布(Pallotti 2007,转引自冯丽萍、孙红娟,2010),两者都考虑到了频率和分布,但都没有考虑到特定语言项目的某一用法在全部用法中所占的比例问题。例如汉语的介词“在”可以表示条件,中介语料中这种用法也有一定的出现频率和类型频率,可是如果我们不以目的语作为参照,就很难确定中介语这一用法的使用次数是否足够。

有鉴于此,我们把中介语中某一语言项目的输出表现也作为评价其习得情况的标准之一。并把输出分为绝对输出和相对输出两种。所谓绝对输出,指的是一定规模语料中某一语言项目的所有输出次数;所谓相对输出,指的是某一语言项目所占的比例跟本族人相近语料中的使用比例之差。如果绝对输出极少,比如100万字的中介语语料中只有1例“可X了”,即使它的正确率达到了100%,但由于这一正确率缺乏统计学上的意义,也就不能认为它已经被习得,更不能认为它是副词“可”的几个用法中最容易或者最先习得的那一个。这种情况也许过于极端——如果绝对输出的次数在5—10次或者更多,那也许有了统计学的意义和价值,但对其习得情况的评价还需要引入相对输出这一概念作为参照。仍以“可”为例,如果相当规模的本族语料中副词用法和连词用法各占30%和70%,而中介语料中副词用法只占到10%,那么就可以认为中介语料中副词“可”的相对输出严重不足,这时即使副词用法的正确率和连词用法不相上下甚至高于连词用法,也不能认为其习得情况好于连词用法。

基于上述思考,我们认为,基于中介语语料库的习得顺序研究应该把正确率和输出情况结合起来对习得情况进行综合评价,这样得出的结论更全面、更符合实际。

2.2.2 习得顺序的确定

使用正确率标准判断是否习得的一个潜在的逻辑推论就是把正确率的高低和习得顺序联系起来。正确率高的项目被认为先习得,正确率低的项目被认为后习得。已有研究的排序方法主要有两种:一种是直接按照正确率或者偏误率排序。某一语言项目的正确率很高,就说明它容易习得或者较早习得;反之,则说明它较难习得或者较晚习得。第二种是采用蕴含量表通过复用系数或量表系数对排列的顺序进行检验。两种方法依据的都是正确使用情况,从统计学的角度来说,如果样本的数量足够,所得到的结果是一致的。(冯丽萍、孙红娟,2010)

把正确率顺序等同习得顺序的做法始于早期的英语语素习得顺序研究。对这一做法的批评意见主要是认为语素顺序研究得出的是正确率顺序或者难易顺序,语素顺序研究缺乏理论动机和依据,无法对所得顺序进行有意义的解释。我们认为,语素习得研究的几个语素之间几乎没有什么关系,上面的批评确实有一定的合理之处。但如果研究的是某一特定的语法项目内部具体用法之间的顺序,就可以进行有意义的解释——难易顺序在很大程度上就是习得顺序:难度小的容易习得,自然也就先习得,难度大的难习得,自然也就后习得。这符合人类认知的一般规律。

不过,正确率顺序必须有来自语料库和统计学的支持。也就是说,正确率必须建立在足够的输出样本的基础上。如果绝对输出极少,100%的正确率也不能表示已经习得;同样,如果想对输出严重不足,有统计学的高正确率也不能表示已经很好的习得。因此我们认为应该把正确率和输出情况结合起来进行判断。

我们研究的习得顺序既包括对某一兼类虚词的两个类别的习得顺序,也包括某一兼类虚词的多个意义和用法的习得顺序。在意义和用法较多的情况下,绝对的先后顺序很难排定,因此我们把习得情况分为良好、中等和较差三个等级,得到的实际上是一个等级顺序。具体来说就是,如果有足够适量的输出且正确率很高(90%以上),就说明习得情况良好;如果输出严重不足且正确率很低(80%以下),就说明习得情况很差;如果输出足够但正确率较低,或者正确率较高但输出不足,习得情况就只能说是一般;如果某一用法在较大规模语料库中根本没有输出,就说明基本没有习得。尽管其原因可能是学习者采取了回避策略,但回避本身也是尚未习得的一种表现。

但是,如果两个或更多的语言项目的习得情况都属于第一种情况(输出足够,正确率也很高),单靠正确率和输出标准就无法评判。这时候就需要借助于初现标准。我们认为,初现的意义就在于提醒研究者注意哪里是一个合适的“阶段性终点”,终点太晚,习得顺序研究就无法排定。因此利用中介语语料库中的等级划分,把阶段性终点前移不失为一个解决的办法。当然,运用初现标准同样适用于习得情况中等的语言项目。

根据Pienemann (1995)的定义,初现指“第一次被系统地运用”。其中“第一次”涉及时间点的确定问题,“系统运用”则是避免公式化(formula)的使用(将语言项目作为固定结构习得)给评价是否习得带来误判。不过使用初现标准的学者在判断初现时间时的做法并不一致,有人选择某句法结构第一次出现为习得,有的选择在3、4、5种不同语境中出现为习得的时间点。(冯丽萍、孙红娟,2010)

出于上述考虑,本研究在评价习得情况、确定习得顺序时同时采取输出情况、正确率和初现三个标准。具体的操作程序是:先在中介语语料库中检索出某一兼类虚词的所有的输出用例,进行分类统计和描写说明,并将结果与相当规模的本族语料中相应的意义和用法进行比较,评价其绝对输出和相对输出情况,得出第一组习得情况等级顺序;然后结合上下文对所有输出用例进行人工分析,发现并简单分析与之有关的偏误类型,得出各个意义和用法的正确率,并根据正确率的高低得出第二组习得情况等级顺序;再对各个意义和用法在初级语料中的初现情况进行考察,得出第三组习得情况等级顺序即初现顺序;最后综合输出、正确率和初现三方面的情况,得出一个比较全面、符合实际的客观习得顺序。

需要说明的是,本书使用的中介语语料库由两个各为60万字的子语料库组成,其中初级、中级和高级三个部分各为40万字(其中南师大语料和复旦语料各20万字)。我们在描写输出和正确率情况时,对象为整个120万字中介语语料库中的全部输出用例。在考察初现情况时,只考察初级和中级部分的语料。为了增加说服力,我们在初现情况考察中将对两个子语料库分别进行统计,以某一意义和用法在20万字的中介语语料至少有3个输出用例为达到初现标准(如果只有3个用例,将注意该用法是否存在公式化倾向)。

2.2.3 习得顺序的解释和预测

在相信语言项目的习得存在一个固定的顺序以后,研究者们接下来做的就是试图对这一顺序进行解释。关于英语语素习得顺序,Larsen-Freeman (1976)的研究表明,输入频率可能是最重要的原因。这种解释很难解释一些反例,如英语的定冠词the的输入频率很高,但习得顺序并不靠前。这说明习得顺序的成因不是单一的。后来研究者们又想到了其他几个因素:感知突显性、语义复杂度、形态语音规律和句法范畴。所谓感知突显性,指的是某一结构是否容易听到或感觉到,语义复杂度指的是某一形式表达的意义的数量(如果一个形式只有一个功能/意义,就容易学;如果有若干个功能,就比较难学)。形态语音规律指的是语素受语音环境影响而产生的变化,句法范畴则首先区分词汇性和功能性,然后再区分自由和粘着。Goldschneider&Dekeyser (2001)认为,语素习得顺序是五种因素共同作用的结果,这五种因素可以统一概括为“突显性”,它们分别从语音、形态、语义、语法和数量方面体现了语素的突显性。

另一个基于认知显著度对习得顺序进行解释和预测的理论是Eckman (1977)提出的标记差异假设(markedness differential hypothesis)。标记现象指的是语言范畴的不对称现象,比如英语名词的单数形式是无标记的,而复数则是有标记的;肯定形式是无标记的,否定形式则是有标记的。标记差异假设对学习难度的解释和预测是:困难程度与标记难度成正比,标记程度越高的项目越难学。标记差异理论更多地关心学习者母语(L1)对二语(L2)习得的影响,其假设包括:

L2中那些不同于L1且标记程度更高的区域学习时会有困难。

L2中那些不同于L1且标记程度更高的区域学习时其困难程度等于其标记程度。

L2中那些不同于L1且标记程度低于L1的区域学习时不会有困难。

Pienemann (1989)在研究德语语序习得顺序时认为,影响这一顺序的是语言处理方面的因素,典型的语序最容易处理,而从句内的处理则最难。不同阶段习得的结构之间存在着蕴含关系:掌握前一阶段的结构是完成后一阶段习得的先决条件。他后来(Pienemann,1998)进一步提出了可加工理论(processability theory,PT)。这一理论的基础是大脑中存在一个语言处理器(linguistic processor),第二语言形式的产生和理解只有在语言处理器能够对其处理时才会发生。只有具备了必需的处理程序,才能说出某些结构,凡是不能处理的,就不能习得。Pienemann (1998)建立了一个与程序顺序相关的层级:

无程序>语类程序>名词短语程序>动词短语程序>句子程序>从句程序

这些程序之间存在蕴含关系,前一个程序是后一个程序的前提,如果习得了后边的程序,就意味着前边的程序全都已经习得。这就意味着理解了处理器的工作原理就能够对学习者遵循的发展顺序做出预测。

从理解和加工的角度看,习得顺序问题可以看作是认知处理的难度问题。认知和处理加工难度小的语言项目先习得,难度大的后习得。处理和加工难度在语义和句法两方面都有表现。一般来说,语义理解的难度顺序是具体的意义比抽象的意义容易理解,客观性意义比主观性意义容易理解。句法加工的难度顺序则是简单的结构比复杂的结构容易加工,结构越复杂,加工的难度就越大。前述Pienemann (1998)提出的词→短语→句子→从句的加工程序顺序实际上就是句法结构的复杂度顺序。

在理解和加工过程中,学习者对语义的处理总是先于句法处理,这就意味着意义的习得先于形式的习得。一个很好的证明就是学习者输出往往会经历这样一个阶段:意义是正确的,但形式是错误的。VanPatten (2007)提出的二语加工的意义第一原则(the primacy of meaning principle)认为,学习者首先因为意义对输入进行加工,之后才是因为形式加工(转引自Gass&Selinker,2008),意义第一原则包括若干个次原则,如实词第一原则(学习者优先加工输入中的实词)、词汇优先原则(当词项和语法形式都携带语义信息时,学习者依赖词项而不是语法形式来获取意义)和非冗余形式优先原则(学习者首先加工非冗余的有意义的语法形式,之后才加工冗余的意义形式),我们对此的理解是,加工的优先顺序其实也反映的认知的一般规律:实词的意义比虚词具体,词汇意义比语法意义具体,句法意义比语用意义具体(冗余形式表达的是语用意义),其结果就表现为习得顺序:实词比虚词容易习得,词汇意义比语法意义先习得,句法意义比语用意义先习得。

总之,二语习得顺序研究经历了从单纯的描写习得顺序到尝试作出解释甚至预测的发展过程。认知显著度(主要是频率)、语义的明晰度(理解难度和复杂度)、句法结构的复杂度都可能会影响习得顺序。它们都可以对习得顺序作出一定程度的解释和预测。不过它们可能都不是唯一的因素。因此比较符合实际的看法是,每一种因素都有一定的解释力和适应范围,应该根据具体的语言项目来选择最合适的解释和预测的角度。从适用范围的大小来说,语义方面的因素显然更重要。

从描写到解释甚至预测的变化代表着二语习得顺序研究上升到了一个新的理论高度。有了理论导向,二语习得顺序研究就不再是盲目的。基于某种理论假设的习得顺序研究显然更具说服力,也更有效。

2.3 语法化顺序与汉语兼类虚词习得顺序研究

2.3.1 语法化过程和二语习得过程的认知共性

语言形式和意义的演变是有理据的。语法化过程在很大程度上是一个认知过程。人类认知的一般规律是从具体到抽象,从简单到复杂,从个别到一般。重新分析、类推、隐喻和转喻等人类基本的认知机制在语法化过程中起着重要作用。语法化的另一个动因是语用因素,包括语境吸收、语用推理等。不过语用因素的背后仍然是认知因素。语言形式的语义往往首先在特定的语境中获得,如果该语境有较高频率的使用,这一语义就会在语言使用者的大脑里抽象为广义的形式—意义关系。语用推理指语言使用中说话人和听话人可以利用会话原则传递和推导隐藏在字面背后的“隐涵义”,主要是利用会话的“不过量原则”进行基于常识和事理的回溯推理(沈家煊,2004)。语用推理也是认知方式作用的结果,或者说,认知方式特别是转喻会在语用推理和话语理解中发挥作用(江晓红,2011)。因为人们的知识结构犹如一个由不同知识和概念构成的网络体系,任何一个节点的激活都可能影响到跟它邻近的关联密切的节点,从而激活相关的知识、概念和认知结构,推导出话语背后的意义。

第二语言习得是一个心理过程,不同时期的心理学理论对语言习得过程有不同的解释。行为主义认为第二语言习得是一个克服旧习惯(母语)、养成新习惯(目的语)的过程,以乔姆斯基为代表的心灵主义认为大脑里先天存在一个固有的语言习得机制(LAD,language acquisition device),其中的核心部分是普遍的原则和参数,第二语言习得就是激活二语参数、建立第二语言系统的过程。行为主义理论受到了乔姆斯基的批评,而乔姆斯基主张的先天语言习得机制也被认知主义否定。

认知主义认为,语言习得过程也是一个认知过程。从认知角度研究二语习得过程主要有三种代表性理论。其一是思维适应性控制模式(adaptive control of thought),这种理论模式把知识分为陈述性知识和过程式知识,二语习得过程就是陈述性知识向程序性知识转化的过程。其二是竞争模式(the competition model),认为语言习得过程在本质上也是信息处理过程,是语言形式和语言功能的匹配过程,在信息处理过程中,母语线索和目的语线索存在冲突和竞争。第三种也是当代认知观的主流理论——信息加工模式(lnformation processing model),这种理论认为二语习得过程是一个语言信息在学习者大脑中经过了一个输入、加工、输出的过程,信息处理是一个从有意识的处理向自动处理发展的过程。学习者从输入中提取信息,然后利用这些信息进行意义和形式方面的处理和加工形成语法,最后产出目的语形式。

Gass (2008)曾把从输入到输出的转化过程分为五个阶段,并据此建立了一个二语习得模型:

感知输入→理解输入→吸收→整合→输出

Gass认为,感知输入(apperceived input)是二语习得的启动机制。感知是内在的认知行为,学习者通过感知确认一个语言形式,并把它与某些先前经验理解起来。不是所有的输入信息都能被学习者感知到,选择性注意、情感因素、频率和先前知识(包括本族语知识、其他语言知识、现有第二语言知识以及关于世界的知识等)等因素都会影响学习者对输入的感知。理解输入(comprehended input)是一个分析机制,包括理解意义和理解结构,是一个从语义一直到详尽的形式分析的连续统。是否能被理解与学习者的先前语言知识有关,先前知识是理解的基础。并不是所有理解了的输入都能被吸收。吸收和融合(integration)是一个处理和加工机制,包括语义加工和句法加工。吸收是一个假设的形成、验证、拒绝、修正和确认的过程,加工过并且被认为适合语言发展的语言信息有些被整合为学习者语言知识系统或语法的一部分,有些则被存储起来。输出则给学习者提供了产出语言并得到反馈的机会,经过整合的知识会带来规则的改变,由于输出时学习者不得不把词语按照某种顺序排列,所以输出会迫使学习者由语义加工转到句法加工。

总之,二语习得是一个从输入到输出的认知整合过程。输入必须是可理解的。可理解输入建立在学习者先前知识的基础之上,因为新知识的建立需要一个支点。这个支点就是先前知识,它决定学习者是否能理解以及理解的水平。只有在理解的基础上才能对信息进行处理和加工。

语法化和二语习得都是一个认知过程,语法化过程主要表现为语义演变过程,其方向是从具体到抽象、从客观到主观。在语法化过程中,隐喻、转喻和推理等认知机制发挥了重要的作用。成人二语习得的认知策略是优先理解和加工意义,在理解和加工意义时也会结合语境发挥推理等语用机制。也就是说,语法化过程和习得过程在认知上存在共性。意义的理解和加工顺序也是从具体的词汇意义到抽象的语法意义,因此语法化程度等级顺序实际上反映的是理解和加工的难度顺序,容易理解和加工的意义先习得,难以理解和加工的后习得,这就意味着语法化程度顺序和习得的先后顺序很可能是一致的。

2.3.2 语法化过程与语言习得过程的发展共性

语言习得研究主要是在语言学理论和心理学理论双重影响下进行的。20世纪70年代以来,对语言习得研究影响最大的无疑是普遍语法理论和认知心理学。二语习得作为一门独立的学科直接得益于普遍语法理论。不过,尽管习得一种语言在很大程度上是在习得这种语言的语法,但推动习得过程的是语义和语用功能,而不是抽象的句法特性。普遍语法能够为习得过程的存在提供理论上的支持,但能对习得过程做出解释的却是人类认知的一般规律。更重要的是,普遍语法解释的是语言知识的表征系统而不是语言知识的习得过程,它认为抽象的原则和参数是先天固有的。这种观点不具有证伪性,也不符合各种语言的语法都经历了发展的过程、都是变化而来的这一语言事实。认知心理学的习得模式虽然重视对习得过程的解释,但它把语言习得等同于一般的知识和技能的习得,也不能单独解释二语习得现象。很显然,语言习得研究既需要语言(语法)理论,也需要认知科学。这样一来,语法化就是一个很好的理论框架。

20世纪90年代语法化理论重新兴起之后,研究者们注意到语法化和语言习得都有一个发展过程这一共同点,开始对语法化过程和习得过程是否一致感兴趣并把语法化和语言习得结合起来进行研究。

Givón (1998)认为:“语言演进、语言习得和历时变化,在这三个与人类语言相关的发展过程中,每一个似乎都遵循着完全相同的发展顺序。”(In each of the three developmental processes pertaining to human language evolution,acquisition,diachrony-the very same sequence seems to be involved.)

语言习得可以分为一语习得和二语习得。关于一语习得(儿童母语习得)和语法化之间的关系,Slobin (1994,2002)的研究比较有代表性。他发现儿童习得中的英语现在完成时的语法化和现在完成时的历史语法化有密切的联系,儿童早期对现在完成时的使用更加“具体”,更易于表达一个概念。这表明一语习得中存在语法化过程,且儿童语言发展和历时语言演变之间存在相似性,两者的结果是并行(parallel)的,儿童的个体语言发展和不断重复的语言的历时变化之间有着惊人的相似之处。Ziegeler (1997)同Slobin的观点相似。他还列出了一些例子来证明,个体发展(ontogeny)和历时发展(diachrony)之间的对应关系是很明显的。其中一个例子就是“过去意义”的语法化,从完成式语法化到过去形式的历时性语法化过程和第一语言习得过程,两者是并行的。

不过,Slobin认为儿童语言发展与历时语言演变的相似并非过程上的再现。因为一语习得的语法化过程是由认知因素引起的,由于认知上的限制,儿童更倾向于注意那些认知上最简单、最自然、最可得的概念。儿童的语法构成机制与成人语言的语法化原理差异很大。在成人语言中,新的语法形式源于语用基础,借鉴于已存在的意义。但学龄前儿童无法从这些已有的意义中提取东西,而只能拘泥于核心的句法概念和语用功能。随着语用、认知能力的加强,他们才有能力理解成熟说话人话语的语用意义,进而自己运用。儿童用显著透视域去发现现有语法形态的意义,并且一开始所发现的意义有限。而成人则从显著透视域中进行抽象并创造出广泛使用的语法标记。词汇语项逐渐发展成为语法词是在成熟说话人的会话含义推理中进行的,因此语言的演变一般都源于社会交际和语言互动中成熟的参与者,而不是年幼的语言学习者。儿童会“发现”(discover)语法形式的语用扩展性,却无法“创造”(innovate),这些语用扩展(extension)是由年纪更大的人们发明的,儿童只是在对话中习得它们而已。

Slobin之所以强调一语习得中的语法化过程不同于语言演变中的语法化,是因为他认为语言演变中的语法化是指词语项目在演变过程中被重新分析,而一语习得中的语法化明显是一个整体过程。但如果承认习得语法化(acquisitional grammaticalization)并不创造新的形式和意义或者说并不是导致语言演变而是重述演变的阶段性结果,那么它和历时语法化(diachronic grammaticalization)的顺序是一致的。Erbaugh (1986)的研究表明中国儿童对名词词类划分系统的习得和公元前1400年至今的历史发展有着共同的顺序。杨成虎(2005)的研究也表明儿童母语的虚词习得实际上是语言发展过程的重演,其发展过程与语法化的发展过程具有共同性。戚国辉、杨成虎(2008)通过实验发现,语法化和儿童母语语法习得在总体上相平行。

关于二语习得和历时语法化的关系,Giacalone Ramat (1992)曾以提问的形式写道:“在语言的历时发展中和语言习得中,它们的语法化渠道是否是一样的?这两者的演变途径有着惊人的相似,似乎告诉我们:语法化的概念,为被语法化了的语义关系的习得和语言的历史发展,都提供了恰当的基础。在语法化的量表上,个体学习者会从独立的词汇项目开始,再逐步向目的语的语法编码发展。与之相类似的是,历史上的语法化也正是一个将词汇和句法项逐步变成语法的过程。”其结论是:“如果人们认为学习一门语言意味着学习构成该语言语法的一系列规则,以及辖制该语言使用的若干语用规则和社会文化习俗,那么这一语言习得的过程在很大程度上就是一个语法化的过程。”原文如下:

Are the channels of grammaticalization the same inboth instances,diachrony and language acquisition? There are striking similarities in the paths of change suggesting that the notion of grammaticalization provides a suitable basis for examining both acquisition of grammaticalized semantic relations and the historical development in the same area.Along a grammaticalization scale,the individual learner would start from autonomous lexical elements and step gradually into the grammatical encoding of the target language.Analogously,grammaticalization processes have,historically,moved items from the lexicon and syntax into grammar.

If it is assumed that learning a language means learning sets of rules constituting the grammar of that language,together with a number of pragmatic principles and of sociocultural norms that govern language use,then much of the language acquisition process will necessarily appear as instances of grammaticalization.

Giacalone Ramat研究了以意大利语作为第二语言的习得,发现道义情态先于认知情态这一习得顺序跟语法化的顺序完全一致,可以根据语法化顺序对习得顺序的演变方向做出预测性的假设。当然,其文章也像Slobin (1994)那样关心习得语法化是否创造新的形式,结论是,经典意义上的语法化同成人二语习得中的语法化有不同,习得者并不创造新的语法形式,而是创造目的语的各个子系统的近似物。

LlorenComajoan&Manuel Pérez Saldanya (2005)认为,二语习得中的语法化与Slobin关于儿童语言习得的看法并不一致。成人学习者没有儿童那样认知上的限制,因为成人可以借助他们的第一语言和普遍知识所给予他们的隐喻和转喻过程。因此,历时性发展与个体发展之间的重述关系(diachrony recapitulates ontogeny)也可以应用到第二语言习得上。历时语法化和习得语法化都是词汇单位在特定语境中获得语法地位的一种语言变化过程,所以在二语习得中,将语法化理论应用到二语习得数据中,是富有成效的。“可以假设,成人二语习得者的习得顺序就是重复该语言的历史发展过程。”(It can be hypothesized that the sequence followed by adult L2 learners toward a target language reproduces the diachronic development of a language.)

前面的相关研究介绍表明,已有不少学者发现并证明了语法化和成人二语习得在过程与结果方面的共性。尽管这些研究的侧重点在于成人二语习得过程中是否存在语法化以及习得语法化和历时语法化的过程与结果一致性,但也注意到了习得顺序和语法化顺序的一致关系。因此给了我们很大的理论启示。

2.3.3 语法化顺序与汉语虚词习得顺序的构拟

语法化既是历时现象,也是共时现象。语法化研究的重心从历时转向共时之后,就可能使用一种新的研究方法:构拟—验证。沈家煊(1998)指出,在历时线索还不明朗的情况下,可以先通过共时分析来“构拟”历时演变过程,然后用历史材料来验证和修正。吴福祥(2003b)也认为,可以利用单向性假设来共时地构拟某种演变的方向。我们觉得,这种方法在汉语虚词语法化研究方面特别有效。因为汉语的很多虚词(包括副词、介词和连词等)都是从实词(主要是动词)逐步语法化而来的。语法化是连续的、渐变的。在新的意义和形式出现后,旧的意义和形式不一定马上消失。这种共存现象在共时层面上可能表现为一词多义,也可能表现词的兼类。换句话说,现代汉语共时平面虚词包括兼类虚词的多个意义和用法一般是不同时期产生的,但都积淀在共时平面。由于汉字的原因,词的同一性和连续性在历时演变中得到了很大程度的保障,而且有丰富的文献语料,这就为虚词语法化研究提供了支撑。

受这种观点启发,本书在研究兼类虚词的语法化顺序时也采用共时构拟和历时验证的方法:先对虚词共时平面存在的多个意义和用法之间进行分类描写,分析意义和用法之间的语义关联,得出一个大致的关联顺序,然后通过历时语料考察加以验证。

不过,我们更感兴趣的是把“构拟—验证”这一方法应用于汉语虚词包括兼类虚词的二语习得顺序研究上。这一方法的思路和操作程序如下:

(ⅰ)假设虚词的语法化顺序和习得顺序基本一致,或者呈显著正相关;

(ⅱ)描写某一虚词不同意义和用法之间的语法化顺序;

(ⅲ)根据该虚词的语法化顺序构拟其不同意义和用法之间的习得顺序;

(ⅳ)通过对该虚词在较大规模中介语语料库中的输出用例的分析考察,得出其客观习得顺序;

(ⅴ)把构拟的习得顺序和客观习得顺序进行对比,讨论二者的一致性或相关性,验证构拟顺序的准确性。

我们这样做的理由或者说动机主要有以下两点:首先,习得顺序研究是第二语言习得研究最重要的内容之一,它不仅可以揭示二语习得的规律,还可以促进第二语言教学。但汉语作为第二语言的习得顺序研究起步较晚,成果也较少,研究对象大多集中在一些有限的语法项目上,研究方法大多是个案调查、问卷调查和语料研究等,研究结果也局限于得出一个习得顺序,解释性不强(施家炜,2006)。况且对习得顺序的解释工作需要在描写出习得顺序之后才能进行,但缺乏理论指导的描写存在盲目性,因此目前特别需要具有理论导向的汉语习得顺序研究。其次,二语习得研究既需要语言学理论,也需要认知科学。语法化理论建立在认知机制的基础上,可以作为习得顺序研究的一个框架。汉语语法化研究特别是虚词的语法化研究近年来取得了丰硕的成果,汉语作为第二语言的教学和研究都应该吸收这些成果。由于作为理论语法的语法化理论旨在“明理”,而对外汉语语法教学需要的是旨在“致用”的教学语法(孙德金,2011),直接把语法化研究的成果运用于课堂教学还缺乏可行性和有效性。但把语法化理论和相关研究成果运用于二语习得顺序研究却是可行的,即便是持审慎态度的学者也承认,“就基本的原则来说,从实到虚,从具体到抽象,是符合语言学习由易到难、循序渐进的基本规律的”。(孙德金,2011)而语法化的方向正是由实到虚,由具体到抽象。

当然,这一研究方法是否可行的关键在于虚词不同意义和用法的“语法化顺序和习得顺序基本一致”这一假设能否成立。我们对此持乐观态度。一方面,前面的讨论已经表明,语法化是人类语言演变的共性,成人二语习得顺序也具有普遍性,两者在认知机制和发展过程等方面都存在共性;另一方面,这一假设有其合理的依据:语法化和二语习得都是一个认知过程。在语法化过程中,实在、具体的词汇意义减弱,比较抽象的语法意义、跟说话人主观态度有关的语用意义得到加强。也就是说,语法化主要表现为意义的抽象化和主观化,是一个从具体到抽象、从客观到主观的认知过程。而在习得过程中,首先要理解和加工的就是语义。理解加工的优先顺序其实也反映的是认知的一般规律:实词的意义比虚词具体,词汇意义比语法意义具体,句法意义比语用意义具体,其结果就表现为习得顺序:实词比虚词容易习得,词汇意义比语法意义先习得,句法意义比语用意义先习得。语法化程度较低的语言成分抽象程度较低,理解和加工的难度也较低,因此较容易习得或者说先习得;语法化程度较高的语言成分抽象程度较高,而且还带有相当的主观化成分,理解和加工的难度较高,因此较难或者说后习得。具体到汉语虚词来说,它们大都由实词语法化而来,且很多都不止一种意义,这些不同意义之间存在有机的关联,也经历了从实到虚、从虚到更虚的历时演变,它们之间存在一个语法化顺序。由于它们在形式方面没有什么本质的不同,学习者面对的主要是意义的理解和加工问题,因此影响其习得顺序的决定性因素可能就是其意义的语法化程度——是否抽象以及抽象化程度、有无主观性以及主观化程度。可以认为,虚词的习得顺序与其语法化顺序在很大程度上存在着一致性,可以根据语法化顺序对其习得顺序做出构拟和预测。

高顺全(2012)在这方面已经做过类似的探索性研究,他以现代汉语7个常用多义副词为对象,通过语料库分析等实证性研究证明其语法化顺序和习得顺序基本上是一致的。本书考察的兼类虚词比多义副词的情况要复杂一些,但汉语的兼类虚词完全同形,说它们属于不同的词类,主要是就其句法功能而言的,它们可以看作一个虚词的两个不同的大类用法。因此我们相信,虚词的不同意义和用法之间的语法化顺序和习得顺序基本一致这一假设同样适用于兼类虚词的习得顺序研究。

2.3.4 影响习得顺序的几个因素

二语习得本身是一个复杂的过程,本章2.2.3节的讨论表明,习得顺序可能是多种因素共同作用的结果,它主要与学习者的认知机制有关,但也会受到学习策略、教学环境等因素的影响。

语言项目的输入频率肯定会给课堂环境下的第二语言习得顺序带来影响,输入频率高的语言成分会先习得(至少在短时期内会这样)。课堂输入频率在很大程度上取决于该项目的母语使用频率(虽然不一定经过科学的计算,但教师和教材编写者一般都会依赖语感中的频率意识)。使用频率高的,课堂输入频率一般也较高;反之,输入频率就会较低。但虚词不同意义和用法的语法化程度与使用频率之间的关系比较复杂。语法化程度低的用法,在共时层面上的使用频率可能很高,如引介处所的介词“在”;也可能比较低,如“跟”引介动作对象的介词用法。因此,客观习得顺序可能会受到输入频率的影响影响而发生局部的改变,结果就是和语法化顺序不完全一致。

其次,语言项目的规则化程度和句法复杂程度也会影响到习得顺序。比如引介比较对象的介词“跟”经常以“(X)跟Y一样”的形式出现,很容易语块化,习得难度可能会因此降低。反映在习得顺序上,这种用法就可能会先于比它语法化程度低的用法习得。

最后也是最重要的因素,就是教学顺序对习得顺序可能的影响。关于习得顺序和课堂教学之间的关系,普遍的看法是习得顺序是客观存在的,课堂教学无法改变基本的自然习得顺序。Pienemann (1985)提出的可教性(可学得性)假设(the learnability hypothesis)认为,语言处理策略对语言的发展有阻碍和制约作用。如果语言教学超前于学习者所处的语言发展阶段,学习者可能会使用回避策略,从而对语言习得产生消极的影响。超越语言习得阶段的课堂教学往往会阻碍正常的语言习得过程,学习者依然无法习得所教的内容。只有当所教的语言结构接近学习者在该阶段在自然环境中有能力习得的语言结构时,语言教学才能促进语言习得。二语中的某个语言点能否被教会,取决于学习者是否在自然语言环境里不用人教也能习得该语言点。这跟中介语所处的发展阶段有关。如果中介语尚未发展到可以吸收某个语言点的阶段,提前教学并不能使学习者受益。换言之,教学不能从根本上改变习得顺序。

二语习得顺序的多维模式理论认为,有些项目之间的习得顺序是固定的,但有些项目之间的顺序则是可变的(因学习环境)。教学安排不能改变固定的那一部分顺序,却有可能改变可变的那些顺序。语法化顺序是一个连续统,其邻近的两个意义在语法化程度上的差异可能并不十分显著,属于“可变”的部分,对这些意义和用法来说,教学顺序可能会产生作用:先教的先习得。其结果也是根据语法化顺序构拟出的习得顺序与客观习得顺序不完全一致。

基于上述思考,本书在根据语法化顺序构拟习得顺序时一般不考虑上述因素,但在验证构拟顺序和客观习得顺序的一致程度,特别是讨论、解释两者之间不同之处时,会结合上述因素,特别是教学安排因素——主要依据是国家汉办主编的《高等学校国外留学生汉语教学大纲(长期进修)》(以下各章简称《教学大纲》),因为它是近十多年来国内各高校对外汉语教材编写的共同依据。

总之,本书主要基于虚词的语法化顺序和习得顺序基本一致这一假设,采取构拟—验证的方法研究汉语兼类虚词的习得顺序。但在专题研究之前,我们并未奢望构拟的顺序和客观习得顺序完全一致。因为除了上述因素之外,至少还有两个理由:其一,即便语法化顺序和习得顺序基本一致的假设成立,我们也不敢保证自己对兼类虚词语法化顺序的描述是绝对正确的;其二,同样,本书对客观习得顺序的描写分析建立在一个120万字的汉语中介语语料库基础之上,但语料库方法本身有其局限性,比如主要是书面语料而没有口语语料,语料的连续性不强等。但我们认为,相对于在黑暗中摸索来说,只要这一假设基本成立,或者说根据语法化顺序构拟的习得顺序和客观习得顺序基本一致或者呈比较显著的正相关性,这一方法在汉语习得顺序研究和汉语作为第二语言教学方面的理论意义和应用价值就是不言而喻的。

2.4 小结

本章在对语法化研究和二语习得顺序研究一些关键术语评介的基础上提出了一些为本书研究服务的概念、方法、操作程序和理论假设。主要包括以下几个方面:(1)语法化顺序以及(兼类)虚词语法化顺序的确定方法,即综合语义关联顺序、历时发展顺序、语义抽象化程度和主观化程度等多种因素确定兼类虚词不同意义和用法之间的语法化顺序。(2)习得标准和习得顺序的确定方法与程序。和以往使用单一标准(正确率或初现)不同,我们主张先分别从输出、正确率和初现三个方面的表现评价某一意义和用法的习得情况等级,然后对其习得情况等级顺序进行综合、全面的评价,得出一个客观习得顺序。(3)我们认为语法化过程和成人二语习得过程之间存在认知共性和发展共性,赞同虚词不同意义和用法之间的“语法化顺序和习得顺序基本一致”这一假设。并以这一假设为基础,首次提出“构拟—验证”这一具有一定创新性的以理论为导向的研究方法,同时给出了具体的研究程序。另外,我们也充分考虑到了影响构拟顺序和客观习得顺序一致性的一些因素。

本章为本研究提供了理论基础。我们认为,既然语法化过程和习得过程之间有着很多共同点,语法化顺序和习得顺序之间也就很可能存在着高度的一致性。从具体到抽象,从客观到主观既是语义演变的规律,也是语言习得的规律。对于汉语这样一种历时和共时之间有着一脉相承的语义联系的语言来说,语法化顺序是不难描述的。在目前汉语习得研究还十分薄弱的情况下,语法化理论就显得特别重要,因为虚词的语法化顺序比二语习得顺序更容易观察和描写。因此,把语法化理论作为框架,根据语法化顺序构拟、预测习得顺序在揭示二语习得顺序方面可以达到事半功倍的效果。我们相信,基于语法化理论的习得顺序研究不但能使汉语的习得顺序研究具有可靠的理论导向,还能为教材编写、课堂教学中的语法项目排序提供参考。

本章也为以下各章规范了研究方法和操作程序。本书分11章对17个兼类虚词进行专题研究,以下各章在方法和程序上都基本一致,不再做特别的说明。