1 绪论
1.1 研究对象与范围
本书名为《基于语法化理论的汉语兼类虚词习得顺序研究》。
兼类虚词指的是身兼两个以上词类的虚词,如“和”兼属连词和介词,“在”兼属介词和副词,“不过”兼属副词、连词和助词等。
现代汉语有不少兼类虚词。一般的词典或虚词类工具书如《现代汉语词典》《现代汉语规范词典》《现代汉语八百词》(吕叔湘主编)、《现代汉语虚词词典》(张斌主编)和《现代汉语常用虚词词典》(武克忠主编)等都对虚词的词性做了标注。我们考察后发现,这些辞书对某一虚词是否兼类或者身兼几类的处理并不完全一致。本书在确定研究对象和范围时主要依据《现代汉语八百词》(为了行文简便,以下及后面各章中均简称为《八百词》),最主要的原因是它编写的初衷是“供非汉族人学习汉语时使用”,是为汉语作为第二语言教学服务的。它在对虚词的意义和用法分类时,更充分地考虑到了第二语言教学实际。
我们在《八百词》中共统计到兼类虚词30个,其中单音节16个,双音节14个。具体如下:
并 从 给 跟 管 和 将 就 可 连 同 以 因 与 在自 不过 果然 果真 还是 或者 尽管 就是 可是 另外 那么 甚至 同时 因为 只是
在这30个兼类虚词中,属于副词和介词兼类的有6个,分别是“从”“就”“将”“连”“在”和“自”;属于介词和连词兼类的有8个,分别是“跟”“管”“和”“同”“与”“因”“因为”和“以”;属于副词和连词兼类有15个,分别是“并”“不过”“果然”“果真”“还是”“或者”“尽管”“就是”“可”“可是”“另外”“那么”“同时”“甚至”和“只是”(其中“那么”《八百词》标为指代词和连词兼类,我们觉得它指示程度时更像是副词);属于介词和助词兼类的只有“给”1个。
我们最初的打算是在汉语中介语语料库输出用例的统计分析上对所有的兼类虚词分别进行专题研究,但在初步的检索统计后发现,有些兼类虚词的输出用例太少甚至没有,有些则表现为两类词性的输出用例的数量相差悬殊,因此,我们决定缩小专题研究的范围。
在6个副介兼类虚词中,“从”的副词用法使用受限(只用在否定词前),“就”的介词用法输出用例极少,“连”基本上没有副词用例,“将”“自”属于书面语,副词和介词用法都鲜有输出用例。在8个介连兼类虚词中,“管”的连词用例为零,介词用例也很少;“以”的书面色彩过浓。在15个副连兼类虚词中,“并”和“或者”基本上只有连词用例而没有副词用例;“另外”的副词用法本身就仅限于用在动词之前(用于名词性成分之前时为代词),中介语语料中基本上见不到用例;至于“果然”和“果真”,虽然《八百词》和一般辞书一样把它们标注为副词和连词兼类,但两者意义和用法基本相同,很难加以区分;“给”的助词用法(用于“把”字句和“被”字句中,或者相当于“把”“被”)在汉语中介语语料库中很难见到输出用例。
经过这样一轮初步的筛选之后,我们把专题研究对象确定为以下17个兼类虚词,即:
在 跟 和 同 与 因 因为 不过 还是 尽管 就是 可 可是 那么 同时 甚至 只是
语法化(grammaticalization)是人类语言共同存在的一种语言演变现象,主要指实词逐渐虚化为没有实在意义的语法成分和短语或词组逐渐凝结为一个单词的过程(江蓝生,2000)。前者即一般所说的实词虚化,后者也可以看作短语的词汇化(lexicalization)。本书研究的单音节兼类虚词的语法化是实词虚化;双音节兼类副词大都经历了词汇化和语法化两个过程,不过这两个过程互相伴随,很难区分,而且两者的演变机制相同,动因上也有很大的一致性,都属于语言演变的大框架(王灿龙,2005)。因此我们侧重从语法化的角度理解。语法化有程度上的高低之别:意义由实变虚是虚化,由虚变为更虚也是虚化。虚词的不同意义和用法之间的语法化程度由低到高可以形成一个序列,我们把这个序列叫做语法化程度顺序,简称语法化顺序。
二语习得理论认为,第二语言学习者在习得两个以上语言项目时存在一个习得顺序,即某些语言项目一定在另外一些语言项目之前或之后习得。习得顺序不受学习者母语、年龄以及学习环境等因素的影响,是一种客观存在。就语法项目来说,习得顺序包含两方面的内容:一是指习得不同语法项目时的先后顺序,学习者总是先习得某些语言规则后再习得另外一些语言规则,一般称之为“习得顺序”(the order of acquisition);二是指习得某一特定、较为复杂语法项目内部相关的子项目时也遵循固定的顺序,有人称之为“习得次序/序列”(the sequence of acquisition)。
兼类虚词虽然完全同形,但在句法、语义甚至语用上却是有区别的。对于把汉语作为第二语言的学习者来说,它们几乎是不同的语言项目。同时,汉语虚词意义和用法一般都比较复杂,兼类虚词的某一词类内部的不同意义和用法也不是同时习得的。因此,本书研究的习得顺序包括两方面的内容:兼类虚词不同词类之间的习得顺序是“order”,某一词类内部不同用法之间的先后是“sequence”,不过我们认为两者之间并没有本质的区别,因此统称为习得顺序。本书着重研究兼类虚词不同词类之间的习得顺序,即学习者先习得兼类虚词的哪一个词性的意义和用法,同时也对某一词类的意义和用法进行再分类,研究其小类用法或者说不同义项之间的习得顺序。
1.2 研究思路与方法
本研究的总体思路是,在语法化理论的框架下研究汉语兼类虚词的习得顺序。该思路基于这样的认识:语法化过程和成人二语习得过程之间存在认知共性和发展共性,语法化顺序和习得顺序在很大程度上是一致的。
本书根本性的研究方法为“构拟—验证”法。构拟的习得顺序和客观习得顺序之间可能存在差异,因此本研究是具有理论导向的习得顺序研究。具体思路和操作程序如下:
(ⅰ)假设虚词的语法化顺序和习得顺序基本一致,或者呈显著正相关;
(ⅱ)描写某一虚词不同意义和用法之间的语法化顺序;
(ⅲ)根据该虚词的语法化顺序构拟其不同意义和用法之间的习得顺序;
(ⅳ)通过对该虚词在较大规模中介语语料库中输出用例的分析考察,得出其客观习得顺序;
(ⅴ)把构拟的习得顺序和客观习得顺序进行对比,讨论二者的一致性或相关性,验证构拟顺序的准确性。
本书在对17个兼类虚词进行专题研究时采取基于用法的研究方法,即研究兼类虚词一个形式的不同意义和用法之间的语法化顺序与习得顺序。每个专题都基本遵守相同的研究思路和程序。即:
第一步,对兼类虚词的意义和用法进行分类。在《八百词》的分类基础上,参考其他辞书的分类,吸收语法学界的研究成果(以贴近教学实际为原则),同时提出自己的看法。
第二步,从共时和历时两个角度(包括语义关联顺序、历时发展顺序、抽象化程度和主观化程度多个方面)描写兼类虚词不同意义和用法的语法化程度顺序,并在此基础上构拟其习得顺序。
第三步,通过对本研究所用的汉语中介语语料库中兼类虚词的习得情况考察,得出各个意义和用法的客观习得顺序。在评判习得情况等级顺序时,注意综合某一意义和用法在输出、正确率和初现三方面的表现,得出一个比较符合实际的客观习得顺序。
第四步,对比客观习得顺序和基于语法化程度构拟出的习得顺序之间的异同,对不同之处进行讨论和解释。同时考察《高等学校外国留学生汉语教学大纲》(以下各章简称《教学大纲》)对该兼类虚词的处理情况,并就相关教学安排提出一些合理化建议。
本研究在描写语法化顺序时主要采取共时和历时相结合、演绎推导和语料佐证相结合的方法;在考察习得情况、描写习得顺序时主要使用定性和定量研究相结合的方法。定性研究主要指对习得情况进行分等级评价,定量研究则主要表现为语料库研究法——对每个兼类虚词的不同用法都进行穷尽性分类统计和对比分析。
为了简便,本研究使用“>”这一个符号表示多个意思:用以描写语法化顺序时表示“低于”,描写习得情况等级顺序时表示“好于”,构拟和描写习得顺序时表示“先于”。
1.3 语料说明
本书对兼类虚词客观习得顺序的描写和评判建立在对汉语中介语语料库输出用例的穷尽性统计分析基础之上。
本书使用的汉语中介语语料库由两个各为60万字的子语料库组成。其中之一为作者自建,由作者所在的复旦大学国际文化交流学院不同水平的外国留学生书面作文组成(包括平时作文和考试作文,以前者居多)。语料收集时间在2008年至2012年之间,形式主要为命题作文,文体大都为叙事文体,也有少量属于说明和议论性质,作文长度在100字至800字之间。这些作者来自于30多个国家,学习汉语时间在两个月到两年半之间。留学生按语言水平编班,细化为从A到J共10个阶段:分班测试时,零起点学生编在A段,学习两个月后升为B段;有一定汉语基础、学习时间在两个月左右的留学生分班时编在B段,学习两个月后升为C段,依此类推。我们按照学生的汉语水平,把收集来的语料分为三个等级:BD段为初级,E-H段为中级,I-J段为高级。自建复旦语料库中初级、中级和高级之语料各为20万字。
另一子语料库由南京师范大学国际文化教育学院所建汉语中介语语料库之部分语料组成,由肖奚强教授友情提供(本书作者亦将自建语料库之部分语料回赠)。该语料库语料全部为南师大外国留学生书面作文,其形式、文体属性以及文章长度均和复旦语料库中的作文相类,作者也来自多个国家。语料按学生年级分为三个等级(各20万字):一年级学生作文语料为初级,二年级作文为中级,二年以上学生作文为高级。
复旦大学国际文化交流学院一个学期完成两段教学,因此自建语料库的初、中、高级和南师大语料库的初、中、高级水平基本相当。这样,本研究所用汉语中介语语料库的初、中、高三个等级均为40万字,总规模为120万字。虽然不是很大,但已经能够保证中介语料的连续性和统计分析的有效性。研究者之所以使用两个来自不同高校的子语料库,除了资源共享之外,更重要的目的是想对比不同教学情况下学习者的语言项目输出是否有较大的不同,特别是在初现方面有无差异。
复旦语料库和南师大语料库均不分国别,不过习得顺序在提出之初的定义就是二语习得中存在一个不受学习者母语影响的共同顺序。尽管后来的研究表明某些语言项目的习得顺序可能会因母语的差异而有所不同,但这种差异不是根本性的。本书研究的出发点和目的是从语法化和语言习得在认知上存在共通之处这一角度来解释习得顺序的共性或者说倾向,因此不分国别不会影响我们的基本结论。
对汉语中介语语料库中某一语言项目的统计分析只能发现某一语言项目的绝对输出情况,要比较科学地评价输出情况,最好能把它和本族语料中相应语言项目的使用情况结合起来进行对比分析。为此,我们又建立了一个约100万字的本族语语料库。考虑到中介语语料库中的书面作文主要为叙事、说明和议论文体,我们选取了王朔的小说《我是你爸爸》(约15.2万字)、赵瑜的报告文学《马家军调查》(约31万字)、张正隆的报告文学《雪白血红》(约16.1万字)、余秋雨的散文《抱愧山西》(约17.7万字)和《邓小平文选》(第三卷,约19.5万字)作为本族语定量统计分析比较的对象。前三部作品的口语和北方话色彩比较浓厚,余秋雨的作品则具有比较明显的书面语气息,《邓小平文选》则兼具口语和书面语色彩。这样能基本上保证这一小规模本族语语料库的“普通话”属性。
另需说明的是,我们在对兼类虚词进行意义和用法分类时所举例句有些直接引自《八百词》,有些出自前述四部本族语作品,少数则为研究者自省,均未标明出处。在兼类虚词历时发展过程之考察部分,所用例句除特别说明外,均出自中国人民大学朱冠明教授所建之“朱氏语料库”,所有用例都注明了出处。中介语部分,除了错别字以外,均未做改动,因此不少语句颇有不通之处。但真实的中介语语料确实如此。