上QQ阅读APP看书，第一时间看更新

走向亲缘比较语言学

李葆嘉

假如可以说，我是“扶手椅上的语言学家”，也就难免胡思乱想。比如，提出语言学的研究方式可以分为四种：地对地、空对地、地对空、空对空。虽然前两种我也做，但更多的兴趣在后二者（基于语料提炼理论，辨析各种理论而得出自己的看法）。

面对历史比较语言学，首先提出三个问题：（1）20世纪的中国有历史比较语言学博士吗?（2）中国学者了解的历史比较语言学来自何处?（3）历史比较语言学这门学科如何形成的?

对于第一个问题，20世纪上半叶，中国赴欧美留学的语言学者中，唯有林语堂（1895—1976）是莱比锡大学的历史语文学专业博士（1923）——其导师是东亚—南洋历史比较语言学家康拉德（A.Conrady,1864—1925）——博士学位论文是《中国古代音韵研究》（Zur alt chinesischen Lautlehre）。按莱比锡大学的规定，及格以上的论文分四等：0.5 = egregia（优）、1.0 = valde（良）、2.0 = laudabilis（可以）、3.0=idonea（勉强通过）。康拉德的鉴定是：“基于林语堂在行文中，这里指论文中的德语错误以及各种疏漏，林的论文只能给2.0。”虽然林先生回国后发过几篇汉语古音学文章，但更适合感性想象地做文学，诙谐幽默地谈人生。顺便看看近年来，从海外回来或执教国外的中国学者，历史比较语言学（或历史语言学）专业的博士堪称凤毛麟角（可能不超过5位）。当然，并非历史比较语言学专业出身的才能从事该领域的研究，其他语言学专业出身的不但有从事历史比较语言学（或历史语言学）的，而且还有贡献重大者。

对于第二个问题，中国研究汉语古音学（或民语关系学）的学者，言必称历史比较法或历史语言学原则，但似乎未见专门探讨“欧洲传统历史比较法或历史语言学原则（基于19世纪和20世纪初一手文献）和汉语古音学（或民语关系学）研究的方法论”著作。有时不免令人生疑，中国学者是否深入了解19世纪的欧洲历史比较语言学。国内学者看到的，主要是法国梅耶（A.Meillet,1866—1936）的《历史语言学中的比较方法》（La méthode comparative en linguistique historique,1925）中译本。[1]梅耶的主要专著《印欧语比较研究导论》（Introduction à l'étude comparative des langues indo-européennes,1903），未见中译本。

对19世纪德国的史勒格尔（F.Schlegel,1772—1829）、葆朴（F.Bopp,1791—1867）、格里姆（J.Grimm,1785—1863）、波特（A.F.Pott,1802—1887）、施莱歇尔（A.Schleicher,1821—1868）、库尔提乌斯（G.Curtius,1820—1885）、布鲁格曼（K.Brugmann,1849—1919）、保罗（H.Paul,1846—1921）、维尔纳（K.A.Verner,1846—1896）以及丹麦拉斯克（R.Ch.Rask,1787—1832）的名著皆无翻译。其中，保罗的《语言学史原理》（Principien der Sprachgeschichte,1880）被誉为青年语法学派的“圣经”。另外，索绪尔（F.de Saussure,1857—1913）的《论印欧诸语元音的原始系统》（Mémoire sur le système primitif des voyelles dans les langues indo-européennes,1879），也是仅闻其名而未见其文。再回到19世纪下半叶的法国，梅耶的老师布雷阿尔（M.J.A.Bréal,1832—1915）1857年到柏林大学，师从葆朴和韦伯（A.Weber,1825—1901）学习比较语法和梵文。1864年到法兰西学院执教比较语法，用八年时间翻译其师葆朴的四卷本《比较语法》（1866,1868,1869,1872），历史比较语言学在19世纪60年代才真正进入法国语言学界。

对于第三个问题，不得不遗憾地说，我们通常了解的历史比较语言学形成过程是“伪史”。东方学家威廉·琼斯（William Jones，1746—1794）从未做过任何历史比较工作（在其所有著作中，连一组词例的比较也找不到），只是为了准备周年讲辞（The Third Aniversary Discoursee,on the Hindus,1786; The Fourth Anniversary Discourse,on the Arabs,1787; The Fifth Anniversary Discourse,on the Tartar,1788; The Sixth Anniversary Discourse,on the Persians,1789; The Seventh Anniversary Discourse,on the Chinese,1790; The Eighth Anniversary Discourse,on the Borderers,Mountaineers,and Islanders of Asia,1791; The Ninth Anniversary Discourse,on the Origin Families of Nations,1792），通过阅读文献泛泛而论，凭借间接资料遽然而断，甚至道听途说信以为真，是19世纪的英国学者炮制了“琼斯神话”。史实表明，历史比较语言学的本体论和方法论成熟于17世纪中期的荷兰莱顿（当时欧洲的学术中心）。莱顿大学教授伯克斯洪（M.Z.van Boxhorn,1612—1653）在其四本书中（1647 abc,1654）提出历史比较法并论证了斯基泰假说（即印欧语假说，包括希腊语、罗曼语、日耳曼语、波斯语、斯拉夫语、波罗的语、凯尔特语、北印度语等）。1723年，荷兰学者凯特（L.ten Kate,1647—1731）基于七种日耳曼语或方言的比较，提出日耳曼历史音变定律。一方面，强调语音系统和词法形态的变化都是规则变化，历史音变规则无例外；另一方面，强调历史音变的次序、根词元音的交替模式，以及历史音变对变格与变位的影响。这一研究要比所谓“格里姆定律”（Deutsche Grammatik.2 nd edit.,1822）早100年。葆朴、格里姆对18世纪荷兰学派的研究都有所了解（J.Noordegraaf,The“Schola Hemsterhusiana”Revisited,1995）[2]。

遗憾的是，这段尘封的历史鲜有人知。先是德国本费（T.Benfey,1809—1881）的《19世纪初以来的德国语言学和东方语文学的历史，以及对早期的回溯》（Geschichte der Sprachwissenschaft und Orientalischen Philologie in Deutschland seit dem Anfange des 19.Jahrhunderts mit einem Rückblick auf die früheren Zeiten.1869），鼓吹“德意志精神天空中的最灿烂明星”（the brightest stars of the German intellectual heaven），有意诋毁荷兰学派。后是英国罗宾斯（R.H.Robins,1921—2000）的《语言学简史》（A Short History of Linguistics,1967），进一步遮蔽了历史比较语言学史的真相。其实，作为欧洲中古语法研究的专家，罗宾斯从未涉猎历史比较语言学的专题研究，不仅没有就《三周年演讲》全文理解琼斯讲辞，更何谈基于十一次演讲整体语境的全面理解。甚至就是其本国学者（Cambrensis 1194,Hickes 1689 &1703—1705,Lhuyd 1707,Wotton 1713,Rowland Jones 1767,Monboddo 1773—1786）的语言历史比较研究，在其语言学史中也未出现。

一比较语言学的缘起

我们先来到9世纪的提亚雷特古城（位于今阿尔及利亚西北部），当时处于阿拉伯帝国的治下。犹太语法学家库莱什（Judah ibn Kuraish，希伯来语）正在撰写《学术论文》（Risālah Bargès& Goldberg eds.,Paris: Baris,1857），就语音和形态比较寻找闪米特诸语的亲属关系。他先把《圣经》与阿拉米语的类似单词进行比较，再把《圣经》与拉比希伯来语的类似词语进行比较，最后讨论希伯来语、阿拉米语和阿拉伯语之间的亲属关系。库莱什认为，这些闪米特语具有共同来源，虽然各自发展有别却遵循相同规律。

接下来，我们来到欧洲的上空，俯视语言历史比较一步步的足迹。印欧语比较的探索阶段，萌芽于佚名的冰岛学者（成稿于1122—1133年间），其后有威尔士的坎布伦西斯（Cambrensis,1194）、西班牙的罗德里库斯（Rodericus,1243）、意大利的但丁（Dante,1305）与荷兰的阿格里科拉（Agricola,1479）。在这些先驱之后，16世纪进入第二阶段词语和谐说（Gelenius,1537等）。17世纪进入第三阶段成熟期，荷兰学派的伯克斯洪（Boxhorn,1647abc,1654）创立了历史比较语言学理论方法。此后，凯特（Kate,1723）揭示日耳曼历史音变定律。第四阶段即19世纪的德国学派（以及丹麦拉斯克等），主要体现为研究规模的拓展和过程的精细化，而在理论方法上并无重大的原创性建树。

语言历史比较的崛起，其驱动力主要源于日耳曼民族意识的觉醒及寻根情结。在发现古罗马历史学家塔西陀（Tacitus,55—120）和帕特尔库鲁斯（Paterculus，约前19—后31）的论著后，当他们第一次读到日耳曼部族首领阿尔米纽斯（Arminius，前18—后21），率领日耳曼人在条顿堡森林击败罗马三个军团（西元9年）的事迹时，对自己的祖先越发敬重，更加热爱其本族语。由此，他们要知道其祖先来自哪里，于是根据语言证据，参照历史和考古，推定其祖先来自东方的斯基泰故乡。史实表明，历史比较语言学的形成和成熟，并非像通常想象的那样，基于16世纪大航海时代的语言大发现和18世纪多种语言标本集的编撰，或者得益于英国学者18世纪末在印度“发现梵语知识”，而是植根于欧洲学术发展的内在趋势，即文艺复兴前后的人文主义兴起，对古老欧洲民族文化的发现。

我们漫步于17世纪的莱顿——自由之棱堡（Praesidium Libertatis）。当时，欧洲的一流学者云集莱顿，语言关系及其起源成为众多学者的流行话题。作为荷兰学派的集大成者，伯克斯洪（Boxhorn 1647abc,1654）创立了历史比较语言学的本体论（斯基泰假说）和方法论。虽然伯克斯洪并非首次对语言相似现象加以比较，但是他将这些亲属语言视为一个有机系统，而为语言历史研究确定了后世称为的“比较方法”。其科学性主要表现在：（1）区分传承词和外来词，确定亲属关系必须排除外来词，要以本地人的常用传承词为比较对象。（2）区分系统特征和貌似同源，亲属关系应当建立在系统性特征的对应之上，不要把偶然相似误以为亲属同源。（3）兼顾词汇比较和语法比较，不仅要比较传承词，而且要对语法现象，尤其是名词格变词尾、动词屈折形态加以比较。（4）区分远古形态和革新形态，希腊语、拉丁语和条顿语中观察到的屈折系统，如果去掉“晚近形成的装饰品”即革新形态，那么就能映射出相同的远古形态系统。（5）关注不规则变化的价值，类似的语法异常现象或不规则变化，不仅可以视为亲属关系的关键证据，而且尤其重要；同词根映射的差别，有可能通过这些语言一直使用的规则加以解释。伯克斯洪不但阐明了历史比较法，更重要的是有意识地实践，在其论著中列出一系列词语比较清单。

我们继续鸟瞰其他语系的早期研究。早期研究乌拉尔语的是德国缪恩斯特（Münnster,1544）、瑞典—芬兰维克雄纽斯（Wexionius,1650）、瑞典斯提恩希尔姆（Stiernhielm,1671）、德—瑞典谢费尔（Scheffer,1673）、德国艾克哈特（Eckhart,1711）。最早调研鞑靼语即阿尔泰语的是荷兰威特森（Witsen,1692），首先对阿尔泰语分组的是德—瑞典斯塔伦贝格（Strahlenberg,1730）。早期研究闪—含语言关系的是法国波斯特尔（Postel,1538）、法国基沙尔德（Guichard,1606）、德国拉维斯（Ravis,1648）、瑞士霍廷格（Hottinger,1659;1661）、德国鲁道夫（Ludolf,1702），提出阿拉米语组的是德国莱布尼茨（Leibniz,1710），最早建立“东方语言”谱系树模式和类比研究法的是荷兰斯库尔滕（Schultens,1738b）。最早推定马达加斯加、东印度群岛和科科斯群岛诸语同源，提出南岛语系雏形的是荷兰雷兰德（Reeland,1708）。在18世纪末，开启非洲语言比较研究的是法国普罗亚尔特（Proyart,1776），开启南美语言比较研究的是意大利杰里伊（Gilij,1782），开启北美语言比较研究的是美国爱德华兹（Edwards,1787）。

现在来到18世纪80年代的英属印度首府加尔各答，英国东方学家正在就亚洲种族关系做《三周年演讲》（1786），而语言只是其研究工具或佐证材料之一。其第一部分第二自然段（5句话，141个单词），提及梵语与一些语言之间存在“亲密—同源”关系（《三周年演讲》的结论与之龃龉），袭用或依托的是前人的语言比较和梵文研究成果。对琼斯十一次周年演讲中涉及语言历史和关系的全部内容，通过逐一核查得出——在37种说法中，琼斯说对了的共10种（皆前有所因，其中琼斯表明前人有研究的仅1种），琼斯说错了的共27种（其中前人研究错误而琼斯亦错的2种，前人研究正确而琼斯反而错误的3种）。琼斯对语言比较的具体工作并无实践，主要通过阅读文献印象、凭借间接资料，甚至道听途说来确定语言关系。当然，作为18世纪与19世纪之交比较语法学家的“先驱”，琼斯的演讲对其后法德学者的梵文研究具有激发作用。而在两者之间发挥桥梁作用的却是孟加拉亚洲学会成员、英国梵文学家汉密尔顿（Alexander Hamilton,1762—1824），他在巴黎（1803—1804）传播梵文知识，推动了19世纪法德学者的梵文研究热潮，开启了德国学者的梵欧语言对比之门。

琼斯将种族—语言关系置于传统的《圣经》框架内，符合当时一些学者的信念。为反对19世纪上半叶的德国学者垄断历史比较，19世纪中期的三位英国学者（Müller,1851; Anonym,1866; Farrar,1869）鼓吹琼斯的成就，再加上德国语言学史家（Benfey,1869）的自吹自擂以及对荷兰学者的诋毁，以至于20世纪的一些学者将“历史比较语言学奠基人琼斯”奉为定论，并且一再夸大，甚至加冕为“第一位现代语言学家”“现代语言学之父”“现代语言科学的创始人”（这就是所谓“琼斯神话”），从而掩盖了荷兰学派的巨大成就，扭曲了西方历史比较语言学的形成和发展历程。

西方学界探索语言关系及其历史的这门学科，在12世纪萌芽，从无名到有名——从16世纪上半叶出现关键术语，到19世纪初形成学科专名，再到20世纪名称变化，其轨迹大体如下：

Lexicum symphonum“词汇和谐”（Gelenius 1537）

Linguarum affinitate“语言亲和”（Postel 1538）

Cognatione“血统关系”佩利雍（Périon 1554）

l'Harmonie étymologique“词源和谐”（Guichard 1606）

Vergelijcken（词语、语法）“比较”（Boxhorn 1647c）

Gemeenschap“亲缘关系”（Kate 1710）

taelverwanten…vergeleken word“亲属语言……进行比较”（Kate 1723）

Vergleichende Sprachlehre“比较语法”（Vater 1801）

Vergleichende Grammatik“比较语法”（A.Schlegel 1803,F.Schlegel 1808）

Vergleichende Sprachenkunde“比较语文学”（Adelung 1806）

→英语 Comparative Philology“比较语文学”（Müller 1851）

Comparative Grammar“比较语法”（Herbert 1874）

Comparative and Historical Grammar“比较和历史语法”（Jespersen 1924）

Comparative Linguistics“比较语言学”（Whorf 1941）

Comparative and Historical Linguistics“比较和历史语言学”

Historical-comparative Linguistics“历史—比较语言学”

（当代）

从16世纪到18世纪，首先是波西米亚（捷克）学者杰勒纽斯（S.Gelenius,1497—1554）在《欧洲大家族四种语言的词汇和谐，希腊语、拉丁语、日耳曼语和斯拉夫语的协和一致分类》（Lexicum symphonum quo quatuor linguarum Europae familiarium,Graecae scilicet,Latinae，Germanicae ac Sclauinicae concordia consonatiiaq' indicator,1537）中提出“词汇和谐”；继而，法国学者波斯特尔（G.Postel,1510—1581）在《希伯来语和古老民族的起源，以及各种语言亲和》（De originibus seu de Hebraicae linguae et gentis antiquitate,deque variarum linguarum affinitate,1538）中提出“语言亲和”。此后，法国学者佩利雍（J.Périon,1498—1559）在《论高卢语的起源，及其与希腊语的血统关系》（Dialogorum de linguæ Gallican origine,ejusque çum Graecâ cognatione,1554）中提出“血统关系”，基沙尔德（E.Guichard，生卒不详）在《论希伯来语、迦勒底语、叙利亚语、希腊语、拉丁语、法语、意大利语、西班牙语、阿勒曼语、弗拉芒语、盎格鲁语等语言的词源和谐说》（L'Harmonie étymologique des Langues Hébraïgue,Chaldaïque,Syriaque,Greque,Latine,Françoise,Italienne,Espagnole,Allemagne,Flamande,Anglosie,& c.）中采用的是“词源和谐”。荷兰学者伯克斯洪在《对女神尼哈勒尼亚之谜提问的解答》（Antwoord van Marcus Zuerius van Boxhorn,Gegeven Op de Vraaghen,Hem Voorgestelt over de Bediedinge van de Afgodinne Nehalennia,1647c）中提出词语音义、语法形态的成系统“比较”。其后，凯特在《论哥特语和尼德兰语的亲缘关系》（Gemeenschap tussen de Gottische Spraeke en de Nederduytsche,1710）和《以可靠基础和高雅名义介绍荷兰语的精要知识，深思熟虑和溯源沿流最有用的特性和规则变化，并对最重要的古老语言和存在至今的亲属语言，如古哥特语、法兰克—德意志语、盎格鲁—撒克逊语及当代高地德语和冰岛语进行比较》（Aenleiding tot de Kennisse van het Verhevene Deel der Nederduitsche Sprake waer in Hare zekerste Grondslag,edelste Kragt,nuttelijkste Onderscheiding,en geregeldste Afleiding overwogen en naegespoort,en tegen het Allervoornaemste der Verouderde en Nog-levende Taelverwanten,als't Oude Mœso-Gotthisch,Frank-Duitsch,en Angel-Saxisch,beneffens het Hedendaegsche Hoog-Duitsch en Yslandsch,vergeleken word,1723）中，先后使用“亲缘关系”和“亲属语言……进行比较”。

受比较解剖学的影响，19世纪初的德国学者在这门学科之前冠名“比较”。1801年，伐特尔（J.S.Vater,1771—1826）在《试论普通语法学》（Versuch einer allgemeinen Sprachlehre）中提出要建立一门“比较语法”（Vergleichende Sprachlehre），展开“语言的比较研究”（Ver gleichende Sprachstudium），以揭示各种语言的结构差异。1803年，奥古斯特·史勒格尔（A.W.Schlegel,1767—1845）在《评伯恩哈迪的 <语法学>》（Of Bernhardi's Sprachlehre）中提出“比较语法”（vergleichende Grammatik），指的是语言亲缘关系比较。1808年，弗里德里希·史勒格尔在《论印度人的语言和智慧》（Überdie Sprache und Weisheit der Indier）中沿用其兄的“比较语法”术语。1851年，英国牛津大学教授缪勒（F.M.Müller,1823—1900）发表《比较语文学》（Comparative Philology）。1874年，英国学者本多尔（Herbert Bendall）将施莱歇尔的《印度日耳曼语诸语比较语法纲要》（3rd German edit.,1870）选译为《印欧语比较语法纲要，尤其是梵语、希腊语和拉丁语》（A Compendium of the Comparative Grammar of the Indo-European,Sanskrit,Greek,and Latin Languages）。整个19世纪到20世纪初，通行术语主要是“比较语法” “比较语文学”。此后，1924年，丹麦语言学家叶斯柏森（O.Jespersen,1860—1943）在《语法哲学》（The Philosophy of Grammar）中使用了“比较和历史语法”（Comparative and Historical Grammar）这一术语。1941年，美国语言学家沃尔夫（B.L.Whorf,1897—1941）在《语言与逻辑》（Languages and Logic）中明确区分了“比较语言学”（Comparative Linguistics）与“对比语言学”（Contrastive Linguistics）。

“历史比较语言学”是当今中文论著中的常见汉译术语。然而就网络检索，英语文献中常见的是Comparative and Historical Linguistics（比较和历史语言学），更常见的是 Comparative Linguistics（比较语言学）或Historical Linguistics（历史语言学）。与汉译术语“历史比较语言学”相对的 Historical Comparative Linguistics 似乎未见，类似的是 Historical and Comparative Linguistics（历史和比较语言学）、Historical-comparative Linguistics（历史—比较语言学），偶见的是 Comparative Historical Linguistics（比较历史语言学）。

这门寻找语言亲缘关系的学科，可以从两方面加以界定：一是“历史的”，突出的本体论（语言历史关系的追溯）；一是“比较的”，强调的是方法论（基于语言要素比较）。早期关键术语“词汇和谐”“语言亲和”“词源和谐”和“亲缘关系”等，关注的是本体论。虽然17世纪中期已经阐明比较方法论，但作为学科名称，“比较语法”“比较语文学”在19世纪初才出现。20世纪40年代替换为“比较语言学”，意在强调方法论。一般而言，“比较语法”“比较语文学”“比较语言学”“历史语言学”“历史比较语言学”在所指学科上等值。

二比较语言学的蜕变

西欧学者的语言历史比较实现了当初的愿望，他们找到了远在东方的故乡——黑海和里海一带的大草原（乌克兰草原，或南俄草原），其远祖是骑马善射的斯基泰人。这一印欧民族及其语言起源假说，如今是立陶宛考古学家金布塔斯（M.Gimbutas.The Prehistory of Eastern Europe,Part I.Mesolithic,Neolithic,and Copper Age Cultures in Russia and The Baltic Area,1956）基于库尔干考古文化提出的库尔干假说。至于英国考古学家伦弗如（A.C.Renfrew.Archaeology and Language:The Puzzle of IndoEuropean Origins.London:Pimlico,1987）基于农业推移提出的安纳托利亚假说，应更为远古的古欧人的来源，即古欧洲曾经存在的、现已几近灭绝的古欧语群（Palaeo-European language stocks）。约在1万年前，从原始采集—渔猎文明中形成早期农耕文化，但是由于北方草原不适合农耕，因此迁徙到这里的族群则形成游牧文化。马的驯化、马车的发明，为远距离迁徙提供了方便，于是其中的一部分重返农耕世界。一次又一次的迁徙和征战，使其语言南下中亚两河流域，向西进入伊朗高原、安纳托利亚和欧洲，向东南进入五条河、印度河和恒河流域。在欧洲，后迁入的原始印欧语与更早进入的古欧语遭遇，尽管印欧语占了上风，然而不同地区的印欧语中却映射出古欧语底层的异质性。可以推定，在欧洲形成的印欧语系的不同语族，除了迁入时期不同，还可能经历了原始印欧语与不同地域古欧语的融合过程。到19世纪中期，在施莱歇尔笔下，印欧语的谱系树画出来了。[3]

然而，当语言历史比较向其他地区推进，成为世界性历史比较语言学之时，却遭遇不同“语言关系类型”的挑战。特别是来到东亚—南洋，由此引发一系列关于语言历史比较的疑难问题。

在《从同源性到亲缘度：历史比较语言学的重大转折—— <汉语的祖先> 译序》[4]中，我曾经讨论了六个问题。

1.基本词汇的可能借用

传统历史比较的默认值是基本词汇不能借用，否则最严格的语音对应规则也不能作为同源证据。然而东方语言的历史比较显示，基本词汇，包括核心词汇也具有借用的可能性，语言的借用、混合和换用在史前已经发生。这一为传统历史比较始料不及的“没有什么语言成分不可能不被借用”的事实，无疑动摇了其基石。而这一似乎不成问题的问题一旦成为问题，必然会将我们抛入同源和借用纠缠不清的深渊。正如在沙加尔（Laurent Sagart,Some remarks on the ancestry of Chinese,1995）和斯塔罗斯金（Sergai Starostin,Old Chinese vocabulary:A historical perspective,1995）的争论中看到的，一方自以为铁证如山的同源，一方却针锋相对地指出是借用。而在互相指责对方用以比较的是借词的同时，却并未从理论方法上确证己方用的绝对不是借词。由此暴露出双方的共同困惑——是否能为辨析远古同源或借用提出都认可的标准，或者如何才能为鉴定远古或史前同源和借用建立参照系?以往一些学者用以泯灭这一界限的“关系词”，至少已经给出部分答案。如果既不可能为辨析同源和借用提出标准，又不愿意在两者的纠缠不清中耗费精力，那么历史比较语言学将走向何方?

2.原始义项的逐步重建

以往用于比较的基本词表（以某种语言的词汇形式为符号，比如斯瓦迪士词表用英语），务必用新的原始义项表（通过构成该义项的语义特征来界定）取代。从义项表的总体设计而言，某一确定的原始义项的建构就是某一确定的史前社会状况及其生态文化的语言符号化重建；从义项表的义项选择而言，某一确定的原始义项都务必进行论证或原始认知建构。原始义项表的建构是分步骤的，并非一开始就奢求世界语言比较的通用性，而应首先基于一定地域的史前文化特点进行建构（甚至要建构不同年代深度的义项表，比如距今10000年、7000年、5000年、3000年）。只有当我们已有几种基于不同地域的原始义项表，才可能通过二次或多次抽取，以建构用以世界范围的通用义项表（某一历史阶段）。

3.词音结构的类型演变

除词音音节结构的缩简演变在一些语言中得以证实以外，其扩展演变同样也可以找到确凿证据。这些新的发现，为不同词音结构类型的语言也可进行历史比较开辟了道路，比如双音节或多音节的南岛语和单音节的古汉语之间。当然，除了词语比对，还需要就词音音节结构的历史演变机制和过程加以阐释。

4.不同词形的多向比较

在具体研究过程中，就某一原始义项进行相关语言的历史比较，不但需要找准音义匹配的对应形式，而且需要解释同一原始义项（可能有几个不同的词形）的其他“非对应语音形式”的来源。而一种语言中的某一原始义项存在不止一个古老形式的现象，则可能反映了该语种形成，以及相关语言的接触和影响的错综复杂性。

5.语义引申比较的探索

语言的本质是语义性，词汇语义中包含着大量的历史信息。任何特定语言中的音义结合体都是一个独具特色的历史事件。一个特定的选择往往出自多种可能性，而每一选择或命名都汇聚着关于语言始源的信息。在此，我们不必提出理想化的语义比较应是相关语言的语义网络比对，就是个别词族的语义引申比较也存在若干问题。迄今，我们对相关语言的语义关系之间如何进行历史比较还知之甚少。尽管白一平（William H.Baxter,“A Stronger Affinity...Than Could have been Produced by Accident”:A Probabilistic Comparison of Old Chinese and Tibeto-Burman,1995）承诺：假如通过明确而非循环的方式解决了语义匹配的游移性，那么语义匹配和语音匹配将具有同等地位。然而，只要一涉足语言的历史语义比较，也就会牵涉史前或新石器时期、金属时期人类的认知结构模式和语义演变途径。

6.历史语料的非自足性

一种语言主体所拥有的文化是一个处于特定时空中的综合体。这一综合体是一系列具有特征的文化因素互相融合而成的有机体。由于原始或远古语言的年代渺渺茫茫，语言历史比较所借助的语言自身资料（有文字记录的最古语言，也就距今5000年前左右）不可能具有自足性。由此决定了语言历史比较需要相关学科，特别是遗传学、人类学、考古学、历史学、民俗学和史前生态学等领域的研究成果，用以支撑和相互验证。

语言的细胞是词汇，其他只是衍生物或装饰品。我没有涉及形态要素和句法结构（其中的未知太多，比如形态要素到底什么时期萌芽的，句法结构的不同类型到底什么时期分化的，其历史肯定比基本词汇要晚得多，甚至也谈不上比基本词汇更稳定），只是基于以上讨论进一步提出历史比较成果的评估程序和世界语言关系的亲缘梯度。语言或语群之间的发生学关系研究结果，需要一定的评估标准与检测程序。尽管这一评估或检测的公认标准或程序尚未出现，但是白一平（Baxter 1995）和斯塔罗斯金（Starostin 1995）还是做了有益的尝试。语言的亲属关系可以分为远亲关系（超级语系）和近亲关系（传统语系）等，或者不同历史阶段和历史层次的亲属关系。基于原始义项以及其他语言结构因素比较的相似度，依据一定的比较标准和评估程序，可以确定不同语言之间的亲缘梯度。

发端于17世纪的西欧历史比较语言学，面对的印欧语是人类历史上典型的分化型语言，不可能对比较语言学的所有理论问题深思熟虑。然而，在随后而来的推进世界性语言关系研究的历史进程中，却遭遇到在印欧语比较中未见的一系列新问题。一方面，基于研究范围的扩大和谱系树模型的膨胀，超级语系的建构实在是传统比较语言学的必然，尽管持传统观点者难以接受；另一方面，超级语系的建构浪潮势必导致比较语言学的研究——从语言的同源论研究转向语言的亲缘度检测。以建构始源语为目标的同源性研究重在定性，而基于相关语言要素统计的亲缘度检测则重在定度。显而易见，如果仍然囿于传统的同源论或谱系树，一定会陷入用以比较的词语究竟是否借用的针锋相对，而亲缘度理念却可避免在目前或可能永远无法解决的问题上纠缠不清。

随着多语种大型语料库的建立，比较语言学将拥有更翔实的资料，其手段将更加先进，比较研究也将进一步深入和量化。然而，语种资料再多，即使参照多方资料和成果有效地进行了始源语的重建——确定了到底哪些是原始核心义项，仍然不能回避其相似性到底哪些源于承传，哪些源于借用。因此，多语种大型语料库的建立和原始核心义项的重建，必然为语言亲缘度研究提供新的坚实基础。

在《亲缘语言学：超级语系建构中的华夏汉语位置》（2008）第七部分“走向新的亲缘比较语言学”中有进一步的阐述。

既然语言的借用、混合和换用在史前就已经发生，那么新石器时期的“借用”可能成为金属时期的“同源”，金属时期的“同源”可能出于新石器时期的“借用”，甚至不排除旧石器晚期人类语言基本相通的可能性。如果既不可能为新石器—金属时期如何辨析二者提出可靠标准，又不愿意在此纠缠不清中耗时费力，那么唯一的出路就是——跳出传统的“同源性”思维定式。

历史比较语言发展到超级语系建构阶段，也就预示着传统历史比较务必改弦更张——从语言的“同源性”研究转向语言的“亲缘度”检测。我在《语言关系类型学：对谱系树理论的超越》[5]中指出，不同语言之间的亲缘关系，并非仅有西方传统历史比较语言学所提出的“谱系树”。谱系树或亲缘分化型，仅仅是世界语言关系学中的一种（或典型的一种）。在旧石器到新石器，再到金属时期的技术进步总背景下，由于经济和文化发展的不平衡性，处于不同地区和不同经济方式状态中的人类语言，逐步分化为不同的语言关系格局：（1）渔猎—采集民型保留着原始性地缘连锁语网；（2）海上游牧民型形成地缘离散型语链或断裂后的语珠；（3）农耕民型的文化扩散突破原始语网，语言推移和互动混合形成地缘同化型语区；（4）游牧民型的远距离迁徙突破原始语网，语言分离和独立发展形成亲缘分化型语系。

因此，“亲缘度理念”可避免在永远无法解决的问题上纠缠不清。然而，到底用怎样来评测语言之间的亲缘度?如能根据当时的考古遗存、生态环境等，建构一份“新石器—金属时期的核心义位系统”，包括区域性核心义位和全球性核心义位，然后基于多语种（包括构拟）基本词汇平行库，就可以通过程序运行和检测标准给出不同语言之间的亲缘度。这一亲缘度大致可划分为四级：（1）紧密亲缘度（传统语系，距今3000—5000年）;（2）稍远亲缘度（超级语系，距今7000年左右）;（3）疏远亲缘度（庞大的超级语系，距今10000年左右）;（4）古远亲缘度（距今20000年以前）。同时，还可为之配备相应的人类基因特征库、考古人类体质特征库、考古文化资料库等作为参考。

语言关系类型学、亲缘度理念、语言关系与基因研究的互证、基于计算机技术的统计语言学，这些都为21世纪的“亲缘比较研究”奠定了理论方法。这一“亲缘度”与传统“同源论”存在若干差别：（1）同源比较坚持同源性，而亲缘比较基于亲缘度；（2）同源比较主要基于传世文献，而亲缘比较包括若干无文字语言，它们在地域分布和数量上远远超过前者；（3）同源比较的基本模型是谱系树，而亲缘比较是多元化模型；（4）同源比较坚持严格的语音对应规则，而亲缘比较采用多边比较方法；（5）同源比较的目标是构拟祖语，而亲缘比较无须构拟祖语；（6）同源比较主要在语言内部，亲缘比较基于跨学科印证，把语言看作文化系统中的个相；（7）同源比较的时间深度最多5000年（以文字出现为上限），而亲缘比较的时间深度可追溯到更古远（基于考古文化学、考古人类学和分子人类学）。换而言之，这一“亲缘比较”已从传统“历史比较语言学”蜕变为“亲缘比较语言学”。在贯通时空的全球视野中追溯人类语言的远祖和演化轨迹，成为当代语言比较的任务。

三关注比较语言学的新进展

一开始提出的两个问题，我要表达的是，作为西方语言学的显学，历史比较语言学在中国学科体系中并非一门学科，也就是有几所高校在语言学及应用语言学博士点下设置历史比较语言学方向。与其他几所高校的博士点不同（他们具有多种语言田野调查的积累，便于从事具体的比较研究），我则另辟蹊径，根据博士生的外语背景聚焦于历史比较语言学理论方法。

2009年，李艳完成博士学位论文《当代历时比较语言学的理论与方法》，其修订稿题名《超级语系：历史比较语言学的新理论》,2012年印行。该专著主要展示的是与汉语有关的假说，包括白保罗与马提索夫的汉藏语系、德里姆的汉—蕃语族、沙加尔的汉—南语系、蒲立本的汉藏—印欧语系、斯塔罗斯金的汉藏—高加索语系，以及格林伯格和中国学者提出的超级语系，同时梳理了当代西方学者语言同源研究的理论和方法。网络上看到评价：

自印欧语系假说开始，语系假说的研究从欧洲发展到亚洲、非洲、美洲等世界各地，各地学者的热情有增无减。但是对于超级语系，却没有受到这样的待遇。进入20世纪中期以来，超级语系研究的热情才被激发起来，但是国内对此了解非常有限。李艳著作的出现，无疑给学界带来福音，方便了国内学者的研究。（豆瓣读书，https://book.douban.com/review/5786488/）

10年以后，李艳的新著《历史比较语言学理论：从同源论到亲缘度》即将付梓。新著进一步探讨国外学者关于世界语言的语系和超级语系假说，如格林伯格的非洲语言四大语系、印度洋—太平洋语系、美洲三大语系、欧亚超级语系，还有其他学者的诺斯特拉语系、南岛语言分类、南亚语言分类、南方大语系，直至世界语言一源论。除此之外，讨论了语言历史比较领域的一些新方法。除了格林伯格的多边比较法，主要介绍了基于相似的量化研究法（词汇统计学、概率模型、计算机化大规模比较法、自动相似性判断程序），基于特征的状态研究法（最大简约法、最大兼容法、最大似然法、贝叶斯分析法、网络模型—完美演化法、贝叶斯程序—生物学演化法、马尔可夫突变模型推断法），基于距离的演化研究法（非加权组平均法、邻接计算法、网络建构法、分离分解法、回答集编程法、分离等级法、快速收敛法）。对国内的学者而言，许多内容难免生疏。直觉告诉我，用建模和数学方法计算语言的相似度或演化史，面对的最大尴尬在于数据的可靠性。人类语言并非人类基因（客观的生理表现），用于比较、统计、计算的语言要素可能存在不确定性（语言学家或研究者的主观认定）。如果处理的是构拟形式，更易失之毫厘、差之千里。当然，也不妨聊备一说。

从语系，到大语系、超级语系，必然走向全球语言“根部一源论”，也就是回到“亚当—夏娃语”或巴比塔变乱之前的语言。1905年，意大利学者特隆贝提（Alfredo Trombetti,1866—1929）出版《语言起源的单元说》（L'unita d'origine del linguaggio），通过比较各种语言的词根试图证明世界语言同出一源。1954年，美国学者斯瓦迪士（M.Swadesh）在《美洲印第安比较语言学的展望和问题》（Perspectives and Problems of Amerindian Comparative Linguistics）中，再次提出世界语言一源论。通过比较新旧大陆的各个语系，他认为，可以证明很多语系之间存在古老的亲缘关系，因而可以合并为超级语系。同样，这些超语系之间也可能有更为古老的亲缘关系——最终世界所有语言同出一源。

1984年，斯塔罗斯金（《Гипотеза о генетических связяхсинотибецкийязык с енисейскими и северокавказскими языками》）提出汉藏语、叶尼塞语和北高加索语存在遗传联系即汉—高超级语系。1991年，尼古拉耶夫（S.L.Nikolaev,Sino-Caucasian Languages in America）证明纳—德内语与汉—高超级语系存在联系。1995年，美国学者本特森和布拉热克（J.D.Bengtson & V.Blažek,Lexica Dene-Caucasica）把巴斯克语和布鲁沙斯基语也纳入其中，扩展为德内—高加索语。而格林伯格把除德内—高加索语系之外的世界语言分为：非洲语言（四个语系）、欧亚语系、印度洋—太平洋语系、美洲印第安语系。

在此基础上，格林伯格的学生再次提出世界语言一源论。1994年，茹伦（M.Ruhlen）发表《语言的起源：追踪母语的进化》（The Origin of Language.Tracing the Evolution of the Mother Tongue），将全球语言调整为12个大（或超级）语系：克瓦桑语系、尼日尔—科尔多凡语系、尼罗—撒哈拉语系、亚非语系、达罗毗荼语系、卡尔特维里语系、欧亚语系、德内—高加索语系、南方大语系、印度洋—太平洋语系、澳大利亚语系、美洲印第安语系。同年，茹伦与本特森发表的《全球词源》（Global Etymologies），从32种语系里找到27个音义近似的词，并构拟了原始词根。依据这些词根，试图证明世界语言一源论。显而易见，这一始源语（如果确实如此）的年代已是距今30000年、50000年之前。而根据语言年代学（基于可以观察的资料）测算，某种语言经过14000年之后，几乎所有的基本词汇被已经陆续被新的词汇所取代。当然这一测算未必可靠，因为与近5000年来的语言变化速度相比，20000万年以前的语言变化相当缓慢。

在我看来，人类语言的“根部一源论”，可以作为我们回顾人类语言由来的悬想（在人类史上是可能的，基于语言要素的论证则是困难的），但在语言学研究上没有太多价值。人类语言演化的复杂性不在于根部一源论，有价值的、值得探索的是近10000年、7000年、5000年（开始又文字记录）、3000年的语言分化、推移、接触、融合、换用。

历史比较语言学，或我称为的“亲缘比较语言学”，从印欧语（Cambrensis 1194,Agricola 1479,Gelenius 1537,Becanus 1569,Vulcanius 1597,Lipsius 1602,Elichmann 1640,Salmasius 1643,Boxhorn 1647abc、1654），到闪—含语（Kuraish 9th C.,Postel 1538,Guichard 1606,Hottinger 1659,Ludolf 1702,Leibniz 1710,Schultens 1738）、乌拉尔语（Münnster 1544,Wexionius 1650,Stiernhielm 1671,Eckhart 1711,Rudbeck the Younger 1727,Sajnovics 1770,Gyármathi 1799）、阿尔泰语（Witsen 1692,Strahlenberg 1730）、南岛语（Reeland 1708）、非洲语（Proyart 1776）、美洲语（Gilij 1782,Edwards 1787），再到汉藏语（Klaproth 1823,Logan,1852,Kuhn 1889,Conradyin 1896,Przyluski 1924）等，从距离扩展的大语系再到远距离的超级语系，最终成为覆盖全球的世界语言根部一源论。研究的年代深度，也从距今几千年，延伸到距今10000年，甚至50000年。

人类总是在寻根。正如日耳曼人的寻根意识驱动了印欧语假说的形成，全球人类的寻根意识，最终催生了人类语言的根部一源论。尽管可以从不同视角对这些宏观研究成果及其方法加以评点，然而，人类的寻根热情不会在乎这些。从方法论来看，语言的亲缘度研究方法，应根据语言的时空定位有所不同。也就是，不可能完全用研究近5000年来语言的亲缘度方法，来评估距今7000年、10000年，甚至50000年的语言亲缘度研究。

要全面而系统地梳理当代历史比较语言学的理论方法，需要阅读大量外语文献，中国学界已经很少有人愿意这样做。而为了拓展视野，了解国际学术现状和趋势，不知这些则未免闭门造车。连“跟着转”都不可能，更何谈所谓创新?当然，面对如此众多的文献资料，要梳理清楚，也难以面面俱到。

李艳2009年从南京师范大学博士生毕业后，一直孜孜不倦、坚持不懈。转眼已历十年。其中2013年，李艳到美国加州大学伯克利分校访学，师从马提索夫教授。每周二集中讨论做项目遇到的问题，受益良多。2018年第一季度，又到法国国家科学院东亚语言研究所短期访学，向沙加尔教授请益。这些都是促进她学术发展的关键点。

多读书，多读原著，多辨伪祛妄；更细心，更沉下心，更深思熟虑——愿以之共勉。

相信本书的出版，有助于开拓中国学者的学术视野，有助于提高中国学者的理论自觉，有助于推进中国语言学的进展。

是为序。

李葆嘉谨识

2019年12月10日于南京千秋情缘

[1]岑麒祥1931—1933年在法国巴黎大学，师从房德里耶斯（Joseph Vendyes,1875—1960）学习普通语言学，师从梅耶学习历史比较语言学。1933年，获法国国家文科硕士学位和语言学高等研究文凭。所译梅耶《历史语言学中的比较方法》,1936年刊于广州中山大学《语言文学专刊》（1卷1—4期）,1957年科学出版社出版单行本。对传播法国历史比较语言学做出了贡献。

[2]这些内容及以下“比较语言学的缘起”，详见李葆嘉等《尘封的比较语言学史：打破琼斯神话》，科学出版社2020年版（即将出版）。

[3]1850年前后，他开始仿照植物学家的树图形以构画语言谱系树（Stammbäume）。1853年，在《原始印欧人的最早分化》（Die ersten Spaltungen des indogermanischen Urvolkes）中为印欧语绘制了一棵有主干、枝杈、树叶的谱系树。1860年，在《德意志语》（Die Deutsche Sprache）中画过一幅说明语言的种和亚种如何从其基础形式产生的谱系图。1863年，在《达尔文理论与语言学》（Die Darwinsche Theorie und die Sprachwissenschaft – offenes Sendschreiben an Herrn Dr.Ernst Haeckel）中的语言谱系树，则用线条代替了树形。

[4]王士元主编：《汉语的祖先》（The Ancestry of the Chinese Language），李葆嘉主译，中华书局2005年版，第1—102页。

[5]原刊于《引玉集：语言学和文献学研究论集》（李葆嘉主编），南京师范大学文学院印行，2000年，第681—701页。收入李葆嘉《理论语言学：人文与科学的双重精神》，江苏古籍出版社2001年版，第19—39页。修改稿《论语言关系类型学及结构类型的演变趋势》，载《大江东去——王士元教授八十岁贺寿文集》（石锋、彭刚主编），香港城市大学出版社2013年版。