自然语言交流的计算机模型
上QQ阅读APP看书,第一时间看更新

1.2  验 证 原 则

我们的自然语言交流理论是一套功能型理论,是一套用于高效计算机程序及其相关硬件的陈述性规范说明。陈述性规范说明描述了软件的必要特征,如外部界面、数据结构和算法。计算机模型的偶然性注14特征,如程序语言的选择或者程序员的风格偏好等,不在陈述性规范说明之内。

和逻辑学的代数定义(algebraic definition)注15不同,陈述性规范说明并不完全基于集合理论,而是从程序化的角度,指明输入输出条件下确保系统功能稳定的各成分的一般构造条件。陈述性规范说明必须具有普遍性,提供坚实的数学基础和框架,同时也必须足够详细,能够在不同环境下满足轻松编程的需要。

陈述性规范说明是必要的,因为计算机代码不容易被人理解。以高级编程语言,如Lisp,写成的程序只适合给专家看。一般读者感兴趣的只是软件如何实现其功能的概括性说明。

投入某一具体应用的陈述性规范说明文件有两个层次:(i)一般理论框架(如自然语言交流的功能体系),(ii)一般理论框架的具体化应用(如应用到英语、德语、韩语或者任何其他语言)。反过来,与具体应用相结合的理论框架可以通过(iii)各种不同的,用Lisp语言、C语言或者Java语言等编写出来的操作程序来实践,例如:

1.2.1  陈述性规范说明与实践操作之间的关系

陈述性规范说明可以在必要特征等价的前提下应用于不同的实践操作。数据库语义学的陈述性规范说明还在不断发展,它要求至少有一个最新的实践来自动验证该理论在现阶段的功能,检验理论对于范围不断扩大的各种任务的解决能力。这样才能发现理论在现阶段出现的错误、不完备性以及其他弱点(形成明确假说,见FoCL’99,7.2.3)。这是改进陈述性规范说明,使之进入下一个高级阶段的前提。

理论发展和自动检验相互促进正是数据库语义学(DBS)的验证方法。它虽然不同于自然科学的定量方法(可重复性实验),以及数学的逻辑公理方法(一致性证明),但又与之兼容。

数据库语义学的验证方法注16非常重要,原因有以下几点:第一,自然语言符号是约定俗成的,不适合采用自然科学的定量方法。第二,语言学和相关领域(如语文学)的分析流派众多,很难开展对比评估。