自主创新与甘肃现代农业发展研究
上QQ阅读APP看书,第一时间看更新

第三节 农业自主创新能力综合评价模型与方法

一 自主创新能力评价方法

自主创新能力评价的方法较多,主要包括层次分析法、多元统计分析方法、数据包络分析方法、灰色理论分析方法。

(一)层次分析方法

层次分析法(Analytic Hierarchy Process, AHP)是美国运筹学家匹兹堡大学教授托马斯·塞蒂(T. L. Saaty)于20世纪70年代初,在为美国国防部研究“根据各个工业部门对国家福利的贡献大小而进行电力分配”课题时,应用网络系统理论和多目标综合评价方法提出的一种层次权重决策分析方法。层次分析方法适用于复杂层次结构的多目标决策分析,一般根据需要评价目标影响因素的复杂程度,在评价目标与评价指标之间分3—4级:目标层、准则层、因素层以及指标层。通过定量和定性数据,获得各项指标的测度值,并将其标准化,做无量纲处理。最后得出评价目标的综合得分。

层次分析法的缺点是不能为决策提供新方案。层次分析法的作用是从备选方案中选择较优者。在应用层次分析法的时候,存在的情况是自身创造能力不够,造成我们只能在自己想出来的众多方案里选出一个最好的。而对于大多数的决策者而言,如果分析工具能分析出在已知的方案里的最优者,然后指出方案的不足,或者再提出改进方案的话,这种分析工具才是比较完美的。

(二)多元统计分析方法

多元统计分析主要是应用主成分分析、因子分析、聚类分析等方法对一些对象进行分类和评价。

1.主成分分析

主成分分析是一种数学变换的方法,它把给定的一组相关变量通过线性变换转成另一组不相关的变量,这些新的变量按照方差依次递减的顺序排列。在数学变换中保持变量的总方差不变,使第一变量具有最大的方差,称为第一主成分;第二变量的方差次大,并且和第一变量不相关,称为第二主成分。依次类推,n个变量就有n个主成分。

主成分分析是一种降维的方法,便于分析问题,但在实际分析中需要注意以下问题:(1)明确和判断该数据降维的条件是否成立;(2)主成分系数的平方和是否为1;(3)明确和判断所用数据是否适合做单独的主成分分析;(4)选取的主成分对原始变量是否具有代表性。

2.因子分析

因子分析(Factor Analysis)是一种常用的多元统计分析方法,其功能在于简化观测系统、减少变量个数,用少量共性指标解释整个系统。因子分析从研究多个指标之间的相互依赖关系入手,在尽量保持原有信息完整性的前提下,寻找少量能够控制所有变量的公因子,以体现原始变量与公因子之间的关系。最后计算主要指标的合理权重,依照公因子得分对每个样本对象进行综合评价。

在算法上,因子分析与主成分分析很相似,不过在因子分析中所采用的协方差矩阵的对角元素不再是变量的方差,而是和变量对应的共同度(变量方差中被各因子所解释的部分)。和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好地解释。如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这种情况也可以使用因子得分做到。所以这种区分不是绝对的。

3.聚类分析

聚类分析是直接比较各事物之间的性质,将性质相近的归为一类,将性质差别较大的归入不同类的分析技术。

传统的聚类算法已经比较成功地解决了低维数据的聚类问题。但是由于实际应用中数据的复杂性,在处理许多问题时,现有的算法经常失效,特别是对于高维数据和大型数据的情况。传统聚类方法在高维数据集中进行聚类时,主要遇到两个问题:(1)高维数据集中存在大量无关的属性使得在所有维中存在簇的可能性几乎为零;(2)高维空间中数据较低维空间中数据分布要稀疏,其中数据间距离几乎相等是普遍现象,而传统聚类方法是基于距离进行聚类的,因此在高维空间中无法基于距离来构建簇。

(三)数据包络分析方法

数据包络分析方法(Data Envelopment Analysis, DEA)和模型是1976年由美国的库珀(Cooper)等人首先提出的。它用来对多投入、多产出的多个决策单元的效率进行评价,用来比较提供相似产出的产出单位之间的效率。DEA是一种非参数的评价方法,其实质是根据一组关于输入—输出的观测值来确定有效生产前沿面。

DEA的优点是科研评价输入、输出书面都有很多的对象,并且DEA可以给出有益的管理信息,以指导各个单位改进工作方式和提高管理水平。缺点是DEA是相对效率的评价,它不能对某一对象的绝对效率进行评价,不能表明对象的实际技术水平。

(四)灰色理论分析方法

灰色理论分析法是邓聚龙教授提出的。目前一些灰色理论方法已用于技术创新能力评价中,如灰色关联分析、灰色聚类分析。灰色关联分析就是根据因素之间发展趋势的相似或相异程度,亦即“灰色关联度”,作为衡量因素间关联程度的一种方法。灰色聚类分析实质上是构建灰色相似关系矩阵,反映分析对象中各元素之间的亲疏关系。

本章主要采用多元统计分析的因子分析方法。

二 因子分析法

因子分析是一种数据简化的技术。它通过研究众多变量之间的内部依赖关系,探求观测数据中的基本结构,并用少数几个假想变量来表示其基本的数据结构。这几个假想变量能够反映原来众多变量的主要信息。原始的变量是可观测的显在变量,而假想变量是不可观测的潜在变量,称为因子。

(一)因子分析模型

Xii=1, 2, …, p)有p个变量,表示为:

Xi=ai1F1+…+aimFm+εimp

F1, F2, …, Fm为公共因子,是不可观测的变量,它们的系数称为因子载荷。εi是特殊因子,是不能被前m个公共因子包含的部分。并且满足:

(1)cov(F, ε),F, ε即不相关;

(2)F1, F2, …, Fm互不相关,方差为1,即:

(3)互不相关,方差不一定相等,εiN(0, ),即:

(二)因子载荷矩阵中的几个统计特征

(1)因子载荷aij是第i个变量与第j个公共因子的相关系数,反映了第i个变量与第j个公共因子的相关性。

(2)变量共同度的统计意义。变量Xi的共同度是因子载荷矩阵的第i行元素的平方和,记为

,即所有的公共因子和特殊因子对变量Xi的贡献为1。如果非常靠近1,非常小,则因子分析的效果好,从原变量空间到公共因子空间的转化性质好。

(3)公共因子F方差贡献的统计意义。因子载荷矩阵中各列元素的平方和为所有的Fjj=1, …, m)对Xi的方差贡献和。衡量Fj的相对重要性。

(三)因子分析的步骤

因子分析有两个核心问题:一是如何构造因子变量;二是如何对因子变量进行命名解释。因子分析有下面四个步骤。

1.确定待分析的原有若干变量是否适合于因子分析

因子分析是从众多的原始变量中构造出少数几个具有代表意义的因子变量,这里面有一个潜在的要求,即原有变量之间要具有比较强的相关性。如果原有变量之间不存在较强的相关关系,那么就无法从中综合出能反映某些变量共同特征的少数公共因子变量。因此,在因子分析时,需要对原有变量做相关分析。最简单的方法就是计算变量之间的相关系数矩阵。如果相关系数矩阵在进行统计检验中,大部分相关系数都小于0.3,并且未通过统计检验,那么这些变量就不适合进行因子分析。

2.构造因子变量

因子分析中有多种确定因子变量的方法,如基于主成分模型的主成分分析法和基于因子分析模型的主轴因子法、极大似然法、最小二乘法等。其中基于主成分模型的主成分分析法是使用最多的因子分析方法之一。下面以该方法为对象进行分析。

主成分分析通过坐标变换手段,将原有的p个相关变量xi做线性变化,转化为另外一组不相关的变量yi,可以表示为:

y1, y2, y3, …, yp为原有变量的第一、第二、第三……第p个主成分。其中y1在总方差中占的比例最大,综合原有变量的能力也最强;其余主成分在总方差中占的比例逐渐减少,也就是综合原变量的能力依次减弱。主成分分析就是选取前面几个方差最大的主成分,这样既达到了因子分析较少变量个数的目的,同时又能以较少的变量反映原有变量的绝大部分信息。主成分分析的步骤如下:

第一,数据的标准化处理。

,其中,i =1, 2, …, n, n为样本点数,j =1, 2, …, p, p为样本原变量数目。

第二,计算数据的协方差矩阵R

第三,求R的前m个特征值:λ1λ2λ3≥…≥λm,以及对应的特征向量u1, u2, …, um,这些特征向量是标准化正交向量。

第四,求m个变量的因子载荷矩阵。

3.旋转使得因子变量更具有可解释性

进行因子分析的数学目的不仅仅是要找出公共因子以及对变量进行分组,更重要的是要知道每个公共因子的意义,以便进行进一步的分析。如果每个公共因子的含义不清,则不便于进行实际的解释。因子旋转的目的是使因子载荷矩阵的结构简化,使各个因子的载荷值尽可能地向0和1两个极值转化。因子旋转的主要方法有:四次方最大法、方差最大法和等量最大法,本章分析采用方差最大法。

4.计算因子变量的得分

计算因子得分是因子分析的最后一步。因子变量确定以后,对每一样本数据,希望得到它们在不同因子上的具体数据值,这些数值就是因子得分,它和原变量的得分相对应。有了因子得分,在以后的研究中,就可以针对维数少因子得分来进行。

Fj=βj1x1+βj2x2+…+βjpxpj=1, 2, …, m

估计因子得分的方法有回归法、Bartlett法、Anderson-Rubin法等,本章采用回归法。