应用统计学
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.6 统计学的发展历程

统计的实践活动先于统计学的产生。从结绳记事开始,就有了对自然社会现象的简单计量活动,有了统计的萌芽。统计学产生于17世纪中叶,主要有三个源头:政治算术、国势学和概率论。

1.政治算术学派

统计学的一个源头是英国人威廉·配第(William Petty)的代表作《政治算术》。配第在书中用大量的数字对英国、法国、荷兰三国的经济实力进行比较,分析了造成各国实力差异的原因,并从贸易、税制、分工、资本和利用闲散劳动力等多方面提出了英国的强盛之道。这种用数字、重量和尺度来计量,并配以朴素的图表的做法,正是现代统计学广为采用的方法和内容。马克思评价威廉·配第“在某种程度上可以说是统计学的创始人”。

该学派的另一个知名人物是约翰·格朗特(John Graunt),他对英国伦敦人口的出生率和死亡率进行分类计算,编制了世界上第一张“死亡率”统计表,以死亡率表为依据进行了人口的统计推算预测。遗憾的是,政治算术学派的学者都没有使用“统计学”这个名称,他们的著作有统计学之实,却没有统计学之名。

2.国势学派

该学派产生于18世纪的德国,代表人物是德国人海·康令(H. Conring)和高·阿亨华尔(G. Achenlwall)。康令以叙述国家显著事项和国家政治关系为内容,在大学开设了国势学课程。阿亨华尔把拉丁语Status和意大利语Stato引申为德语Statistika,意思是主要用文字来记述国家应注意的事项的学问。1850年,德国人克尼斯(K. G. A. Knies)在《作为独立科学的统计学》一书中,将“国势学”正式命名为“国家学”,将英国人威廉·配第和约翰·格朗特创立的“政治算术”正式命名为Statistika(统计学)。1787年,英国人齐麦曼(E. A. Zimmrman)把德语Statistika译成英语Statistics(统计学)。

3.古典概率论

古典概率论奠基人包括法国的布莱斯·帕斯卡(B. Pascal)和皮埃尔·德·费马(Pierre de Fermat)。帕斯卡和费马通过通信的方式,将赌博中出现的各种具体问题,归纳为一般的概率原理,为后来概率论和统计学的发展奠定了基础。之后比利时人阿道夫·凯特勒(A. Quetelet)将概率论引入统计学,使统计方法在准确性方面有了质的飞跃。

自17世纪上述几位科学家从不同角度开始了统计学研究后,经过几代统计学家的努力,历经两个半世纪,到19世纪末建成了古典统计学(主要是描述统计学)的基本框架。

20世纪初,大工业的发展对产品质量检验问题提出了新的要求,即只抽取少量产品作为样本对全部产品的质量好坏做出推断。1908年英国人威廉·希利·戈塞特(W. S. Gosset)提出了小样本t统计量,利用t统计量就可以从大量的产品中抽取较小的样本完成对全部产品质量的检验和推断,这样就使统计学进入了现代统计学(主要是推断统计学)的新阶段。以后经过著名统计学家费希尔(R. A. Fisher)给出了F统计量、最大似然估计、方差分析等方法和思想,奈曼(Neyman)和皮尔逊(E. S. Pearson)的置信区间估计和假设检验,到20世纪中叶构筑了现代统计学的基本框架。

从20世纪50年代以来,统计理论、方法和应用进入了一个全面发展的新阶段。一方面,统计学受计算机科学、信息论、混沌理论、人工智能等现代科学技术的影响,新的研究领域层出不穷,如现代时间序列分析、贝叶斯统计、非参数估计、线性统计模型、数据挖掘等。另一方面,统计方法的应用领域不断扩展,几乎所有的科学研究都离不开统计方法。因为不论是自然科学、工程技术、农学、医学、军事科学,还是社会科学都离不开数据,要对数据进行研究和分析就必然用到统计方法,现在连纯文科领域的法律、历史、语言和新闻都越来越重视对统计数据的分析,因而可以说,统计方法与数学、哲学一样是所有学科的基础。

相关链接

统计方法与《红楼梦》

《红楼梦》一书共120回,一般认为前80回为曹雪芹所著,后40回为高鹗所续。长期以来,红学界对这个问题一直有争议。争议最大的是关于后40回的作者到底是谁,有人认为是曹雪芹,有人认为是高鹗,还有人认为是高鹗和其他人所写。1986年,复旦大学李贤平教授带领他的学生用统计方法进行了研究,他们创造性的想法是将120回看作120个样本,然后将与情节无关的虚词作为变量,让学生数出每一回虚词出现的次数,以此为数据,用统计分析中的聚类分析方法进行分类。之所以要抛开情节,是因为在一般情况下,同一情节大家描述得都差不多,但由于个人写作特点和习惯不同,所用虚词可能是不一样的。聚类结果将120回分成两组,即前80回为一类,后40回为另一类。将前80回代表的组与没有争议的曹雪芹其他作品中的虚词进行对比,发现两者间没有显著差异,证实前80回是曹雪芹所著。同时,将前80回与后40回进行对比,发现它们之间存在显著的差异,证明《红楼梦》并非出自曹雪芹一人的手笔。而后40回是否为高鹗所写呢?将后40回代表的组与没有争议的高鹗其他作品中的虚词进行对比,论证结果推翻了后40回为高鹗一人所写的结论。这个论证在红学界轰动很大。统计分析的方法支持了红学界的观点,这使红学界大为感叹。

资料来源:圣才学习网