前言
我们生活在一个数据时代,在实际工作和科学研究过程中会产生大量的数据。如何把隐藏在一大批看起来杂乱无章的数据里的信息、规律、关键点萃取出来,是研究者应该了解,甚至应该深入研究的学问。这不仅需要一定的统计学知识,而且需要用统计分析工具将结果呈现出来。Excel已经是很多人比较熟悉的一个数据处理工具了,对广大业余研究者而言,舍近求远或者重起炉灶去学习、掌握专业的统计分析工具(如SPSS),无疑是不太明智的。即便是专业研究者,已经掌握了“高大上”的专业统计分析工具,手边有一个简单易用、随手可用的数据统计分析工具也不是多余的。
长期以来,Excel未能很好地进入统计分析领域,这可能与一些研究者缺乏统计学知识和高效计算工具有关。计算机性能的突飞猛进,Excel的诞生与发展,已经很好地解决了计算难题。Excel历经30多年的开发,已经相当成熟,可以轻松计算数量庞大的数据。比起专业的统计软件,非专业人士对Excel更容易上手,更容易深入,更可能融会贯通,也就能更好地应对实际工作和科学研究数据的统计分析了,而且研究者明白其中过程,不至于像专业统计软件那样被“蒙在鼓中”。“工欲善其事,必先利其器”,应用Excel的多项高级功能、多达400多个函数、可以自由编程的VBA程序,按照统计学原理建立数据间的逻辑联系,研制出解决统计分析问题的一个个有针对性的模板,会有力地提高科学研究的统计分析水平和效率,使科学研究结论具有统计理论支撑的“含金量”,具有一定显著性水平的统计学意义,使定性分析具有定量分析的扎实基础。Excel相当于在统计理论与科学研究之间修筑了一座四通八达的宏伟立交桥,鸿沟填平了,高墙推倒了,理论接地气了,“而今迈步从头越”,统计理论自当“风物长宜放眼量”。
本书按照统计学的理论脉络搭建骨架,按照原理、实例的方式丰富血肉。原理部分尽量简明、通晓,不追求公式的繁杂推理过程,没有统计学基础的读者,不至于因为艰涩难懂的统计理论而萌生去意。实例部分先给出经典例子,再分析解题思路,最后呈现详细的实现方法与步骤。读者即便“依样画葫芦”,也能习得一招半式,从而解决学习、工作和科学研究中的统计分析问题。本书篇幅长,内容多,堪为基于统计学的Excel统计分析大全。
第1章 背景知识 主要介绍统计学和Excel 2016的背景知识,为读者学习本书抛锚定基。
第2章 统计表 对统计表进行概述,重点介绍各类次数分布表及数据的单条件求和与多条件求和。
第3章 统计图 对统计图进行概述,重点介绍次数分布图、常用的统计图表以及Excel 2016新增统计图表的制作要领,概率分布图则在专门章节介绍。
第4章 统计量 介绍集中量数、差异量数、地位量数等常用的统计量,介绍数据的分布形态、描述统计工具。
第5章 概率及其分布 介绍概率的基本知识,重点介绍排列组合和包括二项分布、泊松分布、正态分布在内的三大概率分布。
第6章 抽样及其分布 介绍随机抽样中的简单随机抽样、等距随机抽样、分层随机抽样及包括卡方分布、𝑡分布、𝐹分布在内的三大抽样分布。
第7章 参数估计 介绍总体均值及其差异、总体标准差及方差、总体比率及其差异、总体相关系数的区间估计。
第8章 假设检验 关于参数的假设检验,介绍对总体均值、总体比例、总体方差、总体相关系数的假设检验。
第9章 方差分析 介绍方差分析的基本原理、方差分析中的齐性检验、单因素方差分析、多因素方差分析,以及事后检验、数据转换等内容。
第10章 相关分析 介绍通过图表、函数公式、“协方差”工具、“相关”工具对积差相关、等级相关、质与量相关、品质相关、复相关、偏相关进行分析和检验。
第11章 回归分析 介绍一元线性回归、多元线性回归及可化为线性回归的一元曲线回归。
第12章 非参数检验 介绍符号检验法、符号秩检验法、中数检验法、秩和检验法、秩次方差检验法的实现方法。
第13章 主成分分析与因子分析 介绍主成分分析和因子分析的实现方法。
第14章 聚类分析 介绍系统聚类法、模糊聚类法的原理和实现方法。
第15章 判别分析 介绍对两组样品的距离判别、贝叶斯判别及费希尔判别的实现原理与方法。
第16章 预测分析 介绍移动平均法、指数平滑法、季节变动预测法、灰色预测模型、马尔可夫预测法等预测分析方法。
第17章 层次分析 介绍在决策元素分解为目标、准则、方案等层次基础之上的定性和定量分析相结合的决策原理与方法。
本书具有如下特色。
- 内容丰富。以Excel 2016为平台,既包含通过图示、求典型量数等手段对数据资料进行分析和描述的描述统计,又包含在一定置信度下对数据进行统计检验、统计分析和非参数检验的推断统计,还包含对多变量进行统计分析的多元统计。本书既有简明的统计原理,又有大量的实例和方法。
- 结构严谨。本书以统计学理论脉络为骨架,以实例为血肉。结构上逻辑清晰,层次分明,层层递进,由浅入深,承前启后,前后呼应,知识性与实用性相得益彰,有助于读者在一本书里就能比较系统地学习到统计知识和Excel技术。
- 案例经典。本书的很多案例来源于统计学教材的经典例子。呈现例子后,马上分析解题思路,再通过Excel图表和表格呈现实现方法与步骤。通过案例,使读者不仅知其然,还知其所以然,深刻理解统计原理与方法,有助于在实际场景中应用统计分析方法。一些数据文件,基本上就是统计分析模板。
- 一题多解。统计量公式往往有多个推演公式,Excel有丰富的图表、内置函数和功能强大的数学分析工具以及处理数据的其他有效方法,这就为解决统计分析问题提供了多种手段和方法。本书尽量做到一例多用,一题多解,使读者举一反三、触类旁通、融会贯通,全方位、立体地分析和思考问题。
学习本书,需要注意以下几点。
- 统计符号的问题。在各版本的统计学著述中,统计符号不太规范统一,大量存在同一符号有不同指代的问题,给阅读和理解带来困扰。本书也难以做到完全规范统一,请读者结合场景理解。
- 得数显示的问题。Excel精度设置的高低,可能导致计算结果小数点后几位显示的不一致。列的字符宽度不够,也可能因四舍五入导致实际得数与显示的得数不一致。
- 公式填充的问题。活动单元格右下角的小方块,光标移至其上时,光标会变成小十字,Excel称此小方块为填充柄。利用填充柄可拖动鼠标左键向相邻单元格填充数据(包括公式),或双击鼠标左键向下填充。由于填充时的方向是向相邻单元格,所以本书称之为“填充”,而不称之为“复制、粘贴”。填充公式的方向,一般为向右、向下或二者兼之。
- 表格布局的问题。用Excel进行数据处理非常直观,其表格就像一张演算稿纸,算式可以放在人们认为方便的地方,只要相对引用位置不出错就行。为让读者有全局观,很多实例都多表合一,一气呵成,不给人支离破碎的感觉。一般来说,剪切、粘贴表格公式不会影响计算结果。为减少文件个数,多数章节的实例被安排在一个工作簿的若干工作表中。本书实例,读者可以扫描右侧二维码下载。
除封面署名人员之外,参与本书编写的人员还有敖杰、陈洪彬、代利、戴世敏、邓鸿健、邓丽红、邓丽梅、贺长虹、胡艳丽、黄均兰、李丹、李锦兰、李锦玉、李君、李宣琴、刘柏林、刘荣祺、罗尚金、容美霞、唐洪、王光美、王珊、王辛然、巫海燕、吴青利、吴长福、肖萧、徐勇、杨勇、张集、张燕。其中,敖杰编写了第2章,陈洪彬编写了第3章,戴世敏编写了第4章,贺长虹编写了第5章,李宣琴编写了第6章,刘柏林编写了第8章,刘荣祺编写了第9章,罗尚金编写了第10章,王珊编写了第11章,王辛然编写了第13章,吴青利编写了第14章。
在本书的编写过程中,借鉴了一些网上资料,无法一一标出出处,在此向资料的作者表示谢意。
本书难免会有疏漏,欢迎读者通过清华大学出版社网站(www.tup.com.cn)与我们联系,帮助我们改正提高。
感谢您的使用。
张运明