首都经济贸易大学统计学院432统计学[专业硕士]历年考研真题及详解
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2012年首都经济贸易大学432统计学[专业硕士]考研真题及详解

一、单项选择题(本题共30小题,每小题2分,共60分)

1某机构调查居民幸福感,将幸福感设定为“非常幸福”“比较幸福”“一般”“不太幸福”和“很不幸福”,则“幸福感”是(  )。

A.分类变量

B.顺序变量

C.定距变量

D.定比变量

【答案】B

【解析】顺序变量是说明事物有序类别的一个名称,其取值是顺序数据。本题将“幸福感”分为5个类别,并进行了排序,因此属于顺序变量。

2为了研究北京市财政支付能力,从北京统计年鉴搜集到历年北京市财政支出额数据,则该数据是(  )。

A.原始数据

B.二手数据

C.观察数据

D.实验数据

【答案】B

【解析】二手数据是指已经经过加工整理的统计数据,能够在一定程度上说明总体现象。二手数据的来源有:公开出版的统计数据,主要来自官方的统计部门和政府、组织、学校、科研机构。如:《中国统计年鉴》《人口普查资料汇编》《北京市统计年鉴》《世界发展报告》等;尚未公开发表的统计数据,如各企业的经营报表数据、专业调查咨询机构未公开发布的调查结果数据。

3某企业有日产A产品50件的设备200台,企业质检部门为了了解该设备所生产的产品的质量,从200台设备中随机抽取10台,由这10台设备生产的500件产品构成样本,这种抽样方法是(  )。

A.简单随机抽样

B.分层抽样

C.系统抽样

D.整群抽样

【答案】D

【解析】整群抽样是先将总体中若干单位合并为组,这样的组称为群,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。本题中,先将200台设备看成200个群,然后直接抽取10台,即10个群,最后对这10台设备生产的500件产品全部实施调查,因此这种抽样方法属于整群抽样。

4某证券公司为调查民众的投资意向,进行了问卷调查。以下问题中,你认为不合适的问项是(  )。

A.现在稍有知识的人都在投资股票,请问您投资股票了吗?

B.您现在持有股票吗?

C.您认为现在是入市的好时机吗?

D.您认为未来三个月内股市会持续繁荣吗?

【答案】A

【解析】A项中“现在稍有知识的人都在投资股票”带有诱导性,不适合作为选项。

5下列各项中属于抽样误差的是(  )。

A.由于访问员记录错误产生的误差

B.由于被调查人对所问问题理解不准确产生的误差

C.由于被调查人拒绝回答造成的误差

D.由于样本的随机性产生的误差

【答案】D

【解析】抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差。ABC三项均属于非抽样误差。

6下面所列统计图中,适用于展示定性数据的是(  )。

A.茎叶图

B.条形图

C.雷达图

D.直方图

【答案】B

【解析】条形图是用宽度相同的条形的高度或长度来表示数据多少的图形。ACD三项都是用于展示定量数据的图示方法。

7某次考试学生成绩分布如下图所示,最低分数出现在哪个科目(  )。

A.数学

B.物理

C.语文

D.英语

【答案】C

【解析】箱线图是由一组数据的最大值、最小值、中位数、两个四分位数这五个特征值绘制而成的。从下往上依次是最小值、下四分位数、中位数、上四分位数、最大值。因此,据图可知,最低分数出现在语文这个科目。

8下列各项中,最容易受到极端值影响的是(  )。

A.极差

B.四分位差

C.异众比率

D.方差

【答案】A

【解析】极差是一组数据的最大值与最小值之差,最容易受极端值的影响,因此,不能准确描述出数据的分散程度。四分位差是上四分位数与下四分位数之差,反映了中间50%数据的离散程度。异众比率是指非众数组的频数占总频数的比例,主要用于衡量众数对一组数据的代表程度。方差是各变量值与其平均数离差平方的平均数。

9能够度量数据分散程度的统计量是(  )。

A.众数

B.中位数

C.均值

D.方差

【答案】D

【解析】数据的分散程度反映的是各变量值远离其中心值的程度。描述数据分散程度的测度值主要有异众比率、四分位差、方差和标准差、极差、平均差、离散系数等。ABC三项均是度量数据集中程度的统计量。

10某保险公司为了研究投保人的年龄构成情况,得到了四个数据的分布,分别是:所有投保人的年龄分布;所有投保人的保额分布;随机抽取的30人的年龄分布;多次抽样得到的样本平均年龄的分布,这四个分布中属于抽样分布的是(  )。

A.

B.

C.

D.

【答案】D

【解析】由样本统计量所形成的概率分布就是抽样分布,如样本均值的分布,样本比例的分布等。

11在估计总体均值时,下列各项中属于随机变量的是(  )。

A.总体均值

B.置信区间

C.置信水平

D.样本均值分布

【答案】D

【解析】由于样本是随机变量,而统计量是样本的函数,因此样本统计量是随机变量。样本均值分布是由样本统计量所形成的概率分布,因此也属于随机变量。

12在一项消费者口味偏好的调查研究中,随机抽取了200名饮料的消费者,调查他们对两种品牌饮料口味的满意度,并进行了假设检验,其零假设是消费者对两种饮料没有偏好。如果满意度使用10分制打分,得到饮料甲平均得分为7分,饮料乙平均得分为5分,计算伴随概率P-值为0.001,因此研究人员做出了拒绝零假设的结论,下面说法正确的是(  )。

A.犯弃真错误的概率等于0.001

B.犯取伪错误的概率等于0.0001

C.犯弃真错误的概率不大于0.001

D.犯取伪错误的概率不大于0.001

【答案】C

【解析】P-值就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率,也即利用样本观察值能够作出拒绝原假设的最小显著性水平。犯弃真错误的概率为显著性水平α。因此,当P-值为0.001时说明犯弃真错误的概率不大于0.001。

13某调查公司分析员根据调查资料得到某商品销售量与居民可支配收入之间的回归方程为:01x,在对回归系数1的显著性检验时,使用的检验统计量为(  )。

A.z

B.t

C.x2

D.F

【答案】B

【解析】回归分析中的显著性检验主要包括两方面的内容:线性关系检验(F检验);回归系数的检验(t检验)。

14为了研究两变量间的关系,计算其相关系数r=0,说明两变量间(  )。

A.存在相关关系

B.存在函数关系

C.无线性相关关系

D.不相关

【答案】C

【解析】相关系数r仅仅是两变量之间线性关系的一个度量,它不能用于描述非线性关系。这意味着,r=0只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。变量之间的非线性相关程度较大时,就可能会导致r=0。

15某产品产量与单位成本的回归模型为y=β0+β1x+ε,依据样本数据拟合的回归方程为01x,则两个等式中属于随机变量的是(  )。

A.β0

B.β1

C.

D.0

【答案】D

【解析】由于样本是随机变量,而统计量是样本的函数,因此样本统计量是随机变量。题中0属于样本统计量,因此是随机变量。β0和β1是模型的参数,而参数是未知的常数,因此不属于随机变量。是估计值。

16为了分析不同时段对车辆通行时间的影响,进行了方差分析,结果为拒绝原假设,则说明(  )。

A.不同时段对车辆通行时间没有影响

B.不同时段对车辆通行时间存有影响

C.各不同时段车辆通行时间均存在显著差异

D.各不同时段车辆通行时间均相同

【答案】B

【解析】方差分析是指通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。原假设为:H0:μ1=μ2=…=μk(自变量对因变量没有显著影响),备择假设为:H1:μ1,μ2,…,μk不全相等(自变量对因变量有显著影响)。因此,本题中结果为拒绝原假设,说明接受了备择假设,即不同时段对车辆通行时间存有影响。

17为研究高考成绩对大学成绩的影响,打算利用最小平方法拟合回归方程01x,最小二乘法估计回归方程的出发点是(  )。

A.

B.

C.

D.

【答案】B

【解析】最小二乘法是通过使因变量的观测值yi与估计值i之间的离差平方和达到最小来估计参数β0和β1的方法。

18利用最近k期发展水平的平均值作为下一期预测值的预测方法是(  )。

A.移动平均法

B.指数平滑法

C.线性趋势法

D.非线性趋势法

【答案】A

【解析】简单移动平均法是将最近k期发展水平的数据加以平均,作为下一期的预测值。指数平滑法是通过对过去的观察值加权平均进行预测的一种方法,该方法使t+1期的预测值等于t期的实际观察值与t期的预测值的加权平均值。线性趋势法是运用最小平方法进行预测,用直线斜率来表示增长趋势的一种外推预测方法。

19某企业2006年、2007年和2008年销售额环比增长速度分别为10%、15%、20%,则2008年相比于2005年的增长速度为(  )。

A.

B.(1+10%)×(1+15%)×(1+20%)

C.

D.(1+10%)×(1+15%)×(1+20%)-1

【答案】D

【解析】设2005年、2006年、2007年、2008年的销售额发展水平分别为y1,y2,y3,y4,根据已知条件可知(y2-y1)/y1=10%,(y3-y2)/y2=15%,(y4-y3)/y3=20%

则有2006年、2007年和2008年销售额环比发展速度为y2/y1=110%,y3/y2=115%,y4/y3=120%,因此2008年相比于2005年的增长速度为

20某企业同类产品销售量比去年增长10%,销售价格下降10%,则销售额(  )。

A.不变

B.增长

C.下降

D.不确定

【答案】C

【解析】销售额=销售价格×销售量,当销售量比去年增长10%,销售价格下降10%时,销售额变为(1-10%)(1+10%)=0.99,即销售额与去年相比下降了1-0.99=1%。

21某企业产品销售价格指数为

则该指数为(  )。

A.平均指数

B.个体指数

C.数量指数

D.综合指数

【答案】A

【解析】价格指数

属于算术平均指数。

22某企业历年产品产量如下表所示:

为了预测该企业产品产量的变动趋势,应建立的趋势模型为(  )。

A.=b0+b1t

B.=b0b1t

C.=K+b1t

D.

【答案】A

【解析】对于年度资料时间序列,若其逐年增长量又称环比增长量大致相等,则应采用直线趋势模型;若其逐年发展速度即环比发展速度大致相等,则应采用指数曲线趋势模型;若其二级增长量即环比增长量大致相等,则应采用二次曲线趋势模型;若其环比增长量的环比发展速度大致相等,则应采用修正指数曲线模型。从表中产量的数据可以看出,该企业历年产品产量的环比增长量依次为:20、18、23、21、19、23、20、18、20、18,大致相等,因此应建立的趋势模型为线性趋势模型。

23在总体均值的抽样推断中,不会影响到必要样本容量的是(  )。

A.总体方差

B.总体均值

C.抽样方式

D.置信度

【答案】B

【解析】设E代表所希望达到的估计误差,则确定必要样本容量的公式为:

从公式中可以看出,总体均值不会影响到必要样本容量。

24设事件A与事件B独立,且P(A)=0.4,P(B)=0.8,则P(AB)=(  )。

A.0.4

B.0.8

C.0.6

D.0.32

【答案】D

【解析】事件A与事件B独立,则有P(AB)=P(A)P(B)=0.4×0.8=0.32。

25设某运动员投篮命中率为0.8,则其一次投篮投中的数学期望为(  )。

A.0.16

B.0.2

C.0.5

D.0.8

【答案】D

【解析】记X为一次投篮投中的次数,则X的概率分布列为:

则该运动员一次投篮投中的数学期望为E(X)=0×0.2+1×0.8=0.8。

26设A,B为两个事件,若P(AB)=0,且P(A+B)=1,则事件A与B的关系为(  )。

A.相等

B.互斥

C.对立

D.独立

【答案】C

【解析】P(AB)=0,则有A∩B=∅,即事件A与事件B互斥。P(A+B)=1,则有A∪B=Ω,即事件A与事件B构成必然事件。根据构成对立事件的充要条件可知,事件A与B为对立事件。

27设A⊂B,P(A)=0.1,P(B)=0.5,则P(A∪B)=(  )。

A.0.05

B.0.1

C.0.5

D.0.6

【答案】C

【解析】A⊂B,则有P(A∪B)=P(B)=0.5,P(A∩B)=P(A)=0.1。

28设A与B是两个互斥事件,下列各项中正确的是(  )。

A.P(A∪B)=P(B)

B.P(A|B)=P(B)

C.P(AB)=0

D.P(AB)=P(A)P(B)

【答案】C

【解析】A与B是两个互斥事件,则有A∩B=∅,即P(AB)=0。A项:P(A∪B)=P(A)+P(B)-P(AB)=P(A)+P(B);B项:P(A|B)=P(AB)/P(B)=0;D项:若事件A与B互为独立事件,则有P(AB)=P(A)P(B)。

29为研究北京市城镇居民的收入状况,在北京市城镇居民中随机抽取800户进行调查,计算得到其户均月收入为4180元。此“户均月收入”属于(  )。

A.参数

B.统计量

C.估计值

D.样本容量

【答案】B

【解析】统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。根据统计量的特点可知,本题中的“户均月收入”属于统计量。

30若随机变量X~N(μ,σ2),则X的密度函数f(x)的曲线拐点出现在(  )处。

A.x=0

B.x=μ

C.x=μ±σ

D.x=π

【答案】C

【解析】X的密度函数f(x)的图像是一条钟形曲线,中间高、两边低、左右关于μ对称,μ是正态分布的中心,且在x=μ附近取值的可能性大,在两侧取值的可能性小,μ±σ是该曲线的拐点。

二、简要回答下列问题(本题共4个小题,每小题10分,共40分)

1何谓抽样误差?何谓非抽样误差?请举例说明。

答:(1)抽样误差是由抽样的随机性引起的样本结果与总体真值之间的误差。抽样误差是由抽样的随机性导致的。通过增加样本量可以减小抽样误差,当样本量大到与总体单位相同时,也就是抽样调查变成普查时,抽样误差就减小到零。采用不同的组织方式,会有不同的抽样误差。

(2)非抽样误差是指除抽样误差之外的,由于其它原因引起的样本观察结果与总体真值之间的差异。

非抽样误差有以下几种类型:

抽样框误差,是指抽样框中的单位与研究总体的单位不存在一一对应的关系,使用这样的抽样框抽取样本就会出现一些错误。

回答误差,是指被调查者在接受调查时给出的回答与真实情况不符。导致回答误差的原因有多种,主要有理解误差、记忆误差和有意识误差。

无回答误差,是指被调查者拒绝接受调查,调查人员得到的是一份空白的答卷。

调查员误差,是指由于调查员的原因而产生的调查误差。

测量误差,是指如果调查与测量工具有关,则很可能产生测量误差。

2用来描述数据离散程度的统计量有哪些?并说明各统计量适合于何种类型的数据?

答:描述数据离散程度的统计量有异众比率、四分位差、极差、平均差、方差和标准差等。

(1)分类数据:异众比率

异众比率是指非众数组的频数占总频数的比例。异众比率主要用于衡量众数对一组数据的代表程度。

(2)顺序数据:四分位差

四分位差是上四分位数与下四分位数之差,它反映了中间50%数据的离散程度。

(3)数值型数据:极差、平均差、方差和标准差

极差是指一组数据的最大值与最小值之差。极差是描述数据离散程度的最简单测度值,计算简单,易于理解,但它容易受极端值的影响。

平均差也称平均绝对离差,它是各变量值与其平均数离差绝对值的平均数。平均差以平均数为中心,反映了每个数据与平均数的平均差异程度,它能全面准确地反映一组数据的离散状况。

方差是各变量值与其平均数离差平方的平均数。它在数学处理上是通过平方的办法消去离差的正负号,然后再进行平均,方差开方后即得到标准差。

3某关于居民收入的研究报告将居民按收入高低划分为高收入组(上四分位数以上者)、较高收入组(介于中位数与上四分位数之间者)、较低收入组(下四分位数与中位数之间者)和低收入组(低于下四分位数者)。报告中称,今年低收入组人群比重较去年有明显下降,说明居民收入有所提高。请从统计学角度指出该报告中有何错误?为什么?

答:低收入组人群占所有居民的25%,不能根据低收入组人群比重较去年有明显下降,就推断出居民收入有所提高。因为低收入组人群只占居民总体的25%,没有代表性。

4美国洛杉矶湖人队2000年14名球员的薪水(百万美元)如下表:

为了确定新年度球员薪水水平,球员工会与老板进行谈判。球队老板计算了14名球员的平均收入,其数值为410多万美元,老板觉得球员薪水太高了,不能再提高了。而球员工会代表主张用中位数分析球员薪水水平,并绘制了茎叶图以支持自己的说法。请说明球队老板和球员工会代表的争执原因是什么?你认为谁的主张更合理?为什么?

答:双方选用了不同的指标代表总体一般水平,从而造成对整体工资水平认识的差异,对于是否应提高工资而言,双方争论并无合理与否的区别。造成对整体工资水平不同认知的根本原因在于球员间的收入分配差异。换言之,在这个实例中,算术平均数与中位数对于描述总体一般水平来说,并没有哪个指标存在明显优势。

三、计算分析题(本题共4个小题,其中第一题必答题10分,2-4题选答2题,每题20分,共50分)

1为分析甲、乙两城市职工收入水平及差异,分别从两地随机抽取部分职工并进行了调查,调查数据经整理后得到下表:

(1)请选用一种统计图直观地比较这两个样本,并说明从中得到的了什么样的信息?

(2)你认为应当采用哪一种统计量来分别描述甲、乙两城市职工收入的一般水平?并简要说明理由;

(3)进行统计计算,并对两个城市职工收入水平的特点做一简要分析。

解:(1)绘制甲乙城市职工收入水平对比直方图,如下图所示。

图 甲乙两城市职工收入水平对比直方图

从甲乙两城市职工收入水平对比直方图可以看出,甲城市收入在3000~4000元的职工人数较多,而4000~5000元和5000元以的职工人数则较少。乙城市2000~3000,4000~5000元的职工人数较多,而2000元以下,5000元以上的职工人数则较少。

(2)根据表中的数据可计算得到:

=3223(元);=3128;s2=1340761;s2=1081103

据此可知,甲乙两城市的职工平均收入水平不同,不能用标准差直接比较其离散程度,因此,需要计算离散系数。

(3)V=s/=1157.9/3223=0.3593,V=s/=1039.8/3128=0.3324

由于V>V,说明两个城市的职工收入水平相比较,乙城市的职工收入水平较集中,甲城市的职工收入水平较分散。

2天天公司营销售人员对公司近年的广告宣传费用支出和产品销售量进行了统计,得到如下数据:

(1)绘制散点图,说明广告宣传费与产品销售量之间的关系;

(2)拟合销售量对广告宣传费用支出的直线回归方程,说明回归系数的实际意义;

(3)结合实际,你认为能否利用广告宣传费用预测产品销售量,并做出相应的说明。

解:(1)产品销售量与广告宣传费之间关系的散点图如下图所示:

由散点图可以看出,产品销售量Y与广告宣传费X呈正的线性相关关系。

(2)

=24.71,=267.86,01=53.42

则产品销售量对广告宣传费的直线回归方程为:=53.42+8.68x。

0是回归直线在y轴上的截距,它表示当广告宣传费为0元时,产品销售量的期望值为53.42千件;

1是回归直线的斜率,它表示当广告宣传费每增加一万元时,产品销售量平均增加8.68千件。

(3)我认为在实际中,不能利用广告宣传费用预测产品销售量。由回归方程知,随着广告宣传费用的增加,产品销售量也随之增加,但在实际中,随着广告费用的增加,产品销售量并不会一直增加,最终它会停在一个相对稳定的水平上,这是因为产品销售量不仅与广告费用相关,而且还与消费者偏好、消费者需求等客观因素有关。

3企业要面临投资决策问题。已知现在有A、B两个备选的投资项目,经专业人员分析,其中A项目面临高风险的概率为10%,预计可获利200万元;中等风险的概率为25%,预计可获利180万元;面临低风险的概率为35%,预计可获利140万元;在无风险的情况下,预计获利50万元。

要求:

(1)写出A项目获利的概率分布:

(2)计算A项目获利的期望值;

(3)若B项目预计可获利150万元,企业应如何选择投资项目,请说明理由。

解:(1)记X代表投资A项目的获利情况,则A项目获利的概率分布列为:

(2)E(X)=50×30%+140×35%+180×25%+200×10%=129(万元)

(3)从期望值来看,B项目预计获利150万元大于A项目的129万元。但还需比较两者风险的分散程度,为消除变量值水平高低对离散程度测度值的影响,需要计算离散系数。离散系数大的说明数据平均值的代表性差,离散系数小的说明数据平均值的代表性好,更稳定。

4为开展电视观众行为研究,对改进电视栏目和节目提供依据,需要准确获取全国电视观众的收视习惯,为此拟进行一次抽样调查。请你针对此问题设计一调查方案的基本框架,并说明拟采取的抽取样本的方法及设计思路。

抱歉,本题不提供答案,可自由作答。