统计学第五版贾俊平期末考试模拟试题二
IMB standardization office【IMB 5AB- IMBK 08- IMB 2C】
模 拟试题二 一. 单项选择题(每小题2分,共20分) 一辆新购买的轿车,在正常行使条件下,一年内发生故障的次数及相应的概率如下表所示: 故障次数() 概率() 0 1 2 3 正好发生1次故障的概率为( ) A. B. C.D. 要观察200名消费者每月手机话费支出的分布状况,最适合的图形是( ) A.饼图 B.条形图 C.箱线图 D.直方图 从某种瓶装饮料中随机抽取10瓶,测得每瓶的平均净含量为355毫升。已知该种饮料的净含量服从正态分布,且标准差为5毫升。则该种饮料平均净含量的90%的置信区间为( )
A. B. C.D.
根据最小二乘法拟合线性回归方程是使( ) A. B. C.D.
一项调查表明,大学生中因对课程不感兴趣而逃课的比例为20%。随机抽取由200名学生组成的一个随机样本,检验假设,,得到样本比例为。检验统计量的值为( ) A. B. C.D.
在实验设计中,将种“处理”随机地指派给试验单元的设计称为( ) A.试验单元 B.完全随机化设计 C.随机化区组设计 D.因子设计
某时间序列各期观测值依次为10、24、37、53、65、81,对这一时间序列进行预测适合的模型是( ) A.直线模型 B.二次曲线模型 C.指数曲线模型 D.修正指数曲线模型
在因子分析中,变量的共同度量反映的是( ) A.第个公因子被变量
的解释的程度
B.第个公因子的相对重要程度 C.第个变量对公因子的相对重要程度 D.变量的信息能够被第个公因子所解释的程度 如果要检验两个独立总体的分布是否相同,采用的非参数检验方法是( ) A.Mann-Whitney检验 B.Wilcoxon符号秩检验 C.Kruskal-Wallis检验 D.Spearman秩相关及其检验 在二元线性回归方程中,偏回归系数的含义是( ) A.变动一个单位时,的平均变动值为B.变动一个单位时,因变量 的平均变动值为C.在不变的条件下,D.在不变的条件下,变动一个单位时,的平均变动值为的平均变动值为变动一个单位时,二. 简要回答下列问题(每小题10分,共20分) 画出时间序列预测方法选择的框图。 简述因子分析的基本步骤。 三. 计算与分析下列各题(每小题15分,共60分) 假定其他条件不变,某种商品的需求量()与该商品的价格()有关,现取得以下样本数据: 价 格(元) 需求量(公7 75 6 80 5 70 8 60 7 65 5 85 4 90
斤) 根据上表数据计算得:,,,。 (1)绘制散点图,说明需求量与价格之间的关系。 (2)拟合需求量对价格的直线回归方程,说明回归系数的实际意义。 (3)计算当价格为10元时需求量的点估计值。 一家物业公司需要购买一批灯泡,你接受了采购灯泡的任务。假如市场上有两种比较知名品牌的灯泡,你希望从中选择一种。为此,你从两个供应商处各随机抽取了60个灯泡的随机样本,进行“破坏性”试验,得到灯泡寿命数据经分组后如下: 灯泡寿命(小时) 700~900 900~1100 1100~1300 1300~1500 合计 供应商甲 12 14 24 10 60 供应商乙 4 34 19 3 60 (1)请用直方图直观地比较这两个样本,你能得到什么结论 (2)你认为应当采用哪一种统计量来分别描述供应商甲和供应商乙灯泡寿命的一般水平请简要说明理由(3)哪个供应商的灯泡具有更长的寿命 (4)哪个供应商的灯泡寿命更稳定 为估计每个网络用户每天上网的平均时间是多少,随机抽取了225个网络用户的简单随机样本,得样本均值为小时,样本标准差为小时。 (1)试以95%的置信水平,建立网络用户每天平均上网时间的区间估计。 (2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水平,建立年
龄在20岁以下的网络用户比例的置信区间。 (注:,) 对于来自五个总体的样本数据进行方差分析,得到下面的方差分析表() 差异源 组间 组内 总计 SS A df 4 15 19 MS B C F D P-value F crit < (1)计算出表中A、B、C、D四个单元格的数值。 (2)B、C两个单元格中的数值被称为什么它们所反映的信息是什么 (3)在的显着性水平下,检验的结论是什么 模拟试题二解答
一、单项选择题(每小题2分,共20分)
;2. D;3. C;4. B;5. A;6. B;7. C;8. D;9. A;10. C。
二、简要回答下列问题(每小题10分,共20分) 1. 框图如下:
2. (1)对数据进行检验,以判断手头的数据是否适合作因子分析。用于因子分析的变量必须是相关的。一般来说,相关矩阵中的大部分相关系数小于,就不适合作因子分析了。
(2)因子提取。根据原始变量提取出少数几个因子,使得少数几个因子能够反映原始变量的绝大部分信息,从而达到变量降维的目的。
(3)因子命名。一个因子往往包含了多个原始变量的信息,它究竟反映了原始变量的哪些共同信息?因子分析得到的因子的含义是模糊的,需要重新命名,以便对研究的问题做出合理解释。 (4)根据因子得分函数计算因子在每个样本上的具体取值,以便对各样本进行综合评价和排序。
三、计算与分析各题(每小题15分,共60分) 1.(1)散点图如下:
从散点图可以看出,需求量与价格之间存在负线性关系,即随着价格的提高,需求量则随之下降。 (2)由最小二乘法可得:
,
。
总需求量与价格的一元线性回归方程为:。回归系数表示:价格每增加1元,总需求量平均减少公斤。 (3)公斤。
2. 两个供应商灯泡使用寿命的直方图如下:
从集中程度来看,供应商甲的灯泡的使用寿命多数集中在1100小时~1300小时之间,供应商乙的灯泡的使用寿命多数集中在900小时~1100小时之间。从离散程度来看,供应商甲的灯泡的使用的离散程度大于供应商乙的离散程度。
(2)应该采用平均数来描述供应商甲和供应商乙灯泡寿命的一般水平,因为两个供应商灯泡使
用寿命的分布基本上是对称分布的。
(3)计算两个供应商灯泡使用寿命的平均数如下:
小时。
小时。
甲供应商灯泡使用寿命更长。
(4)计算两个供应商灯泡使用寿命的标准差和离散系数如下:
小时。
小时。
由于,说明供应商乙的灯泡寿命更稳定。 3. (1)已知:,
,,。
网络用户每天平均上网时间的95%的置信区间为:
即(,)。
(2)样本比例。龄在20岁以下的网络用户比例的95%的置信区间为:
即(%,%)。
4. (1)A=;B=÷4=;C=÷15=;D=÷=。
(2)B=被称为组间方差,反映组间平均误差的大小;C=被称为组内方差,反映组内平均误差的大小。
(3)由于,拒绝原假设,表明五个总体的均值之间不全相等。
因篇幅问题不能全部显示,请点此查看更多更全内容