您的当前位置:首页正文

《统计学》课程期末考查

来源:画鸵萌宠网


河南城建学院2014~2015年度第二学期

《统计学》期末考查

学号 *********

姓名 申圣

课题名称 关于河南城建学院学生课余时间安排满意程度调查 评分

2015年5月

1、编写统计调查研究提纲(5分)。 (1)选题思路: 相比中学阶段时间紧凑争分夺秒的学习生活,大学生有着非常充裕的课外可自由支配的时间,从开始进入大学校园到毕业离开的这段时间里,大学生怎样度过自己的课余时间成了每一位大学生面临的问题 (2)研究目标: 为了更好的了解大学生课余时间的安排,方便下一届大学生对自己课余时间的安排做参考,使大学生能更好地安排自己的生活学习 (3)统计过程的步骤: (1)先进行小规模抽样,抽取总体的1%进行调查,样本数量180份,为避免废卷,发放问卷200份。 (2)调查方法是小组成员分区域进行抽样调查,遵守一定的访问行走规则对在校大学生逐一进行走访并填写问卷 (3)调查报告的设计:在网络上查阅相关资料后,完成调查报告的设计。 (4)对调查所得到的资料进行分析,对调查问卷进行数据统计,得大学生对于在校期间学车的看法及选择驾校的意向。对此次调查所涉及的问题严格按照以上所述进行评价调查分析,最后通过进行基础性统计对调查结果进行总体测算。 2、编写调查方案(10分) (1)调查总体范围和包含的个体数量 (2)调查对象的抽样率和样本数 (3)课题涉及的变量有哪些? (a)调查数据变量 总体范围:河南城建学院学生 个体数量:18000 1% 180 每周进行的体育锻炼时间长,每周进行自习的时间长,每周上网的时间长 对自己课余时间安排的满意度分数 (b)二手数据变量 无 (4)抽样方法和抽样过采取非概率抽样的方法。 程 在宿舍、校餐厅、图书馆、自习室、运动场、操场等学生集中地区进行,方便抽样 (5)如何控制抽样误差 1.增加样本个数。 2.调查过程仔细认真。 3.减少废卷率. 3、编写调查问卷(注意甄别不同调查对象,考虑问题答案设计对后续数据分析的影响)(10分)

关于河南城建学院在校学生课余时间安排满意情况

一、单项选择 1.亲,您的性别 A.男生 B.女生

2.2015年大学几年级

A.一 B.二 C.三 D.四 3.一周有( )节课 4关于男女朋友

A.有 B没有 C.有在外地 D.正在追 E.不好说 5.每月平均陪男女朋友的时间大概是多少 (_________________) 小时 6.如果早晨第一节没课你一般

A.早早起床学习 B.看看表继续睡 C.玩电脑或者手机 D其他 7.平均每月进行的课外自习的时间长 (___________________)小时

8.你每月花费在上网的时间是多少 (___________________)小时

9平均每个月外出学校逛街购物的次数() 10平常在上课的课间时间做什么

A.继续学习 B.扣扣手机 C.出去走走D趴下睡觉E其他 11.对于学校放的小长假

A.回家 B.旅游 C 宅在宿舍玩 D继续学霸模式 E.兼职赚外快 F.其他

12课余时间看什么书吗

A.中外杂志名著B.和专业有关的书C.只看手机上的电子书D不看 13上网的时候一般做些什么

A.看新闻娱乐咨讯 B.聊天刷动态 C.玩游戏D看影视追剧 E.查资料学习 F.网购 G其他

14经常做体育锻炼吗

A.每天都做B.每周做1-2次C.偶尔做一次 D.有规律按计划的做E.只在体育课上做F从不锻炼

15请问你每月花费在运动方面比如体育锻炼上面的时间是多少 (_____________________)小时 16.你喜欢的体育项目是

A.各种球类 B.长短跑步 C.单双杠和自由锻炼 D.武术 E.其他 17针对你自己的课余时间安排有计划吗

A.有合理的计划做事休息B.挑最要紧的事做C.想起什么就做什么D.别人做什么我就做什么E.没一点计划F.管我呢俺想咋咋滴 相比高中紧张的学习环境你喜欢

A.喜欢高中的充实B.喜欢大学的自由D.没感觉E.不喜欢上学 18每天晚上大概几点睡觉

A.8点前 B.9点前 C.10点前D.11点前 E.12点前F.零点后

19对于吃饭你一般选择

A.带回宿舍去吃 B.在餐厅解决掉C.路上边走边吃 D.叫外卖 20请您给自己的课余时间安排满意度打分,综合满分100 (______________)

21你对于本次的调查问卷的填写还满意吗

A.很满意B.满意 C.一般吧 D.不太好 E.不想填写 二、自由回答

您对本次的调查问卷有什么建议?

谢谢您的合作

4、编制数据文件(如果数据文件与问卷不对应,本项不得分)。(5分) A:平均每月进行的体育锻炼的时间长 B:平均每月陪男女朋友的时间长 C:对自己课余时间的安排满意分数 序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 A 20 43 60 59 42 12 23 34 27 18 16 17 19 54 42 26 28 46 57 18 60 14 24 2 13 B 14 26 34 60 24 28 17 16 25 30 33 26 28 50 56 32 12 12 10 25 5 26 0 24 35 C 87 56 65 89 90 56 65 78 59 66 90 76 79 88 65 69 66 85 78 88 95 80 68 69 79 序号 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 A 20 43 60 59 42 12 23 34 27 17 16 17 19 54 42 26 28 46 57 18 59 14 24 6 13 B 15 26 34 60 24 28 17 16 25 30 34 26 28 50 56 32 12 12 10 25 5 26 0 24 35 C 88 56 65 89 90 56 65 78 59 66 90 76 79 88 65 69 66 85 78 88 95 80 68 69 79 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50

16 55 38 37 49 56 33 34 20 26 45 30 35 26 46 56 60 34 26 28 24 20 13 15 46 40 20 10 23 24 20 13 10 30 45 24 12 10 9 5 0 2 32 2 15 16 35 24 30 12 88 69 88 59 49 78 65 35 48 59 65 78 59 59 68 78 88 79 79 78 98 90 89 80 70 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 16 55 38 37 49 56 33 34 20 26 45 30 35 26 46 56 60 34 26 28 24 20 13 15 46 40 20 10 23 24 20 13 11 30 45 24 12 10 9 5 1 2 32 3 15 16 35 24 30 12 88 69 88 59 49 78 65 35 48 59 65 78 59 59 68 78 88 79 79 68 98 90 89 80 70 5、选择一个主要的数值型变量进行数据分组分析(20分) (1)进行分组分析的数值型变量是 (2)制作分组频数频率分布表 平均每周进行的体育锻炼时间长 平均每周进行的体育锻炼时间长 频数 8 16 28 20 26 2 100 频率 0.08 0.16 0.28 0.2 0.26 0.2 1 51-60 41-50 31-40 21-30 11-20 1-10 总计

(3)绘制直方图

30252015105051-6041-5031-4021-3011——2001--10

(4) 计算分组后的平均数、众数、中位数,说明分布形态

频数频率中位数 33.5 众数 34 平均数 32.78 因为众数>平均数>中位数 所以数据为左偏分布 (5) 计算不分组的平均数、众数、中位数,并与分组数据进行误差比较。

中位数 34 众数 34 平均数 32.84 误差比较:分组后的中位数小于不分组的,众数都相等,分组后平均数小于不分组的,但都相差不是很大

(6) 计算分组后的方差、标准差、离散系数

方差 246.21878 标准差 15.69136 离散系数 0.4778124 (7)假设所选变量属于正态分布,验证标准分数的经验值 大约68%的取值范围 大约95%的取值范围 (17.02,48.94) 内含样本数 (1.46,64.22) 内含样本数 62 100 实际占百分比 实际占百分比 62% 100% 6、分类数据分析(列联分析)(10分) (1)两个被研究的变量组成的原始数据列联表

是否有 男女朋友 是 否 合计 课余时间安排满意度 很满意 比较满意 一般 较差 合计 26 20 46 17 8 25 11 8 19 6 4 10 60 40 100 (2)两个被研究的变量的期望值列联表 是否有 男女朋友 是 否 合计 课余时间安排满意度 很满意 比较满意 一般 较差 合计 27.6 18.4 46 15 10 25 11.4 7.6 19 6 4 10 60 40 100 (3)检验过程 (a)提出假设 H0:观察频数与期望频数一致, 即大学生是否有男女朋友对课余时间安排有显著影响 H1:观察频数与期望频数不一致,即大学生是否有男女朋友对课余时间安排没有显著影响 (b)X2值计算表 是否有 课余时间安排满意度 男女朋很满意 比较满意 一般 较差 合计 友 是 0.093 0.267 0.014 0 0.374 否 0.139 0.4 0.021 0 0.56 合计 0.232 0.667 0.035 0 0.934 (c)查表得到X2临界值进行检验,进行P检验,决策,得出结论 查表得临界值X2(0.05)(3)=7.8147

决策:因为X2>X2(0.05)(3),所以拒绝原假设H0,接受备选假设H1。 结论:大学生是否有男女朋友对课余时间安排没有显著影响。 (d)具体分析解释结论:观察频数与期望频数一致,即大学生是否有男女朋友对课余时间安排没所得结论 有显著影响。 7、单因素方差分析(15分)

(1)被分析的分类变量和数值型变量分别是什么?

分类变量:体育锻炼情况 数值型变量:对课余时间安排评价得分 (2)散点图及判定

由散点图可观察到,体育锻炼情况不同的同学对课余时间安排的满意度得分在60分以上的人数是不同的,而且经常体育锻炼的同学,其对课余时间的安排越满意。

(3)F值计算步骤和结果(包含方差分析计算表) 每天都要锻炼 66 1 2 3 4 计算F统计量: 样本均值 总均值 SSA SSE MSA MSE df1 df2 (4H0):提各出水假平设 均值相等,即体育锻 炼情况对大学生的课余时间安排36 56 73 每天都要锻炼 57.75 体育锻炼情况 每周至少一次 89 50 81 50 每周至少一次 67.5 50 2993.5 3134.37 997.833 261.198 3 12 每月至少一次 30 从不锻炼 15 69 40 33 每月至少一次 43 45 23 44 从不锻炼 31.75 情况没有显著影响。 H1:各水平均值不全相等,即体育锻炼情况对大学生的课余时间安排情况有显著影响。 (5)查表,F检验,得出结论 查表得F=3.82>3.078 所以拒绝原假设H0,认为各水平之间差异明显,就是说明体育锻炼对大学生的课余时间安排情况有显著影响。

(6)使用Excel数据分析工具对所得结论进行验证

方差分析:单因素方差分析 SUMMARY 观测组 数 求和 平均 方差 列 1 4 10 2.5 1.666667 列 2 4 231 57.75 258.9167 列 3 4 270 67.5 419 列 4 4 172 43 318 列 5 4 127 31.75 227.5833 方差分析 差异源 SS df MS F P-value 102132553.组间 .5 4 375 10.42052 0.000305 3675.245.0组内 5 15 333 总计 13889 19 (7)分析解释所得结体育锻炼对大学生的课余时间安排有显著影响。 论 (8)关系强度测量与解释 F crit 3.055568 关系强度R^2=0.955=95.5%

这表明体育锻炼占课余时间安排情况的影响效应占总效应的95.5%,而残差效应则占4.5%。

(9)多重比较分析与最终结论

1、提出以下假设。

检验一:H0:u1=u2;H1:u1≠u2 检验二:H0:u1=u3;H1:u1≠u3 检验三:H0:u1=u4;H1:u1≠u4 检验四:H0:u2=u3;H1:u2≠u3 检验五:H0:u2=u4;H1:u2≠u4 检验六:H0:u3=u4;H1:u3≠u4 2、计算检验统计量 检验统计量 9.75 14.75 26 3、计算LSD 检验一 检验二 检验三 检验四 检验五 检验六 LSD 33.18 33.18 33.18 33.18 33.18 33.18 24.5 35.75 11.25 4、做出决策

|X1-X2|LSD3,不拒绝H0, 不能认为每天都要锻炼与从不锻炼之间有显著差异。 |X2-X3||X3-X4|8、相关分析和一元线性回归分析(15分)

(1)选取关系最密切的自变量平均每月体育锻炼时间长X 和因变量,名称是 学生对自己课余时间安排的满意分数Y (2)相关系数计算表 我在原始数据表中抽出10对数据 平均每月课余时间锻炼时间安排满意长x 分数y xy x^2 y^2 y^ 35 55 1925 1225 3025 68.77099984 54 69 3726 2916 4761 85.0516229 60 89 5340 3600 7921 90.19287229 15 43 645 225 1849 51.63350188 29 79 2291 841 6241 63.62975045 46 88 4048 2116 7744 78.19662372 38 90 3420 1444 8100 71.34162453 22 72 1584 484 5184 57.63162616 9 40 360 81 1600 46.49225249 26 49 1274 676 2401 61.05912575 (3)相关系数的计算及结果解释 (y^-y均)^2 1.879640553 311.579791 519.5150272 248.5824631 14.21478168 116.5670837 15.53640394 95.42112744 437.1339061 40.2066862 (x^-x均)^2 2.56 424.36 707.56 338.56 19.36 158.76 21.16 129.96 595.36 54.76 r=(nΣxy-ΣxΣy)/{[nΣx^2-(Σx)^2]^1/2*[nΣy^2-(Σy)^2]^1/2}=0.727906884 表明x与y之间存在正线性相关关系,且中度相关

(4)用最小二乘法得出回归方程,并解释方程中各参数的意义

设一元回归模型为 y=b0+b1x 根据最小二乘法得

b0=(nΣxy-ΣxΣy) /[nΣx^2-(Σx)^2]=38.7803784 b1=y(平均)-b0*x(平均=0.856874898

得出回归方程为y=38.7803784+0.856874898x

表示每平均每月锻炼时间长增加1小时,学生就会对自己的课余时间安排满意分数增加0.857分 当输入平均每月锻炼时间长为30小时的时候,学生的课余时间安排满意分数为30*0.857+38.78=64.49分

(5)用Excel输出回归分析结果,验证前面计算的准确性

SUMMARY OUTPUT 回归统计 Multiple R R Square 0.709119175 0.50285 F 0004 Adjusted 0.44070R Square 6254 14.3464标准误差 3156 观测值 10 方差分析 Significance F 0.021658325 df 1 8 9 Coefficients -30.88334505 回归分析 残差 总计 Intercept X Variable 1.293041 2867 SS 1665.439213 1646.560787 3312 标准误差 34.70806664 0.454561261 MS 1665.439213 205.8200984 t Stat -0.889803093 2.844595392 F 8.091722946 Lower P-value 95% 0.39953-110.927732 02903 0.021658325 0.244822721 Upper 95% 49.15360016 2.341263014 下限 95.0% -110.9202903 0.244822721 上限 95.0% 49.15360016 2.341263014

(6)计算判定系数并解释回归直线的拟合优度状况

1 2 3 4 5 (Yi预测-y平均)^2 1.879640553

(Yi-y平均)^2 153.76 311.579791 519.5150272 248.5824631 14.21478168 2.56 466.56 595.36 134.56 6 7 8 9 10 合计 116.5670837 15.53640394 95.42112744 437.1339061 40.2066862 1800.636911 SSR 424.36 510.76 21.16 750.76 338.56 3398.4 SST 判定系数R^2=SSR/SST=0.6297234说明学生课余时间安排满意分数变差当中,有63%可以由课余时间安排满意分数与锻炼时间长度的关系来解释。拟合优度还是较好的

(7)对回归系数进行检验,并评价回归分析结果 提出假设 H0:b1=0 H1:b1≠0 F= 结论: 0.987899091 因为F=0.987899>F0.05,所以接受 H1,即课余时间安排满意程度分数与平均每月进行的锻炼时间长度之间线性关系显著。

(8)对每一个自变量原始值,求对应的因变量估计值和置信区间 1 2 3 4 5 6 7 8 9 10 平均每月锻炼时间长x 35 54 60 15 29 46 38 22 9 26 课余时间安排满意分数y 55 69 89 43 79 88 90 72 40 49 预测值y^ 68.77099984 85.0516229 90.19287229 51.63350188 63.62975045 78.19662372 71.34162453 57.63162616 46.49225249 61.05912575 置信上限 70.23276874 96.30095491 101.4422043 62.88283389 74.87908246 89.44595573 82.59095654 68.88095817 57.7415845 72.30845777 置信下限 57.52166782 73.80229089 78.94354028 40.38416986 52.38041844 66.9472917 60.09229252 46.38229415 35.24292047 49.80979374 9、时间序列分析(10分)

(1) 编制核心数值型变量时间序列数据(时间为2005~2014年),编制3期移动平均法、指数平滑

法(a=0.5),和一元线性回归法(要写出回归方程)的拟合值及方差计算表 移动平均法 年份 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 合计 指数平滑法(a=0.5) 平均每月锻炼时间长 56 60 55 49 51 41 46 43 39 46 移动平均预测k=3 预测误差 预测误差平方 57 54.66666667 51.66666667 47 46 43.33333333 42.66666667 42.66666667 42.5 2 5.666666667 0.666666667 6 0 0.333333333 3.666666667 -3.333333333 42.5 4 32.11111111 0.444444444 36 0 0.111111111 13.44444444 11.11111111 1806.25 486 年份 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 合计 线性回归法 平均每月锻炼指数平滑法预测误差 预测误差平方 时间长 (a=0.5) 56 60 56 4 16 55 58 -3 9 49 56.5 -7.5 56.25 51 52.75 -1.75 3.0625 41 51.875 -10.875 118.265625 46 46.4375 -0.4375 0.19140625 43 46.21875 -3.21875 10.36035156 39 44.609375 -5.609375 31.46508789 46 41.8046875 4.1953125 17.60064697 43.90234375 -43.90234375 1927.415787 486 X 2005 2006 2007 2008 2009 2010 2011 2012 (Y-Y均值)^2 Y 56 2361.96 60 2361.96 55 2361.96 49 2361.96 51 2361.96 41 2361.96 46 2361.96 43 2361.96

因篇幅问题不能全部显示,请点此查看更多更全内容

Top