国内某大学有男生6000人,女生4000人,该校想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取100人,调查他们平均每天运动的时间(单位:小时),统计表明该校学生平均每天运动的时间范围是[0,3],若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”,根据调查的数据按性别与“是否为‘运动达人’”进行统计,得到如表2×2列联表.运动时间性别 运动达人非运动达人合计男生 36 女生 26 合计 100 (1)请根据题目信息,将2×2类联表中的
2019-04-28
国内某大学有男生6000人,女生4000人,该校想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取100人,调查他们平均每天运动的时间(单位:小时),统计表明该校学生平均每天运动的时间范围是[0,3],若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”,根据调查的数据按性别与“是否为‘运动达人’”进行统计,得到如表2×2列联表.
运动时间 性别 | 运动达人 | 非运动达人 | 合计 |
男生 | 36 | | |
女生 | | 26 | |
合计 | | | 100 |
(1)请根据题目信息,将2×2类联表中的数据补充完整,并通过计算判断能否在犯错误频率不超过0.025的前提下认为性别与“是否为‘运动达人’”有关;
(2)将此样本的频率估计为总体的概率,随机调查该校的3名男生,设调查的3人中运动达人的人数为随机变量X,求X的分布列和数学期望E(X)及方差D(X).
附表及公式:
P(K2≥k0) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 |
k0 | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 |
K2=n(ad-bc)2 |
(a+b)(c+d)(a+c)(b+d) |
,其中n=a+b+c+d.
优质解答
(1)列联表如下:运动时间 性别 | 运动达人 | 非运动达人 | 合计 |
男生 | 36 | 24 | 60 |
女生 | 14 | 26 | 40 |
合计 | 50 | 50 | 100 |
计算观测值K2=100×(36×26-24×14)2 |
60×40×50×50 |
=6>5.024,
所以在犯错误概率不超过0.025的前提下可以认为性别与“是否为‘运动达人’”有关;
(2)随机调查一名男生,则这名男生为运动达人的概率为
P==,
X的可能取值为0,1,2,3;
所以P(X=0)=(1-)3=,
P(X=1)=••(1-)2=,
P(X=2)=•()2(1-)=,
P(X=3)=()3=;
所以X的分布列为:E(X)=3×=,
D(X)=3××(1-)=.
(1)列联表如下:运动时间 性别 | 运动达人 | 非运动达人 | 合计 |
男生 | 36 | 24 | 60 |
女生 | 14 | 26 | 40 |
合计 | 50 | 50 | 100 |
计算观测值K2=100×(36×26-24×14)2 |
60×40×50×50 |
=6>5.024,
所以在犯错误概率不超过0.025的前提下可以认为性别与“是否为‘运动达人’”有关;
(2)随机调查一名男生,则这名男生为运动达人的概率为
P==,
X的可能取值为0,1,2,3;
所以P(X=0)=(1-)3=,
P(X=1)=••(1-)2=,
P(X=2)=•()2(1-)=,
P(X=3)=()3=;
所以X的分布列为:E(X)=3×=,
D(X)=3××(1-)=.