国内某大学有男生6000人,女生4000人,该校想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取100人,调查他们平均每天运动的时间(单位:小时),统计表明该校学生平均每天运动的时间范围是[0,3],若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”.根据调查的数据按性别与“是否为‘运动达人’”进行统计,得到如下2×2列联表:运动时间性别运动达人非运动达人合计男生36女生26合计100(1)请根据题目信息,将2×2列联表中的数据补充完整,并通过计
2019-04-28
国内某大学有男生6000人,女生4000人,该校想了解本校学生的运动状况,根据性别采取分层抽样的方法从全校学生中抽取100人,调查他们平均每天运动的时间(单位:小时),统计表明该校学生平均每天运动的时间范围是[0,3],若规定平均每天运动的时间不少于2小时的学生为“运动达人”,低于2小时的学生为“非运动达人”.根据调查的数据按性别与“是否为‘运动达人’”进行统计,得到如下2×2列联表:
运动时间 性别 | 运动达人 | 非运动达人 | 合计 |
男生 | 36 | | |
女生 | | 26 | |
合计 | | | 100 |
(1)请根据题目信息,将2×2列联表中的数据补充完整,并通过计算判断能否在犯错误概率不超过0.025的前提下认为性别与“是否为‘运动达人’”有关;
(2)将此样本的频率估计为总体的概率,随机调查该校的3名男生,设调查的3人中运动达人的人数为随机变量X,求X的分布列和数学期望E(X)及方差D(X).
附表及公式: P(K2≥k0) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 |
k0 | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 |
K2=n(ad-bc)2 |
(a+b)(c+d)(a+c)(b+d) |
,其中n=a+b+c+d.
优质解答
(1)由题意,该校根据性别采取分层抽样的方法抽取的100人中,有60人为男生,40人为女生,据此2×2列联表中的数据补充如下.
运动时间 性别 | 运动达人 | 非运动达人 | 合计 |
男生 | 36 | 24 | 60 |
女生 | 14 | 26 | 40 |
合计 | 50 | 50 | 100 |
由表中数据得K2的观测值k=100×(36×26-24×14)2 |
50×50×60×40 |
=6>5.024,
所以在犯错误概率不超过0.025的前提下,可以认为性别与“是否为‘运动达人’”有关.…(6分)
(2)由题意可知,该校每个男生是运动达人的概率为=,故X~B(3, ),
X可取的值为0,1,2,3,
所以P(X=0)=()3-0()0=,P(X=1)=()3-1()1=,P(X=2)=()3-2()2=,P(X=3)=()3-3()3=.
X的分布列为:
∴E(X)=3×=,D(X)=3××=.…(12分)
(1)由题意,该校根据性别采取分层抽样的方法抽取的100人中,有60人为男生,40人为女生,据此2×2列联表中的数据补充如下.
运动时间 性别 | 运动达人 | 非运动达人 | 合计 |
男生 | 36 | 24 | 60 |
女生 | 14 | 26 | 40 |
合计 | 50 | 50 | 100 |
由表中数据得K2的观测值k=100×(36×26-24×14)2 |
50×50×60×40 |
=6>5.024,
所以在犯错误概率不超过0.025的前提下,可以认为性别与“是否为‘运动达人’”有关.…(6分)
(2)由题意可知,该校每个男生是运动达人的概率为=,故X~B(3, ),
X可取的值为0,1,2,3,
所以P(X=0)=()3-0()0=,P(X=1)=()3-1()1=,P(X=2)=()3-2()2=,P(X=3)=()3-3()3=.
X的分布列为:
∴E(X)=3×=,D(X)=3××=.…(12分)