数学
如何证明本福特定律感觉很神奇,也知道数学表达式,

2019-05-28

如何证明本福特定律
感觉很神奇,也知道数学表达式,
优质解答
1938年,本福特发现了统计报表中的这样一个规律:
一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍.推广来说,越大的数,以它为首几位的数出现的机率就越低.它可用於检查各种数据是否有造假.
在十进制首位数字的出现机率(%,小数点后一个位):
1 30.1%
2 17.6%
3 12.5%
4 9.7%
5 7.9%
6 6.7%
7 5.8%
8 5.1%
9 4.6%
证明如下:假设我们有一个很大的样本空间,有随机变量x₁,x₂,...,x_{n},这里n足够大.x₁,x₂,...,x_{n}的演化规律可以用上边所讲的指数方程来模拟.
如果我们对于指数定律的解两边取以10为底的对数,我们就会得到lg x(t)正比于时间t的结论.
如果我们问变量x介于80-90的概率有多大,我们只需要求出x(t=80)时t的解t₁,和x(t=90)时t的解t₂.那么占总时间T的比率(t₂-t₁)/T即为x介于80-90的概率.
那么如果我们问首位数字是8的概率呢?多亏了duanx和zhuww的想法,我们只需要关心lg x的小数部分介于lg 8和lg 9之间的长度为多少即可.
这是由于关于10的对数lg x的整数部分决定着x是几位数(整数部分是1,说明是两为数;整数部分是2,说明是3位数……).而lg x的小数部分则决定着x的每位数字是什么.
如果画一个lg x的小数部分关于时间t的图像,实际上就相当于把lg x的图像折叠到[lg 0,lg 10]区间.这样,我们就不需要关心时间T有多大,因为时间轴也被折叠了.那么首位数字为D的概率即为 [lg(D+1)-lg(D)]/(lg 10-lg 1)=lg(D+1)-lg(D).
以上结果即为本福特发现的规律
1938年,本福特发现了统计报表中的这样一个规律:
一堆从实际生活得出的数据中,以1为首位数字的数的出现机率约为总数的三成,接近期望值1/9的3倍.推广来说,越大的数,以它为首几位的数出现的机率就越低.它可用於检查各种数据是否有造假.
在十进制首位数字的出现机率(%,小数点后一个位):
1 30.1%
2 17.6%
3 12.5%
4 9.7%
5 7.9%
6 6.7%
7 5.8%
8 5.1%
9 4.6%
证明如下:假设我们有一个很大的样本空间,有随机变量x₁,x₂,...,x_{n},这里n足够大.x₁,x₂,...,x_{n}的演化规律可以用上边所讲的指数方程来模拟.
如果我们对于指数定律的解两边取以10为底的对数,我们就会得到lg x(t)正比于时间t的结论.
如果我们问变量x介于80-90的概率有多大,我们只需要求出x(t=80)时t的解t₁,和x(t=90)时t的解t₂.那么占总时间T的比率(t₂-t₁)/T即为x介于80-90的概率.
那么如果我们问首位数字是8的概率呢?多亏了duanx和zhuww的想法,我们只需要关心lg x的小数部分介于lg 8和lg 9之间的长度为多少即可.
这是由于关于10的对数lg x的整数部分决定着x是几位数(整数部分是1,说明是两为数;整数部分是2,说明是3位数……).而lg x的小数部分则决定着x的每位数字是什么.
如果画一个lg x的小数部分关于时间t的图像,实际上就相当于把lg x的图像折叠到[lg 0,lg 10]区间.这样,我们就不需要关心时间T有多大,因为时间轴也被折叠了.那么首位数字为D的概率即为 [lg(D+1)-lg(D)]/(lg 10-lg 1)=lg(D+1)-lg(D).
以上结果即为本福特发现的规律
相关标签: 证明 福特 定律 数学 表达式
相关问答