宇宙最喜欢的数字

为什么一个特定的数字比你预期的更频繁地出现,以及如何利用它来抓住骗子!
2015年2月05日
通过盖瑞

分享

宇宙有一个最喜欢的数字,更重要的是:特勤局利用这个事实来抓骗子!不相信?继续阅读…

这号码吗?

让我们做一个小实验。以裸体科学家网站上的前50篇文章为例。金宝搏app最新下载写下文章中出现的每一个数字,取第一个数字。我们将不包括日期,因为它们受到人类的影响太大,而不是宇宙。

列出所有这些数字后,你认为分布是什么样的?也许,你会期望看到均匀分布的15、25、3……等等。事实上,宇宙似乎从根本上更喜欢数字1。这些文章的特点是1比其他任何东西都多,其次是2,频率一直下降到9。

本福德数量

领先的数字 1 2 3. 4 5 6 7 8 9

出场次数

105

77

32

31

29

20.

22

17

7

*我们的样本非常接近本福德定律所建议的数字。如果我们继续数文章,我们会越来越接近理论分布。

当弗兰克·本福德第一次发现这个奇怪的现象——现在被称为本福德定律——时,他想他一定是犯了一个错误。“宇宙怎么会有一个最喜欢的数字呢?”他想,于是开始了收集数据的任务。他收集了河流的长度、人口规模、分子量、物理常数、棒球统计数据和任何他能得到的数字。弗兰克如此痴迷于理解宇宙的偏好,以至于当他开始写第一篇描述这一现象的论文时,他已经收集了超过2万份观测结果。令人惊讶的是,几乎所有的人都遵循这样的模式:每个样本中大约30%的数字以1开头,大约5%的数字以9开头。这意味着15比9多6倍!

从根本上说,宇宙似乎更喜欢数字1。我们稍后会解释原因,但首先,让我们看看如何利用这一事实来抓捕罪犯。

反欺诈

一个虚构的黑帮藏身处假设一群歹徒利用一家餐馆作为他们犯罪活动的幌子。为了让他们的非法收入看起来是合法的,他们每天晚上都会制造一系列假顾客,让他们向餐馆支付不同金额的钱。然后他们用非法赚来的钱支付假客户的账单。在外人看来,这些交易看起来就像顾客和餐馆之间的普通现金支付。除非你用本福德定律。

银行账户几乎完全遵循本福德定律,但匪徒们并不知道这一点。就像大多数人一样,当他们选择“随机”数字来制作他们的账本时,他们会确保这些数字均匀分布,代表15和代表9的频率一样高。不幸的是,当一名法务会计出现并分析了餐厅的账簿时,他们意识到他们没有遵守本福德定律,这立即标志着黑帮的欺诈活动。

使用本福德法获得的证据可以并且已经被用作法庭上的证据。事实上,同样的技术可以用于其他各种可能存在欺诈活动的领域。这可能包括怀疑被篡改的临床试验,甚至是被指控被操纵的选举。甚至有人认为,在希腊加入欧元区之前,他们的财政状况被操纵,以便他们符合成为货币联盟一部分的标准,因为这些数字不符合本福德定律。无论情况如何,如果宇宙偏爱较低的第一个数字不被支持,犯规可能正在进行中。

但是为什么宇宙会有偏好呢?

被本福德弄糊涂了

理解本福德定律最简单的方法之一是想象一个人口为100人的城镇。这个小镇要达到200人,并改变其人口规模的第一个数字,它必须翻倍,换句话说,增加100%。但是小镇要从200人增加到300人,只需要增加50%,这就容易多了。这意味着人口倾向于停留在100万,1000万,100万左右,并迅速超过较高的数字。所以当弗兰克·本福德(Frank Benford)这样的人观察城镇人口规模的集合时,他发现人们更喜欢从数字1开始的城镇规模。本福德定律的神奇之处在于,同样的论点似乎适用于所有数据,而不仅仅是人口。

本福德定律还有其他一些很好的解释,我在本文的最后附上了我最喜欢的一个作为特别奖励。

每天我都在洗牌

快乐的青蛙许多人觉得本福德定律非常令人惊讶,这就是为什么它对抓捕欺诈很有用。它如此令人惊讶的原因是,人们并不擅长判断某件事是否是随机的。因此,面对世界上大量的数据,我们的直觉告诉我们,1和9的数量是一样的,但事实并非如此。最重要的是,我们的直觉是如此强烈,以至于当我们看到相反的证据时,我们经常选择忽略它。

在iPod的早期,苹果团队引入了一个数学上完美的随机播放功能。一旦随机播放功能被激活,你就可以完全确定你的播放列表将以真正随机的顺序包含你最喜欢的音乐。不幸的是,洗牌功能在数学上是随机的,而不是直观上随机的,这导致全球用户抱怨洗牌功能的随机性。苹果被迫对这一功能进行了重新编程,史蒂夫·乔布斯(Steve Jobs)用那句著名的话回应道:“我们减少了随机性,让它看起来更随机。”

本福德定律告诉我们,人们不太擅长伪造随机的机会,所以我们虚构的黑帮应该采纳史蒂夫·乔布斯的建议,通过让他们的账户看起来不那么随机,让他们的账户看起来更随机。

对于数学爱好者来说……

本福德的抽奖活动

本福德定律的另一种解释是想象一个抽奖。要在抽奖中中奖,你必须选择一张前导数字为1的彩票,即1,10,11,12等。假设抽奖券中只有两张票,分别是1和2。选择编号为1的彩票,也就是唯一的中奖彩票的概率是50%。如果你把票的数量增加到3张,那么中奖的概率下降到33%,如果你把票的数量增加到4张,那么中奖的概率下降到25%,因为标有1的票仍然是唯一的中奖票。继续这样下去,当你有9张彩票时,中奖的概率下降到11%或1 / 9。但是当你把第十张彩票加到抽奖券中,选到中奖彩票的概率增加到20%或10分之2,因为现在有两张中奖彩票:1和10。

Benfrods数量加上11号彩票,中奖概率增加到27%,加上12号彩票,中奖概率增加到33%。然后中奖的概率继续增加,直到抽奖中有19张票,11张中奖票(标有1、10、11、12、13、14、15、16、17、18和19的票)意味着中奖的概率是58%。

不幸的是,这就是获胜的可能性下降的地方。所有20到99之间的票都不是中奖票。这意味着将抽奖大小增加到20个,将中奖概率降低到55%,将抽奖大小增加到21个,将中奖概率降低到52%。这种趋势一直持续到99张彩票的抽奖,中奖概率只有11%。

但是当你加上第100张彩票,中奖的概率又上升了。这种模式会无限期地持续下去,随着您添加更多的彩票,选择中奖彩票的概率会增加或减少。

当随机选择数据时,这就像抽奖,但不知道抽奖的总大小,所以我们必须计算平均值。通过这样的计算你最终的获胜概率是30%换句话说,30%的数字以1开头。

评论

添加注释