国外流行数学课本上的神秘数字表。网友:引人入胜,猜不到结局。

原创文章版权归微信微信官方账号所有
“把科学带回家”全部
作者琦君有这样一本神书,它的文本不包含任何字母,但却畅销60多年,并且已经再版了三次。亚马逊上的评论数超过亚马逊十大畅销书之一的第一本书《饥饿游戏》,获得4.2/5的高分,并触发《纽约时报》、《华尔街日报》等。
《纽约时报》 2001年关于《百万随机数表》(百万个随机数字有十万个正态偏差)章节的报告经常出现在各种统计学教材中,是附录中经常出现的神秘表格的常见来源。
教科书中的随机数统计。图片:世卫组织卫生系统图书馆这本书是一本标志着人类核武器时代到来的书。在个人电脑时代之前,被统计学家奉为圣经的是《百万随机数表》(百万个随机数字,有十万个正态偏差)(以下简称百万)。
是的,这本书的正文是一百万个随机数。为美国空军制造兰德计算机的计算机科学家加里布里格斯(Gary Briggs)说,这本书是一部有65年历史的杰作。“我们都很佩服。”沃顿商学院(wharton school)副教授伊桑莫利克(Ethan Mollick)指出,在计算机出现之前,《百万》这本书是随机数最常见的来源。
截至今年8月,这本书已有699条评论。与此相比,亚马逊十大畅销书之一的《饥饿游戏》的平装初版,评论只有200多条。
我们先来看看亚马逊网友3354对这本书的评价
“具有重要历史意义的迷人杰作。你看不到结局,就猜不到结局。”
“几百万个随机数?他们只用了10个,然后用不同的组合重复。不要上当!”
“我被书名迷惑了.我以为里面有随机数,但是看了一会发现还是有规律的……经过几个小时的数学模拟,证明了……每页左上角的数字可以组成1-628的递增序列。”好吧,网友的评论很中肯。作为一本你完全摸不透的书,几百万完全买得起这样的名声。要理解这本书的划时代性,我们有必要知道随机数有多难得到。随机性似乎无处不在,比如路边的石头,女生的心情,人渣们的答案……但其实真的很难得到高质量的随机数。计算机输出的随机数是“伪随机数”,因为无论给计算机什么指令,它们都会稳定地执行同样的运算,输出同样的结果。也就是说,计算机无法输出真随机数。真随机数的唯一来源是大自然。比如核裂变。你可能想问,我们怎么知道随机数是真的还是假的?很简单。就画个图吧。
真随机数会形成随机游走。图片:可汗学院如果你用一串随机数做一个饕餮蛇的图片,让饕餮蛇每走一步都按照这个序列中的数字转动,那么真正的随机数形成的饕餮蛇看起来是不规则的。无论你放大还是缩小这张照片,贪食蛇在任何比例下都是走来走去的。这张随机出现的蛇的照片叫做随机漫步。但计算机生成的伪随机数最终会表现出规律性,蛇的步伐会以特定的周期重复。
伪随机数(蓝色)最终会表现出规律性。图片来源:可汗学院真随机数和伪随机数的对抗在20世纪40年代被推向了高潮,因为在研究核物理的时候,人们才意识到真随机数有多么重要。例如,在设计核反应堆时,最关键的步骤是预测中子分布。中子是谁、从哪里来、要到哪里去这三个终极问题,成为设计核反应堆的核心,这个研究方向也叫中子输运。
在反应堆中,中子(蓝色)导致铀235(黄色)裂变。图片:维基百科核物理研究人员普遍认为中子像气体一样在反应堆芯中扩散,并用中子输运方程模拟这一过程。但是,中子输运方程的暴力解法太复杂了,当时的物理学家都很头疼。
后来,这个问题被洛斯阿拉莫斯国家实验室的数学家斯坦尼斯劳乌拉姆解决了。乌拉姆的想法是方程太复杂,我看不懂,可以直接模拟中子如何运动。这种“让我试试”的方法就是著名的统计技术3354蒙特卡罗法。
蒙特卡罗方法其实不难理解。比如看正方形和圆形的面积比,我们可以随机把珠子倒在两个盒子上面。倒了巨量的珠子后,看两个盒子里珠子数量的比例。这个比例就是它们的面积比。图片:大理石科学蒙特卡罗方法不需要求解中子输运方程,而是通过模拟大量中子的运动轨迹来预测反应堆中的中子扩散过程。蒙特卡洛方法在洛斯阿拉莫斯国家实验室被发明和推广后,其他学科也发现了它的易用性。现在蒙特卡罗方法被广泛用于研究各种复杂系统的行为,如金融市场、动荡等。显然,蒙特卡罗方法依赖于大量的随机数,从而保证模拟结果无限接近真实。洛斯阿拉莫斯国家实验室发明的统计工具,将高质量的随机数变成了炙手可热的学术“商品”,百万美元图书就是基于这种需求而诞生的。为了满足飙升的需求,1947年,为美军服务的兰德公司开始制造这种“商品”。1955年,《百万》第一版出版。那么,这些高质量的随机数是如何产生的呢?首先,自然界的随机脉冲源发出随机脉冲。这个脉冲源与一个电子轮相连,电子轮将随机信号转换成0-9的十进制数。
图片:wikimedia然后,这些十进制数被转换成2万张可以被计算机读取的卡片。这些卡片被插入一台IBM电脑,这台电脑产生了一百万个随机数。当然,随机数的质量取决于随机脉冲的质量。兰德公司没有公布其来源,有人猜测随机脉冲来自面向铀矿的盖革计数器。
天然铀矿石。图片:维基媒体铀衰变,在这个过程中释放出粒子。但是两次衰变的间隔是随机的,所以粒子的盖革计数器记录的信号也是随机的。出版后,这本书也成为兰德公司的畅销书。兰德说,这本书是“有史以来出版的最大的随机数表”。高质量的随机数很难得到,所以这本书对于教师、学生、研究人员以及一系列需要和统计打交道的职业来说是必不可少的。据兰德公司介绍,《百万》一书已经成为工程和计量经济学教材中的标准参考书。
大多数科学研究需要随机抽样。图片来源:维基媒体。比如2000年出版的经典社会统计学教材《社会研究方法:定性和定量方法》中写道,如果要随机抽样,可以用一百万本书。昆士兰大学数学教授安东尼j理查森(Anthony J. Richardson)、康奈尔大学工程学荣誉教授阿尼姆h梅伯格(Arnim H. Meyburg)及其同事伊丽莎白s安普特(Elizabeth S. Ampt)甚至指出,《百万》这本书是最知名的随机数表,大多数统计学教科书都会从《百万》这本书里提取一些随机数。这本书也广泛应用于游戏设计和模拟。开发者在设计一款游戏时,需要让玩家时不时遇到不可预知的情况,从而增加游戏的沉迷度。这时候也需要大量的随机数。
实际上,在麻省理工学院数字媒体教授尼克蒙特福特(Nick Montfort)和佐治亚理工学院助理教授伊恩博格斯(Ian Bogost)撰写的《与光束: Atari视频计算机系统赛跑》(Racing the Beam : the Atari Video Computer System)一书中,提到了游戏设计师经常在数百万本书中使用随机数。兰德还表示,到目前为止,Million Book仍然是已知最大的随机数来源,统计学家、物理学家、市场分析师、民意测验专家和质量控制工程师仍然在使用这本书里的随机数。比如桥梁焊接部位的定期检查需要随机数,因为工程师不可能对每个焊接部位都进行调查,所以要随机抽取几个样本进行调查。
甚至有传言说,美国海军潜艇利用这本书里的数字不规则航行,以免被敌人发现。但搞笑的是,纽约公共图书馆一开始把这本书归类为《心理学》。
除了《百万》这本书,2013年9月5日,美国国家标准与技术研究所(NIST)开始每60秒发布一次高质量的随机数。这些随机数表虽然又大又方又好,是重要的工具,但却是计算机安全的“禁书”。这是因为这些公开的随机数不再是秘密,也就是说,它们已经失去了不可预测性。坏人可以用这些已知的随机数破解密码,所以不能用于加密。美国国家标准技术研究所也强调这一点。
国家标准与技术研究所(NIST)的红字警告:不要使用我们的随机数进行加密!图片:beacon.nist.gov/home随机数成名后就不“随机”了,因为它已经不能给人惊喜了,这才是真正的惊喜。数学老师的作业:这本书很经典。建议你全部背下来。封面:连线参考:https://docs.qq.com/doc/DVEhpVXpOY1VXSktX
本微信官方账号转载、引用的文章、图片、音视频文件的版权归著作权人所有,由此产生的相关后果由著作权人、原发布者、内容提供者承担。如有侵权,请联系删除。

其他教程

我爱你就像天上的云彩是什么歌(我爱你爱的好辛苦可你从来都不在乎是什么歌)

2022-8-14 1:21:35

其他教程

反ps软件叫什么(反p图软件是真的吗)

2022-8-14 1:23:44

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索