数据文明发展的时间线

 

我们在woflf|Aplha处理可计算的数据时所做的各种努力,已经将我们带回到了人类历史的开端,事实上,它们的发展已经与整个文明的进程具有令人着迷的紧密关系。

去年,我们邀请了当今著名的数据权威参加wolffram 数据会议,作为交流的一部分,我们绘制了一个系统化数据和可计算知识的历史发展时间表。今年,在快到Wolf2011年数据会议时时,我们采纳了收到的评论和建议,制作了一个1.5米长的时间线海报,同时,也在web上发布了一个简单内容介绍。

Historical data timeline

时间线上的故事告诉了我们:在不断的进步中,我们的文明是怎么样系统性的产生越来越多的知识领域(收集数据并关联到他们),逐渐使他们从可操作到自动化。

在通常的历史讲述中,这些进步被极少的关注,然而他们中的大多数在今天却如此显耀,度量衡,日历,字母表,数据图表,字典,地图,音乐符号,股票表,时间表,公共记录,邮政编码,气象报告,这些事物都在帮助我们描述和组织世界。

从历史上看,有观念则必有起源,大多数情况下,所发生的事情是那些在某些方面有效的改变世界和一个组织或个人在介绍系统化方法方面处于领先地位。

有时候,这些事件是强有力的或出名的,但的确它们经常是隐藏在“密室意识”之中,正如它们是在解决一个实际的问题-通常刚开始是低调的不被人所知的,然而,经过一段时间后,他们所发明的事物中隐含的模式随着需求的增长逐渐的传播开来。

大多数人听说过欧几里得,他定义了一种使数学系统化的方法,或者朱里亚凯撒,他使得每年的月份标准化,很少人听说过季多,他在公元1030年发明了五线谱,柯德瑞在1604年可能是第一个发明了以字母排序的词典,本间中久,他在1755年发明的可能是历史上第一个市场价格表(又称:烛台图表-译者注),布莱德萧在1839年发明了火车时刻表,戴逊在1946年发明了标准化学命名方法(此处似乎不确-译者注)

当观看整个时间线时,会发现几个明显的革新层级。第一个层级是体现或描述事物的体系。像经度和纬度(大约公元前200年被埃拉托色尼发明),代数符号(大约在1595年由韦达发明),物种分类命名(大约在1750年由卡尔林尼克斯发明),法律案件引用(大约在1873年由谢巴德引进),色彩空间(1931年出现),国际单位制度(1954年出现),美国国家信息交换标准代码(1963年出现)互联网域名解析(1983年出现)。

 

第二个进步的层级是关于收集事物的知识体系或宝库。如公元前3000年的巴比伦土地记录,公元前1250年底比斯图书馆,托勒密星表(公元150年),永乐大典(1403年),美国人口普查(1790年),名人录(1849年),天气图表(罗伯特·费兹罗伊1860年),牛津英语词典(从1880年代),黄页(1886年),化学文摘(1907年),棒球统计(1913),盖洛普民意测验(1935年),

基因序列数据库(1982年)。

另外一个层级则更加抽象,是在处理知识的形式方面发挥作用。像算术(在公元前2000年),语法(帕尼尼在公元前400年左右),逻辑(亚里士多德在公元前350年左右),人口统计(约翰格兰特在1662年),微积分(牛顿和莱布尼茨在1687年),流程图(1921年),计算机语言(1957年),地理信息系统(1962年),关系型数据库(1970年代)

当然,像Wolfram|Alpha所去尝试做的那样,我猜想亚里士多德在公元前350年前努力对世界上的对象进行归类并使用逻辑进行形式推理时,也思考的类似的事情。

在1680年代,莱布尼茨,他非常希望将人类的一切问题转换为统一的符号语言,使用一个具有逻辑的机器去获取答案,但不能这样认为,亚里士多德和莱布尼茨生活得太早以至于不能使得这些事情做好。但偶然的,这些想法也会在历史上重新出现,例如在1910年十进制图书分类法,在那个电报为基础的年代,Paul Otlet、Henri la Fontaine实际收集了1200万索引卡片信息,带着在经营问题应答中心的思想(即:用户把想知道的东西以拍电报或寄信的方式发送到该中心,由其进行查找并回复-译者注),在1937年,威尔斯表达了他的愿景“世界大脑”,在1945年,范内瓦·布什描述了他的memex机器(即:早期的电脑构想,包括存储,检索,运算等,http://baike.baidu.com/view/59894.htm介绍-译者注),这些都提供了一个进入世界知识的途径(世界知识被计算机化成为可能-译者注)。在1950和1960年代,知识在未来将被计算机化已经视为理所当然,在同时代的电影如《电脑风云》,《2001太空漫游》,或者电视剧《星际迷航》都有所体现。

然而假设一下,一个重大的革新应是“人工智能”-人类智能的自动化。多年过去之后,人工智能沉寂了,然而我们在使得知识更加广泛的计算机化却取得了太多的进步。

我再谈点其他的内容,我自己的重要认识-从我的基础研究-一种新的科学中呈现出来,即:在人工智能方面,最终不可能有什么特别的事情了,它的全部就是计算。但为了计算,我们从哪里获取原始的素材?这也是我们Wolfram|Alpha所做的工作:对整个时间表上的丰富历史进行有效的直接使用。应该说,作为一个对思想历史感兴趣的人,时间表上汇集的实际进程是非常令人着迷的。我们的工作开始于对Wolffram|Alpha所覆盖的知识领域的观察。实际上,向前追溯,努力去发现每个领域在早期历史上的历程,有时候大多数人已经知道这些历史,但通常我们只惊叹于这些事物存在的历史悠久-或者如此晚近出现。在一些情况下,当我们确信(在数据文明的发展历史中-译者加)存在一个不错的故事前,我们不得不求教一连串的专家。

时间表上的每个时间都是单独记录的-我十分好奇的想看到,当整个时间线组合好之后,将会出现什么事情。当然,可以预料得到,时间表上的事件显示的是很随意的,并且对近代以来的很多进步抱有偏颇之见,主要还是他们没有存在如此之久以至于让今天看起来比较重要。

但当我第一次看到全部时间表时,首先震惊我的是有两个国家的贡献如此显耀:古巴比伦和美国政府。巴比伦(第一个伟大的人类文明)带给我们如此多的事物,例如:人口普查、标准化计量、日历、土地注册、法典、数学用表。对美国而言,(在时间表上显得如此显耀-译者加),可能是白手建国(意即美国建国是从一无所有开始-译者注)的精神,或者可能是“民享”的理念,但早在1785年(随着美国土地法令的建立),美国政府就已经开始进行大规模的、一系列系统性的数据收集工作。

在这个时间表上,一个非常明显的问题是:所有的这些事件是怎么在时间和空间上分布的?

Plot showing the number of events per decade and per century

这里展示了每个十年和每个实际所发生的事件的数量。

Cumulative version of plot showing the number of events per century

这个表展示了这些数字累加起来的情况。

在第一个表中,我们发现在古希腊的黄金时代有一个爆发点,在文艺复兴、工业革命、计算机革命中也有这样的情况。当观察这个累加的图形时,我们发现在公元前500年左右活跃的中心由巴比伦转移到希腊,在公元1000年左右转移到欧洲大陆(罗马帝国那些数字不太高),在1600年左右,英国开始起步,到18世界中期,英国持续与欧洲大陆展开坚强的竞争。美国在1800年以前也开始活跃,但实际上在1900年早些时候才开始起步。

Pie charts illustrating how the share of events so far evolves over time

这些图表显示了迄今为止每个时间阶段中各个国家所发生的事件占据的份额。

公元前250年,古希腊超越了巴比伦,在1595年欧洲超越了希腊。英国在1786年短暂的超越了欧洲大陆。美国在1942年超越了英国。在1984年整个欧洲(今天也只有12%的差距)超越了之前所有之和。

这个图表中,一个明显的特征是在近代以来各种事物的加速增长。就像我前面提及的,不可避免的存在着偏见(通过遗留下来的去评价重要性-译者注),但对我来说,在时间线上有点引人注目的是在公元1000年前已经有接近20%的增长,在1800年和1900年分别有40%和60%的增长率,如果一个人观察最近5000年的情况,会发现一个惊人的指数级增长,每95年翻一倍。

现在我们回顾一下,时间线上不仅是关于技术或科学,也包括数据和知识。当你观察时间线时,你会问:“爱因斯坦在哪里?达尔文在哪里?哪里是空间计划?”实际上,他们没有在这里出现,因为尽管他们在科学和技术上有着突出的重要地位,他们不是这个时间线上的故事的组成部分:如何系统化数据和知识并使它以在世界上存在的本来面目来呈现。像我上面所说的,这个“密室历史”中的大部分在今天的历史书中都没有讲述。

在Wolfram|Alpha,我们也有大量的、正在逐渐增长的关于传统的科学/技术的发明和探索方面的信息。在时间线上,这些看起来有点区别,在中世纪较少活跃,在最近500年,稍微有点像指数增长,每75年增长一倍。

但对于这些时间线上的差异(应指的是时间线上每个时期活跃程度的差异-译者注)有它的意义-也许它反映了系统化数据和知识为世界发展提供了核心的基础,这些缓慢而稳固并逐渐的增长使得这些革新成为可能。

在Wolfram|Alpha工作时,我们清醒的看到人类经过如此漫长之路才达到我们今天所在的位置,但我们看到如此先进的技术已经成为可能时,是十分令人兴奋的事情。我很自豪的成为如此卓越和漫长历史中的一部分。当没有其他事情时,展示这个历史并制作一个好一点的海报。

 

译者介绍:林海龙先生,DAMA China会员,在ERP实施领域有10多年的经验,尤其精通财务业务领域(如财务共享服务,财务核算,财务资金,全面预算),熟悉SAP,Oracle财务管理功能,目前工作集中在企业架构、业务研究、J2ee开发等领域,日常兴趣集中在读书,范围较广泛,如:商业、哲学、历史等方面,可以通过elinzi@gmail.com他取得联系。 

原文地址:http://blog.stephenwolfram.com/2011/08/advance-of-the-data-civilization-a-timeline/