爆发:大数据时代预见未来的新思维 - 中国高校教材图书网
书名:
爆发:大数据时代预见未来的新思维
ISBN: 978-7-300-15474-9
责任编辑:
作者:
艾伯特-拉斯洛·巴拉巴西
相关图书
装订: 平装
印次: 1-1
开本: 16开
定价:
¥59.90
折扣价:¥53.91
折扣:0.90
节省了5.99元
字数:
270千字
出版社:
中国人民大学出版社
页数:
出版日期:
2012-07-09
每包册数:
10
国家规划教材:
省部级规划教材:
入选重点出版项目:
获奖信息:
内容简介:
网络时代以我们不可想象的速度发展着,作为网络科学的先驱,阿尔贝拉斯为读者展现了一个不一样的网络世界,以及未来。读者可以了解网络世界真正的内涵,还能知道如何利用它,影响它。
作者简介:
全球复杂网络研究权威,“无尺度网络”的创立者。美国物理学会荣誉会员,匈牙利科学院外籍院士,欧洲科学院院士。 美国东北大学教授,网络科学研究中心的创始人、主任,同时任职于哈佛大学媒体学院医学系,并担任丹那-法伯癌症研究所癌症系统生物学中心的研究员。 他提出无尺度网络模型,2006年因此荣获了匈牙利计算机学会颁发的冯•诺依曼金质奖章,是建立基于网络共性的统一科学理论的先行者,是复杂网络界引述最多的科学家。 世界著名科技杂志《popular science》杂志赞誉,“他可以控制世界”。
章节目录:
推荐序一 生活抵触随机运动吗
胡泳 北京大学新闻与传播学院副教授、洞察中国社会数字化进程第一人
推荐序二 在科学和历史之间
姜奇平 中国社科院信息化研究中心秘书长、《互联网周刊》主编
推荐序三 不在爆发中爆发,就在沉默中沉默
周涛 电子科技大学互联网科学中心教授、博士生导师
引言 历史不会重演,却自有其韵律
虽然万事皆显出自发偶然之态,但实际上它远比你想象中容易预测。马克•吐温曾说过:历史不会重演,但却自有其韵律。忘掉那些将生命看做掷骰子或是巧克力盒的比喻,把自己想象成处于自动驾驶状态的做着美梦的机器人,你就会更加接近真相。
【选举产生新教皇】
第一部分 人类看待自身和世界的传统思维
第1章 在无数个“显微镜”下现形
扩散理论
人类跟悬浮在水中的花粉微粒其实没什么不同。我们大部分时间也是运动不止。不同的是,我们不是受到微小而不可见的原子的撞击,而是被转化成一系列任务、责任以及动机的不可见的神经元的颤动所驱使。很多新工具都能追踪人类的活动,都能预见我们的下落:不是当下的,而是未来的。
【决斗在贝尔格莱德】
第2章 15分钟,36分钟,还是36小时
转化模型
安迪•沃霍尔说:“未来每个人都有15分钟的成名机会。”然而一只无形的手在放慢人类左右的进程,在今天这个信息饥渴的时代,一条新闻在多长时间之内才算新?我们真的能度量转瞬即逝的成名吗?
【血腥预言】
第3章 是接受绝望,还是追随希望
量子力学
如果有透视未来的千里眼,历史不会重演,人类的动机和欲望也不会重复:我们总是想要更好、更多、更不一样的东西。正如我们以揭开次原子世界的真相为目标进行的物理研究一样,是不是说人类就会变得完全或部分可预测?
【圣战奇兵】
第4章 上帝从不掷骰子
泊松分布
只要遇到无法理解的事情,我们就会说那是偶然,似乎这种表面上的偶然行为推动了历史的演进,而事情发展之迂回曲折似乎如掷骰子一般。但这种偶然真正意味着什么呢?
【一场始料不及的大屠杀】
第二部分 爆发,大数据时代的新思维
第5章 爆发,无处不在
爆发的本质规律:幂律分布
长时间休息之后就会出现短时间的密集活动,就像贝多芬音乐中悦耳的小提琴声被雷鸣般的鼓声打断一样。事实上,从人们对维基百科的编辑,到货币经济公司的交易;从人和动物的睡眠模式,到魔术师为了保证魔杖时刻停留在空中而进行的小动作,所有的一切都证明:爆发点无处不在。
【内格雷克之战】
第6章 请学会偶尔说“不”
爆发的起点1:优先级模型
时间是我们最宝贵的不可再生资源,如果我们尊重它,就必须设定优先级。一旦优先级设定了,幂律规律和爆发的出现就不可避免。优先清单会帮你剔除无关紧要的事,帮我们把烦心的日常琐事转化成永远排队的异常值,让我们的注意力集中到真正重要的事情上去。
【圣十字架从不发生意外】
第7章 来一次爱因斯坦式的时空穿越
爆发的起点2: 信件模型
我们发现了前电子时代人们通信的基本模式,而实际上,不管我们的信息是在电脑上以光速传播,还是用蒸汽机船慢慢地漂洋过海,我们的通信模式都是一样的,就连伟大的爱因斯坦也不例外……
【调查】
第8章 在陌生的地方重新开始
爆发的轨迹1:信天翁模型
从人类记忆的搜寻到网络的信息查找,一切已经证明,查找某个特定目标的最佳策略不是最明显、最系统、最规律的搜寻模式,而是具有爆发性、间歇性,甚至是偶然性的搜寻模式。
【“恶棍!”】
第9章 我们不会永远漂泊
爆发的轨迹2:手机模型
手机数据帮我们解决了这个自相矛盾的问题:如果人类活动遵循列维模式,我们就永远找不到回家了路,但实际并非如此。事实证明我们不会永远漂泊。我们逃脱了定律的诅咒,每次都能回到家中。
【革命吧!】
第10章 每个人都是习惯的奴隶
爆发的频率:熵
我们到底有多好预测?我们最终能够为这个一直困扰我们的问题给出一个定量的答案了。虽然人与人存在很多不同,但我们的可预测程度都差不多,无情的统计规律使得异类根本不存在。我们的行踪都深受规律影响,而且它的影响力比我们想象中要大得多。
【特兰西瓦尼亚牵制战】
第三部分 谁掌控着我们的未来
第10章 爆发来到大数据时代
数据,是一把双刃剑
虽然我们的过去由安全防火墙和隐私法保护着,但通过精密系统的预测,我们的未来却极易被人掌握。未来比过去更具价值,那么谁掌握着我们未来行为的信息?谁又会从中获利?
【塞克勒人VS. 塞克勒人】
第11章 爆发的世界里没有黑天鹅
爆发,生命奇迹的必要因素
生命远不是流畅或随机的,而是在所有时间尺度内都具有爆发性的——从几毫秒到几小时的细胞活动;从几分钟到几周的人类活动模式;从几周到几年的疾病来袭;从几千年到几百万年的进化过程。爆发,是生命奇迹的必要因素,是生物为了适应和存活所进行的不懈斗争。
【决战】
结语 爆发,宇宙运行的科学
我们正在一个聚合点上,在这里数据、科学以及技术都联合起来共同对抗那个最大的谜题——我们的未来,既是个人的又是社会的。无处不在的爆发,是科学的台柱,而它的影响力将与20世纪初期的物理学或者基因革命的影响力不相上下。
【血肉之躯】
译者后记 309
精彩片段:
第7章 来一次爱因斯坦式的时空穿越
爆发的起点2: 信件模型
艾伯特•爱因斯坦——当时已经是个知名物理学家了,但还不是几个月后变成的那种媒体名人——在1919年春天收到了一封来自名不见经传的同僚西奥多•卡鲁扎(Theodor Kaluza)的信。1908年,师从大卫•希尔伯特(David Hilbert)和赫尔曼•闵可夫斯基(Hermann Minkowski)的卡鲁扎完成了他的第一篇也是仅有的一篇论文。此后,他一直在重复研究那篇论文中的问题。十年过去了,已经34岁的卡鲁扎仍然碌碌无为,呆在学术界的最底层的他只能靠微薄的收入养家糊口。当最终完成了第二篇论文之后,他壮着胆子将论文寄给了爱因斯坦。随后,在1919年4月21日那天,他收到了一封颇具鼓励性的回信:“我也时常琢磨着电场被拦截这个问题。但从来没想到将它放在五维立体世界中研究。这个想法对我乃至全世界来讲都是全新的。”
现在,我们在物理课堂上所教的五大基本力的其中三种——引力、磁力以及电力——在1919年时已经被卡鲁兹和爱因斯坦所熟知了。长期以来,这三大作用力之间似乎难有联系。然而,詹姆斯•克拉克•麦克斯韦(James Clark Maxwell)在1864年却发现电力和磁力可以联合起来形成一种力——电磁力。他的成功激励着一代又一代怀有梦想的物理学家,一直到现在人们仍然试着研究出一种方法来使自然界的各种力保持一致,以成就一部万物论。
1919年,统一引力和电磁力仍然一个难以攻克的难题。基于此,卡鲁扎提出了一个出人意料的解决方法。他指出,假设世界不是三维而是五维的话,这两种力就能结合。这一假设自然会让人们不知所措,因为没有人能想象出那个神秘的五维世界是什么样。但卡鲁扎是那种看书学会游泳的人,所以他一直对理论知识怀有坚定的信念。这次也不例外,虽然这种想法有点违反直觉。
卡鲁扎写信给那位科学巨人并不只是出于礼貌——他想请爱因斯坦帮他发表他的论文。当时,像爱因斯坦这样的著名科学家都被誉为优秀科学杂志的守门人。如果爱因斯坦对某篇论文感兴趣,他就会在柏林科学院(Berlin Acadamy)的会议上加以推荐,之后论文就会发表在院报上。令卡鲁扎高兴的是,爱因斯坦愿意帮他。
一周后,也就是4月28日那天,爱因斯坦又给卡鲁扎写了一封信。信的开头相当鼓舞人心:“我读了你的信,而且发现它很有趣。我觉得实现这个理论没有什么不可能。”
不过,下面的内容就相对含蓄了:“但我必须承认里面的观点现在提出来还不具备什么说服力。”
对论文提出一些技术性问题和建议后,爱因斯坦接着说道:“如果你能精确地运用经验知识做出验证,我保证你的理论将是正确的。“
爱因斯坦答应卡鲁扎帮他打开学院大门,但有个条件:“如果上述有关测地线的问题解决的话,我会在学院面前呈交论文的简缩版。请不要责备我,因为在提交论文时,我会署上我自己的名字。”
想象一下几个星期来一连收到两封来自当时最具影响力的物理学家的信时,卡鲁扎会是什么样的心情吧。每封信都那么鼓舞人心,而且爱因斯坦一连写两封信更证明他是真的被这位没什么名气的物理学家的想法迷住了。但这些信也揭开了很多问题,以至于这篇论文多年都未成功发表。
先有爆发式,还是先有电子邮件
2005年,在纪念爱因斯坦奇迹年百年诞辰之际,我应以色列科学院(Israeli Academy of Science)之邀去耶路撒冷(Jerusalem)做演讲。会议日益逼近,但我的心思却没放在那上面。最近,优先级模型又出现了一些耐人寻味的新问题。你应该还记得,我们发现电子邮件通信具有间歇爆发性特征,也就是说在沉寂一段时间后人们总会疯狂地发送邮件。基于此,我开始考虑爆发模式到底是电子时代的副产品,还是显示出了人类活动的更深层次的真理?我们之前所做的所有研究——从电子邮件到网络浏览器——都或多或少跟电脑有联系。所以我们不禁要问一个逻辑性问题:爆发性和电子邮件到底谁先出现的?
我很快意识到,一些著名学者的信件都被后人完好地保存着,所以我想也许能从中找到答案。在网上搜索一番后,我将目标锁定在了艾伯特•爱因斯坦档案室(Albert Einstein Archives)上。这是耶路撒冷希伯来大学(Hebrew University of Jerusalem)的一个项目,他们的任务就是搜集所有爱因斯坦的信件并编纂入目。由于他们迟迟未给我回信,我干脆将他们的地址塞进背包,进行第二项计划:先庆贺爱因斯坦的奇迹年,然后去找爱因斯坦档案室的“老家”犹太国家图书馆(Jewish National Library)。
得来全不费工夫,几天后我受邀去参加一个耶路撒冷的招待会。我在那里结识了一些与会的著名科学史家。当我提到想研究爱因斯坦的信件时,他们指了指那个正好站在我背后的人。很快,我就被引荐给了戴安娜•科莫斯•布赫瓦尔德(Diana Kormos-Buchwald)——加州理工学院的历史系教授,爱因斯坦文件计划的负责人。她确信我找的那些资料虽然不完整,但确实存在而且已经被编纂入目。回国后,她把我介绍给了一同负责爱因斯坦文件计划的加州理工学院高级研究助理提尔曼•绍尔(Tilman Sauer)。联系了两周后,我就收到了艾伯特•爱因斯坦的全部信件,其中包括他跟西奥多•卡鲁扎的通信。
世界是多维的?
卡鲁扎在1919年5月1号给爱因斯坦的回信中打消了他的顾虑,促使爱因斯坦又在5月5号给他回了信:
亲爱的同仁:
我很乐意将你论文的部分摘录提交给学院的会刊。同时,我建议你将寄给我的手稿发表在杂志上,比如《数学杂志》(Mathematische Zeitschrift)或者《物理年鉴》(Annalen der Physi)。只要你愿意,我随时乐意以你的名义将论文提交上去,而且会配以我的简单介绍。
是什么让爱因斯坦这么快就改变了主意呢?我们可以从信中发现一些迹象:“我现在相信,根据实验证明,你的理论已经无懈可击了。”
这个结果对卡鲁扎来说再好不过了。爱因斯坦这位以无止境地追求用实践攻克所有数学问题而闻名的伟人接受了他的观点,承认了我们的世界是五维的。你和我可能都不怎么明白什么是五维世界,但意识受限绝不会阻止一位对数学理论极具洞察力的物理学家的脚步,他会坚持不懈地揭开宇宙的奥秘。如果数学证明世界是更多维的,谁又能够阻挡呢?
爱因斯坦多久回信
爱因斯坦的通信异常频繁——他一生共寄出了大约14500封信,收到了16000多封。这意味着,他成年后平均每天(算上周末)不止写一封信。虽然很惊人,但我感兴趣的不是他的通信数量。我关心的是优先级模型,我想弄清爱因斯坦会等多久才会回信。
我的研究小组里有一位聪明的葡萄牙籍物理系学生若昂•伽马•奥利维拉(João Gama Oliveira),是他最先对加州理工学院提供的数据做了研究。他的分析表明,爱因斯坦的回信模式跟我们的电子邮件模式差不多:他会立即在一两天内回复大量信件。然而,有些信要在他的桌子上呆几个月甚至是几年才会得到答复。令我们没想到的是,若昂的观察表明爱因斯坦的回信时间跟我们之前检测到的电子邮件回复时间一样都遵循幂律分布。
若昂和我首先担心的是爱因斯坦回信模式中的长期间隔是由于资料库中信件不全造成的。然而,加州理工学院的提尔曼•绍尔向我们保证,那些长期间隔绝对是因为时间耽搁了。比方说,爱因斯坦在1921年10月14日给克朗尼格(Ralph de Laer Kronig)的回信中这样写道:“我在累积成山的信件中发现了您去年9月份那封有趣的来信。”的确,记录表明克朗尼格的信被埋在爱因斯坦的桌子上一年多都没得到回复。
但是,不止是爱因斯坦的通信遵循这样的模式。通过英国剑桥大学达尔文通信项目(Darwin Correspondence Project),我们获得了查尔斯•达尔文的所有信件记录。由于认真的达尔文将所有寄出以及收到的信件都备了份,他的通信记录就相当准确了。我们的分析发现,他也是马上回复大量信件,只有极少数会耽搁不回。总的来说,达尔文的回信时间跟爱因斯坦的一样都严格遵循幂律规律。
两位不同时代(爱因斯坦在达尔文去世前3年出生)、不同国籍的学者的通信记录都遵循一样的规律这一事实,不是表明我们在窥视某人的特殊癖好,而是发现了前电子时代人们通信的基本模式。这也意味着,不管我们的信息是在电脑上以光速传播,还是用蒸汽机船慢慢地漂洋过海,我们的通信模式都是一样的。事实上,不管是过去还是现在,时间对我们来说都异常珍贵。我们必须设定优先级,就算是伟大的爱因斯坦和达尔文也不例外。如此一来,拖延、爆发点和幂律分布就会不可避免地出现。
但电子邮件和纸质信件之间还是存在一个特别的差异:两者数据集中的幂——定性幂律的关键参数——不同。 这种差异意味着,在电子通信模式中长时间被耽搁的信件要比纸信通信中少。基于电子通信的即时性,这种差异也并不令人吃惊。
然而,事实上这种差异不是发信时间造成的。数十年来的研究结果表明,定性幂律的幂不是一个任意值,而是与通信模式背后的潜在原理紧密联系的。也就是说,如果一个能够描述两种现象的幂律的幂不同的话,那么支配这两种体系的原理就有本质的不同。所以这种差异表明,如果想说明爱因斯坦和达尔文的通信模式,我们就必须建立一个新模型。
将卡鲁扎打回原点
受到爱因斯坦的鼓励后,西奥多•卡鲁扎很快按照要求做了改动,寄去了一份适合在院刊上发表的简缩版论文。他的事情已经很明朗了——不到四个星期他就收到了四封回信,这表示那位著名的物理学家已经破格将他的事放在了优先位置上。但爱因斯坦在1919年5月14日那天的回信中又显得颇为冷淡。“我最最亲爱的同仁,”他写道:“我已经收到了你为学院准备的论文。不过,在对你的问题进行仔细考虑后,我发现了另外一个难题,而且直到现在我都无法解答。”
利用四点论推导法,爱因斯坦详细说出了自己的困惑,并在最后总结道:“或许你能找到一个解决方法。无论如何,我会等到这些问题解决后才递交你的论文。”
就这样,爱因斯坦将卡鲁扎打回了原点。
到达率与回复率
在优先级模型中,我们假设一旦首要任务完成,任意一项新的优先任务就会将之代替。要想得出爱因斯坦通信的精确模式,我们需要将这个模式作一番修改,加上一些纸信通信的特点。的确,在蜗牛邮件模式下,邮递员每天都会送来一定数量的邮件,然后这些信就加入到了等待回复信件的大军中去。只要时间允许,爱因斯坦会从一大堆信件中选择他认为最重要的加以回复,然后将剩下的留待下一天处理。所以爱因斯坦的通信模式包含着两个因素:
1)我们将其中一种概率称为到达率,也就是到达爱因斯坦桌子上,开始排长队的信件。他会从其中选出一些优先信件。
2)另外一种概率我们称为回复率。他会选择优先级最高的信件加以回复。
如果爱因斯坦的回复率大于信件的到达率,那么他的桌子总体上看会干净很多,因为他在收到信后会立即回复一大部分。在这种亚临界状态下,通信模型显示爱因斯坦的回信时间符合指数分布,其中没有长时间耽搁的情况。很明显,这与我们观察到的幂律分布不同。
不过,如果爱因斯坦的回复率小于信件的到达率,那么日复一日他桌上的信件就会越堆越高。有意思的是,只有在这种超临界状态下,回信时间才符合我们之前观测到的爱因斯坦和达尔文通信模式所显示出的幂律分布。所以,爆发性的出现表明爱因斯坦已经无暇分身,以至于被忽略的信件越积越多。 但他真的那么忙吗?
虽然在奇迹之年只有7封信件留存,但我们完全可以说在1905年这位尚不知名的专利承办员肯定有时间将通信放在首位。的确,那个时候关注他的只有他的家人和朋友。十年后,也就是1905年时,他已经成为知名物理学家了。这时他有责在身,不得不隔几天就写封信。虽然那个时期只有12封信留存,但这既不能表明他特别重视通信,也不能看出其中有特别的延误。
但如果爱因斯坦能够勤于通信——正如他在1919年及时回信给卡鲁扎那样——那么他的回信时间就会符合指数分布而不是我们观测到的幂律分布。也就是说,如此一来他的通信模式中就不会有延误和爆发点出现。
书 评:
其 它: