《大数据时代》



终于读完这本对于我来说相当大部头的一本书了。虽然其中有许多不理解的地方,但书里的例子还是非常新的,收获很大。(我会说我读完这书就变成谷歌和亚马逊的脑残粉了吗,让我早出生几年吧,我要去买他们公司的股票......)书中有许多主题之外的知识,挺有意思的,比如讲到大数据的重点是在于发现“是什么”而不是“为什么”的时候:

首先,我们的直接愿望就是了解因果关系。即使无因果联系存在,我们也还是会假定其存在。研究证明,这只是我们的认知方式,与每个人的文化背景、生长环境以及教育水平是无关的。

普林斯顿大学心理学专家,同时也是2002年诺贝尔经济学奖得主丹尼尔·卡尼曼(Daniel Kahneman)就是用这个例子证明了人有两种思维模式。第一种是不费力的快速思维,通过这种思维方式几秒钟就能得出结果;另一种是比较费力的慢性思维,对于特定的问题,就是需要考虑到位。

卡尼曼指出,平时生活中,由于惰性,我们很少慢条斯理地思考问题。所以快速思维模式就占据了上风。因此,我们会经常臆想出一些因果关系,最终导致了对世界的错误理解。

父母经常告诉孩子,天冷时不戴帽子和手套就会感冒。然而,事实上,感冒和穿戴之间却没有直接的联系。有时,我们在某个餐馆用餐后生病了的话,我们就会自然而然地觉得这是餐馆食物的问题,以后可能就不再去这家餐馆了。事实上,我们肚子痛也许是因为其他的传染途径,比如和患者握过手之类的。然而,我们的快速思维模式使我们直接将其归于任何我们能在第一时间想起来的因果关系,因此,这经常导致我们做出错误的决定。

(我们在思考问题的时候确实很容易直接将其“因果化”,这个观点很有意思啊。)

又比如:

直到1884年,在美国华盛顿召开的国际子午线会议上,25个与会国家中的24个国家一致同意将英格兰格林尼治定为本初子午线和零度经线所穿过的地方(只有自命不凡的法国投了弃权票)

恩.......


然后就是这本书的内容,确实给人很多启发。

知识结构:

一、可以分析更多的数据,不再依赖随机抽象

二、数据如此之多,不在热衷于追求精确度

三、不再热衷于因果关系

四、“数据化”

五六、大数据如何改变了商业、市场、社会的本质

七、大数据的负面影响

八、在大数据时代倡导的一系列规则


首先是大数据时代的信息特点,书中将其归为三点:1.不依赖于随机抽样   2.不追求精确度   3.不热衷于因果关系 。这三个关系中,前两个特点也引出了第三个特点

大数据时代将给我们带来预见未来的可能性,我们不再纠结于“为什么”,重要的是“是什么”。“是什么”将带给我们实际的解决问题,了解事情全貌的能力。例如书中反复提到的谷歌预测流感,亚马逊的用户推荐,这其中,流感爆发的原因和用户为什么可能买那些书并非重点,重点是这些事情确实在发生,提醒我们要做出反应。

随着技术的发展,以及大数据意识的形成,今后许多看起来与信息无关的事情都可能被“数据化”。今年寒假,百度推出“百度迁徙”就是利用了人们手机中的百度地图发回的位置信息,将其数据化之后形成了人口迁徙的直观图。这件事给我挺大震撼,书中看到的信息在现实找到了最新的例子。这个世界确实在发生着变革。而对于大数据的创新性的利用,能带来许多意想不到的东西。

如果将大数据比作一种资源,那么它最大的优点就在于它不随着人的利用次数而减少,相反,大数据的价值的挖掘就在于一次又一次的“二次利用”,人们收集数据的时候也许并不会想到未来的用途,但那些数据可以在被使用一次之后通过和其他数据结合的方式,获得人们意想不到的信息。

当然大数据也会带来负面影响,一方面是个人隐私的保护成为问题,人们可以通过大数据轻易地获得许多个人资料。而收集数据的机构并不能保证数据的使用方式——因为“二次利用”的原因,人们并不知道数据在未来会用在哪些地方。在最后作者给出的解决这一问题的想法是,让数据使用者承担责任,在使用数据前对风险进行评估,并且限制使用时间,过期就要删除所有的资料。

另一个负面影响是,人们也许会以某人有“犯罪的可能性”的原因对人进行惩罚,对于这个问题带来的负面影响,书里是这么说的

但是,主要的问题并不是出在社会需要面对更多威胁上,而是我们在人们真正犯罪之前对他进行惩罚否定了人的自由权利。我们永远不会知道这个受惩罚的人是否会真正犯罪,因为我们已经通过预测预先制止了这种行为,如此一来,我们就没有让他按照他的意愿去做,但是我们却依然坚持他应该为自己尚未实施的未来行为付出代价,而我们的预测也永远无法得到证实。

基于未来可能行为之上的惩罚是对公平正义的亵渎,因为公平正义的基础是人只有做了某事才需要对它负责。

主张预测的国家是保姆式的国家,而且远不止如此。否认个人为其行为承担责任实际上就是在摧毁人们自由选择行为的权利。 如果国家做出的许多决策都是基于预测以及减少风险的愿望,就不存在所谓个人的选择了,也不用提自主行为的权利。无罪,无清白。如此一来,世界不止不会进步,反而在倒退。

这种利用方式就如克隆一般,打破了这个社会以往的认知方式。一旦成真,将会对我们的社会带来很大的冲击吧。

大数据确实有很大的能量,足以改变我们的生活,并且我们只有几年的时间去适应。但是,大数据的局限性也是绝对不能忽略的,大数据展现的是一个大方面,其中的细节并不能一一呈现,这会给我们的判定带来一定的风险。因此,在书的最后,作者说

 大数据预测结果也并非铁定,而只是提供了一种可能性,也就是说,只要我们愿意,结局可以改写。我们可以判断出迎接未来的最佳方式,摇身变作未来的主人,正如莫里在海与风的广阔世界中乘风破浪一般。在过程中我们无须理解宇宙的奥秘或是去证明神的存在,因为大数据已经帮我们做好了。

 大数据是一种资源,也是一种工具。它告知信息但不解释信息。它指导人们去理解,但有时也会引起误解,这取决于是否被正确使用。大数据的力量是那么耀眼,我们必须避免被它的光芒诱惑,并善于发现它固有的瑕疵。

无论如何,大数据给我们带来的是一种参考,一个方向,并非是准确无误的信息。人类的命运还是掌握在自己手上,我们依旧拥有最终的选择权与创造的能力。

 西方谚语有云:“预测未来最好的办法就是创造未来。”这句话在大数据时代亦应当铭记。在福特时代,任何人都无法从数据中看到汽车将替代马车,福特所创造的是无法预测的全新篇章。


评论 ( 13 )
热度 ( 32 )

© 芝士猫 | Powered by LOFTER