看到统计学,我第一时间是想逃离,但是当我翻开这本书后,觉得如果换个名字可能更加贴近中国市场--《魔鬼大数据》。
虽然统计学和大数据这两个词,在国内已经差不多达到一个妇孺皆知的地步,但是相比之下,大数据显得更加亲民。
这本书首先从一个葡萄酒的案例来切入主题,他讲述的是这样的一个故事:一个数据分析师做了关于红酒价值的统计数据,他提出了一个公式,按照这个公式就可以计算出某个年份酒的总体品质,进而推导出哪种红酒更具有升值潜力。
他的这个做法引发了传统葡萄酒评论家的反对,因为当评论家们谈论某一款酒,会用各种散文般的文学词汇来描述酒的感觉,最终神秘的告诉别人某款酒更优质。
但对于数据分析师来说,这些修辞手法都不需要,咱们直接输入年份、降水量、温度等等数据就可以得出结论。
最终的市场结果是:数据分析师的结论正确率不见得弱于前者。
这种传统葡萄酒评论家在这本书里可以被同归为直觉主义者。他们的共性是依照自己的个人经验来判断事物。当发现自己的直觉和经验,有可能受到数据分析的挑战时,很有可能引发强烈的抵触。
而与之对应的,严格采取大数据分析的人们,正是这本书里提到的数据分析师们。
这本书其实是将社会学的方法如何从学术领域向实际决策领域传播,从书中可以看到和解释我们身边很多有意思的现象,从中我们会发现:原来大数据分析早已深入到我们生活的方方面面。
记得还在几年前,用手机打10086查询余额的时候,可以直接切入人工客服查询。而现在在进入人工客服之前,会有一堆的语音提示,他们的首选项会告诉你,你可以用自助服务来查询,而且排名第一的正是我们需要的余额查询。
这种方式是移动公司通过数据挖掘来找到用户的需求规律,进而优化了客户服务。
如果说超级数据在企业界的应用是我们最容易理解和接触到的,那么在第3章的概率治国就可以让我们看到国家是如何运用。
在印度某些偏远山区的学校里,老师缺勤问题非常严重,这导致当地的学生无法正常的接受政府提供的教育。
一位专家决定使用数据分析的方式来解决这个问题。
他在教室里设置了照相机,而且这种相机具有无法篡改的日期和时间戳的功能。
每个老师在上课的结束和开始的时候,都要让学生拍下自己在课堂的照片,而且这一记录会绑定教师的工资和出勤率。
最后的效果是:教师的缺勤率从40%下降到了20%,而且照相机学校的学生在标准化考试中的成绩明显的比以前更好,他们被学校录取的可能性也高出了40%。
在国家层面之外,另一个重要的应用是医疗领域,虽然作者提出了很多医疗领域的应用,但是我最感兴趣的是作者的这一段话:"医疗记录的迅速数字化,意味着医生终于有机会对于全民医疗保健经历中包含的丰富信息加以利用了。"
这意味着医生可以根据病人的具体情况和检查结果,从而推测出病人有可能患某种特定疾病的可能性。
不过这种推测,需要依赖医疗保健系统中无数使用者输入进相应的数据,比如医生,护士。
但我觉得这里有个细节值得商榷,这种医疗未来在中国更有可能实现。
因为和中国相比,美国各州过于自主,于是各种平台数据成为了孤岛,州医院的数据往往不会共享到中央政府。比如疫情期间,各州大量的医疗数据无法和中央数据库做联动,这导致了他们疫情的应对反应比中国远远落后。
不过美国也不见得没有解决的机会,因为随着2021年大量疫苗研制成功之后,中央政府完全可以借此机会建立全国范围的医疗数据联网,也许那时候,作者所说的医疗未来才会出现在美国吧。
这本书里对于信息全面数字化的展示,既让人激动又让人害怕。因为作者提出在未来,传感设备很可能会普遍的存在于我们社会中的每一方面,比如在商品里内置了传感设备,他们会分析出记录下我们购买商品之前的犹豫时间,携带商品的移动距离,以及是否会把这个商品和其他商品一起用。
而这些传感器很可能是纳米级别的,它在特定的环境中无处不在,像尘埃一般随风飘动。
那么那时候美国人民最在意的隐私权将会被重新定义。因为传统的隐私保护的是过去和现在的信息,而大数据所指向的隐私权指的是未来的信息。数据挖掘不仅仅会知道一个人去年做了什么事情,更多的价值在于它可以预测出一个人明年会做什么事。
而这些隐私权,在中国,你懂的。
合上这本书,如果要说有遗憾,我觉得他忽略了中国互联网这个样本。
书中所说的各种电商的预测行为在中国早期已经有了,而且做得更加的深入。但实际操作中依然有很多不足的地方,比如当我某一天兴趣来潮,在A购物网站上搜了手机的信息之后,后面一年时间,可能我的各种网页弹出推送里全是手机。
大数据的确捕捉到了我的兴趣点,但是却没有预测到我的需求可能在B购物网站里已经得到了释放。所以信息孤岛会导致每一家企业在做信息推送时候的不确定性和延后性。
但是如果是短视频平台,这问题的影响就被淡化了很多。
比如抖音app,它会根据用户关注的点赞以及下载量来推送相应的兴趣视频,同时也会不停的穿插新的兴趣视频。最重要的是,抖音会在一段时间之后,降低某个视频博主的推送频率,取而代之的是新的视频博主内容。这样做的好处是,既满足了用户对原有兴趣的维护,同时不至于因为看腻了同一个视频博主而转换平台。
如果想了解一下大数据如何应用在国外的各个方面,可以看一下这本书《魔鬼统计学》,但是我觉得:大数据的未来,属于中国。