昨天晚上彩票开多少?
人类追求预测未来的本领大概已经有上万年的历史,古代的算命大师靠占卜为高官显贵指点迷津,现代的分析师靠建模为机构客户分析市场。人们信奉那句话:“有数据,再加上一点数学,任何事都可以有答案;数据和数学,两者兼具,那么答案便毋庸置疑。”
然而现实是残酷的,无论是占卜大师,还是金融分析师,都免不了翻船。人类靠数学解救过去的伤痛,但结果发现,数学似乎并不能够拯救未来。人类用确凿无疑的数据和分析得出匪夷所思的结论,这是一件可怕而且很酷的事情。
这本书的封面非常简洁,上面印着一句话:“数学和统计有办法解释一切事儿,但是它们解释不了自己。”在互联网时代,人类可以收集到越来越精确的数据,以至于知道昨天晚上开出了几注双色球。不过很遗憾,即使你拥有全世界所有的彩票数据,也不能够预测下一期的中奖号码(排除人为操纵结果的黑天鹅事件)。数学解释不了这个事件。
全书分成12个章节,涵盖了政治、体育、军事等广泛领域,从多个角度说明了统计推论的局限性。第一个章节就用二战时期美军战鹰归巢这个经典案例,证明了统计推论不能解决实际问题。美军的轰炸机在欧洲遭遇德军重创,损失惨重。为了解决损失率高的问题,美军请来了一批数学家和统计学家为飞机加固装甲。统计学家在收集了大量回航飞机上弹孔分布数据之后,建议把机翼部位进行装甲加固。
这个建议看似正确,实则错误。因为如果把回航飞机和坠毁飞机的弹孔分布结合起来,就应该知道大部分弹孔在机身和尾部时,坠毁机率最高。而只有屁股和脑袋足够坚硬,飞机才有可能在受伤之后返航。所以正确的结论是,要把飞行员和机组成员的“屁股和脑袋”保护好,而不是机翼。
书中后面的章节继续展开论述了“数学能解释一切事物的谬论”。比如,对于投票制度的探讨,认为投票结果受到投票机制的影响,而非人民意愿。
对于体育竞技水平的变迁提出了反对意见,认为人们对体育明星的观察存在幸存者偏差,而且对于竞技水平存在选择性偏见。对于战争中敌方炮火落点规律和城市犯罪率的分析,是书中非常精彩的分析章节。最后一个章节探讨了大数据预测中出现的各种偏差问题,非常具有现实意义。
在阅读本书时,经常会引发人们的阵阵笑声。因为书中列举的各种例子和计算方法,在现实生活中比比皆是,但是结果却出乎人们的意料。比如在探讨投票制度演变过程中,就出现一个非常有趣的章节。在这个章节中,作者将3个男人竞争1个女人大数据分析到了极致。用3个男人和1个女人的爱情故事,去类比投票制度的改革。通过对3个男人的偏好排序,去分析不同制度下的投票结果。最终得出结论,投票的结果受到投票机制的约束,而非人们内心真实想法的表达。
书中对于体育竞技成绩变迁的研究,引发了人们对于体育水平和投资收益率的反思。人们在评选最佳体育运动员、最佳投资基金的时候,往往把目光放到当年度最优秀的运动员和收益率最高的基金。然而仔细分析,运动员和基金都受到竞争者能力的影响,人们往往受到幸存者偏差的影响,而忽视了当年度最好的运动员和基金,在下一年度未必是最好的。比如2015年度股票基金收益率冠军汇添富移动互联,但是在2016年则大幅度下跌。这种现象是幸存者偏差造成的,因为没有哪个差运动员和差基金,会被列入评选当年最佳运动员和当年最佳基金。
在战争中炮火落点的分析章节中,作者对统计推论的局限性进行了最为深刻的探讨。作者把对炮火落点的分析过程,进行了极为详细的阐述。通过对不同地方中弹率的分析,证明了最危险的地方,恰好是未中弹区域。这个结论从直觉上是错误的,但是经过缜密的数学分析后,却是一个正确的结论。因为中弹区域和未中弹区域仅仅相差几个数量级,从敌人进攻方向来说,没有差别。而作为己方的防御方,就应该在中弹少的区域进行强化防御。这个结论看似匪夷所思,实则逻辑严密。同样该现象反映在城市管理中也是如此,犯罪率高的区域进行强化管理之后,犯罪率会下降。但是并不意味着全市范围犯罪率的下降。因为犯罪分子会选择新的犯罪地点,新的地点就会取代原来的地点成为高发区域。
最后分享一下心得,在互联网时代,预测未来越来越成为人们追逐的目标,大数据则成为