前几年,网上曾流传过一个帖子:上海高 官纷纷抛售房产,总共挂牌豪宅5000多套(精确到个位数)。这个帖子传播非常广泛。见到这个帖子,我评价道:典型的谣言——谁来界定高 官、谁来界定豪宅?如果不能界定,怎么能统计到这么准确?
我一直担心大数据分析被人当成“包治百病”的算命先生。主张用科学的态度对待数据分析。但刚刚看到某院士的报告,让我更加忧虑:
不知他援引哪里的数据:某企业用大数据预测市场需求,准确率达到92.2%,库存周期缩短20%。用以证明大数据作用很大。看到这样的数据,我的怀疑就是:92.2%是怎么算的?比最简单的算法(上个月预报下个月)高了多少? 20%会这么巧?对于这样的报道,我至少是会产生怀疑的。中国科技界信誉一直很差,且不少汉芯的陈进骗取国家1.5亿,而是普遍性的:很多省级单位的科技进步奖入门是效益3~7个亿,报奖项目效益之和超过GDP增量,可能吗?更何况在科技圈子里面混的,是不知道这种浮夸的风气呢?由此可见,道听途说是不可信的。
受到条件的限制,我们不可能对每个消息都严格论证。但是,在公共场合讲话的时候,一般不会采纳哪些缺乏逻辑支撑、似是而非又难以考证的结果。这也是有科学素养的表现。作为院士在大会上给出疑似浮夸的例子,最大可能的作用,是把大数据的泡沫吹大,让真正做事的人很难、让不吹牛的人难以生存——因为吹牛的人已经给业界树立了标杆、用户会按照这样的要求去要求做事的人。于是,这位院士实际上是逼着人们说假话。
科学家、院士有社会影响力,也是有社会责任的。如果你的话可能被人信,就不能乱说。正如当年某学者用“科学方法”证明 “亩产万斤”的可能性,对当年的浮夸风是有责任的、是愧对饿死的百姓的。
我的很多朋友对市场上的浮夸很反感,而我则是对院士的要求比较苛求。为什么呢?有个故事指的品位:鲁迅经常讽刺某人翻译出错。有人就对鲁迅说:人家不是拿着国家的钱留学的。此后鲁迅就不再批评他了。同样,市场浮夸是为了生存、尚且可以接受,但院士拿着国家给的钱和荣誉却乱说话,就实在不应该了。