首页/文章/ 详情

相关与因果是矛盾的吗?

10月前浏览102

    从重视因果性到重视相关性,是大数据思维的转变之一。但很多朋友都知道:我在谈论工业大数据的时候,经常强调:这个说法不适合工业大数据。然而,吴军在他的《智能时代》中也强调“相关非因果”。我一直很欣赏吴军的观点。难道我真的错了吗?

 

仔细看,原来吴军在“相关”前面加了一个“强”字。他用香烟的例子说明什么是“强相关”:人们可以找到大量的例子说明吸烟与肺癌相关,但却找不到因果关系。读到这里,我明白了:我们两个用不同的词语,表达同样的思想。

 

 1987年,我买了人生中第一本哲学书《科学研究纲领方法 论》,这让我接触到了科学哲学中的证伪主义学派。这本书的影响直接体现在我的硕士论文中。至今我仍然相信,所谓的因果性,只是排除了我们认识到的、足以影响事物进程的干扰;所谓的科学规律,本质上都是对统计结果的解释。我在几次报告中指出:在客观世界中,绝对的因果是不存在的、只能无限逼近、持续接受证伪的考验。具体地说,如果认为一个结论是成立的,就要寻找更多的证据、更精确的证据、从更多的角度发现证据、强调证据的独立性并建立更加严密的证据链、消除可能的反例;同时,你的观点必须能被已知的科学理论解释......这样,在不断证伪的过程中,结论的可靠性不断增加、“相关性”逐渐向“因果性”靠拢。但理论上讲,这个过程是没有终止的,技术人员只能适可而止。  

 

我的这种观点,一方面反对简单的、停滞于肤浅相关性的不严肃、不科学的做法——这种做法常常导致错误的结论;另一方面,反对对数据分析的无限苛求——苛求不仅会扼死创新的机会,还会花大量不必要的时间、降低数据分析的效率。

 

至此为止可以看到:我所谓的“因果性”就是吴军的“强相关”。换一个角度说:如果我们把简单的“相关性”和极端的“因果性”看作两个极端,则两者之间还会有很长的“灰度地带”。作为一个严肃的科技工作者,绝对不应该满足于简单的“相关性”,而要让自己的坐标向“因果性”靠拢。科学研究的过程,起始于“相关”、终止于相对理想的“因果”; 但对企业的技术人员来说,固执己见地追求绝对的“因果性”是不合适的。

 

本文写作背景:

刚才看到傅一平先生在公 众号"与数据同行”上发布“读吴军的《智能时代》”一文。发现我和吴军的观点颇为相似。傅一平先生提到书中7个观点,第一个观点在我93年的硕士论文中就研究了,第二个观点是我最近想写而又没写的;第三、第四个观点谈概率,我多年前就想写本书、上周四在公 众号上写的《智慧和愚蠢隔着一个概率》就是相关的话题;第五个观点基本赞同、但略有差异;我经常提起与第七个观点类似的说法。本文是针对第六个观点。

来源:蝈蝈创新随笔
理论
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2023-07-20
最近编辑:10月前
蝈蝈创新随笔
只是把思考的日志搬运,不当之处...
获赞 88粉丝 10文章 1159课程 0
点赞
收藏
未登录
还没有评论

课程
培训
服务
行家

VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈