首页/文章/ 详情

大数据能改变科学研究的模式

8月前浏览297

今日大暑。我突然想起10多年前一项有趣的研究。

我研究了季节对钢材强度的影响。发现了一种有趣的现象:钢材的强度与季节有关。我把11日定义为11231日定义为365。我用数据进行了建模。两种钢种的强度预报与日期的关系大体如下:  

强度与季节的关系:钢种1

强度与季节的关系:钢种2

我们发现:钢种强度最高的时候,大体发生在大寒季节附近;强度最低的时候,大体发生在大暑附近。

这个研究某种程度上验证了人们的猜想。我们注意到:季节的影响不大,只有±1%左右,甚至比常规测量误差都小。对钢种性能产生影响的因素却非常过去,这样的模型很难建立起来。我们能够建立这个模型,是因为我们积累了多年、大量的数据,从而把干扰去除。

大数据时代,科学研究的手段和方式会发生很大的变化。  

昨天早上,在中科院工作的博士班同学董教授打电话给我,谈起一件事情:有位癌症病人自称,通过练气功改善了病情。有没有办法通过科学的办法进行研究这类问题?我们都认为:传统的科学方法是很难研究的,但大数据时代则是有可能的。  

我对董教授讲了一件事:我在宝钢工作时,每天上下班要经过一个隧道。隧道东面一公里多有座桥。上班时,我开车从桥到隧道方向走,往往觉得从桥到隧道的时间很短。下班时,从隧道出来往桥的方向走,往往觉得时间很长。我开车的速度应该基本一样,肯定是感觉出了问题。  

这件事引发过我的一个思考:人类对“时间的感觉”到底是怎么回事?是早晚差别导致的,还是从明亮度变化导致的?传统上,人的“感觉”是一种主观的东西,很难用科学的方法去研究。但是,如果我们能找到成千上万的人去做实验,也许能找到统计学上的差异,从而能用科学的方法加以研究。  

这就是大数据时代的优势。  

我的同学王博士在加拿大做教授。昨天下午和晚上,我们回顾了过去的一些经历。我也谈到了十多年前的这项研究。我其实发现了很多有意思的事情。比如,某个元素含量对强度的作用不是线性关系,而是与平方根成正比;某些因素的作用是可加的、有些是平方相加再开根号。这些发现,往往是过去人们没有意识到的。我根据模型做了很多预测,发现这些函数非常准确。  

大数据的一个重要作用,就是可以帮助我们剔除各种干扰,把一些较弱的影响显示出来。当数据足够多的时候,大数据就像“显微镜”一样,能把一些细节问题呈现出来。可以说,大数据能为许多新的研究提供条件。而这些方法恰恰是我们30多年前一起读研究生时就试图用的。可惜的是:当时没有足够多的数据,这个方法很难用好。我写硕士论文时,就提出了这个问题。这也是我放弃当初研究的原因。  

同学问我:这样重要的发现,为什么不能写成论文?我告诉他:因为这种研究的过程不规范,不符合当代科学研究的规范。写了也没法在有影响力的论文上发表。只能作为技术工作。但我相信,未来的学术界应该会接受这种方法。但接受这种做法的同时,恐怕也会产生大量滥竽充数的骗子。现在很多人打着AI的幌子搞这类研究,就很容易误入歧途。  

来源:蝈蝈创新随笔
理论科普
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2023-09-02
最近编辑:8月前
蝈蝈创新随笔
只是把思考的日志搬运,不当之处...
获赞 88粉丝 10文章 1159课程 0
点赞
收藏
未登录
还没有评论

课程
培训
服务
行家

VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈