第二天。
徐辰打开pubpeer,看到了那条简短而傲慢的回覆。
【作者回復】:感谢关注。鑑於该论文发表时间较早,原始数据的归档检索较为复杂。但我们对研究结果的完整性和结论的科学性充满信心。因此,对於此类匿名的推测性指控,我们不予置评。
“充满信心?不予置评?”
徐辰看著屏幕,气笑了。
这哪里是回復?这分明就是赤裸裸的敷衍和傲慢!
“年代久远就能当挡箭牌?一句『充满信心』就能死无对证?”
“行,既然你们不见棺材不落泪,那我就给你们来个大的。”
徐辰的眼神变得锐利起来。
他意识到,光靠这一篇论文的几张图,確实很难锤死一个诺奖大佬。毕竟人家可以说这是“误操作”,是“图片误用”,大不了发个勘误就混过去了。
要想彻底揭穿这个谎言,必须要有更系统、更全面的证据!
……
徐辰打开了python,手指在键盘上飞快地敲击。
“既然要锤,那就锤死。”
“既然塞门扎这篇论文有问题,那我们就顺藤摸瓜,看看他的其他论文。”
徐辰编写了一个专门的爬虫脚本。
目標:pubmed资料库。
对象:塞门扎及其团队过去20年发表的所有论文。
抓取內容:所有western blot、免疫萤光、流式细胞术等实验图片。
“运行!”
“顺藤摸瓜,我倒要看看,你这棵大树底下,到底埋了多少雷!”
……
隨著回车键按下,爬虫开始疯狂工作。
数千篇论文,数万张图片,如同潮水般涌入徐辰的硬碟。
紧接著,徐辰启动了他刚刚编写的“图像查重算法”。
这个算法融合了sift特徵点匹配、频域分析以及他在slrm中用到的几何相似度计算。它就像是一只不知疲倦的猎犬,在海量的图片数据中,寻找著那些被隱藏的“双胞胎”。
……
这一夜,徐辰没有睡。
电脑的风扇在疯狂咆哮,cpu和gpu都在满负荷运转。
屏幕上,进度条一点点推进。
每隔几分钟,就会弹出一个红色的警告框:
【警告!发现高度相似图片组!】
【来源1:2008年《jbc》,图3a】
【来源2:2012年《pnas》,图5c】
【相似度:99.9%(经过旋转180度並水平翻转)】
……
【警告!发现图像復用!】
【来源1:2014年《cancer research》,图2b】
【来源2:2016年《oncogene》,图4d】
【相似度:100%(仅调整了对比度)】
……
看著屏幕上不断跳出的红色弹窗,徐辰的表情从最初的震惊,逐渐变成了冷笑。
这哪里是偶尔的失误?这分明就是一场持续了二十年的造假!