江南打假神器来了?AI图像查重4小时筛查3500篇论文—新闻—科学网

时间:2023-09-22 00:12:22 已阅读:77次

7月23日,据 DeepTech深科技 微信公号报导,北京年夜学常务副校长詹启敏于Pubpeer消息网上被指涉嫌25篇论文存于试验图象反复、试验要领存于过错等问题。

7月24日,签名詹启敏的作者于 潇敏ScienceArt 公号上回应称,已经与论文互助者细心核实相干文章表述以及试验成果,当真开展会商,今朝并未发明数据造假以及学术不端环境。

试验图象反复 是论文被质疑的常见问题之一。此前,已经无数起论文打假对准了生物医学范畴,此中的一个要害靶点就是 试验图象反复 。

近日,Nature报导了美国计较机学者研发的一款图象查重软件,好像为倏地解决这一问题带来了但愿。该软件于4小时内筛查了3500篇论文,并终极发明了400个可能反复的图象。

不外,有学者以为,这款软件的错误谬误也很较着,由于图象反复纷歧定是过错。并且,软件以至会将相似的图象标志为反复。

知论理学术打假人Elisabeth Bik评价称,该软件 仍需要人工监视,以确保它不会呈现标志过错 。

新冠论文年夜筛查:4小时、3500篇论文、2.1万张图象

本年6月,雪城年夜学计较机学者丹尼尔 阿库纳(Daniel Acuna)哄骗开发的图象查重软件,提取以及比力了预印本消息网bioRxiv以及medRxiv上的3500篇论文,共2.1万张图象。

Daniel Acuna (图源:Syracuse University)

这一软件可批量筛查论文,找出反复图象,纵然颠末扭转、裁剪的图片也难逃它的高眼。Acuna的公司Resis使用这一软件为期刊以及研究机构提供办事,但今朝还未公然使用。

他说,于4个小时内,该软件就发明了约400个可能存于反复的图象。不外,Acuna以为年夜大都都没有问题。

他选择了24篇包罗 有趣 反复图片的论文,同时宣布于他本身创立的消息网以及PubPeer上。

这惹起了不小的惊动。论文作者们也反映纷歧。一些作者选择了认可过错并当即纠正;一些论文的作者则回覆说,有些过错于经偕行评断的论文版本中已经经纠正。

芬兰赫尔辛基年夜学病毒学家Giuseppe Ballistreri对于Acuna所做的事情暗示感激。他写道: 假如这个软件的运转成果是正确的,我以为应默许于PubMed中实行。

帮忙出书商筛查造假

今朝,期刊审稿年夜多依靠在作者提交的手稿图象,举行手动筛查。《欧洲份子生物学学会杂志》主编Bernd Pulverer先容说,整个历程很耗时,早就应该举行主动筛查以简化历程。

Acuna暗示,假如期刊编纂接纳近似软件,他们或许能更轻松地完成审查事情。

荷兰出书业巨头爱思唯尔科研诚信卖力人IJsbrand Jan Aalbersberg说,为发明图象反复使用问题,出书商需要创立一个包罗所有已经出书图象的同享数据库,以便举行比力。

2015年,Acuna及互助者就从其时揭晓于PubMed生物医学文献数据库开放存取的76万篇文章中提取了260万张图象。他们从中抽取约3750张标志图象举行手动筛查,并按照成果猜测,该数据库中1.5%的论文包罗可疑图象,而0.6%的论文存于图象造假。

需要人工调解成果

不外,也有人暗示,反复纷歧定是过错。Bik以为,该软件 需要人工监视。

Acuna赞成她的不雅点。他说,该软件尚没法按照上下文判定反复图片是否存于问题,需要报酬审查。

但这仍旧是有效的,只管Bik擅长于论文中查找反复的图象,但计较机可以经由过程比力数十万、数百万篇论文,来找到两篇论文中的反复的地方,这对于人类来讲是不成能完成的使命。 Acuna说。

一些研究职员则反应,Acuna的软件将相似的图象也标志为反复。同时,软件没法兼容广为风行的PDF文件格局,也是一个问题。

厥后,Acuna从他的消息网中删除了了约1/3的反复文章阐发,并将其加密。作者只要从他那里得到拜候密钥,才气看到相干成果。

来自德国海德堡的图象完备性阐发师Jana Christopher说,从更广泛的意思上讲,反复图象查重软件过在专一查找反复项,从而轻忽了图象的全貌。例如,两个被判断为反复的图象,实在只要很小的反复区域,于其他方面彻底差别。Acuna以为,革新细微不同是呆板进修前进的要害。

图象阐发于连续,造假者要警惕

即便该软件存于诸多问题,但Acuna暗示,他将继承阐发COVID-19预印本论文。今朝已经经阐发了5500篇,这个数字还于连续上涨。

他还会将预印本中的图象与数据库PubMed中的研究论文举行比力,这可能还会激发其他图象的反复使用。

我但愿作者能意想到,有人正于做如许的工作。 他说。

参考资料:

1.https://www.nature.com/articles/d41586-020-02161-3

2.https://www.nature.com/articles/d41586-020-01363-z

3.https://www.nature.com/articles/d41586-018-02421-3

4.https://doi.org/10.1080/08989621.2020.1793675

5.https://ischool.syr.edu/people����APP/directories/view/deacuna/

6. https://acuna.io/

7. https://www.thepaper.cn/newsDetail_forward_8416829

8. https://mp.weixin.qq.com/s/99t2qTQ7L_HguJpTb4mHdw

出格声明:本文转载仅仅是出在流传信息的需要,其实不象征着代表本消息网不雅点或者证明其内容的真实性;如其他媒体、消息网或者小我私家从本消息网转载使用,须保留本消息网注明的 来历 ,并自大版权等法令义务;作者假如不但愿被转载或者者接洽转载稿费等事宜,请与咱们联系。/江南