借AI“慧眼”鑒別可疑論文圖片|科技創(chuàng)新世界潮

2024-03-20 18:29:40 來源: 科技日報點擊數(shù)：

學(xué)術(shù)期刊工作人員正在核查分析蛋白質(zhì)和DNA的可疑圖片。圖片來源：《自然》網(wǎng)站

科技日報記者?劉霞

今年1月，英國分子生物學(xué)家肖爾托·戴維發(fā)表文章，指控美國哈佛大學(xué)醫(yī)學(xué)院附屬丹娜-法伯癌癥研究所科學(xué)家通過修改圖片偽造數(shù)據(jù)。隨后該研究所正式宣布撤回6篇論文，并糾正了另外31篇論文的數(shù)據(jù)。吹哨人戴維聲稱，這些造假論文發(fā)表于1999年至2017年，其中一些論文刊發(fā)于《細(xì)胞》和《科學(xué)》等頂級科學(xué)期刊。戴維是使用人工智能（AI）圖片分析軟件和手動檢測發(fā)現(xiàn)了論文中的問題。

《自然》網(wǎng)站在近日的報道中指出，上述事件只是冰山一角，對學(xué)術(shù)論文中出現(xiàn)可疑圖片的指控還有很多。面對學(xué)術(shù)偵探和公眾的審查，學(xué)術(shù)期刊正在積極部署AI工具，以檢測出可疑圖片。

可疑圖片層出不窮

可疑圖片包括在多個圖中使用同樣的數(shù)據(jù)，圖片部分或全部重復(fù)，以及拼接圖片等。有些可疑圖片是論文作者有意為之，誤導(dǎo)讀者；也有些是作者為了讓圖片變得更加美觀而作出些許改變。專家表示，不管基于何種理由，可疑圖片都損害了科學(xué)的完整性和嚴(yán)謹(jǐn)性。

專門關(guān)注學(xué)術(shù)不端和期刊撤稿的學(xué)術(shù)打假網(wǎng)站“撤稿觀察”維護(hù)的數(shù)據(jù)庫列出了51000多份需要撤回、更正的記錄。

美國科學(xué)圖片審查員伊麗莎白·比克及其同事對此開展了量化分析。他們研究了1995年至2014年間發(fā)表的20000多篇論文中的圖片，結(jié)果發(fā)現(xiàn)近4%的論文包含可疑圖片。這項研究還顯示，從2003年開始，論文中圖片重復(fù)出現(xiàn)的現(xiàn)象有上升趨勢，可能是因為數(shù)字?jǐn)z影技術(shù)使修改圖片變得更容易。

比克指出，與幾十年前相比，現(xiàn)在發(fā)表的論文數(shù)量與日俱增，論文中出現(xiàn)圖片的數(shù)量也水漲船高，可疑圖片也會有增無減。美國科學(xué)公共圖書館出版?zhèn)惱韴F(tuán)隊成員蕾妮·霍赫則認(rèn)為，可疑圖片問題的高報告率也可能源于“全球?qū)φ\信問題的認(rèn)識提高，舉報行為增多”。

丹娜-法伯癌癥研究所正在開展后續(xù)調(diào)查，該機構(gòu)研究誠信官員巴勒特·羅林斯表示，盡快糾正錯誤至關(guān)重要，這是具有強大研究誠信的機構(gòu)的常見做法。不過，她也補充道，論文中出現(xiàn)圖片重復(fù)或不一致并不能證明作者有意欺騙。

AI或充當(dāng)“火眼金睛”

為減少可疑圖片發(fā)表，包括《細(xì)胞科學(xué)》《公共科學(xué)圖書館·生物學(xué)》《公共科學(xué)圖書館·綜合》在內(nèi)的一些期刊，要求作者除了提交裁剪或處理后的圖片外，還要提交原始圖片。

許多出版機構(gòu)計劃將ImageTwin、ImaCheck和Proofig等AI工具，納入出版前檢查中?！犊茖W(xué)》雜志宣布使用Proofig篩選所有投稿。該雜志主編霍頓·索普表示，Proofig發(fā)現(xiàn)了一些問題，編輯因此否決了某些論文的發(fā)表，通常作者也對論文中的錯誤被識別出來表示感謝。

《自然》報道稱，即使圖片已經(jīng)被旋轉(zhuǎn)、拉伸、裁剪，或改變了顏色，這些AI系統(tǒng)都可以快速檢測出同一篇論文中的重復(fù)圖片。當(dāng)然，不同系統(tǒng)各有不同優(yōu)勢。

比克解釋稱，Proofig可以發(fā)現(xiàn)哪些圖片是通過剪切或縫合拼接而來；ImageTwin則使用戶能將某篇論文中的圖片與其他論文的大型數(shù)據(jù)集進(jìn)行交叉檢查。而一些出版商也在開發(fā)自己的AI圖片分析軟件。

研究表明，AI工具標(biāo)記的許多錯誤也有點“無辜”。Proofig對2021年和2022年初提交給美國癌癥研究協(xié)會9家期刊的1300多篇論文開展了分析，發(fā)現(xiàn)15%的論文可能存在圖片重復(fù)問題。論文作者的回復(fù)表明，207次圖片重復(fù)中，28%是作者有意為之，例如使用同一張圖片說明多個論點；而另外63%是無意的錯誤。

協(xié)同作戰(zhàn)不可或缺

這些科技期刊用戶報告稱，AI系統(tǒng)肯定能更快、更容易發(fā)現(xiàn)某些類型的圖片問題。但比克認(rèn)為，這些AI系統(tǒng)不太擅長發(fā)現(xiàn)更復(fù)雜的操作，比如AI生成的虛假圖片。英國生物學(xué)-生化與分子生物學(xué)類期刊《恩博報告》主編伯恩德·普爾弗也認(rèn)為，這些AI工具有助于檢測出低級別的誠信違規(guī)行為，但更多更嚴(yán)重的問題可能會急劇增加，目前的方法或許很快會過時。

《自然》指出，要想檢測出可疑圖片，在專家團(tuán)隊的專業(yè)素養(yǎng)、技術(shù)工具，以及提高警惕性等方面要協(xié)同發(fā)揮作用。普爾弗表示，隨著圖片處理變得越來越復(fù)雜，查找可疑圖片將變得越來越困難。

那么，從長遠(yuǎn)來看，如何最好地解決圖片濫用問題呢？

比克表示，科學(xué)家需要更多地關(guān)注嚴(yán)謹(jǐn)性和數(shù)據(jù)的可重復(fù)性，對學(xué)術(shù)不端可能帶來的影響和后果要保持敬畏之心。

責(zé)任編輯：左常睿

借AI“慧眼”鑒別可疑論文圖片|科技創(chuàng)新世界潮

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標(biāo)升級或更換您的瀏覽器

3.暫不升級，繼續(xù)瀏覽

借AI“慧眼”鑒別可疑論文圖片|科技創(chuàng)新世界潮

友情鏈接

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點擊下面圖標(biāo)升級或更換您的瀏覽器

3.暫不升級，繼續(xù)瀏覽

抱歉，您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式，這會影響您正常瀏覽本網(wǎng)頁

3.暫不升級，繼續(xù)瀏覽