參考文獻:(上下滑動可瀏覽)
2.21
知識分子
The Intellectual
圖源:pixabay
撰文 | 張?zhí)炱?/strong>
01
中國醫(yī)院占據(jù)前三名
近日,《自然》雜志發(fā)布了一份研究報告,首次從機構(gòu)層面對全球論文撤稿現(xiàn)象進行系統(tǒng)性分析。
在《自然》統(tǒng)計的“撤稿率最高機構(gòu)”中,中國山東濟寧市第一人民醫(yī)院以超過5%的撤稿率(2014-2024年)成為世界上撤稿率最高的科研機構(gòu)。該院平均每發(fā)表20篇論文,就有1篇被撤回,撤稿率超過全球平均水平50倍以上[1]。
濟寧市第一人民醫(yī)院早在數(shù)年前就出現(xiàn)大規(guī)模的學(xué)術(shù)不端事件。2020年,加州學(xué)術(shù)誠信調(diào)查員伊麗莎白·比克(Elisabeth Bik)發(fā)現(xiàn)了400 多篇內(nèi)容高度雷同,疑似來自統(tǒng)一論文工廠的論文,這些論文幾乎全部來自中國的幾十家醫(yī)院,其中濟寧市第一人民醫(yī)院的論文最多,超過100篇[2]。
在事件曝光后,據(jù)《澎湃新聞》報道,濟寧市第一人民醫(yī)院從2021年9月7日到2022年1月21日陸續(xù)發(fā)布10份通報,涉及107篇論文和107起學(xué)術(shù)不端事件,對相關(guān)責(zé)任人分別給予院內(nèi)通報批評、科研誠信誡勉談話、黨內(nèi)警告、行政警告、免職等處理措施[3]。
在自然的新研究中,分列撤稿率榜單二三名的是河北滄州市中心醫(yī)院、河南大學(xué)淮河醫(yī)院,撤稿率約為3.5%左右。在撤稿率前十的機構(gòu)中,中國機構(gòu)占據(jù)七席,均是醫(yī)院以及醫(yī)學(xué)院。除上述三家醫(yī)院,濰坊市人民醫(yī)院、臨沂市人民醫(yī)院、新鄉(xiāng)醫(yī)學(xué)院第一附屬醫(yī)院、齊齊哈爾醫(yī)學(xué)院也進入了前十。其他三席由巴基斯坦的加齊大學(xué)、埃塞俄比亞“亞的斯亞貝巴”(Addis Ababa)理工大學(xué)、印度KPR工程技術(shù)學(xué)院占據(jù)。
圖源:
https://www.nature.com/articles/d41586-025-00455-y
《自然》的撤稿分析基于三家研究誠信公司提供的數(shù)據(jù):Scitility的Argos、Research Signals的Signals,以及Digital Science的Dimensions Author Check。這些公司通過整合Retraction Watch(撤稿觀察)的數(shù)據(jù)庫、Crossref的出版數(shù)據(jù)、PubMed的索引以及期刊網(wǎng)站信息,構(gòu)建了全球撤稿數(shù)據(jù)集。
雖然不同數(shù)據(jù)來源得出的結(jié)果有差異,但機構(gòu)撤稿仍有一些共性規(guī)律,中國小型醫(yī)院和醫(yī)學(xué)院始終占據(jù)著主導(dǎo)地位。
根據(jù)Dimensions的數(shù)據(jù),在撤稿率超過1%的136家機構(gòu)中,大約70%為中國機構(gòu),其中接近60%為醫(yī)院或醫(yī)科大學(xué)。Argos數(shù)據(jù)庫統(tǒng)計的186家撤稿率1%以上的機構(gòu),也呈現(xiàn)出相同的規(guī)律。對不同類型機構(gòu)的分析還顯示,中國醫(yī)院的撤稿率普遍高于高校,屬于撤稿率最高的一類機構(gòu)。
醫(yī)院是學(xué)術(shù)不端的重災(zāi)區(qū)。2023年國家自然科學(xué)基金委第一批不端行為案件處理結(jié)果通報中,8起案例有7起當(dāng)事人都是來自各醫(yī)院、醫(yī)學(xué)院、醫(yī)科大學(xué)。2023年第二批通報中,也有三分之一案例和醫(yī)院、醫(yī)學(xué)院相關(guān)?;?015年至2020年國家自然科學(xué)基金委員會通報數(shù)據(jù)的一項研究也顯示,被處理的人員中專業(yè)為生物醫(yī)藥類的占比約75.9%[4]。
一項通過人工智能算法識別論文工廠論文的研究顯示。論文工廠最初產(chǎn)量只有每年幾篇,至2014年已達每年上百篇,而自2018年起更是躍升至每年上千篇。在SCI收錄的論文中,醫(yī)院是論文工廠產(chǎn)出論文的主要來源,占比高達67.5%。進一步分析全球醫(yī)院發(fā)表的SCI論文發(fā)現(xiàn),幾乎所有的論文工廠論文均出自中國的醫(yī)院[5]。
這些醫(yī)院暴露的問題高度相似,年輕醫(yī)生為滿足職業(yè)晉升的論文要求,不得已從“論文工廠”購買偽造數(shù)據(jù)或直接發(fā)表偽造的論文。伊麗莎白·比克指出,這些醫(yī)生承受著巨大的壓力,因為他們必須發(fā)表論文才能獲得工作或晉升。
在《知識分子》過去關(guān)于撤稿問題的文章中,一位青年研究人員曾經(jīng)介紹,很多省份的衛(wèi)健委都規(guī)定評職稱需要論文,而且有很嚴格的計分的方式,不只是篇數(shù)的問題,還要考核影響因子。近年來只有廣東等少數(shù)地區(qū)不再把論文作為評職稱的必要條件。
“很多人斥責(zé)掠奪性期刊,但很多醫(yī)生沒有辦法,必須要發(fā)論文才能評職稱,所以甘心被掠奪。根本性的原因可能還是逼良為娼的制度。”這位學(xué)者說[6]。
02
誰是撤稿大國
統(tǒng)計過去10年的撤稿數(shù)量,排名前列的不少中國機構(gòu)。但值得注意的是,只統(tǒng)計過去5年(2020—2024)撤稿數(shù)量,印度和沙特阿拉伯的幾家科研機構(gòu)主導(dǎo)了榜單,這是因為它們在2023年Hindawi的撤稿潮中受到了更大的影響。
2023年,Hindawi發(fā)布了超過9,600篇撤稿聲明,撤稿數(shù)量史無前例。本次《自然》研究報告也顯示,Hindawi是撤稿的重災(zāi)區(qū),旗下4種期刊自2014年以來的撤稿率超過20%,另有4種超過10%,占據(jù)了期刊撤稿排行榜的最前列。
這些撤稿論文也有部分中國科研人員參與。受到此次撤稿事件影響,2024年初,教育部科學(xué)技術(shù)與信息化司發(fā)布通知,要求各高校開展撤稿論文自查工作。全面檢索中英文科技文獻數(shù)據(jù)庫,對過去3年來本單位、本人署名(第一作者、通訊作者)的科研論文被撤稿情況進行全面梳理,核實論文撤稿的原因,并嚴懲學(xué)術(shù)不端行為。
教育部的撤稿自查通知指出,這些撤稿行為以及其他出版商的撤稿行為“已對我國的學(xué)術(shù)聲譽和學(xué)術(shù)環(huán)境產(chǎn)生了不利影響”。
不過撤稿數(shù)量很大程度上和機構(gòu)和國家的體量有關(guān),排在前列的撤稿概率未必突出。從撤稿率看,2014至2024年間,在全球范圍內(nèi)過去十年中發(fā)表的 5000 萬或更多篇文章中,有大約 4 萬篇(不到 0.1%)被撤稿。中國學(xué)者參與的撤稿論文占比近60%(逾2萬篇)。目前中國整體撤稿率約為0.3%,三倍于全球平均水平。
埃塞俄比亞與沙特阿拉伯的撤稿率甚至比中國要更高,根據(jù)不同的數(shù)據(jù)源,伊拉克與巴基斯坦以及俄羅斯撤稿率也與中國的水平相當(dāng)。相比之下,美國、英國等國的撤稿率約為0.04%,遠低于全球0.1%的平均水平,許多國家甚至更低。總體來看,中國的撤稿率大致排名在第3到第5之間。
撤稿的原因,也有可能是無心之失或者編輯上的錯誤,但證據(jù)表明,大多數(shù)案例與學(xué)術(shù)不端行為相關(guān)。《自然·人類行為》今年年初的一篇評論文章調(diào)查顯示,20.5%的中國撤稿論文和論文工廠有關(guān)[7]。
03
仍在增長的撤稿
盡管撤稿并不是一個大概率的事件,但在2014到2024年間,撤稿聲明(期刊宣布論文撤回的公告)的增長正在加速,公告數(shù)量從2014年不到2,000,增長到2023年超過12,000。這一方面是由于論文工廠的興起,另一方面是學(xué)術(shù)偵探發(fā)現(xiàn)了更多的問題。
從2014年到2022年,論文撤稿率呈現(xiàn)出顯著上升的趨勢,2022年發(fā)表論文的撤稿率已達約0.2%。2023年和2024年的撤稿數(shù)據(jù)看起來比較低,但可能是因為這兩年發(fā)表的論文還沒有經(jīng)過足夠的時間來暴露問題。通常情況下,論文的撤回需要一段時間,比如幾年后才會被發(fā)現(xiàn)和撤回。
盡管全球撤稿率持續(xù)上升,但已曝光的問題可能僅是冰山一角。法國圖盧茲大學(xué)計算機科學(xué)家紀堯姆·卡巴納克(Guillaume Cabanac)認為,一些領(lǐng)域或機構(gòu)之所以擁有較低的撤稿率,可能僅僅是因為它們避免對存在的問題進行調(diào)查。
在去年發(fā)表在《自然》上的評論文章中,紀堯姆介紹了自己開發(fā)的用來檢測學(xué)術(shù)論文中“扭曲短語”(Tortured phrases)的工具。人工智能生成或者多次翻譯以逃避抄襲檢測的論文中,可能會有一些無法理解的短語出現(xiàn)。
比如人工智能(Artificial intelligence)被翻譯成偽造意識(Counterfeit consciousness)或者人造腦力(Man-made brainpower)。前段時間,中國一篇把摘要(Abstract)翻譯成抽象(Pumping elephant)的撤稿論文也犯了這類錯誤。因為Abstract在一些翻譯軟件上會被譯成“抽象”,抽象兩個字拆開來翻譯到英文就出現(xiàn)了Pumping elephant這種看不懂的詞。
如果一篇文章出現(xiàn)多個這類錯誤,那造假的可能性可想而知相當(dāng)高。截至 2023 年 8 月 20 日,紀堯姆開發(fā)的工具已經(jīng)發(fā)現(xiàn)16,000 篇引用了 5 個或更多此類扭曲短語的論文,但被撤稿的只有18%[8]。
催生畸高撤稿數(shù)量和比例的,可能是鼓勵發(fā)表的短視政策。
印度的自由數(shù)據(jù)科學(xué)家、印度研究觀察組織(IRW)創(chuàng)始人阿查爾·阿加瓦爾(Achal Agrawal)發(fā)現(xiàn),印度高撤稿率機構(gòu)幾乎全部集中在教育重鎮(zhèn)泰米爾納德邦的私立院校,這符合他的分析。在他看來,印度公立大學(xué)和政府機構(gòu)的研究人員面臨的發(fā)表壓力小于私立機構(gòu),私立機構(gòu)不僅鼓勵學(xué)生和教師多發(fā)論文,某些情況下還為發(fā)表論文提供獎金。
在2024年1月發(fā)布的預(yù)印本論文中,阿加瓦爾曾對撤稿觀察數(shù)據(jù)庫中25個國家的撤稿數(shù)據(jù)進行簡單的研究,發(fā)現(xiàn)過去五年論文出版數(shù)量和撤稿聲明率有著高度正相關(guān),發(fā)文數(shù)量大量增長的國家往往撤稿率也迅速提升。雖然相關(guān)不代表因果,但不健康的激勵制度很可能是高撤稿率的元兇。
“這讓人對目前重數(shù)量輕質(zhì)量的激勵制度提出質(zhì)疑,”阿加瓦爾寫道[9]。
[1]Richard Van Noorden. (2025). Exclusive: These universities have the most retracted scientific articles. Nature.
[2]麻省理工科技評論.(2020).驚天學(xué)術(shù)造假!400余篇論文或來自同一“論文工廠”,涉及數(shù)十家中國醫(yī)院.
[3]賈利略.(2022).濟寧市第一人民醫(yī)院10月被撤6篇論文:編造研究過程、代寫代投.《澎湃新聞》
[4]陳賓賓 & 薛建龍.(2022).高??蒲姓\信總體情況實證分析及治理建議——基于國家自然科學(xué)基金委員會2015—2020年通報案例.今日科技(09),66-68.
[5]邸利會.(2022). 中國醫(yī)療界為何治不了自己論文造假這個 “病”?.《知識分子》
[6]張?zhí)炱?(2024). 中國掀起撤稿自查風(fēng)暴的背后.《知識分子》
[7]Xu, S. B., & Hu, G. (2025). Combating China’s retraction crisis. Nature Human Behaviour.
[8]Cabanac, G. (2024). Chain retraction: how to stop bad science propagating through the literature. Nature, 632(8027), 977–979.
[9]Agrawal, A. (2025). Country-wise Retraction Analysis from 2022-2024. Increased Publishing Leading to Higher Retraction Rates.
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.