注:本文整理自知名科學(xué)偵探Elisabeth Bik的博客文章,原文題目是“Discontinuous ridiculous stools – a preprint full of tortured phrases and stolen data”。
“Patients with provocative entrail illnessunclassified gave to crisis division a 3-day history of sickness, retching, migraine and irregular stomach torment alongside discontinuous ridiculous stools as of late.(患有未分類挑釁性內(nèi)臟疾病的患者向危機(jī)部門陳述了為期3天的病癥:惡心、嘔吐、偏頭痛及不規(guī)則腹痛,近期伴有不連貫荒謬的便血)”
若您無法理解上面這句話,請(qǐng)不必?fù)?dān)心——大家都一樣。
扭曲短語
上面的文字充斥著“扭曲短語”(tortured phrases),這是作者試圖掩蓋抄襲行為常用的一種文本改寫方式。為逃過查重工具檢測(cè),他們通過“同義詞替換軟件”來處理復(fù)制過來的內(nèi)容,導(dǎo)致生成荒謬甚至可笑的短語。
常見的扭曲短語包括:
用“Counterfeit consciousness(偽意識(shí))”替代“artificial intelligence(人工智能)”
用“Profound neural organization(深刻神經(jīng)組織)”替代“deep neural network(深度神經(jīng)網(wǎng)絡(luò))”
用“Colossal information(巨型信息)”替代“big data(大數(shù)據(jù))”
用“Bosom peril(胸部危險(xiǎn))”替代“breast cancer(乳腺癌)”
用“Haze figuring(霧測(cè)量)”替代“cloud computing(云計(jì)算)”
此類扭曲短語由Guillaume Cabanac、Cyril Labbé和Alexander Magazinov在2021年預(yù)印本《Tortured phrases: A dubious writing style emerging in science. Evidence of critical issues affecting established journals》中首次提出[1]。
他們創(chuàng)建的“問題論文篩查數(shù)據(jù)庫”目前已收錄超過21,000篇包含五處以上此類短語的論文。大多數(shù)論文發(fā)表于2020年代初,2022年后頻率略有下降——可能因?yàn)镃hatGPT等生成式人工智能工具能更有效地重寫并隱藏抄襲文本。
來自“問題論文篩查數(shù)據(jù)庫”的圖表,顯示每年包含至少5個(gè)扭曲短語的論文數(shù)量
鏈接:https://dbrech.irit.fr/pls/apex/f?p=9999:24::IR_years
一篇充滿詭異同義詞替換的預(yù)印本
在Google Scholar中檢索扭曲短語“provocative gut illnesses”(常用來替代“炎癥性腸病”,IBD),博客作者在medRxiv預(yù)印本庫中發(fā)現(xiàn)了一篇“寶藏文章”:Baqir Ali Khalid等人所著的《Significance of headache in inflammatory bowel diseases》[2],最初于2023年2月上傳至medRxiv。七名作者來自巴基斯坦的五所大學(xué)和醫(yī)學(xué)院。
鏈接:https://www.medrxiv.org/content/10.1101/2023.02.05.23285412v1
文章中,作者聲稱收集了20名IBD患者的“數(shù)據(jù)”,這些患者因頭痛和便血就診于急診科。
文本極度晦澀,存在大量過度同義替換的句子。試試?yán)斫庖韵卤硎觯?/p>
Cerebral vein apoplexy can be deadly and finding is trying as side effects are vague(腦靜脈中風(fēng)可能是致命的,并且由于癥狀模糊,診斷十分困難)
We might want to urge clinicians to continually reexamine their choices, particularly in the event that there is nonappearanceof clinical improvement after a generally deep rooted treatment(我們可能想要敦促臨床醫(yī)生持續(xù)重新審視他們的選擇,特別是在經(jīng)過一段通常根深蒂固的治療后仍缺乏臨床改善的情況下)
EIMs address the primary driver of horribleness in Compact disc(EIMs應(yīng)對(duì)了Compact disc中恐怖性的主要驅(qū)動(dòng)因素)(注:作者可能指克羅恩病Crohn’s Disease)
In the last option study, the chances proportionwas 2.66 (95% certainty stretch = 1.08-6.54) contrasted with everybody(在最后一項(xiàng)研究中,與所有人相比,機(jī)會(huì)比例為2.66 [95%確定性區(qū)間=1.08-6.54])(注:Chances proportion = odds ratio; certainty stretch = confidence interval)
將單個(gè)病例報(bào)告篡改為20名患者的研究
在這個(gè)預(yù)印本中,作者詳細(xì)描述了20名“挑釁性內(nèi)臟疾?。╬rovocative entrail illness)”(即炎癥性腸病)患者:所有人均有3天病程、近期有“不規(guī)則腹痛伴不連貫荒謬的便血(irregular stomach torment alongside discontinuous ridiculous stools as of late)”,且均在兩天前接觸過“兒童(youngsters)”。
等等,20人全部如此?
其血液檢測(cè)結(jié)果未以均值呈現(xiàn),而是以具體數(shù)值列出:“入院當(dāng)日血檢顯示C反應(yīng)蛋白86 mg/L,白細(xì)胞計(jì)數(shù)正常,無缺鐵性貧血(血紅蛋白110 g/L)。肝胰酶、肌酐、尿素電解質(zhì)等指標(biāo)正常。白蛋白偏低(26 g/L),與數(shù)周前一致?!?/p>
這聽起來更像單次血檢結(jié)果,而非20名患者的數(shù)據(jù)集。
原文不難追溯到(記?。捍嬖谂で陶Z的文本為抄襲,將其還原為標(biāo)準(zhǔn)生物醫(yī)學(xué)表述即可定位被抄襲的文章)。
該奇特論文抄襲的源頭是Orfei等于2019年發(fā)表于《BMJ Case Reports》的IBD患者病例報(bào)告[3]。預(yù)印本論文的作者似乎篡改了該病例報(bào)告,偽造成20名患者的研究。
下圖并排對(duì)比2019年《BMJ Case Reports》論文(左)與2023年medRxiv預(yù)印本(右)。已對(duì)部分句子顏色標(biāo)注以便對(duì)照。
左:2019年《BMJ Case Reports》的原文;右:2023年medRxiv預(yù)印本
還抄襲了美國健康訪談?wù){(diào)查研究的數(shù)據(jù)
該預(yù)印本文章繼續(xù)展示“20名患者”的“數(shù)據(jù)”。表1和表2列出吸煙狀況、BMI、偏頭痛等特征。文中寫道:“經(jīng)年齡調(diào)整的偏頭痛或嚴(yán)重頭痛總患病率為15.4%(n=9,062),IBD患病率為1.2%(n=862)”。20名患者的研究出現(xiàn)如此巨大的“n”,極不合理。
使用表1的部分?jǐn)?shù)據(jù),也可以輕易定位到源頭:所有數(shù)值與Yong Liu等在《Headache》(2021)的研究完全一致[4]。該研究基于2015-2016年60,436名美國成年人的國家健康訪談?wù){(diào)查(NHIS)數(shù)據(jù)——遠(yuǎn)不止20人!
下圖并排對(duì)比2021年NHIS數(shù)據(jù)與2023年預(yù)印本,數(shù)值完全相同。
左:2021年《Headache》的原文;右:2023年medRxiv預(yù)印本
該預(yù)印本可能還剽竊了其他論文,但當(dāng)前證據(jù)已確鑿:數(shù)據(jù)至少復(fù)制了兩篇論文,并通過同義詞替換掩蓋抄襲。
目前博客作者已在medRxiv網(wǎng)站留言并向預(yù)印本平臺(tái)組織舉報(bào)了這篇“杰作”。
參考文獻(xiàn):
1. https://arxiv.org/abs/2107.06751
2. https://www.medrxiv.org/content/10.1101/2023.02.05.23285412v1
3. https://casereports.bmj.com/content/12/1/e227228.long
4. https://pmc.ncbi.nlm.nih.gov/articles/PMC8289487
文章整理自:https://scienceintegritydigest.com/2025/07/28/discontinuous-ridiculous-stools-a-preprint-full-of-tortured-phrases-and-stolen-data/-4053
醫(yī)咖會(huì)9周年
驚喜第一彈來啦!
醫(yī)咖會(huì)基礎(chǔ)會(huì)員全面大升級(jí),趕快去領(lǐng)取一年基礎(chǔ)會(huì)員!
基礎(chǔ)會(huì)員權(quán)益:28張基礎(chǔ)課程券,基礎(chǔ)課程均可兌換!醫(yī)咖會(huì)SCI-AI工具,科研內(nèi)容訓(xùn)練,回復(fù)更專業(yè)!
點(diǎn)擊“閱讀原文”/應(yīng)用商店搜索/掃碼下載醫(yī)咖會(huì)APP,登錄后,彈窗領(lǐng)取基礎(chǔ)會(huì)員!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.