- +1
尋找語言錯(cuò)誤有助于識(shí)別論文造假
來自美國(guó)科學(xué)誠(chéng)信中心“醫(yī)學(xué)證據(jù)項(xiàng)目”的法醫(yī)科學(xué)學(xué)家James Heathers,近日在世界科研誠(chéng)信大會(huì)上報(bào)告稱,一種簡(jiǎn)單的檢索語言錯(cuò)誤的方法,有助于識(shí)別“論文工廠”炮制的虛假論文。借助程序自動(dòng)篩查此類錯(cuò)誤,科研核查人員有望找出大量的問題論文。
Heathers是在去年萌生這一想法的。據(jù)《科學(xué)》報(bào)道,當(dāng)時(shí)有人給他發(fā)來十幾篇看起來極為相似的醫(yī)學(xué)論文,希望他能夠找出其中的問題。Heathers花了兩天時(shí)間閱讀這些論文,并注意到一些奇怪但常見的拼寫、語法和用詞錯(cuò)誤。例如,“Kolmogorovor信息復(fù)雜度”拼錯(cuò)了數(shù)學(xué)家Andrey Kolmogorov的姓氏;多篇論文還出現(xiàn)“5毫升含凝膠生物化學(xué)試管”等不規(guī)范表述,Heathers形容這些語句“像是外星人寫的”。
這類語言錯(cuò)誤或許只是非英語母語作者的寫作失誤,本身不足以判定論文造假。但Heathers在谷歌學(xué)術(shù)檢索上述特殊表述后,又發(fā)現(xiàn)了約200篇具備相同特征的論文——不僅主題一致,研究設(shè)計(jì)、圖表樣式等細(xì)節(jié)特征也高度重合。他認(rèn)為,從統(tǒng)計(jì)學(xué)角度看,這種情況幾乎不可能發(fā)生,除非它們都來自同一源頭。Heathers推測(cè),這些論文都是同一篇論文的不同版本,由論文工廠批量偽造、翻新后,出售給那些急于增加發(fā)文數(shù)量的科研人員。
大多數(shù)論文工廠產(chǎn)出的生物醫(yī)學(xué)論文,多聚焦于臨床前實(shí)驗(yàn)室研究,而Heathers篩查出的問題論文均圍繞患者數(shù)據(jù)展開。他表示,這類論文危害更大,因?yàn)槠溲芯拷Y(jié)論會(huì)直接應(yīng)用于臨床診療。目前仍需對(duì)每一篇涉事論文逐一核查,確認(rèn)這些被他稱作“意外水印”的語言錯(cuò)誤是否屬于刻意的學(xué)術(shù)不端行為。
多位科研誠(chéng)信領(lǐng)域?qū)<艺J(rèn)為,這些發(fā)現(xiàn)很重要,但也提出保留意見?!安荒軉螒{這一點(diǎn)就認(rèn)定論文出自論文工廠,它們也可能來自翻譯軟件?!泵绹?guó)初創(chuàng)公司Signals的聯(lián)合創(chuàng)始人Elliott Lumb說。其公司開發(fā)了一款能夠自動(dòng)評(píng)估研究論文的軟件。Lumb表示,如果后續(xù)研究證實(shí)這些錯(cuò)誤與其他學(xué)術(shù)異常信號(hào)相關(guān),它將成為實(shí)用的調(diào)查工具。
Heathers表示,他的這套篩查方法具有可擴(kuò)展性,因?yàn)橥ㄟ^使用諸如拼寫和語法檢查器及搜索引擎等簡(jiǎn)單工具,可以實(shí)現(xiàn)對(duì)重復(fù)錯(cuò)誤和不尋常語句的自動(dòng)識(shí)別。但被標(biāo)記為可疑的論文,每一篇都需要仔細(xì)審查,以確定是否存在學(xué)術(shù)不端行為,這就使得該技術(shù)兼具“快速”和“緩慢”的特點(diǎn)。他希望出版商能將該方法應(yīng)用于未經(jīng)編輯的原創(chuàng)稿件中。
(原標(biāo)題為《尋找語言錯(cuò)誤有助于識(shí)別論文造假》)





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




