(一)主觀(guān)因素沒(méi)有發(fā)表論文時(shí)的檢查,一般由該文章的編輯進(jìn)行,以一定的學(xué)科背景進(jìn)行編輯,在整個(gè)過(guò)程中跟蹤這篇文章??梢园l(fā)現(xiàn)和調(diào)整學(xué)術(shù)不正當(dāng)檢查系統(tǒng)的檢查結(jié)果不同的問(wèn)題。發(fā)表了論文,一般是第三者的檢查。因?yàn)檎撐牡姆秶軓V,檢查者和檢查報(bào)告書(shū)的使用者不可能有全面的學(xué)術(shù)背景。檢查人員根據(jù)計(jì)算機(jī)的檢查結(jié)果發(fā)布檢查報(bào)告,使用者閱讀檢查報(bào)告的數(shù)據(jù),判定測(cè)定者是否具有入門(mén)資格。
只不過(guò)是根據(jù)檢查報(bào)告的數(shù)據(jù),也沒(méi)有一些作者文章的不恰當(dāng)、文章的正確引用等,由于以上的原因,有些檢查結(jié)果和真實(shí)的抄襲率有一定的差距,很難表現(xiàn)出完全的公正性。根據(jù)對(duì)學(xué)術(shù)上的不正當(dāng)檢查系統(tǒng)的研究,提出了正確識(shí)別“文字復(fù)制比”和“文章剽竊率”的提案。我們通常在檢查報(bào)告中看到的“文字復(fù)制比”是系統(tǒng)提供的疑似剽竊的文字,學(xué)術(shù)論文的調(diào)查重量是“文章的剽竊率”定性復(fù)制文章的比例。
[4]在實(shí)際操作中,正確分析“文字復(fù)制比”的真?zhèn)?,即使不知道文章的學(xué)術(shù)內(nèi)容,也可以根據(jù)幾個(gè)共同規(guī)則來(lái)識(shí)別抄襲的程度。(二)客觀(guān)因素Cnki期刊文獻(xiàn)檢查系統(tǒng)以“中國(guó)學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(kù)”為全文數(shù)據(jù)庫(kù),目前支持的原稿種類(lèi)為DOC、TXT、CAJ、KDH、NH、PDF5種格式,從單詞、句子、段落等多方面進(jìn)行學(xué)術(shù)研究的不正當(dāng)行為。[5]檢測(cè)系統(tǒng)的功能表明該系統(tǒng)可以檢測(cè)多個(gè)文獻(xiàn),但實(shí)際上不同種類(lèi)的電子文檔在多個(gè)檢測(cè)中會(huì)出現(xiàn)檢測(cè)值完全不同的現(xiàn)象。
名研究人員在中國(guó)的期刊網(wǎng)站上檢索了與同一作者不同的兩篇文章,在A(yíng)MLC上下載并調(diào)查了這兩篇文章的caj版本,發(fā)現(xiàn)兩篇文章和自己的比較結(jié)果也不是100%。另一種情況是,同一篇文章用不同的形式進(jìn)行調(diào)查,得出了20分的差距。
[6]不同的文件格式可能對(duì)測(cè)量結(jié)果有很大影響。這是因?yàn)橄到y(tǒng)以word文件為基準(zhǔn),在其他種類(lèi)的文件以“外形比例”識(shí)別的期間,可能會(huì)有一些技術(shù)問(wèn)題。