输入标题论文相似度不能超过多少(paperpass30%知网多少)
我们公众号对于中国学者SCI论文撤稿统计推送后,后台收到很多咨询。
其中大多数是研究生导师,他们提出了对研究生论文可能有“抄袭/剽窃”的担忧,寻找预防方法;也有一部分是在读研究生和青年医生,他们的问题则集中在不了解“抄袭/剽窃”发生的原因,从而很容易不知情地变成抄袭/剽窃者。
一、抄袭/撤稿现象的严重性:
截止到2020年6月22日,世界范围内共有23,425篇SCI撤稿,其中中国有10,303篇,占44%。撤稿原因中,39%是由于抄袭或者剽窃(见:撤稿解析)。
仔细分析这些撤稿的文章,有些是造假抄袭了其他人数据或者图片,这是故意抄袭/剽窃。但有些论文实属不该,因为他们有自己的实验数据、自己做了认真统计分析并搭建了论文框架结构,但是在论文撰写过程中却因为摘抄了其他作者的句段而相似度过高、或者引用没有正确标注,也被原文作者或者第三方举报为抄袭/剽窃而撤稿。
我们在2019年找到中国学者撤稿的原因后,开始帮中国作者做投稿前查重。为了弄清楚投稿前论文的相似度到底如何,我们特意对最近1个月的查重报告做一分析。
二、查重报告分析报告
(图1. Credit:MedEditing LLC, USA)
共分析295篇SCI论文的查重报告。其中大于50%的极高相似度的占9.15%,30%-49%的超高相似度占23.05%,15%-29%的高相似度占47.46%,相似度低于15%的占20.34%。也意味着,高达80%的稿件相似度过高(相似度为15%及以上)。
但需要注意的是,这个结果并不能代表投稿论文的全貌。因为写作过程中参考过其他论文的作者、寻求查重的可能性更大,所以本样本量可能存在偏倚。
(图2. 相似度高达60%,最高的单篇相似度分别为14%和6%。Credit:MedEditing LLC, USA)
如图2,对于相似度高于50%的投稿论文,如果杂志社未做查重而发表,随时被因为作者或者其他研究者指责为抄袭而毫无争议地撤稿(占9.15%)。
(图3. 相似度40%,单篇最高20%。Credit:MedEditing LLC, USA)
如图3,对于相似度超过30%的投稿论文,如果这些稿件未经处理而直接投稿出去,会被直接拒稿(占32.2%)。
但是15%-29%的相似度并不意味着是安全的,也属于相似度高的范畴,具体也要看有没有单篇相似度很高。
(图4. 相似度为26%。Credit:MedEditing LLC, USA)
如图4中的论文相似度为26%,但单篇都很低,如果所有引文都有标注,则是安全的。
(图5. 相似度为23%,单篇10%。Credit:MedEditing LLC, USA)
图5中的论文,相似度为23%,但是有一个单篇引文相似度特高,达10%。这种情况也会被指认为抄袭第一篇论文。
三、为什么论文会出现这么高的相似度?
新西兰的学者做了研究,并发表在2017年Higher Education (高等教育)杂志。文章题目是“‘It’s not fair’: policy discourses and students’ understandings of plagiarism in a New Zealand university”。
研究显示,大部分抄袭的发生,是由于学生不能理解抄袭是怎么回事!作者也由此觉得这对学生不公平,因为学校、机构及老师(通常为PI或者通讯作者)有义务提供这些教育。
学生不知情,老师又不教,出了问题该处罚谁呢?
四、中国学者“不知情”抄袭的主要原因是什么?
1,源于写SCI论文的方法。
因为英语不是中国人的母语,而大部分科研工作者对自己的英语水平不够自信,所以就去摘抄已经发表的文章中句子甚至段落;如此一来,投稿时编辑查重结果显示自然是相似度很高,尤其以方法学部分尤为严重。
2,参考的文献有限。
近几年科研论文尤其是生物医药领域的科研论文发文量急剧增加,但是采用的基本参考文献却主要是那些文献,肯定也会导致更大机会与之前已经发表的文章出现相同句子。还有部分研究者用同样的方法学做了系列研究,实验方法学部分相同,或者与其他人的研究方法类似,如果不加修改直接引用也会导致相似度明显增高。
五、如何避免不知情抄袭?
1),千万不要大段摘抄或者在一篇文章中过多引用一篇文献的内容,因为这是明显的抄袭,语言润色或者修改并不能改变抄袭的本质。
2),同样,对于内容的抄袭,尽管已经通过修改词句等降重手段来掩饰,但仍然是抄袭。
3)所有引用都加上引文标注。
4),最关键的,从思想上意识到,高相似度就会被第三方判断为抄袭/剽窃;从具体防御策略上,在完成稿件及投稿之前,一定要做查重。
5),最根本方法。还是自己组织语言撰写文章。这是从根本上解决问题的关键。尽管对写作能力有一定要求,但是勤加练习,也会越来越得心应手。
六、小结:
1,我们的统计发现,80%的投稿前论文相似度高,其中32%超过甚至极高,处于非常危险的境地;
2,学生或者青年学者可能会出现不知情抄袭/剽窃,需要学校及导师加强这方面的教育;
3,有方法可以完全避免抄袭/剽窃。