学位论文需要满足学术规范。人们可能认为,如果论文通过了查重一关,那么就满足了学术规范,就不会被认定有抄袭行为。事实上,这是一种错误认识。通不过查重肯定不满足学术规范。查重率为零也可能不满足学术规范。
为了帮助学位候选人顺利通过查重一关并且确保在论文中不存在专家或任何读者能看出的有剽窃嫌疑的抄袭内容,本文介绍文献引用的规范、抄袭的定义和自查是否有抄袭的可操作步骤,希望对即将申请学位的准毕业生们有所帮助。
学位论文包括学士论文(综合论文训练)、硕士论文和博士论文。三种论文的差异主要体现在贡献和知识掌握的程度上,但写作形式和写作质量都有相同的要求,都需要使用严密的逻辑且遵循严格的学术规范。
学术规范主要包括三个方面:
通过恰当引用和引述文献来尊重他人的工作。
杜绝任何形式的造假。
通过思路清晰和逻辑严密的写作避免误导读者。
本文只讨论学术规范的第一个方面。余下部分包含5个方面的内容:什么是文献引用与引述;抄袭的定义;查重的基本知识;一组查重数据分析;如何自查是否有抄袭。学位论文提交时,需要经历查重一关。查重中存在的问题主要来源于缺乏对文献的必要或恰当的引用。无论是本科学位论文还是研究生学位论文,对文献的引用和引述规范都有相同的、严格的要求,要求达到期刊学术论文对文献引用的同样标准。莱恩社区学院图书馆将为何要引用文献的原因归纳为如下几条:一些常识则不需要引用,如开水沸腾的温度是100摄氏度是常识。一些专业领域的教科书级别的通用知识不需要引用。然而,如果不确定这一点,就引用文献(如教科书)。多引用比不引用好。资深专家很容易判断什么情况下需要引用。然而,对于学生,尤其是本科生,习惯了阅读教科书。大部分教科书都在介绍本领域的通用知识,往往不需要逐一引用文献,除非加入了新的知识。人们会依据作者写教科书的风格和清晰度来理解作者的贡献,不会据此认为教科书中介绍的内容是教科书作者的原创。相反,学位论文是反映学位候选人工作的文章,因此需要清晰地引用文献,来说明因为别人做了什么才导致你不需要做什么以及还需要做什么,交代你用了别人什么方法和得到了什么不同的结果或结论。文献引用有常规引用(citation)和引述(quotation)两种。我们熟悉的引用是常规引用,不熟悉的是引述。下面介绍什么是引述。引述是指直接复制参考文献的一段话。此时对引用信息有苛刻要求。如果引述的一段话较短,应将被引述的话加双引号,同时在引用位置标注引述的内容在原文中所处的页码范围。如果被引述的原话里也有双引号,那么在引述时将原双引号改成单引号。如果引述的话较长,那么可以将引述的内容单独放在一块之中,通过采用两端缩进的方式或不同字体与其它文字进行区别,并在引述内容的末尾加上在原文中的页码范围。学位论文查重时,系统无法判断你是否给了恰当引用和引述,而是单纯依据重复字数来计算重复率。因此,即使引述,也不要将原文复制粘贴,而是将原文用自己的语言风格略微调整文字,并用引述方式引用。抄袭属于一种剽窃行为,是将他人的想法或研究成果当作自己的想法或研究成果的任何行为。抄袭有主动抄袭和被动抄袭两类。主动抄袭属于主观行为,包括幼稚抄袭和恶意抄袭两种情况。幼稚抄袭是指直接将其他人的文章的内容复制到自己的文章中。幼稚抄袭者有主观抄袭意愿,但并不认为这种行为有多严重,否则不会整段话直接复制。幼稚抄袭者的内心思维来源于对生活的理解。比如说,模仿歌星唱歌、临摹书法等在生活中并不属于抄袭的行为。恶意抄袭是指行为人在认识到抄袭属于严重不当行为并且认识到抄袭被查出后会有严重后果的情况下,还是刻意抄袭。恶意抄袭者为了避免抄袭行为暴露,会试图将别人的成果或者观点通过编排、组合等文字技巧或其它技巧窃为己有。这有几种情况。第一种属于引用不规范,或者无意中混淆了自己的观点和别人的观点。第二种属于不经意的漏引,例如试图引用,但忘记将文献列入参考文献。第三种是为了省事,利用了现有文档的一部分(如标准方法的描述,说明书,学长的学位论文模板所带的致谢等)。第四种是通过阅读、会议和私人交往,掌握了一些观点,但历时太久后产生了属于自己想法的印象,从而当作自己的观点写入了自己的文章中。系统查重只能查出部分抄袭的内容。主动抄袭中的幼稚抄袭以及被动抄袭中的省事行为,很容易被系统查重查出来。另一些情况,查重系统则无能为力,如主动抄袭中的恶意抄袭、大部分被动抄袭、抄袭未进入数据库的文章或一些网络文章等。查重系统会将学位论文和数据库中的文献进行对比,能自动查出学位论文有多少比例的局部段落或整句描述与现有文献的文字重复。如果一个仪器的使用方法需要交代,而这个使用方法的介绍已经成为了标准,那么用完全相同的语言交代,就可能被系统判定为与早期文献重复。一些学生可能辩解,某些重复根本不属于本质内容的重复,只是大家使用一些通用知识时,说法完全一样而已,不能谁在先,后面的就算抄吧。但这是学位论文,学位论文最基本的要求是论文有自己的、统一的语言风格。如果从不同的地方将别人的描述性文字拿来进行东凑西拼,就没有达到基本要求。系统查重不仅会给出总的重复率,而且会给出更多信息,包括各章重复率、总的重合字数、有重复的段落数等。不仅如此,重复部分会自动标成别的颜色。管理人员依据有颜色的文字内容的性质,很容易看出是否有整段重复。图1-3是某工科院系2015至2018年的毕业生学位论文的查重数据,给出了重复率在0-1%区间、1-2%区间、2-3%区间、3-4%区间、4-5%区间和5%以上区间的论文数比例。横坐标为百分比区间,纵坐标为在对应区间段的论文数比例。数据表明,历届之间的差异性较小。高达50%的学生重复率低于1%。重复率超过5%的论文占比一般低于10%。
那么,是不是重复率低于1%就一定没有问题呢?以致谢为例,致谢的长度相比于全文,可能不到0.5%。例如,论文是100页,致谢不到半页,那么即使只全部抄袭了致谢,那么重复率也就只有0.5%。但就这0.5%,也会引起极大的不适。这种抄袭往往来源于学生拷贝别人的模板时,忘记替换致谢内容。致谢的重复虽然不会被认定为学术不端,但会让自己在别人认知中留下不好的印象,将使自己与导师的关系处于较为尴尬的状态。如果单纯看重复率,那么在出现同样多的重复字数的情况下,越短的论文重复率可能越高。图4是前面提到的工科院系2018级的学士论文查重率与论文总字数和页码数的比较。横轴都采用了查重结果由高到低的学生排序。可见,论文页码数最低的10篇学位论文,查重重复率最高。查重率高的论文的字数偏低。正因为如此,重复率的高低只是一个参考,更多的是从重复的性质来判断是否有抄袭。
图4 查重重复率与论文长度(总字数和总页码数)的直观对比系统查重通过了,是否就意味着没有抄袭呢?不一定。莱恩社区学院图书馆提供了“抄袭”行为自查流程图【2】,可以对照该流程图检查自己是否不小心“抄袭了”。图5是依据文献【2】原图翻译而成。
图5 莱恩社区学院图书馆抄袭自查流程图,译自文献【2】以下是对该流程图的解读(我们可以对照这些解读内容检查我们是否不小心'抄袭'了):如果使用了别人的信息、主意或工作,需要引用,否则就算抄袭。如果使用了自己的一项之前的工作(如论文),那么也需要引用(自引),否则犯了自我抄袭(self-plagiarism)错误。如果逐字使用了别人的一行文字,那么需要采用引述的方式引用,否则即使引用了也算抄袭。这种情况包含对外文资料的使用。代表观点、方法或其它工作的一段话虽然是翻译过来的,直接使用也需要引述,否则也算抄袭。如果将别人的一段话用自己的语言重新组织,那么至少需要用常规方法引用(可以不采用引述的方式),否则算剽窃。如果你复制使用了别人的图像、流程图或其它形式的非文字形式的作品,也需要引用(往往需要在图的题注的标题右侧标明引用),否则算抄袭。即使你没有上述剽窃现象,也需要将引用的别人的信息与自己的写作与分析相结合,而不能只复制别人的信息。例如,你不能全部使用别人的材料并进行了规范引用和引述,而没有自己的东西。即使你在文章中正确引用和引述了,那还不够,所有参考文献必须出现在论文末尾的参考文献列表之中。可见,虽然系统查重不一定查出了有抄袭现象,但如果不满足以上规范,依然可能会被认定为有剽窃行为,虽然有时这种行为不是刻意的。例如,你使用了别人的图片或者英文文献的翻译内容而不引用,虽然中文系统查重一般查不出来,但属于剽窃行为。