不同查重系统的重复字数判定标准
Paperpass查重系统
paperpass判断重复的标准通常是连续13个字相似或抄袭都会被标红,但需要满足一个前提条件:即所引用或抄袭的A文献文字总和在各个检测段落中要达到5%以上才会被检测出来标红。例如,如果论文中有一处地方超过13个字与别的文章重复,知网检测系统的服务器会对这处地方的前后进行模糊搜索,即使是简单地加了一些“的”“在……时”“但是”等词语来隔断13个字,多数情况也会被检测出来。
其他查重系统
其他查重系统也有各自的判定标准,不过这些系统并非单纯按照固定字数来判定重复,而是从整体的相似比例角度考虑。
影响重复判定的其他因素
引用的处理
- paperpass对引用的要求:在paperpass查重中,黄色的文字是引用部分,但引用也需要遵循相应规则,如果引用不当也可能被计入重复部分。引用单篇文献如果在段落中的占比低于5%(以段落计),可能不会被检测出来。并且如果引用格式不规范,参考文献也可能当成正文来进行检测导致被标红,从而增加重复率。
- 引用整段与单句的区别:尽量引用整段话,如果只是引用单独的一句两句,知网系统可能识别不到具体引用的是哪篇文章里面的句子,这种情况下可能会影响重复率的判定。
论文格式的影响
- PDF与Word格式:知网论文查重为整篇上传,PDF或者Word格式对检测结果可能会造成影响。上传PDF检测时,PDF会比Word多一个文本转换的过程,这个过程有可能会将原本正确的目录和参考文献格式打乱,导致系统识别不正确而被标红,尤其是英文部分被标红可能会使总结果大大增高。
- 文档结构:如果论文整体结构和大纲被打乱,可能会引起同一处的文章检测第一次和第二次标红不一致或者第一次检测没有标红的部分第二次检测被标红。因此在修改重复内容的时候尽量变换句式,不要打乱论文原来的整体大纲和结构。
阅读量: 1165