知网模糊查重是检测系统的一套算法,该算法有一定的范围限制,便是大家熟悉的连续13字符相同以及阈值5%。在模糊算法下,超过了13字符跟阈值5%就会计算为重复。这套算法虽然非常科学,但对论文格式结构要求严格。那么,知网模糊查重到底是什么?一起了解下吧。
一、知网模糊查重是什么
所谓的中国知网模糊查重的意思就是:中国知网论文查重在检测过程中,其实不是一个字一个字进行比对的。如果论文大部分内容相似就会被算做重复的。这一种查重模式提高了知网查重的严谨性和权威性,同时也减少了在写论文的时候模棱两可,模糊过关的可能,所以这就要求在写文章的时候,避免在语句当中穿插一些没有意义的语句。我们反而应该在写论文的时候,使用同义词替代的方法。或者可以对句式进行转换,将主动句变成被动句式。
二、知网查重模糊算法范围
知网查重一般都是认定13个字以上的重复为抄袭的。如果我们在借鉴别人的13个字以后,在这13个字里面穿插一些,着, 了等这几个字,这些字虽然没与构成13个字的重复,但是因为知网是进行模糊查重的,所以知网就会把这些无意义的词给忽略,依旧会判定这一句话为抄袭,这就是知网模糊查重。并不是你在一句话加入一个字后,就不算重复了。
三、知网怎么查重复率
采取多级比对方法。以句子(以句号为标志)作为最小的比对单位,进行“句子-段落-全篇”多级比对。若一个句子中超过13个字符与他人论文相同或相似,则视为“抄袭”。一段落中若5%字符与他人论文相同,也被视为”抄袭“。看来仅仅对句子中的字符进行语序排列是不能逃脱有“抄袭”的嫌疑。像网上流传的,修改几个字、改改顺序等,估计也是难逃检测啊!因此,无论是写作还是修改都应认真对待。
综上所述:知网模糊查重是一套比较科学的检测算法,而计算规则则是连续13字符相同以及超过阈值5%就计算为重复。模糊算法之下,对论文结构要求比较严格,因此大家论文排版时要认真点。最后,由于是模糊算法,因此不能简单修改。上述是“知网模糊查重到底是什么?”全部内容。