书房文学 > 论文怎么写:给大学生的实用写作攻略 > 第 1 节 论文查重,有什么需要知道的?

第 1 节 论文查重,有什么需要知道的?



关于查重,你想知道的都在这里了。

本文主要有以下几个部分:

一、针对查重与降重的辟谣与科普

二、拿来就能用的正派论文降重技巧

三、具体降重案例剖析

四、常见问题答疑

1.?系统到底怎么查重?「不允许连续13字相同」是真的吗?

经常有人问我,知网是按连续多少字相同来查重?不允许连续13字相同是真的吗?

这是一条最流行、最古老的传言了,但实际上这是假的。

就这么说吧,按最严格的标准来,就算你每隔7个字就插入一个字,语句不通不说,降重效果也微乎其微。

知网查重系统开发一二十年了,每年更新个几次,算法若是真的如此小儿科,那也不会有人苦恼降重的问题了,每句多写几个字谁不会。

2.?查重阈值是多少?「查重阈值5%」是真的吗?

查重阈值确实存在,但具体是多少,有很多种说法,0.5%、1%、5%……但即使知道了也没多大意义,所以不必纠结这个。

比如假设阈值是1%,知网查重会分段落(按章节或随机分),如果一个段落10000字,那么理论上单篇抄袭100字不会标红。那么实际操作是这样的,你先假定一个阈值(可能是错的),看每个章节字数(系统可能不按章节分),算出单篇可抄袭字数(最多也就一小段),找多篇文献每篇抄一小段(某些文献可借鉴的很多,而有些文献一段也用不上),最后你得确保除了抄袭的这段,其他内容不会和这些文献重复(有时自己写的也判定重复),以上条件都满足,抄袭而不标红的「阴谋」才能得逞,太累了……

当然你每篇抄得越少,被查出来的概率就越低,这是肯定的。

至于「越少」是多少,没人说得清。

3.?那知网到底怎么查重?

知网采用模糊算法,分段进行查重(识别出章节就按章节分段)。

统计每个段落文字/关键词并与论文库里的文献进行对比,达到一定比率,就把连续重复多的地方标红。

看到这里,你是不是很蒙,完全不知道怎么对症下药。

你只需要知道的是,系统没有那么智能,不会对比论文表达的意思,它只是一堆很死的代码、算法,按字词的相似比率来判断抄袭,你要做的是尽量改得和别人不同,观点一样没关系,用词、表达方式一定要变。

4.?查重后听说有检测记录,知网会不会就入库了,导致学校重复率飙升?

先说答案:不会,只要你有钱,查多少次都可以,知网更新时才会收录(通常半年或一年后!



 本章完

 

(http://www.ccfang.cc/novel/caJG69D9GGL.html)


  请记住本书首发域名:www.ccfang.cc。书房文学手机版阅读网址:http://m.ccfang.cc/