Copyright ?2013-2017 中國知網(wǎng)論文查重檢測系統(tǒng)入口 All Rights Reserved. 網(wǎng)站備案號:黔ICP備19012782號-3.
那么,知網(wǎng)查重連續(xù)多少字算重復是13個字還是字符? 知網(wǎng)論文查重系統(tǒng) 是以章為基本單元的。 比如封面、摘要、緒論都會作為單獨的一章,每一章出一個論文檢測結(jié)果,標明重復率。 每一章有單獨的重復率,全文還有一個總的重復率。 有的學校在規(guī)定論文是否通過查重時,不僅要求全文重復率不能超過多少,還對每章重復率也有要求,以連續(xù)13個字與別的文章重復做為判斷依據(jù)的。 所以不能連續(xù)超過13字相同,否則就會標紅。 知網(wǎng)查重是以連續(xù)13字相似做為依據(jù)的,所以只要保證論文中的每一句話都不與他人的內(nèi)容相似,然后保證任意連續(xù)13字都不同,那知網(wǎng)是檢測不出來。
大致上來說,知網(wǎng)查重算法采用的是一種根據(jù)語義模糊解析算法,用近似比對的方式進行重復率檢測。 而不是簡單地基于某個最小語句為單位(比如傳說中的“13個字連續(xù)一樣”),進行“循環(huán)比對”這么簡單。
封面、摘要、緒論、第一章、第二章、等等這樣一系列的都會各自分成一個片段來檢測,每一個片段都計算出一個相似度,再通過這樣每章的相似度來計算出整篇論文的總重復率。 當知網(wǎng)查重系統(tǒng)識別到你論文中有某句話涉嫌抄襲的時候,它就會對這句話的前面后面部分都重點進行模糊識別,這個時候判斷標準就變得更嚴格,僅僅加一些副詞或虛詞 (比如“的”、“然后”、“但是”、“所以”此類詞語)是能夠識別出來的。 在知網(wǎng)查重進行中,檢測系統(tǒng)只能識別文字部分,論文中的圖片、word域代碼、mathtype編輯的公式、是不檢測的,因為檢測系統(tǒng)尚無法識別這些復雜的內(nèi)容格式。
知網(wǎng)查重是以連續(xù)13字相似做為依據(jù)的,所以只要保證論文中的每一句話都不與他人的內(nèi)容相似,然后保證任意連續(xù)13字都不同,那知網(wǎng)是檢測不出來。 如果論文有一處高于13字的重復,那么知網(wǎng)的數(shù)據(jù)庫就會對該內(nèi)容進行模糊檢索。