在SCI等国际期刊投稿过程中,越来越多的作者会在投稿前先自己查重,避免投稿时期刊查重重复率过高拒稿。其中,CrossCheck查重系统因为其与全球主流出版社的紧密合作,几乎成为期刊编辑在初审阶段的指定查重工具。可能同学们比较关心查重的这2个问题:
1、查重报告中的重复率是如何计算出来的?
2、系统是否会将参考文献部分计入重复率,从而影响最终结果?
小编将根据平时处理的查重的经验,试着为同学们解答一下这2个问题,帮助同学们更准确地理解查重报告,合理控制重复率,避免因“非必要重复”被拒稿。
一、CrossCheck与iThenticate的关系
首先,CrossCheck只是一个产品的名称,它实际上是由Crossref组织与iThenticate联合开发的论文相似性检测服务,现在多数同学更多地叫Crossref,主要面向学术期刊和出版机构,用于检测投稿内容与现有出版物之间的相似度。他们是的构成是这样的:
Crossref 提供文献数据库资源;
iThenticate 提供比对算法和查重界面;
“CrossCheck”是这项服务的名称,用户多数为期刊编辑,而非个人作者。
换句话说,如果你看到某篇论文被“CrossCheck查重”,实际使用的比对技术正是 iThenticate。
二、查重率是如何计算的?
在CrossCheck系统中,重复率(相似性指数)是指:
论文中与数据库中已有文献内容发生实质性相似的比例,通常以百分比形式表示。
查重率的计算过程主要分为三个步骤:
文本分段处理:系统将整篇文章划分为数个内容块(句子、段落);
与数据库比对:每一内容块与Crossref所收录的全球出版内容(包括期刊文章、会议论文、书籍章节等)进行逐句比对;
标记相似内容并累加比重:若某段落与已有文献的文字表达高度重合,系统会标示颜色,并统计其所占总篇幅的比例,最终汇总为“总体相似度”。
例如:若论文中有800字内容与现有文献高度一致,占全文总字数的10%,则报告将显示“10%的相似性”。
但值得注意的是,相似性≠抄袭。系统只是技术比对,不能判断引用是否合理,最终仍需人工审核。
三、参考文献是否计入重复率?
事实上,系统会提供包括和排除参考文献的结果,比如你在ithentiate中文网站查重,会默认得到这2份报告 ,一份会把参考文献计算入重复率,一份会把参考文献排除在重复率外,因此,最终参考文献是否计入重复率是由投稿的期刊编辑确认的,根据我们的经验,大部分期刊是参考排除参考文献的结果,即是不计算叁考文献的重复,而亦有小部分的期刊是计算的,正常情况下,同学们按照排除参考文献的结果去处理重复率一般是没问题的。这意味着,在合理设置条件下,参考文献不会对重复率产生明显影响。但如果文章中存在大量未标注来源的“改写引用”或“暗抄”内容,就很容易被系统识别为重复。但是也不建议同学们把参考文献删除后再查重,这样会龙破坏文章的完整性,可能得到的结果并不那么准确,特别是投稿是完整的文章。
四、实际投稿中,重复率控制建议
不同期刊对可接受的查重率略有差异,但普遍遵循以下建议值:
指标 | 建议控制范围 |
---|---|
总体重复率(Overall Similarity) | < 15% 为佳,< 10% 更稳妥 |
单一来源重复率 | < 5%,避免整段复制 |
自引(自己发表的内容) | 尽量减少,必要时注明引用来源 |
特别提醒:方法部分因使用常规技术和表述,可能会自然产生较高相似度,通常期刊编辑会理解;但引言和讨论部分的重复则容易被判定为剽窃风险。
五、作者该如何应对查重报告?
1、提前使用正规的iThenticate查重平台进行自检,比如ithenticate中文网站;
2、合理引用他人观点,并明确注明来源;
3、对高重复段落进行改写,避免连续照搬表达;
4、确保参考文献格式规范,便于系统识别和排除;
5、保留好查重报告,以便投稿时主动提供说明。
最后,希望大家投稿顺利。