在投稿SCI或英文期刊前,越来越多的同学会主动使用iThenticate进行查重,提前检测一下文章的重复率,不过,拿到查重报告后,面对其中的术语与数据,很多同学仍感到疑惑,尤其是这2个:
Overall Similarity(整体相似率)
Top Sources(主要重合来源)
这些指标到底代表什么?是否直接决定稿件会不会被拒?报告中显示的百分比应该怎么看?
一、什么是 Overall Similarity?
Overall Similarity,中文常译为整体相似率,是iThenticate查重报告中最醒目的一个指标,通常显示在报告首页或摘要页的显眼位置,以百分比形式展示。
这个数值代表:你的稿件中,有多少内容与iThenticate数据库中的其他文献存在相同或相似。
比如:
如果报告显示 Overall Similarity = 18%,这表示:
- 系统判断你整篇文章中约有18%的文字内容,与公开数据库中的文献出现了语义或文本上的重合;
- 这些重合可能是直接引用、复述、背景介绍、方法说明,也可能是未标注来源的相似段落。
需要注意的是:这个相似率并不是“抄袭率”,而是技术上的“文本相似度”检测结果,不能简单等同于学术不端的判定依据。
二、什么是 Top Sources?
在查重报告中,Top Sources通常出现在报告的末尾处,用来列出与您稿件相似度最高的若干来源文献,每条都配有对应的匹配百分比和来源链接。
每条Top Source包含的信息包括:
- 来源网址/期刊名称(如 nature.com、sciencedirect.com)
- 与该来源相似的文字段落数量
- 该来源与您稿件匹配的比例(%)
- 匹配文字在原文和您稿件中的具体位置(在报告中标示颜色)
解读技巧:
- 如果某个Top Source相似度超过5%,需要重点关注;
- 如果Top Source为您自己发表的文章,可能属于“自我抄袭”;
- 如果是某个常用的技术方法部分来源文献,多为合理引用,但也建议清晰标注;
- 若Top Source为您不熟悉的期刊或机构网站,可能是无意中的段落雷同,需慎重处理。
三、如何综合解读这两个指标?
1. 高 Overall Similarity ≠ 抄袭,一定要看来源组成
- 例如,一篇方法类文章的Overall Similarity为23%,但Top Sources全是公开数据库中您已引用的技术文献或通用表达,那么整体重复是可以接受的。
- 但如果该23%中有10%以上是来自一篇未引用的新近SCI文献,且内容为核心分析或结论,问题就比较严重。
2. 低 Overall Similarity 也不代表绝对安全
有时候系统会将多来源的短句相似(每条不足1%)合并起来显示为低重复率。但这些“小碎片”如果集中出现在某一段落或章节,仍可能被编辑识别为“结构性抄袭”或“技术性剽窃”。
3. Top Sources 是发现隐性风险的关键
有经验的作者会通过查看Top Sources:
- 发现某些段落重复自己过去的会议论文,及时调整;
- 识别引用标注不全的段落,补充文献;
- 查找语言表达过于接近参考文献的部分,进行重写降重。
四、期刊编辑如何看待这些指标?
不同期刊对重复率的容忍度不尽相同,但大多数SCI期刊的编辑通常遵循以下原则:
编辑判断要素 | 实际含义 |
---|---|
Overall Similarity 是否超过30% | 高于此数值一般会被警惕甚至拒稿 |
是否存在单一来源重复超10% | 高相似的单一来源被视为风险段 |
是否属于方法类标准表达 | 方法重复率相对宽容,但需标注引用 |
是否为自我重复或多投内容 | 如果没有合理解释,可能构成自我抄袭 |
引用是否清晰、格式是否合规 | 引用规范可显著降低误判风险 |
五、作者实用建议
为了更有效地使用 iThenticate 查重报告,建议作者:
- 投稿前主动查重,做到心中有数;
- 重点关注 Top Sources,对高匹配段落逐一分析;
- 合理使用引用标注,避免“合理使用”变成“默认抄袭”;
- 必要时重写表达,保持原意,改变句式;
- 保留查重报告,投稿时如遇质疑,可主动申明已自查。
iThenticate查重报告中的Overall Similarity是整体相似度的参考指标,而Top Sources则提供了具体比对依据与潜在风险来源。两者结合解读,才能真正判断论文是否存在重复问题。
对于准备投稿SCI或英文期刊的作者而言,学会看懂这两个指标,不仅有助于降重修改,更是保证投稿成功率的重要一环。