💡 功能原理
论文查重检测基于多级指纹相似度算法,通过以下步骤进行分析:
- 文本预处理:对输入文本进行分词、去停用词、词形标准化
- 多级指纹:L1段级SimHash粗筛 → L2句级MinHash召回 → L3滚动哈希精排
- 改写检测:骨架提取识别句式改写,同义词归一化识别同义替换
- 跨语言检测:中英翻译后比对,识别翻译抄袭
- 来源识别:从36个数据源检索相似文献,识别疑似重复来源
📝 论文查重检测
上传论文文件或输入文本,检测与已有文献的相似度
{{ uploadedFileName || '点击上传或拖拽文件到此处' }}
支持 TXT / Markdown / PDF / Word / RTF 格式,文件大小不超过 20MB
📎 {{ uploadedFileName }}
✕
— 或直接粘贴文本 —
🔍
正在检测相似内容
{{ progressStep }}
解析文档
检索文献
相似度比对
📊 查重结果
{{ result.overall_similarity.toFixed(1) }}%
总相似率
{{ result.overall_similarity < 15 ? '✅ 原创性良好,相似度处于安全范围' : result.overall_similarity < 30 ? '⚠️ 存在一定相似,建议检查重复内容' : '❌ 相似度过高,需要大幅修改' }}
{{ stats.total_chars || 0 }}
总字数
{{ stats.similar_chars || 0 }}
相似字数
{{ (result.source_summary || []).length }}
相似来源数
{{ result.elapsed ? result.elapsed.toFixed(1) + 's' : '-' }}
检测耗时
📈 章节相似度分布
📚 疑似来源列表
{{ (source.similarity * 100).toFixed(0) }}%
相似
{{ source.title }}
🎉
未发现高度相似来源
❌
检测失败
{{ errorMsg }}