← 返回学术工具
💡 功能原理

论文查重检测基于多级指纹相似度算法,通过以下步骤进行分析:

  • 文本预处理:对输入文本进行分词、去停用词、词形标准化
  • 多级指纹:L1段级SimHash粗筛 → L2句级MinHash召回 → L3滚动哈希精排
  • 改写检测:骨架提取识别句式改写,同义词归一化识别同义替换
  • 跨语言检测:中英翻译后比对,识别翻译抄袭
  • 来源识别:从36个数据源检索相似文献,识别疑似重复来源

📝 论文查重检测

上传论文文件或输入文本,检测与已有文献的相似度

📄
{{ uploadedFileName || '点击上传或拖拽文件到此处' }}
支持 TXT / Markdown / PDF / Word / RTF 格式,文件大小不超过 20MB
📎 {{ uploadedFileName }}
— 或直接粘贴文本 —
{{ plagiarismText.length }} 字 排除引文 改写检测 跨语言检测
🔍

正在检测相似内容

{{ progressStep }}

解析文档 检索文献 相似度比对

📊 查重结果

{{ result.overall_similarity.toFixed(1) }}%
总相似率
{{ result.overall_similarity < 15 ? '✅ 原创性良好,相似度处于安全范围' : result.overall_similarity < 30 ? '⚠️ 存在一定相似,建议检查重复内容' : '❌ 相似度过高,需要大幅修改' }}
{{ stats.total_chars || 0 }}
总字数
{{ stats.similar_chars || 0 }}
相似字数
{{ (result.source_summary || []).length }}
相似来源数
{{ result.elapsed ? result.elapsed.toFixed(1) + 's' : '-' }}
检测耗时

📈 章节相似度分布

{{ ch.name }}
{{ ch.similarity_percent.toFixed(1) }}%
📚 疑似来源列表
{{ (source.similarity * 100).toFixed(0) }}%
相似
{{ source.title }}
{{ source.authors || '未知作者' }} | {{ source.year || '未知年份' }} | {{ source.venue || '未知来源' }}
🎉
未发现高度相似来源

检测失败

{{ errorMsg }}