温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本申请涉及一种大规模文本增量模糊去重方法、装置、设备及介质。基于该全局字典和预设哈希函数,为不同文档集中的文档生成文档签名,从而保证不同文档集中的相同内容在文档签名上保持一致,从而方便进行跨文档集的重复内容检测。由于仅针对第一文档进行文档签...该专利属于云知声(杭州)智能科技有限公司所有,仅供学习研究参考,未经过云知声(杭州)智能科技有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本申请涉及一种大规模文本增量模糊去重方法、装置、设备及介质。基于该全局字典和预设哈希函数,为不同文档集中的文档生成文档签名,从而保证不同文档集中的相同内容在文档签名上保持一致,从而方便进行跨文档集的重复内容检测。由于仅针对第一文档进行文档签...