温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明涉及一种基于改进的文本指纹算法的短文本集合相似度比较方法及系统,首先对每个文本进行分词处理,得到各个文本的单词集合;接着将每个文本的单词集合进行停用词过滤;然后对每个文本,动态设置K值,对停用词过滤后的单词集合提取K‑shingle,...该专利属于福建福诺移动通信技术有限公司所有,仅供学习研究参考,未经过福建福诺移动通信技术有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明涉及一种基于改进的文本指纹算法的短文本集合相似度比较方法及系统,首先对每个文本进行分词处理,得到各个文本的单词集合;接着将每个文本的单词集合进行停用词过滤;然后对每个文本,动态设置K值,对停用词过滤后的单词集合提取K‑shingle,...