温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明是关于一种基于互联网社区的文本相似度确定方法及装置,方法包括:对互联网社区的海量语料库进行分词处理,得到分词后的语料库;统计分词后的语料库中每个词语对应的逆文档频率;根据每个词语对应的逆文档频率,计算同一帖子下每个评论文本对的第一分词...该专利属于深圳市百川数安科技有限公司所有,仅供学习研究参考,未经过深圳市百川数安科技有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本发明是关于一种基于互联网社区的文本相似度确定方法及装置,方法包括:对互联网社区的海量语料库进行分词处理,得到分词后的语料库;统计分词后的语料库中每个词语对应的逆文档频率;根据每个词语对应的逆文档频率,计算同一帖子下每个评论文本对的第一分词...