温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本公开的一方面涉及一种高效的短文本相似性确定方法,包括对语料库中的短文本进行分词以获得对应的词序列;基于所述语料库中的短文本总数确定惩罚,所述惩罚随所述语料库中的短文本总数增大而减小;确定所述词序列中每个词的词频和调整后的逆文档频率,其中所...该专利属于支付宝(杭州)信息技术有限公司所有,仅供学习研究参考,未经过支付宝(杭州)信息技术有限公司授权不得商用。
温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。
本公开的一方面涉及一种高效的短文本相似性确定方法,包括对语料库中的短文本进行分词以获得对应的词序列;基于所述语料库中的短文本总数确定惩罚,所述惩罚随所述语料库中的短文本总数增大而减小;确定所述词序列中每个词的词频和调整后的逆文档频率,其中所...