一种计算联想词优先级的方法和装置制造方法及图纸

技术编号:16528548 阅读:36 留言:0更新日期:2017-11-09 20:11
本发明专利技术公开了一种计算联想词优先级的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度;获取与所述前缀词对应的各联想词的热度;根据所述相似度和所述热度计算与所述前缀词对应的各联想词的优先级。该实施方式能够提高计算得到的联想词优先级的准确度。

【技术实现步骤摘要】
一种计算联想词优先级的方法和装置
本专利技术涉及计算机
,尤其涉及一种计算联想词优先级的方法和装置。
技术介绍
联想词的计算广泛应用于搜索引擎、输入法等业务领域,在用户输入字符后,可以计算与输入的字符相似或相关的联想词的优先级,并根据优先级对联想词进行排序等处理,以方便用户选择、简化操作、提升用户体验。现有的计算联想词优先级的技术方案,通过统计联想词的热度,即用户最终选择的联想词的次数或频率来确定联想词的优先级。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:根据热度确定联想词优先级的方案准确度不足,难以满足使用需求。
技术实现思路
有鉴于此,本专利技术实施例提供一种计算联想词优先级的方法和装置,能够提高计算得到的联想词优先级的准确度。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种计算联想词优先级的方法,包括:根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度;获取与所述前缀词对应的各联想词的热度;根据所述相似度和所述热度计算与所述前缀词对应的各联想词的优先级。可选的,所述联想词的热度为联想词被选择的次数、频率,或根据所述被选择的次数或频率进行归一化计算后得到的结果。可选的,根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度的步骤包括:根据用户输入的前缀词查找与所述前缀词对应的联想词;根据所述前缀词的本文长度和所述联想词的文本长度计算所述联想词的相似度。可选的,根据所述前缀词的文本长度和所述联想词的文本长度计算所述联想词的相似度的步骤包括:用所述前缀词的本文长度除以所述联想词的文本长度再乘以第一权重,以得到文字得分;用所述前缀词的拼写的文本长度除以所述联想词的拼写的文本长度再乘以第二权重,以得到拼写得分;用所述前缀词缩写的拼写的文本长度除以所述联想词缩写的拼写的文本长度再乘以第三权重,以得到拼写缩写得分;将所述文字得分、拼写得分和拼写缩写得分相加以得到所述联想词的相似度。可选的,所述方法还包括:判断与所述前缀词对应的各联想词是否为特殊词;在确定所述联想词为特殊词后,为所述联想词设置优先级标识。可选的,所述方法还包括:在根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度的步骤前,根据联想词构建与所述联想词对应的前缀词。可选的,所述方法还包括:在根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度的步骤前,对用户输入的前缀词进行清洗,以去除无效的前缀词。为实现上述目的,根据本专利技术实施例的另一个方面,提供了一种计算联想词优先级的装置,包括:相似度计算模块,用于根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度;热度获取模块,用于获取与所述前缀词对应的各联想词的热度;优先级计算模块,用于根据所述相似度和所述热度计算与所述前缀词对应的各联想词的优先级。可选的,所述相似度计算模块还用于:根据用户输入的前缀词查找与所述前缀词对应的联想词;根据所述前缀词的本文长度和所述联想词的文本长度计算所述联想词的相似度。可选的,所述相似度计算模块还用于:用所述前缀词的本文长度除以所述联想词的文本长度再乘以第一权重,以得到文字得分;用所述前缀词的拼写的文本长度除以所述联想词的拼写的文本长度再乘以第二权重,以得到拼写得分;用所述前缀词缩写的拼写的文本长度除以所述联想词缩写的拼写的文本长度再乘以第三权重,以得到拼写缩写得分;将所述文字得分、拼写得分和拼写缩写得分相加以得到所述联想词的相似度。可选的,所述装置还包括:优先级标识模块,用于判断与所述前缀词对应的各联想词是否为特殊词;以及在确定所述联想词为特殊词后,为所述联想词设置优先级标识。可选的,所述装置还包括:前缀词构建模块,用于根据联想词构建与所述联想词对应的前缀词。可选的,所述装置还包括:清洗模块,用于对用户输入的前缀词进行清洗,以去除无效的前缀词。为实现上述目的,根据本专利技术实施例的再一个方面,提供了一种计算联想词优先级的电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器至少实现:根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度;获取与所述前缀词对应的各联想词的热度;根据所述相似度和所述热度计算与所述前缀词对应的各联想词的优先级。为实现上述目的,根据本专利技术实施例的又一个方面,提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时至少实现:根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度;获取与所述前缀词对应的各联想词的热度;根据所述相似度和所述热度计算与所述前缀词对应的各联想词的优先级。上述专利技术中的一个实施例具有如下优点或有益效果:因为采用根据联想词与前缀词的相似度以及联想词的热度综合计算联想词优先级的技术手段,所以克服了现有计算联想词优先级时仅使用联想词热度而导致计算结果不准确的问技术问题,进而达到提高计算得到的联想词优先级的准确度的技术效果。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是本专利技术实施例可以应用于其中的示例性系统架构图;图2是根据本专利技术实施例的计算联想词优先级的方法的主要步骤的示意图;图3是根据本专利技术实施例的计算联想词优先级的装置的主要模块的示意图;图4是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图1示出了可以应用本专利技术实施例的计算联想词优先级的方法或计算联想词优先级的装置的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。终端设备101、102、103可以是具有显示屏并且支持网页浏览或者输入功能的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103使用搜索引擎或者输入引擎时进行相关支持服务的后台支持服务器。后台支持服务器可以对接收到的前缀词等处理,例如计算该前缀词所对应联想词的优先级,并将处理结果反馈给终端设备。需要说明的是,本专利技术实施例所提供的计算联想词优先级的方法一般由服务器105执行,相应地,计算联想词优先级的装置一般设置于服务器105中。应该理解,图1中的终端设备、网络和服务本文档来自技高网...
一种计算联想词优先级的方法和装置

【技术保护点】
一种计算联想词优先级的方法,其特征在于,包括:根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度;获取与所述前缀词对应的各联想词的热度;根据所述相似度和所述热度计算与所述前缀词对应的各联想词的优先级。

【技术特征摘要】
1.一种计算联想词优先级的方法,其特征在于,包括:根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度;获取与所述前缀词对应的各联想词的热度;根据所述相似度和所述热度计算与所述前缀词对应的各联想词的优先级。2.根据权利要求1所述的方法,其特征在于,根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度的步骤包括:根据用户输入的前缀词查找与所述前缀词对应的联想词;根据所述前缀词的本文长度和所述联想词的文本长度计算所述联想词的相似度。3.根据权利要求2所述的方法,其特征在于,根据所述前缀词的文本长度和所述联想词的文本长度计算所述联想词的相似度的步骤包括:用所述前缀词的本文长度除以所述联想词的文本长度再乘以第一权重,以得到文字得分;用所述前缀词的拼写的文本长度除以所述联想词的拼写的文本长度再乘以第二权重,以得到拼写得分;用所述前缀词缩写的拼写的文本长度除以所述联想词缩写的拼写的文本长度再乘以第三权重,以得到拼写缩写得分;将所述文字得分、拼写得分和拼写缩写得分相加以得到所述联想词的相似度。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:判断与所述前缀词对应的各联想词是否为特殊词;在确定所述联想词为特殊词后,为所述联想词设置优先级标识。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:在根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度的步骤前,根据联想词构建与所述联想词对应的前缀词。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:在根据用户输入的前缀词计算与所述前缀词对应的各联想词的相似度的步骤前,对用户输入的前缀词进行清洗,以去除无效的前缀词。7.一种计算联想词优先级的装置,其特征在于,包括:相似度计算模块,用于根据用户输入的前缀词计算与所述前...

【专利技术属性】
技术研发人员:谢群群邵荣防郝晖李萧萧陈贱辉
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1