推荐方法、装置、电子设备及存储介质制造方法及图纸

技术编号:23162025 阅读:43 留言:0更新日期:2020-01-21 22:02
本申请公开了信息推荐方法、装置、电子设备及存储介质,涉及人工智能技术领域。具体实现方案为:接收用户的携带指定词汇的翻译请求;根据预先训练的词向量模型,从预先创建的词汇库中获取基于所述指定词汇的数个目标推荐词汇;所述词向量模型基于语料库中各语料的词汇序列和/或历史翻译日志中同用户同会话中的词汇序列训练而成;基于所述数个目标推荐词汇,向所述用户进行信息推荐。本申请通过采用上述方案,能够更加准确地预测用户的翻译需求,进而能够有效地提高推荐效率,减少用户再次主动发起翻译请求的概率,从而能够有效地增强用户的使用体验度,能够满足更多用户的需求,增加产品的用户粘性。

Recommended methods, devices, electronic equipment and storage media

【技术实现步骤摘要】
推荐方法、装置、电子设备及存储介质
本申请涉及计算机应用
,尤其涉及人工智能应用领域,具体涉及一种信息推荐方法、装置、电子设备及存储介质。
技术介绍
智能对话设备作为人工智能落地的重要形态之一,为用户提供了信息检索的语音入口,根据用户的语音内容进行其他的信息推荐是智能对话设备的一个重要功能,可以精确的预测用户的检索需求,减少用户主动发起询问的次数,为用户提供更好的产品体验。在用户语音需求为词汇翻译查询的场景中,目前业界常用的方案在为用户推荐相关翻译信息时,基于现有的知识库,采用人工标注的方式将常见的词汇分为若干类,然后根据用户询问的翻译词汇,为用户推荐其他同类别的词汇翻译。但是,现有的信息推荐方式中,人工标注词汇分类会导致分类的主观性较强,导致相似词语若被主观分到不同的分类中,会呈现完全不同的信息推荐结果,导致按照现有的方式进行信息推荐的准确性较差、效率较低。
技术实现思路
本申请提供了一种信息推荐方法、装置、电子设备及存储介质,用于提高信息推荐的准确性和效率。本申请提供一种信息推荐方法,包括:本文档来自技高网...

【技术保护点】
1.一种信息推荐方法,其特征在于,包括:/n接收用户的携带指定词汇的翻译请求;/n根据预先训练的词向量模型,从预先创建的词汇库中获取基于所述指定词汇的数个目标推荐词汇;所述词向量模型基于语料库中各语料的词汇序列和/或历史翻译日志中同用户同会话中的词汇序列训练而成;/n基于所述数个目标推荐词汇,向所述用户进行信息推荐。/n

【技术特征摘要】
1.一种信息推荐方法,其特征在于,包括:
接收用户的携带指定词汇的翻译请求;
根据预先训练的词向量模型,从预先创建的词汇库中获取基于所述指定词汇的数个目标推荐词汇;所述词向量模型基于语料库中各语料的词汇序列和/或历史翻译日志中同用户同会话中的词汇序列训练而成;
基于所述数个目标推荐词汇,向所述用户进行信息推荐。


2.根据权利要求1所述的方法,其特征在于,所述词汇库中包括所述语料库的所有语料中的词汇和/或所述历史翻译日志中的所有词汇;根据预先训练的词向量模型,从预先创建的词汇库中获取基于所述指定词汇的数个目标推荐词汇,包括:
根据所述词向量模型,获取所述指定词汇的向量和所述词汇库中每个所述词汇的向量;
计算所述指定词汇的向量与所述词汇库中每个词汇的向量的相似度;
根据所述指定词汇的向量与所述词汇库中每个词汇的向量的相似度,从所述词汇库中获取相似度大于预设相似度阈值的多个词汇,作为所述指定词汇的多个候选推荐词汇;
从所述多个候选推荐词汇中获取所述数个目标推荐词汇。


3.根据权利要求2所述的方法,其特征在于,从所述多个候选推荐词汇中获取所述数个目标推荐词汇,包括:
统计各所述候选推荐词汇在智能对话中的历史被访问次数;
基于各所述候选推荐词汇的所述历史被访问次数,从所述多个候选推荐词汇中筛选出所述历史被访问次数大于预设次数阈值的候选推荐词汇,作为目标推荐词汇,得到所述数个目标推荐词汇。


4.根据权利要求1-3任一所述的方法,其特征在于,接收用户的携带指定词汇的翻译请求之后,所述方法还包括:
获取所述指定词汇的翻译;
并向所述用户展示的所述指定词汇的翻译;
进一步地,所述基于所述数个目标推荐词汇,向所述用户进行信息推荐之前,所述方法还包括:
获取所述数个目标推荐词汇中各所述目标推荐词汇的翻译;
对应地,基于所述数个目标推荐词汇,向所述用户进行信息推荐,具体包括:
在向所述用户提供所述指定词汇的翻译的同时,采用自动续播的推荐方式向所述用户推荐所述数个目标推荐词汇的翻译。


5.根据权利要求1-3任一所述的方法,其特征在于,根据预先训练的词向量模型,从预先创建的词汇库中获取基于所述指定词汇的数个目标推荐词汇之前,所述方法还包括:
基于所述语料库和/或所述历史翻译日志,采集多个具有上下文关系的词汇序列;
采用所述多个词汇序列对所述词向量模型进行训练。


6.根据权利要求5所述的方法,其特征在于,基于所述语料库和/或所述历史翻译日志,采集多个具有上下文关系的词汇序列,包括:
对于所述语料库中的各所述语料,对所述语料进行切词,得到多个词汇;将所述多个词汇按照各所述词汇在所述语料中的先后顺序排列,构成所述词汇序列,共得到多个所述词汇序列;和/或
从所述历史翻译日志中获取同用户同会话中的各会话语句;将各所述会话语句进行分词,得到多个词汇;并将所述多个词汇按照在相应的所述会话语句中的先后顺序排列,得到所述词汇序列,共得到多个所述词汇序列。


7.一种信息推荐装置,其特征在于,包括:
接收模块,用于接收用户的...

【专利技术属性】
技术研发人员:张兵兵
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1