资源推荐方法及装置制造方法及图纸

技术编号:23764962 阅读:63 留言:0更新日期:2020-04-11 19:20
本申请公开了一种资源推荐方法及装置,涉及互联网技术及知识图谱领域,该方法包括:服务器接收到终端设备发送的携带目标实体的实体标识的推荐请求后,利用实体标识确定出与目标实体相关的热门意图,利用热门意图确定目标资源并推送给终端设备。采用该种方案,由于热门意图是服务器利用历史的查询语句和日志,对意图进行结构化,并根据结构化字段对意图进行归一得到的,能够反映大多数用户对目标实体的最关心的方面,因此,能够实现精准推荐。

Resource recommendation methods and devices

【技术实现步骤摘要】
资源推荐方法及装置
本申请实施例涉及人工智能(ArtificialIntelligence,AI)
,尤其涉及一种资源推荐方法及装置。
技术介绍
目前,资源推荐过程中,后台的服务器推测出用户的意图,基于意图确定用户感兴趣的资源并推荐,以实现精准推荐的目的。其中,意图是后台的服务器利用自然语言处理得到的。由于汉语的多样性,同一个意图具有多种表达方式,如通过不同的词汇表达、通过不同顺序不同语法结构的自然语言表达,因此,需要将多种多样的意图进行归一化,利用归一化的意图进行下一步的操作。传统的意图归一化方法中,预先设定意图标签,通过机器学习方法对自然语言文本进行意图分类。分类过程中,考虑自然语言文本的整体语义,将该自然语言文本转换为分类任务,划分到同一类别的自然语言文本使用相同的意图标签。其中,意图标签可以是播放音乐、开灯、订机票等。分类后,利用对应类别的自然语言解析模型对自然语言文本进行解析,以解析出用户的意图。上述将意图识别转化为分类任务的方法中,通过人工定义热门意图词汇得到意图标签。然而,人工定义出的意图标签是有限的,仅能覆本文档来自技高网...

【技术保护点】
1.一种资源推荐方法,其特征在于,包括:/n接收终端设备发送的推荐请求,所述推荐请求携带目标实体的实体标识;/n利用所述实体标识,从热门意图库中确定与所述目标实体相关的热门意图,所述热门意图库是服务器利用多个实体对应的多条查询语句和日志得到的,所述日志用于记录各所述查询语句的搜索特征,所述查询语句为包含实体和实体相关意图的自然语言文本;/n利用所述热门意图,确定目标资源;/n向所述终端设备发送所述目标资源。/n

【技术特征摘要】
1.一种资源推荐方法,其特征在于,包括:
接收终端设备发送的推荐请求,所述推荐请求携带目标实体的实体标识;
利用所述实体标识,从热门意图库中确定与所述目标实体相关的热门意图,所述热门意图库是服务器利用多个实体对应的多条查询语句和日志得到的,所述日志用于记录各所述查询语句的搜索特征,所述查询语句为包含实体和实体相关意图的自然语言文本;
利用所述热门意图,确定目标资源;
向所述终端设备发送所述目标资源。


2.根据权利要求1所述的方法,其特征在于,所述利用所述实体标识,从热门意图库中确定与所述目标实体相关的热门意图之前,还包括:
对于多条查询语句中的每一条查询语句,拆分出实体和所述实体的意图表述,得到多个实体和多条意图表述,所述目标实体包含于所述多个实体中;
对于每一实体的各意图表述,结构化各所述意图表述,得到各所述意图表述的结构化字段;
对于第i实体,利用所述第i实体的各所述意图表述的结构化字段和所述日志,确定所述的i实体的热门意图,以得到所述热门意图库,所述第i实体是所述多个实体中的任意一个,i∈[1,……,M],M为多个实体中实体的个数。


3.根据权利要求2所述的方法,其特征在于,所述对于第i实体,利用所述第i实体的各所述意图表述的结构化字段和所述日志,确定所述的i实体的热门意图,包括:
对于所述第i实体,利用所述第i实体的各所述意图表述的结构化字段包含的意图字段,确定第i意图字段集合;
对于所述第i意图字段集合中的每个意图字段,查询所述日志,以确定所述第i意图字段集合中的各意图字段的搜索特征,所述搜索特征用于指示意图强度;
对于所述第i意图字段集合中的每个意图字段,利用各意图字段的搜索特征,分别确定各意图字段的分数,所述分数用于指示意图字段对应的意图的热门程度;
按照分数从高到低的顺序,对所述第i意图字段集合中的每个意图字段排序,得到第i顺序,将所述第i顺序中的前N个意图字段指示的意图作为所述第i实体的热门意图。


4.根据权利要求3所述的方法,其特征在于,所述对于所述第i实体,利用所述第i实体的各所述意图表述的结构化字段包含的意图字段,确定第i意图字段集合,包括:
对第i意图对集合中的意图对倒排索引,以过滤掉不相关的意图对,所述第i意图对集合包含的意图对是所述第i实体的任意两个结构化字段包含的意图字段的组合;
根据倒排索引后剩余的意图对确定所述第i意图字段集合。


5.根据权利要求4所述的方法,其特征在于,所述根据倒排索引后剩余的意图对确定所述第i意图字段集合,包括:
确定经过倒排索引后剩余的意图对中,各意图对中的意图之间的距离;
根据各意图对中的意图之间的距离,得到多个聚簇,属于同一聚簇的各意图之间的距离小于预设阈值;
归一化属于同一聚簇的各意图,得到所述第i意图字段集合。


...

【专利技术属性】
技术研发人员:朱嘉琪许超王灿卢佳俊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1