基于知识图谱的信息推送方法和装置制造方法及图纸

技术编号:18204345 阅读:22 留言:0更新日期:2018-06-13 06:22
本申请实施例公开了基于知识图谱的信息推送方法和装置。该方法的一具体实施方式包括:识别目标文本中的至少一个实体;确定该至少一个实体中的各个实体的类别;确定该目标文本中的意图点词,将该至少一个实体中的、与该意图点词相关联的实体确定为目标实体;从预置的知识图谱中确定与该目标实体、该目标实体的类别和该意图点词相匹配的知识信息,推送该知识信息。该实施方式实现了富于针对性的信息推送。

【技术实现步骤摘要】
基于知识图谱的信息推送方法和装置
本申请实施例涉及计算机
,具体涉及互联网
,尤其涉及基于知识图谱的信息推送方法和装置。
技术介绍
在搜索、信息推荐等场景下,均会涉及到对用户需求(如搜索句)、内容(如网页内容、微博等)中的文本理解问题,需要理解用户的意图,进而向用户推送相关信息。现有的信息推送方法通常是对待处理文本进行语法分析(例如切词、词性标注等)和语义分析(例如确定文本的主题等),而后基于语法分析结果和语义分析结果进行内容搜索,进而向用户推送搜索到的信息。
技术实现思路
本申请实施例提出了基于知识图谱的信息推送方法和装置。第一方面,本申请实施例提供了一种基于知识图谱的信息推送方法,该方法包括:识别目标文本中的至少一个实体;确定至少一个实体中的各个实体的类别;确定目标文本中的意图点词,将至少一个实体中的、与意图点词相关联的实体确定为目标实体;从预置的知识图谱中确定与目标实体、目标实体的类别和意图点词相匹配的知识信息,推送知识信息。在一些实施例中,识别目标文本中的至少一个实体,包括:将目标文本输入至预先训练的实体识别模型,确定目标文本中的实体,其中,实体识别模型用于表征文本与实体的对应关系。在一些实施例中,在识别目标文本中的至少一个实体之后,该方法还包括:对于至少一个实体中的每一个实体,从预置的知识图谱中确定与该实体相关联的至少一个实体,将所确定的与该实体相关联的实体作为候选关联实体,确定各个候选关联实体与该实体的关联度,将关联度最高的候选关联实体确定为与该实体相匹配的潜在实体。在一些实施例中,在从预置的知识图谱中确定与该实体相关联的至少一个实体之后,该方法还包括:对于至少一个实体中的每一个实体,响应于确定知识图谱中不存在与该实体相关联的实体,将该实体归入知识图谱中。在一些实施例中,确定至少一个实体中的各个实体的类别,包括:对于至少一个实体中的每一个实体,基于预置的、实体与类别的对应关系信息,确定与该实体相对应的至少一个候选类别;基于随机游走算法对至少一个候选类别进行排序;基于排序结果确定至少一个候选类别中的该实体的类别。在一些实施例中,确定目标文本中的意图点词,将至少一个实体中的、与意图点词相关联的实体确定为目标实体,包括:确定知识图谱中的、与至少一个实体中的各个实体相匹配的潜在实体所关联的关联意图点词;基于各个关联意图点词与目标文本的匹配结果,确定目标文本中的意图点词;基于预置的实体与意图点词的共现信息,确定至少一个实体中的、与意图点词相关联的实体,并将所确定的实体确定为目标实体。第二方面,本申请实施例提供了一种基于知识图谱的信息推送装置,该装置包括:识别单元,配置用于识别目标文本中的至少一个实体;第一确定单元,配置用于确定至少一个实体中的各个实体的类别;第二确定单元,配置用于确定目标文本中的意图点词,将至少一个实体中的、与意图点词相关联的实体确定为目标实体;推送单元,配置用于从预置的知识图谱中确定与目标实体、目标实体的类别和意图点词相匹配的知识信息,推送知识信息。在一些实施例中,识别单元进一步配置用于:将目标文本输入至预先训练的实体识别模型,确定目标文本中的实体,其中,实体识别模型用于表征文本与实体的对应关系。在一些实施例中,该装置还包括:第三确定单元,配置用于对于至少一个实体中的每一个实体,从预置的知识图谱中确定与该实体相关联的至少一个实体,将所确定的与该实体相关联的实体作为候选关联实体,确定各个候选关联实体与该实体的关联度,将关联度最高的候选关联实体确定为与该实体相匹配的潜在实体。在一些实施例中,该装置还包括:归入单元,配置用于对于至少一个实体中的每一个实体,响应于确定知识图谱中不存在与该实体相关联的实体,将该实体归入知识图谱中。在一些实施例中,第一确定单元进一步配置用于:对于至少一个实体中的每一个实体,基于预置的、实体与类别的对应关系信息,确定与该实体相对应的至少一个候选类别;基于随机游走算法对至少一个候选类别进行排序;基于排序结果确定至少一个候选类别中的该实体的类别。在一些实施例中,第二确定单元包括:第一确定模块,配置用于确定知识图谱中的、与至少一个实体中的各个实体相匹配的潜在实体所关联的关联意图点词;第二确定模块,配置用于基于各个关联意图点词与目标文本的匹配结果,确定目标文本中的意图点词;第三确定模块,配置用于基于预置的实体与意图点词的共现信息,确定至少一个实体中的、与意图点词相关联的实体,并将所确定的实体确定为目标实体。第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储装置,用于存储一个或多个程序;摄像头,用于采集图像;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如基于知识图谱的信息推送方法中任一实施例的方法。第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如基于知识图谱的信息推送方法中任一实施例的方法。本申请实施例提供的基于知识图谱的信息推送方法和装置,通过识别目标文本中的至少一个实体,以便确定各个实体的类别,之后确定该目标文本中的意图点词,将该至少一个实体中的、与该意图点词相关联的实体确定为目标实体,最后从预置的知识图谱中确定与该目标实体、该目标实体的类别和该意图点词相匹配的知识信息,推送该知识信息,从而在语义分析难度较大的场景下可以基于知识图谱确定文本的意图,实现了富于针对性的信息推送。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请可以应用于其中的示例性系统架构图;图2是根据本申请的基于知识图谱的信息推送方法的一个实施例的流程图;图3是根据本申请的基于知识图谱的信息推送方法的一个应用场景的示意图;图4是根据本申请的基于知识图谱的信息推送方法的又一个实施例的流程图;图5是根据本申请的基于知识图谱的信息推送装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请的基于知识图谱的信息推送方法或基于知识图谱的信息推送方法与装置的示例性系统架构100。如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、搜索类应用、社交平台软件、即时通信工具、邮箱客户端等。终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、本文档来自技高网...
基于知识图谱的信息推送方法和装置

【技术保护点】
一种基于知识图谱的信息推送方法,包括:识别目标文本中的至少一个实体;确定所述至少一个实体中的各个实体的类别;确定所述目标文本中的意图点词,将所述至少一个实体中的、与所述意图点词相关联的实体确定为目标实体;从预置的知识图谱中确定与所述目标实体、所述目标实体的类别和所述意图点词相匹配的知识信息,推送所述知识信息。

【技术特征摘要】
1.一种基于知识图谱的信息推送方法,包括:识别目标文本中的至少一个实体;确定所述至少一个实体中的各个实体的类别;确定所述目标文本中的意图点词,将所述至少一个实体中的、与所述意图点词相关联的实体确定为目标实体;从预置的知识图谱中确定与所述目标实体、所述目标实体的类别和所述意图点词相匹配的知识信息,推送所述知识信息。2.根据权利要求1所述的基于知识图谱的信息推送方法,其中,所述识别目标文本中的至少一个实体,包括:将所述目标文本输入至预先训练的实体识别模型,确定所述目标文本中的实体,其中,所述实体识别模型用于表征文本与实体的对应关系。3.根据权利要求1所述的基于知识图谱的信息推送方法,其中,在所述识别目标文本中的至少一个实体之后,所述方法还包括:对于所述至少一个实体中的每一个实体,从预置的知识图谱中确定与该实体相关联的至少一个实体,将所确定的与该实体相关联的实体作为候选关联实体,确定各个候选关联实体与该实体的关联度,将关联度最高的候选关联实体确定为与该实体相匹配的潜在实体。4.根据权利要求3所述的基于知识图谱的信息推送方法,其中,在所述从预置的知识图谱中确定与该实体相关联的至少一个实体之后,所述方法还包括:对于所述至少一个实体中的每一个实体,响应于确定所述知识图谱中不存在与该实体相关联的实体,将该实体归入所述知识图谱中。5.根据权利要求1所述的基于知识图谱的信息推送方法,其中,所述确定所述至少一个实体中的各个实体的类别,包括:对于所述至少一个实体中的每一个实体,基于预置的、实体与类别的对应关系信息,确定与该实体相对应的至少一个候选类别;基于随机游走算法对所述至少一个候选类别进行排序;基于排序结果确定所述至少一个候选类别中的该实体的类别。6.根据权利要求3所述的基于知识图谱的信息推送方法,其中,所述确定所述目标文本中的意图点词,将所述至少一个实体中的、与所述意图点词相关联的实体确定为目标实体,包括:确定知识图谱中的、与所述至少一个实体中的各个实体相匹配的潜在实体所关联的关联意图点词;基于各个关联意图点词与所述目标文本的匹配结果,确定所述目标文本中的意图点词;基于预置的实体与意图点词的共现信息,确定所述至少一个实体中的、与所述意图点词相关联的实体,并将所确定的实体确定为目标实体。7.一种基于知识图谱的信息推送装置,包括:识别单元,配置用于识别目标文本中的至少一个实体;第一确定单元,配置用于确定所述至少一个实体中的各个实体的类别...

【专利技术属性】
技术研发人员:冯知凡陆超任可欣汪琦朱勇李莹
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1