生成序列标注模型的方法、设备、介质及程序产品技术

技术编号:28736479 阅读:20 留言:0更新日期:2021-06-06 11:44
本申请公开了一种生成序列标注模型的方法、设备、介质及程序产品,涉及知识图谱、自然语言处理和深度学习等人工智能技术领域。该方法的一具体实施方式包括:获取第一搜索信息和对应的第一标签;根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;响应于第二标签与第一标签不一致,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型。得到训练后的序列标注模型。得到训练后的序列标注模型。

【技术实现步骤摘要】
生成序列标注模型的方法、设备、介质及程序产品


[0001]本申请涉及计算机
,具体涉及知识图谱、自然语言处理和深度学习等人工智能
,尤其涉及一种生成序列标注模型的方法、设备、介质及程序产品。

技术介绍

[0002]随着互联网的发展,用户可以通过搜索信息来获取用户需要搜索的结果。
[0003]目前,基于知识图谱理解固定搜索信息,以达到识别用户意图和需求的目的。

技术实现思路

[0004]本申请实施例提出了一种生成序列标注模型的方法、设备、介质及程序产品。
[0005]第一方面,本申请实施例提出了一种生成序列标注模型的方法,包括:获取第一搜索信息和对应的第一标签;根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;响应于第二标签与第一标签不一致,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型。
[0006]第二方面,本申请实施例提出了一种生成序列标注模型的装置,包括:第一获取模块,被配置成获取第一搜索信息和对应的第一标签;第二获取模块,被配置成根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;信息确定模块,被配置成响应于第二标签与第一标签不一致,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;模型训练模块,被配置成基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型。
[0007]第三方面,本申请实施例提出了一种确定搜索结果的方法,包括:获取第二搜索信息,其中,第二搜索信息包括第二需求信息和预设的知识图谱中的知识图谱既定信息;根据知识图谱既定信息,从知识图谱中获取知识图谱既定信息对应的标签结果,以及将第二需求信息输入序列标注模型中,得到第二需求信息对应的标签结果;根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,得到第二搜索信息对应的搜索结果,并展示搜索结果。
[0008]第四方面,本申请实施例提出了一种确定搜索结果的装置,包括:信息获取模块,被配置成获取第二搜索信息,其中,第二搜索信息包括第二需求信息和预设的知识图谱中的知识图谱既定信息;标签得到模块,被配置成根据知识图谱既定信息,从知识图谱中获取知识图谱既定信息对应的标签结果,以及将第二需求信息输入序列标注模型中,得到第二需求信息对应的标签结果;结果得到模块,被配置成根据知识图谱既定信息对应的标签结果和第二需求信息对应的标签结果,得到第二搜索信息对应的搜索结果,并展示搜索结果。
[0009]第五方面,本申请实施例提出了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面或第二方面描述的方
法。
[0010]第六方面,本申请实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行如第一方面或第二方面描述的方法。
[0011]第七方面,本申请实施例提出了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现第一方面或第二方面描述的方法。
[0012]第八方面,本申请实施例提出了一种搜索信息,包括生成序列标注模型的装置和确定搜索结果的装置。
[0013]本申请实施例提供的生成序列标注模型的方法、设备、介质及程序产品,首先获取第一搜索信息和对应的第一标签;然后,根据第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;然后在第二标签与第一标签不一致时,确定第一搜索信息中的第一需求信息不为知识图谱中的信息;最后基于第一需求信息和第一需求信息对应的标签进行训练,得到训练后的序列标注模型,可以基于第一搜索信息中变化的部分(即第一需求信息)训练序列标注模型,以辅助知识图谱,实现对第一搜索信息准确的识别,从而到达准确识别用户意图和需求的目的。
[0014]应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0015]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显。附图用于更好地理解本方案,不构成对本申请的限定。其中:
[0016]图1是本申请可以应用于其中的示例性系统架构;
[0017]图2是根据本申请的生成序列标注模型的方法的一个实施例的流程图;
[0018]图3是根据本申请的确定搜索结果的方法的一个实施例的流程图;
[0019]图4是根据本申请的确定搜索结果的方法的一个应用场景图;
[0020]图5是根据本申请的搜索系统的一个应用示意图;
[0021]图6是根据本申请的生成序列标注模型的装置的一个实施例的结构示意图;
[0022]图7是根据本申请的确定搜索结果的装置的一个实施例的结构示意图;
[0023]图8是用来实现本申请实施例的生成序列标注模型的方法的电子设备的框图。
具体实施方式
[0024]以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0025]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0026]图1示出了可以应用本申请的生成序列标注模型的方法和装置或确定搜索结果的方法和装置的实施例的示例性系统架构100。
[0027]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103、服务器105任意两个之间提供通信链路的介质。网络104可以包括各种连接类别,例如有线、无线通信链路或者光纤电缆等等。
[0028]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种应用,例如各种客户端应用、多方交互应用、人工智能应用等。
[0029]服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103提供支持的后台服务器。后台服务器可以对接收到的请求等数据进行分析等处理,并将处理结果反馈给终端设备。
[0030]需要说明的是,服务器可以是硬件,也可以是软件。当服务器为硬件时,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器。当服务器为软件时,可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种生成序列标注模型的方法,包括:获取第一搜索信息和对应的第一标签;根据所述第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;响应于所述第二标签与所述第一标签不一致,确定所述第一搜索信息中的第一需求信息不为所述知识图谱中的信息;基于所述第一需求信息和所述第一需求信息对应的标签进行训练,得到训练后的序列标注模型。2.根据权利要求1所述的方法,其中,所述第一需求信息包括以下至少一项:实体需求限定信息、问答需求限定信息、泛需求限定信息。3.根据权利要求1或2所述的方法,其中,所述第一搜索信息还包括:知识图谱既定信息,其中,所述知识图谱既定信息为所述知识图谱中的信息。4.根据权利要求3所述的方法,其中,所述知识图谱既定信息包括以下至少一项:实体既定信息、问答既定信息、泛需求既定信息。5.根据权利要求4所述的方法,其中,所述实体既定信息包括:实体提及和/或实体的本质属性信息。6.根据权利要求5所述的方法,其中,所述序列标注模型,包括:ERNIE层、双向长短期记忆网络层和条件随机场层。7.根据权利要求1或2所述的方法,其中,所述第二标签与所述第一标签不一致,包括:所述第二标签为错误的标签;或,所述第二标签为无法识别对应的标签。8.一种确定搜索结果的方法,包括:获取第二搜索信息,其中,所述第二搜索信息包括第二需求信息和预设的知识图谱中的知识图谱既定信息;根据所述知识图谱既定信息,从所述知识图谱中获取所述知识图谱既定信息对应的标签结果,以及将所述第二需求信息输入预先训练的序列标注模型中,得到所述第二需求信息对应的标签结果;根据所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,得到所述第二搜索信息对应的搜索结果,并展示所述搜索结果。9.根据权利要求8所述的方法,其中,所述根据所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,得到所述第二搜索信息对应的搜索结果,包括:根据所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,确定所述第二搜索信息的类型;根据所述知识图谱既定信息对应的标签结果、所述第二需求信息对应的标签结果,以及所述第二搜索信息的类型,确定所述第二搜索信息的类型对应的搜索结果。10.根据权利要求9所述的方法,其中,所述根据所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,确定所述第二搜索信息的类型,包括:利用所述知识图谱对所述知识图谱既定信息设置实体知识标签,得到实体知识标签结果,以及利用所述序列标注模型对所述第二需求信息设置实体需求标签,得到实体需求标签结果;与利用所述知识图谱对所述知识图谱既定信息设置实体知识标签的步骤并行执行,利
用所述知识图谱对所述知识图谱既定信息设置泛需求知识标签,得到泛需求知识标签结果,以及利用所述序列标注模型对所述第二需求信息设置泛需求需求标签,得到泛需求需求标签结果;响应于所述知识图谱既定信息和/或第二需求信息还包括未被识别的信息,利用所述知识图谱对所述未被识别的信息设置问答知识标签,得到问答知识标签结果,以及利用所述序列标注模型对所述未被识别的信息设置问答需求标签;根据所述实体知识标签结果、实体需求标签结果、泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果,确定所述第二搜索信息的类型。11.根据权利要求9或10所述的方法,所述方法还包括:定位所述知识图谱既定信息中的目标实体;确定所述目标实体的实体候选集;从所述实体候选集中确定最终实体;所述根据所述知识图谱既定信息对应的标签结果、所述第二需求信息对应的标签结果,以及所述第二搜索信息的类型,确定所述第二搜索信息的类型对应的搜索结果,包括:根据所述最终实体对应的标签结果、所述第二需求信息对应的标签结果,以及所述第二搜索信息的类型,确定所述第二搜索信息的类型对应的搜索结果。12.根据权利要求11所述的方法,其中,所述从所述实体候选集中确定最终实体,包括:根据以下至少一项,从所述实体候选集中确定最终实体:实体候选集中每个实体的热度特征、实体候选集中每个实体的时间特征、实体候选集中每个实体与所述目标实体的相似度。13.根据权利要求10所述的方法,其中,所述根据所述实体知识标签结果、实体需求标签结果、泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果,确定所述第二搜索信息的类型,包括:响应于所述泛需求知识标签结果、泛需求需求标签结果、问答知识标签结果、问答需求标签结果为错误的标签结果,根据所述实体知识标签结果和实体需求标签结果,确定所述第二搜索信息的类型为实体搜索信息;响应于所述泛需求知识标签结果、泛需求需求标签结果为错误的标签结果,根据所述实体知识标签结果、实体需求标签结果、问答知识标签结果和问答需求标签结果,确定所述第二搜索信息的类型为问答信息;响应于所述实体知识标签结果、实体需求标签结果、问答知识标签结果、问答需求标签结果,根据所述泛需求知识标签结果和泛需求需求标签结果,确定所述第二搜索信息的类型为泛需求搜索信息。14.根据权利要求8所述的方法,其中,所述根据所述知识图谱既定信息对应的标签和所述第二需求信息对应的标签,得到所述第二搜索信息对应的搜索结果,包括:将所述知识图谱既定信息对应的标签结果和所述第二需求信息对应的标签结果,转化为图检索语句;根据所述图检索语句,得到所述图检索语句对应的搜索结果。15.一种生成序列标注模型的装置,包括:第一获取模块,被配置成获取第一搜索信息和对应的第一标签;
第二获取模块,被配置成根据所述第一搜索信息,从预设的知识图谱中获取第一搜索信息对应的第二标签;信息确定模块,被配置成响应于所述第二标签与所述第一标签不一致,确定所述第一搜索信息中的第一需求信息不为所述知识图谱中的信息;模型训练模块,被配置成基于所述第一需求信息和所述第一需求信息对应的标签进行训练,得到训练后...

【专利技术属性】
技术研发人员:林泽南卢佳俊
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1