一种实时信息抽取方法及装置制造方法及图纸

技术编号:25803433 阅读:15 留言:0更新日期:2020-09-29 18:37
本发明专利技术公开了一种实时信息抽取方法,包括:将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理;将当前意图和当前实体的名称和属性值同时输入至表格填充服务中;输出当前的目标实体。可以为口语对话场景的信息抽取任务特殊定制,迎合了提问者和回答者一问一答的文本输入模式,能将前一轮提问者的问题意图保存至数据库,用户回答时可以取出数据库里的问题意图,再将问题意图和候选实体进行匹配和消歧,并将每一轮用户回答的实体信息实时的输出,使得提问者可以实时的查看目标实体的结果,且无需手动录入干预,省时省力。

【技术实现步骤摘要】
一种实时信息抽取方法及装置
本专利技术属于信息抽取
,尤其涉及一种实时信息抽取方法及装置。
技术介绍
在口语对话场景下,如,在用户信息录入时,客服人员需针对所要录入的信息对用户进行提问,用户回答后,客服人员再将信息录入到系统。传统的基于段落、篇章文本的实体信息抽取系统,必须等到客服人员与用户问答交互完成后,一次性将段落文本或篇章文本作为系统的输入,系统从中抽取用户所需的目标实体信息,最后以格式化的形式输出出来。此时,若中间某个实体抽取错误或某个实体信息缺失,客服人员是无法及时修改和填补实体结果的。
技术实现思路
本专利技术实施例提供一种实时信息抽取方法及装置,用于至少解决上述技术问题之一。第一方面,本专利技术实施例提供一种实时信息抽取方法,包括:将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理,其中,所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图,所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值;将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中,其中,所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体,其中,所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格;输出当前的目标实体。第二方面,本专利技术实施例提供一种实时信息抽取装置,包括:意图理解模块以及实体解析模块,配置为将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理,其中,所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图,所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值;表格填充模块,配置为将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中,其中,所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体,其中,所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格;输出模块,配置为输出当前的目标实体。第三方面,提供一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例的多意图识别训练或使用方法的步骤。第四方面,本专利技术实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非易失性计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,使所述计算机执行本专利技术任一实施例的多意图识别训练或使用方法的步骤。本申请的方法和装置可以为口语对话场景的信息抽取任务特殊定制,迎合了提问者和回答者一问一答的文本输入模式,能将前一轮提问者的问题意图保存至数据库,用户回答时可以取出数据库里的问题意图,再将问题意图和候选实体进行匹配和消歧,并将每一轮用户回答的实体信息实时的输出,使得提问者可以实时的查看目标实体的结果,且无需手动录入干预,省时省力,在中间有实体缺失或错误时,提问者可以实时对用户重新提问来修改结果,解决了需要在交互完成后,才能将所有文本一次性作为输入,做不到实时处理的问题。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的一种识别实时信息抽取方法的流程图;图2为本专利技术一实施例提供的另一种识别实时信息抽取方法的流程图;图3为本专利技术一实施例提供的再一种识别实时信息抽取方法的流程图;图4为本专利技术一实施例提供的一个具体实施例的实时信息抽取方法的流程图;图5为本专利技术一实施例提供的另一个具体实施例的实时信息抽取方法的流程图;图6为本专利技术一实施例提供的一种识别实时信息抽取方法的工作流程框图;图7为本专利技术一实施例提供的一种识别实时信息抽取装置的框图;图8是本专利技术一实施例提供的电子设备的结构示意图;具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参考图1,其示出了本申请的识别实时信息抽取方法一实施例的流程图,本实施例的识别实时信息抽取方法可以适用于具备通讯或者实时语音对话功能的终端、如智能手机、平板、电脑等。如图1所示,在步骤101中,将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理;在步骤102中,将当前意图和当前实体的名称和属性值同时输入至表格填充服务中;在步骤103中,输出当前的目标实体。在本实施例中,对于步骤101,实时信息抽取装置在接收到提问者的口语文本和回答者的口语文本之后,对提问者的口语文本和回答者的口语文本进行意图理解服务和实体解析服务处理。其中,意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图,实体解析服务用于抽取提问者的口语文本和回答者的口语文本中的实体并输出当前实体的名称和属性值。之后,对于步骤102,实时信息抽取装置将在提问者的口语文本和回答者的口语文本中抽取的当前意图和当前实体的名称和属性值同时输入到表格填充服务中,使得获取当前的目标实体。其中,表格填充服务用于基于预定义的目标实体对当前意图和当前实体的名称和属性值进行关联处理得到最终的目标实体,其中,预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格。之后,对于步骤103,将获取的当前的目标实体输出至实时信息抽取装置的前端,使得工作人员能够直观的观察到获取的目标实体。本实施例的方法通过对每一轮的提问者的口语文本和回答者的口语文本进行实时信息抽取,然后将抽取的当前意图和当前实体的名称和属性值进行关联处理得到目标实体,并将每一轮获取的目标实体信息进行实时的输出,使得提问者可以实时的查看目标实体的结果,且无需手动录入干预,从而提高了信息录入的效率。在口语交互场景下,提问者提出问题,回答者给出答案,然后提问者从答案中抽取关键信息录入到系统。在这个问答交互的过程中,提问者会针对所要获取的信息通过自然语言的表达方式进行提问,回答者也会将答案以口语的方式表述出来,但录入系统的信息必须是结构化的信息,因此提问者还需从回答者的口本文档来自技高网...

【技术保护点】
1.一种实时信息抽取方法,包括:/n将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理,其中,所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图,所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值;/n将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中,其中,所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体,其中,所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格;/n输出当前的目标实体。/n

【技术特征摘要】
1.一种实时信息抽取方法,包括:
将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理,其中,所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图,所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值;
将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中,其中,所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体,其中,所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格;
输出当前的目标实体。


2.根据权利要求1所述的方法,其中,所述将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中还包括:
判断是否存在多个与所述当前意图相关的所述预定义的目标实体;
若不存在多个与所述当前意图相关的所述预定义的目标实体,则将所述当前意图直接与所述当前实体的名称和属性值进行关联处理得到最终的目标实体;
若存在多个与所述当前意图相关的所述预定义的目标实体,则将所述当前意图转换成具体化意图;
将所述具体化意图与所述当前实体的名称和属性值进行关联处理得到最终的目标实体。


3.根据权利要求2所述的方法,其中,所述若存在多个与所述当前意图相关的所述预定义的目标实体,则将所述当前意图转换成具体化意图包括:
获取上一轮的提问者的口语文本对应的意图;
将所述当前意图基于上一轮的提问者的口语文本对应的意图转换成具体化意图。


4.根据权利要求1所述的方法,其中,在所述将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理之前,所述方法还包括:
判断所述实时接收的提问者的口语文本和回答者的口语文本中是否存在结束信号;
若所述实时接收的提问者的口语文本和回答者的口语文本中不存在结束信号,将所述实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理;
若所述实时接收的提问者的口语文本和回答者的口语文本中存在结束信号,直接输出最终的目标实体。


5.根据权利要求1所述的方法,其中,在将所述当前意...

【专利技术属性】
技术研发人员:方艳徐华
申请(专利权)人:苏州思必驰信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1