一种实时信息抽取方法及装置制造方法及图纸

技术编号：25803433 阅读：15 留言：0更新日期：2020-09-29 18:37

本发明专利技术公开了一种实时信息抽取方法，包括：将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理；将当前意图和当前实体的名称和属性值同时输入至表格填充服务中；输出当前的目标实体。可以为口语对话场景的信息抽取任务特殊定制，迎合了提问者和回答者一问一答的文本输入模式，能将前一轮提问者的问题意图保存至数据库，用户回答时可以取出数据库里的问题意图，再将问题意图和候选实体进行匹配和消歧，并将每一轮用户回答的实体信息实时的输出，使得提问者可以实时的查看目标实体的结果，且无需手动录入干预，省时省力。

全部详细技术资料下载

【技术实现步骤摘要】
一种实时信息抽取方法及装置
本专利技术属于信息抽取
，尤其涉及一种实时信息抽取方法及装置。
技术介绍
在口语对话场景下，如，在用户信息录入时，客服人员需针对所要录入的信息对用户进行提问，用户回答后，客服人员再将信息录入到系统。传统的基于段落、篇章文本的实体信息抽取系统，必须等到客服人员与用户问答交互完成后，一次性将段落文本或篇章文本作为系统的输入，系统从中抽取用户所需的目标实体信息，最后以格式化的形式输出出来。此时，若中间某个实体抽取错误或某个实体信息缺失，客服人员是无法及时修改和填补实体结果的。
技术实现思路
本专利技术实施例提供一种实时信息抽取方法及装置，用于至少解决上述技术问题之一。第一方面，本专利技术实施例提供一种实时信息抽取方法，包括：将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理，其中，所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图，所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值；将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中，其中，所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体，其中，所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格；输出当前的目标实体。第二方面，本专利技术实施例提供一种实时信息抽取装置，...

【技术保护点】
1.一种实时信息抽取方法，包括：/n将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理，其中，所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图，所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值；/n将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中，其中，所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体，其中，所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格；/n输出当前的目标实体。/n

【技术特征摘要】
1.一种实时信息抽取方法，包括：
将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理，其中，所述意图理解服务用于对提问者的口语文本进行意图分类并输出提问者的口语文本对应的当前意图，所述实体解析服务用于抽取所述提问者的口语文本和所述回答者的口语文本中的实体并输出当前实体的名称和属性值；
将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中，其中，所述表格填充服务用于基于预定义的目标实体对所述当前意图和所述当前实体的名称和属性值进行关联处理得到最终的目标实体，其中，所述预定义的目标实体为预先定义的待采集的信息的名称和属性值对应的表格；
输出当前的目标实体。

2.根据权利要求1所述的方法，其中，所述将所述当前意图和所述当前实体的名称和属性值同时输入至表格填充服务中还包括：
判断是否存在多个与所述当前意图相关的所述预定义的目标实体；
若不存在多个与所述当前意图相关的所述预定义的目标实体，则将所述当前意图直接与所述当前实体的名称和属性值进行关联处理得到最终的目标实体；
若存在多个与所述当前意图相关的所述预定义的目标实体，则将所述当前意图转换成具体化意图；
将所述具体化意图与所述当前实体的名称和属性值进行关联处理得到最终的目标实体。

3.根据权利要求2所述的方法，其中，所述若存在多个与所述当前意图相关的所述预定义的目标实体，则将所述当前意图转换成具体化意图包括：
获取上一轮的提问者的口语文本对应的意图；
将所述当前意图基于上一轮的提问者的口语文本对应的意图转换成具体化意图。

4.根据权利要求1所述的方法，其中，在所述将实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理之前，所述方法还包括：
判断所述实时接收的提问者的口语文本和回答者的口语文本中是否存在结束信号；
若所述实时接收的提问者的口语文本和回答者的口语文本中不存在结束信号，将所述实时接收的提问者的口语文本和回答者的口语文本同时输入至意图理解服务和实体解析服务进行处理；
若所述实时接收的提问者的口语文本和回答者的口语文本中存在结束信号，直接输出最终的目标实体。

5.根据权利要求1所述的方法，其中，在将所述当前意...

【专利技术属性】
技术研发人员：方艳，徐华，
申请(专利权)人：苏州思必驰信息科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人