System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,尤其涉及一种信息提取方法、装置、电子设备及存储介质。
技术介绍
1、在各行各业,几乎都会存在业务人员与客户沟通的对话场景,比如在产品销售、服务咨询等活动中,存在业务人员与客户进行对话交流的场景。在这些对话场景中,客户与业务人员之间会产生大量的、多轮次的对话交流。
2、而对于录制的对话数据的应用,目前还是停留在对话数据的存档、证据溯源等传统应用上,无法实现更加高效的关键信息抽取和作业辅助。当用户需要从对话数据中提取需要的信息时,常规的做法是直接从对话数据中检索与问题相关的信息,该信息提取方式效率较低,并且提取的信息准确度较低。
技术实现思路
1、根据本申请实施例的第一方面,提供了一种信息提取方法,包括:
2、获取特定业务场景下的对话数据以及待答复的问题信息;
3、从所述问题信息中提取关键词,并至少基于提取的关键词,从所述对话数据中筛选与所述关键词相关的对话数据,作为备用对话数据;
4、从所述备用对话数据中提取得到与所述问题信息对应的答案信息;
5、从预先构建的知识库中,提取得到与所述问题信息相对应的知识数据,并利用所述知识数据,对所述答案信息进行优化调整;所述知识库由所述特定业务场景所属行业的知识数据和/或业务数据构建得到。
6、根据本申请实施例的第二方面,提供了一种信息提取装置,包括:
7、数据获取单元,用于获取特定业务场景下的对话数据以及待答复的问题信息;
8、数据
9、标签提取单元,用于从所述备用对话数据中提取得到与所述问题信息对应的答案信息;从预先构建的知识库中,提取得到与所述问题信息相对应的知识数据,并利用所述知识数据,对所述答案信息进行优化调整;所述知识库由所述特定业务场景所属行业的知识数据和/或业务数据构建得到。
10、根据本申请实施例的第三方面,提供了一种电子设备,包括存储器和处理器;
11、所述存储器与所述处理器连接,用于存储程序;
12、所述处理器用于通过运行所述存储器中的程序,实现以上任意一项所述的信息提取方法。
13、根据本申请实施例的第四方面,提供了一种存储介质,所述存储介质上存储有计算机程序,所述计算机程序被处理器运行时,实现以上任意一项所述的信息提取方法。
14、根据本申请实施例的第五方面,提供了一种计算机程序产品或计算机程序,所述计算机程序产品或所述计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中;计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,处理器执行所述计算机指令,使得所述计算机设备执行上述的方法。
15、本申请提出的信息提取方法,能够借助关键词从特定业务场景的对话数据中筛选出与问题信息相关的备用对话数据,然后从备用对话数据中提取与问题信息对应的答案信息。在此基础上,还借助由上述特定业务场景所属行业的知识数据和/或业务数据构建的知识库,从中提取与问题信息对应的知识数据,用于对提取的答案信息进行优化调整,从而使得答案信息符合行业知识,提高了答案信息提取的准确度和效率。
16、在一些实现方式中,本申请提出的信息提取方法利用特定业务场景所属行业的知识数据和/或业务数据,对预训练的生成式语言模型进行微调,得到答案信息提取模型。基于上述的答案信息提取模型,在获取到上述特定业务场景下的对话数据以及待答复的问题信息时,能够基于待答复的问题信息中的关键词,从对话数据中筛选出与这些关键词相关的对话数据,作为备用对话数据,然后,借助预先训练的答案信息提取模型,从该备用对话数据中提取得到与该问题信息对应的答案信息。该方案实现了自动从对话数据中提取出与问题信息相对应的答案信息,即能够实现自动从对话数据中提炼解答问题的答案,从而实现了更加高效的关键信息抽取和作业辅助。
17、基于预训练的生成式语言模型强大的自然语言处理能力,该方案的答案信息提取准确度更高,实现了信息抽取的质量和效率双双提升。
本文档来自技高网...【技术保护点】
1.一种信息提取方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,从所述备用对话数据中提取得到与所述问题信息对应的答案信息,包括:
3.根据权利要求2所述的方法,其特征在于,所述利用预先训练的信息提取模型,从所述备用对话数据中提取得到与所述问题信息对应的答案信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述信息提取任务还用于从所述备用对话数据中,提取出与提取的答案信息对应的对话上下文;
5.根据权利要求1所述的方法,其特征在于,所述利用所述知识数据,对所述答案信息进行优化调整,包括:
6.根据权利要求1所述的方法,其特征在于,所述知识库包括行业知识图谱和实体知识图谱,所述行业知识图谱由所述特定业务场景所属行业的知识数据构建得到,所述实体知识图谱由所述特定业务场景所属行业的特定实体的知识数据构建得到;
7.根据权利要求1至4中任意一项所述的方法,其特征在于,从所述问题信息中提取关键词,并至少基于提取的关键词,从所述对话数据中筛选与所述关键词相关的对话数据,作为备用对话数据,包括:
...【技术特征摘要】
1.一种信息提取方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,从所述备用对话数据中提取得到与所述问题信息对应的答案信息,包括:
3.根据权利要求2所述的方法,其特征在于,所述利用预先训练的信息提取模型,从所述备用对话数据中提取得到与所述问题信息对应的答案信息,包括:
4.根据权利要求3所述的方法,其特征在于,所述信息提取任务还用于从所述备用对话数据中,提取出与提取的答案信息对应的对话上下文;
5.根据权利要求1所述的方法,其特征在于,所述利用所述知识数据,对所述答案信息进行优化调整,包括:
6.根据权利要求1所述的方法,其特征在于,所述知识库包括行业知识图谱和实体知识图谱,所述行业知识图谱由所述特定业务场景所属行业的知识数据构建得到,所述实体知识图谱由所述特定业务场景所属行业的特定实体的知识数据构...
【专利技术属性】
技术研发人员:姚继军,冯庭好,张东旭,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。