数据处理方法、装置、电子设备及计算机存储介质制造方法及图纸

技术编号:35091011 阅读:16 留言:0更新日期:2022-10-01 16:48
本申请实施例提供了一种数据处理方法、装置、电子设备及计算机存储介质。该数据处理方法,适用于自动对话生成,方法包括:获取与交互对象进行自动对话的对话过程中当前问题语句对应的问题对话段;根据问题对话段的关键词特征,从预设的多个对话素材中,筛选出与问题对话段关联的多个候选对话素材,其中,候选对话素材包括设定的回答语句和回答语句的关联语句;根据问题对话段的语义信息、以及候选对话素材中回答语句和关联语句之间的语义信息,确定问题对话段与候选对话素材之间的语义匹配度;根据语义匹配度,从多个候选对话素材中确定目标对话素材,并以目标对话素材中的回答语句作为当前问题语句的回答语句。该数据处理方法自动生成对话。法自动生成对话。法自动生成对话。

【技术实现步骤摘要】
数据处理方法、装置、电子设备及计算机存储介质


[0001]本申请实施例涉及计算机
,尤其涉及一种数据处理方法、装置、电子设备及计算机存储介质。

技术介绍

[0002]随着人工智能技术的进步,通过机器与人进行多轮对话的应用越来越多,例如,语音助手、对话式自助查询、自助点单等。在多轮对话应用中,用户可以输入一句输入语句,由机器输出对输入语句进行反馈的回答语句,这样就可以实现机器与人的多轮对话。在此过程中,如果快速、准确地确定回答语句是影响对话质量的重要因素。
[0003]现有的多轮对话系统通过从预设的对话文本中检索出输入语句的回答语句,但是由于语言本身存在的表达多样性,导致现有的检索式对话系统的回答语句比较单一、准确度不足。

技术实现思路

[0004]有鉴于此,本申请实施例提供一种数据处理方案,以至少部分解决上述问题。
[0005]根据本申请实施例的第一方面,提供了一种数据处理方法,适用于自动对话生成,所述方法包括:获取与交互对象进行自动对话的对话过程中当前问题语句对应的问题对话段;根据问题对话段的关键词特征,从预设的多个对话素材中,筛选出与所述问题对话段关联的多个候选对话素材,其中,所述候选对话素材包括设定的回答语句和所述回答语句的关联语句;根据所述问题对话段的语义信息、以及所述候选对话素材中回答语句和关联语句之间的语义信息,确定所述问题对话段与所述候选对话素材之间的语义匹配度;根据所述语义匹配度,从所述多个候选对话素材中确定目标对话素材,并以所述目标对话素材中的回答语句作为所述当前问题语句的回答语句。
[0006]根据本申请实施例的第二方面,提供了一种数据处理装置,适用于自动对话生成,所述装置包括:获取模块,用于获取与交互对象进行自动对话的对话过程中当前问题语句对应的问题对话段;筛选模块,用于根据问题对话段的关键词特征,从预设的多个对话素材中,筛选出与所述问题对话段关联的多个候选对话素材,其中,所述候选对话素材包括设定的回答语句和所述回答语句的关联语句;匹配模块,用于根据所述问题对话段的语义信息、以及所述候选对话素材中回答语句和关联语句之间的语义信息,确定所述问题对话段与所述候选对话素材之间的语义匹配度;确定模块,用于根据所述语义匹配度,从所述多个候选对话素材中确定目标对话素材,并以所述目标对话素材中的回答语句作为所述当前问题语句的回答语句。
[0007]根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面所述的数据处理方法对应的操作。
[0008]根据本申请实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面所述的数据处理方法。
[0009]根据本申请实施例提供的数据处理方案,在确定回答语句时基于当前问题语句对应的问题对话段进行匹配,因而使得综合问题对话段的上下文语义信息,而且对话素材中不仅包含回答语句而且包含关联语句,使得对话素材和问题对话段的匹配更加准确,在进行匹配时基于问题对话段的关键词特征匹配出候选对话素材,再根据语义信息匹配出目标对话素材,这样即保证了匹配的准确度,又降低了匹配成本,确保了匹配的准确性。
附图说明
[0010]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请实施例中记载的一些实施例,对于本领域普通技术人员来讲,还可以根据这些附图获得其他的附图。
[0011]图1为根据本申请实施例一的一种数据处理方法的步骤流程图;
[0012]图2A为根据本申请实施例二的一种数据处理方法的步骤流程图;
[0013]图2B为图2A所示实施例中的一种使用场景中一种神经网络模型的示意图;
[0014]图2C为图2A所示实施例中的一种连接层的示意图;
[0015]图3为根据本申请实施例三的一种数据处理装置的结构框图;
[0016]图4为根据本申请实施例四的一种电子设备的结构示意图。
具体实施方式
[0017]为了使本领域的人员更好地理解本申请实施例中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请实施例一部分实施例,而不是全部的实施例。基于本申请实施例中的实施例,本领域普通技术人员所获得的所有其他实施例,都应当属于本申请实施例保护的范围。
[0018]下面结合本申请实施例附图进一步说明本申请实施例具体实现。
[0019]实施例一
[0020]参照图1,示出了本申请实施例一的数据处理方法的步骤流程示意图。
[0021]在本实施例中,该方法适用于自动对话生成,其包括以下步骤:
[0022]步骤S102:获取与交互对象进行自动对话的对话过程中当前问题语句对应的问题对话段。
[0023]自动对话用于对交互对象输入的语句自动进行回复。例如,可以是人工智能设备与交互对象之间的对话。例如,交互对象通过人工智能设备查询快递进度、送餐进度、商品余量等等。在本实施例中,该方法可以应用于检索式自动对话系统,以通过检索已有的对话素材获得对当前问题语句的回答语句。当然,在其他实施例中,该方法可以应用于其他适当的系统中,对此不作限制。
[0024]以与交互对象进行至少一轮对话为例,当前问题语句可以是交互对象输入的最新的问题语句。其对应的问题对话段可以是包含当前问题语句的所有对话语句。
[0025]例如,对话过程为:
[0026]问题语句1:交互对象:我的包裹发了么,订单号***。回答语句1:智能客服:您好,经查询该包裹已发送。问题语句2:交互对象:哪个公司?
[0027]该示例中,当前问题语句为最新的问题语句,即问题语句2。其对应的问题对话段包含问题语句1、回答语句1和问题语句2。
[0028]步骤S104:根据问题对话段的关键词特征,从预设的多个对话素材中,筛选出与所述问题对话段关联的多个候选对话素材。
[0029]对话素材可以预设,每个对话素材均可以切分为回答语句和与之关联的关联语句,即筛选出的所述候选对话素材包括设定的回答语句和所述回答语句的关联语句。关联语句可以是在前语句和/或在后语句。
[0030]例如,一种包含在前语句、回答语句和在后语句的对话素材为:
[0031][0032][0033]或者,另一种对话素材为:
[0034]在前语句1:交互对象:快递有附加的运费么?在前语句2:智能客服:没有。在前语句3:交互对象:你们发什么快递?回答语句:智能客服:快递通过***公司配送您的包裹。在后语句1:交互对象:我能换快递公司么?在后语句2:智能客服:您需要换成哪个公司?
[0035]在一种可行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,适用于自动对话生成,所述方法包括:获取与交互对象进行自动对话的对话过程中当前问题语句对应的问题对话段;根据问题对话段的关键词特征,从预设的多个对话素材中,筛选出与所述问题对话段关联的多个候选对话素材,其中,所述候选对话素材包括设定的回答语句和所述回答语句的关联语句;根据所述问题对话段的语义信息、以及所述候选对话素材中回答语句和关联语句之间的语义信息,确定所述问题对话段与所述候选对话素材之间的语义匹配度;根据所述语义匹配度,从所述多个候选对话素材中确定目标对话素材,并以所述目标对话素材中的回答语句作为所述当前问题语句的回答语句。2.根据权利要求1所述的方法,其中,所述根据问题对话段的关键词特征,从预设的多个对话素材中,筛选出与所述问题对话段关联的多个候选对话素材,包括:根据所述问题对话段中的关键词对应的词频和逆文本频率、以及所述对话素材中关键词的词频和逆文本频率,确定与所述问题对话段语义关联的多个候选对话素材。3.根据权利要求1所述的方法,其中,所述关联语句包括在对话时序上位于所述回答语句之前的在前语句、以及在对话时序上位于所述回答语句之后的在后语句,所述在前语句形成在前对话段,所述在后语句形成在后对话段。4.根据权利要求3所述的方法,其中,所述根据所述问题对话段的语义信息、以及所述候选对话素材中回答语句和关联语句之间的语义信息,确定所述问题对话段与所述候选对话素材之间的语义匹配度,包括:将所述问题对话段、所述在前对话段、所述在后对话段、所述回答语句形成全局参照文本;分别以所述问题对话段、所述回答语句、所述在前对话段和所述在后对话段作为目标处理对象,对所述目标处理对象进行段内处理,以获得对应的段内语义信息,并根据所述目标处理对象和所述全局参照文本,确定所述目标处理对象对应的全局语义信息;根据所述问题对话段、所述在前对话段、所述在后对话段、所述回答语句各自对应的段内语义信息和全局语义信息,确定所述问题对话段与所述候选对话素材之间的语义匹配度。5.根据权利要求4所述的方法,其中,对所述目标处理对象进行段内处理,以获得对应的段内语义信息,包括:按照时序上逐渐远离所述回答语句的次序,从所述目标处理对象中包含的语句中确定当前语句;使用第一自注意力层,对所述当前语句的特征信息和已提取的段内语义信息进行处理,以获得所述当前语句对应的段内保留信息;根据所述当前语句的段内保留信息和所述已提取的段内语义信息的段内调整权重,将所述当前语句的段内保留信息更新至所述已提取的段内语义信息中,直至完成对目标处理对象中包含的语句的处理。6.根据权利要求5所述的方法,其中,所述根据所述当前语句的段内保留信息和所述已提取的段内语义信息的段内调整权重,将所述当前语句的段内保留信息更新至所述已提取的段内语义信息中,包括:
根据所述当前语句的段内保留信息和所述已提取的段内语义信息,确定所述...

【专利技术属性】
技术研发人员:崔少波付振新计峰严睿赵中州陈海青
申请(专利权)人:阿里巴巴新加坡控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1