【技术实现步骤摘要】
数据处理方法、装置、电子设备及计算机存储介质
[0001]本申请实施例涉及计算机
,尤其涉及一种数据处理方法、装置、电子设备及计算机存储介质。
技术介绍
[0002]随着人工智能技术的进步,通过机器与人进行多轮对话的应用越来越多,例如,语音助手、对话式自助查询、自助点单等。在多轮对话应用中,用户可以输入一句输入语句,由机器输出对输入语句进行反馈的回答语句,这样就可以实现机器与人的多轮对话。在此过程中,如果快速、准确地确定回答语句是影响对话质量的重要因素。
[0003]现有的多轮对话系统通过从预设的对话文本中检索出输入语句的回答语句,但是由于语言本身存在的表达多样性,导致现有的检索式对话系统的回答语句比较单一、准确度不足。
技术实现思路
[0004]有鉴于此,本申请实施例提供一种数据处理方案,以至少部分解决上述问题。
[0005]根据本申请实施例的第一方面,提供了一种数据处理方法,适用于自动对话生成,所述方法包括:获取与交互对象进行自动对话的对话过程中当前问题语句对应的问题对话段;根据问题对话段的关键词特征,从预设的多个对话素材中,筛选出与所述问题对话段关联的多个候选对话素材,其中,所述候选对话素材包括设定的回答语句和所述回答语句的关联语句;根据所述问题对话段的语义信息、以及所述候选对话素材中回答语句和关联语句之间的语义信息,确定所述问题对话段与所述候选对话素材之间的语义匹配度;根据所述语义匹配度,从所述多个候选对话素材中确定目标对话素材,并以所述目标对话素材中的回答语句作为所述当 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,适用于自动对话生成,所述方法包括:获取与交互对象进行自动对话的对话过程中当前问题语句对应的问题对话段;根据问题对话段的关键词特征,从预设的多个对话素材中,筛选出与所述问题对话段关联的多个候选对话素材,其中,所述候选对话素材包括设定的回答语句和所述回答语句的关联语句;根据所述问题对话段的语义信息、以及所述候选对话素材中回答语句和关联语句之间的语义信息,确定所述问题对话段与所述候选对话素材之间的语义匹配度;根据所述语义匹配度,从所述多个候选对话素材中确定目标对话素材,并以所述目标对话素材中的回答语句作为所述当前问题语句的回答语句。2.根据权利要求1所述的方法,其中,所述根据问题对话段的关键词特征,从预设的多个对话素材中,筛选出与所述问题对话段关联的多个候选对话素材,包括:根据所述问题对话段中的关键词对应的词频和逆文本频率、以及所述对话素材中关键词的词频和逆文本频率,确定与所述问题对话段语义关联的多个候选对话素材。3.根据权利要求1所述的方法,其中,所述关联语句包括在对话时序上位于所述回答语句之前的在前语句、以及在对话时序上位于所述回答语句之后的在后语句,所述在前语句形成在前对话段,所述在后语句形成在后对话段。4.根据权利要求3所述的方法,其中,所述根据所述问题对话段的语义信息、以及所述候选对话素材中回答语句和关联语句之间的语义信息,确定所述问题对话段与所述候选对话素材之间的语义匹配度,包括:将所述问题对话段、所述在前对话段、所述在后对话段、所述回答语句形成全局参照文本;分别以所述问题对话段、所述回答语句、所述在前对话段和所述在后对话段作为目标处理对象,对所述目标处理对象进行段内处理,以获得对应的段内语义信息,并根据所述目标处理对象和所述全局参照文本,确定所述目标处理对象对应的全局语义信息;根据所述问题对话段、所述在前对话段、所述在后对话段、所述回答语句各自对应的段内语义信息和全局语义信息,确定所述问题对话段与所述候选对话素材之间的语义匹配度。5.根据权利要求4所述的方法,其中,对所述目标处理对象进行段内处理,以获得对应的段内语义信息,包括:按照时序上逐渐远离所述回答语句的次序,从所述目标处理对象中包含的语句中确定当前语句;使用第一自注意力层,对所述当前语句的特征信息和已提取的段内语义信息进行处理,以获得所述当前语句对应的段内保留信息;根据所述当前语句的段内保留信息和所述已提取的段内语义信息的段内调整权重,将所述当前语句的段内保留信息更新至所述已提取的段内语义信息中,直至完成对目标处理对象中包含的语句的处理。6.根据权利要求5所述的方法,其中,所述根据所述当前语句的段内保留信息和所述已提取的段内语义信息的段内调整权重,将所述当前语句的段内保留信息更新至所述已提取的段内语义信息中,包括:
根据所述当前语句的段内保留信息和所述已提取的段内语义信息,确定所述...
【专利技术属性】
技术研发人员:崔少波,付振新,计峰,严睿,赵中州,陈海青,
申请(专利权)人:阿里巴巴新加坡控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。