问题回答方法及相关装置、电子设备和存储介质制造方法及图纸

技术编号:33121397 阅读:33 留言:0更新日期:2022-04-17 00:21
本申请公开了一种问题回答方法及相关装置、电子设备和存储介质,其中,问题回答方法包括:获取待回答问题文本以及待回答问题涉及的常识文本;基于答案预测模型对待回答问题文本和常识文本进行答案预测,得到待回答问题文本的答案文本;其中,答案预测模型是利用若干组样本文本数据训练得到的,且基于样本文本数据训练答案预测模型时,在样本文本数据中选择至少一个样本字符进行屏蔽。上述方案,能够准确且稳定地实现问题回答。且稳定地实现问题回答。且稳定地实现问题回答。

【技术实现步骤摘要】
问题回答方法及相关装置、电子设备和存储介质


[0001]本申请涉及智能问答
,特别是涉及一种问题回答方法及相关装置、电子设备和存储介质。

技术介绍

[0002]随着自然语言处理等技术的快速发展,通过机器人智能化地实现问题回答已经在越来越多的场景中得到应用。例如,在电子商城、智慧政务、语音助手等诸多场景中,通过智能问答能够提供智慧、高效的自助服务。
[0003]目前,现有智能问答的网络模型通常只能进行浅层识别,无法深度挖掘深层含义,从而很难确保问题回答的可靠性。此外,网络模型的模型性能通常也依赖于大量样本数据,然而在某些小众领域,样本数据又通常较为稀少,从而无法确保网络模型的准确性。有鉴于此,如何准确且稳定地实现问题回答成为亟待解决的问题。

技术实现思路

[0004]本申请主要解决的技术问题是提供一种问题回答方法及相关装置、电子设备和存储介质,能够准确且稳定地实现问题回答。
[0005]为了解决上述技术问题,本申请第一方面提供了一种问题回答方法,包括:获取待回答问题文本以及待回答问题涉及的常识文本;基于答案预测模型对待回答问题文本和常识文本进行答案预测,得到待回答问题文本的答案文本;其中,答案预测模型是利用若干组样本文本数据训练得到的,且基于样本文本数据训练答案预测模型时,在样本文本数据中选择至少一个样本字符进行屏蔽。
[0006]为了解决上述技术问题,本申请第二方面提供了一种体问题回答装置,包括:文本获取模块和答案预测模块,文本获取模块,用于获取待回答问题文本以及待回答问题涉及的常识文本;答案预测模块,用于基于答案预测模型对待回答问题文本和常识文本进行答案预测,得到待回答问题文本的答案文本;其中,答案预测模型是利用若干组样本文本数据训练得到的,且基于样本文本数据训练答案预测模型时,在样本文本数据中选择至少一个样本字符进行屏蔽。
[0007]为了解决上述技术问题,本申请第三方面提供了一种电子设备,包括相互耦接的存储器和处理器,存储器中存储有程序指令,处理器用于执行程序指令以实现上述第一方面中的问题回答方法。
[0008]为了解决上述技术问题,本申请第四方面提供了一种计算机可读存储介质,存储有能够被处理器运行的程序指令,程序指令用于实现上述第一方面中的问题回答方法。
[0009]上述方案,获取待回答问题文本以及待回答问题文本涉及的常识文本,并基于答案预测模型对待回答问题文本和常识文本进行答案预测,得到待回答问题文本的答案文本,且答案预测模型是利用若干组样本文本数据训练得到的,基于样本文本数据训练答案预测模型时,在样本文本中选择至少一个样本字符进行屏蔽,一方面在答案预测过程中不
仅参考待回答问题文本本身还进一步参考其所涉及的常识文本,从而不仅能够参考待回答问题文本本身的语义信息还能参考其所设计常识文本的语义信息,而结合两者语义信息能够深度挖掘不同维度上下文信息、环境信息、背景信息等关键要素,有利于提升问答推理能力,进而提升问题回答的稳定性,另一方面在训练过程中选择样本文本数据中至少一个样本字符进行屏蔽,能够提升数据多样性,从而缓解小样本数据局限性,进而有利于提升网络模型的准确性。故此,能够准确且稳定地实现问题回答。
附图说明
[0010]图1是本申请问题回答方法一实施例的流程示意图;
[0011]图2是答案预测模型一实施例的框架示意图;
[0012]图3是样本文本数据一实施例的示意图;
[0013]图4是本申请问题回答方法另一实施例的流程示意图;
[0014]图5是构建问询文本一实施例的过程示意图;
[0015]图6是本申请问题回答方法一实施例的框架示意图;
[0016]图7是本申请问题回答装置一实施例的框架示意图;
[0017]图8是本申请电子设备一实施例的框架示意图;
[0018]图9是本申请计算机可读存储介质一实施例的框架示意图。
具体实施方式
[0019]下面结合说明书附图,对本申请实施例的方案进行详细说明。
[0020]以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、接口、技术之类的具体细节,以便透彻理解本申请。
[0021]本文中术语“系统”和“网络”在本文中常被可互换使用。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。此外,本文中的“多”表示两个或者多于两个。
[0022]请参阅图1,图1是本申请问题回答方法一实施例的流程示意图。具体而言,可以包括如下步骤:
[0023]步骤S11:获取待回答问题文本以及待回答问题涉及的常识文本。
[0024]在一个实施场景中,待回答问题文本具体可以根据可以实际应用场景进行设置。以电子商务场景为例,待回答问题文本可以包括但不限于:“我几天前买的东西出故障了可以退货吗?”、“我们这里包邮吗?”等等,其他场景可以以此类推,在此不再一一举例。
[0025]在一个实施场景中,用户可以以文本形式输入待回答问题文本,或者,用户也可以以语音形式提问,从而通过对用户语音进行语音识别,得到待回答问题文本,在此不做限定。
[0026]在一个实施场景中,需要说明的是,常识是每个人都具备的关于事物的属性、关系以及事物之间交互的通用知识。常识通常与地点、语言和文化无关,并且很少在文本中显式描述。其涉及但不限于:潜意识存在的先验知识(背景知识),包含生存技能(生活自理能力)、环境识别能力、基本劳作技能、基础的自然科学以及人文社会科学知识等。常识可以包
含单个概念、事实、知识以及事理三元组等。此外,不同应用场景所涉及的常识也不尽相同。为了便于在应用过程中获取常识文本,可以预先构建领域场景的常识库。示例性地,可以搜集领域常识数据(如,电子商务领域数据、智慧政务领域数据等),对于领域常识数据中结构化数据(如,三元组等)可以先进行数据规整,而对于领域常识数据中非结构化数据(如,句子、段落、文章等)可以先借助诸如CASREL等知识抽取技术进行知识结构化,最后可以综合全部知识来源,建立常识库。例如,可以综合全部知识来源,先建立常识概念体系,再将各种来源的三元组填充到常识概念体系中,形成常识库。
[0027]在一个实施场景中,待回答问题文本涉及的常识文本可以包括时间信息、背景信息、专家知识等等,在此不做限定。以电子商城为例,对于时间信息而言,一般商品可以支持七天无理由退货,而对于生鲜商品目前尚不支持退货;或者,对于背景信息而言,最近某厂家由于某商品存在设计缺陷发布召回公告;或者,对于专家知识而言,相关法条规定“经营者提供的商品或者服务不符合质量要求的,消费者可以依照国家规定、当事人约定退货,或者要求经营者履行更换、修理等义务”。其他场景可以以此类推,在此不再一一举例。
[0028]在一个实施场景中,可以先对待回答问题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问题回答方法,其特征在于,包括:获取待回答问题文本以及所述待回答问题涉及的常识文本;基于答案预测模型对所述待回答问题文本和所述常识文本进行答案预测,得到所述待回答问题文本的答案文本;其中,所述答案预测模型是利用若干组样本文本数据训练得到的,且基于所述样本文本数据训练所述答案预测模型时,在所述样本文本数据中选择至少一个样本字符进行屏蔽。2.根据权利要求1所述的方法,其特征在于,每组所述样本文本数据包括样本问题文本、所述样本问题文本涉及的样本常识文本和所述样本问题文本的样本答案文本。3.根据权利要求2所述的方法,其特征在于,所述答案预测模型的训练步骤包括:获取所述样本文本数据中所述样本字符的嵌入特征表示;其中,所述样本文本数据中被屏蔽的样本字符以预设字符表示;基于所述嵌入特征表示对所述样本字符进行编码,得到所述样本字符的语义特征表示;基于所述样本字符的语义特征表示进行预测,得到预测答案文本;基于所述样本答案文本和所述预测答案文本之间的差异,调整所述答案预测模型的网络参数。4.根据权利要求3所述的方法,其特征在于,在所述预设字符属于所述样本问题文本或所述样本常识文本的情况下,所述预设字符的语义特征表示是基于第一参考字符编码得到的,所述第一参考字符包括:所述样本问题文本和所述样本常识文本中所有所述样本字符;和/或,在所述预设字符属于所述样本答案文本的情况下,所述预设字符的语义特征表示是基于第二参考字符编码得到的,所述第二参考字符包括:所述预设字符本身、所述样本问题文本和所述样本常识文本中所有所述样本字符,以及所述样本答案文本中位于所述预设字符之前的所有所述样本字符。5.根据权利要求3所述的方法,其特征在于,所述答案预测模型包括输入层、嵌入层、编码层和预测层;其中,所述输入层用于输入所述样本常识文本、样本问题文本和所述样本答案文本,所述嵌入层用于获取所述嵌入特征表示,所述编码层用于编码得到所述语义特征表示,所述预测层用于预测得到所述预测答案文本。6.根据权利要求1所述的方法,其特征在于,在所述基于答案预测模型对所述待回答问题文本和所述常识文本进行答案预测,得到所述待回答问题文本的答案文本之前,所述方法还包括:响应于所述待...

【专利技术属性】
技术研发人员:方四安吴飞程飞张浩宇
申请(专利权)人:合肥讯飞数码科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1