一种问答语句质检方法、装置及相关产品制造方法及图纸

技术编号:33080895 阅读:8 留言:0更新日期:2022-04-15 10:34
本申请实施例公开一种基于人工智能技术实现的问答语句质检方法、装置及相关产品。当需要质检匹配性的问答语句对,只需要将该问答语句对输入到训练好的问答语句质检模型。由于问答语句质检模型具有判定问题语句与答复语句之间匹配性的功能,因此通过该模型可以判定所输入的问答语句对中问题语句与答复语句是否匹配。进而输出结果可确定接收质检的问答语句对是否质检通过。可见本申请以训练好的问答语句质检模型实现了对问答语句的自动质检,提升了问答语句的质检效率,降低了质检成本。同时,该方案使得全量质检可实现,从而大幅提升质检的覆盖率。质检的覆盖率。质检的覆盖率。

【技术实现步骤摘要】
一种问答语句质检方法、装置及相关产品


[0001]本申请涉及自然语言处理
,尤其涉及一种问答语句质检方法、装置及相关产品。

技术介绍

[0002]人与人的问答以及人机问答发生在人们日常生活的诸多场景中。以电子商务场景为例,当人们在购物平台上咨询货品信息时,由人工客服或者电子客服对消费者的提问做出答复。例如,消费者提供了个人的身材维度,咨询客服合适的衣服尺码,相应地,客服对消费者进行衣服尺码的推荐;消费者咨询某商品的质保时间,客服答复该商品的质保时间;消费者对某商品的使用方式提出疑问,客服提供该商品的正确使用方式。
[0003]无论是人工答复还是机器答复,都有可能发生答复与问题不匹配的情况。例如,答错、漏答或者敷衍答复等。为了保障客户服务的质量,通常需要对问答语句的匹配性进行质检。已有的技术中,采用人工质检问答语句,然而人工质检问答语句的效率低、成本高。另一方面,由于人工质检的效率不佳和出于对质检成本的考虑,人工质检问答语句通常是抽样进行的,因此所质检的问答语句的覆盖率较低,例如抽检5%或者10%的问答语句,难以做到对问答语句匹配性的全量质检。

技术实现思路

[0004]本申请实施例提供了一种问答语句质检方法、装置及相关产品,以提升对问答语句的质检效率,降低质检成本,使全量质检可实现。
[0005]有鉴于此,本申请第一方面提供了一种问答语句质检方法,方法包括:
[0006]获取待质检问答语句对,待质检问答语句对包括具有问答关系的问题语句和答复语句;
[0007]将问题语句和答复语句输入到问答语句质检模型中,以通过问答语句质检模型判定问题语句与答复语句的匹配性;
[0008]获取问答语句质检模型的输出结果,输出结果用于指示待质检问答语句对是否质检通过。
[0009]本申请第二方面提供一种问答语句质检装置,装置包括:
[0010]语句对获取单元,用于获取待质检问答语句对,待质检问答语句对包括具有问答关系的问题语句和答复语句;
[0011]语句对质检单元,用于将问题语句和答复语句输入到问答语句质检模型中,以通过问答语句质检模型判定问题语句与答复语句的匹配性;
[0012]输出结果获取单元,用于质检结果获取问答语句质检模型的输出结果,输出结果用于指示待质检问答语句对是否质检通过。
[0013]本申请第三方面提供一种问答语句质检设备,设备包括处理器以及存储器:
[0014]存储器用于存储程序代码,并将程序代码传输给处理器;
[0015]处理器用于根据程序代码中的指令,执行如上述第一方面的问答语句质检方法的步骤。
[0016]本申请第四方面提供一种计算机可读存储介质,计算机可读存储介质用于存储程序代码,程序代码用于执行上述第一方面的问答语句质检方法。
[0017]从以上技术方案可以看出,本申请实施例具有以下优点:
[0018]本申请实施例中,提供了一种问答语句质检方法、装置、设备及存储介质。在本申请中,当需要质检匹配性的问答语句对,只需要将该问答语句对输入到预先训练好的问答语句质检模型。由于问答语句质检模型具有判定问题语句与答复语句之间匹配性的功能,因此,通过该模型可以判定所输入的问答语句对中问题语句与答复语句是否匹配。进而,通过模型输出的结果来确定接收质检的问答语句对是否质检通过。例如,当模型输出该问题语句与答复语句的匹配概率为0.9,不匹配的概率为0.1时,可以基于两种概率的相对大小确定接收此模型质检后该问答语句对中问题语句与答复语句的匹配性质检不通过。可见本申请以训练好的问答语句质检模型实现了对问答语句的自动质检,提升了问答语句的质检效率,降低了质检成本。同时,该方案使得全量质检可实现,从而大幅提升质检的覆盖率。
附图说明
[0019]图1为本申请实施例提供的一种问答语句对质检方法流程图;
[0020]图2问题语句与答复语句之间问答关系的示意图;
[0021]图3为多个问答语句对正样本的示意图;
[0022]图4A为构建问答语句对负样本的一种实现方式示意图;
[0023]图4B为构建问答语句对负样本的另一种实现方式示意图;
[0024]图4C为构建问答语句对负样本的一种实现方式示意图;
[0025]图5为本申请实施例中通过不同批次归档的工单中提取的正样本构建负样本的示意图;
[0026]图6A为本申请实施例提供的一种问答语句质检模型的结构示意图;
[0027]图6B为本申请实施例提供的另一种问答语句质检模型的结构示意图;
[0028]图6C为本申请实施例提供的又一种问答语句质检模型的结构示意图;
[0029]图7为本申请实施例提供的自动方式与人工方式多重质检问答语句对的场景示意图;
[0030]图8为本申请实施例提供的问答语句质检装置的结构示意图;
[0031]图9为本申请实施例提供的一种用于问答语句质检的服务器的结构示意图;
[0032]图10为本申请实施例提供的一种用于问答语句质检的终端的结构示意图。
具体实施方式
[0033]如前文介绍,目前对问题语句和答复语句匹配性的质检通常由人工完成。人工抽检存在检测覆盖率低、效率低和成本高的问题。许多提供咨询服务的平台往往需要满足非实时的碎片化的用户咨询业务,而这类业务能够产生海量的工单。工单通过异步渠道归档汇集,工单中通常能够提取到大量的问答语句。面对数量如此庞大的工单以及问答语句,有必要提供一种更加高效、低廉和高覆盖率的问答语句质检方案。基于此需求,本申请中提供
了一种自动化实现问答语句质检的解决方案。以下结合实施例和附图对技术方案的实现进行介绍和说明。
[0034]在本申请实施例中,采用人工智能的技术实现模型的训练和运用。人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
[0035]人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习、自动驾驶、智慧交通等几大方向。
[0036]其中,自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种问答语句质检方法,其特征在于,包括:获取待质检问答语句对,所述待质检问答语句对包括具有问答关系的问题语句和答复语句;将所述问题语句和所述答复语句输入到问答语句质检模型中,以通过所述问答语句质检模型判定所述问题语句与所述答复语句的匹配性;获取所述问答语句质检模型的输出结果,所述输出结果用于指示所述待质检问答语句对是否质检通过。2.根据权利要求1所述的方法,其特征在于,所述问答语句质检模型通过以下步骤训练获得:构建问答语句对正样本和问答语句对负样本,其中,所述问答语句对正样本包括具有问答关系并且匹配度大于预设阈值的问题语句和答复语句,所述问答语句对负样本包括匹配度小于或等于所述预设阈值的问题语句和答复语句;分别将所述问答语句对正样本和所述问答语句对负样本输入至初始质检模型中;根据所述初始质检模型的输出结果和输入至所述初始质检模型中的样本的标签之间的差异,对所述初始质检模型进行调整,直至满足训练截止条件,获得所述问答语句质检模型。3.根据权利要求2所述的方法,其特征在于,构建问答语句对负样本,包括:将多个所述问答语句对正样本中的问题语句和答复语句打乱关系重新配对,获得所述问答语句对负样本。4.根据权利要求3所述的方法,其特征在于,所述将多个所述问答语句对正样本中的问题语句和答复语句打乱关系重新配对,获得所述问答语句对负样本,包括:从已构建的所述问答语句对正样本中筛选出多个作为目标样本对;采用以下任一方式对所述目标样本对进行处理,获得所述问答语句对负样本:将所述目标样本对中的问题语句替换为其他问答语句正样本中的问题语句,获得所述问答语句对负样本;或者,将所述目标样本对中的答复语句替换为其他问答语句正样本中的答复语句,获得所述问答语句对负样本;或者,将所述目标样本对中的问题语句和答复语句相互颠倒,获得所述问答语句对负样本。5.根据权利要求2所述的方法,其特征在于,所述问答语句质检模型包括:输入层、编码层、分类输入层和分类层;其中,所述输入层用于将输入的所述待质检问答语句对的问题语句和答复语句分别进行分词,将问题语句的分词结果转换为问题词向量,并将答复语句的分词结果转换为答复词向量;所述编码层用于对所述问题词向量编码,获得问题向量,以及用于对所述答复词向量编码,获得答复向量;所述分类输入层用于基于所述问题向量和所述答复向量进行处理,获得第一向量和第二向量,并对所述问题向量、所述答复向量、所述第一向量和所述第二向量进行拼接,获得拼接后向量;其中,所述第一向量用于表征所述问题向量和所述答复向量之间的差异,所述第二向量用于表征所述问题向量和所述答复向量之间的关系;
所述分类层用于基于所述拼接后向量学习,预测所述待质检问答语句对中问题语句与答复语句的匹配度大于所述预设阈值的概率和匹配度小于或等于所述预设阈值的概率,并将预测的概率输出。6.根据权利要求5所述的方法,其特征在于,所述分类输入层基于所述问题向量和所述答复向量进行处理,获得所述第一向量,包括:所述分类输入层根据所述问题向量和所述答复向量,获取所述问题向量与所述答复向量之差的绝对值作为所述第一向量...

【专利技术属性】
技术研发人员:曾江海杨念民雷植程童丽霞吴俊江陈岁迪郭超
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1