问答方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:27772241 阅读:46 留言:0更新日期:2021-03-23 12:52
本申请实施例公开了问答方法、装置、电子设备和计算机可读介质。该方法的实施例包括:接收客户端发送的问答请求,问答请求中包括问题信息;从目标平台中检索与问题信息相关的目标评论信息;基于已训练的信息抽取模型,从目标评论信息中提取候选答案;对所得到的候选答案进行排序,并基于排序结果从所得到的候选答案中选取目标答案,向客户端返回所述目标答案。该实施方式降低了实现智能问答的人力成本,且提高了智能问答场景中的信息覆盖率。

【技术实现步骤摘要】
问答方法、装置、电子设备和计算机可读介质
本申请实施例涉及计算机
,具体涉及问答方法、装置、电子设备和计算机可读介质。
技术介绍
随着互联网的普及和自然语言处理技术的广泛应用,智能问答功能逐渐兴起,用户输入问题信息后,利用智能问答功能可以自动回答用户的问题,从而与用户进行互动。现有技术中,用户输入问题信息后,通常在预先建立的问答库或知识库中检索与该问题信息匹配的答案信息,以完成对问题信息的回答。由于问答库或知识库需要人工构建且其中的内容极其有限,因而上述方法的人力成本较高且信息覆盖率较低。
技术实现思路
本申请实施例提出了问答方法、装置、电子设备和计算机可读介质,以解决现有技术中实现智能问答的人力成本较高以及智能问答场景中信息覆盖率较低的技术问题。第一方面,本申请实施例提供了一种问答方法,该方法包括:接收客户端发送的问答请求,所述问答请求中包括问题信息;从目标平台中检索与所述问题信息相关的目标评论信息;基于已训练的信息抽取模型,从所述目标评论信息中提取候选答案;对所得到的候选答案进行排序,并基于排序结果从所得到的候选答案中选取目标答案,向所述客户端返回所述目标答案。第二方面,本申请实施例提供了一种问答装置,该装置包括:接收单元,用于接收客户端发送的问答请求,所述问答请求中包括问题信息;检索单元,用于从目标平台中检索与所述问题信息相关的目标评论信息;提取单元,用于基于已训练的信息抽取模型,从所述目标评论信息中提取候选答案;返回单元,用于对所得到的候选答案进行排序,并基于排序结果从所得到的候选答案中选取目标答案,向所述客户端返回所述目标答案。第三方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面中的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中的方法。本申请实施例提供的问答方法、装置、电子设备和计算机可读介质,通过接收客户端发送的问答请求,而后从目标平台中检索与问答请求中的问题信息相关的目标评论信息,之后分别从所检索出的各目标评论信息中提取关键信息,得到候选答案,最后对所得到的候选答案进行排序,并基于排序结果确定候选答案中的目标答案,从而能够向客户端返回针对该问题信息的目标答案。一方面,由于问答过程中不依赖于人工构建的问答库或知识库,因而降低了实现智能问答的人力成本。另一方面,由于用户的评论信息丰富、覆盖问题范围广,因而从评论信息中提取目标答案的方式能够适用于回答问答库或知识库不易解答的开放问题,提高了智能问答场景中的信息覆盖率。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是根据本申请的问答方法的一个实施例的流程图;图2是根据本申请的问答方法的又一个实施例的流程图;图3是步骤204的分解流程图;图4是根据本申请的问答方法的信息抽取模型的处理过程的示意图;图5是根据本申请的问答装置的一个实施例的结构示意图;图6是用于实现本申请实施例的电子设备的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。请参考图1,其示出了根据本申请的问答方法的一个实施例的流程100。该问答方法,包括以下步骤:步骤101,接收客户端发送的问答请求,问答请求中包括问题信息。在本实施例中,问答方法的执行主体(如服务器等电子设备)可以接收客户端发送的问答请求。其中,上述客户端可以是上述执行主体中所安装的任一具有智能问答功能的客户端,如点餐类客户端、团购类客户端、外卖类客户端、点评类客户端等。此处,问答请求中可以包括问题信息。作为示例,用户在使用点评类客户端的过程中,可以通过该客户端所提供的智能问答功能,发送针对某一餐厅的各种问题,如“营业时间”、“服务设施”、“餐厅服务质量”、“攻略”等问题。步骤102,从目标平台中检索与问题信息相关的目标评论信息。在本实施例中,上述执行主体可以从目标平台中检索与问答请求中的问题信息相关的目标评论信息。其中,目标平台可以是存在大量用户评论信息的服务平台,如点评平台、订餐平台等,且不限于上述列举。此处可以采用多种方式从目标平台中检索与问题信息相关的目标评论信息。作为示例,上述执行主体可以首先从问题信息中提取关键词,而后采用关键词匹配的方式,在目标平台中对用户的评论信息进行检索,将与该关键词匹配的评论信息(例如包含该关键词的评论信息)作为目标评论信息。在本实施例的一些可选的实现方式中,还可以采用通过如下步骤从目标平台中检索与问题信息相关的目标评论信息:第一步,获取问题信息的编码向量以及目标平台中的多个评论信息的编码向量。具体地,可以首先从目标平台中召回与问题信息相关的多个评论信息。而后通过已训练的孪生神经网络模型(SiameseModel)获取问题信息的编码向量以及所召回的各个评论信息的编码向量。第二步,确定问题信息的编码向量与各评论信息的编码向量的相似度。此处,可以采用余弦定理、欧氏距离、杰卡德相似性度量方法等各种常用的相似度计算方法,分别计算问题信息的编码向量与各评论信息的编码向量的相似度。第三步,按照相似度由大到小的次序对多个评论信息进行排序,并基于排序结果选取预设数量(例如前20个)的评论信息作为目标评论信息。由于编码向量能够表征文本的语义,因而通过计算编码向量相似度的方式选择目标评论信息,相较于直接进行关键词匹配的方式,能够更准确地衡量问题信息与评论信息的相关性,由此可提高检索出的目标评论信息的准确性。步骤103,基于已训练的信息抽取模型,从目标评论信息中提取候选答案。在本实施例中,上述执行主体中可以预先存储已训练的信息抽取模型。信息抽取模型可以从文本信息中抽取内容,由此,可以使用信息抽取模型,从目标评论信息中抽取信息,以得到候选答案。此处,信息抽取模型可以采用机器学习方法(如有监督学习方法)预先训练得到。训练信息抽取模型所使用的基础模型可以是各种具有文本抽取功能的模型,如BERT(BidirectionalEncoderRepresentationsfromTransformer,基于transformer结构的双向编码器表征)模型、端对端模型等。在本实施例中,可以依次将每个目标评论信息输入至信息抽取模型,得到信息抽取模型输出的针对该目标评论信息的信息抽取结果,该信息本文档来自技高网...

【技术保护点】
1.一种问答方法,其特征在于,所述方法包括:/n接收客户端发送的问答请求,所述问答请求中包括问题信息;/n从目标平台中检索与所述问题信息相关的目标评论信息;/n基于已训练的信息抽取模型,从所述目标评论信息中提取候选答案;/n对所得到的候选答案进行排序,并基于排序结果从所得到的候选答案中选取目标答案,向所述客户端返回所述目标答案。/n

【技术特征摘要】
1.一种问答方法,其特征在于,所述方法包括:
接收客户端发送的问答请求,所述问答请求中包括问题信息;
从目标平台中检索与所述问题信息相关的目标评论信息;
基于已训练的信息抽取模型,从所述目标评论信息中提取候选答案;
对所得到的候选答案进行排序,并基于排序结果从所得到的候选答案中选取目标答案,向所述客户端返回所述目标答案。


2.根据权利要求1所述的方法,其特征在于,所述从目标平台中检索与所述问题信息相关的目标评论信息,包括:
获取所述问题信息的编码向量以及目标平台中的多个评论信息的编码向量;
确定所述问题信息的编码向量与各评论信息的编码向量的相似度;
按照相似度由大到小的次序对所述多个评论信息进行排序,并基于排序结果选取预设数量的评论信息作为目标评论信息。


3.根据权利要求1所述的方法,其特征在于,所述基于已训练的信息抽取模型,从所述目标评论信息中提取候选答案,包括:
将所述问题信息分别与所检索出的各目标评论信息进行拼接,得到多个拼接序列;
分别将各拼接序列输入至预先训练的信息抽取模型,得到分别从各目标评论信息中提取的候选答案。


4.根据权利要求1所述的方法,其特征在于,所述基于已训练的信息抽取模型,从所述目标评论信息中提取候选答案,包括:
将所述问题信息分别与所检索出的各目标评论信息进行拼接,得到多个拼接序列;
分别将各拼接序列输入至预先训练的信息抽取模型,得到各目标评论信息中的关键信息以及所述问题信息无答案的第一概率;
筛选出所述第一概率大于预设阈值的目标评论信息,并将所筛选出的目标评论信息对应的关键信息作为候选答案。


5.根据权利要求4所述的方法,其特征在于,所述将所述问题信息分别与所检索出的各目标评论信息进行拼接,得到多个拼接序列,包括:
对于所检索出的每一个目标评论信息,将所述问题信息与该目标评论信息进行拼接,在拼接位置插入分割符号,并在所述问题信息的首字符前插入预设分类符号,得到拼接序列。


6.根据权利要求5所述的方法,其特...

【专利技术属性】
技术研发人员:夏江南杨玉树江会星
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1