答案生成方法、装置及服务器制造方法及图纸

技术编号:19822032 阅读:15 留言:0更新日期:2018-12-19 14:47
本发明专利技术公开了一种答案生成方法、装置及服务器,涉及人工智能领域,所述方法包括:接收待回答问题,并对待回答问题进行分词处理;根据分词结果和预设问题类别对应的关键词库,确定待回答问题所属的目标问题类别,预设问题类别和关键词库根据语料集训练得到,语料集为问题集合;从目标问题类别对应的数据库中获取待回答问题对应的备选答案数据;根据备选答案数据和答案生成规则生成待回答问题对应的答案。解决了由于问答数据库中问题和答案有限,导致的最终反馈的答案的准确度较低的问题。

【技术实现步骤摘要】
答案生成方法、装置及服务器
本专利技术实施例涉及人工智能领域,特别涉及一种答案生成的方法、装置及服务器。
技术介绍
用户对某项业务或服务存在疑问时,经常会选择询问人工客服,但传统人工客服回复消息的效率较低且成本较高。为了提高回复效率并降低成本,越来越多领域开始使用自动回复系统取代传统的人工客服。相关技术中,自动回复系统中预先存储有问答数据库,当接收到用户发送的问题时,自动回复系统即在问答数据库中查找与该问题相匹配的目标问题,并向用户反馈目标问题对应的答案。然而,基于问题匹配的方式获取答案时,由于问答数据库中问题和答案有限,导致最终反馈的答案的准确度较低。
技术实现思路
为了解决自动回复系统中,由于问答数据库中问题和答案有限,导致的最终反馈的答案的准确度较低的问题,本专利技术实施例提供了一种答案生成方法及装置。所述技术方案如下:根据本专利技术的第一方面,提供了一种答案生成方法,该方法包括:接收待回答问题,并对待回答问题进行分词处理;根据分词结果和预设问题类别对应的关键词库,确定待回答问题所属的目标问题类别,预设问题类别和关键词库根据语料集训练得到,语料集为问题集合;从目标问题类别对应的数据库中获取待回答问题对应的备选答案数据;根据备选答案数据和答案生成模板生成待回答问题对应的答案。根据本专利技术的第二方面,提供了一种答案生成装置,该装置包括:接收模块,用于接收待回答问题,并对待回答问题进行分词处理;确定模块,用于根据分词结果和预设问题类别对应的关键词库,确定待回答问题所属的目标问题类别,预设问题类别和关键词库根据语料集训练得到,语料集为问题集合;获取模块,用于从目标问题类别对应的数据库中获取待回答问题对应的备选答案数据;生成模块,用于根据备选答案数据和答案生成模板生成待回答问题对应的答案。根据本专利技术的第三方面,提供了一种服务器,该服务器包括处理器和存储器,存储器中存储有至少一条指令,指令由处理器加载并执行以实现如第一方面所述的答案生成方法。根据本专利技术的第四方面,提供了一种计算机可读存储介质,存储介质中存储有至少一条指令,指令由处理器加载并执行以实现如第一方面所述的的答案生成方法。本专利技术实施例提供的技术方案带来的有益效果是:本专利技术实施例中,服务器接收到用户提出的待回答问题后,对待回答问题进行分词处理,并根据分词结果和预设问题类别对应的关键词库,确定待回答问题所属的目标问题类别,再针对待回答问题和目标问题类别对应的数据库确定备选答案数据,最后根据备选答案数据和答案生成模板生成待回答问题对应的答案;由于最终得到的答案是基于待回答问题所属问题类别的数据库中的备选答案数据生成,因此所得答案与待回答问题的匹配度更高,且准确度更高,从而解决了由于问答数据库中问题和答案有限,导致最终反馈的答案的准确度较低的问题。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一个示例性实施例提供的答案生成方法流程图;图2是本专利技术一个示例性实施例提供的问题类别和关键词库训练方法流程图;图3是本专利技术另一个示例性实施例提供的问题类别和关键词库训练方法流程图;图4是本专利技术另一个示例性实施例提供的答案生成方法的流程图;图5是本专利技术一个示例性实施例提供的答案生成装置的结构示意图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。本专利技术各个实施例提供的答案生成方法用于服务器,该服务器为一台服务器、若干台服务器组成的服务器集群或云计算中心。在一种可能的实施方式中,该服务器为金融客服系统的后台服务器,用于根据接收到的问题生成相应的答案。为了方便描述,下述实施例中均以答案生成方法应用于服务器来举例说明。参考图1,其示出了本专利技术一个示例性实施例提供的答案生成方法流程图。本实施例以答案生成方法应用于服务器中来举例说明,该答案生成方法包括如下步骤:步骤101,接收待回答问题,并对待回答问题进行分词处理。在用户对金融领域某项业务或服务存在疑问时,即通过终端访问金融客服系统,并将问题输入到该系统中,由金融客服系统将接收到的待回答问题发送到服务器。服务器接收到待回答问题后,首先对该待回答问题进行分词处理,即将待回答问题划分为以词汇为单位的词串。在一种可能的实现方式中,服务器内预先存储有本领域的词库,接收到待回答问题后,即根据该词库中词汇的组合形式对待回答问题进行分词。例如,服务器接收到的用户问题为“非农什么时间发布”,得到的分词结果为[‘非农’,‘什么’,‘时间’,‘发布’]。步骤102,根据分词结果和预设问题类别对应的关键词库,确定待回答问题所属的目标问题类别,预设问题类别和关键词库根据语料集训练得到,语料集为问题集合。在一种可能的实现方式中,语料集为服务器搜集到的本领域用户提出的问题的集合,服务器预先根据该语料集训练得到预设问题类别和关键词库,其中关键词库是根据预设问题类别确定的,是同类问题的关键词集合,用于表示该问题类别的主要特征,且不同预设类别对应的关键词库不同。由于关键词库与预设问题类别相对应,因此当分词结果与一关键词库匹配时,服务器确定待回答问题属于该关键词库对应的预设问题类别,并确定该预设问题类别为目标问题类别。在一种可能的实现方式中,服务器将分词结果中包含的词汇与关键词库中的每个词汇进行匹配,当确定关键词库中包含分词结果中的词汇时,确定分词结果与该关键词库匹配,进一步的,服务器将该关键词库对应的问题类别确定为目标问题类别。步骤103,从目标问题类别对应的数据库中获取待回答问题对应的备选答案数据。在一种可能的实施方式中,服务器中预先设置了问题类别与数据库的对应关系,当确定待回答问题所属的目标问题类别后,服务器确定该目标问题类别对应的数据库,并根据分词结果从该数据库中查找回答该待回答问题时所需的信息,进而将查找得到的信息作为备选答案数据。可选的,服务器将数据库中,与分词结果相关的历史统计数据和/或最近更新的数据确定为备选答案数据。例如,当待回答问题对应的分词结果中包含“非农”时,服务器确定待回答问题对应的目标问题类别为宏观数据,并从宏观数据对应的宏观数据库中提取非农就业人口相关的数据作为备选答案数据。步骤104,根据备选答案数据和答案生成模板生成待回答问题对应的答案。服务器中预先设置了问题类别与答案生成模板的对应关系,当确定待回答问题所属的问题类别后,服务器根据该对应关系得到该待回答问题对应的答案生成模板,并结合步骤103中得到的备选答案数据,生成待回答问题对应的答案。综上所述,本实施例中,服务器接收到用户提出的待回答问题后,对待回答问题进行分词处理,并根据分词结果和预设问题类别对应的关键词库,确定待回答问题所属的目标问题类别,再针对待回答问题和目标问题类别对应的数据库确定备选答案数据,最后根据备选答案数据和答案生成模板生成待回答问题对应的答案;由于最终得到的答案是基于待回答问题所属问题类别的数据库中的备选答案数据生成,因此所得答案与待回答问题的匹配度更高,且准确度更高,从而解决了由于问答数据库中问题和本文档来自技高网...

【技术保护点】
1.一种答案生成方法,其特征在于,所述方法包括:接收待回答问题,并对所述待回答问题进行分词处理;根据分词结果和预设问题类别对应的关键词库,确定所述待回答问题所属的目标问题类别,所述预设问题类别和所述关键词库根据语料集训练得到,所述语料集为问题集合;从所述目标问题类别对应的数据库中获取所述待回答问题对应的备选答案数据;根据所述备选答案数据和答案生成模板生成所述待回答问题对应的答案。

【技术特征摘要】
1.一种答案生成方法,其特征在于,所述方法包括:接收待回答问题,并对所述待回答问题进行分词处理;根据分词结果和预设问题类别对应的关键词库,确定所述待回答问题所属的目标问题类别,所述预设问题类别和所述关键词库根据语料集训练得到,所述语料集为问题集合;从所述目标问题类别对应的数据库中获取所述待回答问题对应的备选答案数据;根据所述备选答案数据和答案生成模板生成所述待回答问题对应的答案。2.根据权利要求1所述的方法,其特征在于,所述接收待回答问题,并对所述待回答问题进行分词处理之前,所述方法还包括:根据所述语料集构建语料词典和词频矩阵,所述语料词典中包含对所述语料集中各个问题进行分词得到的词汇,所述词频矩阵中包含所述语料集中各个问题对应的特征向量,所述特征向量用于指示所述语料词典中的词汇在各个问题中出现的次数;根据所述词频矩阵计算每个问题中各个词汇的特征权重,并根据所述特征权重得到每个问题对应的特征矩阵,所述特征权重用于指示问题中各个词汇的重要程度;根据各个问题对应的所述特征矩阵,对所述语料集中的问题进行聚类,得到所述预设问题类别,其中,同一问题类别中各个问题的语义相似度大于阈值;根据各个预设问题类别中包含的问题,生成各个预设问题类别对应的所述关键词库。3.根据权利要求1或2所述的方法,其特征在于,所述根据分词结果和预设问题类别对应的关键词库,确定所述待回答问题所属的目标问题类别,包括:确定所述分词结果中各个词汇所属的目标关键词库;将所述目标关键词库对应的所述预设问题类别确定为所述目标问题类别。4.根据权利要求1或2所述的方法,其特征在于,所述从所述目标问题类别对应的数据库中获取所述待回答问题对应的备选答案数据,包括:当所述目标问题类别对应的数据库为宏观数据库时,将所述宏观数据库中与所述分词结果对应的宏观经济数据确定为所述备选答案数据,所述宏观数据库中的数据定时更新;当所述目标问题类别对应的数据库为技术指标数据库时,将所述技术指标数据库中与所述分词结果对应的技术指标数据确定为所述备选答案数据,所述技术指标数据库中的数据用于指示信号的统计信息和分布情况;当所述目标问题对应的数据库为客服问答数据库时,在所述客服问答数据库中查找与所述分词结果相似度最高的目标客服问题,所述客服问答数据库中包括问答文档中的客服问题和客服答案;将所述目标客服问题对应的目标客服答案确定为所述备选答案数据。5.根据权利要求4所述的方法,其特征在于,所述根据所述备选答案数据和答案生成模板生成所述待回答问题对应的答案,包括:当所述备选答案数据为所述...

【专利技术属性】
技术研发人员:王宁李天怡梁钰米楠
申请(专利权)人:上海银赛计算机科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1