【技术实现步骤摘要】
问答对知识库的构建方法、装置、设备及存储介质
[0001]本申请涉及到人工智能
,特别是涉及到一种问答对知识库的构建方法、装置、设备及存储介质。
技术介绍
[0002]问答机器人是一个便利解决用户关于业务疑问的有效途径。问答机器人有一个问答对知识库,问答对知识库由问答对组成,问答对即一对(问题
‑
答案)。问答机器人的工作流程是:机器人根据用户的提问在问答对知识库中进行匹配,匹配出和用户自然表述的提问最相近的问题,将最相近的问题对应的答案返回给用户。
[0003]现有技术的问答对知识库的构建通过人工输入,如果出现不当表述如错别字、不友好词等,会导致问答机器人匹配不上最相近的问题或者推送给客户不正确的答案,从而降低问答机器人服务的专业性。
技术实现思路
[0004]本申请的主要目的为提供一种问答对知识库的构建方法、装置、设备及存储介质,旨在解决现有技术的问答对知识库的构建通过人工输入,无法准确检测不当表述,导致应用时匹配不上最相近的问题或者推送不正确的答案的技术问题。
[0005]为了实现上述专利技术目的,本申请提出一种问答对知识库的构建方法,所述方法包括:
[0006]获取待检测的文本数据和所述待检测的文本数据对应的目标类别标签;
[0007]基于所述目标类别标签对所述待检测的文本数据进行不规范检测,得到不规范检测结果;
[0008]当所述不规范检测结果为通过时,将所述待检测的文本数据输入不当表述检测模型进行不当表述检测,得到不当表述检测结 ...
【技术保护点】
【技术特征摘要】
1.一种问答对知识库的构建方法,其特征在于,所述方法包括:获取待检测的文本数据和所述待检测的文本数据对应的目标类别标签;基于所述目标类别标签对所述待检测的文本数据进行不规范检测,得到不规范检测结果;当所述不规范检测结果为通过时,将所述待检测的文本数据输入不当表述检测模型进行不当表述检测,得到不当表述检测结果,所述不当表述检测模型是基于Bert base网络和CRF网络训练得到的模型;当所述不当表述检测结果为通过时,采用特定词语词典和通用错别字纠正模型对所述待检测的文本数据进行错别字检测和纠正,得到错别字纠正后的文本数据,所述通用错别字纠正模型是基于Bert网络训练得到的模型;根据所述错别字纠正后的文本数据和所述待检测的文本数据,确定目标文本数据,根据所述目标文本数据和所述目标类别标签更新问答对知识库。2.根据权利要求1所述的问答对知识库的构建方法,其特征在于,所述基于所述目标类别标签对所述待检测的文本数据进行不规范检测,得到不规范检测结果的步骤,包括:获取字符长度数据,根据所述目标类别标签从所述字符长度数据中获取字符长度范围,得到目标字符长度范围;当所述待检测的文本数据的字符数量位于所述目标字符长度范围内时确定字符长度检测结果为通过,否则确定所述字符长度检测结果为不通过;获取特殊符号库,根据所述目标类别标签从所述特殊符号库中获取特殊符号数据,得到目标特殊符号数据;分别将所述目标特殊符号数据的特殊符号从所述待检测的文本数据中进行特殊符号的查找,当在所述待检测的文本数据中查找到特殊符号时确定特殊符号检测结果为不通过,否则确定所述特殊符号检测结果为通过;当所述字符长度检测结果和所述特殊符号检测结果均为通过时,确定所述不规范检测结果为通过。3.根据权利要求1所述的问答对知识库的构建方法,其特征在于,所述将所述待检测的文本数据输入不当表述检测模型进行不当表述检测,得到不当表述检测结果的步骤,包括:将所述待检测的文本数据输入所述不当表述检测模型进行不当表述标签标注,得到所述待检测的文本数据对应的目标不当表述标签集;获取不当表述标准标签集,将所述不当表述标准标签集在所述目标不当表述标签集中进行不当表述标签的查找,当在所述目标不当表述标签集中查找不当表述标签失败时确定所述不当表述检测结果为通过。4.根据权利要求1所述的问答对知识库的构建方法,其特征在于,所述采用特定词语词典和通用错别字纠正模型对所述待检测的文本数据进行错别字检测和纠正,得到错别字纠正后的文本数据的步骤,包括:采用所述特定词语词典对所述待检测的文本数据进行错别字检测和纠正,得到特定词语纠正后的文本数据;采用所述通用错别字纠正模型对所述特定词语纠正后的文本数据进行错别字检测和纠正,得到所述错别字纠正后的文本数据。
5.根据权利要求4所述的问答对知识库的构建方法,其特征在于,所述采用所述特定词语词典对所述待检测的文本数据进行错别字检测和纠正,得到特定词语纠正后的文本数据的步骤,包括:对所述待检测的文本数据进行分句,得到多个待检测的文本句;分别将每个所述待检测的文本句与所述特定词语词典中的词语进行相似度计算,得...
【专利技术属性】
技术研发人员:张舒婷,赖众程,倪佳,李骁,李林毅,高静,陈志伟,林志超,李筱艺,李会璟,
申请(专利权)人:平安银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。