答案文本的处理方法和装置、关键文本的确定方法制造方法及图纸

技术编号:25835470 阅读:43 留言:0更新日期:2020-10-02 14:16
本说明书提供了答案文本的处理方法和装置、关键文本的确定方法。在一个实施例中,基于上述答案文本的数据处理方法,通过先从预设的知识库中确定出与目标问题匹配的答案文本作为目标答案文本;再通过从目标答案文本中识别确定出与目标问题关联性较强且用户关注度较高的关键文本,并在目标答案文本中标注出上述关键文本;进而可以在向用户所展示的目标答案文本中标识出上述关键文本,使得用户可以方便、高效地读取到目标答案文本中用户所需要的、价值较高的关键信息。

【技术实现步骤摘要】
答案文本的处理方法和装置、关键文本的确定方法
本说明书属于互联网
,尤其涉及答案文本的处理方法和装置、关键文本的确定方法。
技术介绍
在客服答复场景中,常常会使用客服机器人从预设的知识库中检索到的合适的答案文本回复给用户。但是,客服机器人从预设的知识库中直接检索到的答案文本的文本内容有时会比较长。例如,客服机器人检索到并回复给用户的答案文本可能是一个包含有几百个字符的一大段的文本内容。这时用户必须自己仔细地阅读完上述一大段的文本内容后才能最终找到自己所需要的、有价值的关键信息,用户的使用体验相对较差。
技术实现思路
本说明书提供了一种答案文本的处理方法和装置、关键文本的确定方法,以使得用户可以方便、高效地读取到目标答案文本中用户所需要的、价值较高的关键信息,提高用户的使用体验。本说明书提供的答案文本的处理方法和装置、关键文本的确定方法是这样实现的:一种答案文本的处理方法,包括:确定目标问题;从预设的知识库中确定出与所述目标问题匹配的答案文本作为目标答案文本;其中,所述预设的知识库存储有多个答案文本;确定本文档来自技高网...

【技术保护点】
1.一种答案文本的处理方法,包括:/n确定目标问题;/n从预设的知识库中确定出与所述目标问题匹配的答案文本作为目标答案文本;其中,所述预设的知识库存储有多个答案文本;/n确定所述目标答案文本中的关键文本;其中,所述关键文本为目标答案文本中的与目标问题关联且关注度高于预设阈值的文本数据;/n在目标答案文本中标注出所述关键文本,得到标注后的目标答案文本;/n将所述标注后的目标答案文本反馈给终端设备;其中,所述终端设备用于向用户展示目标答案文本,且在所展示的目标答案文本中以预设的标识方式标识出所述关键文本。/n

【技术特征摘要】
1.一种答案文本的处理方法,包括:
确定目标问题;
从预设的知识库中确定出与所述目标问题匹配的答案文本作为目标答案文本;其中,所述预设的知识库存储有多个答案文本;
确定所述目标答案文本中的关键文本;其中,所述关键文本为目标答案文本中的与目标问题关联且关注度高于预设阈值的文本数据;
在目标答案文本中标注出所述关键文本,得到标注后的目标答案文本;
将所述标注后的目标答案文本反馈给终端设备;其中,所述终端设备用于向用户展示目标答案文本,且在所展示的目标答案文本中以预设的标识方式标识出所述关键文本。


2.根据权利要求1所述的方法,所述预设的标识方式包括以下至少之一:高亮文本中的字符、加粗文本中的字符、在文本中的字符下方设置下划线。


3.根据权利要求1所述的方法,所述确定目标问题包括:
获取用户提出的问题;
根据用户提出的问题,从多个预设问题中确定出匹配的预设问题作为目标问题。


4.根据权利要求1所述的方法,所述确定所述目标答案文本中的关键文本,包括:
调用预设的机器阅读模型根据所述目标问题和所述目标答案文本进行数据处理,以从所述目标答案文本中识别出所述关键文本。


5.根据权利要求4所述的方法,所述预设的机器阅读模型按照以下方式建立:
获取历史客服答复记录;
从所述历史客服答复记录中提取出问答文本对;其中,所述问答文本对包含有用户提问的问题文本和客服答复的答复文本,所述答复文本包括客服从答案文本中所截取使用的部分文本数据;
根据预设的知识库,确定出与所述问答文本对对应的答案文本和预设问题;
根据所述问答文本对,以及与所述问答文本对对应的答案文本和预设问题,建立训练数据;其中,所述训练数据中的各组训练数据至少包括预设问题、答复文本和答案文本;
利用所述训练数据进行模型训练,以得到所述预设的机器阅读模型。


6.根据权利要求5所述的方法,根据所述问答文本对,以及与所述问答文本对对应的答案文本和预设问题,建立训练数据,包括:
将问答文本对划分为多个数据组;其中,同一数据组中的问答文本对中的答复文来源于同一个答案文本;
统计各个数据组中的各答复文本的使用频率;
获取各个数据组中使用频率最高的答复文本,和该数据组中的问答文本对所对应的预设问题、答案文本,作为训练数据。


7.根据权利要求6所述的方法,在获取各个数据组中使用频率最高的答复文本,和该数据组中的问答文本对所对应的预设问题、答案文本,作为训练数据之后,所述方法还包括:
对训练数据中所包含的预设问题进行扩展,得到多个扩展问题;
根据所述扩展问题,对所述训练数据进行扩充。


8.根据权利要求1所述的方法,所述确定所述目标答案文本中的关键文本,还包括:
检索预设缓存,以确定出与所述目标答案文本匹配的预设文本作为目标答案文本中的关键文本;其中,所述预设缓存保存有多个预设文本,所述多个预设文本分别与预设的知识库中的答案文本对应。


9.根据权利要求8所述的方法,所述预设文本按照以下方式获取:
调用预设的机器阅读模型根据预设的知识库所保存的答案文本和与该答案文本对应的预设问题进行处理,以从答案文本中确定出关键文本作为与该答案文本对应的预设文本。


10.根据权利要求9所述的方法,所述方法还包括:
检测预设的知识库中的答案文本是否发生更新;
在确定预设的知识库中的答案文本发生更新的情况下,利用所述预设的机器阅读模型对预设缓存中所保存的预设文本进行更新。


11.根据权利要求10所述的方法,所述预设缓存中的预设文本设置有第一时间标记,所述预设的知识库中的答案文本设置有第二时间标记。


12.根据权利要求11所述的方...

【专利技术属性】
技术研发人员:彭爽詹泽崔恒斌谢杨易娄伟锋
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1