用于问答的数据处理方法以及装置、设备、存储介质制造方法及图纸

技术编号:24497941 阅读:35 留言:0更新日期:2020-06-13 03:48
本申请公开了一种用于问答的数据处理方法以及装置、设备、存储介质。该方法包括获取问答对数据;根据所述问答对数据,生成初始问答对集合;将所述初始问答对集合拆分为问题集合和答案集合;对所述问题集合聚类,提取得到问题簇集合;根据经过预设处理后的问答对集合和所述问题簇集合,生成带有答案的问题簇集合。本申请解决了对用于问答的数据没有进行较好利用的技术问题。通过本申请减少人工构建知识的成本。同时抽取得到的热点问答对,减少了企业根据文档条例或者根据记忆编纂知识的人力成本,且生成的知识点即保证了丰富度。

Data processing methods, devices, equipment and storage media for Q & A

【技术实现步骤摘要】
用于问答的数据处理方法以及装置、设备、存储介质
本申请涉及人工智能领域,具体而言,涉及一种用于问答的数据处理方法以及装置、设备、存储介质。
技术介绍
相关技术中常见的企业客服系统是由两种方式组成,机器人客服回答大量常规问题,客服解决特殊化个性问题作为补充。由于客服服务方式便捷化,且客服系统承载量的增强,访客和问题量也指数级的增长。这些对话数据包含了访客的问题和客服的解答,被认为是半结构化的状态,如果能有效的进行挖掘可以产生很大的商业价值。专利技术人发现,针对对话数据的挖掘,往往只是单纯对访客问题进行抽取和聚合操作,只关注了问题忽略了对话中的答案,对话中存在的关联信息没有被利用到。针对相关技术中对用于问答的数据没有进行较好利用的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请的主要目的在于提供一种用于问答的数据处理方法以及装置、设备、存储介质,以解决对用于问答的数据没有进行较好利用的问题。为了实现上述目的,根据本申请的一个方面,提供了一种用于问答的数据处理方法。>根据本申请的用于问本文档来自技高网...

【技术保护点】
1.一种用于问答的数据处理方法,其特征在于,包括:/n获取问答对候选集;/n基于语义对所述问答候选集中的问题进行挖掘;/n基于统计对所述问答候选集中的答案进行挖掘;/n根据挖掘结果,生成热点问答对数据集。/n

【技术特征摘要】
1.一种用于问答的数据处理方法,其特征在于,包括:
获取问答对候选集;
基于语义对所述问答候选集中的问题进行挖掘;
基于统计对所述问答候选集中的答案进行挖掘;
根据挖掘结果,生成热点问答对数据集。


2.一种用于问答的数据处理方法,其特征在于,包括:
获取问答对数据,其中所述问答对数据中包括至少一个问题和至少一个答案;
根据所述问答对数据,生成初始问答对集合;
将所述初始问答对集合拆分为问题集合和答案集合;
对所述问题集合聚类,提取得到问题簇集合;
根据经过预设处理后的问答对集合和所述问题簇集合,生成带有答案的问题簇集合;其中所述经过预设处理后的问答对集合是指在所述初始问答对集合上经过补充或者清洗过滤后得到的处理结果。


3.根据权利要求2所述的数据处理方法,其特征在于,对所述问题集合聚类时还包括,对所述问题集合进行统计和去重,获得种子问题集合;
对所述种子问题集合进行聚类操作,并对聚类形成的簇进行关键词提取,形成问题簇集合。


4.根据权利要求2所述的数据处理方法,其特征在于,对所述问题集合聚类,提取得到问题簇集包括:
将问题簇集合中簇的关键词集合进行统计和去重,得到关键词追踪簇。


5.根据权利要求2所述的数据处理方法,其特征在于,对所述问题集合聚类时还包括,对所述问题集合进行统计和去重,获得种子问题集合;
将所述种子问题集合与所述初始问答对集合进行匹配;
根据匹配结果,生成经过预设处理后的问答对集合。


6.根据权利要求2所...

【专利技术属性】
技术研发人员:杨萌杜振东王清琛
申请(专利权)人:南京云问网络技术有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1