数据处理方法及装置、数据查询方法及装置制造方法及图纸

技术编号:29156667 阅读:40 留言:0更新日期:2021-07-06 22:56
本说明书实施例提供数据处理方法及装置,其中,所述数据处理方法应用于数据管理平台,包括对获取的多个文本数据进行预处理,并基于预处理后的所述多个文本数据之间的相似度,将所述多个文本数据划分为至少一种类型;确定每种类型的文本数据的目标问题、目标答案以及与所述目标问题关联的扩展问题;确定所述目标问题在数据存储平台对应的数据库,并将所述目标问题、所述目标答案以及所述扩展问题存储至对应的数据库;获取所有数据库中相同的目标问题,并将所述相同的目标问题关联的不同扩展问题进行数据库共享。

【技术实现步骤摘要】
数据处理方法及装置、数据查询方法及装置
本说明书实施例涉及计算机
,特别涉及一种数据处理方法。本说明书一个或者多个实施例同时涉及一种数据查询方法,一种数据处理装置,一种计算设备,以及一种计算机可读存储介质。
技术介绍
随着智能聊天机器人的普及,越来越多的项目场景通过聊天机器人解答客户售前、售后等环节的问题,以提升购买转化率与用户满意度。而在聊天机器人应用中,知识库是其中重要的模块,知识库的结构化程度以及内容质量决定着对用户需求检索的准确性及回答质量的高低。但随着项目场景的增多,会使得知识库变得庞大复杂,后期维护困难。
技术实现思路
有鉴于此,本说明书施例提供了一种数据处理方法。本说明书一个或者多个实施例同时涉及一种数据查询方法,一种数据处理装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。根据本说明书实施例的第一方面,提供了一种数据处理方法,应用于数据管理平台,包括:对获取的多个文本数据进行预处理,并基于预处理后的所述多个文本数据之间的相似度,将所述多个文本数据划分为至少一本文档来自技高网...

【技术保护点】
1.一种数据处理方法,应用于数据管理平台,包括:/n对获取的多个文本数据进行预处理,并基于预处理后的所述多个文本数据之间的相似度,将所述多个文本数据划分为至少一种类型;/n确定每种类型的文本数据的目标问题、目标答案以及与所述目标问题关联的扩展问题;/n确定所述目标问题在数据存储平台对应的数据库,并将所述目标问题、所述目标答案以及所述扩展问题存储至对应的数据库;/n获取所有数据库中相同的目标问题,并将所述相同的目标问题关联的不同扩展问题进行数据库共享。/n

【技术特征摘要】
1.一种数据处理方法,应用于数据管理平台,包括:
对获取的多个文本数据进行预处理,并基于预处理后的所述多个文本数据之间的相似度,将所述多个文本数据划分为至少一种类型;
确定每种类型的文本数据的目标问题、目标答案以及与所述目标问题关联的扩展问题;
确定所述目标问题在数据存储平台对应的数据库,并将所述目标问题、所述目标答案以及所述扩展问题存储至对应的数据库;
获取所有数据库中相同的目标问题,并将所述相同的目标问题关联的不同扩展问题进行数据库共享。


2.根据权利要求1所述的数据处理方法,所述对获取的多个文本数据进行预处理之前,还包括:
获取多个在线文本数据和多个离线文本数据,基于所述多个在线文本数据和所述多个离线文本数据形成多个文本数据。


3.根据权利要求1所述的数据处理方法,所述对获取的多个文本数据进行预处理,包括:
根据预设过滤规则对获取的多个文本数据进行规则过滤;
根据语句评分规则对通过规则过滤后的多个文本数据进行语句过滤;
根据情感分析规则对通过语句过滤后的多个文本数据进行情感过滤。


4.根据权利要求3所述的数据处理方法,所述根据语句评分规则对通过规则过滤后的多个文本数据进行语句过滤,包括:
将通过规则过滤后的多个文本数据输入语言模型,获得规则过滤后的多个文本数据中每个文本数据的语句得分;
从规则过滤后的多个文本数据中,删除语句得分小于等于预设得分阈值的文本数据。


5.根据权利要求3或4所述的数据处理方法,所述根据情感分析规则对通过语句过滤后的多个文本数据进行情感过滤,包括:
获取通过语句过滤后的多个文本数据中每个文本数据的语料情绪以及敏感词;
从通过语句过滤后的多个文本数据中,删除语料情绪满足预设情绪阈值或者包含敏感词的文本数据。


6.根据权利要求1所述的数据处理方法,所述基于确定所述目标问题在数据存储平台对应的数据库,包括:
通过对所述目标问题的文本处理确定所述目标问题对应的领域;
基于所述目标问题对应的领域确定所述目标问题对应的数据库领域,并基于所述数据库领域确定所述目标问题在数据存储平台对应的数据库。


7.根据权利要求1所述的数据处理方法,所述将目标问题、所述目标答案以及所述扩展问题存储至对应的数据库,包括:
判断所述目标问题对应的数据库中是否已经存储所述目标问题,
若是,则将所述目标问题关联的扩展问题存储至对应的数据库,并与所述目标问题进行关联,
若否,则将所述目标问题、所述目标答案以及所述扩展问题存储至对应的数据库。


8.根据权利要求1所述的数据处理方法,所述将所述相同的目标问题关联的不同扩展问题进行数据库共享,包括:
确定所述相同的目标问题中每个目标问题不存在的扩展问题;
将所述每个目标问题不存在的扩展问题存储至所述每个目标问题对应的数据库,并与所述每个目标问题进行关联。


9.一种数据查询方法,应用于数据查询平台,包括:
接收客户端发送的、携带有文本问题的数据查询请求;
基于所述数据查询请求对所述文本问题进行预处理,确定所述文本问题在数据存储平台对应的数据库;
从与所述文本问题对应的数据库中,获取与所...

【专利技术属性】
技术研发人员:毛顺亿李秋逸刘小瑒朱学浩许慢张金剑刘磊
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1