数据存储、查询方法、装置及电子设备制造方法及图纸

技术编号:30551750 阅读:29 留言:0更新日期:2021-10-30 13:32
本发明专利技术实施例涉及分布式存储技术领域,公开了一种数据存储、查询方法、装置及电子设备。该方法包括:获取问答数据,所述问答数据包括问题数据和应答数据;使用融合业务特征信息的语义模型将所述问答数据转换为语义向量,其中,所述语义向量包括问题语义向量和应答语义向量;根据所述问题语义向量和所述应答语义向量,分别将所述问题数据和所述应答数据存储至不同存储位置。通过上述方式,本发明专利技术实施例提高了数据查询的准确度。高了数据查询的准确度。高了数据查询的准确度。

【技术实现步骤摘要】
数据存储、查询方法、装置及电子设备


[0001]本专利技术实施例涉及分布式存储
,具体涉及一种数据存储、查询方法、装置及电子设备。

技术介绍

[0002]目前,智能客服系统已经得到越来越广泛的应用。在智能客服系统的应用过程中,需要对问答数据进行存储,并且问答数据的存储质量直接影响智能客服系统进行数据查询的效率。
[0003]相关技术中,一般通过检索引擎构建问答数据的存储位置,通过检索引擎提供的关键词查询接口匹配对应的问答数据,或者通过内存数据库构建问答数据对应的键值来对问答数据进行存储,或者通过神经网络模型构建语义索引树来存储问答数据。专利技术人在实现本专利技术实施例的过程中发现:基于相关技术中问答数据的存储方式,数据查询的准确度较低。

技术实现思路

[0004]鉴于上述问题,本专利技术实施例提供了一种数据存储、查询方法、装置及电子设备,用于解决现有技术中存在的数据查询准确度较低的问题。
[0005]根据本专利技术实施例的一个方面,提供了一种数据存储方法,所述方法包括:
[0006]获取问答数据,所本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据存储方法,其特征在于,所述方法包括:获取问答数据,所述问答数据包括问题数据和应答数据;使用融合业务特征信息的语义模型将所述问答数据转换为语义向量,其中,所述语义向量包括问题语义向量和应答语义向量;根据所述问题语义向量和所述应答语义向量,分别将所述问题数据和所述应答数据存储至不同存储位置。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取训练数据,所述训练数据包括问答语句对和业务语句;生成所述问答语句对所对应的初始问题语义向量和初始应答语义向量,生成所述业务语句所对应的初始业务语义向量;根据所述初始问题语义向量、所述初始应答语义向量和所述初始业务语义向量计算所述问答语句对和所述业务语句的相关性值;若所述相关性值大于预设相关性阈值,则将所述问答语句对与所述业务语句的组合确定为正训练样例,若所述相关性值不大于预设相关性阈值,则将所述问答语句对与所述业务语句的组合确定为负训练样例;根据所述正训练样例和所述负训练样例,对初始语义模型进行训练,以生成所述融合业务特征信息的语义模型。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:随机生成参考向量,根据存储集群的节点数量对所述参考向量进行归一化以生成预设参考向量;计算所述问题语义向量与所述预设参考向量之间的余弦距离和注意力值;根据所述余弦距离和所述注意力值确定所述问题数据的存储位置。4.根据权利要求3所述的方法,其特征在于,所述方法包括:确定目标问题数据所对应的目标应答数据,其中,所述目标问题数据为任一问题数据,所述目标应答数据为与所述目标问题数据关联的应答数据;确定所述目标问题数据的存储位置所对应的节点编号、节点槽总数以及存储槽编号;根据所述节点编号、所述节点槽总数以及所述存储槽编号确定所述目标应答数据的存储位置。5.根据权利要求4所述的方法,其特征在于,所述确定目标问题数据所对应的目标应答数据包括:计算目标问题数据的语义向量与每一应答数据的语义向量的余弦距离;按照所述余弦距离从小到大确定预设数...

【专利技术属性】
技术研发人员:李宗祥
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1