【技术实现步骤摘要】
数据存储方法、装置、存储介质及电子设备
本公开涉及数据处理
,具体地,涉及一种数据存储方法、装置、存储介质及电子设备。
技术介绍
随着计算机技术的不断发展,可以将各种各样的数据存储到数据库进行管理。由于数据库中存储的数据为结构化数据,因此在将数据存储到数据库之前,需要对数据进行结构化处理。相关技术中,主要是训练命名实体识别模型和关系识别模型,然后根据训练得到的模型进行计算以识别出数据的实体和关系,最后根据得出的结果进行数据结构化。按照此种方式,如果计算结果存在明显的错误,则需要重新获取样本数据进行模型训练。
技术实现思路
本公开的目的是提供一种数据存储方法、装置、存储介质及电子设备,以在生成的结构化数据存在错误时,更加方便快捷地修正错误,从而提高数据存储的效率和正确率。为了实现上述目的,第一方面,本公开提供一种数据存储方法,应用于服务器,包括:接收客户端发送的待存储的目标文本;将所述目标文本输入到数据转换模型中进行处理,得到所述目标文本的结构化数据,所述结构化数据至少用于表征分词以及 ...
【技术保护点】
1.一种数据存储方法,其特征在于,应用于服务器,包括:/n接收客户端发送的待存储的目标文本;/n将所述目标文本输入到数据转换模型中进行处理,得到所述目标文本的结构化数据,所述结构化数据至少用于表征分词以及该分词的语义类型间的对应关系;/n将所述目标文本的结构化数据发送给数据库进行存储;/n其中,所述数据转换模型包括多个样本单句,所述多个样本单句中的每个样本单句对应有预设结构化数据,所述数据转换模型用于通过如下方式对所述目标文本进行处理:/n针对所述目标文本中的每个单句,在所述多个样本单句中确定与所述单句最相似的目标单句;/n获取所述目标文本中每个单句分别对应的目标单句的预设 ...
【技术特征摘要】
1.一种数据存储方法,其特征在于,应用于服务器,包括:
接收客户端发送的待存储的目标文本;
将所述目标文本输入到数据转换模型中进行处理,得到所述目标文本的结构化数据,所述结构化数据至少用于表征分词以及该分词的语义类型间的对应关系;
将所述目标文本的结构化数据发送给数据库进行存储;
其中,所述数据转换模型包括多个样本单句,所述多个样本单句中的每个样本单句对应有预设结构化数据,所述数据转换模型用于通过如下方式对所述目标文本进行处理:
针对所述目标文本中的每个单句,在所述多个样本单句中确定与所述单句最相似的目标单句;
获取所述目标文本中每个单句分别对应的目标单句的预设结构化数据;
根据所述目标文本中单句对应的目标单句的预设结构化数据,确定所述单句的结构化数据。
2.根据权利要求1所述的方法,其特征在于,根据所述目标文本中单句对应的目标单句的预设结构化数据,确定所述单句的结构化数据,包括:
若所述预设结构化数据中的各分词在所述单句中均具有对应相同的分词,则将所述预设结构化数据作为所述单句的结构化数据;
若所述预设结构化数据中的目标分词在所述单句中不具有对应相同的分词,则在所述预设结构化数据中删除所述目标分词以及所述目标分词对应的语义类型,并将删除后的预设结构化数据作为所述单句的结构化数据。
3.根据权利要求2所述的方法,其特征在于,在所述预设结构化数据中删除所述目标分词以及所述目标分词对应的语义类型,包括:
确定所述单句中是否存在包含所述目标分词部分字符的匹配分词;
若所述单句中不存在所述匹配分词,则在所述预设结构化数据中删除所述目标分词以及所述目标分词对应的语义类型;
若所述单句中存在所述匹配分词,则在所述预设结构化数据中将所述目标分词替换成所述匹配分词,并将替换后的预设结构化数据作为所述单句的结构化数据。
4.根据权利要求1-3任一所述的方法,其特征在于,根据所述目标文本中单句对应的目标单句的预设结构化数据,确定所述单句的结构化数据,包括:
根据所述目标文本中单句对应的目标单句的预设结构化数据,确定所述单句的初始结构化数据;
所述方法还包括:
针对所述单句的剩余分词,在预设词典中查找所述剩余分词对应的语义类型,所述剩余分词是所述单句中未存在于所述初始结构化数据的分词,所述预设词典用于存储多个预设分词以及所述多个预设分词对应的语义类型;
根据所述初始结构化数据以及所述剩余分词对应的语义类型,确定所述单句的目标结构化数据。
5.根据权利要求1-3任一所述的方法,其特征在于,在所述多个样本单句中确定与所述单句最相似的目标单句,包括:
针对所述多个样本单句中的每...
【专利技术属性】
技术研发人员:贾弼然,顾文剑,崔朝辉,
申请(专利权)人:东软集团股份有限公司,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。