【技术实现步骤摘要】
一种数据存储方法、装置、电子设备和介质
[0001]本申请涉及数据存储
,尤其是涉及一种数据存储方法
、
装置
、
电子设备和介质
。
技术介绍
[0002]随着计算机技术的快速进步,为了更方便存储和应用数据,存储介质应运而生
。
在实际的使用过程中,人们会将大量数据存储到存储介质中,而在此过程中可能存在大量重复数据被存储至存储介质的情况,然而存储介质的存储空间是一定的,重复数据的存储会导致非重复数据的存储空间减小
。
[0003]相关技术中接收到数据存储请求时,会将待存储数据的所有内容与每一已存储数据的所有内容一一进行匹配,当确定待存储数据的内容与某一已存储数据的内容相同时,则确定待存储数据为重复数据,进而只存储不重复数据
。
然而,当存储介质中存在较多数据的已存储数据时,就需要花费较长的时间进行内容匹配,可见,相关技术确定重复数据的效率较低
。
技术实现思路
[0004]为了提高重复数据的确定效率,本申请提供一种数据存储方法
、
装置
、
电子设备和介质
。
[0005]第一方面,本申请提供一种数据存储方法,采用如下的技术方案:一种数据存储方法,包括:当接收到待存储数据写入请求时,获取所述待存储数据的属性信息;基于所述属性信息和预设已存储数据,筛选出与所述属性信息相匹配的若干已存储数据;提取所述待存储数据对应的第一关键数据,以及,提取所述已存储数据对 ...
【技术保护点】
【技术特征摘要】
1.
一种数据存储方法,其特征在于,包括:当接收到待存储数据写入请求时,获取所述待存储数据的属性信息;基于所述属性信息和预设已存储数据,筛选出与所述属性信息相匹配的若干已存储数据;提取所述待存储数据对应的第一关键数据,以及,提取所述已存储数据对应的第二关键数据,其中,关键数据为存在变化的数据;确定所述第一关键数据与所述第二关键数据的相似度,并判断所述相似度是否达到预设最大相似度阈值;若所述相似度达到预设最大相似度阈值,则利用所述待存储数据覆盖相似数据,以进行数据更新,所述相似数据为与所述第二关键数据对应的已存储数据;若所述相似度未达到预设最大相似度阈值,则写入所述待存储数据
。2.
根据权利要求1所述的数据存储方法,其特征在于,所述提取所述待存储数据对应的第一关键数据,包括:基于所述属性信息和所述待存储数据,确定所述待存储数据是否为转换数据;若所述待存储数据不为转换数据,则基于预设的属性信息和提取模板的对应关系和所述属性信息,确定与所述属性信息对应的目标提取模板,并基于所述提取模板提取所述待存储数据对应的第一关键数据;若所述待存储数据为转换数据,则基于预设的属性信息和转换策略和所述属性信息,确定与所述属性信息对应的目标转换策略;基于所述目标转换策略对所述待存储数据进行转换,并提取转换后的待存储数据对应的第一关键数据
。3.
根据权利要求1所述的数据存储方法,其特征在于,所述确定所述第一关键数据与所述第二关键数据的相似度,包括:确定所述第一关键数据的第一字符与所述第二关键数据的第二字符的字符相似度,所述第一字符为从所述第一关键数据中提取到的,所述第二字符为从所述第二关键数据中提取到的;确定所述字符相似度是否达到预设最大字符相似度阈值;若所述字符相似度未达到预设最大字符相似度阈值,则对所述第一关键数据进行语义识别得到第一语义,以及,对所述第二关键数据进行语义识别得到第二语义;确定所述第一语义与所述第二语义的语义相似度,并将所述语义相似度确定为所述第一关键数据与所述第二关键数据的相似度
。4.
根据权利要求1所述的数据存储方法,其特征在于,所述写入所述待存储数据,包括:获取数据存储分区信息,并基于所述数据存储分区信息和所述待存储数据确定存储区域数量;基于预设的存储区域数量和写入模式的对应关系和所述存储区域数量,确定与所述存储区域数量对应的目标写入模式;基于所述目标写入模式和所述待存储数据,写入所述待存储数据
。5.
根据权利要求4所述的数据存储方法,其特征在于,所述基于所述目标写入模式和所述...
【专利技术属性】
技术研发人员:付万福,
申请(专利权)人:深圳市威科伟业电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。