全量数据翻译方法、装置、服务器及存储介质制造方法及图纸

技术编号：18018957 阅读：39 留言：0更新日期：2018-05-23 05:12

本发明专利技术实施例公开了一种全量数据翻译方法、装置、服务器及存储介质，其中，该方法包括：按照预设时间间隔扫描预设存储单元中存储的各站点数据；比较同一站点下子链齐全的最大版本与各资源内容的版本；根据比较结果将所述站点的全量数据翻译为增量数据。本发明专利技术实施例能够将全量数据自动翻译成增量数据，解决了现有知识图谱数据处理系统依赖产品端发现全量数据中的过期数据，且由人力删除过期数据导致的维护成本过高的问题，极大地提升了知识图谱数据库的全面性和稳定性。

全部详细技术资料下载

【技术实现步骤摘要】
全量数据翻译方法、装置、服务器及存储介质
本专利技术实施例涉及数据处理
，尤其涉及一种全量数据翻译方法、装置、服务器及存储介质。
技术介绍
随着互联网技术的发展，利用互联网上的海量数据构建知识图谱数据库，可以为用户提供搜索结果“即搜即得”的搜索体验。目前，知识图谱数据的处理系统主要是基于增量数据进行处理，而部分站长由于能力有限仅能提交全量数据，基于增量的数据处理系统无法有效地自动找出不同版本全量数据之间发生变化的数据，只能依赖产品端发现过期数据后以人工干预的方式删除。但是，人工干预的方式删除只能依赖产品端发现过期数据后进行，在发现过期数据前给数据的处理造成麻烦和风险，并且，通过人工干预的方式删除过期数据人力成本大、效率低下，严重影响了知识图谱数据库的全面性和稳定性。
技术实现思路
本专利技术实施例提供了一种全量数据翻译方法、装置、服务器及存储介质，解决了现有知识图谱数据处理系统依赖产品端发现全量数据中的过期数据，且由人力删除过期数据导致的维护成本过高的问题，极大地提升了知识图谱数据库的全面性和稳定性。第一方面，本专利技术实施例提供了一种全量数据翻译方法，包括：按照预设时间间隔扫描预设存储单元中存储的各站点数据；比较同一站点下子链齐全的最大版本与各资源内容的版本；根据比较结果将所述站点的全量数据翻译为增量数据。第二方面，本专利技术实施例提供了一种全量数据翻译装置，包括：数据扫描模块，用于按照预设时间间隔扫描预设存储单元中存储的各站点数据；版本比较模块，用于比较同一站点下子链齐全的最大版本与各资源内容的版本；全量翻译模块，用于根据比较结果将所述站点的全量数据...
全量数据翻译方法、装置、服务器及存储介质

【技术保护点】
一种全量数据翻译方法，其特征在于，包括：按照预设时间间隔扫描预设存储单元中存储的各站点数据；比较同一站点下子链齐全的最大版本与各资源内容的版本；根据比较结果将所述站点的全量数据翻译为增量数据。

【技术特征摘要】
1.一种全量数据翻译方法，其特征在于，包括：按照预设时间间隔扫描预设存储单元中存储的各站点数据；比较同一站点下子链齐全的最大版本与各资源内容的版本；根据比较结果将所述站点的全量数据翻译为增量数据。2.根据权利要求1所述的方法，其特征在于，还包括：接收字节流数据；根据所述字节流数据的解码结果确定所述字节流数据的数据类型；如果所述字节流数据的数据类型为全量数据，下发所述全量数据至缓存单元，并将所述全量数据按照预设格式存入所述预设存储单元。3.根据权利要求2所述的方法，其特征在于，下发所述全量数据至缓存单元，包括：按照预设规则对所述字节流数据的解码结果进行协议转换后，下发至所述缓存单元。4.根据权利要求2所述的方法，其特征在于，在根据所述字节流数据的解码结果确定所述字节流数据的数据类型之后，还包括：如果所述字节流数据的数据类型为增量数据，按照预设规则对所述字节流数据的解码结果进行协议转换后，下发至所述缓存单元。5.根据权利要求2所述的方法，其特征在于，将所述全量数据按照预设格式存入所述预设存储单元，包括：将所述全量数据中的索引及子链信息存入所述预设存储单元的资源表中，作为对应站点下的一版数据；将所述全量数据中的资源地址存入所述预设存储单元的链接表中；将所述全量数据中的资源内容存入所述预设存储单元的内容表中，其中所述内容表中存储有所述资源内容对应的版本；其中，所述资源表通过子链字段与所述链接表关联，所述链接表通过资源地址字段与所述内容表关联。6.根据权利要求1所述的方法，其特征在于，按照预设时间间隔扫描预设存储单元中存储的各站点数据，包括：按照所述预设时间间隔扫描所述预设存储单元的资源表中各站点下的每个版本的数据；针对每个站点，根据所述站点下各版本的子链信息确定所述站点下子链齐全的版本数据，并在所述站点下所有子链齐全的版本数据中确定最大版本，作为所述站点的子链齐全的最大版本。7.根据权利要求1所述的方法，其特征在于，比较同一站点下子链齐全的最大版本与各资源内容的版本，包括：针对同一站点，扫描所述预设存储单元的内容表中对应于该站点的各资源内容的版本；分别比较该站点的各资源内容的版本与该站点的子链齐全的最大版本。8.根据权利要求1所述的方法，其特征在于，根据比较结果将所述站点的全量数据翻译为增量数据，包括：如果所述资源内容的版本小于所述子链齐全的最大版本，则确定对应的资源内容已过期；依据过期的资源内容生成增量删除包，并发送至缓存单元。9.根据权利要求8所述的方法，其特征在于，在确定对应的资源内容已过期之后，还包括：删除所述预设存储单...

【专利技术属性】
技术研发人员：熊灏，黎江，王军委，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人