一种大规模跨区域的流批处理一体化服务方法技术

技术编号:39331339 阅读:25 留言:0更新日期:2023-11-12 16:07
本发明专利技术公开了一种大规模跨区域的流批处理一体化服务方法,具体涉及不动产登记信息处理技术领域;通过综合考虑变更频繁隐匿系数和登记效率指数,并将其归一化处理得到登记综合表现评估系数,在设定的更新判断阈值范围内进行比较,智能地生成数据处理方式的信号,从而更好地满足不动产登记数据的处理需求;通过获取网络关注值并计算实时批处理间隔,可以智能地调节批处理的时间间隔,可以更及时地处理和更新这些受关注的不动产登记数据,确保数据的准确性和实时性;通过智能调节批处理时间间隔,可以更有效地利用计算资源和存储空间,有助于提升不动产登记数据中心的综合运营能力和数据处理效率。和数据处理效率。和数据处理效率。

【技术实现步骤摘要】
一种大规模跨区域的流批处理一体化服务方法


[0001]本专利技术涉及不动产登记信息处理
,更具体地说,本专利技术涉及一种大规模跨区域的流批处理一体化服务方法。

技术介绍

[0002]批处理是指对有界的数据流处理,如存量数据抽取,一次性将存量数据进行批量抽取入库。采用批处理技术解决存量数据入库问题。流处理是指对无界的数据流处理,如增量数据捕获、操作日志捕获,只要上游还在生产数据,数据输入永远不会结束,应用就得必须持续不断地对到达的数据进行处理。
[0003]不动产登记数据是关于特定地区内的不动产的变更信息和所有权信息的记录。不动产登记数据中心在对若干个区域的不动产登记数据进行处理时,其数据处理方式包括批处理和流处理,若对不动产登记数据单独使用批处理可能导致处理延迟高、数据更新滞后、实时监测困难;若对不动产登记数据单独使用流处理,由于不动产登记数据是跨区域且数据规模大,需要消耗较高的处理资源、复杂处理需求大、存在数据准确性风险,不能根据不动产登记数据的实际情况信息对不同区域来灵活地采用不同的不动产登记数据的数据处理方式。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种大规模跨区域的流批处理一体化服务方法,其特征在于,包括如下步骤:步骤S1:采集不动产登记变更信息,计算总交易占比,根据聚类算法计算近期不动产登记变更占比,通过总交易占比和近期不动产登记变更占比计算变更频繁隐匿系数;步骤S2:采集不动产登记效率信息,根据不动产登记效率信息计算登记效率指数;步骤S3:将变更频繁隐匿系数和登记效率指数通过归一化处理获得登记综合表现评估系数;通过将登记综合表现评估系数和更新判断阈值进行比较,生成流处理信号或批处理信号;步骤S4:采集区域热度信息,根据区域热度信息计算网络关注值,对于生成批处理信号的不动产登记数据,通过网络关注值对初始批处理时间处理间隔进行调节,计算实时批处理间隔。2.根据权利要求1所述的一种大规模跨区域的流批处理一体化服务方法,其特征在于:在步骤S1中,变更频繁隐匿系数的获取方法为:设定时间区间U,实时获取该区域在时间区间U内的不动产登记变更次数;将该区域在时间区间U内的不动产登记变更次数和时间区间U对应的时间长度的比值标记为总变更占比;获取在时间区间U内不动产登记变更对应的时间点;使用聚类算法将在时间区间U内不动产登记变更对应的时间点划分为最近不动产登记变更时间点集合和时间较远不动产登记变更时间点集合,得到最近不动产登记变更时间点集合的最近不动产登记变更时间点的数量和时间较远不动产登记变更时间点集合的时间较远的不动产登记变更时间点的数量;最近不动产登记变更时间点集合的最近不动产登记变更时间点的数量加上时间较远不动产登记变更时间点集合的时间较远的不动产登记变更时间点的数量为总不动产登记变更时间点数量;将最近不动产登记变更时间点集合内的最近不动产登记变更时间点的数量与总不动产登记变更时间点数量的比值标记为近期不动产登记变更占比;根据总变更占比和近期不动产登记变更占比,计算变更频繁隐匿系数,其表达式为:其中Fh、fj、ut、zj、zd分别为变更频繁隐匿系数、该区域在时间区间U内的不动产登记变更次数、时间区间U对应的时间长度、最近不动产登记变更时间点集合内的最近不动产登记变更时间点的数量以及总不动产登记变更时间点数量。3.根据权利要求2所述的一种大...

【专利技术属性】
技术研发人员:朱剑郑智华马骁驰宾元菲陈广雪李茜毛莹莹马愉富吴柱罗晓梅汪剑章韦昭宁黄丽英
申请(专利权)人:广西职业师范学院北京超图软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1