一种基于政务服务大数据的公众办事关联推荐方法技术

技术编号：40590272 阅读：3 留言：0更新日期：2024-03-12 21:50

本发明专利技术公开了一种基于政务服务大数据的公众办事关联推荐方法，旨在为公众办事提供一种结合时间关联、积分关联的推荐方法。现有技术的推荐算法、方法通常是基于办事者的历史数据从而建立模型，以达到预测用户办理事项的潜在需求；但是政务事项数据量庞大、数据种类繁多、很多事项具有非常大的关联性，算法模型实施起来非常困难，推荐准确率难以保证。本发明专利技术基于政务大数据处理，克服政务事项业务复杂、数据项多、数据量大等问题，分析不同的办事者在前、后一定时间段内都办过其它相同的服务事项，采用时间关联排名求取事项关联积分，将积分值较高的事项推荐给办事者。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及政务大数据，尤其是一种基于政务服务大数据的公众办事关联推荐方法。

技术介绍

1、公众在进行行政审批、行政服务的办事过程中存在很多先办、后事的逻辑关系。但是政务服务部门在进行办事说明中只申明了所需的办事材料和办结材料，没有对办事的前后关系进行说明。而且很多表面看上去没有关联的事情在实际情况下具有一些隐性关联性，例如60岁退休的人员除了需办理退休领取养老公积金的手续，可能还要办理驾驶证换证事项，因为特殊机动车的准驾年龄限制是到60岁，满60岁要换成小型客车驾驶证。

2、目前，常用的推荐算法有很多，包含基于协同过滤思维的机器学习的推荐算法应用、基于关联关系的深度学习推荐算法等，例如：基于深度学习的个性化政务服务推荐方法和系统(专利技术公开号：cn107368549a)，这一类的算法往往只根据用户办理事项的历史数据建立模型，从而预测用户办理事项的潜在需求。但是政务事项数据量庞大、数据种类繁多、很多事项具有非常大的关联性，算法模型实施起来非常困难，推荐准确率难以保证。

技术实现思路

1、本申请针对上述现有技术中的缺点，提供一种基于政务服务大数据的公众办事关联推荐方法，从而克服政务事项业务复杂、数据项多、数据量大等问题，分析不同的办事者在前、后一定时间段内都办过其它相同的服务事项，采用时间关联排名算法求取事项关联积分，将积分值较高的事项推荐给办事者。

2、本专利技术所采用的技术方案如下：

3、一种基于政务服务大数据的公众办事关联推荐方法，其包括如下步骤：

4、s1：对输入的历史办事行为数据进行脱敏和清洗；

5、s2：针对处理后的办事行为数据按照分片算法进行分片存储；

6、s3：对分片后的办事行为数据按每个来办人、来办时间进行排序；

7、s4：根据每个办理人前后办理两件事的时间跨度进行积分计算；

8、s5：对所有办理事项两两之间的积分从高到低排序；

9、s6：对当前办事人正在办理的事项积分查询，对积分较高的事项关系输出为推荐表。

10、进一步地，所述办事行为数据包括办事人身份标识、事项标识以及办事时间。

11、进一步地，步骤s1中所述的脱敏为针对办事人身份标识进行hash脱敏，形成办事人hash码(h)，计算h的算法为：

12、h＝s[0]*31^(n-1)+s[1]*31^(n-2)+...+s[n-1]；

13、其中：s＝办事人身份标识字符串；n＝s的字符数量；h为算出的hash码，h为int型，为后面步骤数据分片提供依据；

14、进一步地，步骤s2中所述分片是基于办事人hash码(h)进行统计，得到hc[n]，其中n为h的个数；根据hc[n]进行分片，分片原则根据同时、同一h的办事数量存储到一个片中；那么每个片的hc[i]总数si的分片算法为：

15、

16、其中m为设置的每个分片存放的办理事项的数量，决定每个分片的大小；图4和图6中符号hcn为hc[n]的第n个哈希值。

17、进一步地，步骤s3中所述排序是根据办事人hash码(h)、办事时间进行从小到大排序。

18、进一步地，步骤s4中所述积分的计算方法是基于hash码(h)、办事时间对两个事项标识计算积分，积分w的计算方法为：

19、w＝∑(1-abs(days(d1-d2))/30*dw)

20、其中d1、d2为同一办事人办过的任意两个不同事项的办理时间；abs()是绝对值函数；dw为积分衰减因子，默认为0.08；

21、进一步地，经所述步骤s4，输出积分数据，内容为前置事项标识、后置事项标识、积分值，并按前置事项标识进行分片存储，输出数据存储为积分数据1。

22、进一步地，对每个积分分片数据去除积分值为0的数据；根据前置事项标识、后置事项标识、积分值进行由大到小排序；合并所有分片排序后的数据并输出，输出数据存储在积分数据2。

23、进一步地，所述步骤s6，当有用户正在办理具体的政务事项，通过正在办理的事项标识对应查询积分数据2的内容；根据前置事项标识保留积分前x位数量的数据作为事项推荐数据，并输出推荐数据到业务库中供应用访问。

24、本专利技术的有益效果如下：

25、相对现有技术，现有技术的推荐算法、方法通常是基于办事者的历史数据从而建立模型，以达到预测用户办理事项的潜在需求。但是政务事项数据量庞大、数据种类繁多、很多事项具有非常大的关联性，算法模型实施起来非常困难，推荐准确率难以保证。

26、本专利技术基于政务大数据处理，克服政务事项业务复杂、数据项多、数据量大等问题，分析不同的办事者在前、后一定时间段内都办过其它相同的服务事项，采用时间关联排名算法求取事项关联积分，将积分值较高的事项推荐给办事者。

本文档来自技高网...

【技术保护点】

1.一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：包括如下步骤：

2.如权利要求1所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：所述办事行为数据包括办事人身份标识、事项标识以及办事时间。

3.如权利要求2所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：步骤S1中所述的脱敏为针对办事人身份标识进行Hash脱敏，形成办事人Hash码(H)，计算H的算法为：

4.如权利要求3所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：步骤S2中所述分片是基于办事人Hash码(H)进行统计，得到HC[n]，其中n为H的个数；根据HC[n]进行分片，分片原则根据同时、同一H的办事数量存储到一个片中；每个片的HC[i]总数Si的分片算法为：

5.如权利要求1所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：步骤S3中所述排序是根据办事人Hash码(H)、办事时间进行从小到大排序。

6.如权利要求1所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：步骤S4中

7.如权利要求6所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：经所述步骤S4，输出积分数据，内容为前置事项标识、后置事项标识、积分值，并按前置事项标识进行分片存储，输出数据存储为积分数据1。

8.如权利要求7所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：对每个积分分片数据去除积分值为0的数据；根据前置事项标识、后置事项标识、积分值进行由大到小排序；合并所有分片排序后的数据并输出，输出数据存储在积分数据2。

9.如权利要求8所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：所述步骤S6，当有用户正在办理具体的政务事项，通过正在办理的事项标识对应查询积分数据2的内容；根据前置事项标识保留积分前x位数量的数据作为事项推荐数据，并输出推荐数据到业务库中供应用访问。

...

【技术特征摘要】

1.一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：包括如下步骤：

3.如权利要求2所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：步骤s1中所述的脱敏为针对办事人身份标识进行hash脱敏，形成办事人hash码(h)，计算h的算法为：

4.如权利要求3所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：步骤s2中所述分片是基于办事人hash码(h)进行统计，得到hc[n]，其中n为h的个数；根据hc[n]进行分片，分片原则根据同时、同一h的办事数量存储到一个片中；每个片的hc[i]总数si的分片算法为：

5.如权利要求1所述的一种基于政务服务大数据的公众办事关联推荐方法，其特征在于：步骤s3中所述排序是根据办事人hash码(h)、办事时间进行从小到大排序。

6.如权利要求1...

【专利技术属性】
技术研发人员：陈松，王嘉宁，李文峰，
申请(专利权)人：江苏中科惠软信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人