一种基于数据挖掘的政策信息推送系统技术方案

技术编号:37433973 阅读:9 留言:0更新日期:2023-05-05 19:48
本发明专利技术提供一种基于数据挖掘的政策信息推送系统。一种基于数据挖掘的政策信息推送系统包括:企业信息采集模块、企业数据采集模块、企业信息处理模块、政策搜索模块、赋权排序模块、政策获取模块、推送模块和推送反馈模块。本发明专利技术通过对政策类别进行赋权,根据权重大小确定政策信息推送的优先级,能够使用户第一时间获取到关联性和兴趣度较高的政策信息,增强信息推送的精确度,将政策类别划分等级,确定政策信息的推送周期,推送周期根据不同等级政策下发时间进行动态调整,增强了政策推送的时效性。性。性。

【技术实现步骤摘要】
一种基于数据挖掘的政策信息推送系统


[0001]本专利技术涉及信息推送
,更具体的说,它涉及一种基于数据挖掘的政策信息推送系统。

技术介绍

[0002]政策信息服务为企业提供政策信息的检索、推送、订阅等服务。现有政策信息推送系统对政策进行分类,企业用户根据企业的需求订阅感兴趣的政策类别,平台根据企业用户订阅的政策类别,对企业进行政策推送。
[0003]现有信息推送系统,政策信息推送的优先级模糊,用户容易忽略推送的重点政策信息。当用户忽略重点信息后,系统不会进行再次推送,导致用户无法第一时间获取到有关政策信息,政策信息推送的时效性大大降低。随时间的推移,企业的政策需求也会发生变化,原先信息推送的政策类别与企业用户需求的关联度下降,导致政策推送的准确度降低。

技术实现思路

[0004]本专利技术提供一种基于数据挖掘的政策信息推送系统,通过对政策类别进行赋权,根据权重大小确定政策信息推送的优先级,能够使用户第一时间获取到关联性和兴趣度最高的政策信息,增强信息推送的精确度;
[0005]为实现上述技术方案,本专利技术提供一种基于数据挖掘的政策信息推送系统,包括:
[0006]企业信息采集模块,用于响应企业用户操作,获取该企业用户的企业信息和企业用户对应的兴趣政策类别;
[0007]企业数据采集模块,用于根据企业信息采集对应的企业数据,企业数据包括企业最新动态和经营状况信息,企业数据以文本形式存在;
[0008]企业信息处理模块,用于通过TF

IDF算法对企业数据进行分解过滤,提取企业动态关键词,获取同一政策类别企业动态关键词的出现次数,根据企业动态关键词匹配对应的政策类别;
[0009]政策搜索模块,用于响应企业用户操作,获取该企业用户搜索词条对应的政策类别和对应类别的浏览时长;
[0010]赋权排序模块,用于根据企业用户对应的兴趣政策类别、企业动态关键词对应的政策类别和企业用户搜索词条对应的政策类别情况确定政策类别的推送优先级;
[0011]政策获取模块,用于获取最新政策信息,并将其分为不同的政策类别进行储存;
[0012]推送模块,用于根据政策类别的推送优先级向企业用户推送政策信息;
[0013]推送反馈模块,用于获取推送后的企业用户的行为信息,并调整政策类别的推送优先级。
[0014]优选地,赋权排序模块中确定政策推送优先级排序的步骤如下:
[0015]S1:分别建立企业信息采集模块中企业用户对应的兴趣政策类别、企业动态关键词匹配对应的政策类别和企业用户搜索词条对应的政策类别集合,对三个集合取并集,对
并集集合内的政策集合进行编号,编号为i,i=1、2

n;
[0016]S2:对所有并集集合内的政策类别进行赋权,其第一权重参数为q
1i
,第一次政策信息推送前,并集集合内属于企业用户对应的兴趣政策类别的第一权重参数q
1i
=q
10
,并集集合内不属于企业用户对应的兴趣政策类别的第一权重参数q
1i
=0;
[0017]S3:根据同种政策类别中企业动态关键词出现的次数对进行赋权,权重参数的计算公式为:
[0018]q
2i
=β
i
q
20
[0019][0020]其中,q
2i
为企业动态关键词对应的政策类别的第二权重参数,β
i
为第i种政策类别中企业动态关键词出现的次数v
i
与企业动态关键词总数的比值,q
20
为第二权重基础参数;
[0021]S4:根据该企业用户搜索词条对应的政策类别的浏览时长对该企业用户搜索词条对应的政策类别进行赋权,权重参数计算公式为:
[0022]q
3i
=λ
i
q
30
[0023][0024]其中,q
3i
为企业用户搜索词条对应政策类别的第三权重参数,λ
i
为该企业用户浏览第i种政策类别时长t
i
与浏览总时长的比值,q
30
为第三权重基础参数;
[0025]S5:对上述三种权重参数进行加权处理,得到该政策类别的综合权重参数,计算公式为:
[0026]w
i
=Aq
1i
+Bq
2i
+Cq
3i
[0027]其中A、B和C分别为q
1i
、q
2i
和q
3i
的权重参数系数;
[0028]S6:根据政策类别的综合权重参数w
i
大小对政策类别进行递减排序,并根据排序对政策类别进行重新编号,编号为i,i=1、2

n,政策类别的综合权重参数排序即为政策类别推送的优先级排序;
[0029]S7:建立政策类别编号i与其对应综合权重参数w
i
一一映射的二维数据集,即{(i,w
i
)}。
[0030]优选地,推送模块包括有:
[0031]推送周期确定单元,用于根据政策类别的权重参数大小将政策类别划分为四个等级,根据政策获取模块获取到不同等级的政策确定政策信息的推送周期;
[0032]推送政策整合单元,用于整合推送周期结束时需要推送的政策类别;
[0033]推送单元,用于向企业用户推送整合好的政策信息。
[0034]优选地,推送周期为相邻两次政策信息推送的间隔时间,推送模块中的推送周期确定单元包括如下步骤:
[0035]T1:通过依次比较w
i
与α
k
的大小,确定编号为i的政策类别的等级,其中α
k
政策类别的临界权重参数,k为1、2、3,具体为:
[0036]当w
i
≥α1时,w
i
对应的政策类别被划分为第一等级;
[0037]当α1>w
i
≥α2时,w
i
对应的政策类别被划分为第二等级;
[0038]当α2>w
i
≥α3时,w
i
对应的政策类别被划分为第三等级;
[0039]当α3>w
i
时,w
i
对应的政策类别被划分为第四等级;
[0040]T2:根据政策获取模块获取到不同等级的政策类别的政策,确定推送周期,具体确定方法如下:
[0041]T2.1:基础推送周期为T0;
[0042]T2.2:政策获取模块获取到任一第一等级政策类别内的新政策后,结束当前推送周期,对当前推送周期获取的政策信息进行整合;
[0043]T2.3:政策获取模块获取到两条第二等级政策类别内的新政策后,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于数据挖掘的政策信息推送系统,其特征在于,包括:企业信息采集模块,用于响应企业用户操作,获取该企业用户的企业信息和企业用户对应的兴趣政策类别;企业数据采集模块,用于根据企业信息采集对应的企业数据,企业数据包括企业最新动态和经营状况信息,企业数据以文本形式存在;企业信息处理模块,用于通过TF

IDF算法对企业数据进行分解过滤,提取企业动态关键词,获取同一政策类别企业动态关键词的出现次数,根据企业动态关键词匹配对应的政策类别;政策搜索模块,用于响应企业用户操作,获取该企业用户搜索词条对应的政策类别和对应类别的浏览时长;赋权排序模块,用于根据企业用户对应的兴趣政策类别、企业动态关键词对应的政策类别和企业用户搜索词条对应的政策类别情况确定政策类别的推送优先级;政策获取模块,用于获取最新政策信息,并将其分为不同的政策类别进行储存;推送模块,用于根据政策类别的推送优先级向企业用户推送政策信息;推送反馈模块,用于获取推送后的企业用户的行为信息,并调整政策类别的推送优先级;推送模块包括有:推送周期确定单元,用于根据政策类别的权重参数大小将政策类别划分为四个等级,根据政策获取模块获取到不同等级的政策确定政策信息的推送周期;推送政策整合单元,用于整合推送周期结束时需要推送的政策类别;推送单元,用于向企业用户推送整合好的政策信息。2.根据权利要求1所述的一种基于数据挖掘的政策信息推送系统,其特征在于,赋权排序模块中确定政策推送优先级排序的步骤如下:S1:分别建立企业信息采集模块中企业用户对应的兴趣政策类别、企业动态关键词匹配对应的政策类别和企业用户搜索词条对应的政策类别集合,对三个集合取并集,对并集集合内的政策集合进行编号,编号为i,i=1、2

n;S2:对所有并集集合内的政策类别进行赋权,其第一权重参数为q
1i
,第一次政策信息推送前,并集集合内属于企业用户对应的兴趣政策类别的第一权重参数q
1i
=q
10
,并集集合内不属于企业用户对应的兴趣政策类别的第一权重参数q
1i
=0;S3:根据同种政策类别中企业动态关键词出现的次数对进行赋权,权重参数的计算公式为:q
2i
=β
i
q
20
其中,q
2i
为企业动态关键词对应的政策类别的第二权重参数,β
i
为第i种政策类别中企业动态关键词出现的次数v
i
与企业动态关键词总数的比值,q
20
为第二权重基础参数;S4:根据该企业用户搜索词条对应的政策类别的浏览时长对该企业用户搜索词条对应的政策类别进行赋权,权重参数计算公式为:q
3i
=λ
i
q
30
其中,q
3i
为企业用户搜索词条对应政策类别的第三权重参数,λ
i
为该企业用户浏览第i种政策类别时长t
i
与浏览总时长的比值,q
30
为第三权重基础参数;S5:对上述三种权重参数进行加权处理,得到该政策类别的综合权重参数,计算公式为:w
i
=Aq
1i
+Bq
2i
+Cq
3i
其中A、B和C分别为q
1i
、q
2i
和q
3i
的权重参数系数;S6:根据政策类别的综合...

【专利技术属性】
技术研发人员:赖良刘超成
申请(专利权)人:和容尚行杭州信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1