政策信息推送方法、装置及电子设备制造方法及图纸

技术编号:38767218 阅读:12 留言:0更新日期:2023-09-10 10:40
本发明专利技术涉及信息处理技术领域,提供了一种政策信息推送方法、装置及电子设备。上述方法包括:获取政策信息、人口信息和企业信息;从政策信息中提取关键词,计算每个关键词的权重值,将关键词标记为政策标签,将关键词的权重值设置为政策标签的权重;根据人口信息和政策标签构建个人用户画像标签体系,根据企业信息和政策标签构建企业用户画像标签体系;获取目标政策信息的第二政策标签,根据第二政策标签与用户的第一政策标签计算目标政策信息与用户所享受过的政策信息之间的相似度;向相似度超过阈值的目标用户推送目标政策信息。本发明专利技术实施例能够主动向个人用户或企业用户推送与该用户所享受过的政策信息相似的政策信息,提高政策信息获取效率。高政策信息获取效率。高政策信息获取效率。

【技术实现步骤摘要】
政策信息推送方法、装置及电子设备


[0001]本专利技术涉及信息处理
,具体涉及一种政策信息推送方法、装置及电子设备。

技术介绍

[0002]目前往往是在政府官网或第三方政策平台搜索政策,面对海量政策,用户要精准获取可享受政策需付出较大时间成本或一定资金成本。相关技术中主要通过提取政策标签以及用户(企业或个人)的画像标签,再将政策要素与用户(企业或个人)的画像标签进行匹配的方式,为用户(企业或个人)推送可能符合申报条件的政策。
[0003]由于政策标签以及用户(企业或个人)的画像标签需要人工标注,因此相关技术的工作量较大。另外,一个政策中涉及的申报事项多,每一个申报事项对申报对象的要求并不一致,且同一申报事项的多个政策标签的交并关系复杂,通过将政策标签与用户(企业或个人)的画像标签直接匹配的方式,其准确性难以保证。

技术实现思路

[0004]为克服相关技术中存在的问题,本专利技术实施例提供了一种政策信息推送方法、装置及电子设备。
[0005]本专利技术是通过如下技术方案实现的:
[0006]第一方面,本专利技术实施例提供了一种政策信息推送方法,包括:
[0007]获取政策信息、人口信息和企业信息;
[0008]从所述政策信息中提取关键词,计算每个关键词的权重值,将关键词标记为政策标签,将关键词的权重值设置为政策标签的权重;
[0009]根据人口信息和政策标签构建个人用户画像标签体系,根据企业信息和政策标签构建企业用户画像标签体系,所述个人用户画像标签体系和所述企业用户画像标签体系均包含多个用户,每个用户对应一个用户类型和至少一个画像标签,所述至少一个画像标签中包含一个第一政策标签,该第一政策标签表征用户所享受过的政策信息;
[0010]获取目标政策信息的第二政策标签,根据第二政策标签与各个用户的第一政策标签计算目标政策信息与用户所享受过的政策信息之间的相似度;
[0011]向相似度超过阈值的目标用户发送所述目标政策信息。
[0012]上述政策信息推送方法,获取政策信息、人口信息和企业信息;从政策信息中提取关键词,计算每个关键词的权重值,将关键词标记为政策标签,将关键词的权重值设置为政策标签的权重;根据人口信息和政策标签构建个人用户画像标签体系,根据企业信息和政策标签构建企业用户画像标签体系;获取目标政策信息的第二政策标签,根据第二政策标签与用户的第一政策标签计算目标政策信息与用户所享受过的政策信息之间的相似度;向相似度超过阈值的目标用户推送目标政策信息。本专利技术实施例能够主动向个人用户或企业用户推送与该用户所享受过的政策信息相似的政策信息,相对于用户手动搜索政策信息,
能够大大提高政策信息的获取效率。
[0013]基于第一方面,在一些实施例中,所述获取历史政策信息、人口信息和企业信息,包括:
[0014]通过公开政务类网站或第三方政策平台获取所述政策信息,通过政务系统获取所述人口信息,通过企业网站或者第三方网站获取所述企业信息;
[0015]对所述政策信息、所述人口信息和所述企业信息进行数据去重、数据补全、数据萃取和数据融合处理;
[0016]其中,所述数据去重为:设定数据重复判别规则以及合并策略和清除策略,对所述政策信息、所述人口信息和所述企业信息进行重复性辨别,并对重复数据进行合并或清除处理;
[0017]所述数据补全为:获取已获取到的数据之间的关联关系和规律,基于该关联关系和规律对缺失数据进行补全;
[0018]所述数据萃取为:通过查询、过滤或转换规则从所述政策信息、所述人口信息和所述企业信息中提取所需数据;
[0019]所述数据融合为:根据业务需求定义数据表、数据表的数据项以及每个数据项的数据来源,根据数据项的数据来源将不同来源的数据进行融合。
[0020]基于第一方面,在一些实施例中,所述从所述历史政策信息中提取关键词,计算每个关键词的权重值,将关键词标记为政策标签,将关键词的权重值设置为政策标签的权重,包括:
[0021]对所述政策信息按句子进行文本分割、分词、词性标注和去停用词处理,得到关键词集合;
[0022]将所述关键词集合构成节点集合,一个关键词对应一个节点,根据关键词的共现关系构建边集;
[0023]通过w
ji
=cos(i,j)*com(i,j)计算两个节点之间边的权重,w
ji
表示节点j和节点i之间边的权重,cos(i,j)为节点j和节点i的语义相似度,com(i,j)为节点j和节点i共现的次数;
[0024]通过计算节点V
i
的权重值,WS(V
i
)表示节点V
i
的权重值,In(V
i
)表示指向V
i
的节点集合,Out(V
j
)表示节点V
j
指向的节点集合,WS(V
j
)表示节点V
j
的权重值,d为阻尼系数;
[0025]按照节点的权重值大小关系进行排序,将节点的标签设置为政策标签,将节点的权重值设置为所述政策标签的权重。
[0026]基于第一方面,在一些实施例中,所述根据人口信息和政策标签构建个人用户画像标签体系,包括:
[0027]按照人口信息中年龄、种族、教育程度将人口群体划分为多类个人用户,从所述政策标签中筛选与人口相关的第一政策标签,将各类个人用户的用户类型设置为个人,将所述第一政策标签添加到相应的个人用户的画像标签中,得到所述个人用户画像标签系统;
[0028]所述根据企业信息和政策标签构建企业用户画像标签体系,包括:
[0029]按照成立时间、注册地、企业类型将企业群体划分为多类企业用户,从所述政策标签中筛选与企业相关的第二政策标签,将各类企业用户的用户类型设置为企业,将所述第二政策标签添加到相应的企业用户的画像标签中,得到所述企业用户画像标签系统。
[0030]基于第一方面,在一些实施例中,所述政策信息推送还包括:
[0031]将已享受过政策信息的个人用户或企业用户对应的政策标签作为训练样本训练机器学习模型,再采用训练后的机器学习模型从政策标签中筛选与人口相关的第一政策标签,以及与与企业相关的第二政策标签。
[0032]基于第一方面,在一些实施例中,所述获取目标政策信息的第二政策标签,根据第二政策标签与各个用户的第一政策标签计算目标政策信息与用户所享受过的政策信息之间的相似度,包括:
[0033]获取用户所享受过的政策信息和目标政策信息之间的标签集合Tag(A,B),A表示用户所享受过的政策信息,B表示目标政策信息;
[0034]根据标签集合Tag(A,B),分别构建政策A和政策B的标签向量V
A
和标签向量V
B
,标签向量V
A
和标签向量V
B
中每个元素的值为政策标签的权重,当政策标签本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种政策信息推送方法,其特征在于,包括:获取政策信息、人口信息和企业信息;从所述政策信息中提取关键词,计算每个关键词的权重值,将关键词标记为政策标签,将关键词的权重值设置为政策标签的权重;根据人口信息和政策标签构建个人用户画像标签体系,根据企业信息和政策标签构建企业用户画像标签体系,所述个人用户画像标签体系和所述企业用户画像标签体系均包含多个用户,每个用户对应一个用户类型和至少一个画像标签,所述至少一个画像标签中包含一个第一政策标签,该第一政策标签表征用户所享受过的政策信息;获取目标政策信息的第二政策标签,根据第二政策标签与各个用户的第一政策标签计算目标政策信息与用户所享受过的政策信息之间的相似度;向相似度超过阈值的目标用户推送所述目标政策信息。2.如权利要求1所述的政策信息推送方法,其特征在于,所述获取历史政策信息、人口信息和企业信息,包括:通过公开政务类网站或第三方政策平台获取所述政策信息,通过政务系统获取所述人口信息,通过企业网站或者第三方网站获取所述企业信息;对所述政策信息、所述人口信息和所述企业信息进行数据去重、数据补全、数据萃取和数据融合处理;其中,所述数据去重为:设定数据重复判别规则以及合并策略和清除策略,对所述政策信息、所述人口信息和所述企业信息进行重复性辨别,并对重复数据进行合并或清除处理;所述数据补全为:获取已获取到的数据之间的关联关系和规律,基于该关联关系和规律对缺失数据进行补全;所述数据萃取为:通过查询、过滤或转换规则从所述政策信息、所述人口信息和所述企业信息中提取所需数据;所述数据融合为:根据业务需求定义数据表、数据表的数据项以及每个数据项的数据来源,根据数据项的数据来源将不同来源的数据进行融合。3.如权利要求1所述的政策信息推送方法,其特征在于,所述从所述历史政策信息中提取关键词,计算每个关键词的权重值,将关键词标记为政策标签,将关键词的权重值设置为政策标签的权重,包括:对所述政策信息按句子进行文本分割、分词、词性标注和去停用词处理,得到关键词集合;将所述关键词集合构成节点集合,一个关键词对应一个节点,根据关键词的共现关系构建边集;通过w
ji
=cos(i,j)*com(i,j)计算两个节点之间边的权重,w
ji
表示节点j和节点i之间边的权重,cos(i,j)为节点j和节点i的语义相似度,com(i,j)为节点j和节点i共现的次数;通过计算节点V
i
的权重值,WS(V
i
)表示节点V
i
的权重值,In(V
i
)表示指向V
i
的节点集合,Out(V
j
)表示节点V
j
指向的节点集合,WS(V
j
)表示节点V
j
的权重值,d为阻尼系数;
按照节点的权重值大小关系进行排序,将节点的标签设置为政策标签,将节点的权重值设置为所述政策标签的权重。4.如权利要求1所述的政策信息推送方法,其特征在于,所述根据人口信息和政策标签构建个人用户画像标签体系,包括:按照人口信息中年龄、种族、教育程度将人口群体划分为多类个人用户,从所述政策标签中筛选与人口相关的第一政策标签,将各类个人用户的用户类型设置为个人,将所述第一政策标签添加到相应的个人用户的画像标签中,得到所述个人用户...

【专利技术属性】
技术研发人员:唐明盘浩军奉凡黄颖
申请(专利权)人:深圳中科闻歌科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1