一种政策数据智能推荐方法及系统技术方案

技术编号:30316949 阅读:19 留言:0更新日期:2021-10-09 23:16
本发明专利技术实施例涉及智能推荐技术领域,公开了一种政策数据智能推荐方法及系统,该方法包括:获取政策数据及用户数据,基于政策数据及用户数据分别构造政策画像及用户画像,并计算所包含若干子项对应的子相似度,针对若干子项对应的子相似度进行加权求和得到总相似度,再对总相似度进行降序排序,向特定用户输出符合预设概率阈值的政策数据。相比人工进行政策数据的检索,本发明专利技术实施例基于自然语言处理及深度学习算法,对政策数据及用户数据进行信息抽取并构造政策画像及用户画像,据此计算总相似度,再降序排序筛查出与用户相适配的政策数据,向用户进行精准推荐,从而可排除众多无效信息,确保用户可及时获取到有效的政策数据,提高办事效率。提高办事效率。提高办事效率。

【技术实现步骤摘要】
一种政策数据智能推荐方法及系统


[0001]本专利技术涉及智能推荐
,尤其涉及一种政策数据智能推荐方法及系统。

技术介绍

[0002]随着电子政务的推行,各政府部门与机关单位均将政策数据发布于电子政务平台上,用户通过电子政务平台进行政策数据的检索与获取,从而减少了纸质文件与线下流程。
[0003]在实际应用中,用户通常仅需符合自身行业与企业规模的政策文件,而长期持续地更新使得电子政务平台上积累了海量的政策数据,且政策数据在获取途径上未进行明确的区分,这使得用户难以获得对自己有用的信息,降低了办事效率,电子政务的优势无法得到体现。

技术实现思路

[0004]本专利技术实施例公开一种政策数据智能推荐方法及系统,基于自然语言处理及深度学习算法,对政策数据及用户数据进行信息抽取并构造政策画像及用户画像,据此计算总相似度,筛查出与用户相适配的政策数据并向用户进行精准推荐,排除众多无效信息,确保用户可及时获取到有效的政策数据,提高办事效率。
[0005]本专利技术实施例的第一方面公开了一种政策数据智能推荐方法,所述方法包括:
[0006]获取政策数据及用户数据;
[0007]基于所述政策数据及所述用户数据,分别构造政策画像及用户画像;
[0008]计算所述政策画像及所述用户画像所包含若干子项对应的子相似度;
[0009]针对所述若干子项对应的子相似度进行加权求和,得到总相似度;
[0010]对所述总相似度进行降序排序,向特定用户输出符合预设概率阈值的政策数据。
[0011]作为一种可选的实施方式,在本专利技术实施例的第一方面中,所述基于所述政策数据及所述用户数据,分别构造政策画像及用户画像,包括:
[0012]基于自然语言处理及循环神经网络对所述政策数据及所述用户数据进行信息提取,得到对应于所述政策数据及所述用户数据的若干子项,所述若干子项为半结构化数据;
[0013]其中,所述自然语言处理包括自研中文分词算法模型、公务文书词库、行业词库、领域词库、关键词匹配模型及隐马尔科夫模型;所述政策数据对应的子项包括公文类型及关键词信息;所述用户数据对应的子项包括区划信息、行业信息、领域信息及企业信息;
[0014]对所述半结构化数据进行数据结构化处理,通过抽取关键词构造得到所述政策数据对应的政策画像及所述用户数据对应的用户画像。
[0015]作为一种可选的实施方式,在本专利技术实施例的第一方面中,所述计算所述政策画像及所述用户画像所包含若干子项对应的子相似度,包括:
[0016]基于行政区划层级信息、所述区划信息及所述关键词信息,计算得到所述政策数据与所述用户数据的区划相似度;
[0017]基于行业代码层级信息及所述行业信息,计算得到所述政策数据的行业相似度及
所述用户数据的行业相似度;
[0018]基于企业规模量化信息及所述企业信息,计算得到所述用户数据相对所述政策数据的企业规模相似度;
[0019]基于所述政策画像及所述用户画像,采用等值映射输出扶持领域相似度、企业类型相似度、知识产权相似度及融资阶段相似度。
[0020]作为一种可选的实施方式,在本专利技术实施例的第一方面中,所述针对所述若干子项对应的子相似度进行加权求和,得到总相似度,包括:
[0021]针对所述政策画像及所述用户画像中每一子项,依据专家规则对应设定子项权重值;
[0022]基于所述子项权重值对所述若干子项对应的子相似度进行加权求和,得到所述总相似度。
[0023]作为一种可选的实施方式,在本专利技术实施例的第一方面中,所述方法还包括:
[0024]监测电子政务平台中的政策数据发布页面;
[0025]当监测到所述政策数据发布页面发生更新时,获取新增政策数据;
[0026]计算所述新增政策数据相对每一用户画像的总相似度;
[0027]基于所述新增政策数据相对每一用户画像的总相似度进行降序排序,向符合所述预设概率阈值的用户画像所对应的用户推送所述新增政策数据。
[0028]本专利技术实施例的第二方面公开了一种政策数据智能推荐方法,所述系统包括:
[0029]数据获取单元,用于获取政策数据及用户数据;
[0030]画像构造单元,用于基于所述政策数据及所述用户数据,分别构造政策画像及用户画像;
[0031]第一计算单元,用于计算所述政策画像及所述用户画像所包含若干子项对应的子相似度;
[0032]第二计算单元,用于针对所述若干子项对应的子相似度进行加权求和,得到总相似度;
[0033]匹配输出单元,用于对所述总相似度进行降序排序,向特定用户输出符合预设概率阈值的政策数据。
[0034]作为一种可选的实施方式,在本专利技术实施例的第二方面中,所述画像构造单元包括:
[0035]提取子单元,用于基于自然语言处理及循环神经网络对所述政策数据及所述用户数据进行信息提取,得到对应于所述政策数据及所述用户数据的若干子项,所述若干子项为半结构化数据;
[0036]其中,所述自然语言处理包括自研中文分词算法模型、公务文书词库、行业词库、领域词库、关键词匹配模型及隐马尔科夫模型;所述政策数据对应的子项包括公文类型及关键词信息;所述用户数据对应的子项包括区划信息、行业信息、领域信息及企业信息;
[0037]结构化子单元,用于对所述半结构化数据进行数据结构化处理,通过抽取关键词构造得到所述政策数据对应的政策画像及所述用户数据对应的用户画像。
[0038]作为一种可选的实施方式,在本专利技术实施例的第二方面中,所述第一计算单元包括:
[0039]第一计算子单元,用于基于行政区划层级信息、所述区划信息及所述关键词信息,计算得到所述政策数据与所述用户数据的区划相似度;
[0040]第二计算子单元,用于基于行业代码层级信息及所述行业信息,计算得到所述政策数据的行业相似度及所述用户数据的行业相似度;
[0041]第三计算子单元,用于基于企业规模量化信息及所述企业信息,计算得到所述用户数据相对所述政策数据的企业规模相似度;
[0042]第四计算子单元,用于基于所述政策画像及所述用户画像,采用等值映射输出扶持领域相似度、企业类型相似度、知识产权相似度及融资阶段相似度。
[0043]作为一种可选的实施方式,在本专利技术实施例的第二方面中,所述第二计算单元包括:
[0044]权重设定子单元,用于针对所述政策画像及所述用户画像中每一子项,依据专家规则对应设定子项权重值;
[0045]加权求和子单元,用于基于所述子项权重值对所述若干子项对应的子相似度进行加权求和,得到所述总相似度。
[0046]作为一种可选的实施方式,在本专利技术实施例的第二方面中,所述系统还包括:
[0047]监测单元,用于监测电子政务平台中的政策数据发布页面;
[0048]所述数据获取单元,还用于在监测到所述政策数据发布页面发生更新时,获取本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种政策数据智能推荐方法,其特征在于,所述方法包括:获取政策数据及用户数据;基于所述政策数据及所述用户数据,分别构造政策画像及用户画像;计算所述政策画像及所述用户画像所包含若干子项对应的子相似度;针对所述若干子项对应的子相似度进行加权求和,得到总相似度;对所述总相似度进行降序排序,向特定用户输出符合预设概率阈值的政策数据。2.根据权利要求1所述的方法,其特征在于,所述基于所述政策数据及所述用户数据,分别构造政策画像及用户画像,包括:基于自然语言处理及循环神经网络对所述政策数据及所述用户数据进行信息提取,得到对应于所述政策数据及所述用户数据的若干子项,所述若干子项为半结构化数据;其中,所述自然语言处理包括自研中文分词算法模型、公务文书词库、行业词库、领域词库、关键词匹配模型及隐马尔科夫模型;所述政策数据对应的子项包括公文类型及关键词信息;所述用户数据对应的子项包括区划信息、行业信息、领域信息及企业信息;对所述半结构化数据进行数据结构化处理,通过抽取关键词构造得到所述政策数据对应的政策画像及所述用户数据对应的用户画像。3.根据权利要求2所述的方法,其特征在于,所述计算所述政策画像及所述用户画像所包含若干子项对应的子相似度,包括:基于行政区划层级信息、所述区划信息及所述关键词信息,计算得到所述政策数据与所述用户数据的区划相似度;基于行业代码层级信息及所述行业信息,计算得到所述政策数据的行业相似度及所述用户数据的行业相似度;基于企业规模量化信息及所述企业信息,计算得到所述用户数据相对所述政策数据的企业规模相似度;基于所述政策画像及所述用户画像,采用等值映射输出扶持领域相似度、企业类型相似度、知识产权相似度及融资阶段相似度。4.根据权利要求3所述的方法,其特征在于,所述针对所述若干子项对应的子相似度进行加权求和,得到总相似度,包括:针对所述政策画像及所述用户画像中每一子项,依据专家规则对应设定子项权重值;基于所述子项权重值对所述若干子项对应的子相似度进行加权求和,得到所述总相似度。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:监测电子政务平台中的政策数据发布页面;当监测到所述政策数据发布页面发生更新时,获取新增政策数据;计算所述新增政策数据相对每一用户画像的总相似度;基于所述新增政策数据相对每一用户画像的总相似度进行降序排序,向符合所述预设概率阈值的用户画像所对应的用户推送所述新增政策数据。6.一种政策数据智能推荐系统,其特征在于,所述系统包括:数据获取单元,用于获取政策数据及用户数据;画像构...

【专利技术属性】
技术研发人员:黄裕福谢健伟钱丙健
申请(专利权)人:广州政企互联科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1