基于大数据和人工智能的企业政策匹配度评估方法及系统技术方案

技术编号:35478178 阅读:15 留言:0更新日期:2022-11-05 16:27
本发明专利技术提供的基于大数据和人工智能的企业政策匹配度评估方法及系统,涉及大数据分析领域;其方法包括:收集企业各维度的企业数据;对企业数据进行预处理,包括数据清洗和归一化处理;根据多维企业数据标签系统对预处理后的企业数据标签化,获得标签化的企业标签数据;收集政府部门最新的政策数据;对政策数据进行预处理,包括政策数据清洗和规范政策内容;根据政策匹配维度对预处理后的政策数据标签化,生成政策标签数据;基于企业标签数据和政策标签数据建立标签匹配权重模型,计算企业与政策的匹配度;根据匹配度由高到低排序,输出匹配度最高的N条政策。本发明专利技术为企业政提供策申报建议,清晰化企业政策申报前景,达成政策发布的预期效果。的预期效果。的预期效果。

【技术实现步骤摘要】
基于大数据和人工智能的企业政策匹配度评估方法及系统


[0001]本专利技术涉及大数据分析
,具体涉及一种基于大数据和人工智能的企业政策匹配度评估方法及系统。

技术介绍

[0002]目前由于政策发布者发布政策内容比较标准化,普通企业用户很难理解政策具体细化规则,以及自己企业目前状态是不是符合政策细化规则。同时面对政府发布的大量各种政策,一般企业用户无法知道企业能申报哪些政策以及不同区级单位发布的政策是否可以同时申报。对于新出来的政策不清楚自己企业申报成功的概率有多高,导致企业错失许多可以申报政策,从而导致政策发布方发布政策预期效果降低,企业不能享受政策福利。
[0003]当前常规的政策推荐算法,主要基于企业用户浏览政策行为数据,推荐类似政策,没有综合考虑企业自身状态与政策的匹配度。即,现有技术中缺乏一种政策匹配推荐技术,能够根据企业工商信息、经营数据、往年企业申报政策数据等方面为企业与政策进行匹配,为企业找出能适用或申报的多个政策,为企业提供申报建议,让企业享受政策福利的同时,满足政策发布方发布政策预期效果。

技术实现思路

[0004]本专利技术目的在于提供一种基于大数据和人工智能的企业政策匹配度评估方法及系统,通过对收集的企业信息和政策信息标签化再进行标签匹配的方式实现企业信息与政策信息的关联,在不同维度将企业与所有政策匹配后进行加权排序,获得匹配度排序,根据排序为企业提供申报建议,让企业享受政策福利的同时,达成政策发布方发布政策的预期效果。
[0005]为达成上述目的,本专利技术提出如下技术方案:一种基于大数据和人工智能的企业政策匹配度评估方法,包括:
[0006]收集企业各维度的企业数据,包括企业工商信息、企业员工信息、企业资质信息、企业知识产权和成果项目转化信息、企业获得过的政策补贴及融资贷款信息、企业每年的资产及研发费用信息;
[0007]对企业数据进行预处理,包括数据清洗和归一化处理;
[0008]根据多维企业数据标签系统对预处理后的企业数据标签化,分别对每项企业数据进行标签分类,将各标签类别下的企业数据放入矩阵对象中,针对任一企业计算获得标签化的企业标签数据;
[0009]收集政府部门最新的政策数据;
[0010]对政策数据进行预处理,包括政策数据清洗和规范政策内容;
[0011]根据政策匹配维度对预处理后的政策数据标签化,针对每项政策生成一套政策标签数据;
[0012]基于企业标签数据和政策标签数据建立标签匹配权重模型,通过深度学习算法及
决策树算法匹配企业与政策的相同维度,并基于每个维度的权重,计算企业与政策的匹配度;
[0013]根据企业与政策的匹配度由高到低排序,输出匹配度最高的N条政策。
[0014]进一步的,所述对预处理后的企业数据标签化的标签项包括企业状态、注册地、参保人数、企业性质、所属行业、经营范围、企业资质、企业运营状态、研发投入和专利拥有度;
[0015]其中,企业数据包括企业基本工商信息、近5年每一年获得的贷款金额、融资数据、技术合同信息、项目申报信息、企业员工研究人员数量、学历占比、I类知识产权的数量、II类知识产权的数量、取得的资质认证和知识产权信息;
[0016]所述对企业数据预处理的过程为:对任一企业数据的内容,将中文含义的内容转换为数字表示或字典数据,并补全企业属于省市区信息和企业注册日期。
[0017]进一步的,所述对预处理后的政策数据标签化的标签项包括:
[0018]支持方式:保险补贴、贷款贴息、费用减免、降低成本、评选认定、其他、税收减免、政府投资、政策引导、政府引导基金、最高奖励、资金扶持、政策支持和资质荣誉;
[0019]适用企业类型:工业型企业、农业型企业、服务型企业、研究机构、科技企业、专精特新企业、对外贸易企业、批发企业、零售企业、物流运输企业、仓储企业;
[0020]适用人群:大学生创业、科技人员、高校毕业生、引进人才、退役军人、军烈属和残疾人;
[0021]企业规模:大型企业、中型企业和小微企业;
[0022]成立年限:1~3年、3~5年、5~10年和大于10年;
[0023]适用企业性质:个人独资企业、个体工商户、国有企业、合资企业、民营企业、外资企业、股份制企业;
[0024]政策主题:补助、场地、成果转化、创新、创业、金融、税收和中小企业;
[0025]行业:农、林、牧、渔业,采矿业,制造业,电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业,住宿和餐饮业,信息传输、软件和信息技术服务业,金融业,房地产业,租赁和商务服务业,科学研究和技术服务业,水利、环境和公共设施管理业,居民服务、修理和其他服务业,教育,卫生和社会工作,文化、体育和娱乐业,公共管理、社会保障和社会组织,国际组织;
[0026]产业类目:航空航天、电子信息、海洋产业、会展经济、科技服务业、绿色食品、其他传统产业、生活服务业、生物与新医药、文旅产业、新材料、现代金融、现代物流业、新经济、新能源及节能、医疗健康、资源与环境和装备制造;
[0027]所述对政策数据的预处理过程为:对于已经过申请时间的政策,放入历史政策库中;规范化政策的发布部门、政策等级,采用基于机器学习的语义分析算法从政策内容中提取申请时间并按时间格式规范;提取政策内容中明确说明的政策主题、支持方式、适用行业、适用人群、适用企业性质和适用企业规模;对任一政策形成标准政策申报模板。
[0028]进一步的,所述计算企业与政策匹配度的具体过程为:
[0029]基于深度学习算法与决策树算法,匹配企业满足政策标签数据的若干标签项;
[0030]确定企业满足的任一政策标签项的标签数量;
[0031]分别计算企业满足的任一政策标签项的权限得分;
[0032]根据预设的政策标签项的权重,对企业所有满足政策标签项的权限得分计算加权
总分,获得匹配度。
[0033]进一步的,定义政策数据标签化的任一标签项分值权限为100,标签项下任一标签的分值为100/标签项下标签个数,则:
[0034]企业满足政策标签项的权限得分=企业满足的政策标签项的标签数量
×
标签项下任一标签的分值;
[0035]匹配度=(企业满足适用企业类型的权限得分)*权重因子X1+(企业满足适用人群的权限得分)*权重因子X2+(企业满足企业规模的权限得分)*权重因子X3+(企业满足适用企业性质的权限得分)*权重因子X4+(企业满足政策主题的权限得分)*权重因子X5+(企业满足成立年限的权限得分)*权重因子X6+Sum(企业满足行业的权限得分)*权重因子X7+Sum(企业满足产业类目的权限得分)*权重因子X8)*1000%1000。
[0036]本专利技术另一技术方案在于公开一种基于大数据和人工智能的企业政策匹配度评估系统,包括:
[0037]第一收集模块,用于收集企业各维本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据和人工智能的企业政策匹配度评估方法,其特征在于,包括:收集企业各维度的企业数据,包括企业工商信息、企业员工信息、企业资质信息、企业知识产权和成果项目转化信息、企业获得过的政策补贴及融资贷款信息、企业每年的资产及研发费用信息;对企业数据进行预处理,包括数据清洗和归一化处理;根据多维企业数据标签系统对预处理后的企业数据标签化,分别对每项企业数据进行标签分类,将各标签类别下的企业数据放入矩阵对象中,针对任一企业计算获得标签化的企业标签数据;收集政府部门最新的政策数据;对政策数据进行预处理,包括政策数据清洗和规范政策内容;根据政策匹配维度对预处理后的政策数据标签化,针对每项政策生成一套政策标签数据;基于企业标签数据和政策标签数据建立标签匹配权重模型,通过深度学习算法及决策树算法匹配企业与政策的相同维度,并基于每个维度的权重,计算企业与政策的匹配度;根据企业与政策的匹配度由高到低排序,输出匹配度最高的N条政策。2.根据权利要求1所述的基于大数据和人工智能的企业政策匹配度评估方法,其特征在于,所述对预处理后的企业数据标签化的标签项包括企业状态、注册地、参保人数、企业性质、所属行业、经营范围、企业资质、企业运营状态、研发投入和专利拥有度;其中,企业数据包括企业基本工商信息、近5年每一年获得的贷款金额、融资数据、技术合同信息、项目申报信息、企业员工研究人员数量、学历占比、I类知识产权的数量、II类知识产权的数量、取得的资质认证和知识产权信息;所述对企业数据预处理的过程为:对任一企业数据的内容,将中文含义的内容转换为数字表示或字典数据,并补全企业属于省市区信息和企业注册日期。3.根据权利要求1所述的基于大数据和人工智能的企业政策匹配度评估方法,其特征在于,所述对预处理后的政策数据标签化的标签项包括:支持方式:保险补贴、贷款贴息、费用减免、降低成本、评选认定、其他、税收减免、政府投资、政策引导、政府引导基金、最高奖励、资金扶持、政策支持和资质荣誉;适用企业类型:工业型企业、农业型企业、服务型企业、研究机构、科技企业、专精特新企业、对外贸易企业、批发企业、零售企业、物流运输企业、仓储企业;适用人群:大学生创业、科技人员、高校毕业生、引进人才、退役军人、军烈属和残疾人;企业规模:大型企业、中型企业和小微企业;成立年限:1~3年、3~5年、5~10年和大于10年;适用企业性质:个人独资企业、个体工商户、国有企业、合资企业、民营企业、外资企业、股份制企业;政策主题:补助、场地、成果转化、创新、创业、金融、税收和中小企业;行业:农、林、牧、渔业,采矿业,制造业,电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业,住宿和餐饮业,信息传输、软件和信息技术服务业,金融业,房地产业,租赁和商务服务业,科学研究和技术服务业,水利、环境和公共设施管理业,居民服务、修理和其他服务业,教育,卫生和社会工作,文化、体育和娱乐业,公共管理、
社会保障和社会组织,国际组织;产业类目:航空航天、电子信息、海洋产业、会展经济、科技服务业、绿色食品、其他传统产业、生活服务业、生物与新医药、文旅产业、新材料、现代金融、现代物流业、新经济、新能源及节能、医疗健康、资源与环境和装备制造;所述对政策数据的预处理过程为:对于已经过申请时间的政策,放入历史政策库中;规范化政策的发布部门、政策等级,采用基于机器学习的语义分析算法从政策内容中提取申请时间并按时间格式规范;提取政策内容中明确说明的政策主题、支持方式、适用行业、适用人群、适用企业性质和适用企业规模;对任一政策形成标准政策申报模板。4.根据权利要求3所述的基于大数据和人工智能的企业政策匹配度评估方法,其特征在于,所述计算企业与政策匹配度的具体过程为:基于深度学习算法与决策树算法,匹配企业满足政策标签数据的若干标签项;确定企业满足的任一政策标签项的标签数量;分别计算企业满足的任一政策标签项的权限得分;根据预设的政策标签项的权重,对企业所有满足政策标签项的权限得分计算加权总分,获得匹配度。5.根据权利要求4所述的基于大数据和人工智能的企业政策匹配度评估方法,其特征在于,定义政策数据标签化的任一标签项分值权限为100,标签项下任一标签的分值为100/标签项下标签个数,则:企业满足政策标签项的权限得分=企业满足的政策标签项的标签数量
×
标签项下任一标签的分值;匹配度=(企业满足适用企业类型的权限得分)*权重因子X1+(企业满足适用人群的权限得分)*权重因子X2+(企业满足企业规模的权限得分)*权重因子X3+(企业满足适用企业性质的权限得分)*权重因子X4+(企业满足政策主题的权限得分)*权重因子X5+(企业满足成立年限的权限得分)*权重因子X6+Sum(企业满足行业的权限得分)*权重因子X7+Sum(企业满足产业类目的权限得分)*权重因子X8)*1000%1000。6.一种基于大数据和人工智能的企业政策匹配度评估系统,其特征在于,包括:第一收集模块,用于收集企业各维度的企业数据,包括企业工商信息、企业员工信息、企业资质信息、企业知识产权和成果项目转化信息、企业获得过的政策补贴及融资贷款信息、企业每年的资产及研发费用信息;第一预处理模块,用于对企业数...

【专利技术属性】
技术研发人员:金石邓录杨袁珑
申请(专利权)人:成都政策通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1