【技术实现步骤摘要】
一种政策汇聚与企业画像匹配推荐的方法
[0001]本专利技术涉及政策智能匹配
,具体来说,涉及一种政策汇聚与企业画像匹配推荐的方法。
技术介绍
[0002]随着大数据的发展及应用,逐渐形成了以数据采集、数据ETL、数据分析为数据底座的应用,由于数据的量级、多样性、复杂性和文本数据智能语义分析与提取算法等因素,基于大数据的爬虫技术、ELT技术、NLP语义分析、智能匹配算法等相关技术成为常用的手段。
[0003]企业想获取与企业相关的政策,需要付出大量的人力、时间等资源,从海量政策中筛选出符合其自身申报的政策,进一步影响企业响应政策,调整自己的工作重心或无法享受政策给企业带来的福利。因此,如何将优惠政策信息快速、高效推送给可满足条件相匹配的企业是本领域亟需解决的技术问题。
技术实现思路
[0004]针对相关技术中的上述技术问题,本专利技术提出一种政策汇聚与企业画像匹配推荐的方法,能够克服现有技术的上述不足。
[0005]为实现上述技术目的,本专利技术的技术方案是这样实现的:一种政策汇聚与企业 ...
【技术保护点】
【技术特征摘要】
1.一种政策汇聚与企业画像匹配推荐的方法,其特征在于,包括以下步骤:S1 数据获取:采用系统爬虫及Xpath规则解析收集互联网数据,同时通过人工录入的方式获取数据,将获得到的数据存储到数据库中;S2 数据预处理:采用ETL技术将S1获取的数据进行清洗、转换、去杂、解析;S3 数据文本提取及标签化:采用NLP技术对S2预处理后的数据进行语义理解、分词形成可用标签;S4 匹配模型定制:将S3中提取的政策数据标签以及分类提取的企业数据标签进行匹配评估,同时加入企业画像评估算法进行模型制定,从而得出企业相关匹配度政策集;S5 政策推送:将S4得到的企业相关匹配度政策集按照匹配度推送给企业;S4中所述匹配模型定制的步骤为:S401 分类提取企业的数据标签;S402 采用企业画像评估算法对掌握企业进行企业景气指数画像,同时辅以税务数据全息掌握企业经营情况,是否具有惠企资格;S403 以S402中所述指数为前提,进行模型定制;所述企业画像评估算法的实施步骤为:S4021 获取企业多维度数据;S4022 对数据ETL,同时提取维度数据标签集;S4023 制定权重值并计算结果集;S4024 根据结果集辅以人工验证方式进行优化调整;S4025 获取企业景气指数。2.根据权利要求1所述的政策汇聚与企业画像匹配推荐的方法,其特征在于,S1中所述互联网数据包括互联网惠企政策、公告文件。3.根据权利要求1所述的政策汇聚与企业画像匹配推荐的方法,其特征在于,S1中所述通过人工录入的方式获取数据为:通过客户端录入收集的可公示线下政策数据。4.根据权利要求1所述的政策...
【专利技术属性】
技术研发人员:张磊,孙欢欢,贾晓光,张松梅,庄超,
申请(专利权)人:中关村科技软件股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。