【技术实现步骤摘要】
企业诚信水平标定方法、装置、设备及存储介质
[0001]本申请涉及数据处理
,更具体的说,是涉及一种企业诚信水平标定方法、装置、设备及存储介质。
技术介绍
[0002]当前,可以基于相关政务部门公开的目标企业的政务数据对目标企业的诚信水平进行标定,示例性的,可以使用国家税务总局公布的企业纳税信用等级、相关政务部门公开的企业遵规守纪情况等政务数据评估企业的诚信水平。但是,一个目标企业可能具备多种不同的标识,例如,可以用企业的全称、简称或ID等不同标识表征同一个目标企业,并且,也可能存在目标企业的名称被模糊的情况,根据目标企业的名称难以获取到能够表征企业诚信水平的全部政务数据,数据获取的难度较大、成本较高。
[0003]因此,在实际应用中往往只根据企业纳税信用等级对目标企业的诚信水平进行标定,数据类型单一,标定出的企业诚信水平的准确性不高。
技术实现思路
[0004]鉴于上述问题,提出了本申请以便提供一种企业诚信水平标定方法、装置、设备及存储介质,可以利用多种类型的政务数据实现目标企业的诚信水平标定 ...
【技术保护点】
【技术特征摘要】
1.一种企业诚信水平标定方法,其特征在于,包括:获取若干种预设类型的数据,其中,所述数据包括用于表征企业的诚信水平的政务数据;对于所获取的每一条数据,提取所述数据的地理信息,判断所述地理信息与目标企业的基准地理信息是否匹配,若匹配,则确定所述数据为目标数据;利用企业诚信水平标定模型对所确定的若干条所述目标数据进行处理,标定出所述目标企业的诚信水平,其中,所述企业诚信水平标定模型是利用标注有诚信水平的训练数据训练得到的模型。2.根据权利要求1所述的方法,其特征在于,所述基准地理信息为地理信息系统的POI数据;所述对于所获取的每一条数据,提取所述数据的地理信息,判断所述地理信息与目标企业的基准地理信息是否匹配,若匹配,则确定所述数据为目标数据,包括:根据数据的地理信息,对所获取的全部数据进行聚类,得到若干个聚类;对于每一个所述聚类,在所述聚类中的各条数据中,查找满足企业名称信息名称匹配条件的数据,利用查找到的若干条数据生成数据组;对于每个数据组,提取所述数据组中的全部数据的地理信息,利用所述全部数据的地理信息确定与所述数据组对应的地理范围,对所述POI数据和所述地理范围进行邻近分析,得到所述POI数据和所述地理范围之间的距离,所述距离用于表征所述地理范围与所述POI数据的匹配程度,在所述距离等于零的情况下,确定所述数据组中的全部数据为目标数据。3.根据权利要求1所述的方法,其特征在于,所述企业诚信水平标定模型是对预训练模型进行再训练得到的模型,其中,所述预训练模型是在用于实现中文语义识别的通用任务上训练得到的深度学习模型,在所述再训练的过程中使用的数据为所述标注有诚信水平的训练数据。4.根据权利要求2所述的方法,其特征在于,所述通用任务为新闻情感倾向性识别任务。5.根据权利要求1所述的方法,其特征在于,在所述利用企业诚信水平标定模型...
【专利技术属性】
技术研发人员:罗鹏,刘琳琳,李鼎,王振宇,陈嘉翊,孙晨雨,
申请(专利权)人:国网商用大数据有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。