一种产业链信息构建方法、装置以及存储介质制造方法及图纸

技术编号:37178126 阅读:18 留言:0更新日期:2023-04-20 22:45
本发明专利技术提出了一种产业链信息构建方法,包括以下步骤:构建产业知识图谱,设定所述产业知识图谱的框架;基于所述产业知识图谱的框架,在最小颗粒度的层级下属环节下填入变量参数;结合大规模企业知识图谱,对企业的数据字段进行关键词匹配,以得到符合产业要求的企业,获取企业在关键词匹配中所获得的累计分值;设定匹配阈值分数,将累计分值大于所述匹配阈值分数的企业计入产业名单中,否则将所述企业剔除;对所述产业名单进行抽检标志,生成badcase进行优化校正,输出产业数据结果。本发明专利技术解决了传统方法中企业数据处理量级和精度导致的问题,为产业链搭建提供了更加准确可靠的数据。的数据。的数据。

【技术实现步骤摘要】
一种产业链信息构建方法、装置以及存储介质


[0001]本专利技术涉及智能数据库
,具体涉及一种产业链信息构建方法、装置以及存储介质。

技术介绍

[0002]在各种场景下,都需要产业链的企业数据信息作为支持,市面上通常使用以下方法进行产业链数据库的完善,一是通过国标行业进行企业分类,并根据企业其实际业务与产品进行产业分类,从而达到产业链构建的目的;二是通过收集企业年报,行业研报,上市企业名单等方式,进行数据的归类整理,生成产业龙头名单,但无法全量提供产业下的企业名单。
[0003]然而,上述问题同样存在着许多问题,如方法一通过国标行业进行企业分类的方式,存在精确层度低下的问题,因为行业与产业属于两个参数维度,同时后续结合实际业务和产品进行二次匹配的的效率比较低下;方法二输出产业龙头的方式,则存在数量级的差距,在需要调用全局产业数据进行产业分析或者全量产业名单进行招商的场景下无法满足。

技术实现思路

[0004]针对现有技术的不足,本专利技术提出一种产业链信息构建方法,解决了传统方法中企业数据处理量级和精度导致的问题,为产业链搭建提供了更加准确可靠的数据。
[0005]本专利技术的技术方案是这样实现的:一种产业链信息构建方法,包括以下步骤:构建产业知识图谱,设定所述产业知识图谱的框架;基于所述产业知识图谱的框架,在最小颗粒度的层级下属环节下填入变量参数;结合大规模企业知识图谱,对企业的数据字段进行关键词匹配,以得到符合产业要求的企业,获取企业在关键词匹配中所获得的累计分值;设定匹配阈值分数,将累计分值大于所述匹配阈值分数的企业计入产业名单中,否则将所述企业剔除;对所述产业名单进行数据复核。
[0006]根据产业全貌设定产业知识图谱的框架,包括产业层级以及层级下属环节。
[0007]进一步地,在对企业的数据字段进行关键词匹配时,还包括:基于层级下属环节填入的关键词进行知识图谱的匹配积分,若关键词在不同图谱维度中分别出现,则根据不同图谱维度的权重进行累计分值计算,若总得分超过匹配阈值,则判定为该企业符合产业要求。
[0008]进一步地,所述变量参数还包括产业关键词,关键词属性,匹配项分值,匹配阈值。
[0009]进一步地,所述企业的数据字段包括企业简介、企业新闻、企业全称、主营业务。
[0010]进一步地,在数据复核时,可行则生成产业报告,否则对所述产业名单抽检标注,生成badcase进行优化校正,输出产业数据结果。
[0011]本专利技术第二方面提出了一种产业链信息构建装置,包括:框架构建模块,用于设定
所述产业知识图谱的框架并设置其中的变量参数;关键词匹配模块,用于基于大规模企业知识图谱,对企业的数据字段进行关键词匹配,并获取企业在关键词匹配中所获得的累计分值;筛选模块,用于根据将累计分值大于预设的匹配阈值分数的企业计入产业名单中;名单生成模块,用于生产产业名单;复核模块,用于对所述产业名单进行数据复核。
[0012]本专利技术第三方面提出了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如本专利技术第一方面所述的产业链信息构建方法。
[0013]与现有技术相比,本专利技术具有以下优点。
[0014]本专利技术通过将大规模企业知识图谱加入产业图谱构建的环节中,解决了数据量级的问题,为调用全局产业数据作分析及全量产业名单进行招商的场景提供了数据支持;通过数据匹配、累计分数筛选等方法,提高企业和产业链之间的匹配的正确率,提升了产业链中数据量级边界的同时,不牺牲数据精度,提高用于后续结合实际业务和产品进行二次匹配的效率。
附图说明
[0015]为了更清楚地说明本专利技术实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0016]图1为本专利技术一种产业链信息构建方法的流程示意图。
具体实施方式
[0017]下面将结合本专利技术实施方式中的附图,对本专利技术实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式仅仅是本专利技术一部分实施方式,而不是全部的实施方式。基于本专利技术中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本专利技术保护的范围。
[0018]在本专利技术的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术的限制。此外,术语“第一”、“第二”、“第三”、“第四”等仅用于描述目的,而不能理解为指示或暗示相对重要性。
[0019]在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、
“ꢀ
相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。
[0020]实施方式一本申请的实施方式需要首先构建大规模企业知识图谱,通过构建全量的企业信息图谱,基于大而全的企业数据沉淀满足产业链构建过程中底层的数据需求。
[0021]参见图1,本专利技术实施方式公开了一种产业链信息构建方法,包括以下步骤:S01 构建产业知识图谱,设定所述产业知识图谱的框架;包括产业层级以及层级下属环节。如原料、加工、销售等产业环节。
[0022]S02 基于所述产业知识图谱的框架,在最小颗粒度的层级下属环节下填入变量参数;所述变量参数还包括产业关键词,关键词属性,匹配项分值,匹配阈值,以便在步骤S03中进行匹配筛选;S03 结合大规模企业知识图谱,对企业的数据字段进行关键词匹配,以得到符合产业要求的企业,获取企业在关键词匹配中所获得的累计分值;所述企业的数据字段包括但不限于企业简介、企业新闻、企业全称、主营业务。
[0023]S04 设定匹配阈值分数,将累计分值大于所述匹配阈值分数的企业计入产业名单中,以进行二次筛选,从而提高产业链中企业精准性,否则将所述企业剔除;S05 对所述产业名单进行数据复核,可行则生成产业报告,否则对所述产业名单抽检标注,生成badcase进行优化校正,输出产业数据结果。
[0024]本专利技术的有益在于:
①ꢀ
基于大规模企业知识图谱,保证了数据的全面性;
②ꢀ
基于算法实现全方位匹配,保证了数据的有效性;实施方式二本专利技术还提出了提出了一种产业链信息构建装置,包括:框架构建模块,用于设定所述产业知识图谱的框架并本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种产业链信息构建方法,其特征在于,包括以下步骤:构建产业知识图谱,设定所述产业知识图谱的框架;基于所述产业知识图谱的框架,在最小颗粒度的层级下属环节下填入变量参数;基于大规模企业知识图谱,对企业的数据字段进行关键词匹配,以得到符合产业要求的企业,获取企业在关键词匹配中所获得的累计分值;设定匹配阈值分数,将累计分值大于所述匹配阈值分数的企业计入产业名单中,否则将所述企业剔除;对所述产业名单进行数据复核。2.根据权利要求1所述的产业链信息构建方法,其特征在于:根据产业全貌设定产业知识图谱的框架,包括产业层级以及层级下属环节。3.根据权利要求2所述的产业链信息构建方法,其特征在于:在对企业的数据字段进行关键词匹配时,包括:基于层级下属环节填入的关键词进行知识图谱的匹配积分,若关键词在不同图谱维度中分别出现,则根据不同图谱维度的权重进行累计分值计算,若总得分超过匹配阈值,则判定为该企业符合产业要求。4.根据权利要求1所述的产业链信息构建方法,其特征在于:所述变量参数还包括产业关键词,关键词属...

【专利技术属性】
技术研发人员:黎展陈开冉宝音陈旭东
申请(专利权)人:广州探迹科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1