科技咨询实体画像联机分析处理的分析方法及装置制造方法及图纸

技术编号:37233700 阅读:18 留言:0更新日期:2023-04-20 23:15
本发明专利技术公开了科技咨询实体画像联机分析处理的分析及装置,该方法包括:基于前台属性标签和后台属性标签得到实体属性标签;其中,后台属性标签是基于对科技咨询场景下的实体原始数据的处理得到;根据实体属性标签和预设的数据类型转换关系表进行对应的数据标签转换,将转换后的数据标签进行存储得到数据存储结果;基于数据存储结果将预设的用户规则转换得到JSON格式数据,解析JSON格式数据生成相应的SQL语句查询结果;基于SQL语句查询结果进行数据渲染,根据渲染结果完成科技咨询场景下的实体画像分析。本发明专利技术消除了科技咨询实体属性间的差异,实现了数据的灵活查询以及毫秒级响应,推动实现产业数字化与数据价值化。推动实现产业数字化与数据价值化。推动实现产业数字化与数据价值化。

【技术实现步骤摘要】
科技咨询实体画像联机分析处理的分析方法及装置


[0001]本专利技术涉及大数据OLAP查询分析
,特别是涉及科技咨询实体画像联机分析处理的分析方法及装置。

技术介绍

[0002]科技咨询是由具有科技产业知识并掌握咨询经验的专家团体,以数据信息为基础,综合利用科技知识、专家经验等,针对产业规划、产业洞察等领域提供的智力服务。通过设计产业链、技术链等标引体系,构建诸如企业画像、专利画像等实体画像来挖掘梳理科技咨询下的科技数据,综合各维度画像模型及分析成果,全视角全维度提供咨询服务。OLAP(Online Analytical Processing,联机分析处理)技术可以实现对科技咨询专业领域数据进行建模存储,并提供多角度、多层次的分析,从而辅助专家进行上层决策。
[0003]然而现有的实体画像OLAP分析仍然存在很多的问题:
[0004]现有的画像分析建模研究多集中在用户画像上,鲜有对科技实体画像的关注,且对科技实体画像的研究也多集中在企业、专利等单一实体上,只能应对单一实体场景,缺少对整个科技咨询实体的宏观画像分析,难以支撑科技咨询场景下全方位、多实体、多维度的全景分析场景,无法实现对产业层面的现状及未来发展趋势的分析;
[0005]不同科技实体属性之间存在较大的差异,针对每个科技实体进行画像建模需要消耗大量的时间和精力。与其他业务场景不同的是,科技咨询场景下的画像分析更多的是从一个标引体系宏观层面出发,然后进行后续的下钻操作,对于每个实体的画像细节要求不高;
[0006]科技咨询场景下的实体属性标签结构不规整,存在平面属性标签和标引体系层级属性标签之分,而数据价值大多体现在标引体系层级属性标签中,现有的画像建模都没有考虑到属性分层这一点;
[0007]实体属性标签是可扩展的,且存在多标签的情况,这需要实体画像建模具有良好的可扩展性,能够支撑数据属性更新的场景,但OLAP分析对数据更新的支撑较差,且现有研究多没有考虑属性更新的情况;
[0008]科技咨询场景下的查询多为交互式查询场景,要求时延低、响应快,且查询场景很灵活,现有的画像分析大多数是针对特定业务场景进行的,而科技咨询场景下的查询业务是会不断变化的,因此缺少一种能够灵活适应各种业务场景的快速相应OLAP分析方法。

技术实现思路

[0009]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0010]本专利技术针对上述问题,提出了科技咨询实体画像联机分析处理的分析方法,提出了科技咨询场景下的实体画像存储方案,通过实体属性建模,对不同的属性标签分别设计存储形式,消除了科技咨询实体属性间的差异,并充分考虑数据属性更新的情况,方便后期业务拓展与延伸;提出了面向科技咨询场景的实体画像查询分析方法,通过将用户查询规
则转换为相应的ClickHouse SQL执行,实现了数据的灵活查询以及毫秒级响应;搭建了一种适用于科技咨询场景的实体画像OLAP分析装置,降低了数据查询分析的使用门槛,并可以依据不同的分析场景设计并发布对应的实体画像大屏,将各个视角的实体画像大屏整合,进行整体及细节情况的深度剖析解读,推动实现产业数字化与数据价值化。
[0011]本专利技术的另一个目的在于提出一种科技咨询实体画像联机分析处理的分析装置。
[0012]为达上述目的,本专利技术一方面提出一种科技咨询实体画像联机分析处理的分析方法,包括:
[0013]基于前台属性标签和后台属性标签得到实体属性标签;其中,所述后台属性标签是基于对科技咨询场景下的实体原始数据的处理得到;
[0014]根据所述实体属性标签和预设的数据类型转换关系表进行对应的数据标签转换,将转换后的数据标签进行存储得到数据存储结果;
[0015]基于所述数据存储结果将预设的用户规则转换得到JSON格式数据,解析所述JSON格式数据生成相应的SQL语句查询结果;
[0016]基于所述SQL语句查询结果进行数据渲染,根据渲染结果完成所述科技咨询场景下的实体画像分析。
[0017]进一步的本专利技术实施例的科技咨询实体画像联机分析处理的分析方法还可以具有以下附加技术特征:
[0018]进一步地,所述实体原始数据,包括企业实体原始数据、论文实体原始数据、专利实体原始数据和标准实体原始数据;所述方法,还包括:基于预设的标签规则对所述后台属性标签进行映射得到所述前台属性标签。
[0019]进一步地,所述后台属性标签,包括基本属性标标签、拓展属性标签和标引体系属性标签;所述基于前台属性标签和后台属性标签得到实体属性标签,包括:
[0020]对所述基本属性标签进行数据处理得到处理后基本属性标签;
[0021]利用打标模型和打标规则对所述处理后基本属性标签进行处理分析得到拓展属性标签;
[0022]基于基本属性标签、拓展属性标签和所述标引体系属性标签,完成后台属性标签的打标任务,以根据打标后的后台属性标签和所述前台属性标签得到实体属性标签。
[0023]进一步地,所述方法,还包括,
[0024]利用custom_label的存储字段对拓展属性标签后期新增的属性标签进行数据存储,所述存储字段的存储类型为Array的形式;
[0025]利用层级存储的方式对所述标引体系属性标签进行数据存储,以将所述标引体系属性标签划分为标引体系一级标签、标引体系二级标签、标引体系三级标签和标引体系四级标签。
[0026]进一步地,所述基于数据存储结果将预设的用户规则转换得到JSON格式数据,解析所述JSON格式数据生成相应的SQL语句查询结果,包括:
[0027]基于数据存储结果中标签之间预设的逻辑规则得到筛选标签,并确定筛选标签之间的关系;以及确定预设的规则组的组别之间的关系;
[0028]基于所述筛选标签之间的关系和所述组别之间的关系将所述逻辑规则和所述规则组转化为JSON格式数据,并解析所述JSON格式数据生成相应的SQL语句查询结果。
[0029]为达上述目的,本专利技术另一方面提出一种科技咨询实体画像联机分析处理的分析装置,包括:
[0030]数据获取模块,用于基于前台属性标签和后台属性标签得到实体属性标签;其中,所述后台属性标签是基于对科技咨询场景下的实体原始数据的处理得到;
[0031]数据存储模块,用于根据所述实体属性标签和预设的数据类型转换关系表进行对应的数据标签转换,将转换后的数据标签进行存储得到数据存储结果;
[0032]查询分析模块,用于基于所述数据存储结果将预设的用户规则转换得到JSON格式数据,解析所述JSON格式数据生成相应的SQL语句查询结果;
[0033]结果输出模块,用于基于所述SQL语句查询结果进行数据渲染,根据渲染结果完成所述科技咨询场景下的实体画像分析。
[0034]本专利技术实施例的科技咨询实体画像联机分析处理的分析方法和装置,消除了实体属性间的差异,拥有良好的存储可扩展性,能够支撑实体属性更新的场景;将用户本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种科技咨询实体画像联机分析处理的分析方法,其特征在于,包括以下步骤:基于前台属性标签和后台属性标签得到实体属性标签;其中,所述后台属性标签是基于对科技咨询场景下的实体原始数据的处理得到;根据所述实体属性标签和预设的数据类型转换关系表进行对应的数据标签转换,将转换后的数据标签进行存储得到数据存储结果;基于所述数据存储结果将预设的用户规则转换得到JSON格式数据,解析所述JSON格式数据生成相应的SQL语句查询结果;基于所述SQL语句查询结果进行数据渲染,根据渲染结果完成所述科技咨询场景下的实体画像分析。2.根据权利要求1所述的方法,其特征在于,所述实体原始数据,包括企业实体原始数据、论文实体原始数据、专利实体原始数据和标准实体原始数据;所述方法,还包括:基于预设的标签规则对所述后台属性标签进行映射得到所述前台属性标签。3.根据权利要求2所述的方法,其特征在于,所述后台属性标签,包括基本属性标标签、拓展属性标签和标引体系属性标签;所述基于前台属性标签和后台属性标签得到实体属性标签,包括:对所述基本属性标签进行数据处理得到处理后基本属性标签;利用打标模型和打标规则对所述处理后基本属性标签进行处理分析得到拓展属性标签;基于基本属性标签、拓展属性标签和所述标引体系属性标签,完成后台属性标签的打标任务,以根据打标后的后台属性标签和所述前台属性标签得到实体属性标签。4.根据权利要求3所述的方法,其特征在于,所述方法,还包括,利用custom_label的存储字段对拓展属性标签后期新增的属性标签进行数据存储,所述存储字段的存储类型为Array的形式;利用层级存储的方式对所述标引体系属性标签进行数据存储,以将所述标引体系属性标签划分为标引体系一级标签、标引体系二级标签、标引体系三级标签和标引体系四级标签。5.根据权利要求1所述的方法,其特征在于,所述基于数据存储结果将预设的用户规则转换得到JSON格式数据,解析所述JSON格式数据生成相应的SQL语句查询结果,包括:基于数据存储结果中标签之间预设的逻辑规则得到筛选标签,并确定筛选标签之间的关系;以及确定预设的规则组的组别之间的关系;基于所述筛选标签之间的关系和所述组别之间的关系将所述逻辑规则和所述规则组转化为JSON格式数据,并解析所述JSON格式数据生成相应的SQL语句查询结...

【专利技术属性】
技术研发人员:鄂海红宋美娜丛丽静王晓晖康雯珺梁月梅
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1