当前位置: 首页 > 专利查询>钟珍珍专利>正文

结合数据可视化的知识图谱大数据处理方法及系统技术方案

技术编号:35197433 阅读:40 留言:0更新日期:2022-10-12 18:30
本公开实施例公开了结合数据可视化的知识图谱大数据处理方法及系统;通过多个处理周期对待拆解用户活动事件的活动事件区分标签、活动事件知识短语和事件信息拆解窗口进行深度挖掘处理,每个处理周期获取前一轮处理周期生成的活动事件知识短语以及基于区分标签拆解补全的特征要素,可以尽可能地保障待拆解用户活动事件的事件信息拆解质量,从而将不同的用户活动事件对应的事件信息集从复杂的数字服务互动大数据拆解出来,提高大数据拆解和信息分类的准确性,便于后续针对不同的事件信息集进行独立的用户需求挖掘和大数据推送。集进行独立的用户需求挖掘和大数据推送。集进行独立的用户需求挖掘和大数据推送。

【技术实现步骤摘要】
结合数据可视化的知识图谱大数据处理方法及系统


[0001]本公开涉及大数据处理
,尤其涉及一种结合数据可视化的知识图谱大数据处理方法及系统。

技术介绍

[0002]数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元元素表示,大量的数据集构成数据图像,同时将数据的各个属性值以多维数据的形式表示,可以从不同的维度观察数据,从而对数据进行更深入的观察和分析。知识图谱分析作为数据可视化的其中一个重要分支,在现阶段的大数据挖掘分析中起着关键作用。随着各类数字服务的线上规模不断扩大,服务运行过程中所生成的一系列大数据具有极高的挖掘价值和分析价值,然而,如果直接对这些大数据进行挖掘分析,无疑会增加处理负荷。因此,如何实现对这类复杂大数据的准确拆解和信息分类,是保障后续大数据挖掘以及大数据推荐等处理的关键。

技术实现思路

[0003]本公开的一个目的是提供一种结合数据可视化的知识图谱大数据处理方法及系统。
[0004]本公开的技术方案是通过如下至少部分实施例实现的。
[0005]一种结合数据可视化的知识图谱大数据处理方法,应用于知识图谱大数据系统,所述方法包括:获得数字服务互动大数据的第一活动事件区分标签,以及所述数字服务互动大数据中的待拆解用户活动事件的第一活动事件知识短语和与所述第一活动事件知识短语对应的第一事件信息拆解窗口;利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行不少于两个处理周期的区分标签加权操作,得到第二事件信息拆解窗口;其中,将上一处理周期所述区分标签加权操作生成的第一活动事件知识短语进行知识扩展得到下一处理周期的活动事件知识短语,并利用所述下一处理周期的活动事件知识短语得到该活动事件知识短语对应的事件信息拆解窗口,将所述下一处理周期的所述活动事件知识短语、所述下一处理周期的事件信息拆解窗口和所述下一处理周期对应的活动事件区分标签作为下一处理周期区分标签加权操作的待处理知识;各处理周期对应的所述区分标签加权操作的待处理知识中的活动事件区分标签的质量评分与活动事件知识短语的质量评分一致。
[0006]可见,通过多个处理周期对待拆解用户活动事件的活动事件区分标签、活动事件知识短语和事件信息拆解窗口进行深度挖掘处理,每个处理周期获取前一轮处理周期生成的活动事件知识短语以及基于区分标签拆解补全的特征要素,可以尽可能地保障待拆解用户活动事件的事件信息拆解质量,从而将不同的用户活动事件对应的事件信息集从复杂的数字服务互动大数据拆解出来,提高大数据拆解和信息分类的准确性,便于后续针对不同的事件信息集进行独立的用户需求挖掘和大数据推送。
[0007]在一些可独立实施的示例中,所述利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行不少于两个处理周期的区分标签加权操作,得到第二事件信息拆解窗口,包括:利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行第一处理周期的区分标签加权操作,得到第二活动事件知识短语;利用所述第二活动事件知识短语、与所述第二活动事件知识短语对应的周期化事件信息拆解窗口和第二活动事件区分标签进行不少于一个处理周期的区分标签加权操作,得到所述第二事件信息拆解窗口;其中,所述第二活动事件区分标签的质量评分与所述第二活动事件知识短语的质量评分一致。
[0008]可见,对第一活动事件区分标签、第一活动事件知识短语和第一事件信息拆解窗口进行多处理周期的处理,可以保障每一处理周期的处理结果的质量评分大于其上一处理周期的处理结果的质量评分,从而能够为每一个待拆解用户活动事件确定高质量评分的事件信息拆解窗口。
[0009]在一些可独立实施的示例中,所述利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行第一处理周期的区分标签加权操作,得到第二活动事件知识短语,包括:将所述第一活动事件区分标签中的第一个性化知识短语和所述第一活动事件知识短语进行组合,得到第一联动知识短语;将所述第一联动知识短语、所述第一活动事件区分标签中第一窗口化描述内容和所述第一事件信息拆解窗口进行加权组合,得到所述第二活动事件知识短语。
[0010]可见,通过通过区分标签加权模块对待拆解用户活动事件的活动事件知识短语和窗口化描述内容进行组合,能够得到细节丰富度和准确度更高的第二活动事件知识短语。
[0011]在一些可独立实施的示例中,所述将所述第一活动事件区分标签中的第一个性化知识短语和所述第一活动事件知识短语进行组合,得到第一联动知识短语,包括:通过第一细节特征挖掘处理,对所述第一个性化知识短语和所述第一活动事件知识短语进行处理,得到第一知识特征挖掘结果;分别通过若干个第二细节特征挖掘处理,对所述第一知识特征挖掘结果进行处理,得到若干个第二知识特征挖掘结果;其中,所述第一细节特征挖掘处理的特征滤波单元小于所述第二细节特征挖掘处理的特征滤波单元,且所述若干个第二细节特征挖掘处理的膨胀变量不同;利用所述若干个第二知识特征挖掘结果,确定所述第一联动知识短语。
[0012]可见,通过上述方案得到的联动知识短语可以尽可能保留待拆解用户活动事件的局部特征要素,避免组合处理导致的信息丢失。
[0013]在一些可独立实施的示例中,所述利用所述第二活动事件知识短语、与所述第二活动事件知识短语对应的周期化事件信息拆解窗口和第二活动事件区分标签进行不少于一个处理周期的区分标签加权操作,得到所述第二事件信息拆解窗口,包括:对所述第二活动事件知识短语、所述周期化事件信息拆解窗口和所述第二活动事件区分标签进行第二处理周期的区分标签加权操作,得到第三活动事件知识短语和所述第三活动事件知识短语对应的第一膨胀处理窗口;利用所述第一膨胀处理窗口和所述周期化事件信息拆解窗口,确定第三事件信息拆解窗口;对所述第三活动事件知识短语、所述第一膨胀处理窗口和第三活动事件区分标签进行第三处理周期的区分标签加权操作,得到第四活动事件知识短语和所述第四活动事件知识短语对应的第二膨胀处理窗口;利用所述第二膨胀处理窗口和所述
第三事件信息拆解窗口,确定所述第二事件信息拆解窗口。
[0014]可见,基于膨胀处理(空洞卷积处理)可以精准可靠地拆解出对应于不同活动事件的目标知识字段集,进而提高事件信息的拆解质量。
[0015]在一些可独立实施的示例中,所述对所述第二活动事件知识短语、所述周期化事件信息拆解窗口和所述第二活动事件区分标签进行第二处理周期的区分标签加权操作,得到第三活动事件知识短语和所述第三活动事件知识短语对应的第一膨胀处理窗口,包括:对所述第二活动事件知识短语、所述周期化事件信息拆解窗口和所述第二活动事件区分标签进行第二处理周期的区分标签加权操作,得到所述第三活动事件知识短语;对所述第三活动事件知识短语中的目标知识字段集进行解析,得到所述第一膨胀处理窗口。
[0016]可见,通过通过在对待拆解用户活动事件进行事件拆解的过程中,进一步对待拆解用户活动事件的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结合数据可视化的知识图谱大数据处理方法,其特征在于,应用于知识图谱大数据系统,所述方法包括:获得数字服务互动大数据的第一活动事件区分标签,以及所述数字服务互动大数据中的待拆解用户活动事件的第一活动事件知识短语和与所述第一活动事件知识短语对应的第一事件信息拆解窗口;利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行不少于两个处理周期的区分标签加权操作,得到第二事件信息拆解窗口;其中,将上一处理周期所述区分标签加权操作生成的第一活动事件知识短语进行知识扩展得到下一处理周期的活动事件知识短语,并利用所述下一处理周期的活动事件知识短语得到该活动事件知识短语对应的事件信息拆解窗口,将所述下一处理周期的所述活动事件知识短语、所述下一处理周期的事件信息拆解窗口和所述下一处理周期对应的活动事件区分标签作为下一处理周期区分标签加权操作的待处理知识;各处理周期对应的所述区分标签加权操作的待处理知识中的活动事件区分标签的质量评分与活动事件知识短语的质量评分一致。2.根据权利要求1所述的方法,其特征在于,所述利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行不少于两个处理周期的区分标签加权操作,得到第二事件信息拆解窗口,包括:利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行第一处理周期的区分标签加权操作,得到第二活动事件知识短语;利用所述第二活动事件知识短语、与所述第二活动事件知识短语对应的周期化事件信息拆解窗口和第二活动事件区分标签进行不少于一个处理周期的区分标签加权操作,得到所述第二事件信息拆解窗口;其中,所述第二活动事件区分标签的质量评分与所述第二活动事件知识短语的质量评分一致。3.根据权利要求2所述的方法,其特征在于,所述利用所述第一活动事件区分标签、所述第一活动事件知识短语和所述第一事件信息拆解窗口,进行第一处理周期的区分标签加权操作,得到第二活动事件知识短语,包括:将所述第一活动事件区分标签中的第一个性化知识短语和所述第一活动事件知识短语进行组合,得到第一联动知识短语;将所述第一联动知识短语、所述第一活动事件区分标签中第一窗口化描述内容和所述第一事件信息拆解窗口进行加权组合,得到所述第二活动事件知识短语。4.根据权利要求3所述的方法,其特征在于,所述将所述第一活动事件区分标签中的第一个性化知识短语和所述第一活动事件知识短语进行组合,得到第一联动知识短语,包括:通过第一细节特征挖掘处理,对所述第一个性化知识短语和所述第一活动事件知识短语进行处理,得到第一知识特征挖掘结果;分别通过若干个第二细节特征挖掘处理,对所述第一知识特征挖掘结果进行处理,得到若干个第二知识特征挖掘结果;其中,所述第一细节特征挖掘处理的特征滤波单元小于所述第二细节特征挖掘处理的特征滤波单元,且所述若干个第二细节特征挖掘处理的膨胀变量不同;利用所述若干个第二知识特征挖掘结果,确定所述第一联动知识短语。
5.根据权利要求2所述的方法,其特征在于,所述利用所述第二活动事件知识短语、与所述第二活动事件知识短语对应的周期化事件信息拆解窗口和第二活动事件区分标签进行不少于一个处理周期的区分标签加权操作,得到所述第二事件信息拆解窗口,包括:对所述第二活动事件知识短语、所述周期化事件信息拆解窗口和所述第二活动事件区分标签进行第二处理周期的区分标签加权操作,得到第三活动事件知识短语和所述第三活动事件知识短语对应的第一膨胀处理窗口;利用所述第一膨胀处理窗口和所述周期化事件信息拆解窗口,确定第三事件信息拆解窗口;对所述第三活动事件知识短语、所述第一膨胀处理窗口和第三活动事件区分标签进行第三处理周期的区分标签加权操作,得到第四活动事件知识短语和所述第四活动事件知识短语对应的第二膨胀处理窗口;利用所述第二膨胀处理窗口和所述第三事件信息拆解窗口,确定所述第二事件信息拆解窗口。6.根据权利要求5所述的方法,其特征在于,所述对所述第二活动事件知识短语、所述周期化事件信息拆解窗口和所述第二活动事件区分标签进行第二处理周期的区...

【专利技术属性】
技术研发人员:钟珍珍
申请(专利权)人:钟珍珍
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1