当前位置: 首页 > 专利查询>汪威专利>正文

基于大数据的知识图谱处理方法和云计算系统技术方案

技术编号:30178402 阅读:21 留言:0更新日期:2021-09-25 15:39
本申请实施例公开了一种基于大数据的知识图谱处理方法和云计算系统,在实施该基于大数据的知识图谱处理方法时,通过确定存在热门业务标识的服务项目执行场景的全局知识融合指向信息,能够基于全局知识融合指向信息确定至少一个业务用户端的用户画像知识图谱,从而在构建知识图谱的过程中确保知识库的知识信息的质量,保证用户画像知识图谱能够精准地反映出用户画像的实时更新情况。映出用户画像的实时更新情况。映出用户画像的实时更新情况。

【技术实现步骤摘要】
基于大数据的知识图谱处理方法和云计算系统
[0001]本申请是申请号为“202110308877.7”、申请日为“2021年03月23日”、申请名称为“应用于大数据用户画像分析的信息处理方法和云计算系统”的分案申请。


[0002]本申请涉及大数据和知识图谱
,特别涉及一种基于大数据的知识图谱处理方法和云计算系统。

技术介绍

[0003]目前,随着智能信息服务应用的不断发展,知识图谱(Knowledge Graph)已被广泛应用于智能搜索、智能问答、个性化推荐、情报分析、反欺诈等领域。另外,通过知识图谱能够将Web上的信息、数据以及链接关系聚集为知识,使信息资源更易于计算、理解以及评价,并且形成一套Web语义知识库。知识图谱以其强大的语义处理能力与开放互联能力,可为万维网上的知识互联奠定扎实的基础,使Web 3.0提出的“知识之网”的愿景成为了可能。
[0004]知识图谱从某种程度上可以理解为结构化的语义知识库,用于迅速描述物理世界中的概念及其相互关系,通过对错综复杂的文档的数据进行有效的加工、处理和整合,从而转化为简单、清晰的“实体
‑‑
关系
‑‑
实体”的三元组,最后聚合大量知识,从而实现知识的快速响应和推理。相关技术中,知识图谱有自顶向下和自底向上两种构建方式。一方面,自顶向下构建是借助百科类网站等结构化数据源从高质量数据中提取本体和模式信息并加入到知识库中。另一方面,自底向上构建则是借助一定的技术手段,从公开采集的数据中提取出资源模式选择其中置信度较高的新模式,并在经人工审核之后加入到知识库中。
[0005]然而,相关技术在构建用户画像知识图谱时,在一定程度上难以确保知识库的知识信息的质量,从而难以保证用户画像知识图谱能够精准地反映出用户画像的实时更新情况。

技术实现思路

[0006]本申请实施例之一提供一种基于大数据的知识图谱处理方法,应用于云计算系统,所述云计算系统与多个业务用户端通信连接,所述方法至少包括:根据当前在线服务推送项目中存在热门业务标识的业务项目所在的存在热门业务标识的服务项目执行场景以及所述存在热门业务标识的业务项目的用户行为数据,确定知识融合指向信息和知识质量评估信息;基于所述知识融合指向信息和所述知识质量评估信息进行知识加工,得到所述存在热门业务标识的服务项目执行场景的全局知识融合指向信息;其中,所述全局知识融合指向信息用于确定至少一个所述业务用户端的用户画像知识图谱。
[0007]本申请实施例之一提供一种云计算系统,包括处理引擎、网络模块和存储器;所述处理引擎和所述存储器通过所述网络模块通信,所述处理引擎从所述存储器中读取计算机程序并运行,以执行上述的方法。
附图说明
[0008]图1是根据本专利技术的一些实施例所示的一种示例性基于大数据的知识图谱处理方法和/或过程的流程图;图2是根据本专利技术的一些实施例所示的一种示例性基于大数据的知识图谱处理装置的框图;图3是根据本专利技术的一些实施例所示的一种示例性基于大数据的知识图谱处理系统的框图,以及图4是根据本专利技术的一些实施例所示的一种示例性云计算服务器中硬件和软件组成的示意图。
具体实施方式
[0009]为了更清楚地说明本申请实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本申请的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本申请应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
[0010]为了在构建知识图谱的过程中确保知识库的知识信息的质量,从而保证用户画像知识图谱能够精准地反映出用户画像的实时更新情况,专利技术人针对性地提出了基于大数据的知识图谱处理方法,通过确定存在热门业务标识的服务项目执行场景的全局知识融合指向信息,能够基于全局知识融合指向信息确定至少一个业务用户端的用户画像知识图谱,从而在构建知识图谱的过程中确保知识库的知识信息的质量,保证用户画像知识图谱能够精准地反映出用户画像的实时更新情况。
[0011]在相关实施例中,对基于大数据的知识图谱处理方法进行示例性的说明,请参阅图1,是根据本专利技术的一些实施例所示的一种示例性基于大数据的知识图谱处理方法和/或过程的流程图,所述基于大数据的知识图谱处理方法,可以应用于云计算系统,所述云计算系统与多个业务用户端通信连接,进一步地,云计算系统在执行上述方法时可以实现以下步骤S100和步骤S200所描述的技术方案。
[0012]S100、根据当前在线服务推送项目中存在热门业务标识的业务项目所在的存在热门业务标识的服务项目执行场景以及所述存在热门业务标识的业务项目的用户行为数据,确定知识融合指向信息和知识质量评估信息。
[0013]例如,当前在线服务推送项目可以是云计算系统所激活的在线服务推送项目,包括但不限于商品推送、在线业务(办公业务、娱乐业务)推送以及其他个性化推送项目等。进一步地,热门业务标识的业务项目可以通过对不同的业务用户终端的反馈信息进行分析之后得到,比如,针对业务项目A,其对应的反馈信息可以包括反馈信息m11、反馈信息m12、反馈信息m13、反馈信息m14和反馈信息m15,进一步地,反馈信息m11、反馈信息m12、反馈信息m13、反馈信息m14和反馈信息m15各自对应的反馈推荐指数分别为in11、in12、in13、in14和in15,由此可以得出业务项目A的综合反馈推荐指数为inA=(in11+in12+in13+in14+in15)/5。针对业务项目B,其对应的反馈信息可以包括反馈信息m21、反馈信息m22、反馈信息m23和反馈信息m24,进一步地,反馈信息m21、反馈信息m22、反馈信息m23和反馈信息m24各自对应
的反馈推荐指数分别为in21、in22、in23和in24,由此可以得出业务项目B的综合反馈推荐指数为inB=(in21+in22+in23+in24)/4。进一步地,若inA大于inB,则可以判定业务项目A为存在热门业务标识的业务项目,若inB大于inA,则可以判定业务项目B为存在热门业务标识的业务项目。当然,确定存在热门业务标识的业务项目的实施方式还可以包括其他内容,在此不一一列举。同理,存在热门业务标识的服务项目执行场景的确定方式也可以参照确定存在热门业务标识的业务项目的方式,存在热门业务标识的业务项目的用户行为数据可以是业务用户端对应的业务行为数据,在本实施例中,所述存在热门业务标识的业务项目可以为请求

响应项目(交互项目),相应地,所述存在热门业务标识的业务项目的用户行为数据包括:业务用户端请求数据、云计算系统响应数据、业务用户端验证数据、云计算系统请求数据和业务用户端操作数据等。举例而言,用户行为数据可以通过对相关的执行函数的调用记录进行分析之后得到,也可以通过其他实施方式确定,后续将对用户行为数据的获取方式进行进一步说明。
[0014]另外,知识融合可以理解为在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的知识图谱处理方法,其特征在于,应用于云计算系统,所述云计算系统与多个业务用户端通信连接,所述方法至少包括:确定当前在线服务推送项目中存在热门业务标识的业务项目所在的存在热门业务标识的服务项目执行场景,并确定所述存在热门业务标识的业务项目的用户行为数据;将所述存在热门业务标识的服务项目执行场景拆分为设定数量个服务项目交互场景,获得各个服务项目交互场景的知识融合指向信息;根据所述存在热门业务标识的业务项目的用户行为数据,确定所述存在热门业务标识的服务项目执行场景中的各个服务项目交互场景的知识质量评估信息;按照各个服务项目交互场景的知识质量评估信息,对所述存在热门业务标识的服务项目执行场景中的各个服务项目交互场景的知识融合指向信息进行知识加工,得到所述存在热门业务标识的服务项目执行场景的全局知识融合指向信息;其中,所述全局知识融合指向信息用于确定至少一个所述业务用户端的用户画像知识图谱。2.根据权利要求1所述的方法,其特征在于,所述确定所述存在热门业务标识的业务项目的用户行为数据,包括:确定所述存在热门业务标识的业务项目的业务行为响应记录,并基于所确定的业务行为响应记录,确定所述存在热门业务标识的业务项目的用户行为数据。3.根据权利要求2所述的方法,其特征在于,所述确定所述存在热门业务标识的业务项目的业务行为响应记录的步骤,包括:根据所述当前在线服务推送项目以及所述当前在线服务推送项目之前的设定数量的关联服务推送项目中所述存在热门业务标识的业务项目相对于所述业务用户端的业务项目触发信息,确定所述存在热门业务标识的业务项目的业务行为响应记录;其中,所述存在热门业务标识的业务项目为请求

响应项目,所述存在热门业务标识的业务项目的用户行为数据包括:业务用户端请求数据、云计算系统响应数据、业务用户端验证数据、云计算系统请求数据和业务用户端操作数据。4.根据权利要求1所述的方法,其特征在于,所述根据所述存在热门业务标识的业务项目的用户行为数据,确定所述存在热门业务标识的服务项目执行场景中的各个服务项目交互场景的知识质量评估信息的步骤,包括:根据设定的存在热门业务标识的业务项目的用户行为数据与存在热门业务标识的服务项目执行场景中各个服务项目交互场景的知识质量评估信息的映射关系,以及所述存在热门业务标识的业务项目的用户行为数据,确定所述存在热门业务标识的服务项目执行场景中的各个服务项目交互场景的知识质量评估信息。5.根据权利要求1所述的方法,其特征在于,在所述存在热门业务标识的服务项目执行场景为一个时,所述方法还包括:在确定所述存在热门业务标识的服务项目执行场景的全局知识融合指向信息之后,将所述存在热门业务标识的服务项目执行场景的全局知识融合指向信息作为所述当前在线服务推送项目的存在热门业务标识的服务项目执行场景的过渡知识融合指向信...

【专利技术属性】
技术研发人员:汪威
申请(专利权)人:汪威
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1