一种基于知识图谱的北斗用户行为分析方法技术

技术编号:38587482 阅读:17 留言:0更新日期:2023-08-26 23:28
本发明专利技术公开了一种基于知识图谱的北斗用户行为分析方法,包括:获取北斗用户行为信息,并将北斗用户行为信息筛选为非结构化文本数据和结构化信息;针对非结构化文本数据和结构化信息,分别构建第一信息知识图谱和第二信息知识图谱;将第一信息知识图谱和第二信息知识图谱融合为信息知识总图谱;采用图卷积网络聚合目标节点领域信息从信息知识总图谱中获取图谱特征;基于用户历史行为交互记录,采用偏好传播方法获得用户行为特征;基于图谱特征和用户行为特征,通过交叉压缩法实现多特征高阶交互关联,获得用户行为规律。通过该方法可以实现量化分析北斗用户行为中的隐含规律,以及对北斗用户行为信息进行知识联合抽取。对北斗用户行为信息进行知识联合抽取。对北斗用户行为信息进行知识联合抽取。

【技术实现步骤摘要】
一种基于知识图谱的北斗用户行为分析方法


[0001]本专利技术属于用户行为分析
,特别是一种基于知识图谱的北斗用户行为分析方法。

技术介绍

[0002]基于电力业务的飞速发展,依托“北斗”卫星导航系统,将北斗授时、定位、短报文功能广泛应用在调度、运检、营销等领域,不断深化时空大数据研究与应用,为电力全时空、全业务高效稳健运行提供解决方案。但是当前“北斗”卫星导航系统用户应用需求分散、独立建设,导致出现资源浪费、标准不一、管理困难、响应延迟等问题。因此,通过对北斗用户行为分析获得用户行为规律,对更好掌握用户需求实现资源合理化管理和分配具有重要意义。
[0003]“北斗”卫星导航系统作为全球四大高水平卫星导航服务系统之一,截止至2022年3月底,全球用户已经达到11亿人。由此可知,“北斗”卫星导航系统下实时产生大量的用户行为信息,但海量用户行为信息结构复杂,多以非结构化的数据形式存储,缺乏系统有效的数据管理模式,无法对其中包含的用户行为知识直接利用。
[0004]为解决用户行为信息结构复杂、无法对其中包含的用户行为知识直接利用的问题,有研究人员提出一种基于特征分箱和K

Means算法的用户行为分析方法。该方法基于特征分箱中的用户信息管理模型将变量转化到相似的尺度上并将变量离散化,使得用户分类标签更加清晰,也可依据各类标签分类出不同类型的用户,在利用K

Means算法通过轮廓系数评估聚类算法质量以至于选取最优K值,从而实现用户行为特征的分析。该方法基于特征分箱和K

Means算法的用户行为分析方法,实现了用户行为分析,提高了资源分配的合理性,但是该方法无法量化分析用户行为,各类评价信息仅仅停留在主观评价方面,另外,对北斗用户行为信息中隐含的用户需求与资源分配、以及“北斗”卫星导航系统运行状态之间的关联知识无法进行有效提取和直接利用。
[0005]用户行为分析方法还包括基于机器学习的用户行为分析法和基于平台模型分析的用户行为分析法。基于机器学习的用户行为分析法利用先验知识进行建模,在从一定程度上提高了分析精度,但建模过程过于依赖样本标签。在实际应用中:一方面,样本标签的质量会对检测模型的构建起到非常大的影响;另一方面,对数据样本进行标注同样也会消耗大量人力成本与时间成本。基于平台模型分析的用户行为分析法,以平台构架为基础,以Hadoop来说,依据用户行为大数据,挖掘并分析其中用户相关的行为属性,构建一个完善的用户行为分析架构,同时针对实际用户行为的运用进行深入探索;但此类平台没有先进的功能模块,无法满足用户行为多样化模型需要,不能够完善行为分析与用户画像,无法构建合理指标。
[0006]因此,如何量化分析北斗用户行为中的隐含规律,为用户提供个性化服务和合理性资源分配;以及如何对北斗用户行为信息进行知识联合抽取,有效提取用户行为隐含的关联知识,成为当前研究的关键问题。

技术实现思路

[0007]鉴于上述问题,本专利技术提供一种至少解决上述部分技术问题的一种基于知识图谱的北斗用户行为分析方法,通过该方法可以实现量化分析北斗用户行为中的隐含规律,以及对北斗用户行为信息进行知识联合抽取。
[0008]本专利技术实施例提供了一种基于知识图谱的北斗用户行为分析方法,包括:
[0009]获取北斗用户行为信息,并将所述北斗用户行为信息筛选为非结构化文本数据和结构化信息;
[0010]针对所述非结构化文本数据和结构化信息,分别构建第一信息知识图谱和第二信息知识图谱;
[0011]将所述第一信息知识图谱和第二信息知识图谱融合为信息知识总图谱;
[0012]采用图卷积网络聚合目标节点领域信息从所述信息知识总图谱中获取图谱特征;
[0013]基于用户历史行为交互记录,采用偏好传播方法获得用户行为特征;
[0014]基于所述图谱特征和所述用户行为特征,通过交叉压缩法实现多特征高阶交互关联,获得用户行为规律。
[0015]进一步地,还包括:采用Cypher语言从所述信息知识总图谱中直接查询北斗用户信息。
[0016]进一步地,构建第一信息知识图谱,具体包括:获取所述非结构化文本数据的文本特征向量矩阵和实体特征向量对,基于此,获得所述非结构化文本数据中任意北斗用户行为实体间最大概率情况下的实体关系,并利用Neo4j数据库构建基于所述非结构化文本数据的信息知识图谱,记作第一信息知识图谱。
[0017]进一步地,构建第二信息知识图谱,具体包括:将所述结构化信息直接输入Neo4j数据库中,构建基于所述结构化信息的信息知识图谱,记作第二信息知识图谱。
[0018]进一步地,获取所述非结构化文本数据的文本特征向量矩阵,具体包括:
[0019]按照所述非结构化文本数据的句子长度,对所述非结构化文本数据进行分词、去停顿词和分句处理,并将所述非结构化文本数据存储为短文本形式;
[0020]对短文本中的北斗用户行为实体和实体关系的类别进行标注;
[0021]对标注的短文本进行文本词嵌入处理,获得预训练字向量矩阵;
[0022]根据所述预训练字向量矩阵,通过BiLSTM神经网络模型进行深度上下文特征提取,获得文本特征向量矩阵。
[0023]进一步地,对存储的短文本进行文本词嵌入处理,具体包括:
[0024]根据所述短文本提取输入向量;所述输入向量包括字向量、文本向量和位置向量;
[0025]将所述输入向量输入至ALBERT模型中进行预训练,最终输出预训练字向量矩阵。
[0026]进一步地,所述预训练具体包括:通过注意力机制对所述输入向量进行编码。
[0027]进一步地,获取所述非结构化文本数据的实体特征向量对,具体包括:
[0028]对所述非结构化文本数据进行北斗用户行为实体特征向量提取,获得北斗用户行为实体特征向量集合;
[0029]按照组合数计算公式从所述北斗用户行为实体特征向量集合中,依次针对每个北斗用户行为实体特征向量,抽取对应北斗用户行为的实体特征向量对,具体表示为:
[0030][0031]其中,T
i
表示第i个北斗用户行为的实体特征向量对;e
i
表示第i个北斗用户行为的实体特征向量;e
j
表示第j个北斗用户行为的实体特征向量。
[0032]进一步地,获得所述非结构化文本数据中任意北斗用户行为实体间最大概率情况下的实体关系,具体包括:
[0033]将所述文本特征向量矩阵和所述北斗用户行为实体特征向量对进行向量组合;
[0034]将组合后的向量输入至Attention层,完成对组合向量特征权重的重新匹配,输出时序加权和向量;
[0035]通过Softmax函数对所述时序加权和向量进行关系预测,获得所述非结构化文本数据中任意北斗用户行为实体间最大概率情况下的实体关系。
[0036]与现有技术相比,本专利技术记载的一种基于知识图谱本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的北斗用户行为分析方法,其特征在于,包括:获取北斗用户行为信息,并将所述北斗用户行为信息筛选为非结构化文本数据和结构化信息;针对所述非结构化文本数据和结构化信息,分别构建第一信息知识图谱和第二信息知识图谱;将所述第一信息知识图谱和第二信息知识图谱融合为信息知识总图谱;采用图卷积网络聚合目标节点领域信息从所述信息知识总图谱中获取图谱特征;基于用户历史行为交互记录,采用偏好传播方法获得用户行为特征;基于所述图谱特征和所述用户行为特征,通过交叉压缩法实现多特征高阶交互关联,获得用户行为规律。2.如权利要求1所述的一种基于知识图谱的北斗用户行为分析方法,其特征在于,还包括:采用Cypher语言从所述信息知识总图谱中直接查询北斗用户信息。3.如权利要求1所述的一种基于知识图谱的北斗用户行为分析方法,其特征在于,构建第一信息知识图谱,具体包括:获取所述非结构化文本数据的文本特征向量矩阵和实体特征向量对,基于此,获得所述非结构化文本数据中任意北斗用户行为实体间最大概率情况下的实体关系,并利用Neo4j数据库构建基于所述非结构化文本数据的信息知识图谱,记作第一信息知识图谱。4.如权利要求1所述的一种基于知识图谱的北斗用户行为分析方法,其特征在于,构建第二信息知识图谱,具体包括:将所述结构化信息直接输入Neo4j数据库中,构建基于所述结构化信息的信息知识图谱,记作第二信息知识图谱。5.如权利要求3所述的一种基于知识图谱的北斗用户行为分析方法,其特征在于,获取所述非结构化文本数据的文本特征向量矩阵,具体包括:按照所述非结构化文本数据的句子长度,对所述非结构化文本数据进行分词、去停顿词和分句处理,并将所述非结构化文本数据存储为短文本形式;对短文本中的北斗用户行为实体和实体关系的类别进行标注;对标注的短文本进行文本词嵌入处理,获得预训练字向...

【专利技术属性】
技术研发人员:杨頔王勇臧志斌郑越峰潘飚周萌张连广葛子昭王炳辉李兰心宋磊程爱粉宋伯宇
申请(专利权)人:国网信息通信产业集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1