基于知识图谱的领域知识推送方法技术

技术编号：28208324 阅读：31 留言：0更新日期：2021-04-24 14:40

本发明专利技术公开了一种基于知识图谱的领域知识推送方法，包括：收集领域知识文本构建文本知识库；针对知识库文本进行语义分析和主题建模；通过领域知识图谱嵌入获得节点的语义分布向量；依据用户任务描述、任务主题建立任务上下文特征；根据任务描述中的领域实体与知识图谱进行实体对齐，基于图谱节点路径和图节点语义分布特征进行特征扩展并进行任务关联知识召回；将召回文本与用户任务文本进行文本相似度计算获得候选文本得分；根据得分将排序结果文本推送给用户。本发明专利技术通过知识图谱的节点关联知识和图谱嵌入技术来提升领域知识推送的文本匹配度和用户体验。文本匹配度和用户体验。文本匹配度和用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于知识图谱的领域知识推送方法

[0001]本专利技术属于计算机应用技术，具体为一种基于知识图谱的领域知识推送方法。

技术介绍

[0002]在日益规模化的生产和激烈的服务竞争中，随着大规模的复杂业务系统不断出现，企业进行了大量业务知识管理，积累了海量丰富的系统管理知识。规模化的复杂系统必不可少的会出现诸多缺陷，需要经常进行规范化的系统检查和缺陷修复。但是目前现场检修作业一般都是通过工作人员的技术、经验积累来进行系统的排查，缺乏有效的实用化的智能支撑手段来帮助工作人员进行规范化的操作、快速获取系统故障相关知识以及相关资料的快速更新。
[0003]随着业务系统的不断发展，覆盖范围不断扩大，数量不断增加，网络架构不断升级，系统维护的复杂度不断提高。因此，在系统的维护过程中要求运维人员做到操作规范，处理方法符合要求。因此通过企业积累的领域知识构建一套体系化可操作的运维流程和指导业务操作流程的知识推送系统，提升整个维护工作的质量和效率的需求是十分必要的。
[0004]知识推送是依据一定的协议，自动从服务器中选择特定的与用户相关或用户感兴趣的信息，并通过一定的方式定期传送给用户以减少用户学习成本的一种技术。知识推送主要分三个阶段，用户数据采集阶段，数据加工阶段和推送阶段。它的主要思想是服务器根据获取到的用户的状态和意图主动向用户推送用户感兴趣的信息，并以此减少用户对信息的检索时间，同时根据用户目的和兴趣进行信息的筛选，帮助用户发掘有价值的信息，提高了用户获取信息的准确率和效率。现阶段各个行业都在相关领域进行系统中...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的领域知识推送方法，其特征在于，具体步骤为：步骤1、构建文本知识库，所述文本知识库由领域知识文本构成；步骤2、针对知识库文本进行语义分析和主题建模；步骤3、通过对领域知识图谱进行图嵌入式处理获得知识点的语义分布向量；步骤4、依据用户任务描述、任务主题建立任务上下文特征向量；步骤5、将用户任务描述文本中的领域实体与步骤3中的领域知识图谱进行实体对齐，基于图谱节点路径和图节点语义分布特征进行特征扩展并进行任务关联知识召回；步骤6、将步骤5获得的召回文本与用户任务进行文本相似度计算，获得召回文本得分；步骤7、根据得分将排序结果文本推送给用户；步骤8、若用户任务结束则推送终止；当用户场景和状态变化时则重复步骤4至7。2.根据权利要求1所述的基于知识图谱的领域知识推送方法，其特征在于，文本知识库的构建方法为：按照领域任务需求进行知识范围确定，对内容进行筛选；对文本进行分句，过滤停用词；将最终的文本集合构建为文本知识库。3.根据权利要求1所述的基于知识图谱的领域知识推送方法，其特征在于，针对知识库文本进行语义分析的具体方法为：将知识文本进行分词，采用无监督的WORD2VEC词嵌入算法对文本进行训练获取词的语义分布向量；采用基于词向量加权和的方法计算文本句子的语义向量。4.根据权利要求1所述的基于知识图谱的领域知识推送方法，其特征在于，进行文本主题建模的具体方法为：将知识库中的文本进行分词，根据分词结果对知识库中文本句子做词频统计，将词频低于预设阈值的文本进行词过滤；对句子进行字符处理，获得知识库文本的BIGRAM字典并用于构建文本到对应词袋向量的映射表；通过映射表获得知识库文本的词袋向量，将其作为LDA算法的输入进行训练，获得知识库文本的主题分布向量。5.根据权利要求1所述的基于知识图谱的领域知识推送方法，其特征在于，获取知识图谱节点语义分布向量的具体方法为：步骤3.1、构建领域知识图谱，包括命名实体识别和关系抽取两个任务，采用基于BERT预训练模型进行有监督学习获得领...

【专利技术属性】
技术研发人员：李蔚清，颜于升，
申请(专利权)人：南京理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人