一种知识追踪方法及系统技术方案

技术编号:39598840 阅读:13 留言:0更新日期:2023-12-03 19:57


【技术实现步骤摘要】
一种知识追踪方法及系统


[0001]本专利技术涉及文本信息处理
,特别是指一种知识追踪方法及系统


技术介绍

[0002]知识管理在当今信息爆炸的时代变得至关重要

在知识学习过程中,比如学生学习过程以及企业生产学习过程中,会衍生出大量的文本

图像或者其他类型的知识素材,这些知识素材中蕴含丰富且现有资源中不曾出现的宝贵知识,具有较大的知识价值,尤其是技术知识

技术经验等

若是将这些知识素材更好地进行知识管理

加以提取利用,则可以为用户或者企业带来更多的价值

[0003]知识追踪,在知识管理中起到主要的作用

旨在追踪在学习和生产过程中产生的技术素材,并构建对应的知识库,将知识库投入后续的学习或者生产运营

[0004]现有的知识库,通过采用知识库管理工具
/
助手,对企业或者用户的知识资产进行管理

现有通用的知识库,主要是一种用于知识管理的数据库,用于相关应用领域知识的收集

重新整理以及抽取

知识库中的知识来源于专家或是专业人士的经验和教训,虽然构建简单,但是也存在一些问题:现有知识库中管理的知识数据,来源主要是相关应用领域知识的收集,并加以形式上的整理和应用,因此缺乏知识要素的实体识别,缺乏知识要素之间的关联关系,关联信息比较模糊,无法直观为企业或者用户提供可视化的关联数据,不便于知识信息的管理

检索和追踪;现有知识库中知识数据,为用户提供的知识库文档,较为直接,直接为用户展示整理的经验和教训,缺乏知识数据的关键信息提取和知识要素的分析,缺乏深度知识分析应用


技术实现思路

[0005]本专利技术实施例提供了一种知识追踪方法及系统,能够依托知识实体的关联关系,进行有序

可视化的知识数据管理和应用,通过融合生成的知识图谱,能够快速地让用户了解到对应的知识点位置和关联性,并提供知识点的关联性和知识文本的情感
/
内容倾向以及态度分析,供用户更好地了解知识的内容

深度分析和应用知识图谱,最大化利用知识价值,从而实现智能地管理

检索和追踪知识

所述技术方案如下:一方面,提供了一种知识追踪方法,该方法应用于电子设备,该方法包括:
S1、
提取知识文本数据并缓存至分布式文件系统;
S2、
通过预先部署的
AI
实体识别模型,自动识别所述分布式文件系统中缓存的所述知识文本数据中的实体要素以及实体要素之间的关联关系
T
,并将所述关联关系
T
映射保存至数据库;
S3、
定时通知知识库构建模块抽取所述关联关系
T
,在所述知识库构建模块上,基于所述关联关系
T
执行知识图谱构建活动
G
,以融合实体要素的文本摘要

情感
/
内容倾向以
及态度,生成知识图谱,并将所述知识图谱实时推荐至知识管理平台;
S4、
通过所述知识管理平台管理所述知识图谱,供用户通过应用端访问,开展对所述知识图谱的检索应用

[0006]进一步地,所述提取知识文本数据并缓存至分布式文件系统包括:
S11、
提取知识文本数据,批量对提取的所述知识文本数据进行预处理和清洗;
S12、
对批量处理后的所述知识文本数据,按照文本类型进行数据分类,得到由若干不同文本类型的知识文本数据块组成的数据集
M
,其中,
M={
知识文本数据块1,知识文本数据块2,知识文本数据块
3......}

S13、
对所述数据集
M
中的各项知识文本数据块,按照预设的知识文本优先级进行有序编号,并进行序列优先重排,得到知识文本优排数据集
N

S14、
遍历分布式文件系统的各个存储节点,查看可用的所述存储节点,并将所述知识文本优排数据集
N
中的各项知识文本数据块,按照优先重排顺序分布储存于所述分布式文件系统的所述存储节点;
S15、
将各项知识文本数据块的储存地址,发送至后台服务器

[0007]进一步地,所述通过预先部署的
AI
实体识别模型,自动识别所述分布式文件系统中缓存的所述知识文本数据中的实体要素以及实体要素之间的关联关系
T
,并将所述关联关系
T
映射保存至数据库包括:
S21、
后台服务器接收到所述储存地址之时,通知预先部署的
AI
实体识别模型调用储存在所述储存地址的知识文本数据块;
S22、
通过所述
AI
实体识别模型对所述知识文本数据块进行实体识别,自动识别得到所述知识文本数据块中的实体要素
m
,同时根据所述实体要素
m
的上下文文本信息,关联识别得到所述实体要素之间的关联关系
T

m1

m2
;其中,
m1

m2
都表示实体要素;
S23、
将所述实体要素
m
和所述关联关系
T
进行关联绑定,并将所述关联关系
T
映射保存至数据库;
S24、
按照步骤
S21
‑ꢀ
S23
,依次对所述知识文本优排数据集
N
中的各项知识文本数据块进行实体识别和关联绑定

保存

[0008]进一步地,所述基于所述关联关系
T
执行知识图谱构建活动
G
,以融合实体要素的文本摘要

情感
/
内容倾向以及态度,生成知识图谱包括:
S31、
在知识管理平台的创建页面上,为各个所述实体要素分配对应的实体代表节点;
S32、
根据所述实体要素之间的关联关系
T
,将具有关联性的所述实体代表节点进行关联;
S33、
对所述实体代表节点进行配置,将对应所述实体要素的文本摘要信息和所述情感
/
内容倾向以及态度,绑定至所述实体代表节点;
S34、
绑定完毕,对所述实体代表节点进行元数据配置,在创建页面上生成对应的所述知识图谱

[0009]进一步地,所述活动
G
表示为:
G=∏X K L
,其中,
X
表示实体本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种知识追踪方法,其特征在于,包括:
S1、
提取知识文本数据并缓存至分布式文件系统;
S2、
通过预先部署的
AI
实体识别模型,自动识别所述分布式文件系统中缓存的所述知识文本数据中的实体要素以及实体要素之间的关联关系
T
,并将所述关联关系
T
映射保存至数据库;
S3、
定时通知知识库构建模块抽取所述关联关系
T
,在所述知识库构建模块上,基于所述关联关系
T
执行知识图谱构建活动
G
,以融合实体要素的文本摘要

情感
/
内容倾向以及态度,生成知识图谱,并将所述知识图谱实时推荐至知识管理平台;
S4、
通过所述知识管理平台管理所述知识图谱,供用户通过应用端访问,开展对所述知识图谱的检索应用
。2.
根据权利要求1所述的知识追踪方法,其特征在于,所述提取知识文本数据并缓存至分布式文件系统包括:
S11、
提取知识文本数据,批量对提取的所述知识文本数据进行预处理和清洗;
S12、
对批量处理后的所述知识文本数据,按照文本类型进行数据分类,得到由若干不同文本类型的知识文本数据块组成的数据集
M
,其中,
M={
知识文本数据块1,知识文本数据块2,知识文本数据块
3......}

S13、
对所述数据集
M
中的各项知识文本数据块,按照预设的知识文本优先级进行有序编号,并进行序列优先重排,得到知识文本优排数据集
N

S14、
遍历分布式文件系统的各个存储节点,查看可用的所述存储节点,并将所述知识文本优排数据集
N
中的各项知识文本数据块,按照优先重排顺序分布储存于所述分布式文件系统的所述存储节点;
S15、
将各项知识文本数据块的储存地址,发送至后台服务器
。3.
根据权利要求2所述的知识追踪方法,其特征在于,所述通过预先部署的
AI
实体识别模型,自动识别所述分布式文件系统中缓存的所述知识文本数据中的实体要素以及实体要素之间的关联关系
T
,并将所述关联关系
T
映射保存至数据库包括:
S21、
后台服务器接收到所述储存地址之时,通知预先部署的
AI
实体识别模型调用储存在所述储存地址的知识文本数据块;
S22、
通过所述
AI
实体识别模型对所述知识文本数据块进行实体识别,自动识别得到所述知识文本数据块中的实体要素
m
,同时根据所述实体要素
m
的上下文文本信息,关联识别得到所述实体要素之间的关联关系
T

m1

m2
;其中,
m1

m2
都表示实体要素;
S23、
将所述实体要素
m
和所述关联关系
T
进行关联绑定,并将所述关联关系
T
映射保存至数据库;
S24、
按照步骤
S21
‑ꢀ
S23
,依次对所述知识文本优排数据集
N
中的各项知识文本数据块进行实体识别和关联绑定

保存
。...

【专利技术属性】
技术研发人员:屠静王亚赵策张玥雷媛媛孙岩潘亮亮刘岩刘莎
申请(专利权)人:卓世科技海南有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1