【技术实现步骤摘要】
一种知识追踪方法及系统
[0001]本专利技术涉及文本信息处理
,特别是指一种知识追踪方法及系统
。
技术介绍
[0002]知识管理在当今信息爆炸的时代变得至关重要
。
在知识学习过程中,比如学生学习过程以及企业生产学习过程中,会衍生出大量的文本
、
图像或者其他类型的知识素材,这些知识素材中蕴含丰富且现有资源中不曾出现的宝贵知识,具有较大的知识价值,尤其是技术知识
、
技术经验等
。
若是将这些知识素材更好地进行知识管理
、
加以提取利用,则可以为用户或者企业带来更多的价值
。
[0003]知识追踪,在知识管理中起到主要的作用
。
旨在追踪在学习和生产过程中产生的技术素材,并构建对应的知识库,将知识库投入后续的学习或者生产运营
。
[0004]现有的知识库,通过采用知识库管理工具
/
助手,对企业或者用户的知识资产进行管理
。
现有通用的知识库,主要是一种用于知识管理的数据库,用于相关应用领域知识的收集
、
重新整理以及抽取
。
知识库中的知识来源于专家或是专业人士的经验和教训,虽然构建简单,但是也存在一些问题:现有知识库中管理的知识数据,来源主要是相关应用领域知识的收集,并加以形式上的整理和应用,因此缺乏知识要素的实体识别,缺乏知识要素之间的关联关系,关联信息比较模糊,无法直观为企业或者用户提供可视化的关联数据 ...
【技术保护点】
【技术特征摘要】
1.
一种知识追踪方法,其特征在于,包括:
S1、
提取知识文本数据并缓存至分布式文件系统;
S2、
通过预先部署的
AI
实体识别模型,自动识别所述分布式文件系统中缓存的所述知识文本数据中的实体要素以及实体要素之间的关联关系
T
,并将所述关联关系
T
映射保存至数据库;
S3、
定时通知知识库构建模块抽取所述关联关系
T
,在所述知识库构建模块上,基于所述关联关系
T
执行知识图谱构建活动
G
,以融合实体要素的文本摘要
、
情感
/
内容倾向以及态度,生成知识图谱,并将所述知识图谱实时推荐至知识管理平台;
S4、
通过所述知识管理平台管理所述知识图谱,供用户通过应用端访问,开展对所述知识图谱的检索应用
。2.
根据权利要求1所述的知识追踪方法,其特征在于,所述提取知识文本数据并缓存至分布式文件系统包括:
S11、
提取知识文本数据,批量对提取的所述知识文本数据进行预处理和清洗;
S12、
对批量处理后的所述知识文本数据,按照文本类型进行数据分类,得到由若干不同文本类型的知识文本数据块组成的数据集
M
,其中,
M={
知识文本数据块1,知识文本数据块2,知识文本数据块
3......}
;
S13、
对所述数据集
M
中的各项知识文本数据块,按照预设的知识文本优先级进行有序编号,并进行序列优先重排,得到知识文本优排数据集
N
;
S14、
遍历分布式文件系统的各个存储节点,查看可用的所述存储节点,并将所述知识文本优排数据集
N
中的各项知识文本数据块,按照优先重排顺序分布储存于所述分布式文件系统的所述存储节点;
S15、
将各项知识文本数据块的储存地址,发送至后台服务器
。3.
根据权利要求2所述的知识追踪方法,其特征在于,所述通过预先部署的
AI
实体识别模型,自动识别所述分布式文件系统中缓存的所述知识文本数据中的实体要素以及实体要素之间的关联关系
T
,并将所述关联关系
T
映射保存至数据库包括:
S21、
后台服务器接收到所述储存地址之时,通知预先部署的
AI
实体识别模型调用储存在所述储存地址的知识文本数据块;
S22、
通过所述
AI
实体识别模型对所述知识文本数据块进行实体识别,自动识别得到所述知识文本数据块中的实体要素
m
,同时根据所述实体要素
m
的上下文文本信息,关联识别得到所述实体要素之间的关联关系
T
:
m1
→
m2
;其中,
m1
和
m2
都表示实体要素;
S23、
将所述实体要素
m
和所述关联关系
T
进行关联绑定,并将所述关联关系
T
映射保存至数据库;
S24、
按照步骤
S21
‑ꢀ
S23
,依次对所述知识文本优排数据集
N
中的各项知识文本数据块进行实体识别和关联绑定
、
保存
。...
【专利技术属性】
技术研发人员:屠静,王亚,赵策,张玥,雷媛媛,孙岩,潘亮亮,刘岩,刘莎,
申请(专利权)人:卓世科技海南有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。