一种企业知识库数据储存方法、装置及存储介质制造方法及图纸

技术编号:36787639 阅读:16 留言:0更新日期:2023-03-08 22:32
本发明专利技术涉及用于企业的数据处理技术领域,特别是涉及一种企业知识库数据储存方法、装置及存储介质。方法包括筛选素材文本,产生多个关键词,对所述关键词进行关联处理,根据所述关键词在不同业务内的词频进行归类,形成多个知识数据;根据知识数据的关键词或关联词组识别知识数据的业务区域,并根据知识库构架模型构建子知识库;所述子知识库能够根据输入的关键词选择检索策略并输出给用户。能够为信息化项目、运维、客服人员提供知识搜索、知识图谱、智能应答等功能,提升信息化整体解决能力,提高解决效率。高解决效率。高解决效率。

【技术实现步骤摘要】
一种企业知识库数据储存方法、装置及存储介质


[0001]本专利技术涉及用于企业的数据处理
,特别是涉及一种企业知识库数据储存方法、装置及存储介质。

技术介绍

[0002]随着互联网的兴起,大数据时代的到来,数据、算力、模型的飞速发展,以知识图谱为代表的大数据知识工程应运而生。2012年,谷歌率先推出了面向搜索的大规模知识图谱。发展至今日,知识图谱已发展为人工智能范畴中的一种技术体系,本质上, 知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。知识图谱在数据分析、智慧搜索、智能推荐、自然人机交互、决策支持等应用方面有突出表现。
[0003]公司数字化转型工作涉及到信息化项目建设、信息系统运维、信息专业客服等领域,并配套印发了相应制度。公司每年信息化项目数量多,建设的系统功能繁杂,同时衍生出大量运维及客服工作。
[0004]大量的信息化项目、信息系统运维、信息系统客服的数据和文档分散在各个信息系统或线下,难以统一收集管理,更无法系统地从中提取归纳出需要的信息及关系,由此将出现项目立项内容重复、运维客服问题解决经验难以传递、客服问题无法高效解决等问题。
[0005]针对以上问题,亟需以知识管理工具为基础建设一套知识图谱及智慧搜索系统,为信息化项目、运维、客服人员提供知识搜索、知识图谱、智能应答等功能,提升信息化整体解决能力,提高解决效率。

技术实现思路

[0006]本专利技术要解决的技术问题是:提供一种企业知识库数据储存方法、装置及存储介质,以克服现有技术的不足。
[0007]本专利技术的技术方案是:一方面,本专利技术公开了一种企业知识库数据储存方法,包括:筛选素材文本,产生多个关键词,所述关键词是待建知识库所涉及的业务中多次出现的关键词;对所述关键词进行关联处理,根据所述关键词在不同业务内的词频进行归类,以及根据多个关键词共同出现的词频进行关联形成关联词组;将所述关键词和所述关联词组进行扩展,形成多个知识数据;根据知识数据的关键词或关联词组识别知识数据的业务区域,并根据知识库构架模型构建子知识库;所述子知识库能够根据输入的关键词选择检索策略并输出给用户。
[0008]优选地,还包括在所述建子知识库过程中检测当前子知识库与其他业务的子知识库的知识数据是否关联,并生成关系信息,以及检测各知识库中是否存在矛盾的知识,若
有,则进行标记进行人工研判。
[0009]优选地,所述关键词和所述关联词组进行扩展包括对同义词、相关词、简写、错字进行扩展,并以扩展后的所述关键词和所述关联词组作为要素收集知识库中包含所述要素的至少一个问题,并与所述问题的答案形成所述知识数据。
[0010]进一步地,所述根据知识库构架模型构建子知识库包括:列表类知识库架构模型;所述列表类知识库架构模型通过构建列表类知识集合进行构建;概念类知识库架构模型;所述概念类知识库架构模型通过构建概念类知识集合进行构建;FAQ类知识库架构模型;所述FAQ类知识库架构模型通过构建FAQ类知识集合进行构建。
[0011]进一步地,所述列表类知识集合包括列表类问答,包括至少一个标准问题和至少一个标准答案,并根据问答中的关键词扩展,共同形成所述列表类知识集合;所述概念类知识集合包括至少一个标准问题和至少一个标准答案,以及标准问题和标准答案的扩展概念,共同形成所述概念类知识集合;所述FAQ类知识集合包至少一个标准问题和至少一个标准答案,以及至少一个由标准问题和标准答案扩展的问题。
[0012]第二方面,本专利技术公开了一种企业知识库数据储存装置,包括:生成模块,用于筛选素材文本,产生多个关键词,所述关键词是待建知识库所涉及的业务中多次出现的关键词;并对所述关键词进行关联处理,根据所述关键词在不同业务内的词频进行归类,以及根据多个关键词共同出现的词频进行关联形成关联词组;再将所述关键词和所述关联词组进行扩展,形成多个知识数据。
[0013]优选地,还包括构建模块,用于根据知识数据的关键词或关联词组识别知识数据的业务区域,并根据知识库构架模型构建子知识库,其中所述知识库架构模型包括:列表类知识库架构模型、概念类知识库架构模型和FAQ类知识库架构模型。
[0014]优选地,还包括判断模块,用于在所述建子知识库过程中检测当前子知识库与其他业务的子知识库的知识数据是否关联,并生成关系信息,以及检测各知识库中是否存在矛盾的知识,若有,则进行标记进行人工研判。
[0015]优选地,还包括输出模块。用于根据输入的关键词选择检索策略并输出给用户。
[0016]第三方面,本专利技术还公开了一种存储介质,所述存储介质存储有多条指令,所述指令适用于由处理器加载并执行如上述中任意一项所述的企业知识库储存方法。
[0017]本专利技术的有益效果是:与现有技术相比,通过将知识库划分为不同类型的子知识库,每个子知识库具有对应不同的架构模型和对应的架构规则,进而可利用不同的架构规则构建相应的子知识库,从而有效避免相同语句和词汇的重复录入,提高存储器的存储空间的利用率,并且有效降低工作人员录入量。更为主要的是通过不同类型的子知识库实现针对不同用户的优化输出结果,提高准确率的同时避免产生矛盾点。
附图说明
[0018]图1是根据本专利技术实施例的流程图。
具体实施方式
[0019]为了更好的理解上述技术方案,下面将结合说明书附图以及具体实施方式对上述技术方案进行详细说明。
[0020]实施实例1:参考图1,本专利技术提供了一种企业知识库数据储存方法,包括:筛选素材文本,产生多个关键词,所述关键词是待建知识库所涉及的业务中多次出现的关键词;对所述关键词进行关联处理,根据所述关键词在不同业务内的词频进行归类,以及根据多个关键词共同出现的词频进行关联形成关联词组;将所述关键词和所述关联词组进行扩展,形成多个知识数据;根据知识数据的关键词或关联词组识别知识数据的业务区域,并根据知识库构架模型构建子知识库;所述子知识库能够根据输入的关键词选择检索策略并输出给用户。
[0021]所述业务区域可分为:综合知识区域:要求输入关键字在知识库中进行全局知识搜索,支持全文检索功能,高亮显示匹配关键字或摘要内容;项目知识区域:要求信息化项目实体及相关文档专用查询场景,根据输入关键字以信息化项目实体或相关文档知识范围内的文档知识进行检索,支持全文检索功能,高亮显示匹配关键字或摘要内容;制度知识区域:要求信息化制度相关文档专用查询场景,根据输入关键字以信息化制度相关文档知识范围内的文档知识进行检索,支持全文检索功能,高亮显示匹配关键字或摘要内容;客服知识区域:要求客服等数字化业务知识专用查询场景,根据输入关键字和客服等数字化业务相关文档知识范围内的文档知识进行检索,支持全文检索功能,高亮显示匹配关键字或摘要内容,支持按文档存放路径进行文档查找;运维知识区域:信息化系统运维知识搜索相关文档专用查询场景,根据输入关键字以信息化系统运维相关文档知识范围内的文本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种企业知识库数据储存方法,其特征在于,包括:筛选素材文本,产生多个关键词,所述关键词是待建知识库所涉及的业务中多次出现的关键词;对所述关键词进行关联处理,根据所述关键词在不同业务内的词频进行归类,以及根据多个关键词共同出现的词频进行关联形成关联词组;将所述关键词和所述关联词组进行扩展,形成多个知识数据;根据知识数据的关键词或关联词组识别知识数据的业务区域,并根据知识库构架模型构建子知识库;所述子知识库能够根据输入的关键词选择检索策略并输出给用户。2.根据权利要求1所述的企业知识库数据储存方法,其特征在于,还包括在所述建子知识库过程中检测当前子知识库与其他业务的子知识库的知识数据是否关联,并生成关系信息,以及检测各知识库中是否存在矛盾的知识,若有,则进行标记进行人工研判。3.根据权利要求1的企业知识库数据储存方法,其特征在于,所述关键词和所述关联词组进行扩展包括对同义词、相关词、简写、错字进行扩展,并以扩展后的所述关键词和所述关联词组作为要素收集知识库中包含所述要素的至少一个问题,并与所述问题的答案形成所述知识数据。4.根据权利要求3的企业知识库数据储存方法,其特征在于,所述根据知识库构架模型构建子知识库包括:列表类知识库架构模型;所述列表类知识库架构模型通过构建列表类知识集合进行构建;概念类知识库架构模型;所述概念类知识库架构模型通过构建概念类知识集合进行构建;FAQ类知识库架构模型;所述FAQ类知识库架构模型通过构建FAQ类知识集合进行构建。5.根据权利要求4的企业知识库数据储存方法,其特征在于,所述列表类知识集合包括列表类问答,包括至少一个标准问题和至少一个标准答...

【专利技术属性】
技术研发人员:马艳洁陆岫昶鲍晨漪易也陈运晶钱俊凤纪元周玲娄方桥
申请(专利权)人:贵州电网有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1