一种知识萃取方法技术

技术编号:39674373 阅读:7 留言:0更新日期:2023-12-11 18:40
本发明专利技术涉及网络知识萃取技术领域,提供一种知识萃取方法

【技术实现步骤摘要】
一种知识萃取方法、装置、设备及可读存储介质


[0001]本专利技术涉及网络知识萃取
,具体而言,涉及一种知识萃取方法

装置

设备及可读存储介质


技术介绍

[0002]随着科技的飞速发展,互联网已经逐渐渗透至人们的日常生活中,互联网中存在着大量的信息供人学习,企业培训作为企业十分重视的环节同样可以对互联网中的企业培训知识进行萃取,用于对员工进行培训,以提高企业的管理效率和产量,但是现有的知识萃取方法,难以针对每个人的具体情况进行企业培训知识的个性化推荐,以实现每个学习自己所需的培训内容


技术实现思路

[0003]本专利技术的目的在于提供了一种知识萃取方法

装置

设备及可读存储介质,以改善上述问题

[0004]为了实现上述目的,本申请实施例提供了如下技术方案:一方面,本申请实施例提供了一种知识萃取方法,所述方法包括:获取第一信息和第二信息,所述第一信息包括企业培训领域的相关数据,所述第二信息包括待培训企业的行业类别信息;根据所述待培训企业的行业类别信息对所述第一信息进行萃取,得到第三信息,所述第三信息包括与待培训企业的行业类别相关的企业培训数据;将所述第三信息进行分类,得到分类后的第三信息,所述分类后的第三信息为按工作岗位分类的企业培训数据;根据分类后的第三信息确定每个岗位的工作人员所需培训的相关数据

[0005]第二方面,本申请实施例提供了一种知识萃取装置,所述装置包括:获取模块,用于获取第一信息和第二信息,所述第一信息包括企业培训领域的相关数据,所述第二信息包括待培训企业的行业类别信息;萃取模块,用于根据所述待培训企业的行业类别信息对所述第一信息进行萃取,得到第三信息,所述第三信息包括与待培训企业的行业类别相关的企业培训数据;分类模块,用于将所述第三信息进行分类,得到分类后的第三信息,所述分类后的第三信息为按工作岗位分类的企业培训数据;确定模块,用于根据分类后的第三信息确定每个岗位的工作人员所需培训的相关数据

[0006]第三方面,本申请实施例提供了一种知识萃取设备,所述设备包括存储器和处理器

存储器用于存储计算机程序;处理器用于执行所述计算机程序时实现上述知识萃取方法的步骤

[0007]第四方面,本申请实施例提供了一种可读存储介质,所述可读存储介质上存储有
计算机程序,所述计算机程序被处理器执行时实现上述知识萃取方法的步骤

[0008]本专利技术的有益效果为:本专利技术根据待培训企业的具体行业类别对大数据进行萃取,得到与待培训企业的行业类别相关的企业培训数据,再根据企业的工作岗位对相关的企业培训数据进行进一步的分类,使每个工作岗位对应的员工只需学习与其岗位相关的培训资料,针对每个岗位对应的员工进行工作能力的评估,根据不同的工作能力实现培训资料的个性化推荐,使每个员工学习自己当前所需的培训内容,提高培训效率

[0009]本专利技术的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术实施例了解

本专利技术的目的和其他优点可通过在所写的说明书

权利要求书

以及附图中所特别指出的结构来实现和获得

附图说明
[0010]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图

[0011]图1为本专利技术实施例中所述的知识萃取方法流程示意图

[0012]图2为本专利技术实施例中所述的知识萃取装置结构示意图

[0013]图3为本专利技术实施例中所述的知识萃取设备结构示意图

[0014]图中标注:
901、
获取模块;
902、
萃取模块;
903、
分类模块;
904、
确定模块;
9031、
第一处理单元;
9032、
第二处理单元;
9033、
第三处理单元;
9034、
第四处理单元;
9041、
第一获取单元;
9042、
分割单元;
9043、
第一评分单元
;9044、
第二评分单元;
9045、
评估单元;
9046、
第十处理单元;
90311、
第五处理单元;
90312、
第六处理单元;
90313、
第七处理单元;
90314、
第八处理单元;
90315、
第九处理单元;
90431、
修正单元;
90432、
切分单元;
90433、
第十一处理单元;
90434、
判断单元;
90435、
识别单元;
90441、
第二获取单元;
90442、
第十二处理单元;
90443、
第十三处理单元;
90444、
第十四处理单元;
90445、
第十五处理单元;
90446、
第十六处理单元;
800、
知识萃取设备;
801、
处理器;
802、
存储器;
803、
多媒体组件;
804、I/O
接口;
805、
通信组件

具体实施方式
[0015]为使本专利技术实施例的目的

技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例

通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计

因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例

基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围

[0016]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释

同时,在本专利技术的
描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种知识萃取方法,其特征在于,包括:获取第一信息和第二信息,所述第一信息包括企业培训领域的相关数据,所述第二信息包括待培训企业的行业类别信息;根据所述待培训企业的行业类别信息对所述第一信息进行萃取,得到第三信息,所述第三信息包括与待培训企业的行业类别相关的企业培训数据;将所述第三信息进行分类,得到分类后的第三信息,所述分类后的第三信息为按工作岗位分类的企业培训数据;根据分类后的第三信息确定每个岗位的工作人员所需培训的相关数据
。2.
根据权利要求1所述的知识萃取方法,其特征在于,将所述第三信息进行分类,得到分类后的第三信息,包括:根据所述第三信息确定第三信息中每个句子的关键词信息;计算每个句子中的所述关键词信息与预设的关键词信息之间的相似度,得到相似度信息,所述预设的关键词信息为表征企业的行业类别的关键词;根据第三信息中每个句子对应的句向量与每个句子对应的相似度信息进行加权求和,得到特征信息;根据所述特征信息对所述第三信息进行分类,得到所述分类后的第三信息
。3.
根据权利要求1所述的知识萃取方法,其特征在于,根据分类后的第三信息确定每个岗位的工作人员所需培训的相关数据,包括:获取第一图片信息,所述第一图片信息包括待评级的题目信息;将所述第一图片信息进行分割,得到第二图片信息和第三图片信息,所述第二图片信息包括工作人员填涂的答题卡信息,所述第三图片信息包括工作人员在预设的文本框中填写的文本信息;根据所述第二图片信息得到第一评分信息;根据所述第三图片信息得到第二评分信息;根据所述第一评分信息和所述第二评分信息对工作人员的工作能力进行评估,得到每个工作人员的工作能力等级;根据每个工作人员的工作能力等级确定每个岗位工作人员所需培训的相关数据
。4.
根据权利要求3所述的知识萃取方法,其特征在于,根据所述第二图片信息得到第一评分信息,包括:将所述第二图片信息进行修正,得到修正后的第二图片信息;将所述修正后的第二图片信息进行切分,得到第四图片信息,所述第四图片信息包括填涂点的位置信息;计算每个选项中填涂点的平均灰度,得到平均灰度信息,所述平均灰度信息为选项中填涂点像素的平均灰度值;判断选项为单选题还是多选题,得到判断结果;根据所述判断结果和所述平均灰度信息对选项进行识别,得到第一评分信息
。5.
一种知识萃取系统,其特征在于,包括:获取模块,用于获取第一信息和第二信息,所述第一信息包括企业培训领域的相关数据,所述第二信息包括待培训企业的行业类别信息;
萃取模块,用于根据所述待培训企业的行业类别信息对所述第一信息进行萃取,得到第三信息,所述第三信息包括与待培训企业...

【专利技术属性】
技术研发人员:孙小雨陈一玮孟政国
申请(专利权)人:酷渲北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1