【技术实现步骤摘要】
一种知识萃取方法、装置、设备及可读存储介质
[0001]本专利技术涉及网络知识萃取
,具体而言,涉及一种知识萃取方法
、
装置
、
设备及可读存储介质
。
技术介绍
[0002]随着科技的飞速发展,互联网已经逐渐渗透至人们的日常生活中,互联网中存在着大量的信息供人学习,企业培训作为企业十分重视的环节同样可以对互联网中的企业培训知识进行萃取,用于对员工进行培训,以提高企业的管理效率和产量,但是现有的知识萃取方法,难以针对每个人的具体情况进行企业培训知识的个性化推荐,以实现每个学习自己所需的培训内容
。
技术实现思路
[0003]本专利技术的目的在于提供了一种知识萃取方法
、
装置
、
设备及可读存储介质,以改善上述问题
。
[0004]为了实现上述目的,本申请实施例提供了如下技术方案:一方面,本申请实施例提供了一种知识萃取方法,所述方法包括:获取第一信息和第二信息,所述第一信息包括企业培训领域的相关数据,所述第二信息包括待培训企业的行业类别信息;根据所述待培训企业的行业类别信息对所述第一信息进行萃取,得到第三信息,所述第三信息包括与待培训企业的行业类别相关的企业培训数据;将所述第三信息进行分类,得到分类后的第三信息,所述分类后的第三信息为按工作岗位分类的企业培训数据;根据分类后的第三信息确定每个岗位的工作人员所需培训的相关数据
。
[0005]第二方面,本申请实施例提供了一种知识萃取装置 ...
【技术保护点】
【技术特征摘要】
1.
一种知识萃取方法,其特征在于,包括:获取第一信息和第二信息,所述第一信息包括企业培训领域的相关数据,所述第二信息包括待培训企业的行业类别信息;根据所述待培训企业的行业类别信息对所述第一信息进行萃取,得到第三信息,所述第三信息包括与待培训企业的行业类别相关的企业培训数据;将所述第三信息进行分类,得到分类后的第三信息,所述分类后的第三信息为按工作岗位分类的企业培训数据;根据分类后的第三信息确定每个岗位的工作人员所需培训的相关数据
。2.
根据权利要求1所述的知识萃取方法,其特征在于,将所述第三信息进行分类,得到分类后的第三信息,包括:根据所述第三信息确定第三信息中每个句子的关键词信息;计算每个句子中的所述关键词信息与预设的关键词信息之间的相似度,得到相似度信息,所述预设的关键词信息为表征企业的行业类别的关键词;根据第三信息中每个句子对应的句向量与每个句子对应的相似度信息进行加权求和,得到特征信息;根据所述特征信息对所述第三信息进行分类,得到所述分类后的第三信息
。3.
根据权利要求1所述的知识萃取方法,其特征在于,根据分类后的第三信息确定每个岗位的工作人员所需培训的相关数据,包括:获取第一图片信息,所述第一图片信息包括待评级的题目信息;将所述第一图片信息进行分割,得到第二图片信息和第三图片信息,所述第二图片信息包括工作人员填涂的答题卡信息,所述第三图片信息包括工作人员在预设的文本框中填写的文本信息;根据所述第二图片信息得到第一评分信息;根据所述第三图片信息得到第二评分信息;根据所述第一评分信息和所述第二评分信息对工作人员的工作能力进行评估,得到每个工作人员的工作能力等级;根据每个工作人员的工作能力等级确定每个岗位工作人员所需培训的相关数据
。4.
根据权利要求3所述的知识萃取方法,其特征在于,根据所述第二图片信息得到第一评分信息,包括:将所述第二图片信息进行修正,得到修正后的第二图片信息;将所述修正后的第二图片信息进行切分,得到第四图片信息,所述第四图片信息包括填涂点的位置信息;计算每个选项中填涂点的平均灰度,得到平均灰度信息,所述平均灰度信息为选项中填涂点像素的平均灰度值;判断选项为单选题还是多选题,得到判断结果;根据所述判断结果和所述平均灰度信息对选项进行识别,得到第一评分信息
。5.
一种知识萃取系统,其特征在于,包括:获取模块,用于获取第一信息和第二信息,所述第一信息包括企业培训领域的相关数据,所述第二信息包括待培训企业的行业类别信息;
萃取模块,用于根据所述待培训企业的行业类别信息对所述第一信息进行萃取,得到第三信息,所述第三信息包括与待培训企业...
【专利技术属性】
技术研发人员:孙小雨,陈一玮,孟政国,
申请(专利权)人:酷渲北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。