【技术实现步骤摘要】
基于AI的面试语料分类方法、装置、计算机设备和介质
本申请涉及人工智能领域,特别是涉及一种基于AI的面试语料分类方法。
技术介绍
随着大数据和AI技术的迅速发展,在智能面试能力评估场景中,需要对面试者的回答的各个维度进行能力点评,因此每一个维度都需要训练一个文本分类模型,但是由于面试场景的语料不易获取,标注困难,因此在前期构建模型时通常会遇到缺乏语料的问题,当语料较少时,我们通常会在预先训练好的语言模型上用面试语料进行微调后来达到最终效果,其优点在于能够无监督地采用通用领域的语料训练模型,使得模型学到通用语言知识,解决了数据获取及对其标注都困难的问题。当模型学到通用语义,再用目标领域仅有的少量语料对模型进行微调,就可以得到目标领域中效果相对较好的模型,但是上述方式的缺点是语言模型通常参数数量很大,GPU/TPU内存难以支持其大量的数据运算,训练和推理速度都会变得很慢,难以在生产环境中部署并上线正常运行。中国专利技术专利申请公开号CN108664893A公开了一种人脸检测方法,提供了一种轻量级模型,用于解决现有技术中复 ...
【技术保护点】
1.一种基于AI的面试语料分类方法,其特征在于,所述方法包括:/n获取面试场景下的面试者的面试语料,并对所述面试语料进行去噪处理,得到专用语料;/n将所述专用语料输入预先训练的轻量模型中,其中,所述轻量模型包括编码层、transformer层以及预测层,所述轻量模型是对降维后的GPT模型训练得到的;/n通过所述编码层向量化处理所述专用语料,得到所述专用语料的语料输出矩阵;/n通过不同所述transformer层的权重矩阵为所述语料输出矩阵中的关键词生成权重系数,并将每一所述transformer层按照所述权重系数输出的语料矩阵结果相加,得到所述专用语料的注意力矩阵;/n在所 ...
【技术特征摘要】
1.一种基于AI的面试语料分类方法,其特征在于,所述方法包括:
获取面试场景下的面试者的面试语料,并对所述面试语料进行去噪处理,得到专用语料;
将所述专用语料输入预先训练的轻量模型中,其中,所述轻量模型包括编码层、transformer层以及预测层,所述轻量模型是对降维后的GPT模型训练得到的;
通过所述编码层向量化处理所述专用语料,得到所述专用语料的语料输出矩阵;
通过不同所述transformer层的权重矩阵为所述语料输出矩阵中的关键词生成权重系数,并将每一所述transformer层按照所述权重系数输出的语料矩阵结果相加,得到所述专用语料的注意力矩阵;
在所述预测层中根据所述注意力矩阵得到的所述专用语料的各个维度特征的能力评分,得到对所述面试语料的语料分类结果,输出所述分类结果。
2.根据权利要求1所述的方法,其特征在于,在所述将所述专用语料输入预先训练的轻量模型中之前,还包括:
获取语料训练数据;
随机设置待训练轻量模型的参数,其中,所述参数包括所述轻量模型的编码层的权重矩阵w1的矩阵参数、transformer层的权重矩阵b1的矩阵参数以及预测层的权重矩阵t1的矩阵参数,所述待训练轻量模型是对预先训练好的GPT模型降维得到的模型,包括编码层、transformer层以及预测层,所述待训练轻量模型包括p1层的transformer层,所述GPT模型包括p2层的transformer层,且1≤p1<<p2,p1为整数;
将所述语料训练数据输入所述待训练轻量模型中,得到所述编码层、所述transformer层以及所述预测层的输出结果;并
计算所述输出结果相对于所述GPT模型的输出结果的损失函数;
基于所述梯度下降法计算所述损失函数的数值,并根据所述数值调整所述待训练轻量模型的参数得到所述轻量模型。
3.根据权利要求2所述的方法,其特征在于,所述语料训练数据包括通用语料与面试专用语料,所述将所述语料训练数据输入所述待训练轻量模型中,得到所述编码层、所述transformer层以及所述预测层的输出结果,包括:
基于所述权重矩阵w1对所述语料训练数据进行向量化处理,得到输出矩阵;
基于所述权重矩阵b1对所述输出矩阵中的关键字词进行放大操作,得到注意力矩阵;
点乘权重矩阵t1和所述注意力矩阵确定所述语料训练数据中所述面试专用语料的分类结果;并
将所述输出矩阵、所述注意力矩阵以及所述分类结果作为所述待训练轻量模型的输出结果。
4.根据权利要求3所述的方法,其特征在于,所述基于所述权重矩阵w1对所述语料训练数据进行向量化处理,得到编码后的输出矩阵,包括:
通过one-hot算法对所述语...
【专利技术属性】
技术研发人员:邓悦,金戈,徐亮,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。