【技术实现步骤摘要】
句向量预测方法、问答匹配方法、装置及相关设备
[0001]本专利技术涉及句向量预测
,尤其涉及一种句向量预测方法
、
问答匹配方法
、
装置及相关设备
。
技术介绍
[0002]自然语言处理
(Nature Language processing
,
NLP)
是计算机科学领域与人工智能领域中的一个重要方向
。
随着自然语言处理技术的进步和工程落地经验的积累,智能客服系统近年来在各行业中,已经逐渐应用于实际业务场景
、
服务于实际客户,降低了人工客服的压力和成本
。
现有的客服系统基于
NLP
预训练模型如
Bert
构建,通过识别用户问题中的句向量,再通过句向量与问答数据库中的问答匹配,从而自动给出答复,但预训练模型
Bert
需要经过大量数据进行训练后,才能够学习到人类语言语义
。
在一些项目启动初期,数据量很少,模型就需要多个轮次的训练,使模型能够充足的学习到相关知识,但由于数据量少
、
模型巨大的原因,模型的多轮训练有可能很好的拟合了现有数据,但由于实际业务场景中数据噪点很多,模型也对这些数据噪点进行了拟合,那么在使用模型预测的时候就无法达到很好的效果,最终由于过拟合导致模型泛化能力很差;如果使用较小的预训练模型,会导致模型的推理能力较弱,不能模拟实际业务的多个场景,降低实际业务的收益
。
...
【技术保护点】
【技术特征摘要】
1.
一种句向量预测方法,其特征在于,包括:将待识别语句输入至当前业务的第一句向量预测模型中,得到所述待识别语句对应的句向量预测结果;其中,所述当前业务的第一句向量预测模型是根据与所述当前业务相似的历史业务的第二句向量预测模型进行蒸馏而构建的;所述当前业务的第一句向量预测模型是经过自学习和对比学习训练得到的
。2.
根据权利要求1所述的句向量预测方法,其特征在于,所述当前业务的第一句向量预测模型的构建方法包括:将与所述当前业务相似的历史业务的第二句向量预测模型中的预设层的参数赋值到所述当前业务的第一句向量预测模型的对应层中
。3.
根据权利要求2所述的句向量预测方法,其特征在于,所述第二句向量预测模型包括
n
层,所述第一句向量预测模型包括
m
层,所述第二句向量预测模型中的预设层包括:第1层
、
第
n/2
层和第
n
层;相应地,所述的第一句向量预测模型的对应层包括第1层
、
第
m/2
‑1层和第
m
‑1层
。4.
根据权利要求1所述的句向量预测方法,其特征在于,对所述当前业务的第一句向量预测模型进行自学习和对比学习训练,包括:获取自学习前第一句向量预测模型输出的第一句向量预测结果;获取自学习后第一句向量预测模型输出的第二句向量预测结果;计算所述第一句向量预测结果与所述第二句向量预测结果的相似度得分;计算所述相似度得分与预设标签之间的交叉熵损失,根据所述交叉熵损失更新所述第一句向量预测模型
。5.
根据权利要求4所述的句向量预测方法,其特征在于,所述获取自学习前第一句向量预测模型输出的第一句向量预测结果,包括:将训练数据输入根据与所述当前业务相似的历史业务的第二句向...
【专利技术属性】
技术研发人员:田效宇,马宝昌,潘东宇,
申请(专利权)人:贝壳找房北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。