语义理解模型的训练方法及装置制造方法及图纸

技术编号:37704782 阅读:24 留言:0更新日期:2023-06-01 23:52
本说明书提供语义理解模型的训练方法及装置,其中所述语义理解模型的训练方法包括:获取句单元样本以及所述句单元样本对应的语义正样本;在预设的语义词库中筛选与所述句单元样本对应的语义负样本,并构建所述语义正样本和所述语义负样本分别对应的语义特征;将所述语义特征输入至语义理解模型进行处理,获得所述语义正样本和所述语义负样本分别对应的语义分值;基于所述语义分值计算损失值,并根据所述损失值调整出满足训练停止条件的目标语义理解模型。语义理解模型。语义理解模型。

【技术实现步骤摘要】
语义理解模型的训练方法及装置


[0001]本说明书涉及机器学习
,特别涉及语义理解模型的训练方法及装置。

技术介绍

[0002]随着互联网技术的发展,单词语义消歧技术在越来越多的领域得以应用,通过对语句中涉及到的词单元进行语义分析,辅助用户了解语句含义,能够更加方便用户进行学习语句内容。现有技术中,在处理单词语义消歧任务时,大多数采用多分类或二分类方案。虽然能够通过分类处理的方式从多个可能的语义中筛选出符合语句含义的正确语义,但是多分类处理方式缺乏全局性,而二分类处理方式对样本的利用太少,影响精准度。因此亟需一种有效的方案以解决上述问题。

技术实现思路

[0003]有鉴于此,本说明书实施例提供了一种语义理解模型的训练方法。本说明书同时涉及一种语义确定方法,一种语义理解模型的训练装置,一种语义确定装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷。
[0004]根据本说明书实施例的第一方面,提供了一种语义理解模型的训练方法,包括:
[0005]获取句单元样本以及所述句单元样本对应的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语义理解模型的训练方法,其特征在于,包括:获取句单元样本以及所述句单元样本对应的语义正样本;在预设的语义词库中筛选与所述句单元样本对应的语义负样本,并构建所述语义正样本和所述语义负样本分别对应的语义特征;将所述语义特征输入至语义理解模型进行处理,获得所述语义正样本和所述语义负样本分别对应的语义分值;基于所述语义分值计算损失值,并根据所述损失值调整出满足训练停止条件的目标语义理解模型。2.根据权利要求1所述的方法,其特征在于,所述获取句单元样本以及所述句单元样本对应的语义正样本,包括:获取所述句单元样本;对所述句单元样本进行解析,获得所述句单元样本中每个词单元对应的语义标签;在所述语义标签中筛选出目标语义标签,并基于所述目标语义标签在所述语义词库中提取所述语义正样本。3.根据权利要求1所述的方法,其特征在于,所述获取句单元样本以及所述句单元样本对应的语义正样本,包括:获取所述句单元样本,并对所述句单元样本进行分词获得多个词单元;将每个词单元与所述语义词库中包含的语义样本进行匹配,根据匹配结果筛选出第一词单元;在所述语义词库中确定与所述第一词单元对应的多个初始语义样本,并在所述多个初始语义样本中选择所述第一词单元关联的所述语义正样本。4.根据权利要求1所述的方法,其特征在于,所述在预设的语义词库中筛选与所述句单元样本对应的语义负样本,包括:在所述句单元样本中确定与所述语义正样本对应的第二词单元;在所述语义词库中确定与所述第二词单元对应的至少两个初始语义负样本;按照预设的筛选规则,在所述至少两个初始语义负样本中筛选出设定数量的初始语义负样本,作为所述句单元样本对应的所述语义负样本。5.根据权利要求1

4任一项所述的方法,其特征在于,所述构建所述语义正样本和所述语义负样本分别对应的语义特征,包括:将所述句单元样本与所述语义正样本进行拼接,根据拼接结果构建所述语义正样本对应的正语义特征,以及将所述句单元样本与所述语义负样本进行拼接,根据拼接结果构建所述语义负样本对应的负语义特征。6.根据权利要求5所述的方法,其特征在于,所述将所述语义特征输入至语义理解模型进行处理,获得所述语义正样本和所述语义负样本分别对应的语义分值,包括:将所述正语义特征和所述负语义特征分别输入至所述语义理解模型进行处理,获得所述语义正样本对应的正语义分值,以及所述语义负样本对应的负语义分值;相应的,所述基于所述语义分值计算损失值,并根据所述损失值调整出满足训练停止条件的目标语义理解模型,包括:
基于所述正语义分值和...

【专利技术属性】
技术研发人员:刘洋柳景明赵薇
申请(专利权)人:北京猿力未来科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1