识别标签的方法、装置、设备以及介质制造方法及图纸

技术编号:30822023 阅读:29 留言:0更新日期:2021-11-18 12:06
提供了一种识别标签的方法、装置、设备以及介质,该方法包括:获取待识别文本;基于待识别文本,得到第一特征向量;该第一特征向量包括第一句向量和第一词向量,第一句向量表征待识别文本的句子级信息,第一词向量中的每一个数值表征待识别文本中的一个词;将第一特征向量输入识别模型,得到待识别文本的意图标签和待识别文本中的各个词的属性标签,待识别文本的意图标签是基于第一句向量识别的,待识别文本中的各个词的属性标签是基于第一词向量识别的;本申请提供的方法通过对识别待识别文本的意图标签的任务和文本中的各个词的属性标签的任务进行联合训练得到识别模型,不仅降低识别过程中计算资源的浪费,而且提升上述两个任务的识别效率。任务的识别效率。任务的识别效率。

【技术实现步骤摘要】
识别标签的方法、装置、设备以及介质


[0001]本申请实施例涉及自然语言处理
,并且更具体地,涉及识别标签的方法、装置、设备以及介质。

技术介绍

[0002]随着人工智能和5G技术的不断进步和深入应用,传统硬件也在融合新的特性,并被赋予强大的计算、感知和互联能力,其中,语音交互也越来越普遍应用于诸多场景,如手机、客服、家居、驾驶等,其目的在于理解用户的意图,并依据意图为用户提供适当的响应。而理解用户的意图即理解交互中传递的文本信息的意图,其中,理解文本信息的意图又和该文本信息中的各个词的属性标签有关。
[0003]目前,识别文本的意图和识别文本中各个词的属性标签普遍存在计算资源浪费,识别效率低的问题。
[0004]因此,怎样提升识别文本的意图和识别文本中各个词的属性标签的效率,降低识别过程的资源消耗是本领域急需解决的问题。

技术实现思路

[0005]本申请实施例提供了一种识别标签的方法、装置、设备以及介质,能够提升文本的意图标签和文本中的各个词的属性标签的识别效率,降低识别过程中资源的浪费。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别标签的方法,其特征在于,包括:获取待识别文本;基于所述待识别文本,得到所述待识别文本的第一特征向量;其中,所述第一特征向量包括第一句向量和第一词向量,所述第一句向量用于表征所述待识别文本的句子级别信息,所述第一词向量中的每一个数值用于表征所述待识别文本中的一个词;将所述第一特征向量输入识别模型,以得到所述待识别文本的意图标签和所述待识别文本中的各个词的属性标签,其中,所述待识别文本的意图标签是基于所述第一句向量识别的,所述待识别文本中的各个词的属性标签是基于所述第一词向量识别的。2.根据权利要求1所述的方法,其特征在于,所述基于所述待识别文本,得到所述待识别文本的第一特征向量,包括:将所述待识别文本进行分词处理,以得到多个词;在所述多个词中的第一个词的前面添加分类CLS符号,并在所述多个词中的最后一个词的后边添加分隔SEP符号;将所述多个词、所述CLS符号及所述SEP符号分别与词典中的词进行匹配,以得到所述第一特征向量。3.根据权利要求2所述的方法,其特征在于,所述将所述待识别文本进行分词处理,以得到多个词之前,所述方法还包括:将所述待识别文本处理为第一格式的文本,所述第一格式的文本用于表征满足分词条件的文本;对所述第一格式的文本进行分词处理,以得到多个词。4.根据权利要求2所述的方法,其特征在于,所述将所述多个词、所述CLS符号及所述SEP符号分别与词典中的词进行匹配,以得到所述第一特征向量,包括:将所述词典中的所述多个词的索引号、所述CLS符号的索引号及所述SEP符号的索引号,分别确定为所述第一特征向量中所述词对应的数值、所述CLS符号对应的数值及所述SEP符号对应的数值,以得到所述第一特征向量。5.根据权利要求1所述的方法,其特征在于,所述将所述第一特征向量输入识别模型,以得到所述待识别文本的意图标签和所述待识别文本中的各个词的属性标签,包括:将所述第一特征向量输入识别模型,利用所述识别模型对所述第一句向量进行编码,以得到所述第一句向量对应的语义向量;将所述第一句向量对应的语义向量,映射为所述第一句向量对应的第一概率分布向量;基于所述第一概率分布向量,确定所述待识别文本的意图标签。6.根据权利要求5所述的方法,其特征在于,所述基于所述第一概率分布向量,确定所述待识别文本的意图标签,包括:基于所述第一概率分布向量,确定所述第一概率分布向量中的最大数值;在意图标签库中确定所述第一概率分布向量中的最大数值对应的意图标签;将所述最大数值对应的意图标签,确定为所述待识别文本的意图标签,所述待识别文本的意图标签用于表征所述待识别文本的意图。
7.根据权利要求1所述的方法,其特征在于,所述将所述第一特征向量输入识别模型...

【专利技术属性】
技术研发人员:赵昂陈孝良李智勇
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1