信息处理方法及装置制造方法及图纸

技术编号:30409201 阅读:28 留言:0更新日期:2021-10-20 11:23
本申请公开了一种信息处理方法及装置。其中,该方法包括:获取待处理文本信息;将文本信息转换为词向量,并依据词向量确定隐藏状态特征向量;依据隐藏状态特征向量确定文本信息中每个字对应的意图标签,依据每个字对应的意图标签确定文本信息对应的至少一个意图;依据隐藏状态特征向量确定文本信息中每个字对应的命名实体标签,依据每个字对应的命名实体标签确定文本信息中的命名实体;依据至少一个意图及命名实体确定文本信息所表达的内容。本申请解决了相关技术中处理存在多个意图的信息时需要引入额外的断句网络,会浪费存储空间和运行内存且存在处理延时的技术问题。行内存且存在处理延时的技术问题。行内存且存在处理延时的技术问题。

【技术实现步骤摘要】
信息处理方法及装置


[0001]本申请涉及计算机
,具体而言,涉及一种信息处理方法及装置。

技术介绍

[0002]在车机NLP(Natural Language Processing,自然语言处理)中,一般采用神经网络分类模型和NER(Named Entity Recognition,命名实体识别)模型对输入的文本信息进行相关处理,通常,分类模型和NER模型是两个独立的模型,其中,分类模型用于意图识别,NER模型通过词槽提取实现命名实体识别。
[0003]当一句话中存在多个意图时,现有方案是通过引入具有断句功能的神经网络,先将这句话分成多段独立的句子,然后分别对每段句子进行意图识别和命名实体识别,但由于处理时增加了网络尺寸,就需要更大的存储空间和运行内存,同时还增加了处理延时。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本申请实施例提供了一种信息处理方法及装置,以至少解决相关技术中处理存在多个意图的信息时需要引入额外的断句网络,会浪费存储空间和运行内存且存在处理延时本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:获取待处理文本信息;将所述文本信息转换为词向量,并依据所述词向量确定隐藏状态特征向量;依据所述隐藏状态特征向量确定所述文本信息中每个字对应的意图标签,依据所述每个字对应的意图标签确定所述文本信息对应的至少一个意图;依据所述隐藏状态特征向量确定所述文本信息中每个字对应的命名实体标签,依据所述每个字对应的命名实体标签确定所述文本信息中的命名实体;依据所述至少一个意图及所述命名实体确定所述文本信息所表达的内容。2.根据权利要求1所述的方法,其特征在于,将所述文本信息转换为词向量,并依据所述词向量确定隐藏状态特征向量,包括:将所述文本信息输入目标信息处理模型中的特征提取网络;通过所述特征提取网络中的输入层将所述文本信息中的每个字进行独热编码处理,得到预设长度的第一数组,所述第一数组中的元素表示所述文本信息中各个字的索引;将所述第一数组输入所述特征提取网络中的字嵌入层,由所述字嵌入层输出得到所述词向量;将所述词向量输入所述特征提取网络中的双向长短期记忆网络,由所述双向长短期记忆网络输出得到所述隐藏状态特征向量,所述隐藏状态特征向量用于确定所述文本信息中每个字对应的标签信息,其中,所述标签信息包括所述意图标签及所述命名实体标签。3.根据权利要求1所述的方法,其特征在于,依据所述隐藏状态特征向量确定所述文本信息中每个字对应的意图标签,包括:将所述隐藏状态特征向量输入目标信息处理模型中的意图识别网络;通过所述意图识别网络中的第一全连接层输出得到第一向量,所述第一向量用于表示所述文本信息中每个字映射到多种意图标签的概率信息;将所述第一向量输入所述意图识别网络中的第一条件随机场,由所述第一条件随机场通过维特比解码算法将所述第一向量转换为第二数组,所述第二数组用于表示所述文本信息中每个字对应的意图标签。4.根据权利要求3所述的方法,其特征在于,由所述第一条件随机场通过维特比解码算法将所述第一向量转换为第二数组,包括:通过所述第一条件随机场确定所述第一向量对应的多条链路,其中,每条链路由多个节点组成,每个所述节点表示所述文本信息中一个字映射为一种意图标签时的概率值;由所述维特比解码算法依据状态转移矩阵确定所述多条链路中值最大的目标链路,并依据所述目标链路确定所述第二数组。5.根据权利要求1所述的方法,其特征在于,依据所述隐藏状态特征向量确定所述文本信息中每个字对应的命名实体标签,包括:将所述隐藏状态特征向量输入目标信息处理模型中的命名实体识别网络;通过所述命名实体识别网络中的第二全连接层输出得到第二向量,所述第二向量用于表示所述文本信息中每个字映射为多种命名实体标签的概率信息;将所述第二向量输入第二条件随机场,由所述第二条件随机场通过维特比解码算法将所述第二向量转换为第三数组,所述第三数组用于表示所述文本信息中每个字对应的命名
实体标签。6.根据权利要求1所述的方法,其特征在于,所述每个字对应的意图标签中包括所述每个字对应的意图类别及意图词槽标识,其中,所述意图类别用于表示所述每个字所属的意图,所述意图词槽标识用于表示所述每个字在所属的意图中的词槽标识,其中,所述意图词槽标识包括以下其中之一:意图词槽开始标识,意图词槽中间标...

【专利技术属性】
技术研发人员:宋寒风黄海荣李林峰
申请(专利权)人:湖北亿咖通科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1