一种单词识别方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:26304577 阅读:32 留言:0更新日期:2020-11-10 20:00
本发明专利技术涉及语音语义,提供了一种单词识别方法,包括:获取目标音频数据;根据条件随机字段解码模型,对多个待识别单词的单词标签进行解码,得到多个待识别单词解码后的单词标签,选取音频片段对应一个选取句;根据读取出的选取句的上下文信息和多个待识别单词解码后的单词标签,识别出选取句中包括的多个具有独立含义的单词。因此,采用本申请实施例,由于能够精准读取出选取句的上下文信息,并结合多个待识别单词解码后的单词标签,这样,能够精准识别出选取句中包括的多个具有独立含义的单词。此外,本发明专利技术还涉及区块链技术,上下文信息、目标音频数据、选取音频片段、以及识别出的选取音频片段中包括的多个单词均可存储于区块链中。

【技术实现步骤摘要】
一种单词识别方法、装置、计算机设备和存储介质
本专利技术涉及语音语义
,特别涉及一种单词识别方法、装置、计算机设备和存储介质。
技术介绍
随着智能手机的推广,越来越的即时通信软件得以广泛应用。在多个用户之间通过某一即使通信软件进行交流的过程中,可以使用手写输入文本,也可以直接使用语音功能,发送语音。由于语音转文字的技术的发展,可以将语音转换成文字。在对用户跟踪回访的过程中,也会采用语音转文字的技术。但是,现有的技术,无法根据回访方与用户的通话录音,直接提取出与用户问答有关的单词,以及对单词的识别精度低。
技术实现思路
基于此,有必要针对无法根据回访方与用户的通话录音,直接提取出与用户问答有关的单词,以及对单词的识别精度低的问题,提供一种单词识别方法、装置、计算机设备和存储介质。第一方面,本申请实施例提供了一种单词识别方法,所述方法包括:获取目标音频数据,所述目标音频数据包括目标对象的问答内容,所述目标音频数据还包括梯度标识,所述梯度标识用于标识出目标音频来自的平台、且各个平台均具有不同的梯度;<本文档来自技高网...

【技术保护点】
1.一种单词识别方法,其特征在于,所述方法包括:/n获取目标音频数据,所述目标音频数据包括目标对象的问答内容,所述目标音频数据还包括梯度标识,所述梯度标识用于标识出目标音频来自的平台、且各个平台均具有不同的梯度;/n从所述目标音频数据中提取包括多个待识别单词的选取音频片段,并对多个待识别单词进行标签,得到对应的单词标签,并根据条件随机字段解码模型,对多个待识别单词的单词标签进行解码,得到多个待识别单词解码后的单词标签,所述选取音频片段对应一个选取句;/n根据读取出的所述选取句的上下文信息和多个待识别单词解码后的单词标签,识别出所述选取句中包括的多个具有独立含义的单词。/n

【技术特征摘要】
1.一种单词识别方法,其特征在于,所述方法包括:
获取目标音频数据,所述目标音频数据包括目标对象的问答内容,所述目标音频数据还包括梯度标识,所述梯度标识用于标识出目标音频来自的平台、且各个平台均具有不同的梯度;
从所述目标音频数据中提取包括多个待识别单词的选取音频片段,并对多个待识别单词进行标签,得到对应的单词标签,并根据条件随机字段解码模型,对多个待识别单词的单词标签进行解码,得到多个待识别单词解码后的单词标签,所述选取音频片段对应一个选取句;
根据读取出的所述选取句的上下文信息和多个待识别单词解码后的单词标签,识别出所述选取句中包括的多个具有独立含义的单词。


2.根据权利要求1所述的方法,其特征在于,在所述根据读取出的所述选取句的上下文信息和多个待识别单词解码后的单词标签,识别出所述选取音频片段中包括的多个单词之前,所述方法还包括:
根据上下文识别模型,对所述选取句的上下文环境进行识别和解析,得到与所述上下文环境对应的所述上下文信息,所述上下文识别模型包括第一层和第二层,所述第一层为卷积神经网络层,所述第一层用于解析所述选取句的上下文信息,所述选取句为与所述选取音频片段对应的一个句子,所述第二层为双向长短期记忆网络层,所述第二层用于根据第一方向上单词之间的第一长度距离依赖属性,以及第二方向上单词之间的第二长度距离依赖属性进行建模,得到所述上下文识别模型,所述上下文信息存储于区块链中。


3.根据权利要求2所述的方法,其特征在于,所述根据上下文识别模型,对所述选取句的上下文环境进行识别包括:
通过所述上下文识别模型的所述第一层对所述选取句的上下文环境进行识别和解析,得到与所述上下文环境对应的所述上下文信息。


4.根据权利要求3所述的方法,其特征在于,所述通过所述上下文识别模型的所述第一层对所述选取句的上下文环境进行识别和解析包括:
通过所述第一层的卷积神经网络,学习所述选取句中的每个字符的上下文表示,得到上下文字符序列;
将所述上下文字符序列发送至所述第一层的所述卷积神经网络中的最大池化层;
根据所述上下文字符序列和所述最大池化层,得到每个字符对应的字符嵌入词;
对所述选取句中每个字符对应的字符嵌入词进行解析,得到与所述上下文环境对应的所述上下文信息。


5.根据权利要求4所述的方法,其特征在于,在所述将所述上下文字符序列发送至所述第一层的所述卷积神经网络中的最大池化层之前,所述方法还包括:
获取所述上下文字符序列;
从所述上下文字符序列中选取任一一段字符序列并进行标记,得到选取字符的标记序列;
根据所述条件随机字段解码模型,对所述选取字符的所述标记序列的出现概率进行计算,得到所述选取字符的出现概率,所述条件随机字段解码模型为采用马尔科夫链作为隐含变量的概率转移模型;
在所述选取字符的出现概率大于或等于预设概率阈值的情况下,确定所述选取字符为候选字符。


6.根据权利要求2所述的方法,其特征在于,在所述根据上下文识...

【专利技术属性】
技术研发人员:李志韬王健宗吴天博程宁
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1