【技术实现步骤摘要】
语音识别方法、装置、计算机设备及存储介质
[0001]本申请实施例涉及计算机
,特别涉及一种语音识别方法、装置、计算机设备及存储介质。
技术介绍
[0002]语音识别技术是指对语音数据进行识别得到该语音数据匹配的文本数据的技术,近年来,语音识别技术的应用越来越广泛。相关技术中,在对语音数据进行识别时,通常是直接对语音数据本身进行识别,将识别结果作为该语音数据对应的文本数据,由于在识别过程中所依据的信息较少,导致识别准确率较低。
技术实现思路
[0003]本申请实施例提供了一种语音识别方法、装置、计算机设备及存储介质,提高了语音信号的识别准确率。所述技术方案如下:
[0004]一方面,提供了一种语音识别方法,所述方法包括:
[0005]对语音数据进行识别,得到目标文本数据,将所述目标文本数据中的每个字符和对所述目标文本数据进行词语划分得到的每个词语确定为所述目标文本数据的第一元素,所述词语包括至少两个字符;
[0006]获取每个第一元素的权重,所述权重表示所述第一元素与所述第一元素 ...
【技术保护点】
【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:对语音数据进行识别,得到目标文本数据;将所述目标文本数据中的每个字符和对所述目标文本数据进行词语划分得到的每个词语确定为所述目标文本数据的第一元素,所述词语包括至少两个字符;获取每个第一元素的权重,所述权重表示所述第一元素与所述第一元素的前序元素之间的相关程度,所述第一元素的前序元素包含所述目标文本数据中位于所述第一元素之前且与所述第一元素相邻的至少一个元素;基于所述目标文本数据中的多个第一元素以及每个所述第一元素的权重,确定所述目标文本数据的置信度,所述置信度表示所述目标文本数据为所述语音数据匹配的目标文本数据的可信程度;将所述目标文本数据和所述目标文本数据的置信度,确定为所述语音数据的识别结果。2.根据权利要求1所述的方法,其特征在于,所述基于所述目标文本数据中的多个第一元素以及每个所述第一元素的权重,确定所述目标文本数据的置信度,包括:基于所述目标文本数据中的多个第一元素以及每个所述第一元素的权重,获取所述目标文本数据的目标架构图,所述目标架构图包括多个节点和多条连接线;基于所述目标架构图,确定所述目标文本数据的置信度。其中,每条连接线对应于一个第一元素和所述第一元素的权重,每条连接线从一个起始节点指向一个终止节点,所述词语对应的连接线从所述词语的起始字符对应的连接线的起始节点指向所述词语的终止字符对应的连接线的终止节点,指向任一节点的连接线对应的第一元素与以所述节点为起始节点的连接线对应的第一元素相邻、且位于以所述节点为起始节点的连接线对应的第一元素之前。3.根据权利要求2所述的方法,其特征在于,所述基于所述目标文本数据的多个第一元素以及每个所述第一元素的权重,获取所述目标文本数据的目标架构图,包括:基于所述目标文本数据的多个第一元素,获取所述目标文本数据的第一架构图,所述第一架构图包括多个节点和多条连接线,每个第一元素对应于一条连接线,每条连接线从一个起始节点指向一个终止节点,其中,所述词语对应的连接线从所述词语的起始字符对应的连接线的起始节点指向所述词语的终止字符对应的连接线的终止节点,指向任一节点的连接线对应的第一元素与以所述节点为起始节点的连接线对应的第一元素相邻、且位于以所述节点为起始节点的连接线对应的第一元素之前;获取第二架构图,所述第二架构图包括多个节点和多条连接线,每条连接线对应一个第二元素和所述第二元素对应的权重,每条连接线从一个起始节点指向一个终止节点;按照所述第一架构图,选取所述第二架构图中,与所述第一架构图中的每个第一元素相同的第二元素对应的连接线,以及所述连接线所连接的节点;从选取的节点和连接线中,去除不属于所述目标文本数据对应的任一路径的节点或连接线,得到所述目标架构图。4.根据权利要求3所述的方法,其特征在于,所述基于所述目标文本数据的多个第一元素,获取所述目标文本数据的第一架构图,包括:创建U+1个节点,U为所述目标文本数据中的字符的数量,第x个节点与所述目标文本数
据中的第x个字符对应,U为大于1的正整数,x为不大于U的任一正整数;创建从每个第一元素中的起始字符对应的节点指向每个第一元素中的终止字符对应的节点的下一个节点的连接线,得到所述第一架构图。5.根据权利要求2
‑
4任一项所述的方法,其特征在于,所述基于所述目标架构图,确定所述目标文本数据的置信度,包括:基于所述目标架构图中指向目标节点的连接线对应的权重,以及所述连接线连接的另一个节点的节点特征,确定所述目标节点的节点特征,所述目标节点为所述目标架构图中除第一个节点之外的任一节点,所述节点特征包含位于所述目标节点之前的连接线上的第一元素构成的文本片段以及所述文本片段对应的文本置信度;在所述目标节点为所述目标架构图中的最后一个节点的情况下,将所述目标节点的节点特征包含的文本置信度,确定为所述目标文本数据的文本置信度,所述文本置信度表示所述目标文本数据符合语言逻辑的概率;调整所述文本置信度,得到所述目标文本数据的置信度。6.根据权利要求5所述的方法,其特征在于,所述基于所述目标架构图中指向目标节点的连接线对应的权重,以及所述连接线连接的另一...
【专利技术属性】
技术研发人员:田晋川,余剑威,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。