The application relates to a speech recognition method, a system, a computer device and a storage medium. Including the speech signal feature sequence input tone search network and set word search network synchronization and decoding; get set word search network decoding to the set of words in the output state score; when the set of words in the output state fraction meets the preset conditions, obtain the Monophone confidence search synchronous decoding network and set word search according to the confidence of the network; choose decoding path corresponding to the output of the speech recognition results. The speech recognition method, system and computer equipment and computer readable storage medium at the same time, through the voice signal sequence input tone search network and word search network decoding transmission, can effectively achieve the set out of vocabulary word recognition and reject the recognition, to ensure the accuracy of identification; according to the confidence to choose decoding path the speech recognition results, can further improve the speech recognition accuracy.
【技术实现步骤摘要】
语音识别方法、系统、计算机设备及计算机可读存储介质
本申请涉及语音识别
,特别是涉及一种语音识别方法、系统、计算机设备及计算机可读存储介质。
技术介绍
随着计算机技术的快速发展及应用,进一步实现与机器进行语音交流是人工智能和机器学习应用的一个重要方向,语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。目前语音识别的应用可主要分为两个方向:一个是大词汇连续语音识别系统,它被应用于手机助理,语音听写等;另外一个是向小词汇便携型语音产品发展,如智能玩具,家电遥控等。其中第二种应用中的小词汇语音识别系统已逐渐开始在手持终端、家电等领域得到应用,因为其面向的是小词汇,所以相对于第一种系统除了噪声干扰带来的影响外还要考虑大量的集外词的干扰,即要保证集内词正确识别的同时还要拒绝集外词。而传统的小词汇语音识别系统的产品使用效果仍不尽如人意,如无法有效地实现集内命令词识别和集外词拒识别,语音识别准确度低。
技术实现思路
基于此,有必要针对上述问题,提供一种能有效地实现集内词识别和集外词拒识别,提高识别准确率的语音识别方法、系统、计算机设备及计算机可读存储介质。一种语音识别方法,包括:将语音信号特征序列分别输入单音素搜索网络和集内词搜索网络,并进行同步解码;获取所述同步解码得到的集内词输出状态分数;当所述集内词输出状态分数满足预设条件时,获取所述单音素搜索网络与所述集内词搜索网络同步解码的置信度;根据所述置信度选择对应的解码路径,输出得到语音识别结果。在一个实施例中,所述将语音信号特征序列分别输入单音素搜索网络和集内词搜索网络,并进行同步解码的 ...
【技术保护点】
一种语音识别方法,其特征在于,包括:将语音信号特征序列分别输入单音素搜索网络和集内词搜索网络,并进行同步解码;获取所述同步解码得到的集内词输出状态分数;当所述集内词输出状态分数满足预设条件时,获取所述单音素搜索网络与所述集内词搜索网络同步解码的置信度;根据所述置信度选择对应的解码路径,输出得到语音识别结果。
【技术特征摘要】
1.一种语音识别方法,其特征在于,包括:将语音信号特征序列分别输入单音素搜索网络和集内词搜索网络,并进行同步解码;获取所述同步解码得到的集内词输出状态分数;当所述集内词输出状态分数满足预设条件时,获取所述单音素搜索网络与所述集内词搜索网络同步解码的置信度;根据所述置信度选择对应的解码路径,输出得到语音识别结果。2.根据权利要求1所述的语音识别方法,其特征在于,所述将语音信号特征序列分别输入单音素搜索网络和集内词搜索网络,并进行同步解码的步骤包括:将当前帧语音信号特征序列输入所述单音素搜索网络,得到第一输出状态分数;当所述第一输出状态分数大于第一预设阈值时,将下一帧语音信号特征序列分别输入所述单音素搜索网络和所述集内词搜索网络进行同步解码。3.根据权利要求2所述的语音识别方法,其特征在于,所述将当前帧语音信号特征序列输入所述单音素搜索网络,得到第一输出状态分数的步骤包括:将所述当前帧语音信号特征序列输入所述单音素搜索网络;获取所述当前帧语音信号特征序列与所述单音素搜索网络基元的联合概率;将所述联合概率中的最大值作为所述第一输出状态分数。4.根据权利要求1所述的语音识别方法,其特征在于,所述当所述集内词输出状态分数满足预设条件时,获取所述单音素搜索网络与所述集内词搜索网络同步解码的置信度的步骤包括:当所述集内词输出状态分数满足所述预设条件时,获取所述单音素搜索网络同步解码的第一传递分数和所述集内词搜索网络同步解码的第二传递分数;根据所述第一传递分数和所述第二传递分数,得到所述置信度。5.根据权利要求4所述的语音识别方法,其特征在于,所述当所述集内词输出状态分数满足预设条件时,获取所...
【专利技术属性】
技术研发人员:秦浩然,肖全之,
申请(专利权)人:珠海市杰理科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。