语音处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号:24685401 阅读:44 留言:0更新日期:2020-06-27 08:30
本申请实施例公开了一种语音处理方法、装置、电子设备及存储介质。所述方法包括:将待识别语音转换为对应的文本,获取文本对应的第一特征向量表示,基于第一特征向量表示以及对应的变化规则,得到文本的不流利表示以及标点特征表示,该变化规则包括第一特征向量表示与不流利表示以及标点特征表示之间的对应关系,基于不流利表示以及标点特征表示,得到文本的不流利检测结果以及标点标注结果。从而建立有第一特征向量表示与所述不流利表示以及标点特征表示的对应关系的情况下,可以基于同一的第一特征向量表示就可以同时得到不流利表示以及标点特征表示,实现了将不流利检测和标点标注进行结合,进而降低不流利检测以及标点标注过程中的复杂度。

Speech processing methods, devices, electronic equipment and storage media

【技术实现步骤摘要】
语音处理方法、装置、电子设备及存储介质
本申请涉及语音识别
,更具体地,涉及一种语音处理方法、装置、电子设备及存储介质。
技术介绍
在语音的识别过程中,会先将语音转换为文本,然后再针对转换后的文本进行文本处理。但是,对语音进行识别后所得到文本可能会包含不流利成分并且未添加标点,进而就会对后续的文本处理造成影响。
技术实现思路
鉴于上述问题,本申请提出了一种语音处理方法、装置、电子设备及存储介质,以改善上述问题。第一方面,本申请提供了一种语音处理方法,所述方法包括:将待识别语音转换为对应的文本;获取所述文本对应的第一特征向量表示;基于所述第一特征向量表示以及对应的变化规则得到所述文本的不流利表示以及标点特征表示,所述变化规则包括所述第一特征向量表示与所述不流利表示以及标点特征表示之间的对应关系;基于所述不流利表示以及所述标点特征表示得到所述文本的不流利检测结果以及标点标注结果;输出所述不流利检测结果以及标点标注结果。第二方面,本申请提供了一种语音处理方法,所述方法包括:响应于在语音采集界面触发的语音采集指本文档来自技高网...

【技术保护点】
1.一种语音处理方法,其特征在于,所述方法包括:/n将待识别语音转换为对应的文本;/n获取所述文本对应的第一特征向量表示;/n基于所述第一特征向量表示以及对应的变化规则,得到所述文本的不流利表示以及标点特征表示,所述变化规则包括所述第一特征向量表示与所述不流利表示以及标点特征表示之间的对应关系;/n基于所述不流利表示以及所述标点特征表示,得到所述文本的不流利检测结果以及标点标注结果。/n

【技术特征摘要】
1.一种语音处理方法,其特征在于,所述方法包括:
将待识别语音转换为对应的文本;
获取所述文本对应的第一特征向量表示;
基于所述第一特征向量表示以及对应的变化规则,得到所述文本的不流利表示以及标点特征表示,所述变化规则包括所述第一特征向量表示与所述不流利表示以及标点特征表示之间的对应关系;
基于所述不流利表示以及所述标点特征表示,得到所述文本的不流利检测结果以及标点标注结果。


2.根据权利要求1所述的方法,其特征在于,所述获取所述文本对应的第一特征向量表示,包括:
将所述文本进行分词处理得到多个分词文本;
获取所述多个分词文本分别对应的第二特征向量表示;
对所述第二特征向量表示进行多层变换得到所述多个分词文本分别对应的第一特征向量表示。


3.根据权利要求2所述的方法,其特征在于,所述基于所述不流利表示以及所述标点特征表示,得到所述文本的不流利检测结果以及标点标注结果,包括:
基于所述不流利表示以及所述标点特征表示,得到每个分词文本的不流利检测结果以及标点标注结果。


4.根据权利要求3所述的方法,其特征在于,所述不流利表示以及所述标点特征表示为基于多维向量进行表示,所述基于所述不流利表示以及所述标点特征表示,得到每个分词文本的不流利检测结果以及标点标注结果,包括:
获取基于所述多维向量的不流利表示中的第一目标元素,所述第一目标元素为基于所述多维向量的不流利表示中对应的值最大的元素,将每个所述分词文本的所述第一目标元素的下标所对应的不流利结果作为每个所述分词文本的不流利检测结果;
获取基于所述多维向量的标点特征表示中的第二目标元素,所述第二目标元素为基于所述多维向量的标点特征表示中所对应的值最大的元素,将每个所述分词文本的所述第二目标元素的下标所对应的标点标注结果作为每个所述分词文本的标点标注结果。


5.根据权利要求3所述的方法,其特征在于,所述基于所述不流利表示以及所述标点特征表示,得到每个分词文本的不流利检测结果以及标点标注结果,包括:
获取每个所述分词文本的不流利表示与所有分词文本的标点特征表示之间的第一相似度,并根据所述第一相似度确定每个所述分词文本对应的新的不流利表示;
获取每个所述分词文本的标点特征表示与所有分词文本的不流利表示之间的第二相似度,并根据所述第二相似度确定每个所述分词文本对应的新的标点特征表示;
基于所述新的不流利表示和所述新的标点特征表示得到不流利检测结果以及标点标注结果。


6.根据权利要求5所述的方法,其特征在于,所述获取每个所述分词文本的不流利表示与所有分词文本的标点特征表示之间的第一相似度,并根据所述第一相似度确定每个所述分词文本对应新的不流利表示,包括:
获取每个所述分词文本的所述不流利表示分别对应每个分词文本的所述标点特征表示的相似度,作为所述第一相似度;
将所述第一相似度作为权重,与所有分词文本的标点特征表示进行加权求和,得到每个所述分词文本对应的全局标点特征表示;
将每个所述分词文本的所述不流利表示与各自对应的所述全局标点特征表示进行拼接,得到每个所述分词文本对应的新的不流利表示。


7.根据权利要求5所述的方法,其特征在于,所述获取每个所述分词文本的标点特征表示与所有分词文本的不流利表示之间的第二相似度,并根据所述第二相似度确定每个所述分词文本对应新的标点特征表示,包括:
获取每个所述分词文本的所述标点特征表示分别对应所述每个分词文本的不流利表示的相似度,作为所述第二相似度;
将所述第二相似度作为权重,与所有分词文本的不流利表示进行加权求和,得到每个所述分词文本对应的全局不流利表示;
将每个所述分词文本的所述标点特征表示与各自对应的所述全局不流利表示进行拼接,得到每个所述分词文本对应的新的标点特征表示。<...

【专利技术属性】
技术研发人员:林炳怀王丽园
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1