语音识别处理方法、装置、电子设备及非易失性存储介质制造方法及图纸

技术编号:41639915 阅读:22 留言:0更新日期:2024-06-13 02:34
本申请公开了一种语音识别处理方法、装置、电子设备及非易失性存储介质。其中,该方法包括:调用多个语音识别引擎对属于目标行业的目标业务场景中的录音文件进行语音识别,得到文本数据,并确定文本数据中的关键词和非关键词;分别确定文本数据中关键词和非关键词的字错率,并将关键词和非关键词的字错率进行加权运算,得到真实字错率;根据真实字错率从多个语音识别引擎中确定目标语音识别引擎。本申请解决了使用单语音识别引擎覆盖全业务场景导致某些业务场景下识别率较低的技术问题。

【技术实现步骤摘要】

本申请涉及ai的自然语言处理领域,具体而言,涉及一种语音识别处理方法、装置、电子设备及非易失性存储介质


技术介绍

1、目前在ai语音产品中,能力提供方或集成商往往都使用固有的一种语音识别引擎,并将其应用于所有外呼场景,而语音识别引擎的识别能力与其研发机构的主攻领域、技术累积、企业背景有密切关联;加之随着政策的驱动和多重因素的影响,ai语音服务越来越普及,其业务场景也与日俱增。场景不同,涉及的人群、词库、环境、句长、语种也不同。

2、目前往往针对所有业务场景仅采用单一的语音识别引擎,这会很大程度地影响识别率的稳定性,进而影响后续自然语言处理(natural language processing,简称为nlp)对语义的理解,甚至造成整句识别错误的情况。

3、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本申请实施例提供了一种语音识别处理方法、装置、电子设备及非易失性存储介质,以至少解决使用单语音识别引擎覆盖全业务场景导致某些业务场景下识别率较低的技术问题。

...

【技术保护点】

1.一种语音识别处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,所述知识库通过以下方式确定:

4.根据权利要求2所述的方法,其特征在于,对去除停用词后的所述文本数据进行关键词识别,包括:

5.根据权利要求1所述的方法,其特征在于,分别确定所述文本数据中所述关键词和所述非关键词的所述字错率包括:

6.根据权利要求5所述的方法,其特征在于,所述函数关系通过以下公式确定:

7.根据权利要求1所述的方法,其特征在于,将所述关键词和所述非关键词的所述字错率进行...

【技术特征摘要】

1.一种语音识别处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求2所述的方法,其特征在于,所述知识库通过以下方式确定:

4.根据权利要求2所述的方法,其特征在于,对去除停用词后的所述文本数据进行关键词识别,包括:

5.根据权利要求1所述的方法,其特征在于,分别确定所述文本数据中所述关键词和所述非关键词的所述字错率包括:

6.根据权利要求5所述的方法,其特征在于,所述函数关系通过以下公式确定:

7.根据权利要求1所述的方法,其特征在于,将所述关键词和所述非关键词的所述字错率进行加权运算,得到所述真实字错率包括:

8.根据权利要求7所述的方法,其特征在于,所述关键词的字错率、所述关键词对应的权重和所述关键词个数之...

【专利技术属性】
技术研发人员:邵佳梦马昭征陈少锋钱志远周焕晨
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1