语音数据处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：39300206 阅读：8 留言：0更新日期：2023-11-12 15:51

本申请公开了一种语音数据处理方法、装置、电子设备及存储介质。其中，方法包括：获取待识别的语音数据；基于自动语音识别(ASR)技术，将所述语音数据转换成文本数据；利用所述文本数据，确定所述语音数据对应的第一信息和第二信息，所述第一信息包含所述语音数据对应的场景信息，所述第二信息包含与所述语音数据中词的语境关联的关联信息和前缀语信息；利用所述文本数据、所述第一信息和所述第二信息，确定所述语音数据的关键词。确定所述语音数据的关键词。确定所述语音数据的关键词。

全部详细技术资料下载

【技术实现步骤摘要】
语音数据处理方法、装置、电子设备及存储介质

[0001]本申请涉及语音识别领域，尤其涉及一种语音数据处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能技术的广泛应用，自动语音识别(ASR，Automatic Speech Recognition)技术作为一种便捷的人机交互技术，能够实现从语音数据到文本数据的转化。比如，在商业应用中，商家采用ASR技术将电话沟通的内容进行自动转化，使得客户的语音能够以文本的形式被记录下来，以便于对客户需求的归类以及投诉内容的查询。再比如，在医院场景下，除了门诊中医护人员的问诊信息，还存在超声检查、胃肠镜检查等诊察场景；其中，在上述诊察场景下，医护人员通常需要手持医疗设备对病人进行检查，不便于同时手动记录检查中发现的问题，此时，采用ASR技术能够将医护人员的检查结果实时转化为文本并输出。
[0003]然而，相关技术中，对语音数据进行识别时，存在对专业词汇等关键词的识别准确率低的问题。

技术实现思路

[0004]为解决相关技术问题，本申请实施例提供一种语音数据处理方法、装置、电子设备及存储介质。
[0005]本申请实施例的技术方案是这样实现的：
[0006]本申请实施例提供一种语音数据处理方法，包括：
[0007]获取待识别的语音数据；
[0008]基于ASR技术，将所述语音数据转换成文本数据；
[0009]利用所述文本数据，确定所述语音数据对应的第一信息和第二信息，所述第一信息包含所述语音数据对应的场景...

【技术保护点】

【技术特征摘要】
1.一种语音数据处理方法，其特征在于，包括：获取待识别的语音数据；基于自动语音识别ASR技术，将所述语音数据转换成文本数据；利用所述文本数据，确定所述语音数据对应的第一信息和第二信息，所述第一信息包含所述语音数据对应的场景信息，所述第二信息包含与所述语音数据中词的语境关联的关联信息和前缀语信息；利用所述文本数据、所述第一信息和所述第二信息，确定所述语音数据的关键词。2.根据权利要求1所述的方法，其特征在于，所述利用所述文本数据，确定所述语音数据对应的第一信息，包括：将所述文本数据输入至第一模型，得到所述语音数据对应的场景信息，所述第一模型用于确定输入的文本数据的场景信息。3.根据权利要求2所述的方法，其特征在于，所述第一模型包含采用多任务学习方式训练得到的模型。4.根据权利要求1所述的方法，其特征在于，所述利用所述文本数据，确定所述语音数据对应的第二信息，包括：将所述文本数据输入至第二模型，得到与所述语音数据中词的语境关联的关联信息和前缀语信息，所述第二模型用于确定与输入的文本数据中词的语境关联的关联信息和前缀语信息。5.根据权利要求4所述的方法，其特征在于，所述第二模型包含基于BERT训练得到的模型。6.根据权利要求1所述的方法，其特征在于，所述基于ASR技术，将所述语音数据转换成文本数据，包括：对所述语音数据进行预处理；基于ASR技术，将预处理后的所述语音数据转换成所述文本数据。7.根据权利要求1至6任一项所述的方法...

【专利技术属性】
技术研发人员：侯雷静，张世磊，高莹莹，徐衍翰，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人