语音消息处理方法及装置制造方法及图纸

技术编号：36535780 阅读：12 留言：0更新日期：2023-02-01 16:21

本发明专利技术公开了一种语音消息处理方法及装置，涉及人工智能，该方法包括：接收用户发出的语音消息；将语音消息转化为对应的数字信号，对数字信号进行预处理后输入语言识别模型，输出语音消息的识别结果，所述语言识别模型是深度强化学习智能体对Bi

全部详细技术资料下载

【技术实现步骤摘要】
语音消息处理方法及装置

[0001]本专利技术涉及人工智能
，尤其涉及一种语音消息处理方法及装置。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]近年来，随着大数据、人工智能技术的飞速发展，机器学习的深度学习方法逐渐成熟，且已被广泛应用在多个领域，如手机银行中快速检索中的语音识别等。但在面向老年用户群体及带方言口音的用户群体时，目前语音识别方法的准确率不高，影响为用户办理业务的效率，使得用户体验不佳。
[0004]针对上述问题，目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供一种语音消息处理方法，用以加强语音识别的准确率，提高为用户办理业务的效率，改善用户体验，该方法包括：
[0006]接收用户发出的语音消息；
[0007]将语音消息转化为对应的数字信号，对数字信号进行预处理；
[0008]将预处理后的数字信号输入语言识别模型，输出语音消息的识别结果，其中识别结果表征待执行的操作行为，所述语言识别模型是深度强化学习智能体对双向长短时记忆网络Bi
‑
LSTM进行训练和测试得到的；所述深度强化学习智能体是由深度强化学习环境创建的，所述深度强化学习环境中定义有状态参数、行为参数和反馈参数，所述状态参数记录不同用户的语音消息录音，所述行为参数记录根据不同用户的语音消息执行的操作行为，所述反馈参数记录由操作行为导致操作结...

【技术保护点】

【技术特征摘要】
1.一种语音消息处理方法，其特征在于，包括：接收用户发出的语音消息；将语音消息转化为对应的数字信号，对数字信号进行预处理；将预处理后的数字信号输入语言识别模型，输出语音消息的识别结果，其中识别结果表征待执行的操作行为，所述语言识别模型是深度强化学习智能体对双向长短时记忆网络Bi
‑
LSTM进行训练和测试得到的；所述深度强化学习智能体是由深度强化学习环境创建的，所述深度强化学习环境中定义有状态参数、行为参数和反馈参数，所述状态参数记录不同用户的语音消息录音，所述行为参数记录根据不同用户的语音消息执行的操作行为，所述反馈参数记录由操作行为导致操作结果的变化；其中用户包括不同年龄段和/或不同地区的用户；根据语音消息的识别结果，完成待执行的操作行为。2.如权利要求1所述的方法，其特征在于，在将语音消息转化为对应的数字信号之前，还包括：去除语音消息中的噪声干扰。3.如权利要求1所述的方法，其特征在于，对数字信号进行预处理，包括：对数字信号进行预加重和分帧加窗处理。4.如权利要求1所述的方法，其特征在于，对双向长短时记忆网络Bi
‑
LSTM进行训练，包括：基于深度强化学习环境，将每一用户的语音消息录音输入双向长短时记忆网络Bi
‑
LSTM，输出每一语音消息录音对应的操作行为；根据由每一语音消息录音对应的操作行为获得的反馈参数，更新双向长短时记忆网络Bi
‑
LSTM的参数。5.如权利要求1所述的方法，其特征在于，对双向长短时记忆网络Bi
‑
LSTM进行测试，包括：建立测试数据集，所述测试数据集中包括不同用户的语音消息录音及对应的操作行为和反馈参数；利用所述测试数据集对双向长短时记忆网络Bi
‑
LSTM进行测试。6.一种语音消息处理装置，其特征在于，包括：接收模块，用于接收用户发出的语音消息；预处理模块，用于将语音消息转化为对应的数字信号，对数字信号进行预处理；语音消息识别模块，用于将预处理后的数字信号输入语言识别模型，输出语音消息的识别结果，其中识别结果表征待执行的操作行为，所述语言识别模型是深度强化学习智能体对双...

【专利技术属性】
技术研发人员：张海峰，王碧琳，李斌，
申请(专利权)人：中国银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人