一种声音处理方法及装置制造方法及图纸

技术编号：32136444 阅读：35 留言：0更新日期：2022-01-29 19:46

本申请公开了一种声音处理方法及装置，可应用于人工智能领域或金融领域，用于对在银行办理业务的客户与柜员的声音进行处理。该方法包括：获取从当前柜台位置采集到的银行环境声音，银行环境声音中包括至少一路声音；确定各路声音的声音信息，将各路声音的声音信息输入声音识别模型，确定各路声音中的目标声音；将各路声音中除目标声音之外的声音进行过滤，并将目标声音放大播放给当前柜台对应的当前柜员；获取从当前柜台位置采集到的柜台内部声音，通过与预先保存的当前柜员的声音信息进行对比，从柜台内部声音中识别当前柜员声音；将柜台内部声音中除当前柜员声音之外的声音进行过滤，并将当前柜员声音放大播放给当前柜台对应的客户。对应的客户。对应的客户。

全部详细技术资料下载

【技术实现步骤摘要】
一种声音处理方法及装置

[0001]本申请涉及人工智能
，具体涉及一种声音处理方法及装置。

技术介绍

[0002]银行网点为了保证资金的安全性，通常在各柜台处设置有隔断玻璃，客户与办理业务的柜员分别处在隔断玻璃的两侧进行沟通。而由于隔断玻璃的阻隔以及银行网点环境嘈杂，会出现客户与柜员无法听清对方声音，导致沟通不畅的情况，影响客户体验。

技术实现思路

[0003]有鉴于此，本申请实施例提供一种声音处理方法及装置，以使客户与银行柜员可以更清晰听到对方声音，提高沟通效率。
[0004]为解决上述问题，本申请实施例提供的技术方案如下：
[0005]一种声音处理方法，所述方法包括：
[0006]获取从当前柜台位置采集到的银行环境声音，所述银行环境声音中包括至少一路声音；
[0007]确定各路声音的声音信息，将所述各路声音的声音信息输入声音识别模型，确定所述各路声音中的目标声音；
[0008]将所述各路声音中除所述目标声音之外的声音进行过滤，并将所述目标声音放大播放给当前柜台

【技术保护点】

【技术特征摘要】
1.一种声音处理方法，其特征在于，所述方法包括：获取从当前柜台位置采集到的银行环境声音，所述银行环境声音中包括至少一路声音；确定各路声音的声音信息，将所述各路声音的声音信息输入声音识别模型，确定所述各路声音中的目标声音；将所述各路声音中除所述目标声音之外的声音进行过滤，并将所述目标声音放大播放给当前柜台对应的当前柜员；获取从当前柜台位置采集到的柜台内部声音，通过与预先保存的当前柜员的声音信息进行对比，从所述柜台内部声音中识别当前柜员声音；将所述柜台内部声音中除所述当前柜员声音之外的声音进行过滤，并将所述当前柜员声音放大播放给当前柜台对应的客户。2.根据权利要求1所述的方法，其特征在于，所述声音识别模型的训练过程包括：获取待训练银行环境声音，所述待训练银行环境声音包括多路待训练声音，各路待训练声音对应有是否为目标声音的标签；确定各路待训练声音的声音信息；根据所述各路待训练声音的声音信息以及所述各路待训练声音对应的是否为目标声音的标签，训练声音识别模型，所述声音识别模型用于从各路声音中识别目标声音或者从各路声音中识别非目标声音。3.根据权利要求2所述的方法，其特征在于，当所述声音识别模型用于从各路声音中识别目标声音，所述确定各路声音的声音信息，将所述各路声音的声音信息输入声音识别模型，确定所述各路声音中的目标声音，包括：确定各路声音的声音信息，将所述各路声音的声音信息输入声音识别模型，根据所述声音识别模型输出的从所述各路声音中识别目标声音的识别结果，确定所述各路声音中的目标声音；当所述声音识别模型用于从各路声音中识别非目标声音，所述确定各路声音的声音信息，将所述各路声音的声音信息输入声音识别模型，确定所述各路声音中的目标声音，包括：确定各路声音的声音信息，将所述各路声音的声音信息输入声音识别模型，获取所述声音识别模型输出的从所述各路声音中识别非目标声音的识别结果；根据从所述各路声音中识别非目标声音的识别结果，将所述各路声音中不属于非目标声音的声音确定为目标声音。4.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取当前目标声音中的文本内容、历史目标声音中的文本内容以及历史目标柜员声音中的文本内容；根据所述当前目标声音中的文本内容、所述历史目标声音中的文本内容以及所述历史目标柜员声音中的文本内容，判断是否存在目标声音误识别；如果存在目标声音误识别，提示当前柜台对应的客户重复前一次会话内容，并重新执行获取从当前柜台位置采集到的银行环境声音至将所述目标声音放大播放给当前柜台对应的当前柜员的各步骤。
5.根据权利要求1所述的方法，其特征在于，所述根据所述当前目标声音中的文本内容、所述历史目标声音中的文本内容以及所述历史目标柜员声音中的文本内容，判断是否存在目标声音误识别，包括：将所述当前目标声音中的文本内容、所述历史目标声音中的文本内容、所述历史目标柜员声音中的文本内容以及当前办理业务信息，输入关联识别模型，输出所述当前目标声音中的文本内容是否与当前办理业务匹配的识别结果；如果所述当前目标声音中的文本内容与当前办理业务匹配，确定不存在目标声音误识别；如果所述当前目标...

【专利技术属性】
技术研发人员：黄文强，
申请(专利权)人：中国银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人