语音识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:45099216 阅读:25 留言:0更新日期:2025-04-25 18:38
本发明专利技术涉及语音处理领域,公开了一种语音识别方法、装置、计算机设备及存储介质,其方法包括:通过自适应采样实时获取待识别语音;对待识别语音进行预处理,获得满足预设处理要求的优化语音;通过去重语音识别模型处理优化语音,获得去重文本;去重语音识别模型为经过剪枝处理后具有去重功能的语音识别模型。本发明专利技术使用去重语音识别模型处理待识别语音,获取去重文本,解决了语音识别模型出现词语或句子重复的问题,特别是长时间语音转录和复杂对话记录等场景下,显著减少语词重复现象,优化了模型效率和体验。

【技术实现步骤摘要】

本专利技术涉及语音处理领域,适用于金融科技领域,尤其涉及一种语音识别方法、装置、计算机设备及存储介质


技术介绍

1、随着金融科技(fintech)行业的快速发展,客户服务、交易处理和金融咨询等业务流程对自动化和智能化的需求日益增长。语音识别技术作为人工智能的一个重要分支,在提升用户体验、优化运营效率方面展现了巨大的潜力。特别是在金融科技领域,通过语音交互实现账户查询、转账支付、投资建议等功能不仅能够简化操作流程,还能为用户提供更加便捷的服务体验。

2、现有的语音识别模型,如whisper(由开源人工智能公司openai开发的一种多语言语音识别模型)等,在跨语言识别和鲁棒性方面表现出色,广泛应用于语音转录和自然语言处理任务。然而,在处理长文本或复杂语音输入时,语音识别模型易出现词语或句子重复的问题,影响识别效率和准确性,增加后续处理难度,降低用户体验。现有优化手段如参数调优和数据增强,虽有一定效果,但无法从根本上解决模型内部结构冗余导致的重复现象。


技术实现思路

1、基于此,有必要针对上述技术问题本文档来自技高网...

【技术保护点】

1.一种语音识别方法,其特征在于,包括:

2.如权利要求1所述的语音识别方法,其特征在于,所述通过去重语音识别模型处理所述优化语音,获得去重文本之前,还包括:

3.如权利要求2所述的语音识别方法,其特征在于,所述获取与预训练模型匹配的剪枝规则,包括:

4.如权利要求2所述的语音识别方法,其特征在于,所述根据所述剪枝规则对所述预训练模型进行剪枝,获得待评估语音识别模型,包括:

5.如权利要求4所述的语音识别方法,其特征在于,所述根据所述各个线性层的权重和所述剪枝规则确定权重阈值,包括:

6.如权利要求2所述的语音识别方法,其特征在...

【技术特征摘要】

1.一种语音识别方法,其特征在于,包括:

2.如权利要求1所述的语音识别方法,其特征在于,所述通过去重语音识别模型处理所述优化语音,获得去重文本之前,还包括:

3.如权利要求2所述的语音识别方法,其特征在于,所述获取与预训练模型匹配的剪枝规则,包括:

4.如权利要求2所述的语音识别方法,其特征在于,所述根据所述剪枝规则对所述预训练模型进行剪枝,获得待评估语音识别模型,包括:

5.如权利要求4所述的语音识别方法,其特征在于,所述根据所述各个线性层的权重和所述剪枝规则确定权重阈值,包括:

6.如权利要求2所述的语音识别方法,其特征在于,所述对所述待评估语音识别...

【专利技术属性】
技术研发人员:孙天宇张嘉雯魏韬
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1