一种国产操作系统语音转写方法、装置及存储介质制造方法及图纸

技术编号:46585688 阅读:0 留言:0更新日期:2025-10-10 21:22
本申请公开了一种国产操作系统语音转写方法、装置及存储介质,属于语音识别技术领域。所述方法包括:首先,确定并部署语音识别模型、语音活动检测模型和标点符号预测模型;其次,通过专门的录音线程实时获取音频数据,并使用语音活动检测模型提取人声片段;然后,创建语音识别线程对人声片段进行语音识别,实时更新文本内容;最后,利用标点符号预测模型为文本添加必要的标点符号,并基于这些标点符号动态裁剪音频片段。通过这些技术手段,本申请能够在保证高识别准确度的同时,有效提高语音转写的实时性和系统效率。

【技术实现步骤摘要】

本申请实施例涉及语音识别,特别涉及一种国产操作系统语音转写方法、装置及存储介质


技术介绍

1、随着信息技术的快速发展,语音识别技术在各行各业的应用越来越广泛,从语音助手、客服系统到会议记录和实时翻译等,语音转写需求持续增长。尤其在国产操作系统(如openkylin,银河麒麟操作系统)建设中,高精度、低延迟的语音转写技术成为提升人机交互体验的关键。

2、然而,传统语音转写系统在处理长时音频时面临多个挑战。首先,背景噪声和非人声干扰影响识别准确率,导致识别效果不理想。其次,音频的长度和实时性要求加大了系统的处理延迟,增加了识别错误率。此外,滑动窗口机制虽然能更新上下文,但无法确保有效片段的正确淘汰,且更新的文本结果并不总是准确。

3、因此,如何在保证高识别准确率的同时,提高系统的实时响应能力,成为了亟待解决的技术问题。


技术实现思路

1、本申请实施例提供了一种国产操作系统语音转写方法、装置及存储介质,所述技术方案如下。

2、一方面,提供了一种国产操作系统语音转写方法,所述方法本文档来自技高网...

【技术保护点】

1.一种国产操作系统语音转写方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定目标国产操作系统待部署的语音转写相关模型并完成部署,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述开启专门录音线程进行录音音频数据的实时获取,包括:

5.根据权利要求1述的方法,其特征在于,所述在所述专门录音线程运行中,通过所述语音活动检测模型实时提取出所述录音音频数据中的人声片段,包括:

6.根据权利要求1所述的方法,其特征在于,所述创建语音识别线程...

【技术特征摘要】

1.一种国产操作系统语音转写方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述确定目标国产操作系统待部署的语音转写相关模型并完成部署,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述开启专门录音线程进行录音音频数据的实时获取,包括:

5.根据权利要求1述的方法,其特征在于,所述在所述专门录音线程运行中,通过所述语音活动检测模型实时提取出所述录音音频数据中的人声片段,包括:

6.根据权利要求1所述的方法,其特征在于,所述创建语音识别线...

【专利技术属性】
技术研发人员:刘晓东余杰李汉华黄江杰纪斌彭龙高珑李琢张毅李临波
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1