一种基于音波图的音频识别结果可视化展示方法和系统技术方案

技术编号：38729639 阅读：15 留言：0更新日期：2023-09-08 23:20

本发明专利技术公开了一种基于音波图的音频识别结果可视化展示方法，属于警用音频处理技术领域。本发明专利技术提供了完善的音频识别结果展示思路和与音波图的交互方式，实现了音频识别结果中的每一句话与音波图的片段相互对应和动态交互，清晰的展示出识别结果中每一句话在音波图上的位置以及对应的音波图片段，形成了识别结果的可视化展示能力；音波图播放时，在语音识别结果展示区突出显示当前播放位置对应的对话内容，实现了识别结果和音波图的同步展示；点击语音识别结果区的每一句话，会控制音波图跳转到对应的位置，实现了识别结果的快速定位。本发明专利技术实现了音波图、音频和对话内容三方的快速定位，提高了办案人员的办案效率。提高了办案人员的办案效率。提高了办案人员的办案效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于音波图的音频识别结果可视化展示方法和系统

[0001]本专利技术属于警用音频处理
，更具体地，涉及一种基于音波图的音频识别结果可视化展示方法和系统。

技术介绍

[0002]随着音频音波图技术和语音识别技术的快速发展，利用计算机技术可以将办案过程中收集到的音频进行可视化展示和语音识别，传统展示方式只停留在音频和整篇的语音识别结果关联，对于音频中的重要信息办案人员很难快速定位到这些信息所在位置，可能需要多次点击才能精确定位，这一过程很浪费时间。在一个音频中可能涉及多个角色对话，需要办案人员去记不同角色所说的不同的话，无法直观的显示每个人所说的话。

技术实现思路

[0003]针对现有技术的以上缺陷或改进需求，本专利技术提供了一种基于音波图的音频识别结果可视化展示方法和系统，其目的在于解决现有音频识别展示技术无法精确快速定位所需信息以及分角色展示识别结果的技术问题。
[0004]为实现上述目的，一方面，本专利技术提供了一种基于音波图的音频识别结果可视化展示方法，所述方法包括：
[0005]获取音频的音波图和语音识别结果，并基于音波图获取音波图总长度L和总时间totalT，基于语音识别结果获取每句对话的开始时间beginT、结束时间endT、角色和对话内容；
[0006]在音波图上创建不同的区域对应所述音频中的每句对话，所述区域相对于音波图的开始位置offsetX为：
[0007][0008]宽度width为：
[0009][0010]所述区域被选择后，所述...

【技术保护点】

【技术特征摘要】
1.一种基于音波图的音频识别结果可视化展示方法，其特征在于，所述方法包括：获取音频的音波图和语音识别结果，并基于音波图获取音波图总长度L和总时间totalT，基于语音识别结果获取每句对话的开始时间beginT、结束时间endT、角色和对话内容；在音波图上创建不同的区域对应所述音频中的每句对话，所述区域相对于音波图的开始位置offsetX为：宽度width为：所述区域被选择后，所述音频跳转到被选所述区域的开始位置进行播放；将语音识别结果中的每句对话按角色加对话内容的形式在结果展示区进行展示，当音频进行播放时，获取当前播放时间，若所述播放时间位于一句对话的开始时间beginT和结束时间endT之间，则突出显示所述对话；若选择了展示中的一句对话，则获取所述对话的开始时间beginT，跳转到音频的beginT进行播放，且所述对话在音波图上对应的区域突出显示。2.根据权利要求1所述的方法，其特征在于，若选择了展示中的角色，则展示中所述角色所说的对话内容被突出显示，且所述对话内容在音波图上对应的区域被突出显示。3.根据权利要求1所述的方法，其特征在于，所述区域在音波图上分段显示，若所述区域被选择，则所述区域的音波图被突出显示，且在识别结果展示区突出显示所述区域对应的所述对话内容。4.根据权利要求1所述的方法，其特征在于，若选择展示的一句对话，则进入所述对话内容的编辑功能，并能将编辑后对话内容保存在语音识别结果中。5.一种基于音波图的音频识别结果可视化展示系统...

【专利技术属性】
技术研发人员：余梦帅，乔宏永，王虎，
申请(专利权)人：中国船舶集团有限公司第七〇九研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人