一种自适应增益的智能审讯笔录装置及录音方法制造方法及图纸

技术编号：33644415 阅读：19 留言：0更新日期：2022-06-02 20:20

本发明专利技术公开了一种自适应增益的智能审讯笔录装置及方法，包括：步骤S1：通过多通道声音采集设备进行音源采集；步骤S2：解析音源，生成对应文本信息；步骤S3：基于目标文本信息，生成文本文件数据并输出；本发明专利技术提供的自适应音源增益过程不受限于具体现场环境结构、硬件采音设备和发言人的行为,能实时动态地对发言人的声学信号进行有助于提升识别效果的音源增益,从而避免传统方法的调优成本,保障实录过程；同时综合考虑声学信号的采集和串音处理过程,通过有效的声学特征提取和串音辨识策略模型,实时识别和过滤串音通道,显著降低了串音现象的发生；同时能有效适用于各实际应用的实录现场。场。场。

全部详细技术资料下载

【技术实现步骤摘要】
一种自适应增益的智能审讯笔录装置及录音方法

[0001]本专利技术涉及音频处理领域，尤其是一种自适应增益的智能审讯笔录装置及录音方法。

技术介绍

[0002]目前，在法院庭审过程中，需要将法官及当事人等各角色的发言信息记录下来，在庭审结束后整理成一份庭审笔录，经当事人签字确认后存档。在传统的庭审过程中，都会配一个书记员，整个庭审过程中书记员对各角色发言进行记录，记录完成后需要按照固定格式整理成庭审笔录。整个过程对书记员的打字水平有一定的要求，同时还需要对庭审的案件内容有一定的了解，对法律法规有一定程度的专业深度。在此过程中，由于书记员打字速度、对案件理解程度不一，经常会出现记录效率较低，记录不准确、漏记等问题。
[0003]在进行以语音识别为基础的多人实录系统中，室内环境结构、麦克风硬件、说话人位置和声音，都显著影响现场识别效果。各因素的变动容易造成收音微弱、麦克风串音，进而导致明显的识别率下降和识别结果错误等，从而影响使用体验。市面上还没有一种同时有效解决以上问题的方法、装置或设备。自适应音源增益和防串音方法提供简单通用的配置参数，实现了适配不同实录现场，综合考虑环境、硬件、软件、发言人方式等因素，实时分析各发言人通道的声学信息，进行相应的音量特征增益和串音过滤，极大程度上解决了声音小的识别丢字和各通道串音问题，有效保障了不同实录现场的语音识别效果。
[0004]针对相关技术中法院庭审过程中，记录庭审笔录效率较低的问题，目前尚未提出有效的解决方案。
[0005]目前应用的语音识别系统保证高识...

【技术保护点】

【技术特征摘要】
1.一种自适应增益的智能审讯笔录方法，其特征是，包括：步骤S1：通过多通道声音采集设备进行音源采集；步骤S2：解析音源，生成对应文本信息；步骤S3：基于目标文本信息，生成文本文件数据并输出。2.根据权利要求1所述的一种自适应增益的智能审讯笔录方法，其特征是，步骤S1包括：步骤S1A：将采集设备分区布置采音设备及其相关组件；步骤S1B：采集由采音设备及其相关组件的各通道语音信号；步骤S1C：提取声源的数字信号和声学信息，提供预设的特征；步骤S1D：根据预设的特征量化和分析，确定原信号的音量指标。3.根据权利要求2所述的一种自适应增益的智能审讯笔录方法，其特征是，在步骤S1中，特征量化过程中, 该方法因动态根据说话人的音量大小的实时变化进行自适应的参数输出，采用基于前馈记忆网络的时序建模, 输出每一帧声音信号的增益参数, 并进行增益和输出。4.根据权利要求1所述的一种自适应增益的智能审讯笔录方法，其特征是，步骤S2包括：步骤S2A：将采集到的音源的语音帧按照条件进行划分，得到多个语音组；步骤S2B：将划分的语音组进行状态划分；步骤S2C：对划分后的语音状态进行数据分离，获得若干单字或单词；步骤S2D：将获得的单字或单词进行逻辑组合，得到多条语音信息。5.根据权利要求4所述的一种自适应增益的智能审讯笔录方法，其特征是，对各通道的特征数据进行相似...

【专利技术属性】
技术研发人员：麦联韬，唐海江，朱宇，袁宇豪，
申请(专利权)人：杭州云嘉云计算有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人