麦克风控制方法、电子装置及计算机可读存储介质制造方法及图纸

技术编号:24941949 阅读:46 留言:0更新日期:2020-07-17 21:49
本发明专利技术涉及智能控制技术领域,揭露了一种麦克风控制方法,该方法包括:根据预设用户群的字典矩阵对预设用户群的当前语音信息分解,得到所述预设用户群中参与发言的每个发言者的语音信息的时域信号数据,将所述时域信号数据输入预先训练好的声纹识别模型,得到所述每个发言者的语音特征,当判断预设声纹库存储有某一指定发言者的语音特征时,获取所述指定发言者的标签,根据预先确定的麦克风与发言者的标签的映射关系,确定所述指定发言者的麦克风,并开启所述麦克风。本发明专利技术还提出一种电子装置以及一种计算机可读存储介质。本发明专利技术实现了智能化控制麦克风的开关。

【技术实现步骤摘要】
麦克风控制方法、电子装置及计算机可读存储介质
本专利技术涉及智能控制
,尤其涉及一种麦克风控制方法、电子装置及计算机可读存储介质。
技术介绍
随着当前社会信息技术的发展,各企业对会议的要求与时俱进,此时智能会议应运而生,智能会议采用ASR(AutomaticSpeechRecognition,语音识别)技术将发言者的语音实时转换为文字信息,从而自动生成报告字幕、会议记录等,保证了会议的高效进行。然而,现有技术中,无法实现麦克风开关的智能化控制,当前麦克风开关通常由人工控制,会议过程中存在以下问题:1、人工频繁切换麦克风会破坏会议进程的连续性,打断与会者的发言思路;2、人工控制麦克风开关难以保证语音输出的实时性、准确性,易导致语音转写为文字的准确率降低以及转写资源的浪费;3、与会者发言时如果忘记开启麦克风,将导致会议数据不完整。因此,为解决上述问题,亟需一种智能化控制麦克风开关的方案。
技术实现思路
鉴于以上内容,有必要提供一种麦克风控制方法,旨在实现智能化控制麦克风的开关。...

【技术保护点】
1.一种麦克风控制方法,应用于电子装置,其特征在于,所述方法包括:/n分解步骤:实时获取预设用户群的当前语音信息,根据所述预设用户群的字典矩阵对所述当前语音信息进行分解,得到所述预设用户群中参与发言的每个发言者的语音信息的时域信号数据;/n识别步骤:将所述预设用户群中参与发言的每个发言者的语音信息的时域信号数据输入预先训练好的声纹识别模型,得到所述每个发言者的语音特征,判断预设声纹库是否存储有所述每个发言者的语音特征;/n开启步骤:当判断所述预设声纹库存储有某一指定发言者的语音特征时,获取所述指定发言者的标签,根据预先确定的麦克风与发言者的标签的映射关系,确定所述指定发言者的麦克风,并开启所述...

【技术特征摘要】
1.一种麦克风控制方法,应用于电子装置,其特征在于,所述方法包括:
分解步骤:实时获取预设用户群的当前语音信息,根据所述预设用户群的字典矩阵对所述当前语音信息进行分解,得到所述预设用户群中参与发言的每个发言者的语音信息的时域信号数据;
识别步骤:将所述预设用户群中参与发言的每个发言者的语音信息的时域信号数据输入预先训练好的声纹识别模型,得到所述每个发言者的语音特征,判断预设声纹库是否存储有所述每个发言者的语音特征;
开启步骤:当判断所述预设声纹库存储有某一指定发言者的语音特征时,获取所述指定发言者的标签,根据预先确定的麦克风与发言者的标签的映射关系,确定所述指定发言者的麦克风,并开启所述麦克风。


2.如权利要求1所述的麦克风控制方法,其特征在于,所述方法在分解步骤前还包括:
构建步骤:收集所述预设用户群中每个用户的语音信息,计算所述预设用户群中每个用户的字典矩阵,并基于所述每个用户的字典矩阵构建所述预设用户群的字典矩阵。


3.如权利要求2所述的麦克风控制方法,其特征在于,所述方法在开启步骤后还包括:
关闭步骤:获取从各个已开启的麦克风输入的语音信息,对所述语音信息进行转写并对转写得到的文本信息进行有效性判断,若超过预设时间阈值从某一麦克风输入的语音信息所转写得到的文本信息皆为无效信息,则关闭所述麦克风。


4.如权利要求1所述的麦克风控制方法,其特征在于,所述根据所述预设用户群的字典矩阵对所述当前语音信息进行分解包括:
对所述当前语音信息的时域信号数据进行短时傅里叶变换,得到所述当前语音信息的频域信号数据;
对所述当前语音信息的频域信号数据取模数,得到所述当前语音信息的幅度谱;
根据所述预设用户群的字典矩阵对所述当前语音信息的幅度谱进行分解及有效性判断,得到所述预设用户群中参与发言的每个发言者的语音信息的幅度谱;
对所述每个发言者的语音信息的幅度谱进行过滤;
将过滤后的所述每个发言者的语音信息的幅度谱转换为所述每个发言者的语音信息的频域信号数据;
将所述每个发言者的语音信息的频域信号数据转换为所述每个发言者的语音信息的时域信号数据。


5.如权利要求1-4任一项所述的麦克风控制方法,其特征在于,所述开启步骤还包括:
当判断所述预设声纹库未存储某一指定发言者的语音特征时,将所述指定发言者的语音特征发送给预设客户端;
当接收到所述预设客户端反馈的所述指定发言者的麦克风及标签后,开启所述指定发言者的麦克风,并将所述指定发言者的语音特征及标签存储至所述预设声纹库。

...

【专利技术属性】
技术研发人员:邬慷肖金平刘屹万正勇沈志勇
申请(专利权)人:招商局金融科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1