会议记录方法、装置、设备及存储介质制造方法及图纸

技术编号:33399304 阅读:19 留言:0更新日期:2022-05-11 23:20
本发明专利技术属于语音识别技术领域,公开了一种会议记录方法、装置、设备及存储介质。该方法包括:对待记录音频文件进行分帧,得到所述待记录音频文件的分帧语音;根据所述分帧语音进行倒谱系数值计算,得到目标系数值;根据所述目标系数值确定目标记录用户;根据所述分帧语音和所述目标记录用户生成会议记录。通过上述方式,通过对参会人员发言时的待记录音频文件进行分帧,并对得到的分帧语音进行倒谱系数值,根据得到的倒谱系数值确定在会议进行发言的目标记录用户,并根据分帧语音对目标记录用户的发言内容进行记录,最终完成生成待记录音频文件对应会议的会议记录,提高了会议记录时的效率,节省了会议记录的人力成本。节省了会议记录的人力成本。节省了会议记录的人力成本。

【技术实现步骤摘要】
会议记录方法、装置、设备及存储介质


[0001]本专利技术涉及语音识别
,尤其涉及一种会议记录方法、装置、设备及存储介质。

技术介绍

[0002]随着智能手机的普及,各种输入法和聊天软件成为人们的日常交流的必须品。目前各大主流输入法都支持语音识别,以及将语音转成文字输入,主流聊天软件也都支持相关功能。传统的语音识别原理如下:先对声音分帧;然后将波形作变换,把每一帧波形变成一个多维向量(即声学特征提取),得到观察序列;之后把帧识别成状态,状态组合成音素,音素组合成单词。目前单纯的单人语音转文字技术已经趋于成熟,线上会议成为很多公司开会的首选方式。但利用会议软件进行多人交流的网络语音会议场景下,某段时间内很可能存在多位参会人员讲话,单人语音转文字其实已经不能满足多人参会时的会议记录需求。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供一种会议记录方法、装置、设备及存储介质,旨在解决现有技术无法在多人参会发言时进行会议记录的技术问题。
[0005]为实现上述目的,本专利技术提供了一种会议记录方法,所述方法包括以下步骤:
[0006]对待记录音频文件进行分帧,得到所述待记录音频文件的分帧语音;
[0007]根据所述分帧语音进行倒谱系数值计算,得到目标系数值;
[0008]根据所述目标系数值确定目标记录用户;
[0009]根据所述分帧语音和所述目标记录用户生成会议记录。
[0010]可选地,所述对待记录音频文件进行分帧,得到所述待记录音频文件的分帧语音,包括:
[0011]获取初始音频;
[0012]对所述初始音频进行预加重处理,得到待记录音频文件;
[0013]获取所述待记录音频文件的目标采样点;
[0014]根据预设采样点数值对所述目标采样点进行划分,得到所述待记录音频文件的分帧语音。
[0015]可选地,所述根据所述分帧语音进行倒谱系数值计算,得到目标系数值,包括:
[0016]对所述分帧语音进行加窗,得到所述分帧语音对应的第一语音信号;
[0017]对所述第一语音信号进行频谱变换,得到所述第一语音信号对应的频谱和功率谱;
[0018]对所述频谱和所述功率谱进行倒谱系数值计算,得到目标系数值。
[0019]可选地,所述对所述频谱和所述功率谱进行倒谱系数值计算,得到目标系数值,包括:
[0020]根据所述功率谱和预设滤波器组进行能量输出,得到对数能量;
[0021]根据所述对数能量和所述频谱进行向量变换,确定倒谱参数;
[0022]根据所述倒谱参数进行倒谱系数值计算,得到目标系数值。
[0023]可选地,所述根据所述倒谱参数进行倒谱系数值计算,得到目标系数值,包括:
[0024]根据所述倒谱参数确定倒谱系数和倒谱系数的阶数;
[0025]根据所述倒谱参数、倒谱系数以及阶数确定一阶差分参数;
[0026]根据所述一阶差分参数确定二阶差分参数;
[0027]根据所述倒谱参数、一阶差分参数以及二阶差分参数得到目标系数值。
[0028]可选地,所述根据所述目标系数值确定目标记录用户,包括:
[0029]在历史系数值中查找是否存在所述目标系数值;
[0030]若所述历史系数值中存在所述目标系数值,则根据所述历史系数值对应的历史记录用户确定目标记录用户;
[0031]若所述历史系数值中不存在所述目标系数值,则根据所述目标系数值生成目标记录用户。
[0032]可选地,所述根据所述分帧语音和所述目标记录用户生成会议记录,包括:
[0033]根据所述分帧语音进行语音转换,得到所述分帧语音对应的语音内容;
[0034]将所述语音内容与所述目标记录用户进行内容匹配并进行文本输出,生成所述待记录音频文件对应的会议记录。
[0035]此外,为实现上述目的,本专利技术还提出一种会议记录装置,所述会议记录装置包括:
[0036]分帧模块,用于对待记录音频文件进行分帧,得到所述待记录音频文件的分帧语音;
[0037]计算模块,用于根据所述分帧语音进行倒谱系数值计算,得到目标系数值;
[0038]确定模块,用于根据所述目标系数值确定目标记录用户;
[0039]生成模块,用于根据所述分帧语音和所述目标记录用户生成会议记录。
[0040]此外,为实现上述目的,本专利技术还提出一种会议记录设备,所述会议记录设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的会议记录程序,所述会议记录程序配置为实现如上文所述的会议记录方法。
[0041]此外,为实现上述目的,本专利技术还提出一种存储介质,所述存储介质上存储有会议记录程序,所述会议记录程序被处理器执行时实现如上文所述的会议记录方法。
[0042]本专利技术通过对待记录音频文件进行分帧,得到所述待记录音频文件的分帧语音;根据所述分帧语音进行倒谱系数值计算,得到目标系数值;根据所述目标系数值确定目标记录用户;根据所述分帧语音和所述目标记录用户生成会议记录。通过上述方式,通过对参会人员发言时的待记录音频文件进行分帧,并对得到的分帧语音进行倒谱系数值,根据得到的倒谱系数值确定在会议进行发言的目标记录用户,并根据分帧语音对目标记录用户的发言内容进行记录,最终完成生成待记录音频文件对应会议的会议记录,提高了会议记录时的效率,节省了会议记录的人力成本。
附图说明
[0043]图1是本专利技术实施例方案涉及的硬件运行环境的会议记录设备的结构示意图;
[0044]图2为本专利技术会议记录方法第一实施例的流程示意图;
[0045]图3为本专利技术会议记录方法一实施例的会议记录示意图;
[0046]图4为本专利技术会议记录方法第二实施例的流程示意图;
[0047]图5为本专利技术会议记录装置第一实施例的结构框图。
[0048]本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
[0049]应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。
[0050]参照图1,图1为本专利技术实施例方案涉及的硬件运行环境的会议记录设备结构示意图。
[0051]如图1所示,该会议记录设备可以包括:处理器1001,例如中央处理器 (Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘 (Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真 (Wireless

Fid本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种会议记录方法,其特征在于,所述会议记录方法包括:对待记录音频文件进行分帧,得到所述待记录音频文件的分帧语音;根据所述分帧语音进行倒谱系数值计算,得到目标系数值;根据所述目标系数值确定目标记录用户;根据所述分帧语音和所述目标记录用户生成会议记录。2.如权利要求1所述的会议记录方法,其特征在于,所述对待记录音频文件进行分帧,得到所述待记录音频文件的分帧语音,包括:获取初始音频;对所述初始音频进行预加重处理,得到待记录音频文件;获取所述待记录音频文件的目标采样点;根据预设采样点数值对所述目标采样点进行划分,得到所述待记录音频文件的分帧语音。3.如权利要求1所述的会议记录方法,其特征在于,所述根据所述分帧语音进行倒谱系数值计算,得到目标系数值,包括:对所述分帧语音进行加窗,得到所述分帧语音对应的第一语音信号;对所述第一语音信号进行频谱变换,得到所述第一语音信号对应的频谱和功率谱;对所述频谱和所述功率谱进行倒谱系数值计算,得到目标系数值。4.如权利要求3所述的会议记录方法,其特征在于,所述对所述频谱和所述功率谱进行倒谱系数值计算,得到目标系数值,包括:根据所述功率谱和预设滤波器组进行能量输出,得到对数能量;根据所述对数能量和所述频谱进行向量变换,确定倒谱参数;根据所述倒谱参数进行倒谱系数值计算,得到目标系数值。5.如权利要求4所述的会议记录方法,其特征在于,所述根据所述倒谱参数进行倒谱系数值计算,得到目标系数值,包括:根据所述倒谱参数确定倒谱系数和倒谱系数的阶数;根据所述倒谱参数、倒谱系数以及阶数确定一阶差分参数;根据所述一阶差分...

【专利技术属性】
技术研发人员:李俊聂俊刘胜强李振宁
申请(专利权)人:中国科学技术大学先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1