【技术实现步骤摘要】
会议记录方法、装置、设备及存储介质
[0001]本专利技术涉及语音识别
,尤其涉及一种会议记录方法、装置、设备及存储介质。
技术介绍
[0002]随着智能手机的普及,各种输入法和聊天软件成为人们的日常交流的必须品。目前各大主流输入法都支持语音识别,以及将语音转成文字输入,主流聊天软件也都支持相关功能。传统的语音识别原理如下:先对声音分帧;然后将波形作变换,把每一帧波形变成一个多维向量(即声学特征提取),得到观察序列;之后把帧识别成状态,状态组合成音素,音素组合成单词。目前单纯的单人语音转文字技术已经趋于成熟,线上会议成为很多公司开会的首选方式。但利用会议软件进行多人交流的网络语音会议场景下,某段时间内很可能存在多位参会人员讲话,单人语音转文字其实已经不能满足多人参会时的会议记录需求。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
[0004]本专利技术的主要目的在于提供一种会议记录方法、装置、设备及存储介质,旨在解决现有技术无法在多人参会 ...
【技术保护点】
【技术特征摘要】
1.一种会议记录方法,其特征在于,所述会议记录方法包括:对待记录音频文件进行分帧,得到所述待记录音频文件的分帧语音;根据所述分帧语音进行倒谱系数值计算,得到目标系数值;根据所述目标系数值确定目标记录用户;根据所述分帧语音和所述目标记录用户生成会议记录。2.如权利要求1所述的会议记录方法,其特征在于,所述对待记录音频文件进行分帧,得到所述待记录音频文件的分帧语音,包括:获取初始音频;对所述初始音频进行预加重处理,得到待记录音频文件;获取所述待记录音频文件的目标采样点;根据预设采样点数值对所述目标采样点进行划分,得到所述待记录音频文件的分帧语音。3.如权利要求1所述的会议记录方法,其特征在于,所述根据所述分帧语音进行倒谱系数值计算,得到目标系数值,包括:对所述分帧语音进行加窗,得到所述分帧语音对应的第一语音信号;对所述第一语音信号进行频谱变换,得到所述第一语音信号对应的频谱和功率谱;对所述频谱和所述功率谱进行倒谱系数值计算,得到目标系数值。4.如权利要求3所述的会议记录方法,其特征在于,所述对所述频谱和所述功率谱进行倒谱系数值计算,得到目标系数值,包括:根据所述功率谱和预设滤波器组进行能量输出,得到对数能量;根据所述对数能量和所述频谱进行向量变换,确定倒谱参数;根据所述倒谱参数进行倒谱系数值计算,得到目标系数值。5.如权利要求4所述的会议记录方法,其特征在于,所述根据所述倒谱参数进行倒谱系数值计算,得到目标系数值,包括:根据所述倒谱参数确定倒谱系数和倒谱系数的阶数;根据所述倒谱参数、倒谱系数以及阶数确定一阶差分参数;根据所述一阶差分...
【专利技术属性】
技术研发人员:李俊,聂俊,刘胜强,李振宁,
申请(专利权)人:中国科学技术大学先进技术研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。