会议记录方法、装置、设备及存储介质制造方法及图纸

技术编号：33399304 阅读：30 留言：0更新日期：2022-05-11 23:20

本发明专利技术属于语音识别技术领域，公开了一种会议记录方法、装置、设备及存储介质。该方法包括：对待记录音频文件进行分帧，得到所述待记录音频文件的分帧语音；根据所述分帧语音进行倒谱系数值计算，得到目标系数值；根据所述目标系数值确定目标记录用户；根据所述分帧语音和所述目标记录用户生成会议记录。通过上述方式，通过对参会人员发言时的待记录音频文件进行分帧，并对得到的分帧语音进行倒谱系数值，根据得到的倒谱系数值确定在会议进行发言的目标记录用户，并根据分帧语音对目标记录用户的发言内容进行记录，最终完成生成待记录音频文件对应会议的会议记录，提高了会议记录时的效率，节省了会议记录的人力成本。节省了会议记录的人力成本。节省了会议记录的人力成本。

全部详细技术资料下载

【技术实现步骤摘要】
会议记录方法、装置、设备及存储介质

[0001]本专利技术涉及语音识别
，尤其涉及一种会议记录方法、装置、设备及存储介质。

技术介绍

[0002]随着智能手机的普及，各种输入法和聊天软件成为人们的日常交流的必须品。目前各大主流输入法都支持语音识别，以及将语音转成文字输入，主流聊天软件也都支持相关功能。传统的语音识别原理如下：先对声音分帧；然后将波形作变换，把每一帧波形变成一个多维向量(即声学特征提取)，得到观察序列；之后把帧识别成状态，状态组合成音素，音素组合成单词。目前单纯的单人语音转文字技术已经趋于成熟，线上会议成为很多公司开会的首选方式。但利用会议软件进行多人交流的网络语音会议场景下，某段时间内很可能存在多位参会人员讲话，单人语音转文字其实已经不能满足多人参会时的会议记录需求。
[0003]上述内容仅用于辅助理解本专利技术的技术方案，并不代表承认上述内容是现有技术。

技术实现思路

[0004]本专利技术的主要目的在于提供一种会议记录方法、装置、设备及存储介质，旨在解决现有技术无法在多人参会...

【技术保护点】

【技术特征摘要】
1.一种会议记录方法，其特征在于，所述会议记录方法包括：对待记录音频文件进行分帧，得到所述待记录音频文件的分帧语音；根据所述分帧语音进行倒谱系数值计算，得到目标系数值；根据所述目标系数值确定目标记录用户；根据所述分帧语音和所述目标记录用户生成会议记录。2.如权利要求1所述的会议记录方法，其特征在于，所述对待记录音频文件进行分帧，得到所述待记录音频文件的分帧语音，包括：获取初始音频；对所述初始音频进行预加重处理，得到待记录音频文件；获取所述待记录音频文件的目标采样点；根据预设采样点数值对所述目标采样点进行划分，得到所述待记录音频文件的分帧语音。3.如权利要求1所述的会议记录方法，其特征在于，所述根据所述分帧语音进行倒谱系数值计算，得到目标系数值，包括：对所述分帧语音进行加窗，得到所述分帧语音对应的第一语音信号；对所述第一语音信号进行频谱变换，得到所述第一语音信号对应的频谱和功率谱；对所述频谱和所述功率谱进行倒谱系数值计算，得到目标系数值。4.如权利要求3所述的会议记录方法，其特征在于，所述对所述频谱和所述功率谱进行倒谱系数值计算，得到目标系数值，包括：根据所述功率谱和预设滤波器组进行能量输出，得到对数能量；根据所述对数能量和所述频谱进行向量变换，确定倒谱参数；根据所述倒谱参数进行倒谱系数值计算，得到目标系数值。5.如权利要求4所述的会议记录方法，其特征在于，所述根据所述倒谱参数进行倒谱系数值计算，得到目标系数值，包括：根据所述倒谱参数确定倒谱系数和倒谱系数的阶数；根据所述倒谱参数、倒谱系数以及阶数确定一阶差分参数；根据所述一阶差分...

【专利技术属性】
技术研发人员：李俊，聂俊，刘胜强，李振宁，
申请(专利权)人：中国科学技术大学先进技术研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人