会议信息记录方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:19636907 阅读:22 留言:0更新日期:2018-12-01 17:24
本发明专利技术公开了一种会议信息记录方法、装置、计算机设备及存储介质,所述方法包括:若检测到采集通道产生语音数据,则获取该语音数据和当前时间,并对提取该语音数据的声纹特征,同时通过获取预设的声纹识别模型,来对该声纹特征进行识别,从而确定该声纹特征对应的目标与会人员标识,从而快速准确地确认当前发言人的身份,提高了会议信息记录记录发言人的效率和准确率,同时,对语音数据进行实时识别,生成实时语音文本,将与会人员标识、当前时间和实时语音文本进行关联,得到与会人员标识对应的与会人员在本次会议的发言信息,避免手工记录导致的漏记错记,提高了会议信息记录的效率和准确率。

Conference Information Recording Method, Device, Computer Equipment and Storage Media

The invention discloses a conference information recording method, device, computer equipment and storage medium. The method includes: if the voice data generated by the acquisition channel is detected, the voice data and the current time are acquired, and the voiceprint characteristics of the voice data are extracted. At the same time, the preset voiceprint recognition model is acquired. Recognition of the voiceprint feature can determine the target and participant identification corresponding to the voiceprint feature, thus quickly and accurately confirming the identity of the current speaker, improving the efficiency and accuracy of recording the speaker of conference information. At the same time, real-time recognition of voice data and generation of real-time voice text will be carried out. Personnel identification, current time and real-time voice text are correlated to get the speech information of the participants corresponding to the participants'identification at the meeting, so as to avoid the mistake caused by manual recording and improve the efficiency and accuracy of meeting information recording.

【技术实现步骤摘要】
会议信息记录方法、装置、计算机设备及存储介质
本专利技术涉及计算机
,尤其涉及一种会议信息记录方法、装置、计算机设备及存储介质。
技术介绍
随着科技的进步和计算机网络技术的飞速发展,对用于将各个计算机相互连接的网络计算技术的需求日益高涨。在网络连接环境下,可以顺利地进行计算机资源的共享和信息共享、流通、分发、交换等协同工作。例如,通过网络来实现多人的协同工作的系统有远程会议系统。采用远程会议系统,在位于相互远离的地点的会议室之间传图像和声音,可以看到映在电视画面上的参加者的面孔来召开会议。实际上彼此位于远程地区的参加者可以如同在同一会议室开会那样讨论事宜。另外,由于各个参加者不需要移动,所以能够有效利用时间和削减差旅费等经费等。远程会议给我们带来了很大的便利,但是,当远程会议的与会人员众多时,在进行会议信息记录的时候,往往由于与会人员的数量多而导致记错发言人,而且,在多次发言间隔时间短,或者发言时间较长时,容易漏记一些重要信息,这使得会议信息记录的效率低,且准确率不能达到要求。
技术实现思路
基于此,有必要针对上述技术问题,提供一种可以提高会议信息记录的效率和准确率的会议信息记录方法、装置、计算机设备及存储介质。一种会议信息记录方法,包括:若接收到采集通道的语音数据传输请求,则获取所述语音数据和当前时间;对所述语音数据进行声纹特征提取,得到所述语音数据的目标声纹特征;根据预设的声纹识别模型,对所述目标声纹特征进行声纹识别,确定所述目标声纹特征对应的目标与会人员标识,其中,所述声纹识别模型包括与会人员的基础声纹特征,与会人员标识,以及所述基础声纹特征和所述与会人员标识之间的对应关系;对所述语音数据进行语音识别,生成实时语音文本;将所述目标与会人员标识、所述当前时间和所述实时语音文本进行关联记录,得到所述目标与会人员标识对应的目标与会人员的发言信息。一种会议信息记录装置,包括:数据收集模块,用于若接收到采集通道的语音数据传输请求,则获取所述语音数据和当前时间;特征提取模块,用于对所述语音数据进行声纹特征提取,得到所述语音数据的目标声纹特征;人员确定模块,用于根据预设的声纹识别模型,对所述目标声纹特征进行声纹识别,确定所述目标声纹特征对应的目标与会人员标识,其中,所述声纹识别模型包括与会人员的基础声纹特征,与会人员标识,以及所述基础声纹特征和所述与会人员标识之间的对应关系;语音识别模块,用于对所述语音数据进行语音识别,生成实时语音文本;记录生成模块,用于将所述目标与会人员标识、所述当前时间和所述实时语音文本进行关联记录,得到所述目标与会人员标识对应的目标与会人员的发言信息。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述会议信息记录方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述会议信息记录方法的步骤。上述会议信息记录方法、装置、计算机设备及存储介质,一方面,若检测到采集通道产生语音数据,则获取该语音数据和当前时间,并对语音数据进行声纹特征提取,得到该语音数据的目标声纹特征,同时通过获取预设的声纹识别模型,来对该目标声纹特征进行识别,从而确定该目标声纹特征对应的目标与会人员标识,使得在远程会议的与会人员较多时,通过声纹识别的方式来快速准确识别当前发言人的身份,提高了会议信息记录中确认并记录发言人的效率以及提升了会议信息记录的准确率;另一方面,对语音数据进行实时识别,生成实时语音文本,将与会人员标识、当前时间和实时语音文本进行关联,得到与会人员标识对应的与会人员在本次会议的发言信息,避免手工记录导致的漏记错记,进一步提高了会议信息记录的效率和准确率。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例提供的会议信息记录方法的应用环境示意图;图2是本专利技术实施例提供的会议信息记录方法的实现流程图;图3是本专利技术实施例提供的会议信息记录方法中步骤S2的实现流程图;图4是本专利技术实施例提供的会议信息记录方法中步骤S4的实现流程图;图5是本专利技术实施例提供的会议信息记录方法中构建预设的声纹识别模型的实现流程图;图6是本专利技术实施例提供的会议信息记录方法中实时记录纠正的实现流程图;图7是本专利技术实施例提供的会议信息记录装置的示意图;图8是本专利技术实施例提供的计算机设备的示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1,图1示出本专利技术实施例提供的会议信息记录方法的应用环境。该会议信息记录方法应用在远程会议的会议信息记录场景中。该记录场景包括服务端、客户端和监控端,其中,服务端和客户端之间、服务端和监控端之间通过网络进行连接,与会人员通过客户端发送语音数据到服务端,服务端通过对语音数据进行分析,将语音数据转化为对应的会议记录信息,会议信息记录人员通过监控端监控并根据需要修改服务端的会议记录信息,客户端具体可以但不限于是各种话筒、麦克风、手机和带有录音功能的智能设备,服务端和监控端具体可以用独立的服务器或者多个服务器组成的服务器集群实现。请参阅图2,图2示出本专利技术实施例提供的一种会议信息记录方法,以该方法应用在图1中的服务器为例进行说明,详述如下:S1:若接收到采集通道的语音数据传输请求,则获取该语音数据和当前时间。具体地,当采集通道向服务端发送数据传输请求时,服务端接收该请求中的语音数据,并获取当前时间,其中,采集通道为本实施例的客户端。其中,采集通道收集与会人员的会议发言信息,其具体可以是各种话筒、麦克风或其他带有语音传输功能的通讯设备等,此处不作具体限制。值得说明的是,本专利技术实施例采用多个采集通道来收集语音数据,一般情况下,远程会议人数较多,4个以上的与会人员使用同一采集通道,会使得距离采集通道较远的与会人员的语音数据容易被识别成背景音,从而在语音信号优化的时候被过滤掉,使得语音识别的准确率变低,而本专利技术实施例中采用多通道,避免了因为使用同一采集通道的与会人员过多而导致的语音混杂识别率降低的问题,采集通道可以设置每个与会人员一个独立的采集通道,或者是邻近的2至4个人使用同一个采集通道,具体可以根据实际情况来设置,此处不作限制。S2:对语音数据进行声纹特征提取,得到该语音数据的目标声纹特征。具体地,对语音数据进行声纹特征提取,具体过程为:通过对语音数据进行语音编码和语音信号的预处理,将语音数据从模拟信号转化成数字信号,进而从该数字信号中进行声纹特征的提取,进而得到语音数据的目标声纹特征。其中,声纹特征包括但不限于:声学特征、词法特征、韵律特征、语种方言口音信息和通道信息等。优选地,本专利技术采用的声纹特征为声学特征。S3:根据预设的声纹本文档来自技高网...

【技术保护点】
1.一种会议信息记录方法,其特征在于,所述会议信息记录方法包括:若接收到采集通道的语音数据传输请求,则获取所述语音数据和当前时间;对所述语音数据进行声纹特征提取,得到所述语音数据的目标声纹特征;根据预设的声纹识别模型,对所述目标声纹特征进行声纹识别,确定所述目标声纹特征对应的目标与会人员标识,其中,所述声纹识别模型包括与会人员的基础声纹特征,与会人员标识,以及所述基础声纹特征和所述与会人员标识之间的对应关系;对所述语音数据进行语音识别,生成实时语音文本;将所述目标与会人员标识、所述当前时间和所述实时语音文本进行关联记录,得到所述目标与会人员标识对应的目标与会人员的发言信息。

【技术特征摘要】
1.一种会议信息记录方法,其特征在于,所述会议信息记录方法包括:若接收到采集通道的语音数据传输请求,则获取所述语音数据和当前时间;对所述语音数据进行声纹特征提取,得到所述语音数据的目标声纹特征;根据预设的声纹识别模型,对所述目标声纹特征进行声纹识别,确定所述目标声纹特征对应的目标与会人员标识,其中,所述声纹识别模型包括与会人员的基础声纹特征,与会人员标识,以及所述基础声纹特征和所述与会人员标识之间的对应关系;对所述语音数据进行语音识别,生成实时语音文本;将所述目标与会人员标识、所述当前时间和所述实时语音文本进行关联记录,得到所述目标与会人员标识对应的目标与会人员的发言信息。2.如权利要求1所述的会议信息记录方法,其特征在于,所述对所述语音数据进行声纹特征提取,得到所述语音数据的目标声纹特征包括:对所述语音数据进行声纹解析,得到初始声纹;对所述初始声纹进行预加重处理,生成具有平坦频谱的加重处理声纹;采用分帧和加窗的方式,对所述加重处理声纹进行分帧和加窗处理,得到第一基础语音帧;对所述第一基础语音帧进行静默音分离,得到第一目标语音帧;对每个所述第一目标语音帧进行声纹特征提取,得到所述目标声纹特征。3.如权利要求1所述的会议信息记录方法,其特征在于,所述对所述语音数据进行语音识别,生成实时语音文本包括:对所述语音数据进行语音解析,得到包含第二基础语音帧的帧集合;对所述第二基础语音帧进行静音检测,得到所述第二基础语音帧中的K个连续静音帧,其中,K为自然数;根据K个所述静音帧,将所述帧集合中包含的所述第二基础语音帧划分成K+1个第二目标语音帧;将每个所述第二目标语音帧转换为所述实时语音文本。4.如权利要求1所述的会议信息记录方法,其特征在于,在所述根据预设的声纹识别模型,对所述目标声纹特征进行声纹识别,确定所述目标声纹特征对应的目标与会人员标识之前,所述会议信息记录方法还包括:针对每个与会人员进行声纹特征采集,得到每个与会人员的基础声纹特征;获取每个与会人员标识,并基于所述与会人员的基础声纹特征,所述与会人员标识,以及与会人员的基础声纹特征和与会人员标识之间的对应关系,构建初始声纹识别模型;采用遗传算法对所述初始声纹识别模型进行训练,生成所述预设的声纹识别模型。5.如权利要求1所述的会议信息记录方法,其特征在于,在对所述语音数据进行实时识别,生成实时语音文本之后,在所述将所述目标与会人员标识、所述当前时间和所述实时语音文本进行关联,得到所述目标与会人员在本次会议的发言信息的步骤之前,且在所述对所述...

【专利技术属性】
技术研发人员:黄锦伦
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1