生成会议记录的方法、装置和会议终端制造方法及图纸

技术编号:22103369 阅读:26 留言:0更新日期:2019-09-14 03:49
本发明专利技术提供一种生成会议记录的方法、装置和会议终端。其中,生成会议记录的方法包括:通过声音采集装置获取多个与会人员中发言人的语音信号,根据发言人的语音信号通过摄像头获取发言人的人脸图像;其中,发言人的语音信号用于生成会议记录中的文字信息,人脸图像用于生成会议记录中发言人的身份信息;将发言人的语音信号和发言人的人脸图像发送给服务器。会议终端可以采集会议过程中每个发言人的语音信号和人脸图像,发送给服务器。从而,服务器可以生成包括发言人身份的会议记录,提升了处理效率。

Method, device and conference terminal for generating conference records

【技术实现步骤摘要】
生成会议记录的方法、装置和会议终端
本专利技术涉及信息管理
,尤其涉及生成会议记录的方法、装置和会议终端。
技术介绍
随着商业的快速发展,会议系统的应用十分广泛。对于多人参与的会议,在会议进行中或者会议结束后,通常需要生成会议纪录,以便后续达成会议决定及共识。目前,会议记录通常通过人工整理。例如,会议记录人员在会议进行中快速记录不同说话人的发言,进行相应的文字记录。或者,在会议过程中利用摄像头、麦克风、录音笔等设备对各个人员的发言进行录音或录像。在会议结束后,会议记录人员查看录音或录像,从而整理出各个人员的会议记录。但是,通过人工整理的方式形成会议记录,对用户来说费时费力,降低了处理效率。
技术实现思路
本专利技术提供一种生成会议记录的方法、装置和会议终端,提升了会议记录的生成效率。第一方面,本专利技术提供一种生成会议记录的方法,包括:通过声音采集装置获取多个与会人员中发言人的语音信号,根据所述语音信号通过摄像头获取所述发言人的人脸图像;其中,所述发言人的语音信号用于生成会议记录中的文字信息,所述人脸图像用于生成所述会议记录中所述发言人的身份信息;将所述发言人的语音信号和所述发言人的人脸图像发送给服务器。可选的,所述通过声音采集装置获取多个与会人员中发言人的语音信号,包括:通过所述声音采集装置获取所述发言人的原始语音信号;对所述原始语音信号进行语句切分,获得所述语音信号;所述语音信号包括多个音频信号和每个音频信号的序号;其中,所述音频信号与语句对应;相应的,将所述发言人的语音信号发送给服务器,包括:将所述多个音频信号和每个音频信号的序号发送给所述服务器。可选的,所述通过摄像头获取所述发言人的人脸图像,包括:根据所述发言人的语音信号确定所述发言人的位置;根据所述发言人的位置控制所述摄像头对所述发言人进行拍摄,获取所述发言人的人脸图像。可选的,所述通过声音采集装置获取多个与会人员中发言人的语音信号,通过摄像头获取所述发言人的人脸图像之前,还包括:通过摄像头获取每个与会人员的人脸注册图像;将每个与会人员的人脸注册图像发送给所述服务器。可选的,所述人脸注册图像包括多个图片,所述多个图片中人脸的拍摄角度不同。可选的,所述将所述发言人的语音信号和所述发言人的人脸图像发送给服务器,包括:将所述发言人的语音信号、所述发言人的人脸图像和会议终端的标识信息发送给所述服务器。可选的,还包括:接收所述服务器发送的会议记录;所述会议记录包括所述发言人的语音信号对应的文字信息和所述发言人的身份信息。第二方面,本专利技术提供一种生成会议记录的装置,包括:第一采集模块,用于通过声音采集装置获取多个与会人员中发言人的语音信号,所述发言人的语音信号用于生成会议记录中的文字信息;第二采集模块,用于根据所述语音信号通过摄像头获取所述发言人的人脸图像,所述人脸图像用于生成所述会议记录中所述发言人的身份信息;发送模块,用于将所述发言人的语音信号和所述发言人的人脸图像发送给服务器。可选的,所述第一采集模块具体用于:通过所述声音采集装置获取所述发言人的原始语音信号;对所述原始语音信号进行语句切分,获得所述语音信号;所述语音信号包括多个音频信号和每个音频信号的序号;其中,所述音频信号与语句对应;所述发送模块具体用于:将所述多个音频信号和每个音频信号的序号发送给所述服务器。可选的,所述第二采集模块具体用于:根据所述发言人的语音信号确定所述发言人的位置;根据所述发言人的位置控制所述摄像头对所述发言人进行拍摄,获取所述发言人的人脸图像。可选的,还包括第三采集模块,所述第三采集模块用于:通过摄像头获取每个与会人员的人脸注册图像;所述发送模块,还用于将每个与会人员的人脸注册图像发送给所述服务器。可选的,所述人脸注册图像包括多个图片,所述多个图片中人脸的拍摄角度不同。可选的,所述发送模块具体用于:将所述发言人的语音信号、所述发言人的人脸图像和会议终端的标识信息发送给所述服务器。可选的,还包括接收模块,所述接收模块用于:接收所述服务器发送的会议记录;所述会议记录包括所述发言人的语音信号对应的文字信息和所述发言人的身份信息。第三方面,本专利技术提供一种会议终端,包括:处理器、存储器和收发器;所述收发器,用于与其他设备通信;所述存储器,用于存储指令;所述处理器,用于执行所述存储器中存储的指令,以执行本专利技术第一方面任意实施方式提供的方法。第四方面,本专利技术提供一种存储介质,包括:可读存储介质和计算机程序,所述计算机程序用于本专利技术第一方面任意实施方式提供的方法。第五方面,本申请实施例提供一种程序产品,该程序产品包括计算机程序(即执行指令),该计算机程序存储在可读存储介质中。至少一个处理器可以从可读存储介质读取该计算机程序,至少一个处理器执行该计算机程序使得该设备实施本专利技术第一方面任意实施方式提供的方法。本专利技术提供一种生成会议记录的方法、装置和会议终端,通过声音采集装置获取多个与会人员中发言人的语音信号,根据语音信号通过摄像头获取发言人的人脸图像,将发言人的语音信号和发言人的人脸图像发送给服务器。服务器可以根据发言人的人脸图像获取发言人的身份信息,通过发言人的语音信号获取文字信息,从而生成包括发言人身份的会议记录,提升了会议记录的生成效率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例适用的系统架构图;图2为本专利技术实施例提供的生成会议记录的方法的消息交互图;图3为本专利技术实施例提供的生成会议记录的装置的结构示意图;图4为本专利技术实施例提供的会议终端的结构示意图。具体实施方式下面,通过具体的实施例对本专利技术提供的生成会议记录的方法、装置和会议终端进行说明。示例性的,图1为本专利技术实施例适用的系统架构图。如图1所示,系统可以包括会议终端100和服务器200。会议终端100与服务器200可以进行通信。本专利技术对于通信方式不做限定。例如,可以通过无线网络进行无线通信,也可以通过有线网络进行有线通信。其中,会议终端100包括声音采集装置和摄像头。声音采集装置用于采集声音信号,摄像头用于拍摄图像或视频。本专利技术对于声音采集装置、摄像头的实现方式、数量和在会议终端中的设置位置不做限定。例如,声音采集装置可以为麦克风阵列。例如,摄像头可以为多个,分别设置在会议终端的不同外表面上,可以拍摄不同方向的图像或视频。又例如,摄像头可以为一个,且可以调整拍摄方向。其中,服务器200可以获取会议终端100发送的数据。并且,服务器200可以实现语音识别、语义识别和人脸识别的功能,从而生成包括发言人身份信息的会议记录。可选的,会议终端100也可以实现语音识别、语义识别和人脸识别的功能。需要说明的是,本实施例对于会议终端100的形状和结构不做限定。示例性的,如图1所示,会议终端100可以包括但不限于:麦克风阵列11、语音信号处理模块12、摄像头13、人脸识别模块14、通信接口15、扬声器16和供电模块17。麦克风阵列11可以采集语音信号。语音信号处理模块12可以对麦克风阵列11采集的语音信号进本文档来自技高网...

【技术保护点】
1.一种生成会议记录的方法,其特征在于,包括:通过声音采集装置获取多个与会人员中发言人的语音信号,根据所述语音信号通过摄像头获取所述发言人的人脸图像;其中,所述发言人的语音信号用于生成会议记录中的文字信息,所述人脸图像用于生成所述会议记录中所述发言人的身份信息;将所述发言人的语音信号和所述发言人的人脸图像发送给服务器。

【技术特征摘要】
1.一种生成会议记录的方法,其特征在于,包括:通过声音采集装置获取多个与会人员中发言人的语音信号,根据所述语音信号通过摄像头获取所述发言人的人脸图像;其中,所述发言人的语音信号用于生成会议记录中的文字信息,所述人脸图像用于生成所述会议记录中所述发言人的身份信息;将所述发言人的语音信号和所述发言人的人脸图像发送给服务器。2.根据权利要求1所述的方法,其特征在于,所述通过声音采集装置获取多个与会人员中发言人的语音信号,包括:通过所述声音采集装置获取所述发言人的原始语音信号;对所述原始语音信号进行语句切分,获得所述语音信号;所述语音信号包括多个音频信号和每个音频信号的序号;其中,所述音频信号与语句对应;相应的,将所述发言人的语音信号发送给服务器,包括:将所述多个音频信号和每个音频信号的序号发送给所述服务器。3.根据权利要求1所述的方法,其特征在于,所述根据所述语音信号通过摄像头获取所述发言人的人脸图像,包括:根据所述发言人的语音信号确定所述发言人的位置;根据所述发言人的位置控制所述摄像头对所述发言人进行拍摄,获取所述发言人的人脸图像。4.根据权利要求1所述的方法,其特征在于,所述通过声音采集装置获取多个与会人员中发言人的语音信号,根据所述语音信号通过摄像头获取所述发言人的人脸图像之前,还包括:通过摄像头获取每个与会人员的人脸注册图像;将每个与会人员的人脸注册图像发送给所述服务器。5.根据权利要求4所述的方法,其特征在于,所述人脸注册图像包括多个图片,所述多个图片中人脸的拍摄角度不同。6.根据权利要求1至5任一项所述的方法,其特征在于,所述将所述发言人的语音信号和所述发言人的人脸图像发送给服务器,包括:将所述发言人的语音信号、所述发言人的人脸图像和会议终端的标识信息发送给所述服务器。7.根据权利要求1至5任一项所述的方法,其特征在于,还包括:接收所述服务器发送的会议记录;所述会议记录包括所述发言人的语音信号对应的文字信息和所述发言人的身份信息。8.一种生成会议记录的装置,其特征在于,包括:第一采集模块,用于通过声音采集装置获取多个与会人员中发言...

【专利技术属性】
技术研发人员:耿雷
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1