【技术实现步骤摘要】
会议记录方法、装置、设备及存储介质
本专利技术涉及信息处理
,尤其涉及一种会议记录方法、装置、设备及存储介质。
技术介绍
会议助手主要是用于在进行会议时帮助记录会议的具体内容,形成会议记录,并根据会议记录生成会议纪要。目前会议助手的实现方案多是基于音频录音进行,即在会议进行时通过录音笔设备完成录音后,通过语音识别对录音进行语音识别和角色分离,然后生成会议记录和会议纪要,其中,会议记录和会议纪要中包括每个参会人员说话的文本,以及每个参会人员的身份。由于一个录音文件中包含了参会的多个人的语音,参会人语音的时长各有不同,说话的间隔较短等因素,使得参会人的语音难以从录音中单独区分处理,即录音说话人分离的准确率较低,影响会议记录的生成。
技术实现思路
本专利技术的主要目的在于提供一种会议记录方法、装置、设备及存储介质,旨在解决由于会议中讲话对象分离的准确率低导致的会议记录生成不准确的技术问题。为实现上述目的,本专利技术提供一种会议记录方法,所述方法包括:获取全景摄像设备采集的会 ...
【技术保护点】
1.一种会议记录方法,其特征在于,所述方法包括:/n获取全景摄像设备采集的会议视频和红外线摄像设备采集的红外视频,所述会议视频中包括音频信息;/n根据所述音频信息确定多个文本段和每个文本段的第一时间信息;/n根据所述会议视频中的第一图像集合和所述红外视频中的第二图像集合,确定多个第一讲话时段、和每个第一讲话时段对应的对象信息,所述多个第一讲话时段按照时间顺序排列;/n根据所述多个文本段、每个文本段的第一时间信息、所述多个第一讲话时段、和每个第一讲话时段对应的对象信息,生成会议记录。/n
【技术特征摘要】
1.一种会议记录方法,其特征在于,所述方法包括:
获取全景摄像设备采集的会议视频和红外线摄像设备采集的红外视频,所述会议视频中包括音频信息;
根据所述音频信息确定多个文本段和每个文本段的第一时间信息;
根据所述会议视频中的第一图像集合和所述红外视频中的第二图像集合,确定多个第一讲话时段、和每个第一讲话时段对应的对象信息,所述多个第一讲话时段按照时间顺序排列;
根据所述多个文本段、每个文本段的第一时间信息、所述多个第一讲话时段、和每个第一讲话时段对应的对象信息,生成会议记录。
2.根据权利要求1所述的方法,其特征在于,所述根据所述会议视频中的第一图像集合和所述红外视频中的第二图像集合,确定多个第一讲话时段、和每个第一讲话时段对应的对象信息,包括:
根据所述第二图像集合,确定各时刻的讲话对象;
根据各时刻的讲话对象,确定所述多个第一讲话时段,一个所述第一讲话时段中的讲话对象相同;
根据所述第一图像集合,确定每个第一讲话时段对应的对象信息。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第二图像集合,确定各时刻的讲话对象,包括:
在所述第二图像集合的每张第二图像中,确定多个参会对象的口腔红外特征;
根据每张第二图像中所述多个参会对象的口腔红外特征,确定所述各时刻的讲话对象。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一图像集合,确定每个第一讲话时段对应的对象信息,包括:
针对任意一个第一讲话时段,确定所述第一讲话时段中的讲话对象在第二图像中的对象位置,所述第二图像为所述第二图像集合中的图像;
根据所述讲话对象在所述第二图像中的对象位置,确定所述讲话对象在第一图像中的对象位置,所述第一图像为所述第一图像集合中的图像,所述讲话对象在所述第二图像中的对象位置与所述讲话对象在所述第一图像中的对象位置相同;
根据所述讲话对象在第一图像中的对象位置,确定所述第一讲话时段对应的对象信息。
5.根据权利要求4所述的方法,其特征在于,所述根据所述讲话对象在第一图像中的对象位置,确定所述第一讲话时段对应的对象信息,包括:
根据所述讲话对象在第一图像中的对象位置,确定所述讲话对象;
对所述讲话对象进行人脸识别和/或人体特征识别,得到第一特征信息;
根据所述第一特征信息、以及特征信息与对象信息之间的预设对应关系,确定所述第一讲话时段对应的对象信息。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
若所述预设对应关系中不存在所述第一特征信息对应的对象信息,确定所述讲话对象的临时身份标识;
将所述临时身份标识确定为所述讲话对象的对象信息。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据所述多个文本段、每个文本段的第一时间信息、所述多个第一讲话时段、和每个第一讲话时段对应的对象信息,生成会议记录,包括:
根据每个文本段的第一时间信息,确定每个第一讲话时段对应的至少一个文本段;
根据每个第一讲话时段对应的对象信息和每个第一讲话时段对应的至少一个文本段,生成所述会议记录。
8.根据权利要求7所述的方法,其特征在于,所述根据每个第一讲话时段对应的对象信息和每个第一讲话时段对应的至少一个文本段,生成所述会议记录,包括:
判断所述多个文本段中是否存在第一文本段,所述多个第一讲话时段对应的至少一个文本段中均不包括所述第一文本段...
【专利技术属性】
技术研发人员:杨海军,徐倩,杨强,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。