一种信息处理方法及电子设备技术

技术编号:13864715 阅读:52 留言:0更新日期:2016-10-19 18:39
本发明专利技术提供一种信息处理方法及电子设备,所述方法应用于一电子设备中,所述电子设备包括图像采集单元和声音采集单元,所述方法包括:当利用所述声音采集单元采集声音信息时,利用所述图像采集单元采集图像信息,所述图像信息至少包括发出所述声音信息的说话者的第一图像信息;利用所述声音信息和所述图像信息,获得所述说话者的身份信息;对所述声音信息进行识别,获得所述声音信息对应的文字信息;基于预定的会议脚本模板、所述说话者的身份信息及所述文字信息,生成会议脚本记录。

【技术实现步骤摘要】

本专利技术涉及信息处理
,尤其涉及一种信息处理方法及电子设备
技术介绍
随着信息时代的到来,多人会议成为人们日常工作和生活中不可或缺的一环,而多人会议的脚本记录作为会议的回顾备份也成为会议中必不可少的一部分。现有技术中,对会议的脚本记录通常采用人工方式进行。记录员主要记录的内容是:说话者信息、说话者所说的内容。例如:多人会议中,与会者A首先说话,说话的内容为:大家好!接着与会者B说话,说话的内容是:欢迎大家。但本申请专利技术人在实现本申请实施例中专利技术技术方案的过程中,发现上述技术至少存在如下技术问题:现有技术中,需要人工进行会议的脚本记录,专人记录花费劳力,且人工记录容易引入差错,记录后还需人工手动将记录的内容填充至需要的模板中。现有技术中还不存在电子设备在会议进行过程中自动生成脚本记录的方案。因此,现有技术中存在的技术问题是:电子设备在会议进行的过程中不能自动生成会议的脚本记录。
技术实现思路
本专利技术实施例提供一种信息处理方法及电子设备,用于解决现有技术中存在的电子设备在会议进行的过程中不能自动生成会议的脚本记录的技术问题,提供了一种电子设备在会议进行的过程中自动生成会议的脚本记录的方法,节
约了劳力成本,提高了会议的脚本记录的准确性,简化了用户操作。一方面,本专利技术实施例提供了一种信息处理方法,应用于电子设备中,所述电子设备包括图像采集单元和声音采集单元,所述方法包括:当利用所述声音采集单元采集声音信息时,利用所述图像采集单元采集图像信息,所述图像信息至少包括发出所述声音信息的说话者的第一图像信息;利用所述声音信息和所述图像信息,获得所述说话者的身份信息;对所述声音信息进行识别,获得所述声音信息对应的文字信息;基于预定的会议脚本模板、所述说话者的身份信息及所述文字信息,生成会议脚本记录。可选的,在所述利用所述声音信息和所述图像信息,获得所述说话者的身份信息之前,所述方法还包括:利用所述图像采集单元采集与会者的样本图像信息,并利用所述声音采集单元采集与会者的样本声音信息,所述与会者包括所述说话者;利用所述样本图像信息和所述样本声音信息,建立说话者识别模型。可选的,所述利用所述声音信息和所述图像信息,获得所述说话者的身份信息,具体为:利用所述声音信息识别所述说话者的身份信息,获得初步识别结果;利用所述样本图像信息对所述初步识别结果进行检验,获得所述说话者的身份信息。可选的,所述利用所述样本图像信息对所述初步识别结果进行检验,获得所述说话者的身份信息,包括:将所述样本图像信息依次与所述声音信息绑定,获得多个图像声音信息对;依次将多个图像声音对输入所述说话者识别模型,获得多个身份信息;将多个身份信息中出现次数最多的身份信息作为所述说话者的身份信息。可选的,所述利用所述声音信息和所述图像信息,获得所述说话者的身份信息,具体为:利用所述图像信息识别所述说话者的身份信息,获得初步识别结果;利用所述声音信息对所述初步识别结果进行检验,获得所述说话者的身份信息。可选的,所述利用所述图像信息对所述初步识别结果进行检验,获得所述说话者的身份信息,包括:从所述样本声音信息中提取所述初步识别结果表征的第一说话者的第一样本声音信息;判断所述声音信息是否与所述第一样本声音信息相同,获得判断结果;若所述判断结果为是,则所述说话者的身份信息为所述第一说话者。可选的,在所述获得所述说话者的身份信息之后,所述方法还包括:根据所述图像信息,确定所述说话者的位置信息;所述基于预定的会议脚本模板、所述说话者的身份信息及所述文字信息,生成会议脚本记录,具体为:基于预定的会议脚本模板、所述说话者的身份信息、所述说话者的位置信息及所述文字信息,生成所述会议脚本记录。另一方面,本专利技术实施例提供了一种电子设备,包括:声音采集单元,用于采集声音信息;图像采集单元,用于采集图像信息,所述图像信息至少包括发出所述声音信息的说话者的第一图像信息;第一获得单元,用于利用所述声音信息和所述图像信息,获得所述说话者的身份信息;第二获得单元,用于对所述声音信息进行识别,获得所述声音信息对应的文字信息;生成单元,用于基于预定的会议脚本模板、所述说话者的身份信息及所述文字信息,生成会议脚本记录。可选的,所述图像采集单元还用于:在所述利用所述声音信息和所述图像
信息,获得所述说话者的身份信息之前,采集与会者的样本图像信息;所述声音采集单元还用于:在所述利用所述声音信息和所述图像信息,获得所述说话者的身份信息之前,采集与会者的样本声音信息,所述与会者包括所述说话者;所述电子设备还包括:建立单元,用于利用所述样本图像信息和所述样本声音信息,建立说话者识别模型。可选的,所述第一获得单元具体包括:第一获得模块,用于利用所述声音信息识别所述说话者的身份信息,获得初步识别结果;第二获得模块,用于利用所述样本图像信息对所述初步识别结果进行检验,获得所述说话者的身份信息。可选的,所述第二获得模块包括:第一获得子模块,用于将所述样本图像信息依次与所述声音信息绑定,获得多个图像声音信息对;第二获得子模块,用于依次将多个图像声音对输入所述说话者识别模型,获得多个身份信息;确定子模块,用于将多个身份信息中出现次数最多的身份信息作为所述说话者的身份信息。可选的,所述第一获得单元具体包括:第三获得模块,用于利用所述图像信息识别所述说话者的身份信息,获得初步识别结果;第四获得模块,用于利用所述声音信息对所述初步识别结果进行检验,获得所述说话者的身份信息。可选的,所述第四获得模块包括:提取子模块,用于从所述样本声音信息中提取所述初步识别结果表征的第
一说话者的第一样本声音信息;判断子模块,用于判断所述声音信息是否与所述第一样本声音信息相同,获得判断结果;确定子模块,用于若所述判断结果为是,则所述说话者的身份信息为所述第一说话者。可选的,所述电子设备还包括:确定单元,用于在所述获得所述说话者的身份信息之后,根据所述图像信息,确定所述说话者的位置信息;所述生成单元具体用于:基于预定的会议脚本模板、所述说话者的身份信息、所述说话者的位置信息及所述文字信息,生成所述会议脚本记录。本专利技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:1、本专利技术实施例中,当利用电子设备的声音采集单元采集声音信息时,利用电子设备的图像采集单元采集图像信息,所述图像信息至少包括发出所述声音信息的说话者的第一图像信息;然后利用所述声音信息和所述图像信息,获得所述说话者的身份信息;接着对所述声音信息进行识别,获得所述声音信息对应的文字信息;最后基于预定的会议脚本模板、所述说话者的身份信息及所述文字信息,生成会议脚本记录。在会议进行的过程中电子设备自动生成会议脚本记录,解决了现有技术中存在的电子设备在会议进行的过程中不能自动生成会议的脚本记录的技术问题,提供了一种电子设备在会议进行的过程中自动生成会议的脚本记录的方法,节约了劳力成本,提高了会议的脚本记录的准确性,简化了用户操作。2、本专利技术实施例中,还根据所述图像信息,确定所述说话者的位置信息;然后基于预定的会议脚本模板、所述说话者的身份信息、所述说话者的位置信息及所述文字信息,生成所述会议脚本记录。同时记录每个说话者何时开始说\本文档来自技高网
...

【技术保护点】
一种信息处理方法,应用于电子设备中,所述电子设备包括图像采集单元和声音采集单元,所述方法包括:当利用所述声音采集单元采集声音信息时,利用所述图像采集单元采集图像信息,所述图像信息至少包括发出所述声音信息的说话者的第一图像信息;利用所述声音信息和所述图像信息,获得所述说话者的身份信息;对所述声音信息进行识别,获得所述声音信息对应的文字信息;基于预定的会议脚本模板、所述说话者的身份信息及所述文字信息,生成会议脚本记录。

【技术特征摘要】
1.一种信息处理方法,应用于电子设备中,所述电子设备包括图像采集单元和声音采集单元,所述方法包括:当利用所述声音采集单元采集声音信息时,利用所述图像采集单元采集图像信息,所述图像信息至少包括发出所述声音信息的说话者的第一图像信息;利用所述声音信息和所述图像信息,获得所述说话者的身份信息;对所述声音信息进行识别,获得所述声音信息对应的文字信息;基于预定的会议脚本模板、所述说话者的身份信息及所述文字信息,生成会议脚本记录。2.如权利要求1所述的方法,其特征在于,在所述利用所述声音信息和所述图像信息,获得所述说话者的身份信息之前,所述方法还包括:利用所述图像采集单元采集与会者的样本图像信息,并利用所述声音采集单元采集与会者的样本声音信息,所述与会者包括所述说话者;利用所述样本图像信息和所述样本声音信息,建立说话者识别模型。3.如权利要求2所述的方法,其特征在于,所述利用所述声音信息和所述图像信息,获得所述说话者的身份信息,具体为:利用所述声音信息识别所述说话者的身份信息,获得初步识别结果;利用所述样本图像信息对所述初步识别结果进行检验,获得所述说话者的身份信息。4.如权利要求3所述的方法,其特征在于,所述利用所述样本图像信息对所述初步识别结果进行检验,获得所述说话者的身份信息,包括:将所述样本图像信息依次与所述声音信息绑定,获得多个图像声音信息对;依次将多个图像声音对输入所述说话者识别模型,获得多个身份信息;将多个身份信息中出现次数最多的身份信息作为所述说话者的身份信息。5.如权利要求2所述的方法,其特征在于,所述利用所述声音信息和所述图像信息,获得所述说话者的身份信息,具体为:利用所述图像信息识别所述说话者的身份信息,获得初步识别结果;利用所述声音信息对所述初步识别结果进行检验,获得所述说话者的身份信息。6.如权利要求5所述的方法,其特征在于,所述利用所述图像信息对所述初步识别结果进行检验,获得所述说话者的身份信息,包括:从所述样本声音信息中提取所述初步识别结果表征的第一说话者的第一样本声音信息;判断所述声音信息是否与所述第一样本声音信息相同,获得判断结果;若所述判断结果为是,则所述说话者的身份信息为所述第一说话者。7.如权利要求1至6中任一权项所述的方法,其特征在于,在所述获得所述说话者的身份信息之后,所述方法还包括:根据所述图像信息,确定所述说话者的位置信息;所述基于预定的会议脚本模板、所述说话者的身份信息及所述文字信息,生成会议脚本记录,具体为:基于预定的会议脚本模板、所述说话者的身份信息、所述说话者的位置信息及所述文字信息,生成所述会议脚本记录。8.一种...

【专利技术属性】
技术研发人员:胡永涛
申请(专利权)人:联想北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1