会议纪要转录方法、设备和存储介质技术

技术编号：26602207 阅读：44 留言：0更新日期：2020-12-04 21:25

本申请涉及一种会议纪要转录方法、设备和存储介质。方法包括：获取麦克风阵列采集的会议中发言人的语音信号；针对语音信号提取声纹特征信息，并将声纹特征信息与预存储的声纹特征信息匹配；查找与匹配的预存储的声纹特征信息对应的用户身份信息，并将查找的用户身份信息识别为发言人的身份信息；将采集的语音信号转换为文本的会议发言内容；将文本的会议发言内容和发言人的身份信息关联记录；当未匹配到预存储声纹特征信息时，对语音信号进行声源方位定位，定位到发言人所处的方位；控制拍摄单元针对发言人所处的方位拍摄，得到发言人的图像，并将文本的会议发言内容和发言人的图像关联记录，生成会议纪要。采用本方法能够提高会议纪要生成效率。

全部详细技术资料下载

【技术实现步骤摘要】
会议纪要转录方法、设备和存储介质
本申请涉及计算机技术和语音识别
，特别是涉及一种会议纪要转录方法、设备和存储介质。
技术介绍
随着语音识别技术地不断发展，越来越多的行业中开始使用语音识别技术，例如，即时通信应用中的语音转文字功能、录音转文字的各类软件等。除此之外，会议纪要记录也是语音识别技术的一个应用场景。传统方法中，可以通过搜集会议发言人的语音，并通过语音识别技术将搜集的语音进行文字转录。然而，传统方法只能简单地将语音转换为文字，会导致转录出来的会议内容比较杂乱，还需要人工进一步分析整理，导致效率比较低，不够智能化。因此，亟需一种会议纪要转录方法来实现快速转录会议纪要。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够提高效率的会议纪要转录方法、设备和存储介质。一种会议纪要转录方法，该方法包括：获取麦克风阵列采集的会议中发言人的语音信号；针对采集的所述语音信号提取声纹特征信息，并将提取的所述声纹特征信息与预存储的声纹特征信息进行匹配；查找与匹配的...

【技术保护点】
1.一种会议纪要转录方法，其特征在于，所述方法包括：/n获取麦克风阵列采集的会议中发言人的语音信号；/n针对采集的所述语音信号提取声纹特征信息，并将提取的所述声纹特征信息与预存储的声纹特征信息进行匹配；/n查找与匹配的预存储的声纹特征信息对应的用户身份信息，并将查找到的用户身份信息识别为所述发言人的身份信息；/n将采集的所述语音信号转换为文本的会议发言内容；/n将所述文本的会议发言内容和所述发言人的身份信息进行关联记录；/n当未匹配到预存储声纹特征信息时，对所述发言人的语音信号进行声源方位定位，定位到所述发言人所处的方位；/n控制拍摄单元针对所述发言人所处的方位进行拍摄，得到位于所述方位上的所...

【技术特征摘要】
1.一种会议纪要转录方法，其特征在于，所述方法包括：
获取麦克风阵列采集的会议中发言人的语音信号；
针对采集的所述语音信号提取声纹特征信息，并将提取的所述声纹特征信息与预存储的声纹特征信息进行匹配；
查找与匹配的预存储的声纹特征信息对应的用户身份信息，并将查找到的用户身份信息识别为所述发言人的身份信息；
将采集的所述语音信号转换为文本的会议发言内容；
将所述文本的会议发言内容和所述发言人的身份信息进行关联记录；
当未匹配到预存储声纹特征信息时，对所述发言人的语音信号进行声源方位定位，定位到所述发言人所处的方位；
控制拍摄单元针对所述发言人所处的方位进行拍摄，得到位于所述方位上的所述发言人的图像，并将所述文本的会议发言内容和所述发言人的图像进行关联记录，生成会议纪要。

2.根据权利要求1所述的方法，其特征在于，所述对所述发言人的语音信号进行声源方位定位，定位到所述发言人所处的方位，包括：
根据所述发言人的语音信号到达所述麦克风阵列中不同麦克风的时间差异，确定所述发言人所处的位置相对于所述麦克风阵列的第一角度；
根据所述第一角度、以及所述麦克风阵列和拍摄单元的相对位置关系，确定所述发言人所处的位置相对于所述拍摄单元的第二角度；
所述控制拍摄单元针对所述发言人所处的方位进行拍摄，得到位于所述方位上的所述发言人的图像，包括：
控制所述拍摄单元针对所述第二角度下的人物进行拍摄，得到所述发言人的图像。

3.根据权利要求2所述的方法，其特征在于，所述控制所述拍摄单元针对所述第二角度下的人物进行拍摄，得到所述发言人的图像，包括：
控制所述拍摄单元针对位于所述第二角度下的人物进行拍摄；
当拍摄的图像中存在多个人物时，则将拍摄的所述图像输入至基于深度学习训练的动作识别模型中，识别出所述图像中正在执行说话动作的目标人物；
调整所述拍摄单元的拍摄角度拍摄所述目标人物，得到所述发言人的图像。

4.根据权利要求1所述的方法，其特征在于，所述发言人的身份信息是通过声纹识别单元识别得到；所述方法还包括：
在所述声纹识别单元识别所述发言人的身份信息后，控制所述声纹识别单元进入休眠状态；
当所述麦克风阵列采集的所述发言人的语音信号之间的时间间隔不小于预设停顿时长时，则唤醒处于休眠状态的所述声纹识别单元，返回执行声纹特征信息提取和匹配的步骤，以及执行查找用户身份信息的步骤。

5.根据权利要求4所述的方法，其特征在于，所述方法还包括：
当所述声纹识别单元被唤醒后所查找的用户身份信息，与休眠前所识别的所述发言人的身份信息不一致时，则判定唤醒后所查找的用户身份信息为所述发言人结束发言...

【专利技术属性】
技术研发人员：郑颖龙，赖蔚蔚，周昉昉，林嘉鑫，刘佳木，谢彬瑜，叶杭，吴广财，郑杰生，
申请(专利权)人：广东电力信息科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人