视频会议语音转换文字纪要方法和系统技术方案

技术编号：30154746 阅读：38 留言：0更新日期：2021-09-25 15:05

本申请公开了一种视频会议语音转换文字纪要方法和系统，涉及视频会议技术，该方法包括以下步骤：确定当前使用的目标拾音器；对所述目标拾音器所采集的第一音频信息进行回声消除，得到第二音频信息；将所述第二音频信息的全部或者部分输入到性别鉴定模型，以确定发言者的性别；根据所述发言者的性别选择语音文字转换模型来对所述第二音频信息进行转换，得到所述文字纪要，其中，每个性别配置有对应的语音文字转换模型。本申请先识别发言者的性别在选用对应性别的语音文字转换模型进行翻译，可以提升转换的准确度。可以提升转换的准确度。可以提升转换的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
视频会议语音转换文字纪要方法和系统

[0001]本申请涉及视频会议技术，特别是一种视频会议语音转换文字纪要方法和系统。

技术介绍

[0002]在视频会议中，有时候为了记录会议的内容或者显示字幕，需要将发言者所说的话转换成文字，形成会议纪要。
[0003]现有技术中，相同的语句由不同性别的用户发音，转换的结果可能存在差异，可见现有技术存在精度不足的问题。

技术实现思路

[0004]本专利技术旨在至少解决现有技术中存在的技术问题之一。为此，本专利技术提出一种视频会议语音转换文字纪要方法和系统，以克服性别差异导致的识别不准确。
[0005]一方面，本申请实施例提供了：
[0006]一种视频会议语音转换文字纪要方法，包括以下步骤：
[0007]确定当前使用的目标拾音器；
[0008]对所述目标拾音器所采集的第一音频信息进行回声消除，得到第二音频信息；
[0009]将所述第二音频信息的全部或者部分输入到性别鉴定模型，以确定发言者的性别；
[0010]根据所述发言者...

【技术保护点】

【技术特征摘要】
1.一种视频会议语音转换文字纪要方法，其特征在于，包括以下步骤：确定当前使用的目标拾音器；对所述目标拾音器所采集的第一音频信息进行回声消除，得到第二音频信息；将所述第二音频信息的全部或者部分输入到性别鉴定模型，以确定发言者的性别；根据所述发言者的性别选择语音文字转换模型来对所述第二音频信息进行转换，得到所述文字纪要，其中，每个性别配置有对应的语音文字转换模型。2.根据权利要求1所述的视频会议语音转换文字纪要方法，其特征在于，可选的所述语音文字转换模型包括第一语音文字转换模型和第二语音文字转换模型；所述第一语音文字转换模型通过男性的语音样本进行训练得到；所述第二语音文字转换模型通过女性的语音样本进行训练得到。3.根据权利要求1所述的视频会议语音转换文字纪要方法，其特征在于，将所述第二音频信息输入到性别鉴定模型，以确定发言者的性别，包括:将所述第二音频信息的全部或者部分输入到性别鉴定模型中，使所述性别鉴定模型输出所述第二音频信息属于男性的第一概率和属于女性的第二概率；当所述第一概率和第二概率之差的绝对值大于预设值时，将所述第一概率和所述第二概率之中较大值对应的性别作为发言者的性别。4.根据权利要求3所述的视频会议语音转换文字纪要方法，其特征在于，所述方法还包括以下步骤：当所述第一概率和所述第二概率之差的绝对值小于等于预设值时，获取所述目标拾音器的使用者的画面，根据画面中目标拾音器的位置确定发言者的人脸，通过所述人脸进行识别，得到发言者的性别。5.根据权利要求1所述的视频会议语音转换文字纪要方法，其特征在于，将所述第二音频信息输入到性别鉴定模型，以确定发言者的性别，包括:将所述第二音频信息分割成多个子音频信息；将...

【专利技术属性】
技术研发人员：秦凤枝，王远丰，罗崇立，陈燕，罗一文，潘亮，凌怡珍，陈业钊，徐晓东，彭文昊，翟长华，
申请(专利权)人：广东电力通信科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人