【技术实现步骤摘要】
一种人声分离方法和装置以及设备
本专利技术涉及人声分离
,尤其涉及一种人声分离方法和装置以及设备。
技术介绍
音频会议,是指两个或两个以上不同地方的个人或群体,通过传输线路及多媒体设备,将声音互传,实现即时且互动的沟通,以实现同时进行会议。然而,现有的人声分离方案,在应用在音频会议的会议记录场景时,一般是由人工根据音频会议内容进行人声分离形成文本会议记录,但是由于该音频会议内容会涉及多人人声和人耳对人声的分辨率是有限的,而且由于人的主动性,导致该进行人声分离形成的文本会议记录的准确率一般。
技术实现思路
有鉴于此,本专利技术的目的在于提出一种人声分离方法和装置以及设备,能够在应用在音频会议的会议记录场景时,能够实现无需人工能够根据音频会议内容进行人声分离形成文本会议记录,能够提高该进行人声分离形成的文本会议记录的准确率。根据本专利技术的一个方面,提供一种人声分离方法,包括:在音频会议的会议记录场景时,采集每个参加所述音频会议的参会人员的声音数据;对所述采集的每个参会人员的声音数据进行 ...
【技术保护点】
1.一种人声分离方法,其特征在于,包括:/n在音频会议的会议记录场景时,采集每个参加所述音频会议的参会人员的声音数据;/n对所述采集的每个参会人员的声音数据进行声纹特征提取;/n根据所述提取的声纹特征,对所述音频会议的会议记录场景对应的音频会议内容进行人声分离;/n按时间戳方式,将所述人声分离后的音频会议内容中的每个参会人员的声音数据进行分别标记;/n根据所述经分别标记后的每个参会人员的声音数据,形成所述音频会议的会议记录场景对应的音频会议内容的文本会议记录。/n
【技术特征摘要】
1.一种人声分离方法,其特征在于,包括:
在音频会议的会议记录场景时,采集每个参加所述音频会议的参会人员的声音数据;
对所述采集的每个参会人员的声音数据进行声纹特征提取;
根据所述提取的声纹特征,对所述音频会议的会议记录场景对应的音频会议内容进行人声分离;
按时间戳方式,将所述人声分离后的音频会议内容中的每个参会人员的声音数据进行分别标记;
根据所述经分别标记后的每个参会人员的声音数据,形成所述音频会议的会议记录场景对应的音频会议内容的文本会议记录。
2.如权利要求1所述的人声分离方法,其特征在于,所述根据所述提取的声纹特征,对所述音频会议的会议记录场景对应的音频会议内容进行人声分离,包括:
获取所述音频会议的会议记录场景对应的音频会议内容的人声声音数据,和对所述获取的人声声音数据进行声纹特征提炼,和对比所述提炼的声纹特征和所述提取的声纹特征,采用将所述提炼的声纹特征中与所述提取的声纹特征相同的声纹特征对应的音频会议内容进行分离的方式,对所述音频会议的会议记录场景对应的音频会议内容进行人声分离。
3.如权利要求1所述的人声分离方法,其特征在于,所述按时间戳方式,将所述人声分离后的音频会议内容中的每个参会人员的声音数据进行分别标记,包括:
根据所述人声分离后的音频会议内容中的每个参会人员的声音数据对应的时间戳,生成关联所述时间戳的标签,根据所述生成的标签,将所述人声分离后的音频会议内容中的每个参会人员的声音数据进行分别标记。
4.如权利要求1所述的人声分离方法,其特征在于,所述根据所述经分别标记后的每个参会人员的声音数据,形成所述音频会议的会议记录场景对应的音频会议内容的文本会议记录,包括:
根据所述经分别标记后的每个参会人员的声音数据,采用自然语言处理方式,形成所述音频会议的会议记录场景对应的音频会议内容的文本会议记录。
5.如权利要求1所述的人声分离方法,其特征在于,在所述根据所述经分别标记后的每个参会人员的声音数据,形成所述音频会议的会议记录场景对应的音频会议内容的文本会议记录之后,还包括:
...
【专利技术属性】
技术研发人员:肖龙源,李稀敏,刘晓葳,谭玉坤,叶志坚,
申请(专利权)人:厦门快商通科技股份有限公司,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。