一种语音分割方法、装置以及计算机可读存储介质制造方法及图纸

技术编号:27615521 阅读:24 留言:0更新日期:2021-03-10 10:45
本发明专利技术公开了一种语音分割方法、装置以及计算机可读存储介质,包括获取语音输入信息根据所获取的语音输入信息,生成对应的文本信息,其中文本信息中包括多个语句片段;获取每个语句片段在语音输入信息中的第一时间点和第二时间点,其中第一时间点表征语句片段的起始时间戳,第二时间点表征语句片段的结尾时间戳;根据第一时间点和第二时间点,获取语音输入信息中的语音片段。本方案通过将语音输入信息转换为文本,利用文本中的语句段确定第一时间点和第二时间点,再利用第一时间点和第二时间点作为语音分割点来分割语音输入信息以得到语音片段,以此获取的语音片段中只对应一个目标对象,可提升后续聚类时的准确度。可提升后续聚类时的准确度。可提升后续聚类时的准确度。

【技术实现步骤摘要】
一种语音分割方法、装置以及计算机可读存储介质


[0001]本专利技术涉及语音识别
,尤其涉及一种语音分割方法、装置以及计算机可读存储介质。

技术介绍

[0002]话者分离技术主要面向的是多个话者不同时发声的场景,它解决的是“什么时候由谁说”这样一个问题,目前的话者分离技术中的一个重要过程是说话人分割,而目前说话人分割往往凭借行业经验对语音数据进行均匀分割,这样容易出现某个语音片段中同时存在多个话者,导致在后续聚类过程中将该语音片段的边界部分被错分给相邻说话人,准确度不高。

技术实现思路

[0003]本专利技术实施例提供了一种语音分割方法、装置以及计算机可读存储介质,具有将分割后的语音片段只属于一个目标对象,以提升后续聚类时准确度的技术效果。
[0004]本专利技术一方面提供一种语音分割方法,所述方法包括:获取语音输入信息,其中所述语音输入信息包括对应于多个目标对象并且独立的语音片段;根据所获取的语音输入信息,生成对应的文本信息,其中所述文本信息中包括多个语句片段;获取每个所述语句片段在所述语音输入信息中的第一时间点本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音分割方法,其特征在于,所述方法包括:获取语音输入信息,其中所述语音输入信息包括对应于多个目标对象并且独立的语音片段;根据所获取的语音输入信息,生成对应的文本信息,其中所述文本信息中包括多个语句片段;获取每个所述语句片段在所述语音输入信息中的第一时间点和第二时间点,其中所述第一时间点表征所述语句片段的起始时间戳,所述第二时间点表征所述语句片段的结尾时间戳;根据所述第一时间点和第二时间点,获取所述语音输入信息中的语音片段。2.根据权利要求1所述的方法,其特征在于,所述根据所获取的语音输入信息,生成对应的文本信息,包括:通过语音识别系统将所述语音输入信息转为连续的文本信息;通过基于自然语言理解的标点模型对所述连续的文本信息进行断句处理,以生成包括多个语句片段的文本信息。3.根据权利要求1所述的方法,其特征在于,所述获取每个所述语句片段在所述语音输入信息中的第一时间点和第二时间点,包括:识别所述文本信息中对应同一目标对象且连续的语句片段;获取所述同一目标对象且连续的语句片段中第一个语句片段的第一时间点和最后一个语句片段的第二时间点。4.根据权利要求1所述的方法,其特征在于,在获取所述语音输入信息中的语音片段之后,所述方法还包括:通过声纹识别技术确定每个所述语音片段所对应的目标对象。5.根据权利要求4所述的方法,其特征在于,在确定每个所述语音片段所对应的目标对象之后,所述方法还包括:对所确定的语音片段进行聚类处理,以使每个分类中只包含同一目标对象的语音片段。6.根据权利要求1所述的方法,其特征在于,在根据所获...

【专利技术属性】
技术研发人员:郭理勇陈晓宇曾晨晨李志飞
申请(专利权)人:出门问问苏州信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1