语音断句的方法、装置和存储介质制造方法及图纸

技术编号:22170621 阅读:40 留言:0更新日期:2019-09-21 12:10
本申请提供一种语音断句的方法、装置和存储介质,该方法包括:获取待断句语音对应的文本;采用断句模型,确定所述文本的断句位置,以及所述文本的断句位置的可信度,所述断句模型用于表征文本与断句位置、断句位置的可信度的对应关系;若确定所述文本的断句位置的可信度大于阈值,则根据所述文本的断句位置,对所述待断句语音进行断句。本实施例提供的方法中通过预先获取的断句模型,能够实现实时对待断句语音进行断句,减少了时延。

Method, device and storage medium of voice sentence breaking

【技术实现步骤摘要】
语音断句的方法、装置和存储介质
本申请涉及自然语言处理
,尤其涉及一种语音断句的方法、装置和存储介质。
技术介绍
语音断句,通常应用在对接收到的实时语音断句的场景中。对语音进行和准确的断句,是获取语音准确的语义的前提。例如,在同声传译系统需要对实时获取的语音进行断句,使得翻译系统能够获取实时语音的准确的语义,以进行正确翻译。目前,对语音进行断句的方式通常是先把语音转化成文本进行断句处理,以根据文本的断句结果,对该语音进行断句。现有技术中,对语音转化成的文本进行断句的方式为:获取一段完整的语音对应的文本,根据该文本的语义确定文本的断句位置。该种方式应用在同声传译的场景中时,需要获取完整的语音才能实现语音的断句,造成较大的时延。
技术实现思路
本申请提供一种语音断句的方法、装置和存储介质,能够对语音进行断句,减少时延。本申请的第一方面提供一种语音断句的方法,包括:获取待断句语音对应的文本;采用断句模型,确定所述文本的断句位置,以及所述文本的断句位置的可信度,所述断句模型用于表征文本与断句位置、断句位置的可信度的对应关系;若确定所述文本的断句位置的可信度大于阈值,则根据所述文本的断句位置,对所述待断句语音进行断句。可选的,所述待断句语音为第一语音,所述方法还包括:若确定所述文本中不存在断句位置,或确定所述文本的断句位置的可信度小于所述阈值,则将所述第一语音和所述第一语音之后的第二语音作为所述待断句语音,并重新对所述待断句语音进行断句操作,所述第二语音对应的文本包括预设数量个单词。可选的,所述方法还包括:使用历史语音对应的文本对语言模型进行训练,获取所述断句模型。可选的,所述获取所述断句模型,包括:根据所述历史语音对应的文本,获取训练语句序列,所述训练语句序列中包括多个训练语句,后一个训练语句包括:前一个训练语句、且相较于前一个训练语句增加至少一个单词;根据每个所述训练语句,以及每个所述训练语句的期望断句位置对所述语言模型进行训练,获取所述断句模型,所述断句模型输出的每个所述训练语句的实际断句位置与期望断句位置相同。可选的,所述语言模型是基于BERT框架训练获取的。可选的,所述预设数量个单词为一个单词。可选的,所述待断句语音为同声传译场景中获取的待断句的实时语音。本申请的第二方面提供一种语音断句的装置,包括:处理模块,用于获取待断句语音对应的文本;采用断句模型,确定所述文本的断句位置,以及所述文本的断句位置的可信度,所述断句模型用于表征文本与断句位置、断句位置的可信度的对应关系;若确定所述文本的断句位置的可信度大于阈值,则根据所述文本的断句位置,对所述待断句语音进行断句。可选的,所述待断句语音为第一语音,所述处理模块,还用于若确定所述文本中不存在断句位置,或确定所述文本的断句位置的可信度小于所述阈值,则将所述第一语音和所述第一语音之后的第二语音作为所述待断句语音,并重新对所述待断句语音进行断句操作,所述第二语音对应的文本包括预设数量个单词。可选的,所述装置还包括:训练模块;所述训练模块,用于使用历史语音对应的文本对语言模型进行训练,获取所述断句模型。可选的,所述训练模块,具体用于根据所述历史语音对应的文本,获取训练语句序列,所述训练语句序列中包括多个训练语句,后一个训练语句包括:前一个训练语句、且相较于前一个训练语句增加至少一个单词;根据每个所述训练语句,以及每个所述训练语句的期望断句位置对所述语言模型进行训练,获取所述断句模型,所述断句模型输出的每个所述训练语句的实际断句位置与期望断句位置相同。可选的,所述语言模型是基于BERT框架训练获取的。可选的,所述预设数量个单词为一个单词。可选的,所述待断句语音为同声传译场景中获取的待断句的实时语音。本申请的第三方面提供一种语音断句的装置,包括:至少一个处理器和存储器;所述存储器存储计算机执行指令;所述至少一个处理器执行所述存储器存储的计算机执行指令,使得所述语音断句的装置执行上述语音断句的方法。本申请的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机执行指令,当所述计算机执行指令被处理器执行时,实现上述语音断句的方法。本申请提供一种语音断句的方法、装置和存储介质,该方法包括:获取待断句语音对应的文本;采用断句模型,确定所述文本的断句位置,以及所述文本的断句位置的可信度,所述断句模型用于表征文本与断句位置、断句位置的可信度的对应关系;若确定所述文本的断句位置的可信度大于阈值,则根据所述文本的断句位置,对所述待断句语音进行断句。本实施例中通过预先获取的断句模型,能够实现实时对待断句语音进行断句,减少了时延。附图说明图1为本申请提供的语音断句的方法的流程示意图一;图2为本申请提供的语音断句的方法的流程示意图二;图3为本申请提供的语音断句的装置的结构示意图一;图4为本申请提供的语音断句的装置的结构示意图二。具体实施方式为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请的实施例,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。为了更为清楚地说明本申请提供的语音断句的方法,下述对现有技术中的语音断句方法进行简要介绍。应理解,下述以同声传译场景进行示例说明。同声传译场景中,同声传译装置可以获取用户的实时语音,并将实时语音转化为文本进行断句,根据文本的断句结果对实时语音进行断句,进而对断句后的语音进行翻译。例如,实时语音对应的文本为“Asyoucanseetheimages”,现有的断句方式根据该文本的语义无法对该文本进行断句,需要获取完整的语音对应的文本才能进行断句。如,继续获取用户的语音对应的文本为“arenotreallyspecial”。该完整的语音对应的文本为“Asyoucanseetheimagesarenotreallyspecial”。因此,对该完整的语音对应的文本断句为“Asyoucansee,theimagesarenotreallyspecial.”。应理解,对文本进行断句即为获取文本最佳的加入标点符号的位置。上述中对文本为英文文本进行示例说明,对应的断句的标点符号为英文文本对应的标点符号,本申请提供的语音断句的方法对应用的文本的类型不做限制。在同声传译的场景中,若获取完整的语音才能完成断句,则用户需要等待较长时间才能获取到翻译结果。为了解决上述语音断句产生的时延较大的问题,本申请提供一种语音断句的方法,通过预先训练的断句模型,可以对实时确定语音对应的文本的断句位置,进而达到减少时延的目的。图1为本申请提供的语音断句的方法的流程示意图一。本申请中的语音断句的方法的执行主体可以为语音断句的装置,该语音断句的装置可由任意的软件和/或硬件实现。如图1所示,本实施例提供的语音断句的方法可以包括:S101,获取待断句语音对应的文本。根据应用场景的不同,本实施例中的待断句语音不同。本实施例中的语音断句的方法可以应用在同声传译场景中,对应的,待断句的语音可以为同声传译系统中集成的语音断句的装置实时接收到的语音。本实施例中的语音断句的方法还可以应用在对预本文档来自技高网...

【技术保护点】
1.一种语音断句的方法,其特征在于,包括:获取待断句语音对应的文本;采用断句模型,确定所述文本的断句位置,以及所述文本的断句位置的可信度,所述断句模型用于表征文本与断句位置、断句位置的可信度的对应关系;若确定所述文本的断句位置的可信度大于阈值,则根据所述文本的断句位置,对所述待断句语音进行断句。

【技术特征摘要】
1.一种语音断句的方法,其特征在于,包括:获取待断句语音对应的文本;采用断句模型,确定所述文本的断句位置,以及所述文本的断句位置的可信度,所述断句模型用于表征文本与断句位置、断句位置的可信度的对应关系;若确定所述文本的断句位置的可信度大于阈值,则根据所述文本的断句位置,对所述待断句语音进行断句。2.根据权利要求1所述的方法,其特征在于,所述待断句语音为第一语音,所述方法还包括:若确定所述文本中不存在断句位置,或确定所述文本的断句位置的可信度小于所述阈值,则将所述第一语音和所述第一语音之后的第二语音作为所述待断句语音,并重新对所述待断句语音进行断句操作,所述第二语音对应的文本包括预设数量个单词。3.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:使用历史语音对应的文本对语言模型进行训练,获取所述断句模型。4.根据权利要求3所述的方法,其特征在于,所述获取所述断句模型,包括:根据所述历史语音对应的文本,获取训练语句序列,所述训练语句序列中包括多个训练语句,后一个训练语句包括:前一个训练语句、且相较于前一个训练语句增加至少一个单词;根据每个所述训练语句,以及每个所述训练语句的期望断句位置对所述语言模型进行...

【专利技术属性】
技术研发人员:张睿卿熊皓张传强何中军李芝吴华王海峰
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1