语音文本重构方法、装置、存储介质和计算机设备制造方法及图纸

技术编号:38015023 阅读:8 留言:0更新日期:2023-06-30 10:39
本发明专利技术实施例提供了一种语音文本重构方法、装置、存储介质和计算机设备。该方法包括:获取标准语音文本;判断标准语音文本是否符合语句数量条件;若判断出标准语音文本不符合语句数量条件,则通过语句重构方式,根据标准语音文本,生成第一重构语音文本;若判断出标准语音文本符合语句数量条件,则通过模型切割方式,根据标准语音文本,生成第二重构语音文本,从而使计算机设备能够对获取的标准语音文本进行重构,降低了语音文本的复杂度。降低了语音文本的复杂度。降低了语音文本的复杂度。

【技术实现步骤摘要】
语音文本重构方法、装置、存储介质和计算机设备


[0001]本专利技术实施例涉及文本重构
,具体涉及一种语音文本重构方法、装置、存储介质和计算机设备。

技术介绍

[0002]传统的交互方式具有学习成本高、交互繁琐的缺点,语音控制系统因拥有更自然的交互方式得到越来越多的关注。语音控制系统包括语义理解系统,语音控制系统首先采集音频信号;对音频信号进行语音识别,将音频信号转成语音文本;通过语义理解系统,对语音文本进行语义理解后,解析成指令信息;最后经过自然语言生成后置处理。
[0003]语音文本的规范性和复杂性决定了语义理解系统构建的复杂性、稳定性及建设成本的高低。语音控制系统可对语音文本进行长文本分段,但若语音文本具有多意图、多语句及相关组合,则无法降低语音文本的复杂度,会导致语义理解系统对语音文本进行语义理解时,语音文本的复杂度高。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供了一种语音文本重构方法、装置、存储介质和计算机设备,用以解决现有技术中语音文本的复杂度高的问题。
[0005]第一方面,本专利技术实施例提供了一种语音文本重构方法,包括:
[0006]获取标准语音文本;
[0007]判断所述标准语音文本是否符合语句数量条件;
[0008]若判断出所述标准语音文本不符合语句数量条件,则通过语句重构方式,根据所述标准语音文本,生成第一重构语音文本;
[0009]若判断出所述标准语音文本符合语句数量条件,则通过模型切割方式,根据所述标准语音文本,生成第二重构语音文本。
[0010]在一种可能的实现方式中,所述判断所述标准语音文本是否符合语句数量条件,包括:
[0011]根据所述标准语音文本,输出第一语句数量;
[0012]判断所述第一语句数量是否大于第一数量阈值;
[0013]若判断出所述第一语句数量大于所述第一数量阈值,则确定出所述标准语音文本符合语句数量条件;
[0014]若判断出所述第一语句数量小于或等于所述第一数量阈值,则计算所述标准语音文本的第二语句数量;
[0015]判断所述第二语句数量是否大于所述第一数量阈值;
[0016]若判断出所述第二语句数量小于或等于所述第一数量阈值,则确定出所述标准语音文本不符合语句数量条件;
[0017]若判断出所述第二语句数量大于所述第一数量阈值,则确定出所述标准语音文本
符合语句数量条件。
[0018]在一种可能的实现方式中,所述计算所述标准语音文本的第二语句数量,包括:
[0019]通过动词表,统计出所述标准语音文本的动词数量,并将所述动词数量作为所述第二语句数量;或者,
[0020]通过机器学习模型,根据所述标准语音文本,输出所述第二语句数量。
[0021]在一种可能的实现方式中,所述通过模型切割方式,根据所述标准语音文本,生成第二重构语音文本,包括:
[0022]通过神经网络模型,对所述标准语音文本进行切割,生成切割序列文本,所述切割序列文本包括切割序列与标准语音文本;
[0023]若确定出所述切割序列的数量大于第二数量阈值,则根据切割序列生成第二重构语音文本;
[0024]若确定出所述切割序列的数量小于或等于所述第二数量阈值,则通过分割词表,根据所述切割序列文本,生成所述第二重构语音文本。
[0025]在一种可能的实现方式中,所述通过语句重构方式,根据所述标准语音文本,生成第一重构语音文本,包括:
[0026]对所述标准语音文本进行分析,生成分词结果与依存关系;
[0027]根据所述分词结果与依存关系,对所述标准语音文本进行重组,生成多个单语义语句;
[0028]将多个所述单语义语句作为所述第一重构语音文本。
[0029]在一种可能的实现方式中,所述分词结果包括多个分词,所述依存关系包括至少两个分词之间的并列关系与至少一个分词对应的词属性,所述词属性包括修饰属性;所述根据所述分词结果与依存关系,对所述标准语音文本进行重组,生成多个单语义语句,包括:
[0030]删除所述至少一个分词中的至少一个修饰分词,所述修饰分词对应的词属性系为修饰属性;
[0031]将每个并列分词与至少一个第一分词进行重组,生成多个单语义语句,所述第一分词为不具备并列关系的分词,所述并列分词为具备并列关系的分词。
[0032]在一种可能的实现方式中,所述获取标准语音文本,包括:
[0033]通过同义表查找出获取的语音文本中的未达标准词;将所述语音文本中的未达标准词替换为标准词,并将未达标准词替换为标准词后的所述语音文本作为所述标准语音文本,所述同义表包括至少一个未达标准词与每个未达标准词对应的标准词;和/或,
[0034]删除获取的语音文本中的修饰词,并将删除修饰词后的所述语音文本作为所述标准语音文本。
[0035]第二方面,本专利技术实施例提供了一种语音文本重构装置,包括:
[0036]获取模块,用于获取标准语音文本;
[0037]判断模块,用于判断所述标准语音文本是否符合语句数量条件;
[0038]第一生成模块,用于若判断出所述标准语音文本不符合语句数量条件,则通过语句重构方式,根据所述标准语音文本,生成第一重构语音文本;
[0039]第二生成模块,用于若判断出所述标准语音文本符合语句数量条件,则通过模型
切割方式,根据所述标准语音文本,生成第二重构语音文本。
[0040]第三方面,本专利技术实施例提供了一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行上述第一方面或第一方面任一可能的实现方式中的语音文本重构方法。
[0041]第四方面,本专利技术实施例提供了一种计算机设备,包括存储器和处理器,所述存储器用于存储包括程序指令的信息,所述处理器用于控制程序指令的执行,所述程序指令被处理器加载并执行时实现上述第一方面或第一方面任一可能的实现方式中的语音文本重构方法的步骤。
[0042]本专利技术实施例提供的一种语音文本重构方法、装置、存储介质和计算机设备的技术方案中,获取标准语音文本;判断标准语音文本是否符合语句数量条件;若判断出标准语音文本不符合语句数量条件,则通过语句重构方式,根据标准语音文本,生成第一重构语音文本;若判断出标准语音文本符合语句数量条件,则通过模型切割方式,根据标准语音文本,生成第二重构语音文本,从而使计算机设备能够对获取的标准语音文本进行重构,降低了语音文本的复杂度。
【附图说明】
[0043]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。
[0044]图1为本专利技术实施例提供的一种语音文本重构方法的流程图;
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音文本重构方法,其特征在于,包括:获取标准语音文本;判断所述标准语音文本是否符合语句数量条件;若判断出所述标准语音文本不符合语句数量条件,则通过语句重构方式,根据所述标准语音文本,生成第一重构语音文本;若判断出所述标准语音文本符合语句数量条件,则通过模型切割方式,根据所述标准语音文本,生成第二重构语音文本。2.根据权利要求1所述的方法,其特征在于,所述判断所述标准语音文本是否符合语句数量条件,包括:根据所述标准语音文本,输出第一语句数量;判断所述第一语句数量是否大于第一数量阈值;若判断出所述第一语句数量大于所述第一数量阈值,则确定出所述标准语音文本符合语句数量条件;若判断出所述第一语句数量小于或等于所述第一数量阈值,则计算所述标准语音文本的第二语句数量;判断所述第二语句数量是否大于所述第一数量阈值;若判断出所述第二语句数量小于或等于所述第一数量阈值,则确定出所述标准语音文本不符合语句数量条件;若判断出所述第二语句数量大于所述第一数量阈值,则确定出所述标准语音文本符合语句数量条件。3.根据权利要求2所述的方法,其特征在于,所述计算所述标准语音文本的第二语句数量,包括:通过动词表,统计出所述标准语音文本的动词数量,并将所述动词数量作为所述第二语句数量;或者,通过机器学习模型,根据所述标准语音文本,输出所述第二语句数量。4.根据权利要求1所述的方法,其特征在于,所述通过模型切割方式,根据所述标准语音文本,生成第二重构语音文本,包括:通过神经网络模型,对所述标准语音文本进行切割,生成切割序列文本,所述切割序列文本包括切割序列与标准语音文本;若确定出所述切割序列的数量大于第二数量阈值,则根据切割序列生成第二重构语音文本;若确定出所述切割序列的数量小于或等于所述第二数量阈值,则通过分割词表,根据所述切割序列文本,生成所述第二重构语音文本。5.根据权利要求1所述的方法,其特征在于,所述通过语句重构方式,根据所述标准语音文本,生成第一重构语音文本,包括:对所述标准语音文本进行分析,生成分词结果与依存关系;根...

【专利技术属性】
技术研发人员:黄永刚王天祥宋亮刘楚雄
申请(专利权)人:成都赛力斯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1