语音数据处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:26508283 阅读:25 留言:0更新日期:2020-11-27 15:36
本发明专利技术涉及人工智能领域,提供一种语音数据处理方法,包括:接收用户输入的语音信息;识别所述语音信息,得到对应的自然语言文本信息;调用流程类型识别模型确定所述自然语言文本信息包含的流程类型集;匹配出与所述流程类型集中每一流程类型对应的目标流程要素抽取模型;调用所述目标流程要素抽取模型抽取所述流程类型对应的流程要素,并获取所述流程要素对应的标识序列;根据所述标识序列获取结构化的流程代码。本发明专利技术还提供一种语音数据处理装置、计算机设备及存储介质。本发明专利技术能够提高流程脚本的生成速率,降低RPA流程使用门槛。此外,本发明专利技术还涉及区块链技术,目标流程要素可存储于区块链节点中。

【技术实现步骤摘要】
语音数据处理方法、装置、计算机设备及存储介质
本专利技术涉及人工智能领域,尤其涉及一种语音数据处理方法、装置、计算机设备及存储介质。
技术介绍
随着互联网技术和计算机技术的发展,人们生活的方方面面都会应用到计算机应用程序,应用程序的开发越来越频繁和大众化。然而即使在计算机技术发达的今天,依然有很多工作需要具有较强专业技术背景的工作人员手动操作,还需要专业人员编写繁琐复杂的计算机代码进行支持,且代码的生成速率较低。因而,有必要提出一种语音数据处理方法,能够根据自然语言信息自动生成代码数据,从而提高代码数据的处理效率。
技术实现思路
鉴于以上内容,有必要提出一种语音数据处理方法、语音数据处理装置、计算机设备及计算机可读存储介质,能够避免代码的生成速率较低的问题。本专利技术实施例第一方面提供一种语音数据处理方法,所述语音数据处理方法包括:接收用户输入的语音信息;识别所述语音信息,得到对应的自然语言文本信息;调用流程类型识别模型确定所述自然语言文本信息包含的流程类型集;匹配出与所述流程类型集中每一流程类型对应的目标流程要素抽取模型;调用所述目标流程要素抽取模型抽取所述流程类型对应的流程要素,并获取所述流程要素对应的标识序列;根据所述标识序列获取结构化的流程代码。进一步地,在本专利技术实施例提供的上述语音数据处理方法中,所述识别所述语音信息,得到对应的自然语言文本信息的步骤包括:检测所述语音信息中是否包含错误信息以及语音纠错信息;当检测结果为所述语音信息中包含错误信息以及语音纠错信息时,确定所述错误信息在所述语音信息中的目标位置;获取所述目标位置对应的错误信息与语音纠错信息;根据所述语音纠错信息纠正所述错误信息,得到目标语音信息;将所述目标语音信息输入至语音识别模型中,得到对应的自然语言文本信息。进一步地,在本专利技术实施例提供的上述语音数据处理方法中,所述检测所述语音信息中是否包含错误信息的步骤包括:检测所述语音信息中是否包含预设关键字;当检测结果为所述语音信息中包含预设关键字时,确定所述语音信息中包含错误信息。进一步地,在本专利技术实施例提供的上述语音数据处理方法中,所述流程类型识别模型的训练方法包括:获取流程类型标注数据,其中,所述流程类型标注数据包括流程类型观察序列与流程类型标识序列;调用预训练的语言模型解析所述流程类型标注数据,得到词语级和句子级的embedding结果;基于所述embedding结果调整初始流程类型识别模型。进一步地,在本专利技术实施例提供的上述语音数据处理方法中,所述匹配出与所述流程类型集中每一流程类型对应的目标流程要素抽取模型的步骤包括:调用多线程队列获取所述流程类型集中每一流程类型;确定所述流程类型与所述流程要素抽取模型的映射关系;根据所述映射关系确定目标流程要素抽取模型,其中,所述目标流程要素存储在区块链中。进一步地,在本专利技术实施例提供的上述语音数据处理方法中,所述根据所述标识序列获取结构化的流程代码的步骤包括:获取所述自然语言文本信息包含的所述流程类型携带的标记信息;获取与所述流程类型对应的所述标识序列,并根据所述标记信息确定所述标识序列的执行顺序;按照所述执行顺序遍历语法库,得到与所述标识序列对应的可执行计算机代码。进一步地,在本专利技术实施例提供的上述语音数据处理方法中,在所述接收用户输入的语音信息的步骤之后,所述方法还包括:检测所述语音信息的清晰度是否超过预设清晰度阈值;当检测结果为所述语音信息的清晰度未超过预设清晰度阈值时,提示用户重新输入语音信息。本专利技术实施例第二方面还提供一种语音数据处理装置,所述语音数据处理装置包括:信息接收模块,用于接收用户输入的语音信息;信息识别模块,用于识别所述语音信息,得到对应的自然语言文本信息;类型确定模块,用于调用流程类型识别模型确定所述自然语言文本信息包含的流程类型集;模型匹配模块,用于匹配出与所述流程类型集中每一流程类型对应的目标流程要素抽取模型;要素抽取模块,用于调用所述目标流程要素抽取模型抽取所述流程类型对应的流程要素,并获取所述流程要素对应的标识序列;代码获取模块,用于根据所述标识序列获取结构化的流程代码。本专利技术实施例第三方面还提供一种计算机设备,所述计算机设备包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如上述任意一项所述语音数据处理方法。本专利技术实施例第四方面还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述语音数据处理方法。本专利技术实施例提供一种语音数据处理方法、语音数据处理装置、计算机设备及存储介质,通过输入语音信息的方式,使用自然语言文本信息实现流程脚本生成,提高流程脚本的生成速率,降低RPA流程使用门槛。附图说明图1是本专利技术第一实施方式提供的语音数据处理方法的流程图。图2是本专利技术一实施方式的计算机设备的结构示意图。图3是图2所示的计算机设备的示例性的功能模块图。如下具体实施方式将结合上述附图进一步说明本专利技术。具体实施方式为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施例对本专利技术进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。图1是本专利技术第一实施方式提供的语音数据处理方法的流程图。如图1所示,所述语音数据处理方法包括如下步骤:S11、接收用户输入的语音信息。在本专利技术的至少一实施例中,接收用户输入的语音信息,所述语音信息是一种自然地随文化演化的语言,例如,汉语、英语、日语等。所述语音信息用于计算机程序应用专业领域,所述语音信息包含命令语句,用于控制计算机程序执行相关操作,例如,数据查询等方面。在实际输入语音信息的过程中,可能由于各种原因(例如,网络不流畅、用户输入语音信息时音量较小、周围环境嘈杂等问题)导致用户输入的语音信息不清晰,此时,可以提示用户重新输入语音信息(例如,输出“我没听清,请重新输入”的语音提示),避免因语音信息不清晰而导致无法正确识别出自然语言信息。具体地,在所述接收用户输入的语音信息的步骤之后,所述方法还包括:计算所述语音信息的清晰度;检测所述清晰本文档来自技高网
...

【技术保护点】
1.一种语音数据处理方法,其特征在于,所述语音数据处理方法包括:/n接收用户输入的语音信息;/n识别所述语音信息,得到对应的自然语言文本信息;/n调用流程类型识别模型确定所述自然语言文本信息包含的流程类型集;/n匹配出与所述流程类型集中每一流程类型对应的目标流程要素抽取模型;/n调用所述目标流程要素抽取模型抽取所述流程类型对应的流程要素,并获取所述流程要素对应的标识序列;/n根据所述标识序列获取结构化的流程代码。/n

【技术特征摘要】
1.一种语音数据处理方法,其特征在于,所述语音数据处理方法包括:
接收用户输入的语音信息;
识别所述语音信息,得到对应的自然语言文本信息;
调用流程类型识别模型确定所述自然语言文本信息包含的流程类型集;
匹配出与所述流程类型集中每一流程类型对应的目标流程要素抽取模型;
调用所述目标流程要素抽取模型抽取所述流程类型对应的流程要素,并获取所述流程要素对应的标识序列;
根据所述标识序列获取结构化的流程代码。


2.根据权利要求1所述的语音数据处理方法,其特征在于,所述识别所述语音信息,得到对应的自然语言文本信息的步骤包括:
检测所述语音信息中是否包含错误信息以及语音纠错信息;
当检测结果为所述语音信息中包含错误信息以及语音纠错信息时,确定所述错误信息在所述语音信息中的目标位置;
获取所述目标位置对应的错误信息与语音纠错信息;
根据所述语音纠错信息纠正所述错误信息,得到目标语音信息;
将所述目标语音信息输入至语音识别模型中,得到对应的自然语言文本信息。


3.根据权利要求2所述的语音数据处理方法,其特征在于,所述检测所述语音信息中是否包含错误信息的步骤包括:
检测所述语音信息中是否包含预设关键字;
当检测结果为所述语音信息中包含预设关键字时,确定所述语音信息中包含错误信息。


4.根据权利要求1所述的语音数据处理方法,其特征在于,所述流程类型识别模型的训练方法包括:
获取流程类型标注数据,其中,所述流程类型标注数据包括流程类型观察序列与流程类型标识序列;
调用预训练的语言模型解析所述流程类型标注数据,得到词语级和句子级的embedding结果;
基于所述embedding结果调整初始流程类型识别模型。


5.根据权利要求1所述的语音数据处理方法,其特征在于,所述匹配出与所述流程类型集中每一流程类型对应的目标流程要素抽取模型的步骤包括:
调用多线程队列获取所述流程类型集...

【专利技术属性】
技术研发人员:郝正鸿许开河张涛叶洋甫付艳平
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1