一种语音处理方法和服务器技术

技术编号:19009121 阅读:49 留言:0更新日期:2018-09-22 09:00
本发明专利技术实施例公开了一种语音处理方法和服务器,用于实现根据统一制式信息执行专用场景下的预处理流程,扩展语义识别的应用场景。本发明专利技术实施例提供一种语音处理方法,包括:通过预先训练出的语义识别模型对终端采集到的语音信号进行语义识别,得到语义识别结果;从所述语义识别结果中提取出匹配于专用场景的关键字段;对所述语义识别结果进行语义分析,得到在所述专用场景下的语义级别;根据所述关键字段以及所述语义级别生成在所述专用场景下的统一制式信息;根据所述统一制式信息执行所述专用场景下的预处理流程。

Speech processing method and server

The embodiment of the invention discloses a voice processing method and a server for implementing a preprocessing flow in a special scene according to the unified system information and extending the application scene of semantic recognition. The embodiment of the invention provides a speech processing method, which comprises: semantic recognition of the speech signal collected by the terminal through a pre-trained semantic recognition model, obtaining the semantic recognition result, extracting the key fields matching the special scene from the semantic recognition result, and carrying on the speech of the semantic recognition result. The semantic level in the special scene is obtained by semantic analysis; the unified system information in the special scene is generated according to the key segment and the semantic level; and the preprocessing flow in the special scene is executed according to the unified system information.

【技术实现步骤摘要】
一种语音处理方法和服务器
本专利技术涉及计算机
,尤其涉及一种语音处理方法和服务器。
技术介绍
人工智能(ArtificialIntelligence,AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。随着互联网技术的发展,语义识别越来越广泛的被应用于各个应用场景中,目前市面上各种软件所使用的语义识别技术,一般只是用于做基础的语言识别翻译,语音转化文字或文字转化语音,比如,在导航应用程序中,可通过对用户输入的语音进行语义识别,以为用户提供导航服务等。其中,对待解析的文本等信息进行语义识别之后,缺少对语义识别结果做进一步处理加工,因此无法深入挖掘语义识别结果的进一步方案,局限了对于语义识别的应用场景。
技术实现思路
本专利技术实施例提供了一种语音处理方法和服务器,用于实现根据统一制式信息执行专用场景下的预处理流程,扩展语义识别的应用场景。为解决上述技术问题,本专利技术实施例提供以下技术方案:第一方面,本专利技术实施例提供一种语音处理方法,包括:通过预先训练出的语义识别模型对终端采集到的语音信号进行语义识别,得到语义识别结果;从所述语义识别结果中提取出匹配于专用场景的关键字段;对所述语义识别结果进行语义分析,得到在所述专用场景下的语义级别;根据所述关键字段以及所述语义级别生成在所述专用场景下的统一制式信息;根据所述统一制式信息执行所述专用场景下的预处理流程。第二方面,本专利技术实施例还提供一种服务器,包括:语义识别模块,用于通过预先训练出的语义识别模型对终端采集到的语音信号进行语义识别,得到语义识别结果;字段提取模块,用于从所述语义识别结果中提取出匹配于专用场景的关键字段;级别分析模块,用于对所述语义识别结果进行语义分析,得到在所述专用场景下的语义级别;信息生成模块,用于根据所述关键字段以及所述语义级别生成在所述专用场景下的统一制式信息;信息处理模块,用于根据所述统一制式信息执行所述专用场景下的预处理流程。在第二方面中,服务器的组成模块还可以执行前述第一方面以及各种可能的实现方式中所描述的步骤,详见前述对第一方面以及各种可能的实现方式中的说明。第三方面,本专利技术实施例提供一种服务器,该服务器包括:处理器、存储器;存储器用于存储指令;处理器用于执行存储器中的指令,使得服务器执行如前述第一方面中任一项的方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。第五方面,本专利技术实施例提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。从以上技术方案可以看出,本专利技术实施例具有以下优点:在本专利技术实施例中,通过预先训练出的语义识别模型对终端采集到的语音信号进行语义识别,得到语义识别结果,从语义识别结果中提取出匹配于专用场景的关键字段,对语义识别结果进行语义分析,得到在专用场景下的语义级别,根据关键字段以及语义级别生成在专用场景下的统一制式信息,根据统一制式信息执行专用场景下的预处理流程。本申请实施例中对用户的语音输入进行语义识别和级别判断,根据预设对语音生成标准的统一制式信息,再根据统一制式信息进行不同的预处理,可以实现不同专用场景下的语音体验及优化。对用户的语音信号的判断和预处理,能极大减少用户进行业务工作过程中的信息处理精力,实现根据统一制式信息执行专用场景下的预处理流程,扩展语义识别的应用场景。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域的技术人员来讲,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的系统架构示意图;图2为本专利技术实施例提供的一种语音处理方法的流程方框示意图;图3为本专利技术实施例提供的语音处理方法的执行流程示意图;图4为本专利技术实施例提供的特殊考勤的异常提示场景的示意图;图5为本专利技术实施例提供的请假单的生成流程示意图;图6为本专利技术实施例提供的交通特殊情况的反馈场景的示意图;图7为本申请实施例提供的交通反馈单的生成流程示意图;图8-a为本专利技术实施例提供的一种服务器的组成结构示意图;图8-b为本专利技术实施例提供的另一种服务器的组成结构示意图;图8-c为本专利技术实施例提供的一种信息生成模块的组成结构示意图;图8-d为本专利技术实施例提供的另一种服务器的组成结构示意图;图9为本专利技术实施例提供的语音处理方法应用于服务器的组成结构示意图。具体实施方式本专利技术实施例提供了一种语音处理方法和服务器,用于实现根据统一制式信息执行专用场景下的预处理流程,扩展语义识别的应用场景。为使得本专利技术的专利技术目的、特征、优点能够更加的明显和易懂,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本专利技术一部分实施例,而非全部实施例。基于本专利技术中的实施例,本领域的技术人员所获得的所有其他实施例,都属于本专利技术保护的范围。本专利技术的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,以便包含一系列单元的过程、方法、系统、产品或设备不必限于那些单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它单元。图1为一个实施例中语音处理方法的应用场景图。参照图1,该应用场景中包括通过网络连接的终端11和服务器12。该终端11可以是具备定语音采集功能的设备,即终端11可以通过麦克风采集用户发出的语音,该终端上还可以安装有应用程序(Application,APP),用户可以操作应用程序。在一个实施例中,终端11可以为移动终端,移动终端可以包括手机、平板电脑、笔记本电脑、个人数字助理和穿戴式设备等中的至少一种。服务器12可以用独立的服务器或者是多个物理服务器组成的服务器集群来实现。服务器12可以获取到用户的语音信号,例如服务器12和终端11通信,从终端11获取到语音信号。该服务器可以实现对语音进行语义识别,通过语义识别结果提取出关键字段,该关键字段是匹配于预设的专用场景,该专用场景可以有多种,例如企业的办公自动化(OfficeAutomation,OA)管理场景,或者报警处理场景等。服务器根据语义识别结果进行语义分级,从而确定出当前语音信号对应的语义级别,语义级别是指按照语音识别结果所包含的语义内容划分出的等级或者严重程度,服务器还可以生成统一制式信息,从而使用统一制式信息来完成专用场景下的预处理流程,可以实现不同专用场景下的语音体验及优化。接下来从服务器的角度来描述本申请实施例提供的一种语音处理方法,请参阅图2所示,语音处理方法包括如下步骤:101、通过预先训练出的语义识别模型对终端采集到的语音信号进行语义识别,得到语义识别结果。在本申请实施例中,用户可以使用终端来采集该用户的语音信号,从而终端可以采集到语音信号,然后终端与服务器交互,向服务器发送所采集到的语音信本文档来自技高网...
一种语音处理方法和服务器

【技术保护点】
1.一种语音处理方法,其特征在于,包括:通过预先训练出的语义识别模型对终端采集到的语音信号进行语义识别,得到语义识别结果;从所述语义识别结果中提取出匹配于专用场景的关键字段;对所述语义识别结果进行语义分析,得到在所述专用场景下的语义级别;根据所述关键字段以及所述语义级别生成在所述专用场景下的统一制式信息;根据所述统一制式信息执行所述专用场景下的预处理流程。

【技术特征摘要】
1.一种语音处理方法,其特征在于,包括:通过预先训练出的语义识别模型对终端采集到的语音信号进行语义识别,得到语义识别结果;从所述语义识别结果中提取出匹配于专用场景的关键字段;对所述语义识别结果进行语义分析,得到在所述专用场景下的语义级别;根据所述关键字段以及所述语义级别生成在所述专用场景下的统一制式信息;根据所述统一制式信息执行所述专用场景下的预处理流程。2.根据权利要求1所述的方法,其特征在于,所述通过预先训练出的语义识别模型对终端采集到的语音信号进行语义识别之前,所述方法还包括:根据所述语音信号的采集端口确定出所述终端中被操作的应用程序APP;根据所述终端中被操作的APP确定相应的语义识别模型。3.根据权利要求1所述的方法,其特征在于,所述根据所述关键字段以及所述语义级别生成在所述专用场景下的统一制式信息,包括:从统一制式模板库中获取与所述专用场景匹配的统一制式模板;在所述统一制式模板中的预置位置填充所述关键字段的字段内容,得到填充有字段内容的统一制式模板;使用所述语义级别对所述填充有字段内容的统一制式模板进行标注,得到所述统一制式信息。4.根据权利要求1所述的方法,其特征在于,所述根据所述统一制式信息执行所述专用场景下的预处理流程,包括:将所述统一制式信息通知给在所述专用场景下与所述语义级别匹配的目标接收方。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:从所述目标接收方获取对所述统一制式信息的处理结果;将所述处理结果发送给所述终端。6.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:若无法从所述语义识别结果中提取到所述关键字段,触发所述终端重新采集所述语音信号。7.一种服务器,其特征在于,包括:语义识别模块,用于通过预先训练出的语义识别模型对终端采集到的语音信号进行语义识别,得到语义识别结果;字段提取模块,用于从所述语义识别结果中提取出匹配于专用场景的关键字段...

【专利技术属性】
技术研发人员:黄珊珊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1