语音识别方法和装置制造方法及图纸

技术编号:20162375 阅读:21 留言:0更新日期:2019-01-19 00:15
本申请实施例公开了语音识别方法和装置。该方法的一具体实施方式包括:将用户输入的语音发送至服务器;接收服务器发送的用户输入的语音对应的初始识别语句;基于前置纠错列表和用户输入的语音对应的初始识别语句,确定待呈现给用户的语句,以及将待呈现给用户的语句呈现给用户,前置纠错列表包括:需要纠错的词语、需要纠错的词语对应的替换词语。实现了在语音识别过程中当识别出的语句中出现错误的词语的情况下利用前置纠错列表进行及时地纠错,向用户呈现较为准确的语句,进一步地,利用后置纠错列表对呈现给用户的语句进行较为准确地分词后进行语义理解,得到较为准确的语义理解结果,进而向用户推送较为准确的与语义理解结果相关联的信息。

【技术实现步骤摘要】
语音识别方法和装置
本申请涉及计算机领域,具体涉及语音识别领域,尤其涉及语音识别方法和装置。
技术介绍
在一些应用中,集成有语音识别功能和语义理解功能,以与用户进行智能的交互。目前,通常是由应用将用户输入的语音发送至服务器,在服务器上进行识别得到识别出语句以及对识别出的语句进行语义理解,直接向用户展示识别出的语句和向用户推送与语义理解结果相关联的信息。在识别出的语句中的部分词语出现错误的情况下,导致展示给用户的语句和推送给用户的信息均不准确。
技术实现思路
本申请实施例提供了语音识别方法和装置。第一方面,本申请实施例提供了语音识别方法,该方法包括:将用户输入的语音发送至服务器;接收服务器发送的用户输入的语音对应的初始识别语句;基于前置纠错列表和用户输入的语音对应的初始识别语句,确定待呈现给用户的语句,以及将待呈现给用户的语句呈现给用户,前置纠错列表包括:需要纠错的词语、需要纠错的词语对应的替换词语。第二方面,本申请实施例提供了语音识别装置,该装置包括:发送单元,被配置为将用户输入的语音发送至服务器;接收单元,被配置为接收服务器发送的用户输入的语音对应的初始识别语句;纠错单元,被配置为基于前置纠错列表和用户输入的语音对应的初始识别语句,确定待呈现给用户的语句,以及将待呈现给用户的语句呈现给用户,前置纠错列表包括:需要纠错的词语、需要纠错的词语对应的替换词语。本申请实施例提供的语音识别方法和装置,通过将用户输入的语音发送至服务器;接收服务器发送的用户输入的语音对应的初始识别语句;基于前置纠错列表和用户输入的语音对应的初始识别语句,确定待呈现给用户的语句,以及将待呈现给用户的语句呈现给用户,前置纠错列表包括:需要纠错的词语、需要纠错的词语对应的替换词语。实现了在语音识别过程中当识别出的语句中出现错误的词语的情况下利用前置纠错列表进行及时地纠错,向用户呈现较为准确的语句,进一步地,利用后置纠错列表对呈现给用户的语句进行较为准确地分词后进行语义理解,得到较为准确的语义理解结果,进而向用户推送较为准确的与语义理解结果相关联的信息。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1示出了适于用来实现本申请实施例的示例性系统架构;图2示出了根据本申请的语音识别方法的一个实施例的流程图;图3示出了根据本申请的语音识别方法的一个流程示意图;图4示出了根据本申请的语音识别装置的一个实施例的结构示意图;图5是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了适于用来实现本申请实施例的示例性系统架构。如图1所示,终端101、网络102、服务器103。网络102可以为有线通信网络或无线通信网络。终端101可以为智能设备、智能手机、平板电脑、车载终端。用户在终端101输入与用户期望获取的信息相关联的语音,终端101将用户在终端101上输入的语音发送至服务器103。服务器103可以对用户输入的语音进行语音识别,得到服务器识别出的语句。终端101可以配置有前置纠错模块,前置纠错模块可以用于判断服务器识别出的语句中是否存在错误的词语,以及当判断出服务器识别出的语句中存在错误的词语时,对错误的词语进行纠错,得到用于呈现给用户的语句,将用于呈现给用户的语句呈现给用户。终端101可以将呈现给用户的语句发送至服务器103,服务器103可以对呈现给用户的语句进行语义理解,得到语义理解结果,进而查找出与语义理解结果相关联的信息,将与语义理解结果相关联的信息发送至终端101。当语义理解结果正确时,与语义理解结果相关联的信息为期望获取的信息。请参考图2,其示出了根据本申请的方法的一个实施例的流程。本申请实施例所提供的方法可以由终端(例如图1中的终端101)执行,具体可以由运行在终端上的APP执行。该方法包括以下步骤:步骤201,将用户输入的语音发送至服务器。在本实施例中,可以由用户的终端接收可以输入的语音,可以由用户的终端将用户输入的语音发送至服务器。步骤202,接收服务器发送的用户输入的语音对应的初始识别语句。在本实施例中,服务器在接收到用户的语音之后,可以在服务器对用户输入的语音进行语音识别,得到由服务器识别出的语句。可以将由服务器识别出的语句称之为用户输入的语音对应的初始识别语句。服务器可以将用户输入的语音对应的初始识别语句发送至用户的终端。步骤203,基于前置纠错列表和用户输入的语音对应的初始识别语句,确定呈现给用户的语句,以及呈现给用户的语句呈现给用户。在本实施例中,可以预先在服务器上存储前置纠错列表。前置纠错列表可以包含多个纠错模版。纠错模版可以为正则表达式。纠错模版中包含多个词语。纠错模版中的至少一个词语不能和其他的词语进行组合去表达一个明确的意图。纠错模版中的不能和其他的词语进行组合去表达一个明确的意图的词语可以称之为需要纠错的词语。需要纠错的词语也可称之为错误的词语。在前置纠错列表中,对于每一个纠错模版,可以预先将纠错模板和纠错模版中的需要纠错的词语对应的替换词语对应地进行存储。在本实施例中,可以基于前置纠错列表和初始识别语句,确定呈现给用户的语句,以及将确定出的呈现给用户的语句呈现给用户。当基于前置纠错列表和初始识别语句,确定呈现给用户的语句,可以首先判断多个纠错模板中是否存在与用户输入的语音对应的初始识别语句匹配的纠错模板。例如,当用户输入的语音对应的初始识别语句中包含一个纠错模板中的所有词语时,则用户输入的语音对应的初始识别语句与该纠错模版匹配。可以根据判断结果,确定呈现给用户的语句。当用户输入的语音对应的初始识别语句未与任何一个纠错模版匹配时,则可以将用户输入的语音对应的初始识别语句作为呈现给用户的语句。当用户输入的语音对应的初始识别语句中与一个纠错模版匹配,可以利用与该纠错模版对应的替换词语替换用户输入的语音对应的初始识别语句中的需要纠错的词语,得到纠错后的语句,将纠错后的语句作为呈现给用户的语句。从而,将用户输入的语音对应的初始识别语句纠正为正确的语句,然后再呈现给用户。换言之,呈现给用户的语句为对用户输入的语音的最终的识别结果。在本实施例的一些可选的实现方式中,当运行在终端上的用于接收用户输入的语音的应用即运行在终端上的用于接收用户输入的语音的APP启动时,可以向服务器发送前置纠错列表获取请求,接收服务器发送的前置纠错列表。换言之,当用于接收用户输入的语音的应用启动时,用于接收用户输入的语音的应用向服务器发送前置纠错列表获取请求来获取前置纠错列表。运行在终端上的用于接收用户输入的语音的应用还用于接收服务器发送的所述语音对应的初始识别语句、基于前置纠错列表和初始识别语句,确定呈现给用户的语句以及呈现给用户的语句呈现给用户。在服务器上可以每间隔预设时长对前置纠错列表进行更新。从而,每一次当用于接收用户输入的语音本文档来自技高网...

【技术保护点】
1.一种语音识别方法,包括:将用户输入的语音发送至服务器;接收服务器发送的用户输入的语音对应的初始识别语句;基于前置纠错列表和用户输入的语音对应的初始识别语句,确定待呈现给用户的语句,以及将所述待呈现给用户的语句呈现给用户,前置纠错列表包括:需要纠错的词语、需要纠错的词语对应的替换词语。

【技术特征摘要】
1.一种语音识别方法,包括:将用户输入的语音发送至服务器;接收服务器发送的用户输入的语音对应的初始识别语句;基于前置纠错列表和用户输入的语音对应的初始识别语句,确定待呈现给用户的语句,以及将所述待呈现给用户的语句呈现给用户,前置纠错列表包括:需要纠错的词语、需要纠错的词语对应的替换词语。2.根据权利要求1所述的方法,前置纠错列表包括:多个正则表达式,正则表达式包括:需要纠错的词语;以及基于前置纠错列表和用户输入的语音对应的初始识别语句,确定待呈现给用户的语句包括:从多个正则表达式中查找出与用户输入的语音对应的初始识别语句匹配的正则表达式;利用与查找出的正则表达式对应存储的替换词语替换用户输入的语音对应的初始识别语句中的需要纠错的词语,得到待呈现给用户的语句。3.根据权利要求2所述的方法,所述方法还包括:向服务器发送呈现给用户的语句;接收服务器发送的返回结果,返回结果通过在服务器上利用后置纠错列表对呈现给用户的语句进行语义理解而得到,后置纠错列表包括:语义理解时应进行分词的词语组合、应进行分词的词语组合对应的分词后的词语。4.根据权利要求3所述的方法,所述方法还包括:响应于用于接收用户输入的语音的应用启动,向服务器发送前置纠错列表获取请求;接收服务器发送的前置纠错列表。5.一种语音识别装置,包括:发送单元,被配置为将用户输入的语音发送至服务器;接收单元,被配置为接收服务器发送的用户输入的语音对应的初始识别语句;纠错单元,被配置为基于前...

【专利技术属性】
技术研发人员:孙凯刘坤党启贺
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1