基于人机交互的语音纠错方法和装置制造方法及图纸

技术编号:19936730 阅读:29 留言:0更新日期:2018-12-29 05:27
本申请是关于一种基于人机交互的语音纠错方法和装置,其中方法包括:获取用户当前输入的第一语音数据;对第一语音数据进行解析,确定第一语音数据对应的目标语音数据;将第一语音数据与目标语音数据进行比对,确定第一语音数据中的目标词语;播放目标词语对应的标准语音。本申请方法实现了通过将用户语音与标准语音数据进行比较,对用户语音中发音不准确的语音数据进行主动纠正,使得用户的发音更准确,不仅提高了用户学习效率和针对性,还能改善用户体验。

【技术实现步骤摘要】
基于人机交互的语音纠错方法和装置
本申请涉及语音处理
,特别涉及一种基于人机交互的语音纠错方法和装置。
技术介绍
语言是人类最重要的交际工具,是人们进行沟通的主要表达方式。比如,英语,为使用频率较高的通用语的主导。然而,由于不同国家具有不同的发音特色,使得不同国籍的用户在利用英语进行交流时存在障碍。因此,为了提高用户的英语发音,改善不同国籍用户间的交流障碍,当用户语音偏离目标语音规范一定范围时,对用户的英语发音进行纠正显得格外重要。在实际应用过程中,用户通常是利用音频资料进行反复练习或者跟读的方式进行发音纠正,但是由于在跟读过程中,容易出现发音不准、自己也无法对不准确的音调、音长以及音高进行有效纠正,长此以往,容易造成用户英语口语较差,出现更多的地方式英语,从而影响用户的英语交流,降低了用户使用体验。申请内容本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请一方面实施例提供一种基于人机交互的语音纠错方法,该方法包括:获取用户当前输入的第一语音数据;对所述第一语音数据进行解析,确定所述第一语音数据对应的目标语音数据;将所述第一语音数据与所述目标语音数据进行比对,确定所述第一语音数据中的目标词语;播放所述目标词语对应的标准语音。本申请另一方面实施例提供一种基于人机交互的语音纠错装置,该装置包括:第一获取模块,用于获取用户当前输入的第一语音数据;第一确定模块,用于对所述第一语音数据进行解析,确定所述第一语音数据对应的目标语音数据;第二确定模块,用于将所述第一语音数据与所述目标语音数据进行比对,确定所述第一语音数据中的目标词语;播放模块,用于播放所述目标词语对应的标准语音。本申请又一方面实施例提供一种计算机设备,该计算机设备包括:存储器及处理器,所述存储器存储有计算机程序,当所述处理器执行所述程序时,实现所述的基于人机交互的语音纠错方法。本申请再一方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时,实现所述的基于人机交互的语音纠错方法。本申请实施例提供的基于人机交互的语音纠错方法和装置,通过获取用户当前输入的第一语音数据,以对第一语音数据进行解析,确定第一语音数据对应的目标语音数据,并将第一语音数据与目标语音数据进行比对,确定出与第一语音数据中的目标词语,然后播放目标词语对应的标准语音。由此,实现了通过将用户语音与标准语音数据进行比较,对用户语音中发音不准确的语音数据进行主动纠正,使得用户的发音更准确,不仅提高了用户学习效率和针对性,还能改善用户体验。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。图1是根据本申请一示例性实施例示出的基于人机交互的语音纠错方法的流程示意图;图2是根据本申请一示例性实施例示出的基于人机交互的语音纠错方法的流程示意图;图3是根据本申请一示例性实施例示出的基于人机交互的语音纠错方法的流程示意图;图4是根据本申请一示例性实施例示出的基于人机交互的语音纠错装置的结构示意图;图5是根据本申请一示例性实施例示出的基于人机交互的语音纠错装置的结构示意图;图6是根据本申请一示例性实施例示出的计算机设备的结构示意图;图7是根据本申请一示例性实施例示出的计算机设备的结构示意图。通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。本申请各实施例针对相关技术中,用户利用音频资料进行反复练习或者跟读的方式,对英语发音进行纠正时,由于跟读过程中,容易出现发音不准,自己也无法对不准确的音调、音长以及音高进行有效纠正,长此以往,容易造成用户英语口语较差,出现更多的地方式英语,从而影响用户的英语交流,降低了用户使用体验的问题,提出一种基于人机交互的语音纠错方法。本申请实施例提供的基于人机交互的语音纠错方法,通过获取用户当前输入的第一语音数据,以对第一语音数据进行解析,确定第一语音数据对应的目标语音数据,并将第一语音数据与目标语音数据进行比对,确定出与第一语音数据中的目标词语,然后播放目标词语对应的标准语音。由此,实现了通过将用户语音与标准语音数据进行比较,对用户语音中发音不准确的语音数据进行主动纠正,使得用户的发音更准确,不仅提高了用户学习效率和针对性,还能改善用户体验。下面结合附图,对本申请提供的基于人机交互的语音纠错方法和装置进行详细说明。首先结合图1,对本申请实施例提供的基于人机交互的语音纠错方法进行详细说明。图1是根据本申请一示例性实施例示出的基于人机交互的语音纠错方法的流程示意图。如图1所示,该基于人机交互的语音纠错方法可以包括以下步骤:步骤101,获取用户当前输入的第一语音数据。可选的,本申请实施例提供的基于人机交互的语音纠错方法,可以由本申请实施例提供的计算机设备执行。其中,计算机设备中设置有基于人机交互的语音纠错装置,以通过基于人机交互的语音纠错装置对用户输入的语音数据进行纠错管理或控制。本实施例计算机设备可以是任一具有数据处理功能的硬件设备,比如智能手机、电脑、个人数字助理等等。其中,第一语音数据可以是用户根据计算机设备提供的素材,通过麦克风输入的语音数据。在本申请一种可选的实现形式中,可以通过以下方式,获取用户当前输入的第一语音数据:作为第一种实现方式获取用户根据已播放的示例语句,跟读的第一语音数据。其中,在本实施例中已播放的示例语句,可以是任一类型的句子,比如简单句、并列句、复合句等等,此处对其不作具体限定。可以理解的是,本申请为了更具有针对性的对用户语音数据进行纠正,可以先向用户播放简单句的示例语句,以使计算机设备可以从基础语句,对用户的语音数据进行纠正。例如,计算机设备通过话筒播放“Thisisapple”,此时用户可以跟读“Thisisapple”。作为第二种实现方式获取用户针对已播放的问题语句,回答的第一语音数据。例如,计算机设备通过话筒播放“whatisthis”,此时用户可以根据自己的理解对上述问题进行作答,比如“Anapple”。需要说明的是,为了方便用户能够更好的理解问题语句,本申请在播放问题语句时,还可通过计算机设备的显示界面同步向用户显示对应的图片信息,以使用户根据图片信息及问题语句进行作答,从而不仅提高用户与计算机设备的交互性,还能提高用户的学习兴趣。步骤102,对第一语音数据进行解析,确定第一语音数据对应的目标语音数据。可选的,在获取到用户当前输入的第一语音数据之后,计算机设备可对第一语音数据进行解析,确定出与第一语音数据对应的目标语音数据。在实际应用过程中,为了能够对用户的第一语句数据进行准确纠正,在向用户播放示例语本文档来自技高网...

【技术保护点】
1.一种基于人机交互的语音纠错方法,其特征在于,包括:获取用户当前输入的第一语音数据;对所述第一语音数据进行解析,确定所述第一语音数据对应的目标语音数据;将所述第一语音数据与所述目标语音数据进行比对,确定所述第一语音数据中的目标词语;播放所述目标词语对应的标准语音。

【技术特征摘要】
1.一种基于人机交互的语音纠错方法,其特征在于,包括:获取用户当前输入的第一语音数据;对所述第一语音数据进行解析,确定所述第一语音数据对应的目标语音数据;将所述第一语音数据与所述目标语音数据进行比对,确定所述第一语音数据中的目标词语;播放所述目标词语对应的标准语音。2.如权利要求1所述的方法,其特征在于,所述获取用户当前输入的第一语音数据,包括:获取用户根据已播放的示例语句,跟读的第一语音数据;或者,获取用户针对已播放的问题语句,回答的第一语音数据。3.如权利要求2所述的方法,其特征在于,所述确定所述第一语音数据对应的目标语音数据,包括:根据所述示例语句或所述问题语句,确定各候选语音数据;根据所述第一语音数据与所述各候选语音数据的匹配度,确定目标语音数据。4.如权利要求3所述的方法,其特征在于,所述根据所述第一语音数据与所述各候选语音数据的匹配度,确定目标语音数据,包括:根据所述第一语音数据的结构与所述各候选语音数据的结构的匹配度,确定目标语音数据;和/或,根据所述第一语音数据对应的时间长度与所述各候选语音数据对应的时间长度的匹配度,确定目标语音数据;和/或,根据所述第一语音数据包括的词语数量与所述各候选语音数据包括的词语数量的匹配度,确定目标语音数据。5.如权利要求1-4任一所述的方法,其特征在于,所述获取用户当前输入的第一语音数据之前,还包括:根据已播放的示例语句或问题语句,确定各候选语音数据;根据所述各候选语音数据,确定第一语音数据对应的结束词语集;...

【专利技术属性】
技术研发人员:王志伟陈孟阳邓澍军
申请(专利权)人:北京比特智学科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1