语音纠错方法和装置制造方法及图纸

技术编号:14943827 阅读:52 留言:0更新日期:2017-04-01 10:14
本申请提出一种语音纠错方法和装置,该语音纠错方法包括:接收用户语音数据;确定当前纠错模式,所述纠错模式包括:语义纠错模式或者索引纠错模式;根据所述用户语音数据和所述当前纠错模式,对待纠错内容进行纠错;将纠错后的内容反馈给用户。该方法能够提高纠错准确度和适用范围,从而更好满足用户需求,提升用户体验。

【技术实现步骤摘要】

本申请涉及自然语言理解
,尤其涉及一种语音纠错方法和装置
技术介绍
随着人工智能相关技术的日益成熟,越来越多的智能设备进入用户的生活中,人与机器的交互日渐平常。交互过程中使用频率最高的一般为语音交互,这种交互方式可以解放人的双手,从而受到用户的喜爱,如语音输入,语音对话。现在越来越多的智能设备提供语音纠错的功能,让用户可以使用语音对智能设备中的显示内容进行修改,进一步解放了人的双手,大大提高了用户体验。相关技术中,语音纠错的方法一般是对文本数据进行纠错,具体纠错时,用户必须按照固定模式进行纠错,导致限制较多,纠错准确度较低,无法满足用户需求。
技术实现思路
本申请旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本申请的一个目的在于提出一种语音纠错方法,该方法可以提高纠错准确度和适用范围,从而更好满足用户需求,提升用户体验。本申请的另一个目的在于提出一种语音纠错装置。为达到上述目的,本申请第一方面实施例提出的语音纠错方法,包括:接收用户语音数据;确定当前纠错模式,所述纠错模式包括:语义纠错模式或者索引纠错模式;根据所述用户语音数据和所述当前纠错模式,对待纠错内容进行纠错;将纠错后的内容反馈给用户。本申请第一方面实施例提出的语音纠错方法,通过确定纠错模式,可以选择适合当前场景的纠错模式,从而提高纠错准确度;通过对待纠错内容进行纠错,不限于对文本数据进行处理,可以扩展适用范围;因此,通过提高纠错准确度和扩展适用范围,可以更好满足用户需求,提升用户体验。为达到上述目的,本申请第二方面实施例提出的语音纠错装置,包括:接收模块,用于接收用户语音数据;确定模块,用于确定当前纠错模式,所述纠错模式包括:语义纠错模式或者索引纠错模式;纠错模块,用于根据所述用户语音数据和所述当前纠错模式,对待纠错内容进行纠错;反馈模块,用于将纠错后的内容反馈给用户。本申请第二方面实施例提出的语音纠错装置,通过确定纠错模式,可以选择适合当前场景的纠错模式,从而提高纠错准确度;通过对待纠错内容进行纠错,不限于对文本数据进行处理,可以扩展适用范围;因此,通过提高纠错准确度和扩展适用范围,可以更好满足用户需求,提升用户体验。本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。附图说明本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是本申请一个实施例提出的语音纠错方法的流程示意图;图2是本申请另一个实施例提出的语音纠错方法的流程示意图;图3是本申请实施例中为待纠错文本数据中每个词构建索引的示意图;图4是本申请实施例中待纠错文本数据及对应的候选词和候选索引的示意图;图5是本申请一个实施例提出的语音纠错装置的结构示意图;图6是本申请另一个实施例提出的语音纠错装置的结构示意图;图7是本申请另一个实施例提出的语音纠错装置的结构示意图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。图1是本申请一个实施例提出的语音纠错方法的流程示意图。如图1所示,本实施例的方法包括:S11:接收用户语音数据。所述用户语音数据一般为用户针对显示的错误内容进行纠错的语音数据,所述显示的错误内容如显示的错误文本数据,当然也可以为其它显示内容,如图像。本实施例中,在语音纠错时,可以分为多种纠错模式,比如分别称为语义纠错模式和索引纠错模式,相应的,用户语音数据可以为语义纠错模式时的语音数据,也可以为索引纠错模式时的语音数据。假设待纠错内容为文本数据,且该文本数据为“合肥到北京的火车票”,而用户想订的是南京到北京的火车票,则用户可以通过语音进行纠错,如用户说出语义纠错模式时的语音数据,如为“把合肥修改为南京”。索引纠错模式时的语音数据是索引,索引一般是数字编号,如用户说出“二点二”。所述用户语音数据一般根据用户需要修改的内容确定,具体内容本申请不作限定。S12:确定当前纠错模式,所述纠错模式包括:语义纠错模式或者索引纠错模式。一些示例中,可以由系统自动确定当前纠错模式。一些示例中,可以由系统接收用户选择的当前纠错模式。进一步的,系统自动确定当前纠错模式时,可以是系统对用户的历史发音或当前发音或用户当前所处的环境进行分析,自动确定当前纠错模式;如用户发音较标准,用户所处的环境比较安静时,用户语音数据的质量较高,语义理解准确度较高,系统可以自动确定当前纠错模式类型为语义纠错模式;反之如果用户发音不标准或者用户所处的环境噪声较大时,用户语音数据的质量较低,语义理解准确度不高,而数字的识别效果一般比对汉字的识别效果好,则系统可以自动确定当前纠错模式类型为索引纠错模式。或者,系统自动确定当前纠错模式时,也可以是系统根据用户历史选择的纠错模式,自动确定当前纠错模式;如用户历史通常选择语义纠错模式,则表明用户习惯使用语义纠错模式,则系统可以自动确定当前纠错模式为语义纠错模式。系统接收用户选择的当前纠错模式时,例如,系统将两种纠错模式作为选项,通过显示或语音播放等方式提供给用户,用户通过手势、语音或按键等操作选择当前纠错模式。需要说明的是,虽然图1中S11和S12相互连接,但是这只是一种示例,在实际实施时,当前纠错模式可以与接收的用户语音数据有关,比如对接收的用户语音数据进行分析,判断发音是否标准,根据发音是否标准确定当前纠错模式,此时,S11和S12可以相互连接。或者,当前纠错模式也可以与接收的用户语音数据无关,比如,系统自动分析用户当前所处的环境确定当前纠错模式时,或者根据用户选择确定当前纠错模式时,并非是根据接收的用户语音数据确定的当前纠错模式,此时,S11和S12并不相互连接,是分离的。S13:根据所述用户语音数据和所述当前纠错模式,对待纠错内容进行纠错。在语义纠错模式下,主要通过对用户语音数据进行语义理解后,根据语义理解结果对待纠错内容进行纠错。在索引纠错模式下,主要通过对待纠错内容建立索引,用户通过待纠错内容的索引进行纠错。所述待纠错内容包括:文本数据和非文本数据,非文本数据包括但不限于:图像、视频、音频、应用程序。在语义纠错模式下,用户语音数据一般是文本数据对应的语音数据。以图像为例,用户语音数据为“删掉第五张图像”或者“在第二张图像后中插入一张林志玲的图像”等;以应用程序为例,用户语音数据可以为“关掉360浏览器,打开IE浏览器”等;在索引纠错模式下,如预先对显示的视频构建索引后,并显示出每个视频相应的候选索引,用户语音数据一般为候选索引对应的语音数据。S14:将纠错后的内容反馈给用户。比如,待纠错文本数据为“合肥到北京的火车票”,用户语音数据为“把合肥修改为南京”,则经过语音纠错后,将“南京到北京的火车票”反馈给用户。反馈可以通过内容显示或者语音播放等方式进行。本实施例中,通过确定纠错模式,可以选择适合当前场景的纠错模式,从而提高纠错准确度;通过对待纠错内容进行纠错,不限于对文本数据进行本文档来自技高网...
语音纠错方法和装置

【技术保护点】
一种语音纠错方法,其特征在于,包括:接收用户语音数据;确定当前纠错模式,所述纠错模式包括:语义纠错模式或者索引纠错模式;根据所述用户语音数据和所述当前纠错模式,对待纠错内容进行纠错;将纠错后的内容反馈给用户。

【技术特征摘要】
1.一种语音纠错方法,其特征在于,包括:接收用户语音数据;确定当前纠错模式,所述纠错模式包括:语义纠错模式或者索引纠错模式;根据所述用户语音数据和所述当前纠错模式,对待纠错内容进行纠错;将纠错后的内容反馈给用户。2.根据权利要求1所述的方法,其特征在于,如果当前纠错模式为语义纠错模式,所述根据所述用户语音数据和所述当前纠错模式,对待纠错内容进行纠错,包括:对所述用户语音数据进行语音识别,得到所述用户语音数据对应的识别文本数据;根据所述识别文本数据确定纠错信息,并根据所述纠错信息对待纠错内容进行纠错,得到纠错后的内容。3.根据权利要求2所述的方法,其特征在于,所述根据所述识别文本数据确定纠错信息,包括:根据所述识别文本数据和预设的纠错规则,确定纠错信息;和/或,提取所述识别文本数据和待纠错内容的纠错特征,根据所述纠错特征和预先构建的语音纠错模型,确定纠错信息。4.根据权利要求3所述的方法,其特征在于,所述根据所述识别文本数据和预设的纠错规则,确定纠错信息,包括:根据所述识别文本数据确定当前适用的纠错规则,以及,对所述识别文本数据与所述当前适用的纠错规则进行匹配,确定纠错信息;或者,对所述识别文本数据与每种纠错规则进行匹配,确定纠错信息。5.根据权利要求2-4任一项所述的方法,其特征在于,所述纠错信息包括:错误词和纠错词;纠错词和纠错位置;错误词和纠错位置;或者,错误词、纠错词和纠错位置。6.根据权利要求1所述的方法,其特征在于,如果当前纠错模式为索引纠错模式,所述根据所述用户语音数据和所述当前纠错模式,对待纠错内容进行纠错,包括:为待纠错内容建立候选内容及候选索引;对所述用户语音数据进行语音识别,得到所述用户语音数据对应的识别文本数据,所述识别文本数据包括:纠错索引;在待纠错内容中,用所述纠错索引对应的候选内容替换对应的错误内容,得到纠错后的内容。7.根据权利要求6所述的方法,其特征在于,如果待纠错内容为待纠错文本数据,则所述候选内容为候选词,所述为待纠错内容建立候选内容及候选索引,包括:对待纠错文本数据进行分词;为分词得到的词构建索引;确定所述词对应的词对词,并确定所述词对词的候选得分;根据所述词对应的词对词的候选得分,确定所述词的候选词,以及根据所述词的索引和所述候选词的候选得分,为所述候选词构建候选索引。8.根据权利要求1所述的方法,其特征在于,所述待纠错内容包括:文本数据和非文本数据。9.一种语音纠错装置,其特征在于...

【专利技术属性】
技术研发人员:刘迪源刘聪王智国胡国平潘嘉潘青华黄鑫
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1