语音转换纠错方法和装置制造方法及图纸

技术编号:17248400 阅读:18 留言:0更新日期:2018-02-11 06:33
本发明专利技术公开了一种语音转换纠错方法和装置,其中,方法包括:对用户输入的连续语音信息进行语音识别转换处理,显示对应的原始文本语句;获取对原始文本语句的纠错触发操作,根据预设的信息候选库检测原始文本语句,将原始文本语句中一处或者多处的原始信息片段转换为至少一个与原始信息片段对应的候选信息片段;显示至少一个包含候选信息片段的候选文本语句,根据用户从候选文本语句中选择的目标文本语句替换原始文本语句,并将目标文本语句发送给目标用户。由此,在语音转换为文本出现歧义时,为用户提供多个候选文本语句以供用户选择,从而实现快速完成对语音转换的文本的修改。

【技术实现步骤摘要】
语音转换纠错方法和装置
本专利技术涉及语音处理
,尤其涉及一种语音转换纠错方法和装置。
技术介绍
随着互联网技术的进步,语音识别逐渐走向的舞台,通过语音识别技术,可以实现用户与机器进行语音交流,让机器通过识别和理解过程把语音信号转变为相应的文本或命令。相关技术中,由于用户发音不标准或者环境噪音等的影响,在很多场景下,将语音转换到文本具有歧义,为了纠正这种歧义,需要用户对转换的文本手动删除更改,这样在长句中用户修改的成本较高,一般需要多次修改才能获得正确结果,甚至用户需要重新输入,操作繁琐。
技术实现思路
本专利技术提供一种语音转换纠错方法和装置,以解决现有技术中,纠错步骤繁琐,耗时的技术问题。本专利技术实施例提供一种语音转换纠错方法,包括以下步骤:对用户输入的连续语音信息进行语音识别转换处理,显示对应的原始文本语句;获取对所述原始文本语句的纠错触发操作,根据预设的信息候选库检测所述原始文本语句,将所述原始文本语句中一处或者多处的原始信息片段转换为至少一个与所述原始信息片段对应的候选信息片段;显示至少一个包含所述候选信息片段的候选文本语句,根据所述用户从所述候选文本语句中选择的目标文本语句替换所述原始文本语句,并将所述目标文本语句发送给目标用户。本专利技术另一实施例提供一种语音转换纠错装置,包括:第一转换模块,用于对用户输入的连续语音信息进行语音识别转换处理;显示模块,用于显示对应的原始文本语句;获取模块,用于获取对所述原始文本语句的纠错触发操作;第二转换模块,用于根据预设的信息候选库检测所述原始文本语句,将所述原始文本语句中一处或者多处的原始信息片段转换为至少一个与所述原始信息片段对应的候选信息片段;所述显示模块,还用于显示至少一个包含所述候选信息片段的候选文本语句;替换模块,用于根据所述用户从所述候选文本语句中选择的目标文本语句替换所述原始文本语句;发送模块,用于将所述目标文本语句发送给目标用户。本专利技术又一实施例提供一种计算机设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述实施例所述的语音转换纠错方法。本专利技术还一实施例提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述实施例所述的语音转换纠错方法。本专利技术实施例提供的技术方案可以包括以下有益效果:通过对用户输入的连续语音信息进行语音识别转换处理,显示对应的原始文本语句,获取对原始文本语句的纠错触发操作,根据预设的信息候选库检测原始文本语句,将原始文本语句中一处或者多处的原始信息片段转换为至少一个与原始信息片段对应的候选信息片段,显示至少一个包含候选信息片段的候选文本语句,根据用户从候选文本语句中选择的目标文本语句替换原始文本语句,并将目标文本语句发送给目标用户。由此,在语音转换为文本出现歧义时,为用户提供多个候选文本语句以供用户选择,从而实现快速完成对语音转换的文本的修改。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是根据本专利技术一个实施例的语音转换纠错方法的流程图;图2(a)是根据本专利技术一个具体实施例的语音转换纠错方法的应用前台界面效果示意图;图2(b)是根据本专利技术另一个具体实施例的语音转换纠错方法的应用前台界面效果示意图;图3是根据本专利技术另一个实施例的语音转换纠错的流程图;图4是根据本专利技术一个实施例的语音转换纠错装置的结构示意图;以及图5是根据本专利技术另一个实施例的语音转换纠错装置的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的语音转换纠错方法和装置。图1是根据本专利技术一个实施例的语音转换纠错方法的流程图,如图1所示,该语音转换纠错方法包括:步骤101,对用户输入的连续语音信息进行语音识别转换处理,显示对应的原始文本语句。可以理解,在可以通过语音输入信息的很多应用场景下,比如在聊天应用中语音输入聊天信息,比如,在浏览器应用中语音输入检索信息等,可通过终端设备的麦克风等装置接收用户输入的连续语音信息,为了将识别该连续的语音对应的相关信息,对其进行识别转换处理为原始文本语句,并在相关应用界面中显示对应的原始文本语句。其中,在本专利技术的一个实施例中,为了提高语音转换为原始文本语句的准确性,对接收的连续语音信息进行去噪处理,并将去燥处理后的连续语音信息进行转换处理。步骤102,获取对原始文本语句的纠错触发操作,根据预设的信息候选库检测原始文本语句,将原始文本语句中一处或者多处的原始信息片段转换为至少一个与原始信息片段对应的候选信息片段。具体地,显示对应的原始文本语句代表当前的语音识别结果,但是该语音识别结果可能和用户的输入意图有偏差,比如,用户有语音输入时,会加入一些习惯性的语气词语,比如“今天天气、额,不对,明天天气怎么样”,此时转换的原始文本语句,显然不能满足用户的输入需求,在有些应用场景下,甚至会转换出与用户的输入的语音信息完全相反意思的原始文本语句。因此,获取用户对原始文本语句的纠错触发操作,根据预设的信息候选库检测原始文本语句,根据检测结果,以将原始文本语句中一处或者多处的原始信息片段转换为至少一个与原始信息片段对应的候选信息片段,其中,与上述至少一个与原始信息片段对应的候选信息片段对应的原始信息片段,是根据检测结构确定的可能具有歧义的片段。其中,根据具体应用需求的不同,可采用不同的方式获取对原始文本的纠错触发操作,举例如下:第一种示例:检测到用户对原始文本语句进行全选操作。在本示例中,如果检测到用户对原始文本语句进行全选操作,则表明用户可能对转换结果不满意,可能想全部删除重新输入,此时确定获取对原始文本语句的纠错触发操作。第二种示例:检测到用户对整句纠错功能控件的触发操作。在本示例中,在相关应用的界面上提供整句纠错功能控件,当用户对转换结果不满意时,可能会触发该控件,比如单击、双击等操作,此时确定获取对原始文本语句的纠错触发操作。第三种示例:检测到用户对原始文本语句中的信息片段进行删除操作。在本示例中,如果检测到用户对原始文本语句中的信息片段进行删除操作,则表明用户可能对该信息片段转换结果不满意,可能想删除重新输入,此时确定获取对原始文本语句的纠错触发操作。当然,在实际应用中,有可能与原始信息片段对应匹配的候选信息片段可能为多个,为了确定出最有可能符合用户的输入意图的候选信息片段,在本专利技术的实施例中,根据待转换的原始信息片段在原始文本语句中的位置信息以及上下文信息,根据预设的统计模型获取与原始信息片段对应匹配的多个候选信息片段的匹配度。进而,根据预设的匹配策略对多个候选信息片段的匹配度进行分析,获取至少一个与原始信息片段对应的候选信息片段,其中,上述预设的匹配策略是为了避免候选信息片段较多导致用户选择受到干扰,可以是将匹配度高于一定值的信息片段作为候选信息片段的策略,也可以是将本文档来自技高网...
语音转换纠错方法和装置

【技术保护点】
一种语音转换纠错方法,其特征在于,包括以下步骤:对用户输入的连续语音信息进行语音识别转换处理,显示对应的原始文本语句;获取对所述原始文本语句的纠错触发操作,根据预设的信息候选库检测所述原始文本语句,将所述原始文本语句中一处或者多处的原始信息片段转换为至少一个与所述原始信息片段对应的候选信息片段;显示至少一个包含所述候选信息片段的候选文本语句,根据所述用户从所述候选文本语句中选择的目标文本语句替换所述原始文本语句,并将所述目标文本语句发送给目标用户。

【技术特征摘要】
1.一种语音转换纠错方法,其特征在于,包括以下步骤:对用户输入的连续语音信息进行语音识别转换处理,显示对应的原始文本语句;获取对所述原始文本语句的纠错触发操作,根据预设的信息候选库检测所述原始文本语句,将所述原始文本语句中一处或者多处的原始信息片段转换为至少一个与所述原始信息片段对应的候选信息片段;显示至少一个包含所述候选信息片段的候选文本语句,根据所述用户从所述候选文本语句中选择的目标文本语句替换所述原始文本语句,并将所述目标文本语句发送给目标用户。2.如权利要求1所述的方法,其特征在于,所述获取对所述原始文本语句的纠错触发操作,包括:检测到所述用户对所述原始文本语句进行全选操作;或者,检测到所述用户对整句纠错功能控件的触发操作;或者,检测到所述用户对所述原始文本语句中的信息片段进行删除操作。3.如权利要求1所述的方法,其特征在于,所述根据预设的信息候选库检测所述原始文本语句,将所述原始文本语句中一处或者多处的原始信息片段转换为至少一个与所述原始信息片段对应的候选信息片段,包括:根据预设的标准用语候选库检测所述原始文本语句,将所述原始文本语句中一处或者多处的原始信息片段转换为至少一个与所述原始信息片段对应的候选信息片段,其中,所述标准用语候选库具体包括下述一种或者几种组合:根据语气词候选库对所述原始信息片段进行过滤或者改写;和/或,根据同音词候选库将所述原始信息片段转换成至少一个同音候选词;和/或,根据口语词候选库将所述原始信息片段转换成对应的书面候选词;和/或,根据数字或者英文转换候选库将所述原始信息片段转换成对应的候选信息片段;和/或,根据标点候选库将所述原始信息片段的间隔符号转换成对应的候选间隔符号。4.如权利要求3所述的方法,其特征在于,所述根据预设的信息候选库检测所述原始文本语句,将所述原始文本语句中一处或者多处的原始信息片段转换为至少一个与所述原始信息片段对应的候选信息片段,还包括:获取所述用户的偏好特征;根据与所述偏好特征对应的个性化用语候选库检测所述原始文本语句,将所述原始文本语句中一处或者多处的原始信息片段转换为至少一个与所述原始信息片段对应的候选信息片段。5.如权利要求1所述的方法,其特征在于,当与所述原始信息片段对应...

【专利技术属性】
技术研发人员:周承礼谢波
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1