英文语音信息的文本转换方法和装置制造方法及图纸

技术编号:17347929 阅读:38 留言:0更新日期:2018-02-25 14:28
本发明专利技术提出了一种英文语音信息的文本转换方法和装置,其中,方法包括:接收用户输入的英文语音信息,根据预设算法确定目标语音识别模型,应用目标语音识别模型标识英文语音信息的原始音素;应用对英文文本预先训练的注音模型和预设的概率模型对原始音素进行匹配,确定匹配成功的目标音素;获取与目标音素对应的目标英文文本,并将目标英文文本显示在语音转换文本框中。由此,通过根据英文语音的发音进行注音,并对注音结果标准化处理后进行英文文本的转化,实现了对英文语音的识别,识别准确度高且扩展了语音识别的应用领域。

Text conversion method and device for English speech information

The invention presents a text conversion method and device, a English voice information which methods: English voice information receiving user input, according to the preset algorithm to determine the target speech recognition model, the original phoneme application target speech recognition model identification English voice information; application of English text pre training model and the probability of default notation model matching the original phoneme, determine the matching success target phoneme; target corresponding to the target phoneme English text and target text displayed in the English speech text box. Thus, the English speech according to the phonetic pronunciation, and the phonetic transformation after the standardization of the English text, achieve the recognition of English voice, high recognition accuracy and expand the application field of speech recognition.

【技术实现步骤摘要】
英文语音信息的文本转换方法和装置
本专利技术涉及语音处理
,尤其涉及一种英文语音信息的文本转换方法和装置。
技术介绍
人工智能(ArtificialIntelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语音识别、图像识别、自然语言处理和专家系统等。其中,人工智能最重要的方面就是语音识别技术。相关技术中,对用户的语音识别的技术集中在对用户输入的中文语音的识别,缺少对英文语音的识别技术。
技术实现思路
本专利技术旨在至少在一定程度上解决上述的技术问题之一。为此,本专利技术的一个目的在于提出一种英文语音信息的文本转换方法,以解决现有技术中无法准确识别英文语音的技术问题。本专利技术的第二个目的在于提出一种英文语音信息的文本转换装置。本专利技术的第三个目的在于提出一种计算机设备。本专利技术的第四个目的在于提出一种非临时性计算机可读存储介质。本专利技术的第五个目的在于提出一种计算机程序产品。为达上述目的,本专利技术第一方面实施例提出了一种英文语音信息的文本转换方法,包括以下步骤:接收用户输入的英文语音信息,根据预设算法确定目标语音识别模型,应用所述目标语音识别模型标识所述英文语音信息的原始音素;应用对英文文本预先训练的注音模型和预设的概率模型对所述原始音素进行匹配,确定匹配成功的目标音素;获取与所述目标音素对应的目标英文文本,并将所述目标英文文本显示在语音转换文本框中。本专利技术实施例的英文语音信息的文本转换方法,接收用户输入的英文语音信息,根据预设算法确定目标语音识别模型,应用目标语音识别模型标识英文语音信息的原始音素,应用对英文文本预先训练的注音模型和预设的概率模型对原始音素进行匹配,确定匹配成功的目标音素,获取与目标音素对应的目标英文文本,并将目标英文文本显示在语音转换文本框中。由此,通过根据英文语音的发音进行注音,并对注音结果标准化处理后进行英文文本的转化,实现了对英文语音的识别,识别准确度高且扩展了语音识别的应用领域。为达上述目的,本专利技术第二方面实施例提出了一种英文语音信息的文本转换装置,包括:确定模块,用于接收用户输入的英文语音信息,根据预设算法确定目标语音识别模型;标识模块,用于应用所述目标语音识别模型标识所述英文语音信息的原始音素;匹配模块,用于应用对英文文本预先训练的注音模型和预设的概率模型对所述原始音素进行匹配,确定匹配成功的目标音素;获取模块,用于获取与所述目标音素对应的目标英文文本;显示模块,用于将所述目标英文文本显示在语音转换文本框中。本专利技术实施例的英文语音信息的文本转换装置,接收用户输入的英文语音信息,根据预设算法确定目标语音识别模型,应用目标语音识别模型标识英文语音信息的原始音素,应用对英文文本预先训练的注音模型和预设的概率模型对原始音素进行匹配,确定匹配成功的目标音素,获取与目标音素对应的目标英文文本,并将目标英文文本显示在语音转换文本框中。由此,通过根据英文语音的发音进行注音,并对注音结果标准化处理后进行英文文本的转化,实现了对英文语音的识别,识别准确度高且扩展了语音识别的应用领域。为达上述目的,本专利技术第三方面实施例提出了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时,实现如上述实施例所述的英文语音信息的文本转换方法。为了实现上述目的,本专利技术第四方面实施例提出了一种非临时性计算机可读存储介质,当所述存储介质中的指令由处理器被执行时,使得能够执行如上述实施例所述的英文语音信息的文本转换方法。为了实现上述目的,本专利技术第五方面实施例提出了一种计算机程序产品,当所述计算机程序产品中的指令处理器执行时,执行一种如上述实施例所述的英文语音信息的文本转换方法。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是根据本专利技术一个实施例的英文语音信息的文本转换方法的流程图;图2是根据本专利技术另一个实施例的英文语音信息的文本转换方法的流程图;图3是根据本专利技术一个实施例的英文语音信息的文本转换装置的结构示意图;图4是根据本专利技术另一个实施例的英文语音信息的文本转换装置的结构示意图;以及图5是根据本专利技术一个实施例的计算机设备的结构示意图。具体实施方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。下面参考附图描述本专利技术实施例的英文语音信息的文本转换方法和装置。由于相关技术中,集中在中文的文本结构等对中文语音进行识别,而英文的结构以及发音与中文区别较大,采用对中文语音识别的技术对英文语音进行识别,准确度不高、误差较大。为了解决上述技术问题,本专利技术提出了一种针对英文语音进行识别的技术,提高了英文语音识别的准确度。图1是根据本专利技术一个实施例的英文语音信息的文本转换方法的流程图,如图1所示,该英文语音信息的文本转换方法包括:步骤101,接收用户输入的英文语音信息,根据预设算法确定目标语音识别模型,应用目标语音识别模型标识英文语音信息的原始音素。在本专利技术的实施例中,根据应用场景的不同,可采用不同的方式接收到用户输入的英文语音信息,作为一种可能的实现方式,通过终端设备中的麦克风等语音装置实时接收用户的英文语音信息,作为另一种可能的实现方式,根据用户的选择,提取用户录音中的英文语音信息。具体而言,在本专利技术的实施例中,接收用户输入的英文语音信息,根据预设算法确定目标语音识别模型,应用目标语音识别模型标识英文语音信息的原始音素,其中,原始音素是英文发音的最小单位,由此,基于英文发音的结构进行注音,且基于预先设置的目标语音识别模型对英文语音本身进行注音识别,相较于直接根据对接收到的英文语音进行文本转换等方式进行识别,误差较小。需要说明的是,根据应用场景的不同,上述确定目标语音识别模型的预设算法不同,举例说明如下:作为一种可能的实现方式,预设的算法为深度学习算法,深度学习是机器学习中一种基于对数据进行表征学习的方法。观测值(例如一幅图像)可以使用多种方式来表示,如每个像素强度值的向量,或者更抽象地表示成一系列边、特定形状的区域等。而使用某些特定的表示方法更容易从实例中学习任务,深度学习算法是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征,准确度和效率较高。具体而言,在本示例中,应用深度学习算法对汉语音素标识的英文词样本集进行训练,生成第一语音识别模型,应用深度学习算法对英语音素标识的英文词样本集进行训练,生成第二语音识别模型,从而,将发音不标准而偏向于中文发音以及偏向标准的英文的语音,对应到不同的语音识别模型进行识别,避免了在一些应用场景下,发音带有中文口音时识别不标准的问题,通过上述第一语音识别模型和第二语音识别模型,既可准确识本文档来自技高网...
英文语音信息的文本转换方法和装置

【技术保护点】
一种英文语音信息的文本转换方法,其特征在于,包括以下步骤:接收用户输入的英文语音信息,根据预设算法确定目标语音识别模型,应用所述目标语音识别模型标识所述英文语音信息的原始音素;应用对英文文本预先训练的注音模型和预设的概率模型对所述原始音素进行匹配,确定匹配成功的目标音素;获取与所述目标音素对应的目标英文文本,并将所述目标英文文本显示在语音转换文本框中。

【技术特征摘要】
1.一种英文语音信息的文本转换方法,其特征在于,包括以下步骤:接收用户输入的英文语音信息,根据预设算法确定目标语音识别模型,应用所述目标语音识别模型标识所述英文语音信息的原始音素;应用对英文文本预先训练的注音模型和预设的概率模型对所述原始音素进行匹配,确定匹配成功的目标音素;获取与所述目标音素对应的目标英文文本,并将所述目标英文文本显示在语音转换文本框中。2.如权利要求1所述的方法,其特征在于,在所述根据预设算法确定目标语音识别模型之前,还包括:应用深度学习算法对汉语音素标识的英文词样本集进行训练,生成第一语音识别模型,以及,应用深度学习算法对英语音素标识的英文词样本集进行训练,生成第二语音识别模型。3.如权利要求2所述的方法,其特征在于,所述根据预设算法确定目标语音识别模型,包括:提取所述英文语音信息的发音特征信息;根据所述发音特征信息计算与所述第一语音识别模型匹配的第一概率,以及与所述第二语音识别模型匹配的第二概率;根据所述第一概率和所述第二概率确定目标语音识别模型。4.如权利要求2所述的方法,其特征在于,所述应用所述目标语音识别模型标识所述英文语音信息的原始音素,应用对英文文本预先训练的注音模型和预设的概率模型对所述原始音素进行匹配,包括:应用所述第一语音识别模型标识与所述英文语音信息对应的汉语原始音素;应用对英文文本预先训练的汉语音素注音模型和预设的概率模型对所述原始音素进行匹配;或者,应用所述第二语音识别模型标识与所述英文语音信息对应的英语原始音素;应用对英文文本预先训练的英语音素注音模型和预设的概率模型对所述原始音素进行匹配。5.如权利要求1所述的方...

【专利技术属性】
技术研发人员:程强钱胜
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1