System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 用于生成地区特定语音拼写变体的系统和方法技术方案_技高网

用于生成地区特定语音拼写变体的系统和方法技术方案

技术编号:40139024 阅读:10 留言:0更新日期:2024-01-23 23:19
用于基于地区特定发音生成给定单词的语音拼写变体的系统和方法。音素‑字母密度模型可以被配置为识别与输入单词相对应的音素序列,并且识别可以与输入音素序列相对应的所有字符序列及其相应的概率。音素‑音素误差模型可以被配置为识别可以对应于给定音素序列的地区特定替代音素序列及其相应的概率。使用这两个模型,对于给定输入单词,处理系统可以被配置为基于地区特定发音和/或表示每个替代字符序列对应于输入单词的可能性的概率分布,生成可以对应于输入单词的替代字符序列的列表。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、处理书面或口语的各种应用(例如,文字处理应用、搜索引擎、语音识别、自动化助理、自然语言处理模型)可以受益于了解可能对应于给定单词的潜在替代拼写和拼写错误以及替代发音。例如,文字处理应用可以被配置为对照字典和已知拼写错误的数据库检查文本,并用最可能的更正(例如,“the”)替代任何常见拼写错误的单词(例如,“teh”)。尽管这在某些情况下可能很有效,但常见拼写错误的数据库可能无法反映发音的区域差异,这可能会改变某些单词的发音和拼写方式(或拼写错误)。因此,依赖于仅反映常见拼写错误的数据库的系统可能无法自动选择受这种区域发音影响的单词的正确替代,和/或可能无法识别合理的替代。此外,当应用依赖于语音识别(或语音到文本)将口语输入转换为文本时,这种挑战可能会被放大,因为发音变化可能会比用户打字时影响更大比例的输入。


技术实现思路

1、目前的技术涉及用于基于地区特定(locale-specific)发音生成给定单词的语音拼写变体(phonetic spelling variation)的系统和方法。对此,当前技术可以利用音素-字母密度模型和音素-音素误差模型。音素-字母密度模型可以被配置为识别与输入单词相对应的音素序列,并且识别可以与输入音素序列相对应的所有字符序列及其相应的概率。音素-音素误差模型可以被配置为识别可以对应于给定音素序列的地区特定替代音素序列及其相应的概率。例如,在“s”可以用“j”发音的地区(locale),并且因此单词“design”可以发音为“dijin”,音素-音素误差模型可以被配置为将“dijin”的音素序列(例如,“/d//ih0//jh//ay1//n/”)识别为“design”的音素序列(例如,“/d//ih0//z//ay1//n/”)的地区特定替代,以及其被使用的似然值。如下面进一步解释的,使用这两个模型,对于给定输入单词,处理系统可以被配置为基于地区特定发音和/或表示每个替代字符序列对应于输入单词的可能性的概率分布,生成可以对应于输入单词的替代字符序列的列表。

2、在一个方面,本公开描述了一种生成给定单词的替代拼写的计算机实现的方法,包括:由处理系统的一个或多个处理器确定与给定单词相对应的第一音素序列,所述第一音素序列包括表示给定单词的第一发音的多个音素;由一个或多个处理器识别可用于代替第一音素序列的一个或多个音素的一个或多个替代音素;由一个或多个处理器基于第一音素序列和识别的一个或多个替代音素生成一个或多个替代音素序列;以及对于一个或多个替代音素序列中的每个给定替代音素序列,生成给定单词的给定替代拼写,包括:由一个或多个处理器识别可对应于给定替代音素序列的每个给定音素的一个或多个字形(grapheme);以及由一个或多个处理器组合识别的一个或多个字形中的每一个,以形成给定替代拼写。在一些方面,确定与给定单词相对应的第一音素序列是基于音素-字母密度模型。在一些方面,确定与给定单词相对应的第一音素序列是基于音素词典。在一些方面,识别可用于代替第一音素序列的一个或多个音素的一个或多个替代音素是基于音素-音素误差模型。在一些方面,识别可对应于给定替代音素序列的每个给定音素的一个或多个字形是基于音素-字母密度模型。在一些方面,由一个或多个处理器识别可对应于给定替代音素序列的每个给定音素的一个或多个字形还包括识别表示一个或多个字形可以对应于给定音素的似然值(likelihood)的第一似然值。在一些方面,由一个或多个处理器将识别的一个或多个字形中的每一个组合以形成给定替代拼写还包括:基于所识别的一个或多个字形中的每一个的识别的第一似然值生成给定替代拼写的第二似然值,第二似然值表示给定替代拼写可对应于第一音素序列的似然值。在一些方面,所述方法还包括由一个或多个处理器识别所识别的一个或多个替代音素中的每一个的第三似然值,所述第三似然值表示所识别的一个或多个替代音素的每一个可用于代替第一音素序列的音素的似然值。在一些方面,所述方法还包括由一个或多个处理器基于包括在给定替代音素序列中的每个识别的替代音素的识别的第三似然值生成一个或多个替代音素列中的每个给定替代音素序列的第四似然值,所述第四似然值表示给定替代音素序列可以对应于第一音素序列的似然值。在一些方面,所述方法还包括由一个或多个处理器基于第二似然值和第四似然值生成概率分布,所述概率分布表示每个生成的替代拼写对应于给定单词的可能性。

3、在另一方面,本公开描述了一种用于生成给定单词的替代拼写的系统,包括:存储器,以及耦合到存储器的一个或多个处理器并且被配置为:确定与给定单词相对应的第一音素序列,所述第一音素序列包括表示给定单词的第一发音的多个音素;识别可用于代替第一音素序列的一个或多个音素的一个或多个替代音素;基于第一音素序列和识别的一个或多个替代音素生成一个或多个替代音素序列;以及对于一个或多个替代音素序列中的每个给定替代音素序列,生成给定单词的给定替代拼写,包括:识别可对应于给定替代音素序列的每个给定音素的一个或多个字形;以及组合识别的一个或多个字形中的每一个,以形成给定替代拼写。在一些方面,一个或多个处理器还被配置为基于音素-字母密度模型确定与给定单词相对应的第一音素序列。在一些方面,一个或多个处理器还被配置为基于音素词典确定与给定单词相对应的第一音素序列。在一些方面,一个或多个处理器还被配置为基于音素-音素误差模型识别可用于代替第一音素序列的一个或多个音素的一个或多个替代音素。在一些方面,一个或多个处理器还被配置为基于音素-字母密度模型识别可对应于给定替代音素序列的每个给定音素的一个或多个字形。在一些方面,识别可对应于给定替代音素序列的每个给定音素的一个或多个字形还包括识别表示一个或多个字形可对应于给定音素的似然值的第一似然值。在一些方面,将识别的一个或多个字形中的每一个组合以形成给定替代拼写还包括基于所识别的一个或多个字形中的每一个的识别的第一似然值生成给定替代拼写的第二似然值,第二似然值表示给定替代拼写可对应于第一音素序列的似然值。在一些方面,一个或多个处理器还被配置为识别所识别的一个或多个替代音素中的每一个的第三似然值,所述第三似然值表示所识别的一个或多个替代音素的每一个可用于代替第一音素序列的音素的似然值。在一些方面,一个或多个处理器还被配置为基于包括在给定替代音素序列中的每个识别的替代音素的识别的第三似然值生成一个或多个替代音素列中的每个给定替代音素序列的第四似然值,所述第四似然值表示给定替代音素序列可以对应于第一音素序列的似然值。在一些方面,一个或多个处理器还被配置为基于第二似然值和第四似然值生成概率分布,所述概率分布表示每个生成的替代拼写对应于给定单词的可能性。

本文档来自技高网...

【技术保护点】

1.一种生成给定单词的替代拼写的计算机实现的方法,包括:

2.根据权利要求1所述的方法,其中,确定与所述给定单词相对应的第一音素序列是基于音素-字母密度模型。

3.根据权利要求1所述的方法,其中,确定与所述给定单词相对应的第一音素序列是基于音素词典。

4.根据权利要求1所述的方法,其中,识别可用于代替所述第一音素序列的一个或多个音素的一个或多个替代音素是基于音素-音素误差模型。

5.根据前述权利要求中任一项所述的方法,其中,识别可对应于所述给定替代音素序列的每个给定音素的一个或多个字形是基于音素-字母密度模型。

6.根据前述权利要求中任一项所述的方法,其中,由所述一个或多个处理器识别可对应于所述给定替代音素序列的每个给定音素的一个或多个字形还包括:识别表示所述一个或多个字形可对应于所述给定音素的似然值的第一似然值。

7.根据权利要求6所述的方法,其中,由所述一个或多个处理器将所述识别的一个或多个字形中的每一个组合以形成所述给定替代拼写还包括:基于所述识别的一个或多个字形中的每一个的识别的第一似然值生成所述给定替代拼写的第二似然值,所述第二似然值表示所述给定替代拼写可对应于所述第一音素序列的似然值。

8.根据权利要求7所述的方法,还包括由所述一个或多个处理器识别所述识别的一个或多个替代音素中的每一个的第三似然值,所述第三似然值表示所述识别的一个或多个替代音素中的每一个可以用于代替所述第一音素序列的音素的似然值。

9.根据权利要求8所述的方法,还包括由所述一个或多个处理器基于包括在所述给定替代音素序列中的每个识别的替代音素的识别的第三似然值,生成所述一个或多个替代音素列中的每个给定替代音素序列的第四似然值,所述第四似然值表示所述给定替代音素序列可对应于所述第一音素序列的似然值。

10.根据权利要求9所述的方法,还包括由所述一个或多个处理器基于所述第二似然值和所述第四似然值生成概率分布,所述概率分布表示每个生成的替代拼写对应于所述给定单词的可能性。

11.一种用于生成给定单词的替代拼写的系统,包括:

12.根据权利要求11所述的系统,其中,所述一个或多个处理器还被配置为基于音素-字母密度模型确定与所述给定单词相对应的第一音素序列。

13.根据权利要求11所述的系统,其中,所述一个或多个处理器还被配置为基于音素词典确定与所述给定单词相对应的第一音素序列。

14.根据权利要求11所述的系统,其中,所述一个或多个处理器还被配置为基于音素-音素误差模型识别可用于代替所述第一音素序列的一个或多个音素的一个或多个替代音素。

15.根据权利要求11-14中的任一项所述的系统,其中,所述一个或多个处理器还被配置为基于音素-字母密度模型识别可对应于所述给定替代音素序列的每个给定音素的一个或多个字形。

16.根据权利要求11-14中的任一项所述的系统,其中,识别可对应于所述给定替代音素序列的每个给定音素的一个或多个字形还包括:识别表示所述一个或多个字形可对应于所述给定音素的似然值的第一似然值。

17.根据权利要求16所述的系统,其中,将所述识别的一个或多个字形中的每一个组合以形成所述给定替代拼写还包括:基于所述识别的一个或多个字形中的每一个的识别的第一似然值生成所述给定替代拼写的第二似然值,所述第二似然值表示所述给定替代拼写可对应于第一音素序列的似然值。

18.根据权利要求17所述的系统,其中,所述一个或多个处理器还被配置为识别所述识别的一个或多个替代音素中的每一个的第三似然值,所述第三似然值表示所述识别的一个或多个替代音素中的每一个可用于代替所述第一音素序列的音素的似然值。

19.根据权利要求18所述的系统,其中,所述一个或多个处理器还被配置为基于包括在所述给定替代音素序列中的每个识别的替代音素的识别的第三似然值,生成所述一个或多个替代音素列中的每个给定替代音素序列的第四似然值,所述第四似然值表示所述给定替代音素序列可对应于所述第一音素序列的似然值。

20.根据权利要求19所述的系统,其中,所述一个或多个处理器还被配置为基于所述第二似然值和所述第四似然值生成概率分布,所述概率分布表示每个生成的替代拼写对应于所述给定单词的可能性。

...

【技术特征摘要】
【国外来华专利技术】

1.一种生成给定单词的替代拼写的计算机实现的方法,包括:

2.根据权利要求1所述的方法,其中,确定与所述给定单词相对应的第一音素序列是基于音素-字母密度模型。

3.根据权利要求1所述的方法,其中,确定与所述给定单词相对应的第一音素序列是基于音素词典。

4.根据权利要求1所述的方法,其中,识别可用于代替所述第一音素序列的一个或多个音素的一个或多个替代音素是基于音素-音素误差模型。

5.根据前述权利要求中任一项所述的方法,其中,识别可对应于所述给定替代音素序列的每个给定音素的一个或多个字形是基于音素-字母密度模型。

6.根据前述权利要求中任一项所述的方法,其中,由所述一个或多个处理器识别可对应于所述给定替代音素序列的每个给定音素的一个或多个字形还包括:识别表示所述一个或多个字形可对应于所述给定音素的似然值的第一似然值。

7.根据权利要求6所述的方法,其中,由所述一个或多个处理器将所述识别的一个或多个字形中的每一个组合以形成所述给定替代拼写还包括:基于所述识别的一个或多个字形中的每一个的识别的第一似然值生成所述给定替代拼写的第二似然值,所述第二似然值表示所述给定替代拼写可对应于所述第一音素序列的似然值。

8.根据权利要求7所述的方法,还包括由所述一个或多个处理器识别所述识别的一个或多个替代音素中的每一个的第三似然值,所述第三似然值表示所述识别的一个或多个替代音素中的每一个可以用于代替所述第一音素序列的音素的似然值。

9.根据权利要求8所述的方法,还包括由所述一个或多个处理器基于包括在所述给定替代音素序列中的每个识别的替代音素的识别的第三似然值,生成所述一个或多个替代音素列中的每个给定替代音素序列的第四似然值,所述第四似然值表示所述给定替代音素序列可对应于所述第一音素序列的似然值。

10.根据权利要求9所述的方法,还包括由所述一个或多个处理器基于所述第二似然值和所述第四似然值生成概率分布,所述概率分布表示每个生成的替代拼写对应于所述给定单词的可能性。

11.一种用于生成给定单词的替代拼写的系统,包括:

【专利技术属性】
技术研发人员:A·古普塔A·拉古维尔A·夏尔马N·劳特M·库马尔
申请(专利权)人:谷歌有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1