【技术实现步骤摘要】
本专利技术涉及语言转换,尤其涉及消除语言转换中的多个读法的歧义。
技术介绍
例如N元语法模型的统计语言模型通常用以通过使用概率分布将概率Pr (W)指配给一序列字W来将一种语言转换或翻译成另一种语言。这些语言模型通常是从一大堆文本 (称作语料库)训练且,一般地,俘获每一个字的出现频率和/或语料库内的两个或两个以上字的每一序列。按照惯例,通过训练语言模型而不管语言模型在每一特定上下文中的用法和/或读法来考虑语料库中的特定字的出现。虽然语料库中的大多数字且一般地各自与一种意义相关联且可能地与一个以上正确发音相关联,但是某些字是以完全相同方式书写而具有不同意义和发音/读法(即,同形异音异义词)。举例来说,英文语言中的同形异音异义词的实例为“desert”,其在一种上下文和用法/发音中意味“抛弃”且在另一种上下文和用法/发音中意味“干燥的荒芜陆地区域”。因此,通过考虑字“desert”的频率而不管字 “desert”在语料库中的用法的上下文,常规语言模型最可能看漏第一种含义(“抛弃”)和第二种含义(“干燥的荒芜陆地区域”)的字的使用频率的任何差别。拼音是使用罗马字母表抄 ...
【技术保护点】
一种方法,其包括:在包括存储器和一个或一个以上处理器的装置处:接收待转换成一组字符的输入数据,所述组字符包括所述输入数据在目标符号系统中的符号表示;以及使用区别所述目标符号系统的同形异音异义字符的第一读法与第二读法的语言模型,以确定所述同形异音异义字符表示所述输入数据的对应部分的相应概率。
【技术特征摘要】
...
【专利技术属性】
技术研发人员:布伦特·D·拉梅尔斯,戴王·K·奈克,道格拉斯·R·戴维森,亚内斯·G·A·多尔芬,朴佳,
申请(专利权)人:苹果公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。