【技术实现步骤摘要】
语言转换处理方法、装置及方言语音交互系统
本专利技术语音识别
,特别是一种语言转换处理方法和装置,此外,本专利技术还涉及一种方言语音交互系统。
技术介绍
随着语音识别技术的普及,人们对语音交互系统的需求在日益增高,特别是对音源的语种的多样化需求在快速提升,不再仅仅拘泥于普通话进行交互的形式,通过不同的语种如英语、法语、方言等进行交互的需求日益突出。然而,目前的语音交互系统都是基于普通话进行设计的,如果要实现其他语种,特别是方言的语音交互,就需要直接设计一套基于相应语种的交互系统,而针对每个语种都设计一套系统从研发成本、维护成本等各方面来说成本都是非常高昂的,且非常不便于维护和移植。而对于单个系统而言,其本身也会存在一定缺陷,例如,以设计一套基于方言的语音交互系统为例,整个语音交互系统的主要模块都使用方言的系统,包括语音识别、语义理解、对话管理模块都使用方言系统,这样带来的一大问题就是,每个系统都需要训练方言模型。而对于方言模型来说,原始数据的获取和标注的代价都很大,由于数据的稀缺性和需要专业的方言知识所限制,每个模块都 ...
【技术保护点】
1.一种语言转换处理方法,其特征在于,包括如下步骤:/n配置包含有第一语言及匹配的第二语言的语言数据对存储;/n获取待转换的第一语言文本;/n将所述第一语言文本与所述语言数据对中的内容进行搜索匹配,获取匹配度在预设范围内的第一备选数据对记录;/n通过构建的神经网络模型获取与所述第一语言文本匹配度在预设范围内的第二备选数据对记录;/n根据所述第一备选数据对记录和第二备选数据对记录确定文本转换结果输出。/n
【技术特征摘要】
1.一种语言转换处理方法,其特征在于,包括如下步骤:
配置包含有第一语言及匹配的第二语言的语言数据对存储;
获取待转换的第一语言文本;
将所述第一语言文本与所述语言数据对中的内容进行搜索匹配,获取匹配度在预设范围内的第一备选数据对记录;
通过构建的神经网络模型获取与所述第一语言文本匹配度在预设范围内的第二备选数据对记录;
根据所述第一备选数据对记录和第二备选数据对记录确定文本转换结果输出。
2.根据权利要求1所述的方法,其特征在于,通过构建的神经网络模型获取与所述第一语言文本匹配度在预设范围内的第二备选数据对记录包括如下步骤:
配置包括有第一语言和第二语言数据对及其对应的特征向量的神经网络特征库;
根据构建的神经网络模型将所述第一语言文本转换为第一特征向量;
根据所述第一语言文本从所述语言数据对获取文本匹配度在设定阈值内的数据对记录;
根据所述数据对记录和神经特征网络库对所述数据对记录进行特征转换,获取数据对记录的特征向量;
根据所述第一特征向量和数据对记录的特征向量的相似性,获取与所述第一语言文本匹配度在预设范围内的数据对记录作为第二备选数据对记录。
3.根据权利要求2所述的方法,其特征在于,根据构建的神经网络模型将所述第一语言文本转换为第一特征向量实现为包括如下步骤:
对所述第一语言文本进行分词处理,并对分词处理后的每一个词从预先配置的词典中获取其对应的词向量;
将所述第一语言文本中每一个词对应的位置编号转换为位置向量;
根据所述词向量与所述位置向量生成第一特征向量。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述获取的匹配度在预设范围内的第一备选数据对记录和第二备选数据对记录为匹配度最高的第一备选数据对记录和第二备选数据对记录,所述根据所述第一备选数据对记录和第二备选数据对记录确定文本转换结果输出实现为包括如下步骤:
分别获取所述第一备选数据对记录和第二备选数据对记录与所述第一语言文本的相似度;
根据获取的相似度,取相似度最大的备选数据对记录中的第一语言文本对应的第二语言文本作为文本转换结果输出。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述获取的匹配度在预设范围内的第一备选数据对记录和第二备选数据对记录为匹配度在预设阈值的第一备选数据对记录和第二备选数据对记录,所述根据所述第一备选数据对记录和第二备选数据对记录确定文本转换结果输出还实现为包括如下步骤:
配置所述第一备选数据对记录和第二备选数据对记录的置信度权重;
获取所述第一备选数据对记录和第二备选数据对记录中的交集文本;
在交集文本的数量大于一时,根据置信度权重和交集文本中的备选数据对记录与第一语言文本的相似度分别计算交集文本中各备选数据对记录的最终置信度,将所述最终置信度进行排序,获取置信度最大的备选数据对记录中的第一语言文本对应的第二语言文本作为文本转换结果输出;
在交集文本...
【专利技术属性】
技术研发人员:陈明佳,
申请(专利权)人:苏州思必驰信息科技有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。