一种语音合成方法、电子设备及智能家居系统技术方案

技术编号:22170615 阅读:20 留言:0更新日期:2019-09-21 12:10
本发明专利技术公开了一种语音合成方法、电子设备及智能家居系统,该方法包括:获取用户语音需求数据;得到用户意图并从中提取准意图标签;获取与用户意图相关联的文字结果;由准意图标签确定目标意图标签,并从知识图谱中查询与目标意图标签相关联的语音集合,基于该语音集合确定与每个文字相关联的语音,并将该文字与确定的语音进行合成。该电子设备通过语音识别服务器、语义理解服务器、知识图谱服务器和语音合成终端实现该方法,该智能家居系统包括一个或多个该电子设备。本发明专利技术通过知识图谱内保存的标签及语言集合,在获取到与用户意图相关联的每个文字后,可基于该语音集合确定每个文字相关联的语音将该文字与确定的语音合成为读音准确度高的语音。

A Speech Synthesis Method, Electronic Equipment and Smart Home System

【技术实现步骤摘要】
一种语音合成方法、电子设备及智能家居系统
本专利技术涉及语音合成
,特别是涉及一种语音合成方法,还涉及使用该语音合成方法的电子设备及智能家居系统。
技术介绍
现代汉语包含了很多的多音字,如“调”,既可以念“diào”,如“声调”;也可以念“tiáo”,如“调解”。在现有的语音合成(TTS,即texttospeech)过程中,语音合成系统多使用概率的方法来判断多音字的发音。但是上述判断方法存在以下缺陷:当待合成语句中缺少成分时,无法判别语句中多音字或通假字的读音。例如,当“为”出现在“已为你XXX”这句话里时,很难分辨汉字“为”的读音是“wèi”还是“wéi”。这是因为在语句“已为你调到26度”里汉字“为”的读音是“wèi”,而在语句“已为你所用”里汉字“为”的读音是“wéi”。因此,设计一种比使用概率来判别读音更加严谨的语音合成方法显得至关重要。
技术实现思路
本专利技术要解决的技术问题是:现有技术中语音合成系统使用概率的方法来判断多音字或通假字的发音时,存在当待合成语句缺少成分时,无法判别语句中多音字或通假字的读音的问题。为解决上述技术问题,本专利技术提供了一种语音合成方法、电子设备及智能家居系统。根据本专利技术的第一个方面,提供了一种语音合成方法,其包括:获取用户输入的语音需求数据;分析所述语音需求数据,得到用户意图并从该用户意图中提取准意图标签;获取与所述用户意图相关联的文字结果;根据所述准意图标签确定目标意图标签,并从构建的知识图谱中查询与所述目标意图标签相关联的语音集合,所述知识图谱中保存有多个标签以及与各个标签相关联的语音集合;针对获取的文字结果中的每个文字,基于查询的语音集合确定与该文字相关联的语音,并将该文字与确定的语音进行合成。优选的是,从用户意图中提取准意图标签,包括:从所述用户意图中提取关键词;确定与所述关键词相对应的准意图标签。优选的是,所述知识图谱中还保存有标签间的关联关系,具有关联的多个标签形成一个关联分支,根据所述准意图标签确定目标意图标签包括:确定提取的准意图标签的个数;当提取的准意图标签为一个时,确定该准意图标签为所述目标意图标签;当提取的准意图标签为多个时,根据所述知识图谱确定提取的多个准意图标签所属的关联分支,并将处于该关联分支的末端的标签作为所述目标意图标签。优选的是,所述标签间的关联关系通过连接标签的路径体现。优选的是,所述的语音合成方法还包括构建所述知识图谱,其包括:根据用户所处的多个使用场景,确定与各个使用场景相对应的标签;针对确定的每个标签,确定与该标签相对应的语音集合,所述语音集合包含与该标签相关联的每个文字的读音;保存确定的所有标签以及与各个标签相对应的语音集合,以构建所述知识图谱。优选的是,构建所述的知识图谱,还包括:针对确定的每个标签,确定与该标签有关联的标签,并建立该标签与关联的标签的关联关系;将所述关联关系保存在所述知识图谱中。优选的是,所述标签间的关联关系通过连接标签的路径体现。优选的是,从构建的知识图谱中查询与所述目标意图标签相关联的语音集合,包括:将所述目标意图标签与所述知识图谱中保存的标签相匹配;将与匹配成功的标签相关联的语音集合,确定为与所述目标意图标签相关联的语音集合。根据本专利技术的第二个方面,提供了一种电子设备,其包括:语音识别服务器,配置为获取用户输入的语音需求数据;语义理解服务器,配置为分析所述语音需求数据,得到用户意图并从该用户意图中提取准意图标签;知识图谱服务器,其中保存有知识图谱,所述知识图谱中保存有多个标签以及与各个标签相关联的语音集合,该知识图谱服务器配置为根据所述准意图标签确定目标意图标签,从构建的知识图谱中查询与所述目标意图标签相关联的语音集合,并将所述用户意图发送给云端资源服务器,以供该云端资源服务器获取与所述用户意图相关联的文字结果;以及语音合成终端,配置为针对获取的文字结果中的每个文字,基于查询的语音集合确定与该文字相关联的语音,并将该文字与确定的语音进行合成。根据本专利技术的第三个方面,提供了一种智能家居系统,其包括一个或多个如上所述的电子设备。与现有技术相比,上述方案中的一个或多个实施例可以具有如下优点或有益效果:应用本专利技术的语音合成方法,能够在构建的知识图谱内通过查询到与用户意图相对应的标签,进而找到与该标签相关联的语音集合,当获取到与用户意图相关联的每个文字后,能够基于该语音集合确定每个文字相关联的语音,进而将该文字与确定的语音进行合成,使得在获取到用户输入的语音需求数据时,能够合成读音准确的语音。附图说明通过结合附图阅读下文示例性实施例的详细描述可更好地理解本公开的范围。其中所包括的附图是:图1为本专利技术实施例的语音合成方法的总体流程图;图2为本专利技术实施例的构建知识图谱方法的流程图;图3为本专利技术实施例的确定目标意图标签方法的流程图;图4为本专利技术实施例的电子设备的工作流程框图;图5为本专利技术实施例的知识图谱的部分结构图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,以下将结合附图及实施例来详细说明本专利技术的实施方法,借此对本专利技术如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。现有技术中语音合成系统使用概率的方法来判断多音字或通假字的发音时,存在当待合成语句缺少成分时,无法判别语句中多音字或通假字的读音的问题。实施例一本实施例提供一种语音合成方法,以一种更加严谨的方法来确定待合成的语音并进行语音合成。图1为本专利技术实施例的语音合成方法的总体流程图,如图1所示,该语音合成方法主要包括以下步骤S101至步骤S106。在实施该语音合成方法前,需要预先构建知识图谱,通过构建的知识图谱存储所需的语音集合,图2为本专利技术实施例的构建知识图谱方法的流程图,如图2所示,构建知识图谱的步骤S101包括以下子步骤S1011至子步骤S1014。在步骤S1011中,根据用户所处的多个使用场景,确定与各个使用场景相对应的标签,通过标签建立起用户所处的使用场景与知识图谱之间的联系。在步骤S1012中,针对确定的每个标签,确定与该标签相对应的语音集合,语音集合包含与该标签相关联的每个文字的读音。进一步的,该语音集合通过人为限定,即每个文字的读音在其所属的语音集合中是既定的,通过找到该文字与标签对应的语音集合,即可准确找到该文字对应的读音。在步骤S1013中,针对确定的每个标签,确定与该标签有关联的标签,并建立该标签与关联的标签的关联关系,标签间的关联关系通过连接标签的路径体现,并将关联关系保存在知识图谱中。在步骤S1014中,保存确定的所有标签以及与各个标签相对应的语音集合,以构建知识图谱。那么,对于构建好的知识图谱,每当操作人员增加一个标签,该标签就通过路径与关联的标签连接为新的更为宽广的知识图谱;每当操作人员减少一个标签,该标签就断开与之关联的所有路径,也就断开了与其关联的所有标签而形成新的较小的知识图谱。由此可见,每增加或减少任意一个标签,该知识图谱所包含的内容就成倍数扩大或减小,因而,整个知识图谱的数据处于实时动态更新、变化中,即可通过不断的更新优化,提高用户体验度。在步骤S102中,获取用户输入的语音需求数据,进一步的,用户可通过麦克风等语音服务器输入当前想要设备作出的反馈。在步骤S103中,分析本文档来自技高网...

【技术保护点】
1.一种语音合成方法,其特征在于,包括:获取用户输入的语音需求数据;分析所述语音需求数据,得到用户意图并从该用户意图中提取准意图标签;获取与所述用户意图相关联的文字结果;根据所述准意图标签确定目标意图标签,并从构建的知识图谱中查询与所述目标意图标签相关联的语音集合,所述知识图谱中保存有多个标签以及与各个标签相关联的语音集合;针对获取的文字结果中的每个文字,基于查询的语音集合确定与该文字相关联的语音,并将该文字与确定的语音进行合成。

【技术特征摘要】
1.一种语音合成方法,其特征在于,包括:获取用户输入的语音需求数据;分析所述语音需求数据,得到用户意图并从该用户意图中提取准意图标签;获取与所述用户意图相关联的文字结果;根据所述准意图标签确定目标意图标签,并从构建的知识图谱中查询与所述目标意图标签相关联的语音集合,所述知识图谱中保存有多个标签以及与各个标签相关联的语音集合;针对获取的文字结果中的每个文字,基于查询的语音集合确定与该文字相关联的语音,并将该文字与确定的语音进行合成。2.根据权利要求1所述的语音合成方法,其特征在于:从用户意图中提取准意图标签,包括:从所述用户意图中提取关键词;确定与所述关键词相对应的准意图标签。3.根据权利要求2所述的语音合成方法,其特征在于:所述知识图谱中还保存有标签间的关联关系,具有关联的多个标签形成一个关联分支,根据所述准意图标签确定目标意图标签包括:确定提取的准意图标签的个数;当提取的准意图标签为一个时,确定该准意图标签为所述目标意图标签;当提取的准意图标签为多个时,根据所述知识图谱确定提取的多个准意图标签所属的关联分支,并将处于该关联分支的末端的标签作为所述目标意图标签。4.根据权利要求3所述的语音合成方法,其特征在于:所述标签间的关联关系通过连接标签的路径体现。5.根据权利要求1所述的语音合成方法,其特征在于:还包括构建所述知识图谱,其包括:根据用户所处的多个使用场景,确定与各个使用场景相对应的标签;针对确定的每个标签,确定与该标签相对应的语音集合,所述语音集合包含与该标签相关联的每个文字...

【专利技术属性】
技术研发人员:吴伟贾巨涛黄姿荣秦子宁张伟伟
申请(专利权)人:珠海格力电器股份有限公司珠海联云科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1