一种语音交互方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:27564030 阅读:17 留言:0更新日期:2021-03-09 22:07
本发明专利技术公开了一种语音交互方法、装置、设备及计算机可读存储介质,涉及通信技术领域,以解决具有音箱功能的终端无法在特定场景满足用户高效沟通的需求的问题。该方法包括:接收消息发送方的语音消息;根据所述语音消息,识别所述消息发送方的身份信息;根据所述消息发送方的身份信息、所述语音消息以及预设的用户关系图谱,确定消息接收方;向所述消息接收方输出所述语音消息。本发明专利技术实施例可使得用户可利用具有音箱功能的终端进行高效的沟通。可利用具有音箱功能的终端进行高效的沟通。可利用具有音箱功能的终端进行高效的沟通。

【技术实现步骤摘要】
一种语音交互方法、装置、设备及计算机可读存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种语音交互方法、装置、设备及计算机可读存储介质。

技术介绍

[0002]智能音箱基于人工智能的人机对话,通过语音输入、语义识别、指令执行等,构建闭环的家庭、办公等场景下的智能生态圈。当前智能音箱的主要功能集中在高音质的播放、智能电话、家居控制、声纹识别个性化爱好定制、日常的人机对话查询等功能。但是,目前智能音箱仅作为声音输入-输出的通道,在一些特定的应用场景下,比如人际交互场景中,无法满足用户高效沟通的需求。

技术实现思路

[0003]本专利技术实施例提供一种语音交互方法、装置、设备及计算机可读存储介质,以解决具有音箱功能的终端无法在特定场景满足用户高效沟通的需求的问题。
[0004]第一方面,本专利技术实施例提供了一种语音交互方法,应用于具有音箱功能的终端,包括:
[0005]接收消息发送方的语音消息;
[0006]根据所述语音消息,识别所述消息发送方的身份信息;
[0007]根据所述消息发送方的身份信息、所述语音消息以及预设的用户关系图谱,确定消息接收方;
[0008]向所述消息接收方输出所述语音消息。
[0009]其中,所述根据所述语音消息,识别所述消息发送方的身份信息,包括:
[0010]提取所述语音消息的声纹特征;
[0011]根据所述声纹特征和第一对应关系,识别所述消息发送方的身份信息,其中,所述第一对应关系为声音模型与用户身份之间的对应关系。
[0012]其中,所述根据所述语音消息,识别所述消息发送方的身份信息,包括:
[0013]获取所述消息发送方发送所述语音消息所使用的终端的信息;
[0014]提取所述语音消息的声纹特征;
[0015]根据所述声纹特征、所述终端的信息和第二对应关系,识别所述消息发送方的身份信息,其中,所述第二对应关系为声音模型、终端信息与用户身份之间的对应关系。
[0016]其中,所述根据所述消息发送方的身份信息、所述语音消息以及预设的用户关系图谱,确定消息接收方,包括:
[0017]将所述语音消息转换为文字消息;
[0018]基于NLP(Natural Language Processing,自然语言处理)算法,对所述文字消息进行语义识别,获得语义识别结果;
[0019]根据所述消息发送方的身份信息、所述语义识别结果以及所述用户关系图谱,确
定消息接收方。
[0020]其中,所述向所述消息接收方输出所述语音消息,包括:
[0021]获取所述消息接收方的声音模型;
[0022]将所述语音消息和所述声音模型进行合成,得到合成后的语音消息;
[0023]利用所述音箱向所述消息接收方广播所述合成后的语音消息。
[0024]其中,在所述得到合成后的语音消息之后,所述方法还包括:
[0025]缓存所述合成后的语音消息。
[0026]其中,在所述接收消息发送方的语音消息之前,所述方法还包括以下至少一项:
[0027]建立第一对应关系或第二对应关系,其中,所述第一对应关系为声音模型与用户身份之间的对应关系,所述第二对应关系为声音模型、终端信息与用户身份之间的对应关系;
[0028]基于知识图谱算法构建用户关系图谱。
[0029]第二方面,本专利技术实施例提供了一种语音交互装置,应用于具有音箱功能的终端,包括:
[0030]接收模块,用于接收消息发送方的语音消息;
[0031]识别模块,用于根据所述语音消息,识别所述消息发送方的身份信息;
[0032]确定模块,用于根据所述消息发送方的身份信息、所述语音消息以及预设的用户关系图谱,确定消息接收方;
[0033]输出模块,用于向所述消息接收方输出所述语音消息。
[0034]其中,所述识别模块包括:
[0035]第一提取子模块,用于提取所述语音消息的声纹特征;
[0036]第一识别子模块,用于根据所述声纹特征和第一对应关系,识别所述消息发送方的身份信息,其中,所述第一对应关系为声音模型与用户身份之间的对应关系。
[0037]其中,所述识别模块包括:
[0038]第一获取子模块,用于获取所述消息发送方发送所述语音消息所使用的终端的信息;
[0039]第二提取子模块,用于提取所述语音消息的声纹特征;
[0040]第二识别子模块,用于根据所述声纹特征、所述终端的信息和第二对应关系,识别所述消息发送方的身份信息,其中,所述第二对应关系为声音模型、终端信息与用户身份之间的对应关系。
[0041]其中,所述确定模块包括:
[0042]转换子模块,用于将所述语音消息转换为文字消息;
[0043]识别子模块,用于基于NLP算法,对所述文字消息进行语义识别,获得语义识别结果;
[0044]确定子模块,用于根据所述消息发送方的身份信息、所述语义识别结果以及所述用户关系图谱,确定消息接收方。
[0045]其中,所述输出模块包括:
[0046]获取子模块,用于获取所述消息接收方的声音模型;
[0047]合成子模块,用于将所述语音消息和所述声音模型进行合成,得到合成后的语音
消息;
[0048]输出子模块,用于利用所述音箱向所述消息接收方广播所述合成后的语音消息。
[0049]其中,所述输出模块还包括:
[0050]缓存子模块,用于缓存所述合成后的语音消息。
[0051]其中,所述装置还包括设置模块,用于执行以下至少一项:
[0052]建立第一对应关系或第二对应关系,其中,所述第一对应关系为声音模型与用户身份之间的对应关系,所述第二对应关系为声音模型、终端信息与用户身份之间的对应关系;
[0053]基于知识图谱算法构建用户关系图谱。
[0054]第三方面,本专利技术实施例提供了一种通信设备,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序;
[0055]所述处理器,用于读取存储器中的程序实现如第一方面所述的方法中的步骤。
[0056]第四方面,本专利技术实施例提供了一种语音交互装置,应用于具有音箱功能的终端,包括:处理器和收发器;
[0057]其中,所述收发器用于,接收消息发送方的语音消息;
[0058]所述处理器用于,根据所述语音消息,识别所述消息发送方的身份信息;根据所述消息发送方的身份信息、所述语音消息以及预设的用户关系图谱,确定消息接收方;
[0059]所述收发器用于,向所述消息接收方输出所述语音消息。
[0060]其中,所述处理器还用于,提取所述语音消息的声纹特征;根据所述声纹特征和第一对应关系,识别所述消息发送方的身份信息,其中,所述第一对应关系为声音模型与用户身份之间的对应关系。
[0061]其中本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语音交互方法,应用于具有音箱功能的终端,其特征在于,包括:接收消息发送方的语音消息;根据所述语音消息,识别所述消息发送方的身份信息;根据所述消息发送方的身份信息、所述语音消息以及预设的用户关系图谱,确定消息接收方;向所述消息接收方输出所述语音消息。2.根据权利要求1所述的方法,其特征在于,所述根据所述语音消息,识别所述消息发送方的身份信息,包括:提取所述语音消息的声纹特征;根据所述声纹特征和第一对应关系,识别所述消息发送方的身份信息,其中,所述第一对应关系为声音模型与用户身份之间的对应关系。3.根据权利要求1所述的方法,其特征在于,所述根据所述语音消息,识别所述消息发送方的身份信息,包括:获取所述消息发送方发送所述语音消息所使用的终端的信息;提取所述语音消息的声纹特征;根据所述声纹特征、所述终端的信息和第二对应关系,识别所述消息发送方的身份信息,其中,所述第二对应关系为声音模型、终端信息与用户身份之间的对应关系。4.根据权利要求1所述的方法,其特征在于,所述根据所述消息发送方的身份信息、所述语音消息以及预设的用户关系图谱,确定消息接收方,包括:将所述语音消息转换为文字消息;基于自然语言处理NLP算法,对所述文字消息进行语义识别,获得语义识别结果;根据所述消息发送方的身份信息、所述语义识别结果以及所述用户关系图谱,确定消息接收方。5.根据权利要求1所述的方法,其特征在于,所述向所述消息接收方输出所述语音消息,包括:获取所述消息接收方的声音模型;将所述语音消息和所述声音模型进行合成,得到合成后的语音消息;利用所述音箱向所述消息接收方广播所述合成后的语音消息。6.根据权利...

【专利技术属性】
技术研发人员:马建华李青懋
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1