基于智能机器的网络直播方法、装置、设备及存储介质制造方法及图纸

技术编号：34796301 阅读：31 留言：0更新日期：2022-09-03 20:01

本发明专利技术涉及语音语义领域，揭露一种基于智能机器的网络直播方法、装置、设备以及存储介质，包括：接收直播指令及直播文本，并基于所述直播指令创建直播间，利用预设的语音合成模型将所述直播文本转换为直播语音，并通过智能机器人在所述直播间输出所述直播语音，解析所述直播指令，得到直播规则，并根据所述直播规则，在预设时间之后切换直播运作模式，进入互动环节，在所述互动环节中，读取所述直播间中的弹幕信息，利用预设的语义分析模型及互动知识库对所述弹幕信息进行解析匹配，生成回答内容，利用所述语音合成模型将所述回答内容转换为回复语音，并通过所述智能机器人在所述直播间输出所述回复语音。本发明专利技术可以提高网络直播的效率。效率。效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于智能机器的网络直播方法、装置、设备及存储介质

[0001]本专利技术涉及语音语义领域，尤其涉及一种基于智能机器的网络直播方法、装置、设备及存储介质。

技术介绍

[0002]随着科技的发展，一些企业都开始涉足直播行业，例如直播带货等。
[0003]目前常见的直播模式都是人为进行直播，缺少智能化，需要付出较高的人工成本，且在急需进行一场直播时，常常由于人手不够，导致直播无法正常进行，从而降低了直播的效率。

技术实现思路

[0004]本专利技术提供一种基于智能机器的网络直播方法、装置、设备及存储介质，其目的在于提高网络直播的效率。
[0005]为实现上述目的，本专利技术提供的一种基于智能机器的网络直播方法，包括：
[0006]接收直播指令及直播文本，并基于所述直播指令创建直播间；
[0007]利用预设的语音合成模型将所述直播文本转换为直播语音，并通过智能机器人在所述直播间输出所述直播语音；
[0008]解析所述直播指令，得到直播规则，并根据所述直播规则，在预设时间之后切换...

【技术保护点】

【技术特征摘要】
1.一种基于智能机器的网络直播方法，其特征在于，所述方法包括：接收直播指令及直播文本，并基于所述直播指令创建直播间；利用预设的语音合成模型将所述直播文本转换为直播语音，并通过智能机器人在所述直播间输出所述直播语音；解析所述直播指令，得到直播规则，并根据所述直播规则，在预设时间之后切换直播运作模式，进入互动环节；在所述互动环节中，读取所述直播间中的弹幕信息，利用预设的语义分析模型及互动知识库对所述弹幕信息进行解析匹配，生成回答内容；利用所述语音合成模型将所述回答内容转换为回复语音，并通过所述智能机器人在所述直播间输出所述回复语音。2.如权利要求1所述的基于智能机器的网络直播方法，其特征在于，所述利用预设的语音合成模型将所述直播文本转换为直播语音，包括：对所述直播文本进行音素转换，得到音素序列；利用所述语音合成模型的编码器、解码器及残差网络依次对所述音素序列进行频谱处理，得到目标梅尔频谱；利用所述语音合成模型的WaveGlow声码器对所述目标梅尔频谱进行并行音频转换，得到直播语音。3.如权利要求2所述的基于智能机器的网络直播方法，其特征在于，所述对所述直播文本进行音素转换，得到音素序列，包括：对所述直播文本进行语句切分处理，得到切分语句文本；根据预设的文本格式规则，将所述切分语句文本中的非文字转化为文字；对所述切分语句文本进行分词处理，得到分词文本；根据预设的文字音素映射词典，对所述分词文本进行映射，得到音素；对所述音素进行向量转化，得到音素向量；按照文本顺序对所述音素向量进行编码排序，得到音素序列。4.如权利要求2所述的基于智能机器的网络直播方法，其特征在于，所述利用所述语音合成模型的编码器、解码器及残差网络依次对所述音素序列进行频谱处理，得到目标梅尔频谱，包括：利用所述编码器对所述音素序列进行上下文特征提取，得到隐藏特征矩阵；根据所述隐藏特征矩阵，利用所述解码器对所述训练文本的梅尔频谱进行预测，得到预测梅尔频谱；利用所述残差网络对所述预测梅尔频谱进行残差连接，得到目标梅尔频谱。5.如权利要求2所述的基于智能机器的网络直播方法，其特征在于，所述利用所述语音合成模型的WaveGlow声码器对所述目标梅尔频谱进行并行音频转换，得到直播语音，包括：利用所述WaveGlow声码器对所述目标梅尔频谱进行并行语音波形转换，得到语音波形...

【专利技术属性】
技术研发人员：余刚盛，
申请(专利权)人：未鲲上海科技服务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人