用于智能语音设备的方法、装置、设备和介质制造方法及图纸

技术编号：31911932 阅读：11 留言：0更新日期：2022-01-15 12:52

本公开提供了一种用于智能语音设备的方法、装置、设备和介质，涉及计算机技术领域，尤其涉及人工智能和语音技术。实现方案为：基于用户的生物特征，确定用户的年龄区间；基于年龄区间，选择预设的第一语速参数用于播报语音；响应于识别出用户的身份，基于用户的历史语速记录，调整第一语速参数，以确定第二语速参数，其中，历史语速记录包括智能语音设备在与用户的至少一次交互中，从用户的声纹特征中提取的特定于用户的语速参数；以及基于第二语速参数播报语音。速参数播报语音。速参数播报语音。

全部详细技术资料下载

【技术实现步骤摘要】
用于智能语音设备的方法、装置、设备和介质

[0001]本公开涉及计算机
，尤其涉及人工智能和语音技术，具体涉及一种用于智能语音设备的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。

技术介绍

[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]语音合成，又称文语转换(Text to Speech，TTS)技术，它是将计算机自己产生的、或外部输入的文字信息转变为可以听得懂的、流利的汉语口语输出的技术。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明，否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似地，除非另有指明，否则此部分中提及的问题不应认为在任何现有技术中已被公认。

技术实现思路

[0005]本公开提供了一种用于智能语音设备的方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
[0006]根据本公开的一方面，提供了一种用于智能语音设备的方法，包括：基于用户的生物特征，确定用户的年龄区间；基于年龄区间，选择预设的第一语速参数用于播报语音；响应于识别出用户的身份，基于用户...

【技术保护点】

【技术特征摘要】
1.一种用于智能语音设备的方法，包括：基于用户的生物特征，确定所述用户的年龄区间；基于所述年龄区间，选择预设的第一语速参数用于播报语音；响应于识别出所述用户的身份，基于所述用户的历史语速记录，调整所述第一语速参数，以确定第二语速参数，其中，所述历史语速记录包括所述智能语音设备在与所述用户的至少一次交互中，从所述用户的声纹特征中提取的特定于所述用户的语速参数；以及基于所述第二语速参数播报语音。2.根据权利要求1所述的方法，其中，所述生物特征包括所述用户的人脸特征和声纹特征。3.根据权利要求2所述的方法，其中，基于所述用户的生物特征，确定所述用户的所述年龄区间包括：基于所述用户的所述人脸特征，确定所述用户的第一预测年龄；基于所述用户的所述声纹特征，确定所述用户的第二预测年龄；响应于所述第一预测年龄与所述第二预测年龄的差值不超过第一阈值，确定所述用户的年龄为所述第一预测年龄；响应于所述第一预测年龄与所述第二预测年龄的差值超过第一阈值，确定所述用户的年龄为所述第二预测年龄；以及基于所确定的所述用户的年龄，确定所述用户的所述年龄区间。4.根据权利要求1至3中任一项所述的方法，其中，所述响应于识别出所述用户的身份，基于所述用户的历史语速记录，调整所述第一语速参数包括：响应于识别出所述用户的身份，读取所述用户的至少一个历史语速记录；对所述至少一个历史语速记录进行正态分布拟合，以计算所述至少一个历史语速记录的正态分布均值；以及基于所述正态分布均值，调整所述第一语速参数。5.根据权利要求4所述的方法，还包括：基于所述用户对于播放语速的设置记录值，调整所述第一语速参数。6.根据权利要求5所述的方法，其中，所述调整所述第一语速参数，以确定第二语速参数包括：计算所述正态分布均值、所述设置记录值以及所述第一语速参数的加权平均值，以确定第三语速参数；以及基于所述第三语速参数，确定所述第二语速参数。7.根据权利要求6所述的方法，其中，所述基于所述第三语速参数，确定所述第二语速参数包括：响应于所述第三语速参数与所述设置记录值的差值不超过第二阈值，将所述第三语速参数确定为所述第二语速参数；以及响应于所述第三语速参数与所述设置记录值的差值超过第二阈值，将所述设置记录值确定为所述第二语速参数。8.根据权利要求1至3中任一项所述的方法，还包括：基于待播报内容的内容类别，调整所述第一语速参数。
9.一种用于智能语音设备的装置，包括：第一确定单元，被配置为基于用户的生物特征，确定所述用户的年龄区间；选择单元，被配置为基于所述年龄区间，选择预设的第一语速参数用于播报语音；第一调整单元，被配置为响应于识别出所述用户的身份，基于所述用户的历史语速记录，调整所述第一语速参数，其中，所述历史语速记录包括所述智能语音设备在与所述用户的至少一次交互中，从所述用户的声纹特征中提取的特定于所述用户的语速参数，以确定第二语速参数；以及播报单元，被配置为基于所述第二语速参数播报语音。10.根据权利要求9所述的装置，其中，所述生物特征包括所述用户的人脸特征和声纹特...

【专利技术属性】
技术研发人员：王国旭，金鹿，米雪，夏伟，薛军涛，蒋祥涛，贾振超，
申请(专利权)人：上海小度技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人