电子设备及其控制方法技术

技术编号：28388443 阅读：31 留言：0更新日期：2021-05-08 00:18

电子设备基于正被输入的文本句子获得文本句子的韵律信息，将文本句子分割成多个句子元素，通过将多个句子元素和文本句子的韵律信息输入到文本到语音(TTS)模块来并行获得韵律信息被反映到多个句子元素中的每个句子元素的语音，并且对并行获得的多个句子元素的语音进行合并以输出文本句子的语音。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】电子设备及其控制方法
本公开涉及一种电子设备及其控制方法。更具体地，本公开涉及一种能够实现更自然发声的对话系统的电子设备及其控制方法。
技术介绍
近年来，人工智能(AI)系统已被用于各种领域。与现有的基于规则的智能系统不同，AI系统是机器学习、判断并迭代地改善分析和决策制定的系统。随着AI系统的使用增加，例如，准确度、识别率以及对用户品味的理解或预期可相应地增加。因此，现有的基于规则的智能系统正逐渐被基于深度学习的AI系统取代。AI技术是由机器学习(例如，深度学习)和利用机器学习的基本技术构成的。机器学习是能够对输入数据的特性进行分类或学习的算法技术。元素技术是使用机器学习算法(诸如深度学习)来模拟人脑的功能(诸如识别和判断)的技术。机器学习是由诸如语言理解、视觉理解、推理、预测、知识表示、运动控制等
构成的。实现AI技术的各种领域可包括以下领域。语言理解是用于识别、应用和/或处理人类语言或字符的技术，并且包括自然语言处理、机器翻译、对话系统、问答、语音识别或合成等。视觉理解是用于将对象识别和处理为人类视觉的技术，包括对象识别、对象跟踪、图像搜索、人类识别、场景理解、空间理解、图像增强等。推断预测是用于判断和逻辑地推断和预测信息的技术，包括基于知识和基于概率的推断、优化预测、基于偏好的计划、推荐等。知识表示是用于将人类经验信息自动化为知识数据的技术，包括知识构建(数据生成或分类)、知识管理(数据利用)等。运动控制是用于控制车辆的自主行驶和机器人的运动的技术，包括运动控制(导航、碰撞、驾驶...

【技术保护点】
1.一种电子设备，包括：/n存储器，被配置为存储至少一个指令；以及/n处理器，被配置为执行存储在存储器中的所述至少一个指令，所述至少一个指令在被执行时使处理器进行控制以进行以下操作：/n基于获得文本输入，获得所述文本输入的韵律信息，/n将所述文本输入分割成多个片段，/n通过将所述多个片段和所述韵律信息输入到文本到语音TTS模块来并行地获得语音片段，其中，在语音片段中所述韵律信息被反映到所述多个片段中的每个片段，以及/n通过对语音片段进行合并来获得所述文本输入的语音。/n

【技术特征摘要】
【国外来华专利技术】20190228 KR 10-2019-0024241;20181114 US 62/767,1681.一种电子设备，包括：
存储器，被配置为存储至少一个指令；以及
处理器，被配置为执行存储在存储器中的所述至少一个指令，所述至少一个指令在被执行时使处理器进行控制以进行以下操作：
基于获得文本输入，获得所述文本输入的韵律信息，
将所述文本输入分割成多个片段，
通过将所述多个片段和所述韵律信息输入到文本到语音TTS模块来并行地获得语音片段，其中，在语音片段中所述韵律信息被反映到所述多个片段中的每个片段，以及
通过对语音片段进行合并来获得所述文本输入的语音。

2.根据权利要求1所述的电子设备，其中，处理器在执行所述至少一个指令时还被配置为：
通过基于第一标准分割所述文本输入来获得多个第一片段，并且基于用于将所述多个第一片段转换为语音片段的第一处理时间小于预定时间，将所述多个第一片段输入到TTS模块，
基于用于将所述多个第一片段中的至少一个第一片段转换为语音片段的第一处理时间大于或等于所述预定时间，通过基于第二标准分割所述至少一个第一片段来获得多个第二片段，以及
基于用于将所述多个第二片段转换为语音片段的第二处理时间小于所述预定时间，将所述多个第二片段输入到TTS模块。

3.根据权利要求2所述的电子设备，其中，第一标准包括标点符号标准并且第二标准包括子句标准，或者第一标准包括所述子句标准并且第二标准包括短语标准。

4.根据权利要求1所述的电子设备，其中，所述韵律信息基于所述文本输入的格式、语法结构和上下文中的至少一个包括所述文本输入的语调信息和重音信息。

5.根据权利要求1所述的电子设备，其中，所述多个片段中的每个片段包括与所述文本输入中的顺序相关的索引信息，并且
其中，处理器在执行所述至少一个指令时还被配置为通过基于所述索引信息对语音片段进行合并来获得所述文本输入的语音。

6.根据权利要求1所述的电子设备，其中，TTS模块是深度神经网络文本到语音DNNTTS模块。

7.根据权利要求1所述的电子设备，还包括：
扬声器，
其中，处理器在执行所述至少一个指令时还被配置为控制扬声器输出应答语音并且在所述应答语音之后输出所述文本输入的语音。

8.根据权利要求7所述的电子设备，其中，存储器还被配置为存储多个应答语音，并且
其中，处理器在执行所述至少一个指令时还被配置为：
基于用于获得所述文本输入的语音的处...

【专利技术属性】
技术研发人员：郑锺勋，成昊相，洪斗和，闵庚甫，吴殷美，朱基岘，
申请(专利权)人：三星电子株式会社，
类型：发明
国别省市：韩国;KR

全部详细技术资料下载我是这个专利的主人