语音交流方法及装置制造方法及图纸

技术编号：24097226 阅读：30 留言：0更新日期：2020-05-09 11:00

本发明专利技术公开了一种语音交流方法及装置。其中，该方法包括：接收语音信息；根据应答模型确定语音信息的应答信息，其中，应答模型为使用多组训练数据，通过机器学习训练得出的，多组训练数据中的每组数据均包括：语音信息和语音信息对应的应答信息；获取多个语料库，其中，语料库用于获取组成应答信息的特征词；从多个语料库中选取不同的特征词替换组成应答信息的特征词。本发明专利技术解决了相关技术中由于自然语言生成过中出现的过拟合现象导致语音识别效果差的技术问题。

Voice communication methods and devices

全部详细技术资料下载

【技术实现步骤摘要】
语音交流方法及装置
本专利技术涉及语音处理领域，具体而言，涉及一种语音交流方法及装置。
技术介绍
目前，深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据，例如图像信息，文本信息和自然语言信息等。在智能家电中，以扫地机器人为例，扫地机器人的应用逐步广泛，现有对扫地机器人的控制多是基于机身按钮或遥控器进行控制，但遥控器易丢，扫地机器人体积较小，成人操作时需弯腰下蹲，极其不便。故语音控制在智能家电上的应用极为迫切。在语音识别中，最容易出现的问题是自然语言生成中出现的过拟合现象，由于语言中表达的多样性，同样的语言文字在说话时不同的表达顺序，以及停顿时间不同等，都会使得最终表达的意思不一样。而在现有技术中，对上述语音进行识别中采用统一化处理，并不能得到合理且具有区分性的词语，有时候还可能引起语句不通顺等，进而会导致语音识别效果不佳。针对上述的问题，目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种语音交流方...

【技术保护点】
1.一种语音交流方法，其特征在于，包括：/n接收语音信息；/n根据应答模型确定所述语音信息的应答信息，其中，所述应答模型为使用多组训练数据，通过机器学习训练得出的，所述多组训练数据中的每组数据均包括：语音信息和所述语音信息对应的应答信息；/n获取多个语料库，其中，所述语料库用于获取组成应答信息的特征词；/n从多个所述语料库中选取不同的特征词替换组成所述应答信息的特征词。/n

【技术特征摘要】
1.一种语音交流方法，其特征在于，包括：
接收语音信息；
根据应答模型确定所述语音信息的应答信息，其中，所述应答模型为使用多组训练数据，通过机器学习训练得出的，所述多组训练数据中的每组数据均包括：语音信息和所述语音信息对应的应答信息；
获取多个语料库，其中，所述语料库用于获取组成应答信息的特征词；
从多个所述语料库中选取不同的特征词替换组成所述应答信息的特征词。

2.根据权利要求1所述的方法，其特征在于，所述语料库的数量为两个，两个所述语料库包括：第一语料库和第二语料库。

3.根据权利要求1所述的方法，其特征在于，从多个所述语料库中选取不同的特征词替换组成所述应答信息的特征词之前包括：
判断所述应答信息中的特征词之间的合理性；
在合理性低于合理阈值的情况下，从多个所述语料库中选取不同的特征词替换组成所述应答信息的特征词。

4.根据权利要求3所述的方法，其特征在于，从多个所述语料库中选取不同的特征词替换组成所述应答信息的特征词包括：
确定所述应答信息中需要进行替换的第一特征词；
从所述语料库中选取对应的第二特征词；
将所述应答信息中的第一特征词替换为第二特征词。

5.根据权利要求4所述的方法，其特征在于，将所述应答信息中的第一特征词替换为第二特征词之后包括：
对替换后的应答信...

【专利技术属性】
技术研发人员：吴少波，易斌，连园园，覃广志，
申请(专利权)人：珠海格力电器股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人