智能辅助机器人交互方法、系统、电子设备及存储介质技术方案

技术编号:29407515 阅读:16 留言:0更新日期:2021-07-23 22:47
本发明专利技术提供一种智能辅助机器人交互方法、系统、电子设备及存储介质。方法包括:智能辅助机器人接收用户的语音信息;智能辅助机器人根据接收的所述语音信息进行自动语音识别,得到对应的文字信息;智能辅助机器人对所述文字信息进行自然语言处理,将所述文字信息转换为结构化的语言;根据所述结构化的语言,智能辅助机器人从预设数据库中提取回答文本信息;智能辅助机器人将所述回答文本信息转换成语音,从智能辅助机器人的音响设备播放出去。系统包括:接收模块、语音识别模块、自然语言处理模块、文本提取模块、语音转换播放模块。本申请流程上减低繁琐性,方法简单、效率高。

【技术实现步骤摘要】
智能辅助机器人交互方法、系统、电子设备及存储介质
本专利技术属于机器人语音交互
,尤其涉及一种智能辅助机器人交互方法、系统、电子设备及存储介质。
技术介绍
我国已经进入老龄化社会,越来越多的养老陪伴的产品进入市场,其中近年来用于养老陪护的机器人产品受到越来越多人的关注。目前需要一种养老陪护智能辅助机器人交互方法。因此为丰富相关领域的算法研究,设计了该养老陪护智能辅助机器人交互方法。目前如专利申请号CN112562685.A提供一种服务机器人的语音交互方法和装置,专利申请CN202011210092.8提供一种基于智能交互系统的情感陪护智能机器人,专利申请CN202011190277.7提供一种机器人的语音交互处理方法及机器人。从以上专利申请中可以看出大多数交互方法,存在过程繁琐且耦合性强,整个交互过程的便利性有待进一步提高。针对机器人与用户进行交互过程的服务体验差,算法复杂的问题,设计了一种智能辅助机器人交互方法、系统、电子设备及存储介质。
技术实现思路
基于以上技术不足,本申请提供一种智能辅助机器人交互方法、系统、电子设备及存储介质。第一方面,本申请提出一种智能辅助机器人交互方法,包括如下步骤:智能辅助机器人接收用户的语音信息;智能辅助机器人根据接收的所述语音信息进行自动语音识别,得到对应的文字信息;智能辅助机器人对所述文字信息进行自然语言处理,将所述文字信息转换为结构化的语言;根据所述结构化的语言,智能辅助机器人从预设数据库中提取回答文本信息;智能辅助机器人将所述回答文本信息转换成语音,从智能辅助机器人的音响设备播放出去。所述智能辅助机器人接收用户的语音信息,包括:当接收到的语音信息中包含设定的激活词信息,则智能辅助机器人启动交互功能。所述自动语音识别,即对采集到的所述语音信息进行音频数据处理,包括如下步骤:对所述语音信息分别进行滤波处理、分帧处理;针对处理后的语音信息,将其时域信息转换到频域信息,把每一帧波形变成一个多维特征向量;根据声学特性计算每一个所述特征向量在声学特征上的得分;根据语言学模型计算所述语音信息对应可能词组序列的概率;最后根据已有的字典,对词组序列进行解码,得到对应的文字信息。所述智能辅助机器人将所述回答文本信息转换成语音,包括如下步骤:预设智能辅助机器人语音播报声纹信息;对所述对应的文字信息进行编码,并结合声纹信息进行拼接处理;通过注意力机制模型进行解码,得到解码信息;将所述解码信息输出到所述智能辅助机器人的声码器;所述声码器根据解码后的信息生成声音波形。第二方面,本申请提出一种智能辅助机器人交互系统,包括:接收模块、语音识别模块、自然语言处理模块、文本提取模块、语音转换播放模块;所述接收模块、语音识别模块、自然语言处理模块、文本提取模块、语音转换播放模块依次顺序相连接;所述接收模块,用于接收用户的语音信息;语音识别模块,用于根据接收的所述语音信息进行自动语音识别,得到对应的文字信息;自然语言处理模块,用于对所述文字信息进行自然语言处理,将所述文字信息转换为结构化的语言;文本提取模块,用于根据所述结构化的语言,智能辅助机器人从预设数据库中提取回答文本信息;语音转换播放模块,用于将所述回答文本信息转换成语音,从智能辅助机器人的音响设备播放出去。第三方面,本申请提出一种电子设备,包括:一个或多个处理器;存储器;一个或多个应用程序,其被存储在所述存储器中并被配置为由所述一个或多个处理器加载和运行以便第一方面所述的智能辅助机器人交互方法。第四方面,本申请提出一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面或者第一方面任一可能的实现方式所述的智能辅助机器人交互方法。有益技术效果:与现有技术相比,本专利技术的优点在于:该交互算法将语音处理过程进一步优化,流程上减低繁琐性,方法简单、效率高。附图说明图1为本申请实施例的一种智能辅助机器人交互方法示意图;图2为本申请实施例的一种智能辅助机器人交互系统原理框图;图3为本申请实施例的一种电子设备示意图。具体实施方式这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。下面将结合附图和实例对本专利技术作进一步的详细说明。本申请提供一种智能辅助机器人交互方法、系统、电子设备及存储介质。第一方面,本申请提出一种智能辅助机器人交互方法,如图1所示,包括如下步骤:步骤S1:智能辅助机器人接收用户的语音信息;步骤S2:智能辅助机器人根据接收的所述语音信息进行自动语音识别,得到对应的文字信息;所述自动语音识别,将声学语音进行分析,得到对应的文字信息。步骤S3:智能辅助机器人对所述文字信息进行自然语言处理,将所述文字信息转换为结构化的语言;步骤S4:根据所述结构化的语言,智能辅助机器人从预设数据库中提取回答文本信息;步骤S5:智能辅助机器人将所述回答文本信息转换成语音,从智能辅助机器人的音响设备播放出去。所述智能辅助机器人接收用户的语音信息,包括:当接收到的语音信息中包含设定的激活词信息,则智能辅助机器人启动交互功能。所述自动语音识别,即对采集到的所述语音信息进行音频数据处理,包括如下步骤:对所述语音信息分别进行滤波处理、分帧处理;针对处理后的语音信息,将其时域信息转换到频域信息,把每一帧波形变成一个多维特征向量;根据声学特性计算每一个所述特征向量在声学特征上的得分;根据语言学模型计算所述语音信息对应可能词组序列的概率;语音学模型包括很多中经典模型,均属于本申请中的保护范围,本实施例采用的语音学模型是利用语音识别领域经典的隐马尔可夫模型(HMM)。在语音识别中,隐藏的马尔可夫模型用于对子词级别(例如英语音素)的声学观察(特征向量)建模。通常为每个音素建模3个状态,分别对音素的开头,中间和结尾进行建模。隐马尔可夫模型从左向右单向、带自环、带跨越的拓扑结构来对识别基元建模,一个音素就是一个三状态的HMM,一个词就是构成词的多个音素的HMM串行起来构成的HMM,而连续语音识别的整本文档来自技高网...

【技术保护点】
1.一种智能辅助机器人交互方法,其特征在于,包括如下步骤:/n智能辅助机器人接收用户的语音信息;/n智能辅助机器人根据接收的所述语音信息进行自动语音识别,得到对应的文字信息;/n智能辅助机器人对所述文字信息进行自然语言处理,将所述文字信息转换为结构化的语言;/n根据所述结构化的语言,智能辅助机器人从预设数据库中提取回答文本信息;/n智能辅助机器人将所述回答文本信息转换成语音,从智能辅助机器人的音响设备播放出去。/n

【技术特征摘要】
1.一种智能辅助机器人交互方法,其特征在于,包括如下步骤:
智能辅助机器人接收用户的语音信息;
智能辅助机器人根据接收的所述语音信息进行自动语音识别,得到对应的文字信息;
智能辅助机器人对所述文字信息进行自然语言处理,将所述文字信息转换为结构化的语言;
根据所述结构化的语言,智能辅助机器人从预设数据库中提取回答文本信息;
智能辅助机器人将所述回答文本信息转换成语音,从智能辅助机器人的音响设备播放出去。


2.根据权利要求1所述智能辅助机器人交互方法,其特征在于,所述智能辅助机器人接收用户的语音信息,包括:当接收到的语音信息中包含设定的激活词信息,则智能辅助机器人启动交互功能。


3.根据权利要求1所述智能辅助机器人交互方法,其特征在于,所述自动语音识别,即对采集到的所述语音信息进行音频数据处理,包括如下步骤:
对所述语音信息分别进行滤波处理、分帧处理;
针对处理后的语音信息,将其时域信息转换到频域信息,把每一帧波形变成一个多维特征向量;
根据声学特性计算每一个所述特征向量在声学特征上的得分;
根据语言学模型计算所述语音信息对应可能词组序列的概率;
最后根据已有的字典,对词组序列进行解码,得到对应的文字信息。


4.根据权利要求1所述智能辅助机器人交互方法,其特征在于,所述智能辅助机器人将所述回答文本信息转换成语音,包括如下步骤:
预设智能辅助机器人语音播报声纹信息;

【专利技术属性】
技术研发人员:吴新开霍向马亚龙
申请(专利权)人:北京洛必德科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1