人机语音交互方法及系统技术方案

技术编号:11281255 阅读:77 留言:0更新日期:2015-04-09 14:54
本发明专利技术公开了一种人机语音交互方法及系统,通过采集用户的语音信息,分析语音信息得出语言类型,对语音信息采用与语言类型对应的识别模式进行识别,将该语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息,再将识别的语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息;当得到的上述两种信息存在关联时,则将两种信息同步输出。通过上述人机语音交互方法,可识别多种语言的语音,实现多种语言的交互,且同时实现视频与语音的同步回应,使客户体验感更强,且通过判断反馈语音信息与反馈视频信息的关联性,实现反馈语音信息与反馈视频信息的一致性,提高交互准确率,且声音和画面更加的协调与同步。

【技术实现步骤摘要】
【专利摘要】本专利技术公开了一种人机语音交互方法及系统,通过采集用户的语音信息,分析语音信息得出语言类型,对语音信息采用与语言类型对应的识别模式进行识别,将该语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息,再将识别的语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息;当得到的上述两种信息存在关联时,则将两种信息同步输出。通过上述人机语音交互方法,可识别多种语言的语音,实现多种语言的交互,且同时实现视频与语音的同步回应,使客户体验感更强,且通过判断反馈语音信息与反馈视频信息的关联性,实现反馈语音信息与反馈视频信息的一致性,提高交互准确率,且声音和画面更加的协调与同步。【专利说明】人机语音交互方法及系统
本专利技术涉及电子产品
,特别是涉及人机语音交互方法及系统。
技术介绍
随着科技的进步,数字文化馆内的电子产品越来越多,也越来越智能化,人机语音交互产品就是其中一个。人机语音交互系统可以为参观的客户提供有效的人机交互功能,通过语音与机器进行交流,让机器明白人说的是什么,并给出相应的回答。例如,通过人机语音交互系统获取数字文化馆内的相关产品的介绍以及相关功能,也可通过人机语音交互系统为客户指引路径,告诉客户想要去的地方的路线等功能。 然而,现有的人机语音交互方法及系统只是通过采集语音信息,然后对语音信息进行识别,再通过该语音信息调取数据库中预先存储的语音回应信息并输出,对用户的问题进行解答,实现人机语音交互。这种人机语音交互系统功能单一,交互准确性比较低。
技术实现思路
基于此,有必要针对现有的人机语音交互方法及系统的交互准确性较低的问题,提供一种人机语音交互方法及系统。 一种人机语音交互方法,包括以下步骤: 采集用户的语音信息; 对所述语音信息进行分析,得出所述语音信息所对应的语言类型; 对所述语音信息采用与所述语言类型对应的识别模式进行识别; 将识别的所述语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的所述反馈语音信息; 将识别的所述语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的所述反馈视频信息; 判断匹配的所述反馈语音信息与匹配的所述反馈视频信息是否存在关联; 若匹配的所述反馈语音信息与匹配的所述反馈视频信息存在关联; 则将匹配的所述反馈语音信息与匹配的所述反馈视频信息同步输出; 显示所述反馈视频信息。 本专利技术还公开一种人机语音交互系统,包括: 采集模块,用于采集用户的语音信息; 语音分析模块,用于对所述语音信息进行分析,得出所述语音信息所对应的语言类型; 语音识别模块,用于对所述语音信息采用与所述语言类型对应的识别模式进行识别; 第一匹配模块,用于将识别的所述语音信息与预先存储的反馈语音信息进行检索匹配; 第二匹配模块,用于将识别的所述语音信息与预先存储的反馈视频信息进行检索匹配; 关联判断模块,用于判断匹配的所述反馈语音信息与匹配的所述反馈视频信息是否存在关联; 输出模块,用于将匹配的所述反馈语音信息与匹配的所述反馈视频信息同步输出; 显示模块,用于显示所述反馈视频信息。 上述人机语音交互方法及系统,通过不同的识别模式对不同语言的语音信息进行识别,再将识别的语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息,再将识别的语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息;当匹配的反馈语音信息与匹配的反馈视频信息存在关联时,则将这两种信息同步输出。通过上述人机语音交互方法,可识别多种语言的语音,实现多种语言的交互,且同时实现视频与语音的同步输出,使客户体验感更强,且通过判断反馈语音信息与反馈视频信息的关联性,实现反馈语音信息与反馈视频信息的一致性,提高交互准确率,提高声音和画面的协调性。 【专利附图】【附图说明】 图1为一种实施方式的人机语音交互方法的流程图; 图2为一种实施方式的人机语音交互系统的模块图; 图3为另一实施方式的人机语音交互系统中的结构子模块图。 【具体实施方式】 为了使本专利技术的目的、技术方案和优点更加清楚明了,以下根据附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不限定本专利技术。 请参考参阅1,一种人机语音交互方法,包括以下步骤: SlOO:采集用户的语音信息。 只有通过采集到用户的语音信息,才能根据用户的语音信息进行后续相应的处理,整个系统是以用户的语音信息为依据,为用户提供相应的回应,实现人机语音交互。 S200:对语音信息进行分析,得出语音信息所对应的语言类型。 不同的用户可能采用不同的语言方式进行交互,即采用不同的语种进行交互,例如,采用中文、英文或其他语种,则采集的用户语音信息包括多种语言的语音信息,若对不同语言类型的语音信息均采用同样的识别模式进行识别,则识别错误率会较高,所以首先需要分析采集的用户语音信息的语言类型。 S300:对语音信息采用与语言类型对应的识别模式进行识别。 分析得出用户的语音信息的语言类型后,需要选择与语言类型对应的识别模式对语音信息进行识别,多种识别模式预先设置的。例如,分析得到用户的语音信息的语音类型为中文,则采用对应的中文识别模式对语音信息进行识别;分析得到用户的语音信息的语音类型为英文,则采用对应的英文识别模式对语音信息进行识别。这样采用对应的识别模式对不同语言类型的语音信息进行识别,可提高识别准确性。 S400:将识别的语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的反馈语音信息。 在数据库中预先存储了反馈语音信息,当语音信息经过识别后,将其与预先存储的反馈语音信息进行检索匹配,得到与用户的语音信息相对应的反馈语音信息。例如,数据库中预先存储了数字文化馆内肉眼3D电视机的功能介绍语音信息,用户询问的语音信息是需要知道肉眼3D电视机的相关信息,通过检索匹配,可以得到与用户的语音信息相对应的反馈语音信息,即肉眼3D电视机的功能介绍语音信息。 S500:将识别的语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的反馈视频信息。 同样的,在数据库中预先存储了反馈视频信息,当语音信息经过识别后,将其与预先存储的反馈视频信息进行检索匹配,得到与用户的语音信息相对应的反馈视频信息。例如,数据库中预先存储了数字文化馆内关于肉眼3D电视机的视频信息,用户询问的语音信息是需要知道肉眼3D电视机的相关信息,通过检索匹配,可以得到与用户的语音信息相对应的反馈视频信息,即肉眼3D电视机的视频信息。 S600:判断匹配的反馈语音信息与匹配的反馈视频信息是否存在关联。 在数据库中预先存储了反馈语音信息与反馈视频信息的关联关系,例如,预先存储了 3D电视机功能介绍语音信息和关于3D电视机的视频信息的关联,这种关联关系可以是多对多的,即多个语音信息可关联到多个视频信息,一个语音信息可关联多个视频信息,一个视频信息可关联到多个语音信息。 若匹配的反馈语音信息与匹配的反馈视频信息存在关联,则执行以下步骤: S700:将匹配的反馈语音信息与匹配的反馈视频信息同步输出。 S800:显示反馈视频信息。本文档来自技高网...

【技术保护点】
一种人机语音交互方法,其特征在于,包括以下步骤:采集用户的语音信息;对所述语音信息进行分析,得出所述语音信息所对应的语言类型;对所述语音信息采用与所述语言类型对应的识别模式进行识别;将识别的所述语音信息与预先存储的反馈语音信息进行检索匹配,得到匹配的所述反馈语音信息;将识别的所述语音信息与预先存储的反馈视频信息进行检索匹配,得到匹配的所述反馈视频信息;判断匹配的所述反馈语音信息与匹配的所述反馈视频信息是否存在关联;若匹配的所述反馈语音信息与匹配的所述反馈视频信息存在关联;则将匹配的所述反馈语音信息与匹配的所述反馈视频信息同步输出;显示所述反馈视频信息。

【技术特征摘要】

【专利技术属性】
技术研发人员:周新华王小兰
申请(专利权)人:湖南华凯文化创意股份有限公司
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1