人机交互装置及方法制造方法及图纸

技术编号:34407644 阅读:91 留言:0更新日期:2022-08-03 21:55
本发明专利技术提供了一种人机交互装置及方法,属于人机交互技术领域。人机交互装置包括:服务器,用于获取用户输入的音频数据,对所述音频数据进行语音识别,得到文本数据,对所述文本数据进行解析,得到关键词组合;确定与所述关键词组合匹配的页面信息,将所述页面信息发送给显示屏;显示屏,用于根据所述页面信息显示对应的页面。本发明专利技术的技术方案能够提升人机交互效率,改善用户体验。改善用户体验。改善用户体验。

【技术实现步骤摘要】
人机交互装置及方法


[0001]本专利技术涉及人机交互
,特别是指一种人机交互装置及方法。

技术介绍

[0002]相关技术中,与尺寸较大的显示设备进行人机交互时,有以下两种技术方案:
[0003]技术方案1、通过鼠标点击显示设备的显示界面上的菜单按钮进行交互;
[0004]技术方案2、通过与显示设备关联的控制设备上的功能按钮进行交互。
[0005]以上2种技术方案,在进行人机交互时都存在缺陷,对于技术方案1,如果显示界面的尺寸过大,用鼠标点击时需要跨越的区域比较远,操作体验较差;对于技术方案2,如果使用控制设备来进行人机交互,还需要设置额外控制设备,需要额外的开发工作,增加了成本。

技术实现思路

[0006]本专利技术要解决的技术问题是提供一种人机交互装置及方法,能够提升人机交互效率,改善用户体验。
[0007]为解决上述技术问题,本专利技术的实施例提供技术方案如下:
[0008]一方面,提供一种人机交互装置,包括:
[0009]服务器,用于获取用户输入的音频数据,对所述音频数据进行语音识别,得到文本数据,对所述文本数据进行解析,得到关键词组合;确定与所述关键词组合匹配的页面信息,将所述页面信息发送给显示屏;
[0010]显示屏,用于根据所述页面信息显示对应的页面。
[0011]一些实施例中,所述服务器具体用于将所述音频数据的原始音频格式转换为目标音频格式;对所述目标音频格式下的所述音频数据进行切分处理,得到目标语音数据;将所述目标语音数据输入至语音识别引擎,得到所述文本数据。
[0012]一些实施例中,所述服务器还用于根据词库和上下文语意识别算法识别所述文本数据中的错别字,并对所述错别字进行更正。
[0013]一些实施例中,所述服务器具体用于根据中文文法语序和词性对所述文本数据进行分词,得到多个词汇,所述词性包括动词、名词、形容词、连接词、量词和外语;根据所述多个词汇确定关键词组合,所述关键词组合包括第一组合、第二组合和第三组合,所述第一组合包括所述多个词汇中的动词、名词、量词和外语,所述第二组合包括所述多个词汇中表示动作的词汇和表示对象的词汇;所述第三组合包括所述第一组合中表示动作的词汇和表示对象的词汇。
[0014]一些实施例中,所述服务器具体用于分别计算所述第一组合、所述第二组合和所述第三组合与预设语料库中的语料的匹配度,确定匹配度最高的一条语料,根据所述语料中包括动作的词汇和表示对象的词汇得到所述页面信息;
[0015]其中,所述预设语料库包括多条语料,每一所述语料包括表示执行主体的词汇、表
示动作的词汇和表示对象的词汇,或,每一所述语料包括表示动作的词汇和表示对象的词汇。
[0016]本专利技术的实施例还提供了一种人机交互方法,包括:
[0017]服务器获取用户输入的音频数据,对所述音频数据进行语音识别,得到文本数据;
[0018]所述服务器对所述文本数据进行解析,得到关键词组合;
[0019]所述服务器确定与所述关键词组合匹配的页面信息,将所述页面信息发送给显示屏;
[0020]所述显示屏根据所述页面信息显示对应的页面。
[0021]一些实施例中,所述对所述音频数据进行语音识别,得到文本数据包括:
[0022]所述服务器将所述音频数据的原始音频格式转换为目标音频格式;对所述目标音频格式下的所述音频数据进行切分处理,得到目标语音数据;将所述目标语音数据输入至语音识别引擎,得到所述文本数据。
[0023]一些实施例中,所述对所述文本数据进行解析,得到关键词组合之前,所述方法还包括:
[0024]所述服务器根据词库和上下文语意识别算法识别所述文本数据中的错别字,并对所述错别字进行更正。
[0025]一些实施例中,所述对所述文本数据进行解析,得到关键词组合包括:
[0026]根据中文文法语序和词性对所述文本数据进行分词,得到多个词汇,所述词性包括动词、名词、形容词、连接词、量词和外语;
[0027]根据所述多个词汇确定关键词组合,所述关键词组合包括第一组合、第二组合和第三组合,所述第一组合包括所述多个词汇中的动词、名词、量词和外语,所述第二组合包括所述多个词汇中表示动作的词汇和表示对象的词汇;所述第三组合包括所述第一组合中表示动作的词汇和表示对象的词汇。
[0028]一些实施例中,所述确定与所述关键词匹配的页面信息包括:
[0029]分别计算所述第一组合、所述第二组合和所述第三组合与预设语料库中的语料的匹配度,确定匹配度最高的一条语料;
[0030]根据所述语料中包括动作的词汇和表示对象的词汇得到所述页面信息;
[0031]其中,所述预设语料库包括多条语料,每一所述语料包括表示执行主体的词汇、表示动作的词汇和表示对象的词汇,或,每一所述语料包括表示动作的词汇和表示对象的词汇。
[0032]本专利技术的实施例还提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如上所述的人机交互方法的步骤。
[0033]本专利技术的实施例具有以下有益效果:
[0034]上述方案中,可以根据用户输入的音频数据,通过语音识别来控制显示屏的显示,无需用户通过手工操作,即可实现用户通过语音来对显示屏上显示的页面进行切换和打开。本实施例中,由于用户可以通过语音控制显示屏的显示,能够释放用户在浏览显示屏时的行动,让用户能随意走动观看显示的页面内容,不用固定在鼠标位置或者手持控制设备来控制显示页面;另外,如果通过鼠标点击或者控制设备去控制显示的页面,只能根据展开的菜单功能去选择,根据一级菜单二级菜单的顺序去浏览,不能快速跳转到需要的页面,通
过语音控制,可以使得用户浏览页面的顺序和内容更具灵活性,用户能够根据需要和喜爱,快速查阅到需要的页面并进行浏览,能够提升人机交互效率和用户体验。
附图说明
[0035]图1为本专利技术实施例的应用场景示意图;
[0036]图2为本专利技术实施例人机交互装置的结构框图;
[0037]图3为本专利技术实施例人机交互方法的流程示意图;
[0038]图4为本专利技术实施例对文本数据进行解析以及确定页面信息的示意图。
具体实施方式
[0039]为使本专利技术的实施例要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0040]本专利技术实施例提供一种人机交互装置及方法,能够提升人机交互效率,改善用户体验。
[0041]本专利技术实施例应用于图1所示的场景中,该人机交互装置能够与用户进行人机交互,如图2所示,本实施例的人机交互装置包括:
[0042]服务器11,用于获取用户输入的音频数据,对所述音频数据进行语音识别,得到文本数据,对所述文本数据进行解析,得到关键词组合;确定与所述关键词组合匹配的页面信息,将所述页面信息发送给显示屏12;
[0043]显示屏12,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人机交互装置,其特征在于,包括:服务器,用于获取用户输入的音频数据,对所述音频数据进行语音识别,得到文本数据,对所述文本数据进行解析,得到关键词组合;确定与所述关键词组合匹配的页面信息,将所述页面信息发送给显示屏;显示屏,用于根据所述页面信息显示对应的页面。2.根据权利要求1所述的人机交互装置,其特征在于,所述服务器具体用于将所述音频数据的原始音频格式转换为目标音频格式;对所述目标音频格式下的所述音频数据进行切分处理,得到目标语音数据;将所述目标语音数据输入至语音识别引擎,得到所述文本数据。3.根据权利要求1所述的人机交互装置,其特征在于,所述服务器还用于根据词库和上下文语意识别算法识别所述文本数据中的错别字,并对所述错别字进行更正。4.根据权利要求1所述的人机交互装置,其特征在于,所述服务器具体用于根据中文文法语序和词性对所述文本数据进行分词,得到多个词汇,所述词性包括动词、名词、形容词、连接词、量词和外语;根据所述多个词汇确定关键词组合,所述关键词组合包括第一组合、第二组合和第三组合,所述第一组合包括所述多个词汇中的动词、名词、量词和外语,所述第二组合包括所述多个词汇中表示动作的词汇和表示对象的词汇;所述第三组合包括所述第一组合中表示动作的词汇和表示对象的词汇。5.根据权利要求4所述的人机交互装置,其特征在于,所述服务器具体用于分别计算所述第一组合、所述第二组合和所述第三组合与预设语料库中的语料的匹配度,确定匹配度最高的一条语料,根据所述语料中包括动作的词汇和表示对象的词汇得到所述页面信息;其中,所述预设语料库包括多条语料,每一所述语料包括表示执行主体的词汇、表示动作的词汇和表示对象的词汇,或,每一所述语料包括表示动作的词汇和表示对象的词汇。6.一种人机交互方法,其特征在于,包括:服务器获取用户输入的音频数据,对所述音频数据进行语音识别,得到文本数据;所述服务器对所述文本数据进行解析,得到关键词组合;所述服务器确定与所述关键...

【专利技术属性】
技术研发人员:范琳翊
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1