一种基于吹气的可控交互界面的系统和方法技术方案

技术编号:20864907 阅读:22 留言:0更新日期:2019-04-17 09:03
本公开提供了一种基于吹气的可控交互界面的系统和方法,包括服务器端和客户端,服务器端包括训练数据采集模块,被配置为在训练阶段收集三种吹气数据作为训练数据;数据预处理模块,被配置为对获取的原始数据进行归一化和离散化操作;特征提取模块,被配置为对预处理好的数据提取特征;模型训练模块,被配置为对提取好的特征数据对分类器模型进行训练;识别模块,被配置为利用训练好的分类模型对用户的吹气进行类型识别,并将识别好的类型发送到客户端;所述客户端,被配置为检测吹气交互信号,发送给服务器端进行识别,基于从服务器端接收的吹气类型,匹配相应的交互操作。

【技术实现步骤摘要】
一种基于吹气的可控交互界面的系统和方法
本公开涉及一种基于吹气的可控交互界面的系统和方法。
技术介绍
本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,不必然构成在先技术。从键盘、鼠标等传统交互方式到多点触控、语音、手势、姿势、眼球跟踪以及脑-机交互等自然交互方式,人机交互
取得了巨大的进展。然而,这些交互方式不一定适用于所有场景。例如,当双手被占用时无法进行鼠标或触摸交互时,在嘈杂或不方便使用语音的环境中无法进行语音交互,或肢体障碍的人无法进行语音或眼球跟踪交互等。呼吸是人类的本能,由于呼吸可以被有意识地控制,利用呼吸进行交互被认为是影响真实物理世界和虚拟世界的另一种控制机制。呼吸互动的便捷性和可控性在一定程度上可以弥补上述常见交互模式的缺点。因此,呼吸被看作是一种仅次于触摸和语音的直接可控的自然交互方式。迄今为止,有些研究将呼吸或者吹气作为一种直接输入的交互控制方式。根据获取呼吸信号的相关传感器佩戴位置的不同,呼吸检测方法可以分为两类:一是通过检测胸部或腹部的运动来获得呼吸信号;另一种是通过放置在嘴部的特殊装置直接检测吸入和呼出气流来获得呼吸信号。现有研究一般都依赖于特殊的定制设备,如呼吸传感器、呼吸带或其他特殊传感器,这些设备通常较为复杂,价格昂贵且不方便佩戴,在日常生活中缺乏通用的便携性,有时可能难以控制。
技术实现思路
本公开为了解决上述问题,提出了一种基于吹气的可控交互界面的系统和方法,本公开不需要昂贵的呼吸信号获取设备,用户可以选择简单的练习或者直接进行使用,可以便捷的携带、随时随地方便地使用,不受复杂设备和特殊使用条件的限制。为了实现上述目的,本公开采用如下技术方案:一种基于吹气的可控交互界面的系统,包括服务器端和客户端,所述服务器端包括:训练数据采集模块,被配置为在训练阶段收集三种吹气数据作为训练数据;数据预处理模块,被配置为对获取的原始数据进行归一化和离散化操作;特征提取模块,被配置为对预处理好的数据提取特征;模型训练模块,被配置为对提取好的特征数据对分类器模型进行训练;识别模块,被配置为利用训练好的分类模型对用户的吹气进行类型识别,并将识别好的类型发送到客户端;所述客户端,被配置为检测吹气交互信号,发送给服务器端进行识别,基于从服务器端接收的吹气类型,匹配相应的交互操作。基于吹气的可控交互方法,包括以下步骤:随机采集一定数量的吹气数据,形成用于训练分类器模型的训练数据集;对采集到的原始数据进行预处理,将数据归一化到标准范围[-1、1];使用滑动窗口对原始的连续声波数据进行离散化处理,形成离散样本;提取均值、方差、一阶差分以及标准化值大于0.4的比例的数据;选择支持向量机作为分类器模型,基于提取的四个特征信号来训练分类器模型,并使用随机交叉验证来验证分类模型的准确性;使用训练好的模型,首先判断用户是否选择进行练习;如果是,将练习数据加入训练数据集,重新对样本进行处理和提取;否则正式使用。作为进一步的限定,一旦检测到用户进行了吹气交互,将给服务器端发送指令;服务器端获取吹气数据,进行数据的离散化处理和提取,使用训练好的模型进行识别分类;服务器将分类结果发送客户端;根据客户端接收的识别类型,执行相应的交互操作。作为进一步的限定,采样频率为8000Hz,每隔一段时间进行一次吹气。作为进一步的限定,在数据采集过程中,根据吹气的持续时间和强度,定义了三种吹气形式用于交互:大吹气,大于一定强度的吹气且至少持续N秒;强呼:大于一定强度持续小于N秒;轻吹:小于设定强度且持续小于N秒。作为进一步的限定,训练模型算法的具体步骤包括:经过预处理和特征提取的训练数据d和与其相对应的吹气动作a;利用训练数据d和吹气类型a进行分类模型SVM的训练,得到新模型m;使用新模型m定时更新线上服务器中的模型;返回模型m,用于服务器识别吹气的类型。作为进一步的限定,在选择支持向量机作为分类器模型时,调用网格参数寻优函数SVMcgForClass来优化分类器SVM中的惩罚参数c和高斯径向基函数RBF内核函数中的参数g,以提高分类精度,使用随机交叉验证方法来验证分类模型的准确性:将采集的全部数据随机分为一个训练集和一个测试集,其比例为9:1;重复地进行多次交叉验得出平均准确率来验证模型的准确性和有效性。作为进一步的限定,吹气类型识别算法的具体步骤包括:提前设定好的阈值θ,用于判断用户是否进行了吹气动作;实时获取吹气后通过麦克风产生的声音的音量值v;判断音量值v和阈值θ的大小,如果v>θ,客户端给服务器端发送声音数据d,服务器端获取声音数据d,继而对d进行预处理和特征提取操作,得到d’;根据d’识别当前吹气动作,得到吹气类型a,发送给客户端;客户端根据接收到的a,执行相应的交互操作;否则,再次实时获取吹气后通过麦克风产生的声音的音量值。作为进一步的限定,相应的交互操作包括:PC端视频的播放;手机移动端网页的浏览;虚拟现实游戏的运行。本公开的工作原理为:Web服务器作为获取并处理吹气数据、训练和运行分类模型的服务器端。当用户使用该吹气交互界面时,在服务器上运行的分类预测模型会根据该用户的吹气数据来识别其吹气动作,并将识别结果发送回客户端(例如,PC端应用、手机移动端应用或HTCVIVE虚拟系统)。一旦客户端接收到识别的吹气动作类型,运行的应用程序就会执行相应的操作。与现有技术相比,本公开的有益效果为:本公开使用方便、易操作、成本较低;本公开可在环境噪音在65db左右的嘈杂场景中使用,效果良好,例如环境音乐为64db且音源距离用户不超过0.5米,且同一空间内有3-4人在正常交流时,交互准确率可达94%;本公开在某些特殊人群中使用很方便,像无法使用语音的聋哑人群、无法使用触控交互的肢体障碍人群等;本公开应用范围广,除了用在普通的应用中,如本公开提到的系统,更可用于类似开车时接听电话、导航时吹气控制地图放大和缩小、在嘈杂的厨房学习做饭以及将这种交互方式与数字词典结合起来推广到聋哑人群中使用等多种特殊情况。附图说明构成本申请的一部分的说明书附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。图1为本公开的系统架构图;图2为本公开的使用原理示意图;图3为本公开算法技术流程图;图4(a)-图4(c)为本公开应用于PC端的实例示意图;图5(a)-图5(b)为本公开应用于手机移动端的实例示意图;图6(a)-图6(c)为本公开应用于虚拟游戏的实例示意图。具体实施方式:下面结合附图与实施例对本公开作进一步说明。应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属
的普通技术人员通常理解的相同含义。需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。在本公开中,术语如“上”、“下”、“左”、“右”、“前”、“后”、“竖直”、“水平”、“侧”、“底”等指示的本文档来自技高网
...

【技术保护点】
1.一种基于吹气的可控交互界面的系统,其特征是:包括服务器端和客户端,所述服务器端包括:训练数据采集模块,被配置为在训练阶段收集三种吹气数据作为训练数据;数据预处理模块,被配置为对获取的原始数据进行归一化和离散化操作;特征提取模块,被配置为对预处理好的数据提取特征;模型训练模块,被配置为对提取好的特征数据对分类器模型进行训练;识别模块,被配置为利用训练好的分类模型对用户的吹气进行类型识别,并将识别好的类型发送到客户端;所述客户端,被配置为检测吹气交互信号,发送给服务器端进行识别,基于从服务器端接收的吹气类型,匹配相应的交互操作。

【技术特征摘要】
1.一种基于吹气的可控交互界面的系统,其特征是:包括服务器端和客户端,所述服务器端包括:训练数据采集模块,被配置为在训练阶段收集三种吹气数据作为训练数据;数据预处理模块,被配置为对获取的原始数据进行归一化和离散化操作;特征提取模块,被配置为对预处理好的数据提取特征;模型训练模块,被配置为对提取好的特征数据对分类器模型进行训练;识别模块,被配置为利用训练好的分类模型对用户的吹气进行类型识别,并将识别好的类型发送到客户端;所述客户端,被配置为检测吹气交互信号,发送给服务器端进行识别,基于从服务器端接收的吹气类型,匹配相应的交互操作。2.基于吹气的可控交互方法,其特征是:包括以下步骤:随机采集一定数量的吹气数据,形成用于训练分类器模型的训练数据集;对采集到的原始数据进行预处理,将数据归一化到标准范围[-1、1];使用滑动窗口对原始的连续声波数据进行离散化处理,形成离散样本;提取均值、方差、一阶差分以及标准化值大于设定值的比例的数据;选择支持向量机作为分类器模型,基于提取的四个特征信号来训练分类器模型,并使用随机交叉验证来验证分类模型的准确性;使用训练好的模型,首先判断用户是否选择进行练习;如果是,将练习数据加入训练数据集,重新对样本进行处理和提取;否则正式使用。3.如权利要求2所述的基于吹气的可控交互方法,其特征是:一旦检测到用户进行了吹气交互,将给服务器端发送指令;服务器端获取吹气数据,进行数据的离散化处理和提取,使用训练好的模型进行识别分类;服务器将分类结果发送客户端;根据客户端接收的识别类型,执行相应的交互操作。4.如权利要求2所述的基于吹气的可控交互方法,其特征是:采样频率为8000Hz,每隔一段时间进行一次吹气。5.如权利要求2所述的基于吹气的可控交互方法,其特征是:在数据采集过程中,根据吹气的持续...

【专利技术属性】
技术研发人员:陈叶青杨承磊卞玉龙鲍西雨刘娟盖伟王璐孟祥旭李军
申请(专利权)人:济南奥维信息科技有限公司济宁分公司山东大学
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1