一种记忆背诵辅助系统技术方案

技术编号:36450372 阅读:10 留言:0更新日期:2023-01-25 22:46
本发明专利技术公开一种记忆背诵辅助系统,包括座椅,其特征在于:所述座椅固定连接一组后侧喇叭,所述座椅固定连接对称的方板,所述方板固定连接一组耳侧喇叭,所述座椅固定连接L形板,所述L形板固定连接舵机,所述舵机的输出轴固定连接圆板,所述圆板固定连接一组圆杆,所述圆杆固定连接曲面屏。本发明专利技术涉及记忆辅助设备领域,具体地讲,涉及一种记忆背诵辅助系统。本发明专利技术要解决的技术问题是提供一种记忆背诵辅助系统,方便辅助记忆背诵。方便辅助记忆背诵。方便辅助记忆背诵。

【技术实现步骤摘要】
一种记忆背诵辅助系统


[0001]本专利技术涉及记忆辅助设备领域,具体地讲,涉及一种记忆背诵辅助系统。

技术介绍

[0002]背诵是一种特殊的记忆方法。它要求人们对客观事物要按照固定次序,不分轻重主次,毫无遗漏地去进行记忆。背诵一般为两种,即机械的背诵和理解的背诵。机械的背诵是在不理解材料意义的情况下,借助字单纯反复去进行记忆的一种方法。这种背诵是以机械记忆为基础的。一般来说,年幼儿童(如小学生)由于机械记忆的能力较发达,所以他们虽然不理解记忆材料的意义,也容易把它背诵出来。
[0003]目前,还缺少一种设备,通过使用文字显示与语音提示相结合,来实现辅助使用者进行记忆背诵。

技术实现思路

[0004]本专利技术要解决的技术问题是提供一种记忆背诵辅助系统,方便辅助记忆背诵。
[0005]本专利技术采用如下技术方案实现专利技术目的:
[0006]一种记忆背诵辅助系统,包括座椅,其特征在于:所述座椅1固定连接一组后侧喇叭2,所述座椅1固定连接对称的方板3,所述方板3固定连接一组耳侧喇叭4,所述座椅1固定连接L形板9,所述L形板9固定连接舵机8,所述舵机8的输出轴固定连接圆板7,所述圆板7固定连接一组圆杆6,所述圆杆6固定连接曲面屏5;
[0007]还包括以下步骤:
[0008]步骤一:需要背诵或记忆的东西,例如单词,在所述曲面屏5上进行变动位置显示,并控制所述舵机8转动,实现所述曲面屏5摆动,实现需要背诵或记忆的东西位置不断变化;
[0009]步骤二:根据基于CNN卷积神经网络算法对单词位置进行识别;
[0010]基于CNN卷积神经网络算法对单词位置进行识别,选择One

Stage单阶段目标检测算法YOLO,其不需要region proposal阶段,直接产生物体的类别概率和位置坐标值,经过单次检测即可直接得到最终的检测结果,因此有着更快的检测速度和效率,YOLO

v4算法是在原有YOLO目标检测架构的基础上,采用了近些年CNN领域中最优秀的优化策略,从数据处理、主干网络、网络训练、激活函数、损失函数等各个方面都有着不同程度的优化,有着更好的精度和效率,YOLOv4的网络结构划可分为Input、Backbone、Neck、Head四个模块;
[0011]步骤二一:Input,对输入数据进行数据增强,采用Mosaic数据增强,其是在CutMix数据增强的基础上进化而来的,CutMix是使用两张图片拼接进行数据增强,而Mosaic拓展到了使用四张图片拼接,且这四张图片是随机缩放、随机裁剪和随机排版的,这样可以一下子极大的丰富数据集,以不同单词出现在屏幕不同位置时作为输入数据;
[0012]步骤二二:Backbone,在YOLOv4中backbone进行了一次升级,称为CSPDarknet53,CSPNet全称是Cross Stage Partial Networks,也就是跨阶段局部网络。CSPNet解决了其他大型卷积神经网络框架Backbone中网络优化的梯度信息重复问题,将梯度的变化从头到
尾地集成到特征图中,因此减少了模型的参数量和FLOPS数值,既保证了推理速度和准确率,又减小了模型尺寸。CSPNet实际上是基于Densnet的思想,复制基础层的特征映射图,通过dense block发送副本到下一个阶段,从而将基础层的特征映射图分离出来。这样可以有效缓解梯度消失问题(通过非常深的网络很难去反推丢失信号),支持特征传播,鼓励网络重用特征,从而减少网络参数数量;
[0013]步骤二三:在这里选择Mish作为激活函数,其是一个与ReLU和Swish非常相似的激活函数,公式如下:
[0014]y=x*tanh(ln(1+ex))
[0015]Mish函数是一个平滑的曲线,允许更好的信息深入神经网络,从而得到更好的准确性和泛化;在负值的时候并不是完全截断,允许比较小的负梯度流入;
[0016]步骤二四:Neck,YOLOv4使用PANet(Path Aggregation Network)代替FPN进行参数聚合以适用于不同level的目标检测,融合的时候使用的方法是Addition,YOLOv4算法将融合的方法由加法改为Concatenation,是一种特征图融合方式;
[0017]步骤二五:YOLOv4中最后的yolo预测层沿用了YOLOv3的yolo,不过需要注意的是YOLOv4在经过了如上Neck后,
[0018](1)第一个yolo层:feature map 76x76==>mask=0,1,2==>对应最小的anchor;
[0019](2)第二个yolo层:feature map 38x38==>mask=3,4,5==>对应中等的anchor;
[0020](3)第三个yolo层:feature map 19x19==>mask=6,7,8==>对应最大的anchor;
[0021]步骤二六:YOLOv4在Bounding box Regeression Loss上也做了一些创新,采用CIOU_Loss进行回归预测,使得预测框的速度和精度更加高;
[0022]步骤二七:训练模型,darknet下训练数据集为COCO,首先制作数据集,在开始训练,创建yolov4文件夹,加入yolov4.cfg、coco.data、coco.names,并在yolov4文件夹下创建backup文件夹用于存放中间权重,开始执行训练指令./darknet detector train;
[0023]步骤二八:测试训练的模型,得出检测效果,输出单词在屏幕中的位置,即(x,y)坐标,根据误差,进行迭代多次训练,提升模型的精度;
[0024]步骤三:所述后侧喇叭(2)及所述耳侧喇叭(4)分别发出不同分贝的声音,左右耳听到的声音与眼睛看到位置相重叠,视听、位置相结合加深记忆,变动位置视听位置相结合将注意力集中在同一个位置。
[0025]作为本技术方案的进一步限定,还包括以下步骤:
[0026]步骤四:在使用者嘴附近设置录音装置,通过语音识别算法识别使用者语音;
[0027]语音识别算法,是将一段语音信号转换成相对应的文本信息,系统主要流程为:特征提取

>声学模型

>语言模型

>字典与解码四大部分;
[0028]步骤四一:预处理,为了更有效地提取特征往往还需要对所采集到的声音信号进行滤波、分帧等音频数据预处理工作,将需要分析的音频信号从原始信号中合适地提取出来;
[0029]对首尾端的静音进行切除,降低对后续步骤造成的干扰,静音切除的操作一般称
为VAD,声音分帧,也就是把声音切开成一小段一小段,每小段称为一帧,使用移动窗函数来实现,不是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种记忆背诵辅助系统,包括座椅(1),其特征在于:所述座椅(1)固定连接一组后侧喇叭(2),所述座椅(1)固定连接对称的方板(3),所述方板(3)固定连接一组耳侧喇叭(4);所述座椅(1)固定连接L形板(9),所述L形板(9)固定连接舵机(8),所述舵机(8)的输出轴固定连接圆板(7),所述圆板(7)固定连接一组圆杆(6),所述圆杆(6)固定连接曲面屏(5);还包括以下步骤:步骤一:需要背诵或记忆的东西,例如单词,在所述曲面屏(5)上进行变动位置显示,并控制所述舵机(8)转动,实现所述曲面屏(5)摆动,实现需要背诵或记忆的东西位置不断变化;步骤二:根据基于CNN卷积神经网络算法对单词位置进行识别;基于CNN卷积神经网络算法对单词位置进行识别,选择One

Stage单阶段目标检测算法YOLO,其不需要region proposal阶段,直接产生物体的类别概率和位置坐标值,经过单次检测即可直接得到最终的检测结果,因此有着更快的检测速度和效率,YOLO

v4算法是在原有YOLO目标检测架构的基础上,采用了近些年CNN领域中最优秀的优化策略,从数据处理、主干网络、网络训练、激活函数、损失函数等各个方面都有着不同程度的优化,有着更好的精度和效率,YOLOv4的网络结构划可分为Input、Backbone、Neck、Head四个模块;步骤二一:Input,对输入数据进行数据增强,采用Mosaic数据增强,其是在CutMix数据增强的基础上进化而来的,CutMix是使用两张图片拼接进行数据增强,而Mosaic拓展到了使用四张图片拼接,且这四张图片是随机缩放、随机裁剪和随机排版的,这样可以一下子极大的丰富数据集,以不同单词出现在屏幕不同位置时作为输入数据;步骤二二:Backbone,在YOLOv4中backbone进行了一次升级,称为CSPDarknet53,CSPNet全称是Cross Stage Partial Networks,也就是跨阶段局部网络。CSPNet解决了其他大型卷积神经网络框架Backbone中网络优化的梯度信息重复问题,将梯度的变化从头到尾地集成到特征图中,因此减少了模型的参数量和FLOPS数值,既保证了推理速度和准确率,又减小了模型尺寸。CSPNet实际上是基于Densnet的思想,复制基础层的特征映射图,通过dense block发送副本到下一个阶段,从而将基础层的特征映射图分离出来。这样可以有效缓解梯度消失问题(通过非常深的网络很难去反推丢失信号),支持特征传播,鼓励网络重用特征,从而减少网络参数数量;步骤二三:在这里选择Mish作为激活函数,其是一个与ReLU和Swish非常相似的激活函数,公式如下:y=x*tanh(ln(1+ex))Mish函数是一个平滑的曲线,允许更好的信息深入神经网络,从而得到更好的准确性和泛化;在负值的时候并不是完全截断,允许比较小的负梯度流入;步骤二四:Neck,YOLOv4使用PANet(Path Aggregation Network)代替FPN进行参数聚合以适用于不同level的目标检测,融合的时候使用的方法是Addition,YOLOv4算法将融合的方法由加法改为Concatenation,是一种特征图融合方式;步骤二五:YOLOv4中最后的yolo预测层沿用了YOLOv3的yolo,不过需要注意的是YOLOv4在经过了如上Neck后,
(1)第一个yolo层:feature map 76x 76==>mask=0,1,2==>对应最小的anchor;(2)第二个yolo层:feature map 38 x 38==>mask=3,4,5==>对应中等的anchor;(3)第三个yolo层:feature map 19 x 19==>mask=6,7,8==>对应最大的anchor;步骤二六:YOLOv4在Bounding box Regeression Loss上也做了一些创新,采用CIOU_Loss进行回归预测,使得预测框的速度和精度更加高;步骤二七:训练模型,darknet下训练数据集为COCO,首先制作数据集,在开始训练,创建yolov4文件夹,加入yolov4.cfg、coco.data、coco.names,并在yolov4文件夹下创建backup文件夹用于存放中间权重,开始执行训练指令./darknet detector train;步骤二八:测试训练的模型,得出检测效果,输出单词在屏幕中的位置,即(x,y)坐标,根据误差,进行迭代多次训练,提升模型的精度;步骤三:所述后侧喇叭(2)及所述耳侧喇叭(4)分别发出不同分贝的声音,左右耳听到的声音与眼睛看到位置相重叠,视听、位置相结合加深记忆,变动位置视听位置相结合将注意力集中在同一个位置。2.根据权利要求1所述的记忆背诵辅助系统,其特征在于,还包括以下步骤:步骤四:在使用者嘴附近设置录音装置,通过语音识别算法识别使用者语音;语音识别算法,是将一段语音信号转换成相对应的文本信息,系统主要流程为:特征提取

>声学模型

>语言模型

>字典与解码四大部分;步骤四一:预处理,为了更有效地提取特征往往还需要对所采集到的声音信号进行滤波、分帧等音频数据预处理工作,将需要分析的音频信号从原始信号中合适地提取出来;对首尾端的静音进行切除,降低对后续步骤造成的干扰,静音切除的操作一般称为VAD,声音分帧,也就是把声音切开成一小段一小段,每小段称为一帧,使用移动窗函数来实现,不是简单的切开,各帧之间一般是有交叠的;(1)CODEC为解决频率混叠,在对模拟信号进行离散化采集前,采用低通滤波器滤除高于1/2采样频率的频率成份。实际仪器设计中,这个低通滤波器的截止频率(fc)为:截止频率(fc)=采样频率(fs)/2.56(2)预加重,为了对语音的高频部分进行加重,去除口唇辐射的影响,增加语音的高频分辨率,因为高频端大约在800Hz以上按6dB/oct(倍频程)衰减,频率越高相应的成分越小,为此要在对语音信号进行分析之前对其高频部分加以提升;一般通过传递函数为高通数字滤波器来实现预加重,其中a为预加重系数,0.9<a<1.0。设n时刻的语音采样值为x(n),经过预加重处理后的结果为y(n)=x(n)

ax(n

1),这里取a=0.97,传递函数为,H(z)=1

az
‑1(3)端点检测,也叫语音活动检测,Voice Activity Detection,VAD,它的目的是对语音和非语音的区域进行区分,端点检测就是为了从带有噪声的语音中准确的定位出语音的开始点,和结束点,去掉静音的部分,去掉噪声的部分,找到一段语音真正有效的内容;VAD算法可以粗略的分为三类:基于阈值的VAD、作为分类器的VAD、模型VAD;步骤四二:特征提取,将声音信号从时域转换到频域,为声学模型提供合适的特征向量,主要算法有线性预测倒谱系数LPCC和梅尔倒谱系数MFCC,目的是把每一帧波形变成一个包含声音信息的多维向量;<...

【专利技术属性】
技术研发人员:张鹏钟亚玲
申请(专利权)人:中南迅智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1