一种基于阅读理解的老年痴呆量表纠错方法、系统及介质技术方案

技术编号:37990233 阅读:21 留言:0更新日期:2023-06-30 10:04
本发明专利技术公开一种基于阅读理解的老年痴呆量表纠错方法、系统及介质,方法步骤包括:1)获取测试者关于老年痴呆量表的音频,并将测试者音频转录为待纠错文本;2)检索出与待纠错文本相匹配的神经心理量表文本,记为候选字符;3)将与待纠错文本和匹配的候选字符组合成文本对,并输入到BERT预训练模型中,得到待纠错文本Text中每个字符被替换为神经心理量表中第j个字符的条件概率;4)选择从候选字符列表中选择概率最大的字符作为字符的最终输出。系统包括:音频获取及转换模块、候选字符匹配模块、BERT处理模块、纠错模块;本发明专利技术结合神经心理量表的语言特点,提出了专有的纠错数据生成方法,弥补了训练数据欠缺的问题。弥补了训练数据欠缺的问题。弥补了训练数据欠缺的问题。

【技术实现步骤摘要】
一种基于阅读理解的老年痴呆量表纠错方法、系统及介质


[0001]本专利技术涉及老年痴呆量表测试领域,具体是一种基于阅读理解的老年痴呆量表纠错方法、系统及介质。

技术介绍

[0002]由于神经心理测试具有一定的主观性,因此痴呆从筛查到诊断难度大,多数综合医院、社区卫生中心、养老机构尚不具备测试能力,从而限制了老年痴呆的正确诊断率,亟待技术突破解决神经心理测试耗时长、主观臆断影响等难题。人工智能技术中的自动语音识别恰好可以从测试效率、准确性等方面解决上述问题,有望将神经心理量表测试在更多社区推广。
[0003]因此能精准识别重庆方言的自动语音识别技术,将有助推广痴呆病症的早筛,特别是阿尔兹海默症的早筛。临床研究表明,与老年痴呆和轻度认知障碍相关的可量化的认知下降迹象在患者语言中是可检测到的。机器学习模型已被证明可以成功地使用语音和语言变量检测痴呆,例如从语音识别到的文本中分析句子内容可以推测患者健康状况。由于转录本应该足够准确以正确表示句法和语言特征,因此当前的方法通常依赖于由受过训练的转录员做转录。但这将耗费大量的时间和精力,同时目前任何本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,包括以下步骤:1)获取所述测试者关于老年痴呆量表的音频,并将测试者音频转录为待纠错文本。2)在神经心理量表中,检索出与待纠错文本相匹配的神经心理量表文本,记为候选字符;3)建立BERT预训练模型;4)将与待纠错文本和匹配的候选字符组合成文本对,并输入到BERT预训练模型中,得到待纠错文本Text中每个字符被替换为神经心理量表中第j个字符的条件概率;5)选择从候选字符列表中选择概率最大的字符作为字符的最终输出,重复步骤2)至步骤4),直到解码遇到end字符为止。2.根据权利要求1所述的一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,待纠错文本Text中的字符x
i
被替换为候选字符表中第j个字符的条件概率P
c
(yi=j|text)如下所示:P
c
(y
i
=j|Text)=softmax(W*h
i
+b)[j](1)式中,W和b为权重和偏置参数,是输入xi的embedding结果;softmat为激活函数;为BERT预训练模型中最后一层隐状态。3.根据权利要求1所述的一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,所述BERT预训练模型包括多头注意力层、前向传播层、encoder输出层。4.根据权利要求3所述的一种基于阅读理解的老年痴呆量表纠错方法,其特征在于,多头注意力层的输出MultiHead(Q,K,V)如下所示:MultiHead(Q,K,V)=Concat(head1,...,head
h
)W
O
(2)式中,W0为权重;其中,参数head
i
如下所示:head
i
=Attention(QW
iQ
,KW
iK
,VW
iV
),i=1,2,...,h(3)式中,W
iQ
、W
iK
、W
iV
表示权重;Q=XW
iQ
、K=XW
iK
、V=XW
iV
表示查询向量、键向量和值向量;h为字符数量;其中,注意力Attention(Q,...

【专利技术属性】
技术研发人员:张美伟崔秋实余娟吕洋余维华李文沅王香霖祝陈哲
申请(专利权)人:重庆医科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1