医疗问诊口语的术语匹配方法及相关设备组成比例

技术编号:37166812 阅读:26 留言:0更新日期:2023-04-20 22:39
本发明专利技术提供一种医疗问诊口语的术语匹配方法及相关设备,其中方法包括:确定问诊口语,以及获取标准术语库;将问诊口语和标准术语库中所包含的术语,输入至术语匹配模型中,确定与问诊口语对应的匹配术语;其中,术语匹配模型基于训练样本得到,训练样本包括口语样本集和口语样本集对应的术语。通过基于术语语义实现对训练语料的扩展,将术语作为训练依据,然后在术语匹配时,将术语与问诊口语作为输入,提高术语匹配模型使用的准确性。提高术语匹配模型使用的准确性。提高术语匹配模型使用的准确性。

【技术实现步骤摘要】
医疗问诊口语的术语匹配方法及相关设备


[0001]本专利技术涉及问诊数据处理
,尤其涉及一种医疗问诊口语的术语匹配方法、装置、电子设备和存储介质。

技术介绍

[0002]医疗术语槽填充任务(MSL),其目标是自动地从患者问询中检测医疗术语填充槽位,从而将患者问询转化为结构化信息。这种结构化信息既有助于自动构建电子病历,也有助于远程医疗场景下医疗对话系统提供如咨询、诊断等专业可信的医疗服务,因此MSL近些年逐渐受到关注。
[0003]现有实现上述效果的方法可以分为两类:多标签分类方法和序列生成方法。但是两者均存在一定的问题,其中,多标签分类方法是基于无标注数据通过弱监督预训练学习术语,限制了预训练数据的规模;而序列生成式方法因为是利用对话模板将MSL建模为回复生成任务,使得对话预训练与目标任务间的差异对使用性能有所影响,如术语匹配准确度。

技术实现思路

[0004]本专利技术提供一种医疗问诊口语的术语匹配方法、装置、电子设备和存储介质,用以解决现有技术中多标签分类和序列生成在术语匹配过程中效果较差的问题。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医疗问诊口语的术语匹配方法,其特征在于,包括:确定问诊口语,以及获取标准术语库;将所述问诊口语和所述标准术语库中所包含的术语,输入至术语匹配模型中,确定与所述问诊口语对应的匹配术语;其中,所述术语匹配模型基于训练样本得到,所述训练样本包括口语样本集和所述口语样本集对应的术语。2.根据权利要求1所述的医疗问诊口语的术语匹配方法,其特征在于,所述将所述问诊口语和所述标准术语库中所包含的术语,输入至术语匹配模型中,确定与所述问诊口语对应的匹配术语,包括:对所述标准术语库中包含的术语进行拼接,得到对应的术语序列;将所述问诊口语转化为对应的文本序列,并将所述术语序列与所述文本序列进行拼接,得到目标序列;将所述目标序列输入至所述术语匹配模型中,输出得到对应的匹配术语。3.根据权利要求1所述的医疗问诊口语的术语匹配方法,其特征在于,所述术语匹配模型基于训练样本得到,包括:确定口语样本集,并基于所述口语样本集得到术语集合;将所述口语样本集与所述术语集合中的若干术语进行拼接,并对拼接后的序列进行表征提取,得到对应的表征矩阵;基于所述表征矩阵对术语匹配模型进行训练,得到训练好的术语匹配模型。4.根据权利要求3所述的医疗问诊口语的术语匹配方法,其特征在于,所述基于所述口语样本集得到术语集合,包括:对所述口语样本集中的每一口语样本进行术语提取,得到每一口语样本对应的术语,并将所述术语进行汇总得到所述口语样本集对应的术语集合。5.根据权利要求3所述的医疗问诊口语的术语匹配方法,其特征在于,所述将所述口语样本集与所述术语集合中的若干术语进行拼接,并对拼接后的序列进行表征提取,得到对应的表征矩阵,包括:在所述口语样本集中确定第一口语样本,并对所述第一口语样本进行处理得到对应的第一文本序列,以及基于所述第一口语样本在所述术语...

【专利技术属性】
技术研发人员:胡泽发徐爽徐波
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1