标准症状文本匹配方法、装置、设备及存储介质制造方法及图纸

技术编号:38415128 阅读:7 留言:0更新日期:2023-08-07 11:18
本申请涉及数字医疗技术领域,提供一种标准症状文本匹配方法、装置、设备及存储介质,其中,该标准症状文本匹配方法包括:获取待识别医疗文本,并根据所述待识别医疗文本获取标准症状库,所述标准症状库中的每个标准症状标注有拼音序列;对所述待识别医疗文本标注拼音序列,得到待匹配医疗文本;将所述待匹配医疗文本和所述标准症状库输入标准症状识别模型,得到所述待识别医疗文本的语义向量和所述标准症状库的语义向量库;基于所述语义向量和所述语义向量库得到与所述待识别医疗文本相匹配的标准症状。通过该标准症状文本匹配方法解决了现有的标准症状文本匹配方法无法识别医疗文本中存在的同音错别字的问题。文本中存在的同音错别字的问题。文本中存在的同音错别字的问题。

【技术实现步骤摘要】
标准症状文本匹配方法、装置、设备及存储介质


[0001]本专利技术涉及数字医疗
,尤其涉及一种标准症状文本匹配方法、装置、设备及存储介质。
技术背景
[0002]标准症状文本匹配是将医疗文本(例如:病历、住院记录、临床记录、患者在线上诊断过程中输入的内容等)所描述的内容匹配到标准症状上的技术,例如,将患者在线上诊断过程中输入的内容“头有一点疼”匹配到“头痛”这一标准症状。
[0003]现有的医疗文本通常采用电子文本的形式,由于电子文本通常产出于拼音输入法,因此会导致医疗文本中可能会出现同音错别字的问题,而现有的标准症状文本匹配方法无法识别医疗文本中存在的同音错别字,从而导致对与医疗文本相匹配的标准症状的匹配结果不准确的问题。

技术实现思路

[0004]本申请实施例提供一种标准症状文本匹配方法、装置、设备及存储介质,旨在解决现有的标准症状文本匹配方法无法识别医疗文本中存在的同音错别字的问题,以提高对与医疗文本相匹配的标准症状的匹配结果的准确性。
[0005]第一方面,本申请实施例提供一种标准症状文本匹配方法,所述方法包括:
[0006]获取待识别医疗文本,并根据所述待识别医疗文本获取标准症状库,所述标准症状库中的每个标准症状标注有拼音序列;
[0007]对所述待识别医疗文本标注拼音序列,得到待匹配医疗文本;
[0008]将所述待匹配医疗文本和所述标准症状库输入预设的标准症状识别模型,得到所述待识别医疗文本的语义向量和所述标准症状库的语义向量库;
[0009]基于所述语义向量和所述语义向量库在所述标准症状库中找到与所述待识别医疗文本相匹配的标准症状。
[0010]第二方面,本申请实施例提供一种标准症状文本匹配装置,所述标准症状文本匹配装置包括:
[0011]第一获取模块,用于获取待识别医疗文本,并根据所述待识别医疗文本获取标准症状库,所述标准症状库中的每个标准症状标注有拼音序列;
[0012]标注模块,用于对所述待识别医疗文本标注拼音序列,得到待匹配医疗文本;
[0013]输入模块,用于将所述待匹配医疗文本和所述标准症状库输入预设的标准症状识别模型,得到所述待识别医疗文本的语义向量和所述标准症状库的语义向量库;
[0014]计算模块:用于基于所述语义向量和所述语义向量库在所述标准症状库中找到与所述待识别医疗文本相匹配的标准症状。
[0015]第三方面,本申请实施例提供一种计算机设备,所述计算机设备包括处理器、存储器以及存储在所述存储器上并可被所述处理器执行的计算机程序,其中所述计算机程序被
所述处理器执行时,实现如上任一项所述的标准症状文本匹配方法。
[0016]第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其中所述计算机程序被所述处理器执行时,实现如上任一项所述的标准症状文本匹配方法。
[0017]本申请实施例公开了标准症状文本匹配方法、装置、设备及存储介质,其中,该标准症状文本匹配方法通过对所述待识别医疗文本标注拼音序列,得到所述待匹配医疗文本,并将所述待匹配医疗文本和每个标准症状都标注有拼音序列的所述标准症状库输入所述标准症状识别模型,使所述标准症状识别模型在输出所述待匹配医疗文本的语义向量时,既要识别所述待匹配医疗文本的文本序列的语义,又要识别所述待匹配医疗文本的拼音序列的语义,使所述标准症状识别模型在输出所述标准症状库的语义向量库时,既要识别所述待匹配标准症状库中的每一个标准症状的文本序列的语义,又要识别所述待匹配标准症状库中的每一个标准症状的拼音序列的语义,解决了现有的标准症状文本匹配方法无法识别医疗文本中存在的同音错别字的问题,提高了对与医疗文本相匹配的标准症状的匹配结果的准确性。
附图说明
[0018]为了更清楚地说明本申请实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0019]图1为本申请实施例提供的标准症状文本匹配方法的流程示意图;
[0020]图2为本申请实施例提供的标准症状文本匹配装置的示意性框图;
[0021]图3为本申请实施例提供的计算模块的示意性框图;
[0022]图4为本申请实施例提供的第一获取模块的示意性框图;
[0023]图5为本申请实施例提供的又一标准症状文本匹配装置的示意性框图;
[0024]图6为本申请实施例提供的计算机设备的示意性框图。
具体实施方式
[0025]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0026]附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
[0027]应当理解,在此本申请说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本申请。如在本申请说明书和所附权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式。
[0028]还应当理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0029]随着信息技术的发展,现有的医疗文本(例如:病历、住院记录、临床记录、患者在线上诊断过程中输入的内容等)通常采用电子文本的形式,医院在对病例、住院记录、临床记录进行分类管理时,往往需要利用终端设备(如:电脑、手机、平板电脑等)识别这些医疗文本所描述的标准症状,患者在进行线上诊断的过程中,线上诊断系统往往需要识别用户输入的内容所描述的标准症状。
[0030]由于电子文本通常产出于拼音输入法,因此会导致医疗文本中可能会出现同音错别字的问题,例如,“头一按就疼”被输入为“头一安就疼”,虽然不影响实际沟通过程中的理解,但是会对识别模型的理解造成一定程度的干扰,而现有的标准症状文本匹配方法还无法识别医疗文本中存在的同音错别字。
[0031]为此,本申请实施例提供一种标准症状文本匹配方法、装置、设备及存储介质,目的是为了解决现有的标准症状文本匹配方法无法识别医疗文本中存在的同音错别字的问题,以提高对与待识别医疗文本相匹配的标准症状的识别结果的准确性。其中,该标准症状文本匹配方法可用于终端设备,例如,智能手机、平板电脑、笔记本电脑、台式电脑、服务器、可穿戴设备等,也可用于线上问诊系统。
[0032]下面结合附图,对本申请的一些实施例作详细说本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标准症状文本匹配方法,其特征在于,包括:获取待识别医疗文本,并根据所述待识别医疗文本获取标准症状库,所述标准症状库中的每个标准症状标注有拼音序列;对所述待识别医疗文本标注拼音序列,得到待匹配医疗文本;将所述待匹配医疗文本和所述标准症状库输入预设的标准症状识别模型,得到所述待识别医疗文本的语义向量和所述标准症状库的语义向量库;基于所述语义向量和所述语义向量库在所述标准症状库中找到与所述待识别医疗文本相匹配的标准症状。2.根据权利要求1所述的方法,其特征在于,所述基于所述语义向量和所述语义向量库在所述标准症状库中找到与所述待识别医疗文本相匹配的标准症状,包括:分别计算所述语义向量与所述语义向量库中的每个语义向量的相似度,得到相似度集合;基于所述相似度集合在所述标准症状库中找到与所述待识别医疗文本相匹配的标准症状。3.根据权利要求2所述的方法,其特征在于,所述分别计算所述语义向量与所述语义向量库中的每个语义向量的相似度,得到相似度集合,包括:分别计算所述语义向量与所述语义向量库中的每个语义向量的余弦值,得到由所述余弦值组成的相似度集合;所述基于所述相似度集合在所述标准症状库中找到与所述待识别医疗文本相匹配的标准症状,包括:确定由所述余弦值组成的相似度集合中最大的余弦值对应的标准症状并输出。4.根据权利要求1所述的方法,其特征在于,所述获取待识别医疗文本,包括:获取图片格式的医疗文本,并采用文字识别技术对所述图片格式的医疗文本进行文字提取,得到所述待识别医疗文本。5.根据权利要求1

4任一项所述的方法,其特征在于,在所述获取待识别医疗文本之前,所述方法还包括:获取训练样本集,并对所述训练样本集中的文本标注拼音序列,得到预训练样本集;基于所述预训练样本集对预训练模型进行训练,得到所述标准症状识别模型。6.根据权利要求5所述的方法,其特征在于,所述训练样本集包括第一训练样本集和第二训练样本集,所述第一训练样本集中的文本为医疗文本,所述第二训练样本集中的文本为给所述医疗文本标注第一标准症状后的医疗文本对,所述第一标准症状为与所述医疗文本相匹配的标准症状,所述对所述训练样本集中的文本标注拼音序列,得到预训练样本集,包括:对所述第一训练样本集中的...

【专利技术属性】
技术研发人员:阮晓雯吴振宇
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1