医学术语标准化的方法、装置、设备及存储介质制造方法及图纸

技术编号：37388428 阅读：27 留言：0更新日期：2023-04-27 07:27

本申请提供了一种医学术语标准化的方法、装置、设备及存储介质。该方法包括：确定任一医学用语的语义特征；根据所述语义特征，从所述医学用语所属的至少一个目标分类标签下构建的标签前缀树中，搜索所述医学用语对应的标准术语集；其中，所述标签前缀树由所述目标分类标签下的多个标准术语组成。本申请实施例可以避免医学用语标准化后的标准术语遗漏，从而保证医学术语标准化的全面性。而且，无需对医学知识库中的每个标准术语进行与该医学术语间的概率预测，在确保医学术语标准化的准确性的基础上，通过借助目标分类标签下构建的标签前缀树，提升医学术语标准化的高效性。提升医学术语标准化的高效性。提升医学术语标准化的高效性。

全部详细技术资料下载

【技术实现步骤摘要】
医学术语标准化的方法、装置、设备及存储介质

[0001]本申请实施例涉及自然语言处理
，具体涉及一种医学术语标准化的方法、装置、设备及存储介质。

技术介绍

[0002]在医学领域下，临床术语标准化任务已经成为医学数据统计中不可或缺的一项任务。关于同一种医学诊断、手术、药品、医疗检查、化验、症状等，通常会存在多种不同的医学用语。所以，为了保证医学数据统计的规范性，需要将原始的医学用语转换为统一的标准术语，以便研究人员对各个患者的电子病历进行相应的诊断分析。
[0003]通常情况下，可以通过预先构建的序列到序列模型对原始的医学用语进行特征分析，来预测知识库中每个标准术语的字符概率，从而得到该医学用语对应的标准术语。但是，考虑到知识库中收录有大量繁琐的标准术语，通过序列到序列模型预测每个标准术语的字符概率，来对原始的医学用语进行标准化时，会耗费极大的时间成本，且无法保证医学术语标准化的准确性，使得医学术语标准化存在一定的局限性。

技术实现思路

[0004]本申请实施例提供一种医学术语标准化的方法、装置、设备及存储介质，确保医学术语标准化的准确性，提升医学术语标准化的高效性和全面性。
[0005]第一方面，本申请实施例提供了一种医学术语标准化的方法，该方法包括：
[0006]确定任一医学用语的语义特征；
[0007]根据所述语义特征，从所述医学用语所属的至少一个目标分类标签下构建的标签前缀树中，搜索所述医学用语对应的标准术语集；
[0008]其中，所述标签前缀树由...

【技术保护点】

【技术特征摘要】
1.一种医学术语标准化的方法，其特征在于，包括：确定任一医学用语的语义特征；根据所述语义特征，从所述医学用语所属的至少一个目标分类标签下构建的标签前缀树中，搜索所述医学用语对应的标准术语集；其中，所述标签前缀树由所述目标分类标签下的多个标准术语组成。2.根据权利要求1所述的方法，其特征在于，所述根据所述语义特征，从所述医学用语所属的至少一个目标分类标签下构建的标签前缀树中，搜索所述医学用语对应的标准术语集，包括：根据所述医学用语的语义特征，确定初始分类标签，作为当前分类标签；执行标准术语搜索步骤：根据所述当前分类标签和所述当前分类标签下的隐状态向量，从所述当前分类标签下构建的标签前缀树中，搜索所述医学用语在所述当前分类标签下的目标标准术语；根据所述目标标准术语中的末尾字符和所述末尾字符下的隐状态向量，预测下一分类标签，作为新的当前分类标签，继续返回执行上述标准术语搜索步骤，直至所述下一分类标签为空白字符，得到所述医学用语对应的标准术语集。3.根据权利要求2所述的方法，其特征在于，所述根据所述当前分类标签和所述当前分类标签下的隐状态向量，从所述当前分类标签下构建的标签前缀树中，搜索所述医学用语在所述当前分类标签下的目标标准术语，包括：将所述当前分类标签下的标签前缀树中根节点的子节点，作为当前节点；根据所述当前分类标签和所述当前分类标签下的隐状态向量，预测所述当前节点下的字符概率，以确定所述医学用语在所述当前分类标签下搜索出的首个字符，并将所述首个字符作为当前字符；执行字符预测步骤：将所述当前字符在所述标签前缀树中所处节点的子节点，作为新的当前节点；根据所述当前字符在所述标签前缀树中的字符搜索轨迹和所述当前字符下的隐状态向量，预测所述新的当前节点下的字符概率，以确定所述当前字符的后一字符；...

【专利技术属性】
技术研发人员：孙小婉，蔡巍，张霞，
申请(专利权)人：沈阳东软智能医疗科技研究院有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人