合并大规模药物数据列表方法、装置、设备和介质制造方法及图纸

技术编号:42824980 阅读:33 留言:0更新日期:2024-09-24 21:01
本申请提供了合并大规模药物数据列表方法、装置、设备和介质,通过根据最新的UMLS数据集筛选出符合药物概念语义类型的数据,并根据最新的MESH数据集,解析其中药物入口词与其同义词;在MESH数据集中通过药物的实体名称查询所有相同概念编号的药物名称以及同义词名称,并将合并的查询结果作为该药物的同义词集合,据以遍历所有药物的同义词集合;对任意至少两个具有相同元素的同义词集合并,以作为一个新药物的同义词集合;为每个药物定义药物编号,以表征该集合的标准化药物名称。本申请特别是当存在大量重复元素时,以显著提高合并过程的速度。

【技术实现步骤摘要】

本申请涉及训练集数据生成,特别是涉及一种合并大规模药物数据列表方法、装置、设备和介质


技术介绍

1、人工智能的发展需要经过三个阶段:计算智能、感知智能和认知智能。随着高性能计算、gpu加速等技术的发展,目前机器的计算智能已经远远超过人类水平;而利用深度神经网络(deep neural networks, 以下简称dnn)算法,计算机在感知智能领域,如自动驾驶汽车、医学图像识别等领域也基本达到了人类想到的水平。但是,认知智能需要的推理、规划、联想、创作等建立在语言、概念、关系、属性等基础上的高级"思维",利用强大的计算能力和海里的数据并不能对认知智能的提升有多大帮助,目前可能仅有人类六岁儿童的水平。

2、目前,人工智能领域的共识是,知识图谱是感知智能通往认知智能的基石,因为它能解决语义理解问题,也能解决知识推理问题。知识图谱是由google公司在2012年提出来的一个概念。从学术的角度,知识图谱是一种用来表示语义网络(semantic network)的知识库。从实际应用的角度出发,知识图谱实际上是由"三元组"构建的多关系图(multi-rel本文档来自技高网...

【技术保护点】

1.一种合并大规模药物数据列表方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,路径压缩中在执行查找操作时,通过将路径上的每个节点直接连接到根节点,从而使树的深度变浅;在在执行合并操作时,根据树的秩或大小,将较小的树连接到较大的树上,从而防止树变得过深。

3.根据权利要求1所述的方法,其特征在于,所述UMLS数据集中符合药物概念语义类型包括:chem、chvs、orch、nnon、aapp、chvf、phsu、bodm、bacs、horm、enzy、vita、imft及sbst中任意一种或多种。

4.根据权利要求1所述的方法,...

【技术特征摘要】

1.一种合并大规模药物数据列表方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,路径压缩中在执行查找操作时,通过将路径上的每个节点直接连接到根节点,从而使树的深度变浅;在在执行合并操作时,根据树的秩或大小,将较小的树连接到较大的树上,从而防止树变得过深。

3.根据权利要求1所述的方法,其特征在于,所述umls数据集中符合药物概念语义类型包括:chem、chvs、orch、nnon、aapp、chvf、phsu、bodm、bacs、horm、enzy、vita、imft及sbst中任意一种或多种。

4.根据权利要求1...

【专利技术属性】
技术研发人员:马超
申请(专利权)人:慧算基因科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1