一种随机森林哈希的医学CT图像存储与检索方法技术

技术编号：20047598 阅读：59 留言：0更新日期：2019-01-09 05:02

本发明专利技术请求保护一种随机森林哈希学习的医学CT图像高效存储与检索的方法，具体是通过在医学CT图像集上训练得到随机森林哈希模型，保存模型及图像库对应的哈希码库。当用户输入一张需要检索的新的图像时，首先，模型将该图像映射为哈希码；然后在哈希码库中检索与之最近的K个哈希码；最后，将这个K个哈希码利用树的决策路径所定义的最大相容规则解码重构为图像并返回给用户。该方法的实现，有效地提高了图像检索的速度，并且极大地节省了图像的存储空间，有助于医生的医学诊断，减少医生的工作量，提高工作效率，提升医院存储设备的利用率。

全部详细技术资料下载

【技术实现步骤摘要】
一种随机森林哈希的医学CT图像存储与检索方法
本专利技术属于医学图像处理领域，尤其涉及医学CT图像存储与检索方法技术。
技术介绍
大数据时代数据量大幅度增加，现代信息技术的基础设施必须能够处理巨大的数据，由此造成的存储、传输、管理等成本随之增加。事实上，与这些成本相比，在大型数据库中搜索相关内容变得更具挑战性。尤其是搜索诸如音频、图像和视频之类的媒体数据仍然是一个主要的挑战。除了广泛使用的基于文本的商业搜索引擎，如：谷歌、百度和必应，基于内容的图像检索在过去十年中引起了广泛的关注。基于内容的图像检索无需依赖基于文本关键字的索引结构，直接对媒体内容进行有效的索引，以便直接响应视觉查询。在给定数据库中搜索类似的数据样本与最近邻搜索问题相关。高维数据检索本质上可以转换为最近邻查找问题，即给定一个分布在高维空间内的数据集和一个检索样例，在高维空间中返回与检索样例距离最近的数据或与之最接近的前K个数据。将查询点与数据库中的每个样本彻底比较是不可行的，因为线性时间复杂度在现实的大规模应用中往往是不可取的。除了不可扩展外，由于数据通常包含数千甚至数万个维度，所以在实际中的大规模...

【技术保护点】
1.一种随机森林哈希的医学CT图像存储与检索方法，其特征在于，包括以下步骤：1)获取若干医学CT图像并作为训练集，计算所有医学CT图像的标签相似度和流形相似度，标签相似度直接根据图像的标签构建标签相似矩阵，流形相似度根据图像之间的欧氏距离定义相似度；2)根据求得的标签相似矩阵，将所有图像分块，标签一致的图像分在一个块中；3)对于每一个块中的图像，利用流形相似度作为边的权值构建图，使用图分割算法为块中的所有图像初始化一位哈希码；4)将初始化的哈希码作为标签训练随机森林模型，模型的结果更新初始的哈希码；5)重复3)和4)直到达到预设的哈希码位数；6)保存所有随机森林模型，并将图像库中的图像映射为哈...

【技术特征摘要】
1.一种随机森林哈希的医学CT图像存储与检索方法，其特征在于，包括以下步骤：1)获取若干医学CT图像并作为训练集，计算所有医学CT图像的标签相似度和流形相似度，标签相似度直接根据图像的标签构建标签相似矩阵，流形相似度根据图像之间的欧氏距离定义相似度；2)根据求得的标签相似矩阵，将所有图像分块，标签一致的图像分在一个块中；3)对于每一个块中的图像，利用流形相似度作为边的权值构建图，使用图分割算法为块中的所有图像初始化一位哈希码；4)将初始化的哈希码作为标签训练随机森林模型，模型的结果更新初始的哈希码；5)重复3)和4)直到达到预设的哈希码位数；6)保存所有随机森林模型，并将图像库中的图像映射为哈希码，得到与之对应的哈希码库；7)当用户输入一张待检索的图像时，随机森林模型将该图像映射为哈希码，在哈希码库中检索与之最近的K个哈希码，将这K个哈希码利用树的决策路径所定义的最大相容规则解码重构为图像返回给用户。2.根据权利要求1所述的随机森林哈希的医学CT图像存储与检索方法，其特征在于，所述步骤1)标签相似度的计算方法为：标签一致即为相似设为1，标签不一致即为不相似设为-1，无定义则设为0。模型的目标函数如下，i和j表示两张图像的索引，yij表示这两张图像的相似度，hr(x)表示哈希函数，Φ(·)表示哈希函数集，n表示图像的总数量，k表示哈希码位数，r表示哈希码的索引：3.根据权利要求1所述的随机森林哈希的医学CT图像存储与...

【专利技术属性】
技术研发人员：曾宪华，周萌，
申请(专利权)人：重庆邮电大学，
类型：发明
国别省市：重庆,50

全部详细技术资料下载我是这个专利的主人