当前位置: 首页 > 专利查询>大连大学专利>正文

基于医疗服务区域划分的倒排空间索引方法技术

技术编号:18445070 阅读:22 留言:0更新日期:2018-07-14 10:26
基于医疗服务区域划分的倒排空间索引方法,属于移动医疗领域,用于解决查询医学领域大规模数据的难题,要点是:建立基于医疗服务区域划分的网格区域划分;录入倒排区域索引数据项,对所述医疗服务区域中包含的医疗资源数据按网格为单位进行录入并收集于检索系统;当索引查询被接收时,对查询位置定位到对应的网格区域,并在该网格区域找到对应的医疗服务区域并执行倒排医疗服务区域索引的预先索引,效果是划分更加合理。

Inverted spatial index method based on partition of medical service area

The inverted spatial index method based on the division of medical service area, belongs to the mobile medical field, and is used to solve the problem of large-scale data in the field of medical inquiry. The main point is to establish the grid region division based on the division of medical service area; to enter the inverted area index data items and to include medical services in the medical service area. The resource data is recorded in the grid unit and collected in the retrieval system. When the index query is received, the query location is located to the corresponding grid area, and the corresponding medical service area is found in the grid area and the index of the inverted medical service area is indexed in advance. The effect is more reasonable.

【技术实现步骤摘要】
基于医疗服务区域划分的倒排空间索引方法
本专利技术属于移动医疗领域,是一种应用于医疗领域的分布索引方法。
技术介绍
移动医疗已经成为医疗卫生设备采集和测量数据的新热点。它对提高社会效益具有重要意义,如节省社会医疗资源(包括医疗设施和医务人员)、满足高峰时间更多患者的用车需求、提高因事不便治疗的患者的救治率等。
技术实现思路
本专利技术通过从医学角度进行区域分区,设计一个基于网格分区机制建立的倒排索引,并且着眼于解决查询医学领域大规模数据的难题。为了实现上述目的,本专利技术专利所采用的技术方案是:一种基于医疗服务区域划分的倒排空间索引方法,包括如下步骤:建立基于医疗服务区域划分的网格区域划分;录入倒排区域索引数据项,对所述医疗服务区域中包含的医疗资源数据按网格为单位进行录入并收集于检索系统;当索引查询被接收时,对查询位置定位到对应的网格区域,并在该网格区域找到对应的医疗服务区域并执行倒排医疗服务区域索引的预先索引。所述倒排医疗服务区域索引的预先索引的步骤如下:在一个多维数据集对象的移动医疗服务p∈P中,输入第一个分区的数据,将其标记为每一个医疗服务区域的中央单元格MCm,MapReduce将输入文件分割,大块的映射并行运行来处理每个数据碎片在每个数据片段创建的子索引,并由默认的空MapperMapper来执行合并处理,在MapperMapper中建立子索引的算法;之后,在每个Mapper的执行过程中,它将通过文本输入格式顺序读取输入拆分,该文本定义了一个如何从文件读取数据到Mapper的实例,它计算p中每个对象r、s和所有枢轴之间的距离,并将r、s分配到最靠近的枢轴p,每一点集中在一个医疗服务单元中,它将生成m个医疗服务单元,然后分别将<MCm,list(Pi)>成对传递,Mapper输出每个对象r、s及其分区idVCM、原始数据集名称和r、s与最近枢轴的距离,最后,将mapper的输出写进Hadoop文件系统。所述的索引分为两个步骤:过滤步骤:通过医疗服务区域空间范围内的查询来获得可能包括结果的候选集;验证步骤:主要是通过计算检查所有的候选点,排除候选点中不属于最佳的点从而获得最优结果。所述过滤步骤:首先以q为中心,初始化轮圈半径r=δ,之后对这个圆型区域覆盖的医疗网格区域进行监控,当算法执行中在并行的增加半径r=r+δ时,会触发新的一轮PCT算法来增量更新近邻对象集P,在随后的迭代执行过程中,在单位时间片内,仅对整个数据空间中的监控半径r监控,最终通过增量的执行PCT算法可以找到q周围空间的所有邻居并作为候选结果点集Scnd。验证步骤:把得到的候选集Scnd中的每一个点作为查询点,通过执行分布式kNN查询算法,来计算Scnd集中每一个点各自的反向邻居来验证其是否为q的RNN,对于每一个候选集Scnd中的点,采用分布式的机制来并发进行验证,每一个并行任务中,通过持续的遍历倒排医疗服务区域空间区域格索引执行查询来进行验证,直到所有的候选集中的点都被验证完成。有益效果:上述方法可以有效提高索引效率。相较于“R-tree”的主要优点是:只需要更改的某个网格来执行简单的更新;相较于使用计算机平均网格划分,所以在实际应用中更加合理,相对于基于倒排Voronoi与倒排聚类索引,来讲都需要预先确定Voronoi代表点或聚类中心,这需要较大的计算量.而我们划分是基于医疗服务区域语义的,通常行政居民区域该医疗服务区域数据已划分好,无需事先预备计算。本专利技术的方法尤其是一种新的基于医疗服务区域划分的大型医疗服务网络索引解决方案,采用了倒排的方式,基于医疗服务区域这样的自然语义的划分相结合,不但提高了分布式效率,还避免了中心代表点的计算工作量量,从而加快了大规模索引的速度。满足了移动医疗在分布式、可扩展、高效等方面的需求,对比结合目前已经有的索引例如:多媒体数据集、谷歌搜索引擎、快速打车服务、共享单车的搜索引擎等,我们的索引方法更加符合各类小区实际情况,并可以有效处理大规模医疗呼叫数据处理,并能够解决医疗领域的及时突发性实现线上线下、地图与实时结合等等优势。附图说明图1倒排网格指标结构示意图;图2基于网格的索引示例示意图;图3倒排网格索引示例示意图;图4过滤比对过程示意图;具体实施方式实施例1:一种基于医疗服务区域划分的倒排空间索引方法,应用政府现有的医疗行政区域的划分,结合倒排索引方法来解决用户的索引需要,处理医疗资源数据大、资源分散、统计混乱的问题,可以大大提高效率,解决医疗领域的大数据索引。专利技术主要组成如下:S1.基于医疗服务区域划分的网格;S2.面向医疗资源的倒排索引;执行步骤如下:S1.基于医疗服务区域划分的网格的建立。借鉴使用市政府安排好的医疗服务区域的安排,根据不同医疗服务区域的划分对城市进行网格区域划分;S2.执行倒排索引录入,查询用户经常查询的关键词,对这些关键词以及其代表的数据为值(比如某类疾病对应的主治医生,专科医院,药品等等)与对应医疗服务区域中心为关键字进行提前录入整理;S3.分别对S1中每个医疗服务区域网格中包含的医疗资源数据执行S2的统计录入,并将这些数据输入检索系统。S4.查询时,首先寻找查询位置,定位到对应的网格,通过该网格找到对应的医疗服务区域,并在该医疗服务区域内执行倒排索引。网格索引是数据流管理中最常用的索引结构之一,他能有效的支持流动式数据集项目的插入和删除操作。基于网格的空间索引的基本思想是将一个空间划分成一些区域,然后记录每个区域中需要储存的具体内容。当用户执行查询时,首先进入用户查询对象所在的单元格,然后快速查询单元格中选定的空间对象。由于网格索引通常是一次性通过大批量设计的离线预计算,所以一旦建立网格索引,又有一个新目标加入时,只需要更新本地索引项,原来的索引结构几乎是无需改变的。此外,网格单元的尺寸具有可以灵活设置的特点,增加了连续数据检索的灵活性。通过大量研究发现,现有医疗资源的分布主要是以居住区商业建筑的居住人数和建筑面积为基础的,在城市的中心通常是大型医疗机构,如第三级甲等医院;而在住宅区则通常分布一些小型的社区医院。因此结合网格索引的优势,我们将计算机简单的平均网格分区改进,结合现有的医疗服务区域分区将城市空间分割为多个医疗服务区域(如图1所示)。由于医疗资源数据的庞大性,我们使用倒排索引来解决大规模计算需求问题。我们首先将医疗数据(比如医务人员,医疗条件,药品,医疗器械等)输入到系统中,以医疗服务区域中心为关键字,医疗服务区域的网格为值,执行预先倒排索引操作。当有用户有索引更新需求时,也可以再执行倒排索引更新索引,当用户执行查询请求,调用该倒排医疗服务区域索引。总体思想:如算法所示,给定一个多维空间中的数据集s,它会被Hadoop的默认机制划分为所谓的输入拆分,很多程序可以同时并行运行。据伪码算法的描述,在一个多维数据集对象的移动医疗服务p,其中p∈P中(P是分区中全部的医疗服务),输入第一个分区的数据,我们根据医疗区域基于网格的方法,将其标记为每一个医学区域的中央单元MCm。MapReduce可以将输入文件拆分为单独文件。大块的映射可以并行运行来处理每个数据碎片在每个数据片段创建的子指数。最终的合并处理由默认的空映射器来执行。基于上述说明,算法的主要操作是在映射过本文档来自技高网...

【技术保护点】
1.一种基于医疗服务区域划分的倒排空间索引方法,包括如下步骤:建立基于医疗服务区域划分的网格区域划分;录入倒排区域索引数据项,对所述医疗服务区域中包含的医疗资源数据按网格为单位进行录入并收集于检索系统;当索引查询被接收时,对查询位置定位到对应的网格区域,并在该网格区域找到对应的医疗服务区域并执行倒排医疗服务区域索引的预先索引。

【技术特征摘要】
1.一种基于医疗服务区域划分的倒排空间索引方法,包括如下步骤:建立基于医疗服务区域划分的网格区域划分;录入倒排区域索引数据项,对所述医疗服务区域中包含的医疗资源数据按网格为单位进行录入并收集于检索系统;当索引查询被接收时,对查询位置定位到对应的网格区域,并在该网格区域找到对应的医疗服务区域并执行倒排医疗服务区域索引的预先索引。2.如权利要求1所述的基于医疗服务区域划分的倒排空间索引方法,其特征在于,所述倒排医疗服务区域索引的预先索引的步骤如下:在一个多维数据集对象的移动医疗服务p∈P中,输入第一个分区的数据,将其标记为每一个医疗服务区域的中央单元格MCm,MapReduce将输入文件分割,大块的映射并行运行来处理每个数据碎片在每个数据片段创建的子索引,并由默认的空MapperMapper来执行合并处理,在MapperMapper中建立子索引的算法;之后,在每个Mapper的执行过程中,它将通过文本输入格式顺序读取输入拆分,该文本定义了一个如何从文件读取数据到Mapper的实例,它计算p中每个对象r、s和所有枢轴之间的距离,并将r、s分配到最靠近的枢轴p,每一点集中在一个医疗服务单元中,它将生成m个医疗服务单元,然后分别将<MCm,list(Pi)>成对传递,Mapper输出每个对象r、s及其分区idVCM、原始数据集名称和r、s与最...

【专利技术属性】
技术研发人员:季长清汪祖民秦静盛小航
申请(专利权)人:大连大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1