The invention discloses a physical examination data searching system based on Solr, which comprises a data preprocessing module, a Solr search engine platform, a building module and a webpage inquiry module. The invention adopts the Oracle+Solr framework, the data stored in the hospital Oracle database, a full-text search engine with Solr, and MMSeg4i into the library and professional medical thesaurus to support segmentation Chinese text types. Solr can return data by sending query requests, but the data result is JSON, not intuitive enough. Therefore, the invention designs a user inquiry interface that interacts with the index library, which provides the user with a search input box and displays the output results in order to the customer.
【技术实现步骤摘要】
一种基于Solr的体检数据搜索系统
本专利技术属于医疗大数据处理
,具体涉及一种基于Solr的体检数据搜索系统。
技术介绍
健康是人生的第一大财富。随着人们生活水平的提高、保健意识的增强,健康体检逐渐成为一种社会时尚,人们已经改变了只有在得病时才去医院的传统观念,定期体检已经被大多数人所接受。因此,医院积累了海量的电子体检数据。如何充分利用己有的体检数据来更好的辅助医生的学术研究是本领域的研究重点。一般当数据量比较小的时候,各种信息内容都直接存储在医院数据库系统中,并且使用数据库提供的检索和查询功能进行中文内容搜索。但是随着数据量的增大,到百万千万乃至上亿条数据的时候,使用数据库中的like"%keyword%"查询,查询效率会急剧的下降。经实践,在医院现有的传统数据库搜索信息需要几十分钟,极大地浪费医生的时间。并且对于不会使用数据库的医生,提取数据需要求助专业技术人员,增大操作难度。因此使用数据库直接查询来进行中文检索并不是好的解决方案。而使用搜索引擎就可以避免数据库like查询带来的低效性;且使用Solr搭建搜索引擎更可以避免使用其他大型搜索引擎的所遇到的更新慢,数据不准确等问题。
技术实现思路
鉴于上述,本专利技术提供了一种基于Solr的体检数据搜索系统,该系统具有良好的用户界面,医生可按照网页上的目录来进行选择项目和项目下的细项,点击搜索即可得到符合条件的数据;另外,医生还可以自行在搜索框里输入关键字进行查找,搜索时间为几秒,不会因为数据的庞大而影响搜索速度。一种基于Solr的体检数据搜索系统,由数据预处理模块、Solr搜索引擎平台搭建模块和网页 ...
【技术保护点】
一种基于Solr的体检数据搜索系统,其特征在于:由数据预处理模块、Solr搜索引擎平台搭建模块和网页查询模块依次连接组成;其中:所述的数据预处理模块用于对医院体检数据库中的所有体检报告进行预处理以及统计分析,以统计出所有体检项目并进行归纳分类,分析提取出关于B超和放射的所有诊断结果;所述的Solr搜索引擎平台搭建模块利用Solr建立全文搜索引擎,以实现索引创建以及索引搜索;所述的网页查询模块用于为用户提供查找的分类目录选择和关键字输入框,并将输出结果有序地显示给用户。
【技术特征摘要】
1.一种基于Solr的体检数据搜索系统,其特征在于:由数据预处理模块、Solr搜索引擎平台搭建模块和网页查询模块依次连接组成;其中:所述的数据预处理模块用于对医院体检数据库中的所有体检报告进行预处理以及统计分析,以统计出所有体检项目并进行归纳分类,分析提取出关于B超和放射的所有诊断结果;所述的Solr搜索引擎平台搭建模块利用Solr建立全文搜索引擎,以实现索引创建以及索引搜索;所述的网页查询模块用于为用户提供查找的分类目录选择和关键字输入框,并将输出结果有序地显示给用户。2.根据权利要求1所述的体检数据搜索系统,其特征在于:所述数据预处理模块对体检报告进行预处理以及分析,具体包括对缺失重要信息的体检报告进行删除,对体检报告中的异常值进行修正处理。3.根据权利要求1所述的体检数据搜索系统,其特征在于:所述数据预处理模块采用Python连接Oracle对体检报告结果表中的组合项目名称和体检项目名称进行统计并人为归纳分类;同时针对B超和放射的诊断分类目录,通过对个人总检单中的总检查小结进行分析,利用正则表达法得到关于B超和放射的诊断结果。4.根据权利要求1所述的体检数据搜索系统,其特征在于:所述Solr搜索引擎平台搭建模块实现索引创建的具体过程为:首先利用Solr的分词组件对待...
【专利技术属性】
技术研发人员:吴健,顾盼,周立水,邱奇波,邓水光,李莹,尹建伟,吴朝晖,
申请(专利权)人:浙江大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。