【技术实现步骤摘要】
一种适用于医学报告内容提取与结构化方法
本专利技术涉及医学领域,尤其涉及一种适用于医学报告内容提取与结构化方法。
技术介绍
医学报告是判断患者病情的重要依据,目前主要是以文本形式存在。医学报告转变为文本形式的存在可以更方便医生了解病人病情,及时掌握病人是否存在其他的基础病,方便医生做出正确的诊断,准确用药。但现在文本形式的医学报告内容存在没有统一标准结构化,结构化内容难以自动建立词库的问题。
技术实现思路
本专利技术提供的一种适用于医学报告内容提取与结构化方法,旨在解决现有技术中存在报告内容未结构化的问题。为实现上述目的,本专利技术采用以下技术方案:本专利技术的一种适用于医学报告内容提取与结构化方法,包括以下步骤:获取数据预处理后的文本数据;根据自然语言处理算法对所述文本数据进行处理得到结构文本数据;根据键值查找算法和知识图谱算法对所述结构文本数据进行内容提取输出文本内容。将经过数据清洗的文本数据通过自然语言算法进行处理,得到结构文本数据,之后根据键值查找算 ...
【技术保护点】
1.一种适用于医学报告内容提取与结构化方法,其特征在于,包括:/n获取数据预处理后的文本数据;/n根据自然语言处理算法对所述文本数据进行处理得到结构文本数据;/n根据键值查找算法和知识图谱算法对所述结构文本数据进行内容提取输出文本内容。/n
【技术特征摘要】
1.一种适用于医学报告内容提取与结构化方法,其特征在于,包括:
获取数据预处理后的文本数据;
根据自然语言处理算法对所述文本数据进行处理得到结构文本数据;
根据键值查找算法和知识图谱算法对所述结构文本数据进行内容提取输出文本内容。
2.根据权利要求1所述的一种适用于医学报告内容提取与结构化方法,其特征在于,获取数据预处理后的文本数据,包括:
对原始文本数据进行字符串纠正获取纠正文本数据;
根据字符串匹配算法对所述纠正文本数据进行处理获取文本数据。
3.根据权利要求2所述的一种适用于医学报告内容提取与结构化方法,其特征在于,根据自然语言处理算法对所述文本数据进行处理得到结构文本数据,包括:
获取断句数据库和器官数据库;
根据断句数据库对所述结构文本数据进行处理输出断句文本数据;
根据自然语言处理算法对所述断句文本数据进行计算并与器官数据库进行比对输出结构化文本数据。
4.根据权利要求3所述的一种适用于医学报告内容提取与结构化方法,其特征在于,根据键值查找算法和知识图谱算法对所述结构文本数据进行内容提取输出文本内容,包括:
对所述结构化文本数据进行内容提取获取内容数据;
根据键值查找算法对所述内容数据进行处理输出结构化词库;
根据知识图谱算法对所述结构化词库进行处理输出文本内容。
5.一种适用于医学报告内容提取与结构化装置,其特征在于,包括:
预处理模块,获取数据预处理后的文本数据;
结构文本内容模块,根据自然语言处理算法对所述文本数据进行处理得到结构文本数据;
文本内容模块,根据键值...
【专利技术属性】
技术研发人员:张路,俞富裕,高文琪,徐郁,
申请(专利权)人:杭州美腾科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。