一种基于结直肠非结构化数据库的特征提取方法技术

技术编号:41646248 阅读:24 留言:0更新日期:2024-06-13 02:38
本发明专利技术公开了一种基于结直肠非结构化数据库的特征提取方法,涉及非结构化数据特征提取技术领域,包括:对结直肠非结构化数据库设定分类表单,将结直肠非结构化数据库内的用户数据按照分类表单进行分类数据对应;对用户数据进行划分,将用户数据划分为待定用户以及病灶用户,统计病灶用户的数量,将病灶用户的数量设定为病灶总样本数;对病灶用户的分类表单中的分类数据进行同类型特征提取,设定为相似特征,根据相似特征的分布数量在病灶总样本数中的占比设定不同的分类数据的影响值;本发明专利技术用于解决现有的结直肠的非结构化数据库内的数据缺乏系统的比对方法,导致数据库内的数据比对利用率较低的问题。

【技术实现步骤摘要】

本专利技术涉及非结构化数据特征提取,具体为一种基于结直肠非结构化数据库的特征提取方法


技术介绍

1、在进行非结构化特征提取的过程中,其目的都是将数据能够更好的与现有的用户特征进行比对,从而得到用户比对数据,根据用户比对数据得到对应的比对结果,从而能够为非结构化数据库的数据特征提取提供数据比对功能;

2、现有的技术中,在针对结直肠的病灶患者进行非结构化数据提取时,缺少一种能够针对非结构化数据的特征进行数据有效比对提取的方法,导致结直肠的非结构化数据库内的数据很难用于病灶筛查比对,例如在公开号为“cn110633368a”的申请文件中公开了“一种早期结直肠癌非结构化数据的深度学习分类方法”,该方法主要通过深度学习的方法对结直肠的非结构化数据进行分类,仅仅提供的是一种数据的分类方式,但是缺少一种对分类后的数据进行特征提取比对的方法,导致提取后的分类特征缺乏比对利用,最终使结直肠的非结构化的数据库的利用率降低。


技术实现思路

1、本专利技术旨在至少在一定程度上解决现有技术中的技术问题之一,通过对结直肠的本文档来自技高网...

【技术保护点】

1.一种基于结直肠非结构化数据库的特征提取方法,其特征在于,包括:对结直肠非结构化数据库设定分类表单,将结直肠非结构化数据库内的用户数据按照分类表单进行分类数据对应;

2.根据权利要求1所述的一种基于结直肠非结构化数据库的特征提取方法,其特征在于,对结直肠非结构化数据库设定分类表单,将结直肠非结构化数据库内的用户数据按照分类表单进行数据对应包括:将分类表单的分类数据划分为用户体征参数特征以及习惯特征。

3.根据权利要求2所述的一种基于结直肠非结构化数据库的特征提取方法,其特征在于,对病灶用户的分类表单中的分类数据进行同类型特征提取,设定为相似特征,根据相似特征的分...

【技术特征摘要】

1.一种基于结直肠非结构化数据库的特征提取方法,其特征在于,包括:对结直肠非结构化数据库设定分类表单,将结直肠非结构化数据库内的用户数据按照分类表单进行分类数据对应;

2.根据权利要求1所述的一种基于结直肠非结构化数据库的特征提取方法,其特征在于,对结直肠非结构化数据库设定分类表单,将结直肠非结构化数据库内的用户数据按照分类表单进行数据对应包括:将分类表单的分类数据划分为用户体征参数特征以及习惯特征。

3.根据权利要求2所述的一种基于结直肠非结构化数据库的特征提取方法,其特征在于,对病灶用户的分类表单中的分类数据进行同类型特征提取,设定为相似特征,根据相似特征的分布数量在病灶总样本数中的占比设定不同的分类数据的影响值包括:将用户体征参数特征和习惯特征对应的相似特征分别设置为用户体征参数相似特征和习惯相似特征,将用户体征参数相似特征和习惯相似特征对应的影响值分别设定为病灶用户体征参数影响值和病灶用户习惯影响值。

4.根据权利要求3所述的一种基于结直肠非结构化数据库的特征提取方法,其特征在于,病灶用户体征参数影响值的求取过程包括:将用户体征参数特征划分为性别子特征、年龄子特征以及bmi指数子特征;将性别子特征、年龄子特征以及bmi指数子特征对应的用户体征参数相似特征分别设置为性别相似子特征、年龄相似子特征以及bmi指数相似子特...

【专利技术属性】
技术研发人员:刘嘉孔大陆
申请(专利权)人:天津市肿瘤医院天津医科大学肿瘤医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1