一种数据处理方法和系统技术方案

技术编号:29923484 阅读:57 留言:0更新日期:2021-09-04 18:37
本发明专利技术实施例提供了一种数据处理方法和系统,其中的方法包括:获取在线信息数据,所述在线信息数据包括:用户的基本信息、自述信息、问诊单信息、以及舌照信息;对所述在线信息数据进行过滤,得到目标信息数据;对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量;根据所述目标信息数据对应的目标特征向量以及预置的参考信息集合,获取所述在线信息数据对应的目标参考信息;所述参考信息集合包括:历史信息数据对应的历史特征向量以及所述历史信息数据对应的历史参考信息。能够自动为医生提供丰富的参考信息,提高医生工作效率,提高医生工作的准确性。提高医生工作的准确性。提高医生工作的准确性。

【技术实现步骤摘要】
一种数据处理方法和系统


[0001]本专利技术涉及互联网
,尤其涉及一种数据处理方法和系统。

技术介绍

[0002]中医学作为中华民族传统文化的重要组成部分,至今已有数千年历史,其通过“望闻问切”四诊合参的方法,探求病因、病性、病位、分析病机,形成辨证,进而制定治疗手段。随着计算机技术的发展,带动了医学诊疗的信息化,互联网医院/在线诊治平台的出现使得患者与医生之间的交流变得便捷,为患者带来极大的便利。
[0003]然而,现有技术中还没有一种方案能够利用大规模诊断数据,从该数据中在线获取有益的参考信息的方案。

技术实现思路

[0004]本专利技术实施例提供一种数据处理方法和系统,可以提高医生工作效率。
[0005]本专利技术实施例提供了一种数据处理方法,包括:
[0006]获取在线信息数据,所述在线信息数据包括:用户的基本信息、自述信息、问诊单信息、以及舌照信息;
[0007]对所述在线信息数据进行过滤,得到目标信息数据;
[0008]对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量;
[0009]根据所述目标信息数据对应的目标特征向量以及预置的参考信息集合,获取所述在线信息数据对应的目标参考信息;所述参考信息集合包括:历史信息数据对应的历史特征向量以及所述历史信息数据对应的历史参考信息。
[0010]本专利技术实施例提供了一种数据处理系统,包括:
[0011]获取模块,用于获取在线信息数据,所述在线信息数据包括:用户的基本信息、自述信息、问诊单信息、以及舌照信息;
[0012]过滤模块,用于对所述在线信息数据进行过滤,得到目标信息数据;
[0013]提取模块,用于对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量;
[0014]检索模块,用于根据所述目标信息数据对应的目标特征向量以及预置的参考信息集合,获取所述在线信息数据对应的目标参考信息;所述参考信息集合包括:历史信息数据对应的历史特征向量以及所述历史信息数据对应的历史参考信息。
[0015]本专利技术实施例包括以下优点:
[0016]本专利技术实施例可以通过获取在线信息数据,对在线信息数据过滤得到目标信息数据之后,对目标信息数据进行特征提取,得到目标特征向量,并根据目标特征向量从参考信息集合中获取得到目标参考信息,能够根据在线信息数据,自动为医生提供丰富的参考信息,该参考信息作为中间处理结果,可以辅助医生进行后续的数据分析过程,提高医生的工
作效率。
附图说明
[0017]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0018]图1示出了本专利技术的一种数据处理方法实施例一的流程图;
[0019]图2示出了本专利技术的一种数据处理方法实施例二的流程图;
[0020]图3示出了本专利技术的一种数据处理系统实施例的结构框图。
具体实施方式
[0021]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0022]方法实施例一
[0023]参照图1,示出了本专利技术的一种数据处理方法实施例一的流程图,所述方法具体可以包括:
[0024]步骤101,获取在线信息数据,所述在线信息数据包括:用户的基本信息、自述信息、问诊单信息、以及舌照信息。
[0025]在本实施例中,用户可通过线上平台上传信息数据,所述线上平台指建立问诊方(用户)与被问诊方(医生)的线上问诊链路,如互联网医院、线上诊治平台、医院客户端等。所述线上平台获取在线用户的信息数据,所述用户的信息数据包括:用户的基本信息、自述信息、问诊单信息、以及舌照信息。
[0026]所述用户的基本信息可以包括用户年龄、身高、体重、疾病史、过敏史等信息,归属于中医学“问”的范畴。基本信息所包含的项目内容可以是本领域技术人员根据中医所需,提前在线上平台设置,本专利技术对基本信息所包含的项目内容不作具体限制。
[0027]所述用户的自述信息包含用户对自身或者所需求诊的不适症状的描述,可以包含主症状、附加症状及程度、性质等方面的描述,归属于中医学“问”的范畴。
[0028]所述用户的舌照信息是用户通过线上平台上传的舌像所包含的舌色、舌暗、齿痕、裂纹等舌体信息。归属于中医学“望”的范畴。
[0029]所述用户的问诊单信息可以是医生通过线上平台获取用户的基本信息、自述信息、以及舌照信息等信息之后,综合考虑病症及其中医辨证的特点,针对特定病症设计的特定问题及相应选项供用户完善后的信息;也可以是线上平台根据用户的基本信息、自述信息、以及舌照信息等信息,自动生成的针对特定病症设计的特定问题及相应选项供用户完善后的信息。如针对用户描述月经不调信息之后,线上平台自动生成包含:“身体疼痛情况”、“流产情况”、“经量、经质情况”等特定问题的问卷,供用户填写,所述问诊单信息即为用户填写后的该问卷所包含的信息。归属于中医学“问”的范畴。
[0030]可选的,可以将所述用户的基本信息、问诊单信息以及舌照信息对应的目标信息数据以结构化形式表示;将所述用户的自述信息对应的目标信息数据以自然语言文本形式表示。以便于对用户信息数据的处理与分析。
[0031]步骤102,对所述在线信息数据进行过滤,得到目标信息数据。
[0032]对所述在线信息数据进行过滤,可初步对用户信息进行处理,减少数据处理量,例如用户的自述信息为月经不调,可过滤掉用户过敏史等信息。
[0033]步骤103,对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量。
[0034]需要说明的是,本专利技术考虑到用户信息数据一般在特定区间段考虑比较有意义。例如用户的基本信息中包含年龄、身高、体重等信息,而年龄、身高、体重均是(离散或连续)数值类型,月经不调出现年龄一般在15-45岁之间,不同年龄段内的症状表现可能会有差异,如超过50岁或10岁以下很少会有相应症状,可以将年龄1-10划分为第一区间,该区间特征为未发育、11-50划分为第二区间,该区间特征为已发育。另外,身高和体重结合,可以将特征记录为过瘦、肥胖等,在一定指标下可以判断用户的身体状态;疾病史、过敏史等信息则可以直接进行特征分类。因此需要划分不同特征,便于对数据的归类分级分析。
[0035]本领域技术人员可以根据大数据如历史信息数据,预先设置特征信息,如本专利技术可以结合中医辩证中对舌像的观察,为舌照信息设置16种特征,每个特征还可以按照其程度和/或性质进一步细分。所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取在线信息数据,所述在线信息数据包括:用户的基本信息、自述信息、问诊单信息、以及舌照信息;对所述在线信息数据进行过滤,得到目标信息数据;对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量;根据所述目标信息数据对应的目标特征向量以及预置的参考信息集合,获取所述在线信息数据对应的目标参考信息;所述参考信息集合包括:历史信息数据对应的历史特征向量以及所述历史信息数据对应的历史参考信息。2.根据权利要求1所述的方法,其特征在于,所述对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量,包括:通过第一模型对所述目标信息数据进行特征提取,得到所述基本信息对应的第一特征向量、所述自述信息对应的第二特征向量、所述问诊单信息对应的第三特征向量、以及所述舌照信息对应的第四特征向量;将所述第一特征向量、所述第二特征向量、所述第三特征向量、所述第四特征向量进行拼接,得到初始特征向量;通过第二模型对所述初始特征向量进行处理,得到所述目标信息数据对应的目标特征向量。3.根据权利要求2所述的方法,其特征在于,所述第一模型中包括:第一映射表、关键词列表、第二映射表、以及第三映射表;所述通过第一模型对所述目标信息数据进行特征提取,得到所述用户的基本信息对应的第一特征向量、所述用户的自述信息对应的第二特征向量、所述用户的问诊单信息对应的第三特征向量、以及所述用户的舌照信息对应的第四特征向量,包括:根据所述目标信息数据中用户的基本信息与所述第一映射表中预置的基本信息之间的映射关系,提取得到所述用户的基本信息对应的第一特征向量;根据所述目标信息数据中用户的自述信息与所述关键词列表中预置的关键词之间的映射关系,提取得到所述用户的自述信息对应的第二特征向量;根据所述目标信息数据中用户的问诊单信息与所述第二映射表中预置的问诊单信息之间的映射关系,提取得到所述用户的问诊单信息对应的第三特征向量;根据所述目标信息数据中用户的舌照信息与所述第三映射表中预置舌照信息之间的映射关系,提取得到所述用户的舌照信息对应的第四特征向量。4.根据权利要求2所述的方法,其特征在于,所述第二模型包括多层感知器深度模型或主成分分析模型;所述通过第二模型对所述初始特征向量进行处理,得到所述目标信息数据对应的目标特征向量,包括:当所述参考信息集合中历史信息数据量大于或等于预设阈值,且所述历史信息数据带有标签时,通过所述多层感知器深度模型处理所述初始特征向量,得到所述目标信息数据对应的目标特征向量;当所述参考信息集合中历史信息数据量小于所述预设阈值,或所述参考信息集合中历史信息数据不带标签时,通过所述主成分分析模型处理所述初始特征向量,得到所述目标信息数据对应的目标特征向量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标信息数据对应的目标特征向量以及预置的参考信息集合,获取所述在线信息数据对应的目标参考信息,包括:根据所述目标信息数据对应的目标特征向量,通过第三模型从参考信息集合中获取所述在线信息数据对应的目标参考信息;其中,所述第三模型通过如下步骤构建得到:确定所述目标特征向量的特征向量维度和相似性度量指标;其中,所述相似性度量指标包括:欧式距离度量和夹角余弦值度量;当所述目标特征向量的特征向量维度小于或等于预设维度,且所述目标特征向量的相似性度量指标使用欧式距离度量时,选择kd树构建所述第三模型;当所述目标特征向量的特征向量维度大于所述预设维度,或所述目标特征向量的相似性度量指标使用夹角余弦值度量时,选择球树构建所述第三模型。6.根据权利要求3所述的方法,其特征在于,通过如下步骤构建所述关键词列表:存储所述参考信息集合中每条历史用户的自述信息,生成自述文档集合;统计所述自述文档集合中每个词语出现的词频、所述每个词语在自述文档集合中出现的文档频数、句子范围内的词语对共现频数;根据所述词频、文档频数及词语对共现频数,选择所述参考信息集合中目标关键词构建关键词列表。7.一种数据处理系统,其特...

【专利技术属性】
技术研发人员:徐忆苏
申请(专利权)人:北京悦熙兴中科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1