【技术实现步骤摘要】
一种数据处理方法和系统
[0001]本专利技术涉及互联网
,尤其涉及一种数据处理方法和系统。
技术介绍
[0002]中医学作为中华民族传统文化的重要组成部分,至今已有数千年历史,其通过“望闻问切”四诊合参的方法,探求病因、病性、病位、分析病机,形成辨证,进而制定治疗手段。随着计算机技术的发展,带动了医学诊疗的信息化,互联网医院/在线诊治平台的出现使得患者与医生之间的交流变得便捷,为患者带来极大的便利。
[0003]然而,现有技术中还没有一种方案能够利用大规模诊断数据,从该数据中在线获取有益的参考信息的方案。
技术实现思路
[0004]本专利技术实施例提供一种数据处理方法和系统,可以提高医生工作效率。
[0005]本专利技术实施例提供了一种数据处理方法,包括:
[0006]获取在线信息数据,所述在线信息数据包括:用户的基本信息、自述信息、问诊单信息、以及舌照信息;
[0007]对所述在线信息数据进行过滤,得到目标信息数据;
[0008]对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量;
[0009]根据所述目标信息数据对应的目标特征向量以及预置的参考信息集合,获取所述在线信息数据对应的目标参考信息;所述参考信息集合包括:历史信息数据对应的历史特征向量以及所述历史信息数据对应的历史参考信息。
[0010]本专利技术实施例提供了一种数据处理系统,包括:
[0011]获取模块,用于获取在线信息数据,所述在线信息数据包括 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取在线信息数据,所述在线信息数据包括:用户的基本信息、自述信息、问诊单信息、以及舌照信息;对所述在线信息数据进行过滤,得到目标信息数据;对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量;根据所述目标信息数据对应的目标特征向量以及预置的参考信息集合,获取所述在线信息数据对应的目标参考信息;所述参考信息集合包括:历史信息数据对应的历史特征向量以及所述历史信息数据对应的历史参考信息。2.根据权利要求1所述的方法,其特征在于,所述对所述目标信息数据进行特征提取,得到所述目标信息数据对应的目标特征向量,包括:通过第一模型对所述目标信息数据进行特征提取,得到所述基本信息对应的第一特征向量、所述自述信息对应的第二特征向量、所述问诊单信息对应的第三特征向量、以及所述舌照信息对应的第四特征向量;将所述第一特征向量、所述第二特征向量、所述第三特征向量、所述第四特征向量进行拼接,得到初始特征向量;通过第二模型对所述初始特征向量进行处理,得到所述目标信息数据对应的目标特征向量。3.根据权利要求2所述的方法,其特征在于,所述第一模型中包括:第一映射表、关键词列表、第二映射表、以及第三映射表;所述通过第一模型对所述目标信息数据进行特征提取,得到所述用户的基本信息对应的第一特征向量、所述用户的自述信息对应的第二特征向量、所述用户的问诊单信息对应的第三特征向量、以及所述用户的舌照信息对应的第四特征向量,包括:根据所述目标信息数据中用户的基本信息与所述第一映射表中预置的基本信息之间的映射关系,提取得到所述用户的基本信息对应的第一特征向量;根据所述目标信息数据中用户的自述信息与所述关键词列表中预置的关键词之间的映射关系,提取得到所述用户的自述信息对应的第二特征向量;根据所述目标信息数据中用户的问诊单信息与所述第二映射表中预置的问诊单信息之间的映射关系,提取得到所述用户的问诊单信息对应的第三特征向量;根据所述目标信息数据中用户的舌照信息与所述第三映射表中预置舌照信息之间的映射关系,提取得到所述用户的舌照信息对应的第四特征向量。4.根据权利要求2所述的方法,其特征在于,所述第二模型包括多层感知器深度模型或主成分分析模型;所述通过第二模型对所述初始特征向量进行处理,得到所述目标信息数据对应的目标特征向量,包括:当所述参考信息集合中历史信息数据量大于或等于预设阈值,且所述历史信息数据带有标签时,通过所述多层感知器深度模型处理所述初始特征向量,得到所述目标信息数据对应的目标特征向量;当所述参考信息集合中历史信息数据量小于所述预设阈值,或所述参考信息集合中历史信息数据不带标签时,通过所述主成分分析模型处理所述初始特征向量,得到所述目标信息数据对应的目标特征向量。
5.根据权利要求1所述的方法,其特征在于,所述根据所述目标信息数据对应的目标特征向量以及预置的参考信息集合,获取所述在线信息数据对应的目标参考信息,包括:根据所述目标信息数据对应的目标特征向量,通过第三模型从参考信息集合中获取所述在线信息数据对应的目标参考信息;其中,所述第三模型通过如下步骤构建得到:确定所述目标特征向量的特征向量维度和相似性度量指标;其中,所述相似性度量指标包括:欧式距离度量和夹角余弦值度量;当所述目标特征向量的特征向量维度小于或等于预设维度,且所述目标特征向量的相似性度量指标使用欧式距离度量时,选择kd树构建所述第三模型;当所述目标特征向量的特征向量维度大于所述预设维度,或所述目标特征向量的相似性度量指标使用夹角余弦值度量时,选择球树构建所述第三模型。6.根据权利要求3所述的方法,其特征在于,通过如下步骤构建所述关键词列表:存储所述参考信息集合中每条历史用户的自述信息,生成自述文档集合;统计所述自述文档集合中每个词语出现的词频、所述每个词语在自述文档集合中出现的文档频数、句子范围内的词语对共现频数;根据所述词频、文档频数及词语对共现频数,选择所述参考信息集合中目标关键词构建关键词列表。7.一种数据处理系统,其特...
【专利技术属性】
技术研发人员:徐忆苏,
申请(专利权)人:北京悦熙兴中科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。