一种数据分析系统和方法,包括:数据采集单元,用于采集外部特征数据;数据库单元,用于存储特征与事件之间的相关性数据;计算单元,利用所述数据采集单元采集到的外部特征数据和所述数据库单元存储的特征与事件之间的相关性数据计算所述外部特征与事件之间的综合关联值;结果评估单元,对所述计算单元计算的所述相关值进行评估分级;结果输出单元,输出所述评估单元的评估分级结果。
【技术实现步骤摘要】
一种数据分析系统和方法
本专利技术涉及数据计算领域,具体涉及一种数据分析方法和系统,特别涉及一种大数据的分析方法和系统。
技术介绍
一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”,因此在数据就是生产力的今天,对大数据的分析、计算和处理能力就显的尤为重要。
技术实现思路
本专利技术的目的在于提供一种高效、精确的数据分析方法和系统。为达此目的,本专利技术采用以下技术方案:一种数据分析系统,包括:数据采集单元,用于采集外部特征数据;数据库单元,用于存储特征与事件之间的相关性数据;计算单元,利用所述数据采集单元采集到的外部特征数据和所述数据库单元存储的特征与事件之间的相关性数据计算所述外部特征与事件之间的综合关联值;结果评估单元,对所述计算单元计算的所述相关值进行评估分级;结果输出单元,输出所述评估单元的评估分级结果。一种数据分析方法,包括:利用数据采集单元采集外部特征数据;利用数据库单元存储特征与事件之间的相关性数据;通过计算单元利用所述数据采集单元采集到的外部特征数据和所述数据库单元存储的特征与事件之间的相关性数据计算所述外部特征与事件之间的综合关联值;利用结果评估单元对所述计算单元计算的所述相关值进行评估分级;利用结果输出单元输出所述评估单元的评估分级结果。作为本专利技术的优选实施例,数据采集单元通过外部传感器或人机交互界面采集所述外部特征数据。作为本专利技术的优选实施例,所述计算单元通过如下方式计算所述外部特征与事件之间的综合关联值:其中Fj为事件j与多个或全部特征1,2,3…i之间的综合关联值,rect(i)为矩形函数,i为真时rect(i)=1,i为假时rect(i)=0,对应的物理含义是:事件j的特征i发生或采集到时综合关联值Fj的分子部分考虑相关性数值Wij,而对于未发生或未采集到的特征i综合关联值Fj的分子部分不予考虑;Wij为数据库中存储的外部特征i与事件j之间的相关性数值。作为本专利技术的优选实施例,计算单元通过如下方式计算所述外部特征与事件之间的综合关联值:其中Fj为事件j与多个或全部特征1,2,3…i之间的综合关联值,rect(i)为矩形函数,i为真时rect(i)=1,i为假时rect(i)=0,对应的物理含义是:事件j的特征i发生或采集到时综合关联值Fj的分子部分考虑相关性数值Wij,而对于未发生或未采集到的特征i综合关联值Fj的分子部分不予考虑;Ki为特征权重值,该权重值可以根据需要而设定;Wij为数据库中存储的外部特征i与事件j之间的相关性数值。作为本专利技术的优选实施例,所述计算单元为分级嵌套计算单元,包括第一级分级嵌套计算单元到第N级分级嵌套计算单元,N为大于等于2的自然数。作为本专利技术的优选实施例,所述分级嵌套计算单元的第一分级计算嵌套计算单元采用公式计算综合关联值Fj;第二分级嵌套计算单元采用公式计算综合关联值Fb;Fb为事件b与多个或全部特征1,2,3…a之间的综合关联值,rect(a)为矩形函数,a为真时rect(a)=1,a为假时rect(a)=0;对应的物理含义是:事件b的特征a发生或采集到时综合关联值Fb的分子部分考虑相关性数值Vab,而对于未发生或未采集到的特征a综合关联值Fb的分子部分不予考虑相关性数值Vab;Ka为特征权重值,该权重值可以根据需要而设定。作为本专利技术的优选实施例,所述数据库单元中存储的特征与事件之间的相关性数据是根据已有的经验数据构建,上述相关性数据不必然是数字,其包括但不限于是比值、百分数、概率。作为本专利技术的优选实施例,所述数据分析系统和方法可以用于中医体质甄别。作为本专利技术的优选实施例,所述数据分析系统和方法可以用于数据分类。作为本专利技术的优选实施例,所述数据分析系统和方法可以用于风险度评估。作为本专利技术的优选实施例,所述数据分析系统和方法可以用于保险费用精算。作为本专利技术的优选实施例,所述数据分析系统和方法可以用于目标客户群体的分类。附图说明图1是本专利技术的数据分析系统的示意图。1数据采集单元;2数据库单元;3计算单元;4结果评估单元;5结果输出单元。具体实施方式下面结合附图并通过具体实施方式来进一步说明本专利技术的技术方案。体现本专利技术特征与优点的典型实施例将在以下的说明中详细叙述。应理解的是本专利技术能够在不同的实施例上具有各种的变化,其皆不脱离本专利技术的范围,且其中的说明及图示在本质上是当作说明之用,而非用以限制本专利技术。在我们的日常生活中,某一事件的发生往往与其事先、事中或事后的一些表象联系在一起,存在着某种关联。例如:不良驾驶习惯、酒驾、注意力分散、疲劳驾驶、交通违章、车辆状况、驾驶人年龄、驾驶人性格、驾驶人驾驶时的情绪、路面情况、天气情况、气温、行驶速度等与交通安全事故的发生存在某种关联。在更多的时候表象与事实的关联性更为复杂,例如:口干舌燥、四肢无力、面部失色等多种身体表象在中医理论中可能是由于身体处于阴虚质、阳虚质、痰湿质、气虚质、瘀血质、气郁质和和平质中的任何一种身体体质的外在表现,而对于阴虚体质质又可能是心阴虚态、肺阴虚态、肝阴虚态、胃阴虚态、心肾阴虚态、肺肾阴虚态或肝肾阴虚态;对于阳虚体质又可能是心阳虚态、脾阳虚态、肾阳虚态、心肾阳虚态或脾肾阳虚态;对于痰湿体质又可能是肺痰湿态或脾痰湿态;对于湿热体质又可能是肝胆湿热态、脾胃是湿热态、大肠湿热态或膀胱湿热态;对于气虚体质又可能是心气虚态、肺气虚态、脾气虚态、肾气虚态、心肺气虚态、肺脾气虚态、脾肾气虚态、心肾气虚态或心脾气虚态;淤血体质又可能是心淤血态或肝淤血态;气郁体质又可能是肝气郁态或胆气郁态,上述多种体质或多种态跟人体的多种外在表象联系在一起,或者说根据人体的多种外形表象理论上应该能推理计算出人体到底属于哪一种体质哪一种状态。还有在保险领域,例如:汽车商业保险通常需要根据不同的风险因素将目标客户分为不同风险程度的多种类型。因此,如何将根据上述事物的表象、外部特征计算推理出其内在的真实原因,或者说是根据事物的外在表象,外部特征将其分类归纳为不同的类别,显得尤为重要,其本质上就是一种对大数据分分析处理过程。下面以便秘为例说明本专利技术所述的大数据分析方法,这里需要特别声明的是该大数据分析方法可以应用于对多种数据的分析归类,便秘仅仅是出于说明问题的方便而列举的示例性应用实例,不得理解为对本专利技术的限制。在中医领域气虚体质人群便秘通常表现为大便不干不硬,虽有便意,但排便困难,用力努挣则汗出气短,便后乏力,面白神疲,肢倦懒言,舌淡苔白,脉弱;阴虚体质人群便秘通常表现为大便干结,如硬球状,形体消瘦,头晕耳鸣,两颧红赤,心烦少眠,潮热盗汗,腰膝酸软,舌红少苔,脉细数;阳虚质体质人群便秘通常表现为大便干或不干,排出困难,小便清长,面色晄白,四肢不温,腹中冷痛,或腰膝酸冷,舌淡苔白,脉沉迟;气郁体质人群便秘通常表现为大便干结,或不甚干结,欲便不得出,或便而不爽,肠鸣矢气,腹中胀痛,嗳气频作,纳食减少,胸胁本文档来自技高网...

【技术保护点】
一种数据分析系统,包括:数据采集单元,用于采集外部特征数据;数据库单元,用于存储特征与事件之间的相关性数据;计算单元,利用所述数据采集单元采集到的外部特征数据和所述数据库单元存储的特征与事件之间的相关性数据计算所述外部特征与事件之间的综合关联值;结果评估单元,对所述计算单元计算的所述相关值进行评估分级;结果输出单元,输出所述评估单元的评估分级结果。
【技术特征摘要】
1.一种数据分析系统,包括:数据采集单元,用于采集外部特征数据;数据库单元,用于存储特征与事件之间的相关性数据;计算单元,利用所述数据采集单元采集到的外部特征数据和所述数据库单元存储的特征与事件之间的相关性数据计算所述外部特征与事件之间的综合关联值;结果评估单元,对所述计算单元计算的所述相关值进行评估分级;结果输出单元,输出所述评估单元的评估分级结果。2.一种数据分析方法,包括:利用数据采集单元采集外部特征数据;利用数据库单元存储特征与事件之间的相关性数据;通过计算单元利用所述数据采集单元采集到的外部特征数据和所述数据库单元存储的特征与事件之间的相关性数据计算所述外部特征与事件之间的综合关联值;利用结果评估单元对所述计算单元计算的所述相关值进行评估分级;利用结果输出单元输出所述评估单元的评估分级结果。3.如权利要求1或2任一项所述的数据分析系统或方法,所述数据采集单元通过外部传感器和/或人机交互界面采集所述外部特征数据。4.如权利要求1-3任一项所述的数据分析系统或方法,所述计算单元通过如下方式计算所述外部特征与事件之间的综合关联值:其中Fj为事件j与多个或全部特征1,2,3…i之间的综合关联值,rect(i)为矩形函数,i为真时rect(i)=1,i为假时rect(i)=0,对应的物理含义是:事件j的特征i发生或采集到时综合关联值Fj的分子部分考虑相关性数值Wij,而对于未发生或未采集到的特征i综合关联值Fj的分子...
【专利技术属性】
技术研发人员:苏华巍,
申请(专利权)人:苏华巍,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。