一种供血浆者评价方法及系统技术方案

技术编号:23894931 阅读:25 留言:0更新日期:2020-04-22 08:03
本发明专利技术公开了一种供血浆者评价方法,属于数据处理分析的技术领域,该方法包括:提取多组数据源;对各组数据源进行数据初步预处理,以获取各组数据的各个输入特征;作相关性分析,以计算出不同输入特征之间的相关系数;根据所求取的各个相关系数,通过层次分析法计算出各组数据中各个输入特征所对应的权重;对各个输入特征进行归一化处理,并对各组数据中的各个输入特征分别进行加权求和;将加权求和的结果集通过机器学习算法进行自动聚类,以对各组数据所对应的浆员进行等级划分,以实现从浆站业务系统浆员的录入信息,来推断每个浆员的市场潜力,进而使浆站以及生物公司有针对性的对不同浆员采取不同的推广措施。

【技术实现步骤摘要】
一种供血浆者评价方法及系统
本专利技术属于数据处理分析的
,涉及相关性分析、层次分析、聚类分析、python计算机语言、数据特征工程、机器学习等
,具体而言,涉及一种供血浆者评价方法及系统。
技术介绍
浆站每天都会面对大量的新浆员、固定浆员、年轻浆员和年长浆员,浆员来自各个不同的地方,浆员的性别不同,浆员离浆站的距离也不同。大部分浆站目前虽然已经实现了采浆流程全自动化,大大提高了浆站业务流程的效率,但是,我国目前浆站的采浆量有削减的趋势,对照世界卫生组织给定的自给自足的标准,我国血浆采集量任然不足。与美国相比,美国人口只有我们的四分之一,而2017年他们的采浆量确是我国的2.5倍,所以我们在采浆方面还有很大的提升空间。目前,采浆站和生物公司为了拓展浆员业务、宣传及打广告标人群的确定,都是根据以往经验,或一两个标准来判断浆员的等级是优质浆员还是一般浆员,这样往往存在大量的判断误差,因为浆员的等级划分维度不止一两个,决策者很难把多个维度综合起来分析,也缺乏大量数据的支撑。基于上述,根据大量数据从多个维度来分析浆员的等级显得很有必要,目前市场上还没有系统的根据浆员的特征来为浆员划分等级的一种方法,这样就导致浆站宣传的盲目性,增加了浆站宣传的成本。
技术实现思路
鉴于此,为了解决现有技术存在的上述问题,本专利技术的目的在于提供一种供血浆者评价方法及系统以实现从浆站业务系统浆员的录入信息,来推断每个浆员的市场潜力,进而使浆站以及生物公司有针对性的对不同浆员采取不同的推广措施。r>本专利技术所采用的技术方案为:一种供血浆者评价方法,该方法包括:提取多组数据源;对各组数据源进行数据初步预处理,以获取各组数据的各个输入特征;作相关性分析,以计算出不同输入特征之间的相关系数;根据所求取的各个相关系数,通过层次分析法计算出各组数据中各个输入特征所对应的权重;对各个输入特征进行归一化处理,并对各组数据中的各个输入特征分别进行加权求和;将加权求和的结果集通过机器学习算法进行自动聚类;以自动聚类的输出为划分依据,对各组数据所对应的浆员进行等级划分。进一步地,各组数据的输入特征包括献浆频率、潜在献浆时间、浆员类型以及性别。进一步地,所述浆员类型分为固定浆员和非固定浆员,对固定浆员的定义标签为1,对非固定浆员的定义标签为0。进一步地,所述性别根据历史男女献浆人数比例分别对男女性别进行标签定义。进一步地,在相关性分析中,以献浆频率作为主要因素,并计算潜在献浆时间、浆员类型、性别分别与献浆频率之间的相关系数。进一步地,所述层次分析法包括:(a)根据各个相关系数和各个输入特征建立判断矩阵;(b)分析所述判断矩阵的一致性,若不满足一致性,则重新生产判断矩阵;若满足一致性,则计算得到各个输入特征的权重。层次分析法是指将复杂的多目标决策问题作为一个系统,将目标分解为多个目标或准则,进而分解为多指标(或准则、约束)的若干层次,通过定性指标模糊量化方法算出层次单排序(权数)和总排序,以作为目标(多指标)、多方案优化决策的系统方法。进一步地,所述自动聚类包括:(1)以各个输入特征分别进行加权求和的结果集作为机器学习算法的样本;(2)随机生成N个聚类中心;(3)根据样本与各个聚类中心的质心之间的距离,并将样本分为N个簇;(4)判断各个簇是否有变化,若为是,则重新调整各个聚类中心;若为否,则输出各个聚类中心,以各个聚类中心为划分依据。进一步地,所述机器学习算法采用K-Means聚类算法。本专利技术还公开了一种供血浆者评价系统,该系统包括依次通信连接的数据源采集模块、数据预处理模块、数据分析模块、层次分析模块和主运行程序模块,所述数据源采集模块用于采集多组数据源;所述数据预处理模块用于对各组数据源进行数据初步预处理并获取各组数据的各个输入特征;所述数据分析模块用于计算出不同输入特征之间的相关系数;所述层次分析模块用于计算出各组数据中各个输入特征所对应的权重,并获取加权求和的结果集;所述主运行程序模块用于调用机器学习算法,将加权求和的结果集进行自动聚类,并对各组数据所对应的浆员进行等级划分。进一步地,还包括存储模块,该存储模块用于对浆员的等级划分结果进行实时存储。本专利技术的有益效果为:1.采用本专利技术所提供的供血浆者评价方法及系统,其分析了浆员各个输入特征的相关系数,为层次分析构建判断矩阵提供依据,避免了人的主观臆断性;通过层次分析为每个输入特征加上权重,也避免了人为单方面的主观臆断;通过机器学习算法聚类分析,提出每个聚类中心,以此作为浆员等级划分的标准,每天更新一次,每天实时地动态地更新浆员等级,为浆员用户进行不同的推广。整个过程基于数据分析处理完全自动化;通过此方法及系统,能够合理的为浆员划分等级,浆站或生物公司就能有针对性地进行浆员业务拓展,并且可以看每天各个浆员等级的变化情况。附图说明图1是本专利技术所提供的供血浆者评价方法的工作流程框图;图2是本专利技术所提供的供血浆者评价方法中K-Means聚类算法的工作流程示意图;图3是本专利技术所提供的供血浆者评价系统的系统架构图。具体实施方式下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的模块或具有相同或类似功能的模块。下面通过参考附图描述的实施例是示例性的,仅用于解释本申请,而不能理解为对本申请的限制。相反,本申请的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。实施例1在本实施例中具体公开了一种供血浆者评价方法,通过该方法能够合理的为浆员划分等级,浆站或生物公司就能有针对性地进行浆员业务拓展,并且可以看每天各个浆员等级的变化情况,如图1所示,该方法在具体应用时包括以下步骤:1.数据源采集:从数据库中有针对性的提取原始数据,以获取多组数据源,其部分数据如下表1:1namesexagedoctimeregdatedonatetimesdonortype2苍旺佳14329/8/201923/9/2019213向白雪1318/10/20198/10/2019134王大东12726/8/201926/8/2019135林晓22726/8/201926/8/2019136王爱国15526/8/本文档来自技高网...

【技术保护点】
1.一种供血浆者评价方法,其特征在于,该方法包括:/n提取多组数据源;/n对各组数据源进行数据初步预处理,以获取各组数据的各个输入特征;/n作相关性分析,以计算出不同输入特征之间的相关系数;/n根据所求取的各个相关系数,通过层次分析法计算出各组数据中各个输入特征所对应的权重;/n对各个输入特征进行归一化处理,并对各组数据中的各个输入特征分别进行加权求和;/n将加权求和的结果集通过机器学习算法进行自动聚类;/n以自动聚类的输出为划分依据,对各组数据所对应的浆员进行等级划分。/n

【技术特征摘要】
1.一种供血浆者评价方法,其特征在于,该方法包括:
提取多组数据源;
对各组数据源进行数据初步预处理,以获取各组数据的各个输入特征;
作相关性分析,以计算出不同输入特征之间的相关系数;
根据所求取的各个相关系数,通过层次分析法计算出各组数据中各个输入特征所对应的权重;
对各个输入特征进行归一化处理,并对各组数据中的各个输入特征分别进行加权求和;
将加权求和的结果集通过机器学习算法进行自动聚类;
以自动聚类的输出为划分依据,对各组数据所对应的浆员进行等级划分。


2.根据权利要求1所述的供血浆者评价方法,其特征在于,各组数据的输入特征包括献浆频率、潜在献浆时间、浆员类型以及性别。


3.根据权利要求2所述的供血浆者评价方法,其特征在于,所述浆员类型分为固定浆员和非固定浆员,对固定浆员的定义标签为1,对非固定浆员的定义标签为0。


4.根据权利要求2所述的供血浆者评价方法,其特征在于,所述性别根据历史男女献浆人数比例分别对男女性别进行标签定义。


5.根据权利要求2所述的供血浆者评价方法,其特征在于,在相关性分析中,以献浆频率作为主要因素,并计算潜在献浆时间、浆员类型、性别分别与献浆频率之间的相关系数。


6.根据权利要求1所述的供血浆者评价方法,其特征在于,所述层次分析法包括:
(a)根据各个相关系数和各个输入特征建立判断矩阵;
(b)分析所述判断矩阵的一...

【专利技术属性】
技术研发人员:杨智钧杨佑禄白永明
申请(专利权)人:四川九八村信息科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1