一种用户制造技术

技术编号:39522008 阅读:39 留言:0更新日期:2023-11-25 19:01
本发明专利技术提供了一种用户

【技术实现步骤摘要】
一种用户DRGs分组方法


[0001]本专利技术涉及数据处理
,具体而言,涉及一种用户
DRGs
分组方法


技术介绍

[0002]随着科技的发展,
DRGs
分组逐渐成为关注点,其不同于以往项目付费支付方式,而是主要考虑病例的综合情况进行分类付费
。 然而,现有医院信息系统上传的信息繁杂多样,没有进行文本和数据的分类,且多数采用人工分类,导致分组效能低下等一系列问题


技术实现思路

[0003]本专利技术的目的在于提供一种用户
DRGs
分组方法

[0004]本专利技术的实施例通过以下技术方案实现:一种用户
DRGs
分组方法包括以下步骤:获取历史用户就诊数据,并对历史用户就诊数据进行预处理,生成标准用户就诊数据;提取标准用户就诊数据的目标特征,并对目标特征依次进行编码和映射,生成一致性特征;构建
DRGs
分组模型,将标准用户就诊数据以及标准用户就诊数据的一致性特征和
DRGs
类别输入至
DRGs
分组模型中,对
DRGs
分组模型进行训练;获取最新用户就诊数据,将最新用户就诊数据输入至训练后的
DRGs
分组模型中,确定最新用户所属
DRGs
分组

[0005]进一步地,获取历史用户就诊数据,并对历史用户就诊数据进行预处理,生成标准用户就诊数据,包括以下子步骤:获取历史用户就诊数据,提取历史用户就诊数据的文本数据和数值数据,生成对应的文本数据序列和数值数据序列;对文本数据序列和数值数据序列分别进行预处理;将预处理后文本数据序列和预处理后数值数据序列的集合作为标准用户就诊数据

[0006]进一步地,对文本数据序列进行预处理的具体方法为:利用滑动窗口将文本数据序列划分若干个文本数据子序列,计算各个文本数据子序列的文本权重,将各个文本数据子序列中小于文本权重的词频对应的单词剔除,完成文本数据预处理

[0007]进一步地,文本数据子序列的文本权重
σ
的计算公式为:式中,
C
表示文本数据子序列的长度,
f
ck
表示第
c
个单位长度内第
k
个单词的词频,
K
表示第
c
个单位长度内单词个数,
f
c
表示第
c
个单位长度内的最大词频,
D
c
表示第
c
个单位长度的逆文档频率

[0008]进一步地,对数值数据序列进行预处理的具体方法为:利用分箱法对数值数据进
行清洗

[0009]进一步地,标准用户就诊数据的目标特征
m
的计算公式为:式中,
S
n+1
表示第
n+1
个就诊数据,
S
n
表示第
n
个就诊数据,
S
n
‑1表示第
n
‑1个就诊数据,
N
表示就诊数据总数

[0010]进一步地,
DRGs
分组模型包括依次连接的类别匹配层

数据匹配层和模型训练层;类别匹配层用于根据标准用户就诊数据的一致性特征和
DRGs
类别,构建类别匹配函数;数据匹配层用于根据类别匹配函数确定标准用户就诊数据的类别匹配权重;模型训练层用于将标准用户就诊数据作为
DRGs
分组模型的输入参数,将类别匹配权重作为学习率,对
DRGs
分组模型进行训练

[0011]进一步地,类别匹配函数
F
的表达式为:式中,
M
表示目标特征对应的矩阵,
I
表示单位矩阵,
T
表示
ρ
表示
DRGs
类别的权重

[0012]进一步地,标准用户就诊数据的类别匹配权重
θ
的计算公式为:式中,
F
表示类别匹配函数

[0013]进一步地,
DRGs
分组模型的损失函数
Loss
的表达式为:式中,
g
max
表示
DRGs
分组模型中神经元的最大幅值,
g
min
表示
DRGs
分组模型中神经元的最小幅值,
g
ave
表示
DRGs
分组模型中神经元的平均幅值,
G
表示
DRGs
分组模型的神经元个数

[0014]本专利技术实施例的技术方案至少具有如下优点和有益效果:(1)该用户
DRGs
分组方法获取不同格式的就诊数据,对就诊数据进行分类,对文本型就诊数据和数值型就诊数据采用不同的预处理方法,一方面可以保证对数据预处理的准确性,另一方面可以减少算法流程;(2)该用户
DRGs
分组方法通过提取就诊数据的特征来进行模型训练,并对特征进行编码和映射,可以丰富特征元素,保证后期进行模型训练时参数的多样性;(3)该用户
DRGs
分组方法构建的分组模型以历史用户就诊数据作为参数输入,充分考虑历史用户就诊数据所属
DRGs
类别和特征对模型训练的影响,构建类别匹配层和数据匹配层来计算类别匹配权重,类别匹配权重可作为模型训练的学习率,这样训练得到的模型更符合实际需求,具有通用性;
(4)该用户
DRGs
分组方法通过对数据预处理

提取特征以及构建分类模型,可以准确地得到
DRGs
分组结果

附图说明
[0015]图1为本专利技术实施例提供的用户
DRGs
分组方法的流程图

具体实施方式
[0016]为使本专利技术实施例的目的

技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例

通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计

[0017]如图1所示,本专利技术提供了一种用户
DRGs
分组方法,包括以下步骤:获取历史用户就诊数据,并对历史用户就诊数据进行预处理,生成标准用户就诊数据;提取标准用户就诊数据的目标特征,并对目标特征依次进行编码和映射,生成一致性特征;构建
DRGs
分组模型,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种用户
DRGs
分组方法,其特征在于,包括以下步骤:获取历史用户就诊数据,并对历史用户就诊数据进行预处理,生成标准用户就诊数据;提取标准用户就诊数据的目标特征,并对目标特征依次进行编码和映射,生成一致性特征;构建
DRGs
分组模型,将标准用户就诊数据以及标准用户就诊数据的一致性特征和
DRGs
类别输入至
DRGs
分组模型中,对
DRGs
分组模型进行训练;获取最新用户就诊数据,将最新用户就诊数据输入至训练后的
DRGs
分组模型中,确定最新用户所属
DRGs
分组
。2.
根据权利要求1所述的用户
DRGs
分组方法,其特征在于:所述获取历史用户就诊数据,并对历史用户就诊数据进行预处理,生成标准用户就诊数据,包括以下子步骤:获取历史用户就诊数据,提取历史用户就诊数据的文本数据和数值数据,生成对应的文本数据序列和数值数据序列;对文本数据序列和数值数据序列分别进行预处理;将预处理后文本数据序列和预处理后数值数据序列的集合作为标准用户就诊数据
。3.
根据权利要求2所述的用户
DRGs
分组方法,其特征在于:所述对文本数据序列进行预处理的具体方法为:利用滑动窗口将文本数据序列划分若干个文本数据子序列,计算各个文本数据子序列的文本权重,将各个文本数据子序列中小于文本权重的词频对应的单词剔除,完成文本数据预处理
。4.
根据权利要求3所述的用户
DRGs
分组方法,其特征在于:所述文本数据子序列的文本权重
σ
的计算公式为:式中,
C
表示文本数据子序列的长度,
f
ck
表示第
c
个单位长度内第
k
个单词的词频,
K
表示第
c
个单位长度内单词个数,
f
c
表示第
c
个单位长度内的最大词频,
D
c
表示第
c
个单位长度的逆文档频率
。5.
根据权利要求2所述的用户
DRGs
分组方法,其特征在于:所述对数值数据序列进行预处理的具体方法为:利用分箱法对数值数据进行清洗
。6.
根据权利要求1所述的用户
DRGs
分组方法,其特征...

【专利技术属性】
技术研发人员:岳小波张平王涌军
申请(专利权)人:四川互慧软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1