【技术实现步骤摘要】
应用程序调整方法及相关装置
[0001]本申请涉及数据处理
,具体涉及一种应用程序调整方法及相关装置。
技术介绍
[0002]大数据风控模型是医保局抓取骗保欺诈的重要手段。大数据风控模型基于大量的数据质量较高的医保数据。而医保的初始数据往往不适合进行大数据风控分析。因此需要对医保的初始数据进行统一处理,以得到规范化的数据,从而进行风控分析,可以通过初始医保数据处理程序对医保的初始数据进行处理,但是由于各个地方的医保局的字段名与字典值等参数可能不同,这使得大数据风控模型,在部署到不同城市、区域时,通常采用人工的方式对初始医保数据处理程序进行相应调整,导致了初始医保数据处理程序在进行调整时的效率较低。
技术实现思路
[0003]本申请实施例提供一种应用程序调整方法及相关装置,能够提对升初始医保数据处理程序进行调整时的效率较。
[0004]本申请实施例的第一方面提供了一种应用程序调整方法,所述方法包括:
[0005]获取初始医保数据处理程序中的第一参考文本信息;
[0006]对所述第一 ...
【技术保护点】
【技术特征摘要】
1.一种应用程序调整方法,其特征在于,所述方法包括:获取初始医保数据处理程序中的第一参考文本信息;对所述第一参考文本信息进行去停顿词处理,得到第一目标文本信息;对所述第一目标文本信息进行词过滤处理,以得到第二目标文本信息;从目标区域的医保数据中获取与所述第二目标文本信息对应的第三目标文本信息;根据所述第三目标文本信息对所述初始医保数据处理程序进行调整,以得到目标医保数据处理程序。2.根据权利要求1所述的方法,其特征在于,所述对所述第一目标文本信息进行词过滤处理,以得到第二目标文本信息,包括:对所述第一目标文本信息进行分词处理,以得到第一词集合,所述第一词集合中包括至少一个词;获取所述第一词集合中的每个词在所述第一文本信息中出现频率;获取所述第一词集合中的每个词的类别信息;根据所述第一词集合中的每个词在所述第一文本信息中出现频率和所述第一词集合中的每个词的类别信息,对所述第一文本信息进行词过滤处理,以得到所述第二目标文本信息。3.根据权利要求1所述的方法,其特征在于,所述对所述第一目标文本信息进行词过滤处理,以得到第二目标文本信息,包括:对所述第一目标文本信息进行分词处理,以得到第一词集合,所述第一词集合中包括至少一个词;对所述第一词集合中的词进行语义分析,以得到语义分析结果;根据所述语义分析结果对所述第一目标文本信息进行词过滤处理,以得到第二目标文本信息。4.根据权利要求2或3所述的方法,其特征在于,所述从目标区域的医保数据中获取与所述第二目标文本信息对应的第三目标文本信息,包括:获取所述医保数据中的第二参考文本信息,所述第二参考文本信息与所述第一参考文本信息的类型相同;确定所述第二目标文本信息中的每个词与所述第二参考文本信息中的每个词之间的相似度;根据所述相似度,从所述第二参考文本信息中确定出所述第三目标文本信息。5.根据权利要求4所述的方法,其特征在于,确定所述第二目标文本信息中的每个词与所述第二参考文本信息中的每个词之间的相似度,包括:获取所述第二目标文本信息中的每个词与所述第二参考文本信息中的每个词之间的第一类相似度;获取所述第二目标文本信息中的每个词与所述第二参考文本信息中的每个词之间的第二类相似度;根据所述第二目标文本信息中的每个词与所述第二参考文本信息中的每个词之间的第一类相似度和所述第二目标文本信息中的每个词与所述第二参考文本信息中的每个词之间的第二类相似度,进行权值运算,以得到所述第二目标...
【专利技术属性】
技术研发人员:满天龙,
申请(专利权)人:平安医疗健康管理股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。