【技术实现步骤摘要】
医疗票据信息的自动录入方法、系统、设备及存储介质
[0001]本专利技术涉及金融保险数据处理
,具体地涉及一种医疗票据信息的自动录入方法、一种医疗票据信息的自动录入系统、一种电子设备和一种机器可读存储介质。
技术介绍
[0002]保险公司与医疗机构的信息系统通常是不共享的,在保险理赔案件中,保险公司的业务人员通常需要申请理赔的用户提供医疗机构开具的医疗票据,然后由业务人员根据用户提供的医疗票据,将医疗票据的信息,通过人工录入方式,记录至保险公司的信息系统。但由于医疗票据中涉及大量药品信息、医疗专业术语等,在人工录入医疗票据信息时,录入工作较繁琐,耗时较长,录入信息准确率呈不稳定性。同时,由于赔付金核算和案件审核监控都依赖于录入的医疗票据信息,则申请理赔的用户也很难在较短时间内得到保险赔付金,理赔案件结案时间较长,随着业务量增加,人力成本也会显著上升。
[0003]目前,由专家制定整理字符的规则,并采用光学字符识别(Optical Character Recognition,OCR)技术,可减少人工参与。然而,光 ...
【技术保护点】
【技术特征摘要】
1.一种医疗票据信息的自动录入方法,其特征在于,该自动录入方法包括:对医疗票据图像进行光学字符识别,以获得票据字符集合;将所述票据字符集合输入至机器模型,以确定票据类别标签并形成票据类别标签集合,所述机器模型用于确定所述票据字符集合中各票据字符对应的票据类别标签;基于所述票据类别标签集合,从所述票据字符集合确定与各票据类别标签对应的票据字符子集,以构成结构化数据;将所述结构化数据存储于票据信息数据库,以使得所述票据信息数据库在被查询时返回基于所述结构化数据表示的医疗票据信息。2.根据权利要求1所述的医疗票据信息的自动录入方法,其特征在于,所述对医疗票据图像进行光学字符识别,以获得票据字符集合,包括:在医疗票据图像上按识别顺序布置待识别框;确定所述待识别框内的票据字符;按所述识别顺序,将确定的票据字符形成票据字符集合。3.根据权利要求2所述的医疗票据信息的自动录入方法,其特征在于,所述将所述票据字符集合输入至机器模型,以确定票据类别标签并形成票据类别标签集合,包括:将所述票据字符集合输入至训练后的BERT模型中,以从所述BERT模型中提取嵌入向量;将所述嵌入向量输入至训练后的单层神经网络模型中,以确定与作为所述BERT模型输入的各票据字符对应的票据类别标签。4.根据权利要求1所述的医疗票据信息的自动录入方法,其特征在于,所述基于所述票据类别标签集合,从所述票据字符集合确定与各票据类别标签对应的票据字符子集,以构成结构化数据,包括:将所述票据类别标签集合中的票据类别标签,作为指定数据结构的字段;通过与各票据类别标签对应的票据字符,将所述票据字符作为在所述指定数据结构中与所述字段对应的值;通过所述指定数据结构中字段和对应字段的值,按指定数据格式构成结构化数据。5.根据权利要求1所述的医疗票据信息的自动录入方法,其特征在于,其中,所述机器模型包括预训练的BERT模型和单层神经网络模型;所述单层神经网络模型用于将从所述BERT模型中提取的嵌入向量,转换为票据类别标签空间内的预测输出向量;所述预测输出向量中任意一个预测值是与一个票据类别标签对应的;与预测输出向量中最大预测值对应的票据类别标签,作为与输入所述机器模型的票据字符对应的票据类别标签。6.根据权利要求5所述的医疗票据信息的自动录入方法,其特征在于,所述机器模型的训练方法包括:响应于用户操作或用户设备的指令,分别标记普通医疗票据信息和异常医疗票据信息中票据字符的票据类别标签,以获得训练数据,所述训练数据包括标记的票据字符和票据类别标签;基于所述训练数据,对所述BERT模型和所述单层神经网络模型进行训练。
7.根据权利要求6所述的医疗票据信息的自动录入方法,其特征在于,所述响应于用户操作或用户设备的指令,分别标记普通医疗票据信息和异常医疗票据信息...
【专利技术属性】
技术研发人员:苑海川,杨亚刚,谭建斌,张钦格,刘璐,
申请(专利权)人:中国人民财产保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。