【技术实现步骤摘要】
文本处理方法、装置、计算机设备和计算机可读存储介质
[0001]本申请涉及计算机
,具体而言,涉及一种文本处理方法、装置、计算机设备和计算机可读存储介质。
技术介绍
[0002]随着科学技术的发展,计算机设备已经进入到人们的工作生活中,人们可以将各种各样的信息或数据存储在计算机设备中,进行相应的管理、分析和决策,以提高效率。
[0003]相关技术中,例如,在医疗领域,可以将患者的住址、病例等待存储文本输入到计算机设备中,将这些待存储文本进行分词处理得到各待存储文本的至少一个分词结果,然后就可以根据各待存储文本的各分词结果对各待存储文本进行分类存储、结构化存储,或者根据各待存储文本输出符合特定规则的标准文本。
[0004]然而,由于待存储文本可能存在特殊符号和错别字,并且待存储文本记录的信息可能并不详细,因此,这种方案存在输出的标准文本与待存储文本之间差异较大、输出的标准文本的准确性较低的问题。
技术实现思路
[0005]本申请的目的在于提供一种文本处理方法、装置、计算机设备和计算机可读存 ...
【技术保护点】
【技术特征摘要】
1.一种文本处理方法,其特征在于,包括:获取输入文本的至少一个分词结果,各所述分词结果包括所述输入文本中至少一种类型的词组;根据各所述分词结果获取标准文本数据库中的至少一个待处理文本,所述标准文本数据库用于保存多个标准化文本,各标准化文本分别用于标识地址信息;分别确定所述输入文本和各所述待处理文本之间的差异值;根据各所述差异值,输出与所述输入文本匹配的标准文本。2.如权利要求1所述的文本处理方法,其特征在于,所述根据各所述分词结果获取标准文本数据库中的至少一个待处理文本,包括:根据各所述分词结果遍历所述标准文本数据库,获取与各所述分词结果匹配的至少一个标准词组,所述标准词组为根据各所述标准化文本切分得到的词组;根据各所述标准词组生成所述至少一个待处理文本。3.如权利要求1所述的文本处理方法,其特征在于,所述根据各所述分词结果获取标准文本数据库中的至少一个待处理文本,包括:按照各所述分词结果和预设顺序,依次从所述标准文本数据库中获取与各所述分词结果匹配的至少一个第一文本;基于各所述分词结果所指示的地址对应的变更后地址得到更新后分词结果,并按照所述更新后分词结果和所述预设顺序从所述标准文本数据库中获取与所述更新后分词结果匹配的至少一个第二文本;对各所述分词结果进行补齐处理,得到补齐后分词结果,并按照所述补齐后分词结果和所述预设顺序,依次从所述标准文本数据库中获取与所述更新后分词结果匹配的至少一个第三文本;根据各所述第一文本、各所述第二文本和各所述第三文本确定各所述待处理文本。4.如权利要求3所述的文本处理方法,其特征在于,所述基于各所述分词结果所指示的地址对应的变更后地址得到更新后分词结果,并按照所述更新后分词结果和所述预设顺序从所述标准文本数据库中获取与所述更新后分词结果匹配的至少一个第二文本,包括:从预设的地址变更数据库中获取各所述分词结果所指示的地址对应的变更后地址,基于所述变更后地址更新所述分词结果,得到更新后分词结果;按照所述更新后分词结果和所述预设顺序,依次从所述标准文本数据库中获取与所述更新后分词结果匹配的至...
【专利技术属性】
技术研发人员:祝莎莎,王琪,王文祥,唐力伟,赵大平,黄智勇,孙前方,黄克华,陈效华,李茜,
申请(专利权)人:卫宁健康科技集团股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。