一种基于深度学习模型的文本匹配方法组成比例

技术编号：39521659 阅读：9 留言：0更新日期：2023-11-25 19:00

本发明专利技术实施例提供了一种基于深度学习模型的文本匹配方法

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习模型的文本匹配方法、系统及介质

[0001]本专利技术涉及文本识别
，具体涉及一种基于深度学习模型的文本匹配方法
、
系统及介质
。

技术介绍

[0002]对于保险公司而言，在保险理赔过程中会采集到客户的大量数据，在理赔中需要将用户数据与保险公司内部数据进行相互关联以保证采集数据的标准化
。
由于互联网的发展，线上保险办理的业务越来越多，但是对于采集信息标准化仍然需要大量的人工介入
。
目前有些保险公司会引入
OCR
技术，但是
OCR
识别不准确或者用户上传影像较差时，一般仍需要采用人工介入的方式对
OCR
识别的文字进行修正或者采用字符匹配的方式进行标准化
。
采用字符匹配会丢失文字之间的语义信息，文本匹配的正确率往往也较低，从而造成大量人工介入，工作效率难以提升
。
[0003]基于上述技术问题，申请人提出了本申请的技术方案
。

技术实现思路

[0004]本专利技术的目的是提供了一种基于深度学习模型的文本匹配方法
、
系统及介质，提取
OCR
技术识别出的影像数据中关键信息的特征向量，基于该特征向量进行数据检索，并对检索出的多条特征数据分别进行匹配，最终确定文本匹配结果，避免遗漏影像数据中的文本之间的语义信息，能够对
OCR
技术识别出的文本进行修正，提升
OCR
识别...

【技术保护点】

【技术特征摘要】
1.
一种基于深度学习模型的文本匹配方法，其特征在于，包括：通过
OCR
技术识别出影像数据中的关键信息；获取所述关键信息的特征向量；基于所述关键信息的特征向量在预设数据库中进行数据检索，得到与所述关键信息相关的多条特征数据；将所述关键信息与所述多条特征数据分别进行匹配，确定所述影像数据的文本匹配结果
。2.
根据权利要求1所述的基于深度学习模型的文本匹配方法，其特征在于，所述获取所述关键信息的特征向量，包括：将所述关键信息输入到设定的特征向量生成模型中，得到所述关键信息的特征向量
。3.
根据权利要求2所述的基于深度学习模型的文本匹配方法，其特征在于，所述特征向量生成模型为
CoSENT
模型
。4.
根据权利要求1所述的基于深度学习模型的文本匹配方法，其特征在于，所述将所述关键信息与所述多条特征数据分别进行匹配，确定所述影像数据的文本匹配结果，包括：计算所述关键信息与每条特征数据之间的三个分数，所述三个分数分别是向量匹配分数
、
拼音相似分数
、
文本相似分数；针对每条特征数据，计算所述三个分数的加权平均分数，选取加权平均分数最高的特征数据作为所述影像数据的文本匹配结果
。5.
根据权利要求4所述的基于深度学习模型的文本匹配方法，其特征在于，所述三个分数的加权平均分数的权重分别为：向量匹配分数的权重为
0.6
，所述拼音相似分数的权重为
0...

【专利技术属性】
技术研发人员：陆培，李宁，
申请(专利权)人：金卫医保信息管理中国有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人