多模型融合文本匹配方法、装置、设备和存储介质制造方法及图纸

技术编号:24456269 阅读:36 留言:0更新日期:2020-06-10 15:38
本发明专利技术涉及人工智能领域,提供一种多模型融合文本匹配方法、装置、设备和存储介质。方法包括:获取待处理的数据;通过第一神经网络模型将待处理的数据进行初筛,得到候选标准词,第一神经模型为双向门控循环单元模型、注意力模型以及softmax层串联结构的神经网络;通过第二神经网络模型将候选标准词实体初筛,得到标注实体,第二神经网络模型为条件随机场;将标注实体输入至第三神经网络模型,得到多个相似度,第三神经网络模型为卷积深度语义结构模型;获取多个相似度的权重,将相似度乘以对应的相似度的权重,得到多个标注实体得分;将标注得分对应的标注实体按照数值大小从大到小的排序,形成对应标准术语。提高文本匹配的准确率。

Multi model fusion text matching methods, devices, devices and storage media

【技术实现步骤摘要】
多模型融合文本匹配方法、装置、设备和存储介质
本专利技术涉及智能决策领域,尤其涉及一种多模型融合文本匹配方法、装置、设备和存储介质。
技术介绍
传统的处理过程需要大量专业人员根据实际情况进行匹配,将待匹配数据与国家发布的标准库中的名称的匹配。这种方式工作量巨大,效率非常低,且容易出现错误。随着互联网技术的发展,出现一系列基于字符串、词袋模型,或者利用机器学习、深度学习等方式实现文本匹配的方案,本质即为文本相似度计算进行匹配。在文本匹配领域,传统的文本匹配检索模型,如BM25,是基于词袋模型的精确匹配模型。但这个模型存在一定的问题,即无法处理词语的语义相关性。不能识别例如“头痛”和“头疼”等具有高度语义一致性的词语,也无法理解用词相近但语义不同的句子。而近年来新流行的利用深度学习进行端到端文本匹配模型比较好的解决了语义理解的问题,涌现出大量直接对样本进行深度文本匹配的建模方法,如深度语义结构模型(deepsemanticstructuredmodel,DSSM)、基于单词序列的卷积深度语义结构模型(convolutionaldeepsemanti本文档来自技高网...

【技术保护点】
1.一种多模型融合文本匹配方法,其特征在于,所述方法包括:/n获取待处理的数据;/n通过第一神经网络模型将所述待处理的数据进行初筛,得到候选标准词,所述第一神经模型为双向门控循环单元模型、注意力模型以及软最大值softmax层串联结构的神经网络;/n通过第二神经网络模型将所述候选标准词实体初筛,得到标注实体,所述第二神经网络模型为条件随机场;/n将所述标注实体输入至第三神经网络模型,得到多个相似度,所述第三神经网络模型为卷积深度语义结构模型;/n获取多个所述相似度的权重,将所述相似度乘以对应的所述相似度的权重,得到多个标注实体得分;/n将所述标注得分对应的标注实体按照数值大小从大到小的排序,形...

【技术特征摘要】
1.一种多模型融合文本匹配方法,其特征在于,所述方法包括:
获取待处理的数据;
通过第一神经网络模型将所述待处理的数据进行初筛,得到候选标准词,所述第一神经模型为双向门控循环单元模型、注意力模型以及软最大值softmax层串联结构的神经网络;
通过第二神经网络模型将所述候选标准词实体初筛,得到标注实体,所述第二神经网络模型为条件随机场;
将所述标注实体输入至第三神经网络模型,得到多个相似度,所述第三神经网络模型为卷积深度语义结构模型;
获取多个所述相似度的权重,将所述相似度乘以对应的所述相似度的权重,得到多个标注实体得分;
将所述标注得分对应的标注实体按照数值大小从大到小的排序,形成对应标准术语。


2.根据权利要求1所述的方法,其特征在于,所述通过第一神经网络模型将所述待处理的数据进行初筛,得到候选标准词,包括:
将所述待处理的数据输入至所述双向门控循环单元模型,通过所述双向门控循环单元模型将所述待处理的数据转换成向量矩阵,得到特征向量;
将所述特征向量输入至所述注意力模型,通过权值对所述特征向量进行加权求和,得到多个文本标签以及对应文本标签的概率;
将所述多个文本标签以及对应文本标签的概率通过softmax层分类,得到所述候选标准词。


3.根据权利要求1所述的方法,其特征在于,所述通过第二神经网络模型将所述候选标准词实体初筛,得到标注实体,所述第二神经网络模型为条件随机场,包括:
获取带标注的语料数据,所述带标注的语料数据至少包括词语、词性以及字在词语中的位置;
通过所述第二神经网络模型对所述医疗语料数据迭代,得到训练好的条件随机场模型;
获取所述候选标准词的词语、词性以及字在词语中的位置,得到所述候选标准词的词语特征;
将所述词语特征输入至所述训练好的条件随机场模型,通过所述训练好的条件随机场模型生成序列标注,得到标注实体。


4.根据权利要求1所述的方法,其特征在于,所述将所述标注实体输入至第三神经网络模型,得到多个相似度,所述第三神经网络模型为卷积深度语义结构模型,包括:
将所述标注实体输入至所述第三神经网络模型,所述第三神经网络模型为卷积深度语义结构模型;
通过链接卷积层对所述标注实体进行卷积操作,得到多个相似度;
将所述多个相似度链接池化层,通过窗口输出所述多个相似度中的最大值。


5.根据权利要求1所述的方法,其特征在于,所述获取待处理的数据之...

【专利技术属性】
技术研发人员:李勇
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1