基于深度学习BERT模型的煤监类案对比方法及装置制造方法及图纸

技术编号:32589868 阅读:36 留言:0更新日期:2022-03-09 17:23
本发明专利技术公开了基于深度学习BERT模型的煤监类案对比方法及装置,主要解决现有技术中存在的现有比对方法会忽略词义和语义,以及词与词之间的关系所隐藏的大量语义的信息,会导致这一部分信息丢失,导致对比搜索结果不准确的问题。该发明专利技术通过创建BERT分词器,搭建、训练BERT模型;通过BERT分词器读取煤监隐患信息数据库和待搜索隐患信息文本,并对其进行分词,然后通过模型bert得到文本语义向量的相似度;最终得出得分最高的隐患记录返回搜索结果;本发明专利技术能够更为准确的进行煤监类案对比计算。发明专利技术能够更为准确的进行煤监类案对比计算。发明专利技术能够更为准确的进行煤监类案对比计算。

【技术实现步骤摘要】
基于深度学习BERT模型的煤监类案对比方法及装置


[0001]本专利技术涉及煤监类案对比
,具体地说,是涉及基于深度学习BERT模型的煤监类案对比方法及装置。

技术介绍

[0002]煤监类案对比是国家煤矿安全生产监管数据分析平台建设项目的功能之一,具体是根据用户输入的“隐患描述”文本数据,对数据库中的各条“隐患描述”记录进行匹配,返回跟输入相似的隐患记录信息。
[0003]目前,煤监类案对比中仅仅是依靠关键词的匹配进行计算,即通过提取待搜索煤监隐患描述和数据库中的隐患描述中的关键词的方法,然后将关键词进行匹配,若匹配率高,则得分高,否则得分低。
[0004]依靠关键词匹配实现煤监类案隐患描述对比的方法往往会忽略词义和语义,以及词与词之间的关系所隐藏的大量语义的信息,会导致这一部分信息丢失,导致对比搜索结果不准确。

技术实现思路

[0005]本专利技术的目的在于提供基于深度学习BERT模型的煤监类案对比方法及装置,以解决现有比对方法会忽略词义和语义,以及词与词之间的关系所隐藏的大量语义的信息,会导致这一部分信本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习BERT模型的煤监类案对比方法,其特征在于,包括以下步骤:S1、建立BERT模型的词典,然后根据词典创建BERT分词器;S2、搭建、训练BERT模型,然后配置BERT模型的模式和加载预训练模型文件,加载文件中各层参数到搭建的BERT模型中,得到最终模型bert;S3、将煤监隐患信息数据库和待搜索隐患信息文本接入步骤S1的BERT分词器中,BERT分词器对煤监隐患信息数据库和待搜索隐患信息文本进行分词;S4、将步骤S3的分词结合步骤S2的模型bert得到文本语义向量;S5、计算煤监隐患信息数据库和待搜索隐患信息文本两者文本语义向量的相似度,然后根据相似度高低排序列表;S6、根据步骤S5的相似度排序列表,选取得分最高的隐患记录返回搜索结果。2.根据权利要求1所述的基于深度学习BERT模型的煤监类案对比方法,其特征在于,步骤S1的具体过程为:建立BERT模型的词典vocab.txt,然后基于词典vocab.txt创建BERT分词器tokenizer。3.根据权利要求2所述的基于深度学习BERT模型的煤监类案对比方法,其特征在于,步骤S2中搭建、训练BERT模型的具体过程为:利用深度学习框架搭建BERT网络,然后结合预训练模型得到最终的模型bert。4.根据权利要求3所述的基于深度学习BERT模型的煤监类案对比方法,其特征在于,步骤S3的具体过程为:BERT分词器tokenizer读取待搜索隐患信息文本InputText和煤监隐患信息数据库中的所有记录Records;然后对文本InputText和Records进行分词。5.根据权利要求4所述...

【专利技术属性】
技术研发人员:韩威宏刘俊良王怡君张国兵张登辉胥果曾丸畅
申请(专利权)人:成都四方伟业软件股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1