【技术实现步骤摘要】
一种铁路文本命名实体识别方法及装置
本专利技术涉及信息处理
,尤其涉及一种铁路文本命名实体识别方法及装置。
技术介绍
铁路具有技术复杂度高、运行速度快、载客量大、行车间隔小、救援难度大、安全性要求高等特点,局部故障很容易造成连锁反应和放大效应,这对铁路运营过程中突发故障的安全预警和快速处置提出了新的更高要求。铁路安全领域实体名称结构复杂,名称缩略语众多、专业术语性强,且安全文本数据多以Word、Excel等形式存储,并以纸质形式存档,受限于传统技术限制,难以从原始数据库中高效抽取数据有效信息来挖掘蕴藏在数据中的有效信息,而提取铁路安全文本数据中蕴藏的潜在有效信息能够大幅提升铁路安全数据利用价值,进一步为铁路智能化运维提供辅助决策。因此,如何有效的在铁路安全文本中实现命名实体识别已经成为业界亟待解决的问题。
技术实现思路
本专利技术实施例提供一种铁路文本命名实体识别方法及装置,用以解决上述
技术介绍
中提出的技术问题,或至少部分解决上述
技术介绍
中提出的技术问题。第一方面,本专利技术 ...
【技术保护点】
1.一种铁路文本命名实体识别方法,其特征在于,包括:/n对原始铁路文本数据进行预处理,得到预处理铁路文本数据信息;/n将所述预处理铁路文本数据信息输入预设BERT模型,得到铁路文本向量信息;/n将所述铁路文本向量信息输入预设BiLSTM-CRF模型,得到铁路文本命名实体识别结果信息;/n其中,所述预设BERT模型是通过带实体标记的样本预处理铁路文本数据信息训练得到,所述预设BiLSTM-CRF模型是通过带实体标记和语序标记的样本铁路文本向量信息训练得到。/n
【技术特征摘要】
1.一种铁路文本命名实体识别方法,其特征在于,包括:
对原始铁路文本数据进行预处理,得到预处理铁路文本数据信息;
将所述预处理铁路文本数据信息输入预设BERT模型,得到铁路文本向量信息;
将所述铁路文本向量信息输入预设BiLSTM-CRF模型,得到铁路文本命名实体识别结果信息;
其中,所述预设BERT模型是通过带实体标记的样本预处理铁路文本数据信息训练得到,所述预设BiLSTM-CRF模型是通过带实体标记和语序标记的样本铁路文本向量信息训练得到。
2.根据权利要求1所述铁路文本命名实体识别方法,其特征在于,在所述将所述预处理铁路文本数据信息输入预设BERT模型,得到铁路文本向量信息的步骤之前,所述方法还包括:
获取样本预处理铁路文本数据信息,通过BIO标记对样本预处理铁路文本数据信息进行命名实体标记,并在样本预处理铁路文本数据信息的句首和句尾分别插入CLS标记和SEP标记,得到带实体标记的样本预处理铁路文本向量信息;
对所述带实体标记的样本预处理铁路文本向量信息的语序信息进行编码处理,得到带实体标记和语序标记的样本铁路文本向量信息;
根据所述带实体标记和语序标记的样本铁路向量数据信息对BERT模型进行训练,当BERT模型损失函数稳定收敛时,得到预设BERT模型。
3.根据权利要求1所述铁路文本命名实体识别方法,其特征在于,在所述将所述铁路文本向量信息输入预设BiLSTM-CRF模型,得到铁路文本命名实体识别结果信息的步骤之前,所述方法还包括:
获取带实体标记和语序标记的样本铁路文本向量信息,根据所述带实体标记和语序标记的样本铁路文本向量信息对BiLSTM模型进行训练,输出带语序标签的样本铁路文本上下文信息,当满足第一预设训练条件,得到训练好的BiLSTM模型;
根据所述带语序标签的样本铁路文本上下文信息对CRF模型进行训练,当满足第二预设训练条件,得到训练好的CRF模型,根据所述训练好的BiLSTM模型的和训练好的CRF模型得到预设BiLSTM-CRF模型。
4.根据权利要求2所述铁路文本命名实体识别方法,其特征在于,所述根据所述带实体标记和语...
【专利技术属性】
技术研发人员:杨连报,王同军,李新琴,董兴芝,薛蕊,李平,朱建生,马小宁,马志强,刘军,吴艳华,邹丹,王喆,代明睿,张晓栋,程智博,赵冰,
申请(专利权)人:中国铁道科学研究院集团有限公司电子计算技术研究所,北京经纬信息技术有限公司,中国铁道科学研究院集团有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。