基于文本词向量的预案方法、装置、存储介质及电子设备制造方法及图纸

技术编号:33911182 阅读:18 留言:0更新日期:2022-06-25 19:29
本申请公开了一种基于文本词向量的预案方法、装置、存储介质及电子设备。其中,该基于文本词向量的预案方法采用获取待处理的应急预案文本;对应急预案文本进行分词处理和词向量转化,得到应急预案文本的关键词向量;对关键词向量进行语义聚合处理,得到应急预案文本的语义向量;基于语义向量确定应急预案文本的类型;根据应急预案文本的类型对应急预案文本进行相应的数字化预案。本方案通过将应急预案文本转化为数字化预案,可以提高应急预案文本的实用性、可操作性和应用性。可操作性和应用性。可操作性和应用性。

【技术实现步骤摘要】
基于文本词向量的预案方法、装置、存储介质及电子设备


[0001]本申请实施例涉及数据处理领域,具体涉及一种基于文本词向量的预案方法、装置、存储介质及电子设备。

技术介绍

[0002]应急预案是指政府或企业为降低安全生产突发事件后果的严重程度,以对危险源进行评价和灾害事故后果预测为依据,预先制定的事件控制和抢险救灾方案。
[0003]目前的应急预案大多是以纸质文件或电子文档的形式进行存储的,而文件编写的质量参差不齐,可操作性较差,给应急预案的响应、应急指挥以及应急演练带来了极大的不便,不利于各类应急资源快速运达和迅速投入使用,严重影响应急指挥处置效率。

技术实现思路

[0004]本申请实施例提供一种基于文本词向量的预案方法、装置、存储介质及电子设备,可以提高应急预案文本的实用性。
[0005]第一方面,本申请实施例提供了一种基于文本词向量的预案方法,包括:
[0006]获取待处理的应急预案文本;
[0007]对所述应急预案文本进行分词处理和词向量转化,得到所述应急预案文本的关键词向量;
[0008]对所述关键词向量进行语义聚合处理,得到所述应急预案文本的语义向量;
[0009]基于所述语义向量确定所述应急预案文本的类型;
[0010]根据所述应急预案文本的类型对所述应急预案文本进行相应的数字化预案。
[0011]在本申请实施例提供的基于文本词向量的预案方法中,所述对所述应急预案文本进行分词处理和词向量转化,得到所述应急预案文本的关键词向量,包括:
[0012]将所述应急预案文本输入至概率统计分词模型进行分词,并基于分词结果选取关键词;
[0013]通过Word2Vec模型获取所述关键词对应的关键词向量。
[0014]在本申请实施例提供的基于文本词向量的预案方法中,所述将所述应急预案文本输入至概率统计分词模型进行分词,并基于分词结果选取关键词,包括:
[0015]对所述应急预案文本进行分词,并根据分词结果选取候选关键词;
[0016]对所述应急预案文本进行大规模预料学习,得到对应的主题模型;
[0017]基于所述主题模型从所述候选关键词中选取关键词。
[0018]在本申请实施例提供的基于文本词向量的预案方法中,所述基于所述主题模型从所述候选关键词中选取关键词,包括:
[0019]根据所述主题模型确定所述应急预案文本的主题分布和关键词分布;
[0020]基于所述主题分布和所述关键词分布确定所述预案文本和所述候选关键词的主题相似度;
[0021]根据所述主题相似度对所述候选关键词进行排序,并根据排序结果从所述候选关键词中选取关键词。
[0022]在本申请实施例提供的基于文本词向量的预案方法中,所述根据所述应急预案文本的类型对所述应急预案文本进行相应的数字化预案,包括:
[0023]根据所述应急预案文本的类型获取相应的知识图谱;
[0024]基于所述知识图谱对所述应急预案文本进行数字化转换,得到所述应急预案文本的数字化预案。
[0025]在本申请实施例提供的基于文本词向量的预案方法中,所述基于所述知识图谱对所述应急预案文本进行数字化转换,得到所述应急预案文本的数字化预案,包括:
[0026]根据所述知识图谱进行数字预案模型构建,得到与所述应急预案文本对应的数字预案模型;
[0027]将所述应急预案文本输入至所述所述数字预案模型进行处理,得到所述应急预案文本的数字化预案。
[0028]第二方面,本申请实施例提供了一种基于文本词向量的预案装置,包括:
[0029]文本获取单元,用于获取待处理的应急预案文本;
[0030]向量获取单元,用于对所述应急预案文本进行分词处理和词向量转化,得到所述应急预案文本的关键词向量;
[0031]语义聚合单元,用于对所述关键词向量进行语义聚合处理,得到所述应急预案文本的语义向量;
[0032]类型确定单元,用于基于所述语义向量确定所述应急预案文本的类型;
[0033]数字预案单元,用于根据所述应急预案文本的类型对所述应急预案文本进行相应的数字化预案。
[0034]在本申请实施例提供的基于文本词向量的预案装置中,所述向量获取单元用于:
[0035]将所述应急预案文本输入至概率统计分词模型进行分词,并基于分词结果选取关键词;
[0036]通过Word2Vec模型获取所述关键词对应的关键词向量
[0037]第三方面,本申请实施例提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,执行本申请实施例所提供的任一种所述的基于文本词向量的预案方法中的步骤。
[0038]第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现本申请实施例所提供的任一种所述的基于文本词向量的预案方法中的步骤。
[0039]本申请实施例提供的基于文本词向量的预案方法通过获取待处理的应急预案文本;对所述应急预案文本进行分词处理和词向量转化,得到所述应急预案文本的关键词向量;对所述关键词向量进行语义聚合处理,得到所述应急预案文本的语义向量;基于所述语义向量确定所述应急预案文本的类型;根据所述应急预案文本的类型对所述应急预案文本进行相应的数字化预案。本方案通过将应急预案文本转化为数字化预案,可以提高应急预案文本的实用性、可操作性和应用性。
附图说明
[0040]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0041]图1是本申请实施例提供的基于文本词向量的预案方法的流程示意图。
[0042]图2是本申请实施例提供的基于文本词向量的预案装置的结构示意图。
[0043]图3是本申请实施例提供的服务器的结构示意图。
[0044]图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0045]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0046]本申请中的术语“第一”和“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或模块的过程、方法、系统、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或模块。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文本词向量的预案方法,其特征在于,包括:获取待处理的应急预案文本;对所述应急预案文本进行分词处理和词向量转化,得到所述应急预案文本的关键词向量;对所述关键词向量进行语义聚合处理,得到所述应急预案文本的语义向量;基于所述语义向量确定所述应急预案文本的类型;根据所述应急预案文本的类型对所述应急预案文本进行相应的数字化预案。2.如权利要求1所述的基于文本词向量的预案方法,其特征在于,所述对所述应急预案文本进行分词处理和词向量转化,得到所述应急预案文本的关键词向量,包括:将所述应急预案文本输入至概率统计分词模型进行分词,并基于分词结果选取关键词;通过Word2Vec模型获取所述关键词对应的关键词向量。3.如权利要求2所述的基于文本词向量的预案方法,其特征在于,所述将所述应急预案文本输入至概率统计分词模型进行分词,并基于分词结果选取关键词,包括:对所述应急预案文本进行分词,并根据分词结果选取候选关键词;对所述应急预案文本进行大规模预料学习,得到对应的主题模型;基于所述主题模型从所述候选关键词中选取关键词。4.如权利要求3所述的基于文本词向量的预案方法,其特征在于,所述基于所述主题模型从所述候选关键词中选取关键词,包括:根据所述主题模型确定所述应急预案文本的主题分布和关键词分布;基于所述主题分布和所述关键词分布确定所述预案文本和所述候选关键词的主题相似度;根据所述主题相似度对所述候选关键词进行排序,并根据排序结果从所述候选关键词中选取关键词。5.如权利要求1所述的基于文本词向量的预案方法,其特征在于,所述根据所述应急预案文本的类型对所述应急预案文本进行相应的数字化预案,包括:根据所述应急预案文本的类型获取相应...

【专利技术属性】
技术研发人员:刘鸣宇李欢
申请(专利权)人:深圳市奔凯安全技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1