System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及电数字数据处理,具体涉及用于高速公路应急领域的知识图谱扩充方法、设备及介质。
技术介绍
1、在当前高速公路应急领域,各层级、各路域的各个运营单位之间存在着隶属、区域合作职能交叉等多种关系。对各个路域所发生的应急事件之间的关系进行梳理,能够对更好发挥各运营单位职能起到关键辅助作用,加强各区域之间的合作与联系,提高人员、物资等应急资源调配速度,大大提高应急效率。目前,运营单位大多采用建设高速公路应急数据库的方式,对各类应急事件进行汇聚治理,但是高速公路应急数据库仅是对应急数据的简单整合,无法对各类应急事件进行数据的融合与关系分析,数据价值无法最大化。
技术实现思路
1、为了解决上述问题,本申请提出了一种用于高速公路应急领域的知识图谱扩充方法,包括:
2、获取所需的高速公路应急文本集,对所述高速公路应急文本集进行聚类,分别得到各应急事件类型对应的高速公路应急文本,并对所述高速公路应急文本进行数据预处理,以得到处理后的应急数据集;其中,每个应急事件类型对应的所述应急数据集由多个关键词组成;
3、针对每个应急事件类型,通过预设的apriori关联分析算法,从其对应的所述应急数据集中的多个关键词中,筛选出所述应急事件类型中每个应急事件实体对应的应急关键词,并确定任意两个应急事件之间的第一相同应急关键词,根据所述第一相同应急关键词,生成不同应急事件实体之间的第一关系库;
4、从预设的语料库中获取每个应急事件实体对应的应急事件主题文档,基于预设的并行l
5、根据所述主题分布确定任意两个应急事件实体之间是否存在相同的第二应急关键词,以根据所述第二应急关键词,生成不同应急事件实体之间的第二关系库;
6、对任意两个应急事件实体对应的所述第一关系库和所述第二关系库进行相似度分析,以确定所述任意两个应急事件实体之间是否具有强关联关系;
7、若是,根据所述第一关系库和所述第二关系库,对预设的应急事件知识图谱中对应的应急事件实体之间的关系进行扩充,得到扩充后的所述应急事件知识图谱。
8、在本申请的一种实现方式中,对任意两个应急事件实体对应的所述第一关系库和所述第二关系库进行相似度分析,以确定所述任意两个应急事件实体之间是否具有强关联关系,具体包括:
9、确定任意两个应急事件实体对应的每个第一应急关键词与每个第二应急关键词之间的余弦相似度,以及,所述第一应急关键词在所述第一关系库中的第一频率,所述第二应急关键词在所述第二关系库中的第二频率;
10、根据所述余弦相似度、所述第一频率和所述第二频率,确定所述任意两个应急事件实体之间的相似度;
11、在所述相似度大于预设相似度的情况下,确定所述任意两个应急事件实体之间具有强关联关系。
12、在本申请的一种实现方式中,根据所述余弦相似度和所述频率,确定所述任意两个应急事件实体之间的相似度,具体包括:
13、针对每个第一应急关键词,从所述第一应急关键词对应的多个余弦相似度中选取数值最大的余弦相似度,作为所述第一应急关键词对应的第一目标余弦相似度;
14、针对每个第二应急关键词,从所述第二应急关键词对应的多个余弦相似度中选取数值最大的余弦相似度,作为所述第二应急关键词对应的第二目标余弦相似度;
15、将所述第一频率作为所述第一应急关键词对应的第一权重,将所述第二频率作为所述第二应急关键词对应的第二权重,根据所述第一权重和所述第二权重,分别对每个第一应急关键词对应的第一目标余弦相似度,以及对每个第二应急关键词对应的第二目标余弦相似度进行加权求和;
16、计算所述第一目标余弦相似度对应的求和结果和所述第二目标余弦相似度的求和结果的平均值,将所述平均值作为所述任意两个应急事件实体之间的相似度。
17、在本申请的一种实现方式中,根据所述第一关系库和所述第二关系库,对预设的应急事件知识图谱中对应的应急事件实体之间的关系进行扩充,具体包括:
18、根据预设的相似度与强关联等级之间的映射关系,确定所述相似度所属的强关联等级;其中,所述相似度与所述强关联等级呈正相关;
19、按照所述第一应急关键词和所述第二应急关键词分别对应的余弦相似度由大到小的顺序,生成相应的目标应急关键词序列;
20、从所述目标应急关键词序列中,依次选取与所述强关联等级相匹配的指定数量个目标应急关键词,根据所述目标应急关键词,对预设的应急事件知识图谱中对应的应急事件实体之间的关系进行扩充。
21、在本申请的一种实现方式中,基于预设的并行lda算法,根据所述应急事件主题文档,对所述应急事件实体进行主题分析,以确定每个应急事件实体对应的主题分布,具体包括:
22、基于预设的并行lda算法,确定预设的主题数量,并对所述应急事件主题文档中的应急关键词赋予对应的主题编号;其中,所述主题编号小于等于所述主题数量;
23、针对每个应急关键词,遍历所述语料库,以通过预设的采样公式,对所述应急关键词对应的所述主题编号进行更新,直至所述采样公式实现采样收敛;
24、在采样收敛的情况下,确定所述应急事件主题文档中每个应急关键词对应的主题词,以及所述主题词中每个应急关键词对应的概率分布;
25、对所述主题词对应的概率分布进行汇总,得到所述应急事件主题文档对应的应急事件实体的主题分布。
26、在本申请的一种实现方式中,根据所述主题分布确定任意两个应急事件实体之间是否存在相同的第二应急关键词,以根据所述第二应急关键词,生成不同应急事件实体之间的第二关系库,具体包括:
27、对任意两个应急事件实体对应的主题分布进行对比,以从所述应急事件实体中筛选出存在相同主题词的应急事件实体,作为应急事件实体关联组;
28、根据所述应急事件实体关联对应的主题分布,确定所述相同主题词下的应急关键词中相同的第二应急关键词;
29、根据所述第二应急关键词对应的概率分布,计算所述第二应急关键词之间的概率差值;
30、在所述概率差值小于预设值的情况下,根据所述第二应急关键词,生成不同应急事件实体之间的第二关系库。
31、在本申请的一种实现方式中,通过预设的apriori关联分析算法,从其对应的所述应急数据集中的多个关键词中,筛选出所述应急事件类型中每个应急事件对应的应急关键词,具体包括:
32、通过预设的apriori关联分析算法,根据所述应急数据集中每个关键词的出现次数与关键词总数之间的比值,计算每个关键词对应的支持度,并根据预设的支持度阈值,从所述应急数据集中筛选得到对应支持度不小于所述支持度阈值的候选应急关键词;
33、确定各候选应急关键词对应的置信度,针对每个本文档来自技高网...
【技术保护点】
1.用于高速公路应急领域的知识图谱扩充方法,其特征在于,所述方法包括:
2.根据权利要求1所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,对任意两个应急事件实体对应的所述第一关系库和所述第二关系库进行相似度分析,以确定所述任意两个应急事件实体之间是否具有强关联关系,具体包括:
3.根据权利要求2所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,根据所述余弦相似度和所述频率,确定所述任意两个应急事件实体之间的相似度,具体包括:
4.根据权利要求3所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,根据所述第一关系库和所述第二关系库,对预设的应急事件知识图谱中对应的应急事件实体之间的关系进行扩充,具体包括:
5.根据权利要求1所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,基于预设的并行LDA算法,根据所述应急事件主题文档,对所述应急事件实体进行主题分析,以确定每个应急事件实体对应的主题分布,具体包括:
6.根据权利要求5所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,根据所述主题
7.根据权利要求1所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,通过预设的Apriori关联分析算法,从其对应的所述应急数据集中的多个关键词中,筛选出所述应急事件类型中每个应急事件对应的应急关键词,具体包括:
8.根据权利要求7所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,根据所述第一应急关键词,生成不同应急事件实体之间的第一关系库之后,所述方法还包括:
9.用于高速公路应急领域的知识图谱扩充设备,其特征在于,包括:
10.一种非易失性计算机存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令设置为:
...【技术特征摘要】
1.用于高速公路应急领域的知识图谱扩充方法,其特征在于,所述方法包括:
2.根据权利要求1所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,对任意两个应急事件实体对应的所述第一关系库和所述第二关系库进行相似度分析,以确定所述任意两个应急事件实体之间是否具有强关联关系,具体包括:
3.根据权利要求2所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,根据所述余弦相似度和所述频率,确定所述任意两个应急事件实体之间的相似度,具体包括:
4.根据权利要求3所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,根据所述第一关系库和所述第二关系库,对预设的应急事件知识图谱中对应的应急事件实体之间的关系进行扩充,具体包括:
5.根据权利要求1所述的用于高速公路应急领域的知识图谱扩充方法,其特征在于,基于预设的并行lda算法,根据所述应急事件主题文档,对所述应急事件实体进行主题分析,以确定每个应急事件...
【专利技术属性】
技术研发人员:万青松,迟猛,席永轲,房宏基,纪艺,韩应轩,
申请(专利权)人:山东高速信息集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。