一种多部门预警信息内容的分词模型及其质控方法技术

技术编号:39777479 阅读:5 留言:0更新日期:2023-12-22 02:23
本发明专利技术提供一种多部门预警信息内容的质控方法

【技术实现步骤摘要】
一种多部门预警信息内容的分词模型及其质控方法


[0001]本专利技术涉及预警信息内容控制的分析
,特别涉及一种多部门预警信息内容的质控模型及其质控方法


技术介绍

[0002]预警信息是各预警发布责任单位向社会公众无偿提供预警信息发布

防御指南引导的传播介质,包括发布单位

预警信息内容

预警时效

预警等级

预警标题

发布时间等属性

涵盖自然灾害

事故灾难

公共安全

社会安全

风险消息等多种类型,有效的提高预警信息传播的及时性

准确性能够将信息第一时间传达至应急责任人

政府决策领导规避风险

指导防灾减灾工作,因此预警信息内容的准确性以及权威性变得重要

[0003]当前各级预警信息工作机构作为各部门预警信息对接的桥梁,汇聚多部门的预警信息并通过传播渠道一张网对风险覆盖区域进行精准滴灌传播

各部门预警信息接入个性化多,业务规则繁杂,目前有人工审核与系统审核的方式保障预警信息发布质量

人工审核需要求业务人员对各部门预警业务熟练度高,但仍出现审核不严谨

信息内容前后矛盾

词组错误的情况

系统应用层面通过静态页面判断预警属性字段中的业务质控

时间质控等,不利预警质量质控规则的灵活扩展,以及适配多部门的业务规则应用

同时对多部门预警是否协同存在业务质控关联

叠词

词组不匹配错误等问题未能信息化的处置方法,通过人工审核影响信息处置效率

[0004]目前大多数的预警发布系统对于预警内容
,
缺乏对内容的校验,主要依靠预警发布人员的专业素质和审核严谨度,或者在是程序开发过程中协商好的规则对预警内容进行校验

具有如下缺点:
[0005]1:预警词库依靠人工维护,更新较为缓慢;
[0006]2:传统的规则本身也不一定适用于每个部门,导致出现影响使用的情况;
[0007]3:缺乏有效的规则推演,新的规则并不能满足实际的情况;
[0008]4:传统的规则缺乏规则引擎的接入,新增和修改规则都会影响业务系统的实时使用

[0009]中国专利技术
CN202211688001.0
公开了一种基于自然语言处理的气象预警信息审核方法及系统

其是在获取待审核的气象预警文本后,将待审核的气象预警文本输入训练好的文本审核模型,得到语义分类结果;对待审核的气象预警文本进行分词,得到分词序列;基于配置的句法规则集,对分词序列进行句法解析,得到解析结果;句法规则集包括不同预警句式对应的句法规则;根据解析结果和分类结果,确定待审核的气象预警文本的审核结果

该方法克服了人工审核耗时较长以及易出现审核错误的问题,实现了气象预警文本的准确

全面的审核

但是这种审核方法及系统仅针对单一的气象部门的气象预警信息,无法面对多个部门的多种预警信息内容的统一控制,因此对不同的部门
(
例如气象部门

水利部门

地震部门等
)
而言,只能每个部门均开发一套适于本部门的预警信息内容的控制系统


技术实现思路

[0010]本专利技术要解决的技术问题,在于提供一种多部门预警信息内容的质控模型及其质控方法,可以针对多个部门的多种预警信息进行内容的统一控制,而无需每个部门均开发一套适于本部门的预警信息内容的控制系统

[0011]第一方面,本专利技术提供了一种多部门预警信息内容的质控方法,包括下述步骤:
[0012]S1、
接收预警信息的报文,对所述报文的结构体进行拦截解析并获取唯一的部门索引;通过部门索引匹配适配对应部门的预警分词模型容器服务;
[0013]S2、
提取所述结构体中的预警内容和预警标题,对所述预警内容及所述预警标题按对应部门的预警分词模型容器服务中的质控规则集合的规则属性,匹配质控规则适用的发布处置环节;
[0014]S3、
对所述预警内容及所述预警标题执行所述质控规则集合的所有质控规则,得到每个质控规则的处理结果,将每个处理结果匹配一种标识后加入质控结果集;所述质控规则集合中的质控规则包括时间校验规则和内容校验规则;所述标识为通过

不通过或友情提醒;
[0015]S4、
判断所述质控结果集里的所有处理结果的标识是否有不通过的标识,若是,则阻止发布程序的继续执行,并将不满足质控规则描述整合输出,若否,则进入匹配好的所述发布处置环节

[0016]第二方面,本专利技术提供了一种多部门预警信息内容的质控装置,包括:
[0017]部门适配模块,用于接收预警信息的报文,对所述报文的结构体进行拦截解析并获取唯一的部门索引;通过部门索引匹配适配对应部门的预警分词模型容器服务;
[0018]发布处置环节适配模块,用于提取所述结构体中的预警内容和预警标题;对所述预警内容及所述预警标题按对应部门的预警分词模型容器服务中的质控规则集合的规则属性,匹配质控规则适用的发布处置环节;
[0019]内容质控模块,用于对所述预警内容及所述预警标题执行所述质控规则集合的所有质控规则,得到每个质控规则的处理结果,将每个处理结果匹配一种标识后加入质控结果集;所述质控规则集合中的质控规则包括时间校验规则和内容校验规则;所述标识为通过

不通过或友情提醒;
[0020]质控结果处理模块,用于判断所述质控结果集里的所有处理结果的标识是否有不通过的标识,若是,则阻止发布程序的继续执行,并将不满足质控规则描述整合输出,若否,则进入匹配好的所述发布处置环节

[0021]第三方面,本专利技术提供了一种电子设备,包括存储器

处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述的方法

[0022]第四方面,本专利技术提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面所述的方法

[0023]本专利技术实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:通过预设的各部门的预警分词模型容器服务,可以统一接收的不同部门
(
如气象部门

地震部门

渔业部门

疫情管控部门等
)
的预警信息进行统一质控处理<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种多部门预警信息内容的质控方法,其特征在于:包括下述步骤:
S1、
接收预警信息的报文,对所述报文的结构体进行拦截解析并获取唯一的部门索引;通过部门索引匹配适配对应部门的预警分词模型容器服务;
S2、
提取所述结构体中的预警内容和预警标题,对所述预警内容及所述预警标题按对应部门的预警分词模型容器服务中的质控规则集合的规则属性,匹配质控规则适用的发布处置环节;
S3、
对所述预警内容及所述预警标题执行所述质控规则集合的所有质控规则,得到每个质控规则的处理结果,将每个处理结果匹配一种标识后加入质控结果集;所述质控规则集合中的质控规则包括时间校验规则和内容校验规则;所述标识为通过

不通过或友情提醒;
S4、
判断所述质控结果集里的所有处理结果的标识是否有不通过的标识,若是,则阻止发布程序的继续执行,并将不满足质控规则描述整合输出,若否,则进入匹配好的所述发布处置环节
。2.
根据权利要求1所述的一种多部门预警信息内容的质控方法,其特征在于:在通过所述内容校验规则进行校验前,先要对所述预警内容进行分词操作,所述分词操作包括下述过程;
S11、
接入任意一条部门预警信息,对所述部门预警信息的内容按标准解析协议解析,通过正则以及字符串匹配方式进行初步切分成不同的句段,并自动调用对应部门的分词容器进行存储;
S12、
构造每个句段所有可能出现的分词情况并生成具备多部门预警信息内容个性化有向无环图,生成每个句段的有向无环数据集合;
S13、
对每个句段的所述有向无环数据集合进行最大概率分词组合计算,输出每个句段的最大概率的分词词组集合;一个句段的每个单字最大概率出现的词组,计算方法为:其中
Ex
(i)
为第
i
个字在句段中出现的词组,
P(Ex
(i))
为该词组出现的概率,即:每个词组的概率=对应的部门分词容器中该词的词组数
/
对应的部门分词容器中的总词数;
S
为该句段的字数,
Pi
为该词组出现的最大概率;
S14、
对一个句段中的所有单字均进行最大概率词组计算后,则获得该句段的最大概率词组路径
R
,即:
R

{S:[Pi

E]}
;其中
S
为词的节点序号,
Pi
为该词所组合词组出现的最大概率,
E
为该词的组合序号即最大概率词组的位置;当获得所述部门预警信息所有句段的最大概率词组路径后,进而生成所述部门预警信息的内容质控的信息分词
。3.
根据权利要求2所述的一种多部门预警信息内容的质控方法,其特征在于:所述
S12
具体是:对所述部门预警信息的内容按标准解析协议解析,通过正则以及字符串匹配方式进行初步切分成不同的句段,定义每个句段集合的存储变量,通过遍历

改变句
段中每个单字的位置,获得单字组合,同时将所述单字组合与所述应部门的分词容器中的词组进行判断,确定所述单字组合是否为常用词组,直至句段内所有单字组合判断完成,最后生成相关的有向无环图
。4.
根据权利要求2所述的一种多部门预警信息内容的质控方法,其特征在于:所述
S11
中,所述分词容器是通过加载基础词库文件获取基础词库中与对应部门的特点相关的词组而构建得到的;所述初步切分是通过既定好的正则,并通过相关标志符号实现对长段文字的初步分割,检查一个串是否含有某种子串,若是,则将匹配的子串替换或者从某个串中取出符合某个条件的子串
。5.
一种多部门预警信息内容的质控装置,其特征在于:包括:部门适配模块,用于接收预警信息的报文,对所述报文的结构体进行拦截解析并获取唯一的部门索引;通过...

【专利技术属性】
技术研发人员:赵伯听陈治杰杨亨漂蔡金劲郑明莉许艺雯林仲王佳璇林欣
申请(专利权)人:福建省预警信息发布中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1