【技术实现步骤摘要】
一种多部门预警信息内容的分词模型及其质控方法
[0001]本专利技术涉及预警信息内容控制的分析
,特别涉及一种多部门预警信息内容的质控模型及其质控方法
。
技术介绍
[0002]预警信息是各预警发布责任单位向社会公众无偿提供预警信息发布
、
防御指南引导的传播介质,包括发布单位
、
预警信息内容
、
预警时效
、
预警等级
、
预警标题
、
发布时间等属性
。
涵盖自然灾害
、
事故灾难
、
公共安全
、
社会安全
、
风险消息等多种类型,有效的提高预警信息传播的及时性
、
准确性能够将信息第一时间传达至应急责任人
、
政府决策领导规避风险
、
指导防灾减灾工作,因此预警信息内容的准确性以及权威性变得重要
。
[0003]当前各级预警信息工作机构作为各部门预警信息对接的桥梁,汇聚多部门的预警信息并通过传播渠道一张网对风险覆盖区域进行精准滴灌传播
。
各部门预警信息接入个性化多,业务规则繁杂,目前有人工审核与系统审核的方式保障预警信息发布质量
。
人工审核需要求业务人员对各部门预警业务熟练度高,但仍出现审核不严谨
、
信息内容前后矛盾
、
词组错误的情况
。
系统应用层面通过静态页面判断预警 ...
【技术保护点】
【技术特征摘要】
1.
一种多部门预警信息内容的质控方法,其特征在于:包括下述步骤:
S1、
接收预警信息的报文,对所述报文的结构体进行拦截解析并获取唯一的部门索引;通过部门索引匹配适配对应部门的预警分词模型容器服务;
S2、
提取所述结构体中的预警内容和预警标题,对所述预警内容及所述预警标题按对应部门的预警分词模型容器服务中的质控规则集合的规则属性,匹配质控规则适用的发布处置环节;
S3、
对所述预警内容及所述预警标题执行所述质控规则集合的所有质控规则,得到每个质控规则的处理结果,将每个处理结果匹配一种标识后加入质控结果集;所述质控规则集合中的质控规则包括时间校验规则和内容校验规则;所述标识为通过
、
不通过或友情提醒;
S4、
判断所述质控结果集里的所有处理结果的标识是否有不通过的标识,若是,则阻止发布程序的继续执行,并将不满足质控规则描述整合输出,若否,则进入匹配好的所述发布处置环节
。2.
根据权利要求1所述的一种多部门预警信息内容的质控方法,其特征在于:在通过所述内容校验规则进行校验前,先要对所述预警内容进行分词操作,所述分词操作包括下述过程;
S11、
接入任意一条部门预警信息,对所述部门预警信息的内容按标准解析协议解析,通过正则以及字符串匹配方式进行初步切分成不同的句段,并自动调用对应部门的分词容器进行存储;
S12、
构造每个句段所有可能出现的分词情况并生成具备多部门预警信息内容个性化有向无环图,生成每个句段的有向无环数据集合;
S13、
对每个句段的所述有向无环数据集合进行最大概率分词组合计算,输出每个句段的最大概率的分词词组集合;一个句段的每个单字最大概率出现的词组,计算方法为:其中
Ex
(i)
为第
i
个字在句段中出现的词组,
P(Ex
(i))
为该词组出现的概率,即:每个词组的概率=对应的部门分词容器中该词的词组数
/
对应的部门分词容器中的总词数;
S
为该句段的字数,
Pi
为该词组出现的最大概率;
S14、
对一个句段中的所有单字均进行最大概率词组计算后,则获得该句段的最大概率词组路径
R
,即:
R
=
{S:[Pi
,
E]}
;其中
S
为词的节点序号,
Pi
为该词所组合词组出现的最大概率,
E
为该词的组合序号即最大概率词组的位置;当获得所述部门预警信息所有句段的最大概率词组路径后,进而生成所述部门预警信息的内容质控的信息分词
。3.
根据权利要求2所述的一种多部门预警信息内容的质控方法,其特征在于:所述
S12
具体是:对所述部门预警信息的内容按标准解析协议解析,通过正则以及字符串匹配方式进行初步切分成不同的句段,定义每个句段集合的存储变量,通过遍历
、
改变句
段中每个单字的位置,获得单字组合,同时将所述单字组合与所述应部门的分词容器中的词组进行判断,确定所述单字组合是否为常用词组,直至句段内所有单字组合判断完成,最后生成相关的有向无环图
。4.
根据权利要求2所述的一种多部门预警信息内容的质控方法,其特征在于:所述
S11
中,所述分词容器是通过加载基础词库文件获取基础词库中与对应部门的特点相关的词组而构建得到的;所述初步切分是通过既定好的正则,并通过相关标志符号实现对长段文字的初步分割,检查一个串是否含有某种子串,若是,则将匹配的子串替换或者从某个串中取出符合某个条件的子串
。5.
一种多部门预警信息内容的质控装置,其特征在于:包括:部门适配模块,用于接收预警信息的报文,对所述报文的结构体进行拦截解析并获取唯一的部门索引;通过...
【专利技术属性】
技术研发人员:赵伯听,陈治杰,杨亨漂,蔡金劲,郑明莉,许艺雯,林仲,王佳璇,林欣,
申请(专利权)人:福建省预警信息发布中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。