利用自然语言语义分析的政务网站舆情分析与预警的方法技术

技术编号:33918621 阅读:11 留言:0更新日期:2022-06-25 20:39
本发明专利技术提出了一种利用自然语言语义分析的政务网站舆情分析与预警的方法,包括以下步骤:S1,判定采集的文字信息数据中是否存在舆情警示词:若采集的文字信息数据中存在舆情警示词,则执行下一步;若采集的文字信息数据中不存在舆情警示词,则继续等待,返回步骤S1;S2,提取舆情警示词所对应的发出舆情警示词的用户ID,对该用户ID一段时间内的言论进行采集,推送给网站管理员。本发明专利技术能够实现对政府平台上收集的文字信息进行舆情监测推送。平台上收集的文字信息进行舆情监测推送。平台上收集的文字信息进行舆情监测推送。

【技术实现步骤摘要】
利用自然语言语义分析的政务网站舆情分析与预警的方法


[0001]本专利技术涉及一种政务舆情
,特别是涉及一种利用自然语言语义分析的政务网站舆情分析与预警的方法。

技术介绍

[0002]舆情监测是一项交叉了社会科学和数据科学的复杂技术,需要在舆情发生初期对事件有个初步的预判,充分做好应对准备。针对舆情事件的描述,主要来自网络媒体上的新闻文本和类似新浪微博的社交平台,人们通过阅读、转发、评论等,直接告知他人或者从他人那里间接了解到舆情事件的相关信息。

技术实现思路

[0003]本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种利用自然语言语义分析的政务网站舆情分析与预警的方法,包括以下步骤:
[0004]S1,判定采集的文字信息数据中是否存在舆情警示词:
[0005]若采集的文字信息数据中存在舆情警示词,则执行下一步;
[0006]若采集的文字信息数据中不存在舆情警示词,则继续等待,返回步骤S1;
[0007]S2,提取舆情警示词所对应的发出舆情警示词的用户ID,对该用户ID一段时间内的言论进行采集,推送给网站管理员。
[0008]在本专利技术的一种优选实施方式中,言论包括阅读、转发、评论之一或者任意组合。
[0009]在本专利技术的一种优选实施方式中,推送方式包括短信、电子邮箱、手机语音留言之一或者任意组合。
[0010]在本专利技术的一种优选实施方式中,在步骤S1中,包括以下步骤:
[0011]S11,获取图像文件,根据获取的图像文件提取图像文件中的文字数据;
[0012]S12,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
[0013]S13,根据步骤S11中提取的文字数据识别出舆情警示词。
[0014]在本专利技术的一种优选实施方式中,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。
[0015]综上所述,由于采用了上述技术方案,本专利技术能够实现对政府平台上收集的文字信息进行舆情监测推送。
[0016]本专利技术的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0017]本专利技术的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得
明显和容易理解,其中:
[0018]图1是本专利技术流程示意图。
具体实施方式
[0019]下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本专利技术,而不能理解为对本专利技术的限制。
[0020]本专利技术提供了一种利用自然语言语义分析的政务网站舆情分析与预警的方法,如图1所示,包括以下步骤:
[0021]S1,判定采集的文字信息数据中是否存在舆情警示词:
[0022]若采集的文字信息数据中存在舆情警示词,则执行下一步;
[0023]若采集的文字信息数据中不存在舆情警示词,则继续等待,返回步骤S1;
[0024]S2,提取舆情警示词所对应的发出舆情警示词的用户ID,对该用户ID一段时间内的言论进行采集,推送给网站管理员。其言论包括阅读、转发、评论之一或者任意组合;推送方式包括短信、电子邮箱、手机语音留言之一或者任意组合。
[0025]在本专利技术的一种优选实施方式中,在步骤S1中包括以下步骤:
[0026]S11,获取图像文件,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合,根据获取的图像文件提取图像文件中的文字数据;
[0027]S12,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;
[0028]S13,根据步骤S11中提取的文字数据识别出舆情警示词。
[0029]在本专利技术的一种优选实施方式中,在步骤S11中根据获取的图像文件提取图像文件中的文字数据的方法包括以下步骤:
[0030]S111,令λ=1;
[0031]S112,对第λ图像进行操作:
[0032]w=N/(P
×
Q),
[0033]其中,Q表示第λ图像的高度;
[0034]P表示第λ图像的宽度;
[0035]w表示像素目标点的总像素个数与第λ图像的比数;
[0036]N表示图像分离阈值H大于或者等于提取第λ图像中的灰度值的个数;
[0037]S113,w

=(

N+P
×
Q)/P
×
Q,
[0038]w

表示像素背景点的总像素个数与第λ图像的比数;
[0039][0040]其中,ζ表示目标图像的灰度平均值;
[0041]A
i
∈A={A1,A2,A3,

,A
N
,A
N+1
},
[0042]其中,A表示目标图像中的所有像素点的灰度值集;
[0043]A
i
表示目标图像中的第i个像素点的灰度值;
[0044]S114,
[0045]其中,ξ表示背景图像的灰度平均值;
[0046]B
j
∈B={B1,B2,B3,

,B
P
×
Q

N
,B
P
×
Q

N+1
},
[0047]其中,B表示背景图像中的所有像素点的灰度值集;
[0048]B
j
表示背景图像中的第j个像素点的灰度值;
[0049]S115,
[0050]其中,表示提取第λ图像的灰度平均值;
[0051]S116,
[0052]其中,η表示图像方差灰度值;
[0053]使用遍历方法让图像方差灰度值最大η
max
时,得到图像分离阈值H;
[0054]S117,判定图像分离阈值H与提取第λ图像中的第k个像素点灰度值I
λ,k
的关系大小:
[0055]若I
λ,k
≤H,则令I
λ,k
=255;
[0056]若I
λ,k
>H,则令I
λ,k
=0;k=1,2,3,

,P
×
Q;
[0057]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用自然语言语义分析的政务网站舆情分析与预警的方法,其特征在于,包括以下步骤:S1,判定采集的文字信息数据中是否存在舆情警示词:若采集的文字信息数据中存在舆情警示词,则执行下一步;若采集的文字信息数据中不存在舆情警示词,则继续等待,返回步骤S1;S2,提取舆情警示词所对应的发出舆情警示词的用户ID,对该用户ID一段时间内的言论进行采集,推送给网站管理员。2.根据权利要求1所述的利用自然语言语义分析的政务网站舆情分析与预警的方法,其特征在于,言论包括阅读、转发、评论之一或者任意组合。3.根据权利要求1所述的利用自然语言语义分析的政务网站舆情分析与预警的方法,其特征在于,推送方式包括短信、电子邮箱、手机语音留言之一或者任意组合。4.根据权利要求1所述的利用自然语言语义分析的政务网站舆情分析与预警的方法,其特征在于,在步骤S1中包括以下步骤:S11,获取图像文件,根据获取的图像文件提取图像文件中的文字数据;S12,获取舆情警示词数据库,对获取的舆情警示词进行分组,对每组舆情警示词设置一个舆情中心警示词作为标准舆情词,将标准舆情词作为起始节点,设置其它相近舆情词到标准舆情词的距离小于预设距离阈值,将其相近舆情词分为同一组;S13,根据步骤S11中提取的文字数据识别出舆情警示词。5.根据权利要求4所述的利用自然语言语义分析的政务网站舆情分析与预警的方法,其特征在于,图像文件的格式包括bmp、jpg、png、tif、gif之一或者任意组合。6.根据权利要求4所述的利用自然语言语义分析的政务网站舆情分析与预警的方法,其特征在于,在步骤S11中根据获取的图像文件提取图像文件中的文字数据的方法包括以下步骤:S111,令λ=1;S112,对第λ图像进行操作:w=N/(P
×
Q),其中,Q表示第λ图像的高度;P表示第λ图像的宽度;w表示像素目标点的总像素个数与第λ图像的比数;N表示图像分离阈值H大于或者等于提取第λ图像中的灰度值的个数;S113,w<...

【专利技术属性】
技术研发人员:严彦赵根闫亮王彦集李翔罗波洪永文侯伟戴一明彭丽媛郑翔付世娇张运邹敏
申请(专利权)人:重庆市规划和自然资源信息中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1