电网工程物资合同履约诚信舆情监控系统技术方案

技术编号:16080693 阅读:99 留言:0更新日期:2017-08-25 15:52
电网工程物资合同卖方履约诚信舆情监控系统,包括IP确定模块、舆情信息采集模块、舆情信息处理模块、舆情信息管理模块和移动客户端,所述IP确定模块用于确定与电力行业相关的网页IP,述舆情信息采集模块用于搜集互联网上和电网工程物资合同履约情况相关的网页,所述舆情信息处理模块用于提取采集的网页信息的正文部分并进行网页特征项的提取和权重的计算,从而判断采集得到的网页是否为主题相关网页,所述用户管理模块用于向用户显示主题相关的网页,所述移动客户端为安装有相关应用的智能手机或平板电脑,用户可以通过移动客户端模块实时访问舆情信息管理模块的数据库单元,本发明专利技术的有益效果为:通过对网络舆情的监控,实时了解电网工程物资合同卖方履约诚信情况。

【技术实现步骤摘要】
电网工程物资合同履约诚信舆情监控系统
本专利技术创造涉及舆情监控领域,具体涉及一种电网工程物资合同履约诚信舆情监控系统。
技术介绍
电网工程物资是整个电网的基础,而电网工程物资合同卖方的履约情况,而电网工程物资合同卖方的履约情况关系到整个电力系统的物资供应。近年来,随着国民经济的快速发展激增了用电量的需求,加大了电网工程项目的建设,因此也产生了大量的电网工程物资合同,传统的物资合同管理方法通常在签订合同后建立专业的合同管理机构和人员进行实时了解和监管物资合同的履约情况,这种方法不仅增加了工作人员的工作量,而且不能有效预防物资合同的违约情况。当今社会网络舆情的影响越来越大,受人民关注度越来越高的特点,通过对互联网舆情信息的获取和监控,便于通过民众的影响进行电网工程物资合同卖方履约情况的舆情监控,进一步实现良好的电网工程物资交易。
技术实现思路
针对上述问题,本专利技术旨在提供一种电网工程物资合同履约诚信舆情监控系统。本专利技术创造的目的通过以下技术方案实现:电网工程物资合同卖方履约诚信舆情监控系统,包括IP确定模块、舆情信息采集模块、舆情信息处理模块、舆情信息管理模块和移动客户端模块;(1本文档来自技高网...
电网工程物资合同履约诚信舆情监控系统

【技术保护点】
电网工程物资合同卖方履约诚信舆情监控系统,其特征是,包括IP确定模块、舆情信息采集模块、舆情信息处理模块、舆情信息管理模块和移动客户端模块;(1)IP确定模块:用于确定与电力行业相关的网页IP;(2)舆情信息采集模块:设定IP确定模块确定的IP链接为种子链接,采用主题爬虫策略从此种子链接出发,搜集和电网工程物资合同履约主题相关的网页;(3)舆情信息处理模块:用于提取采集的网页信息中的正文部分,从所述正文部分的中文分词结果中提取具有代表性的网页特征项并计算相应特征项的权重,从而进行网页分类;(4)舆情信息管理模块:包括数据库单元、用户登录单元和信息检索单元,所述数据库单元用于存储舆情信息处理模块...

【技术特征摘要】
1.电网工程物资合同卖方履约诚信舆情监控系统,其特征是,包括IP确定模块、舆情信息采集模块、舆情信息处理模块、舆情信息管理模块和移动客户端模块;(1)IP确定模块:用于确定与电力行业相关的网页IP;(2)舆情信息采集模块:设定IP确定模块确定的IP链接为种子链接,采用主题爬虫策略从此种子链接出发,搜集和电网工程物资合同履约主题相关的网页;(3)舆情信息处理模块:用于提取采集的网页信息中的正文部分,从所述正文部分的中文分词结果中提取具有代表性的网页特征项并计算相应特征项的权重,从而进行网页分类;(4)舆情信息管理模块:包括数据库单元、用户登录单元和信息检索单元,所述数据库单元用于存储舆情信息处理模块确定的主题相关网页,用户通过用户登录单元输入密码登录舆情信息管理模块,并可通过信息检索单元输入要检索的关键词进行电网工程物资合同履约情况的信息检索,信息检索单元即显示包含所述关键词的相关网页;(5)移动客户端模块:为安装有相关应用的智能手机或平板电脑,用户可以通过移动客户端模块实时访问舆情信息管理模块的数据库单元,从而了解电网工程物资合同履约诚信情况。2.根据权利要求1所述的电网工程物资合同卖方履约诚信舆情监控系统,其特征是,所述舆情信息采集模块包括主题设置单元、电力猫接入单元和舆情信息采集单元,所述主题设置单元用于根据本系统的主题,设置主题关键词和主题爬虫的初始链接,所述电力猫接入单元用于判断电脑通过电力猫接入网络时,即令舆情信息采集单元采用主题爬虫策略搜集主题相关的网页。3.根据权利要求2所述的电网工程物资合同卖方履约诚信舆情监控系统,其特征是,所述主题设置单元用于根据本系统的主题,设置主题初始关键词和主题爬虫的初始链接,具体包括:a.根据本系统的主题,设置主题初始关键词组G={“电网”、“电力物资”、“履约”、“物资合同”,“违约”},设置关键词的权重分别为qg1、qg2、qg3、qg4和qg5,则主题文档可以初步表示为Wg=(tg1,tg2,tg3,tg4,tg5),其中,tg1、tg2、tg3、tg4、tg5分别代表关键词电网、电力物资、履约、物资合同和违约;b.设置IP确定模块所确定的IP为种子链接,主题爬虫从此种子链接出发,搜集主题相关网页;c.从舆情处理模块确定的各个主题相关网页中,提取权重较高的前h个特征项加入关键词组G,形成新的关键词组G。4.根据权利要求3所述的电网工程物资合同卖方履约诚信舆情监控系统,其特征是,所述舆情信息处理模块包括正文提取单元、特征项提取单元和网页分类单元,所述正文提取单元用于根据电力行业网站的网页特点,采用文本分割的方式提取网页的正文部分,所述特征项提取单元用于从正文部分的中文分词结果中提取具有代表性的特征项并计算特征项在文本中的权重,所述网页分类单元用于判断采集得到的网页是否为主题相关网页。5.根据权利要求4所述的电网工程物资合同卖方履约诚信舆情监控系统,其特征是,所述正文提取单元用于根据电力行业网站的网页特点,采用文本分割的方式提取网页的正文部分,具体包括:a.将采集得到的电力行业网站的网页进行滤波处理,去除网页中的噪声部分;b.从网页源文件中按顺序提取文本块,得到文本块集合A={a1,a2,……an},对文本块集合中的每个文本块的字符数进行统计,并将统计结果存入数组Bi对应的位置处,数组Bi={b1,b2,……bn},对数组Bi进行处理,其计算公式为:式中,bi-1、bi、bi+1分别为文本块i-1、i、i+1的字符数总数,α1、α2、α3分别为bi-1、bi、bi+1的权重,且α1、α2、α3>0;c.定义文本块分界阈值f1和f2,则f1和f2分别为:式中,n为文本块的总数,bi为文本块i中的字符总数,ρ1和ρ2分别为文...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:深圳市创艺工业技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1