用于生成信息的方法和装置制造方法及图纸

技术编号:23085124 阅读:15 留言:0更新日期:2020-01-11 01:10
本公开的实施例公开了用于生成信息的方法和装置。该方法的一具体实施方式包括:获取针对目标对象的舆情文本向量信息集合,其中,舆情文本向量信息包括舆情文本向量和时间标识;基于该舆情文本向量信息集合中的时间标识所指示的顺序,生成针对该目标对象的文本情感时域向量;根据该文本情感时域向量,生成针对该目标对象的舆情预警信息,其中,该舆情预警信息用于表征该目标对象发生目标事件的可能性,该目标事件与该舆情文本向量信息集合所指示的文本内容相关联。该实施方式实现了对舆情文本数据的充分利用,提升了舆情预警的准确度。

Methods and devices for generating information

【技术实现步骤摘要】
用于生成信息的方法和装置
本公开的实施例涉及计算机
,具体涉及用于生成信息的方法和装置。
技术介绍
随着互联网技术的发展,越来越多的民众和媒体通过网络发表评论,网络舆情的数据规模也随之急剧上升。网络舆情越来越成为一种重要的数据来源。相关的方式通常是首先对舆情文本进行要素提取,再根据情感字典判别舆情文本的情感分类。从而组成结构化数据,再将上述结构化数据添加到评估模型中作为补充特征,从而分析舆情数据中的热点事件。
技术实现思路
本公开的实施例提出了用于生成信息的方法和装置。第一方面,本公开的实施例提供了一种用于生成信息的方法,该方法包括:获取针对目标对象的舆情文本向量信息集合,其中,舆情文本向量信息包括舆情文本向量和时间标识;基于舆情文本向量信息集合中的时间标识所指示的顺序,生成针对目标对象的文本情感时域向量;根据文本情感时域向量,生成针对目标对象的舆情预警信息,其中,舆情预警信息用于表征目标对象发生目标事件的可能性,目标事件与舆情文本向量信息集合所指示的文本内容相关联。在一些实施例中,上述基于舆情文本向量信息集合中的时间标识所指示的顺序,生成针对目标对象的文本情感时域向量,包括:对于舆情文本向量信息集合中的舆情文本向量信息,将该舆情文本向量信息中的舆情文本向量输入至预先训练的文本情感模型,生成与输入的舆情文本向量对应的文本情感值;根据时间标识对所生成的文本情感值进行排序,生成文本情感时域向量,其中,文本情感时域向量包括文本情感值序列。在一些实施例中,上述根据文本情感时域向量,生成针对目标对象的舆情预警信息,包括:根据时序异常检测算法对文本情感时域向量进行检测,生成舆情预警信息,其中,时序异常检测算法用于检测文本情感时域向量中的元素的数值波动。在一些实施例中,上述基于舆情文本向量信息集合中的时间标识所指示的顺序,生成针对目标对象的文本情感时域向量,包括:根据舆情文本向量对舆情文本向量信息集合进行聚类,生成目标数目个舆情文本向量信息子集合,其中,舆情文本向量信息子集合用于表征舆情事件;生成目标数目个舆情文本向量信息子集合各自对应的舆情事件向量,其中,舆情事件向量中包括用于表征文本情感的元素;将生成的目标数目个舆情事件向量整合成文本情感时域向量。在一些实施例中,上述根据文本情感时域向量,生成针对目标对象的舆情预警信息,包括:将文本情感时域向量输入至预先训练的舆情预警模型,生成针对目标对象的舆情预警信息。在一些实施例中,上述舆情事件向量中还包括用于表征舆情事件持续时间的元素;上述文本情感时域向量中包括以下至少一项的统计值:舆情文本向量信息子集合的数目,舆情文本向量信息子集合中舆情文本向量信息的数目,文本情感值,舆情事件持续时间。在一些实施例中,上述获取针对目标对象的舆情文本向量信息集合,包括:获取关键词,其中,关键词包括目标对象的标识和其他限定词;从预设的舆情数据源抓取与关键词匹配的文本信息集合,其中,文本信息包括文本内容和时间标识;对文本信息集合中的文本信息的文本内容进行预处理;将经过预处理的文本内容转换为文本向量,生成目标舆情文本向量信息集合;以及该方法还包括:响应于确定所生成的舆情预警信息所指示的舆情事件的可能性大于预设阈值,向目标设备发送预警信息,其中,舆情预警信息所指示的舆情事件与其他限定词相关联。第二方面,本公开的实施例提供了一种用于生成信息的装置,该装置包括:获取单元,被配置成获取针对目标对象的舆情文本向量信息集合,其中,舆情文本向量信息包括舆情文本向量和时间标识;向量生成单元,被配置成基于舆情文本向量信息集合中的时间标识所指示的顺序,生成针对目标对象的文本情感时域向量;信息生成单元,被配置成根据文本情感时域向量,生成针对目标对象的舆情预警信息,其中,舆情预警信息用于表征目标对象发生目标事件的可能性,目标事件与舆情文本向量信息集合所指示的文本内容相关联。在一些实施例中,上述向量生成单元包括:情感值生成模块,被配置成对于舆情文本向量信息集合中的舆情文本向量信息,将该舆情文本向量信息中的舆情文本向量输入至预先训练的文本情感模型,生成与输入的舆情文本向量对应的文本情感值;向量生成模块,被配置成根据时间标识对所生成的文本情感值进行排序,生成文本情感时域向量,其中,文本情感时域向量包括文本情感值序列。在一些实施例中,上述信息生成单元进一步被配置成:根据时序异常检测算法对文本情感时域向量进行检测,生成舆情预警信息,其中,时序异常检测算法用于检测文本情感时域向量中的元素的数值波动。在一些实施例中,上述向量生成单元包括:子集合生成模块,被配置成根据舆情文本向量对舆情文本向量信息集合进行聚类,生成目标数目个舆情文本向量信息子集合,其中,舆情文本向量信息子集合用于表征舆情事件;事件向量生成模块,被配置成生成目标数目个舆情文本向量信息子集合各自对应的舆情事件向量,其中,舆情事件向量中包括用于表征文本情感的元素;整合模块,被配置成将生成的目标数目个舆情事件向量整合成文本情感时域向量。在一些实施例中,上述信息生成单元进一步被配置成:将文本情感时域向量输入至预先训练的舆情预警模型,生成针对目标对象的舆情预警信息。在一些实施例中,上述舆情事件向量中还包括用于表征舆情事件持续时间的元素;上述文本情感时域向量中包括以下至少一项的统计值:舆情文本向量信息子集合的数目,舆情文本向量信息子集合中舆情文本向量信息的数目,文本情感值,舆情事件持续时间。在一些实施例中,上述获取单元包括:获取模块,被配置成获取关键词,其中,关键词包括目标对象的标识和其他限定词;抓取模块,被配置成从预设的舆情数据源抓取与关键词匹配的文本信息集合,其中,文本信息包括文本内容和时间标识;预处理模块,被配置成对文本信息集合中的文本信息的文本内容进行预处理;向量信息生成模块,被配置成将经过预处理的文本内容转换为文本向量,生成目标舆情文本向量信息集合;该装置还包括:发送单元,被配置成响应于确定所生成的舆情预警信息所指示的舆情事件的可能性大于预设阈值,向目标设备发送预警信息,其中,舆情预警信息所指示的舆情事件与其他限定词相关联。第三方面,本公开的实施例提供了一种服务器,该服务器包括:一个或多个处理器;存储装置,其上存储有一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如第一方面中任一实现方式描述的方法。第四方面,本公开的实施例提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面中任一实现方式描述的方法。本公开的实施例提供的用于生成信息的方法和装置,首先获取针对目标对象的舆情文本向量信息集合。其中,舆情文本向量信息包括舆情文本向量和时间标识。而后,基于舆情文本向量信息集合中的时间标识所指示的顺序,生成针对目标对象的文本情感时域向量。之后,根据文本情感时域向量,生成针对目标对象的舆情预警信息。其中,舆情预警信息用于表征目标对象发生目标事件的可能性。目标事件与舆情文本向量信息集合所指示的文本内容相关本文档来自技高网...

【技术保护点】
1.一种用于生成信息的方法,包括:/n获取针对目标对象的舆情文本向量信息集合,其中,舆情文本向量信息包括舆情文本向量和时间标识;/n基于所述舆情文本向量信息集合中的时间标识所指示的顺序,生成针对所述目标对象的文本情感时域向量;/n根据所述文本情感时域向量,生成针对所述目标对象的舆情预警信息,其中,所述舆情预警信息用于表征所述目标对象发生目标事件的可能性,所述目标事件与所述舆情文本向量信息集合所指示的文本内容相关联。/n

【技术特征摘要】
1.一种用于生成信息的方法,包括:
获取针对目标对象的舆情文本向量信息集合,其中,舆情文本向量信息包括舆情文本向量和时间标识;
基于所述舆情文本向量信息集合中的时间标识所指示的顺序,生成针对所述目标对象的文本情感时域向量;
根据所述文本情感时域向量,生成针对所述目标对象的舆情预警信息,其中,所述舆情预警信息用于表征所述目标对象发生目标事件的可能性,所述目标事件与所述舆情文本向量信息集合所指示的文本内容相关联。


2.根据权利要求1所述的方法,其中,所述基于所述舆情文本向量信息集合中的时间标识所指示的顺序,生成针对所述目标对象的文本情感时域向量,包括:
对于所述舆情文本向量信息集合中的舆情文本向量信息,将该舆情文本向量信息中的舆情文本向量输入至预先训练的文本情感模型,生成与输入的舆情文本向量对应的文本情感值;
根据时间标识对所生成的文本情感值进行排序,生成所述文本情感时域向量,其中,所述文本情感时域向量包括文本情感值序列。


3.根据权利要求2所述的方法,其中,所述根据所述文本情感时域向量,生成针对所述目标对象的舆情预警信息,包括:
根据时序异常检测算法对所述文本情感时域向量进行检测,生成所述舆情预警信息,其中,所述时序异常检测算法用于检测文本情感时域向量中的元素的数值波动。


4.根据权利要求1所述的方法,其中,所述基于所述舆情文本向量信息集合中的时间标识所指示的顺序,生成针对所述目标对象的文本情感时域向量,包括:
根据舆情文本向量对所述舆情文本向量信息集合进行聚类,生成目标数目个舆情文本向量信息子集合,其中,舆情文本向量信息子集合用于表征舆情事件;
生成所述目标数目个舆情文本向量信息子集合各自对应的舆情事件向量,其中,舆情事件向量中包括用于表征文本情感的元素;
将所述生成的所述目标数目个舆情事件向量整合成所述文本情感时域向量。


5.根据权利要求4所述的方法,其中,所述根据所述文本情感时域向量,生成针对所述目标对象的舆情预警信息,包括:
将所述文本情感时域向量输入至预...

【专利技术属性】
技术研发人员:胡安民郑宇张钧波何源
申请(专利权)人:京东城市北京数字科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1