当前位置: 首页 > 专利查询>崔冬专利>正文

基于大数据和人工智能的热点话题处理方法及服务器技术

技术编号:33346171 阅读:18 留言:0更新日期:2022-05-08 09:41
本申请的基于大数据和人工智能的热点话题处理方法及服务器,根据本申请,在多条第二社交新闻报道消息中符合社交新闻报道的热点话题跟踪条件的前提下,将多条第二社交新闻报道消息中携带的热点话题确定为待跟踪的热点话题的方式,基于时序层面和语义特征层面进行热点话题的关联度分析,在一定程度上削减热点话题处理服务器的话题跟踪分析开销的前提下有效提升了待跟踪的热点话题的定位准确性。由此可见,可以解决或者部分解决相关技术中存在的热点话题跟踪识别和跟踪分析的精度较低、资源开销较大的技术问题,进而达到提高热点话题跟踪识别和跟踪分析的效率以及精度的技术效果。果。果。

【技术实现步骤摘要】
基于大数据和人工智能的热点话题处理方法及服务器


[0001]本申请涉及大数据和话题处理
,更具体地,涉及一种基于大数据和人工智能的热点话题处理方法及服务器。

技术介绍

[0002]话题检测与跟踪(Topic Detection and Tracking)是一项信息处理技术,这项技术旨在帮助人们应对日益严重的互联网信息爆炸问题,对新闻媒体信息流进行新话题的自动识别和已知话题的持续跟踪。
[0003]随着大数据智能的不断发展,网络舆情话题的数量激增,通过进行话题检测和跟踪,能够从用户层面了解和分析话题互动的相关价值信息,从而为后续的话题推送和服务优化提供依据。
[0004]现目前的话题跟踪和分析方法大多可以结合人工智能技术实现,然而在实际实施时还存在话题跟踪分析效率低下的问题。

技术实现思路

[0005]本申请的一个目的是提供一种用于热点话题跟踪的新技术方案。
[0006]根据本申请的第一方面,提供一种基于大数据和人工智能的热点话题处理方法,应用于热点话题处理服务器,所述方法至少包括:获取多条第一社交新闻报道消息,其中,所述第一社交新闻报道消息由社交平台互动服务器抓取得到,所述第一社交新闻报道消息包括第一热点话题、所述第一热点话题对应的状态描述以及所述第一热点话题的消息抓取时刻;对所述多条第一社交新闻报道消息进行预设消息转换操作,并基于事先设定的时序步长对进行了所述预设消息转换操作后的所述第一社交新闻报道消息进行识别,基于消息识别情况生成包含语义关键特征形式消息的多条第二社交新闻报道消息,其中,所述预设消息转换操作用于将所述第一热点话题对应的状态描述转换为语义关键特征;在所述多条第二社交新闻报道消息中符合社交新闻报道的热点话题跟踪条件的前提下,将所述多条第二社交新闻报道消息中携带的热点话题确定为待跟踪的热点话题。
[0007]根据本申请的第二方面,提供一种热点话题处理服务器,包括:存储器,用于存储可执行的指令;处理器,用于根据所述可执行的指令的控制,运行所述电子设备执行上述的方法。
[0008]根据本申请的第三方面,提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述的方法。
附图说明
[0009]被结合在说明书中并构成说明书的一部分的附图示出了本申请的实施例,并且连同其说明一起用于解释本申请的原理。
[0010]图1是示出可以实现本申请的实施例的热点话题处理服务器100的一种硬件配置
的框图。
[0011]图2是示出可以实现本申请的实施例的热点话题处理服务器100的另一种硬件配置的框图。
[0012]图3是示出可以实现本申请的实施例的基于大数据和人工智能的热点话题处理方法的流程图。
[0013]图4是示出可以实现本申请的实施例的基于大数据和人工智能的热点话题处理系统的架构示意图。
具体实施方式
[0014]<硬件配置>图1是示出可以实现本申请的实施例的热点话题处理服务器100的一种硬件配置的框图,热点话题处理服务器100可以包括处理器110和存储器120,存储器120用于存储可执行的指令,处理器110用于根据可执行的指令的控制,运行热点话题处理服务器100执行本申请中的基于大数据和人工智能的热点话题处理方法。
[0015]图2是示出可以实现本申请的实施例的热点话题处理服务器100的另一种硬件配置的框图,热点话题处理服务器100可以包括处理器110、存储器120和基于大数据和人工智能的热点话题处理装置400,基于大数据和人工智能的热点话题处理装置400包括至少一个可以软件或固件(firmware)的形式储存于所述存储器120中的软件功能模块,所述处理器110通过运行存储在存储器120内的软件程序以及模块,例如本申请实施例中的基于大数据和人工智能的热点话题处理装置400,从而执行各种功能应用以及数据处理,即实现本申请实施例中的基于大数据和人工智能的热点话题处理方法。
[0016]<方法实施例>图3是示出可以实现本申请的实施例的基于大数据和人工智能的热点话题处理方法的流程图,基于大数据和人工智能的热点话题处理方法可以通过图1或图2所示的热点话题处理服务器100实现,进一步可以包括以下Step1

Step3所描述的技术方案。
[0017]Step1、热点话题处理服务器获取多条第一社交新闻报道消息。
[0018]在本方案中,所述第一社交新闻报道消息由社交平台互动服务器抓取得到,所述第一社交新闻报道消息包括第一热点话题、所述第一热点话题对应的状态描述以及所述第一热点话题的消息抓取时刻。
[0019]可以理解,热点话题处理服务器和社交平台互动服务器通信,热点话题处理服务器在获得社交平台互动服务器授权的前提下从社交平台互动服务器中获取第一社交新闻报道消息。
[0020]例如,社交新闻报道消息可以涵盖多个板块的报道消息,比如体育板块、娱乐板块或者购物板块。此外,热点话题可以是不同板块下比较热门的话题,比如体育板块下的NBA、欧冠,又比如娱乐板块下的综艺节目和演唱会。进一步地,第一热点话题对应的状态描述用于表征第一热点话题的状态变化,比如可以是热度暴涨状态、热度维持状态、热度下降状态等,本方案中不作限制。另外,消息抓取时刻可以是获取第一热点话题的时刻,可以根据实际需求精确到分秒。
[0021]Step2、热点话题处理服务器对所述多条第一社交新闻报道消息进行预设消息转
换操作,并基于事先设定的时序步长对进行了所述预设消息转换操作后的所述第一社交新闻报道消息进行识别,基于消息识别情况生成包含语义关键特征形式消息的多条第二社交新闻报道消息。
[0022]在本申请实施例中,所述预设消息转换操作用于将所述第一热点话题对应的状态描述转换为语义关键特征。
[0023]可以理解的是,预设消息转换操作可以根据实际情况进行特征转换需求的灵活调整。进一步地,时序步长可以是时间间隔,比如每隔5s进行一次操作,或者每隔1min进行一次操作。
[0024]在对进行了所述预设消息转换操作后的所述第一社交新闻报道消息进行识别时,可以调用预先训练得到的卷积神经网络实现,比如可以对进行了所述预设消息转换操作后的所述第一社交新闻报道消息进行分类,从而根据分类结果生成对应的包含语义关键特征形式消息的多条第二社交新闻报道消息。
[0025]在本实施例中,通过考虑语义关键特征,能实现从语义层面定位和分类第二社交新闻报道消息,从而便于后续的话题跟踪精度。此外,由于语义关键特征所对应的特征维度较小,因而可以有效减少热点话题处理服务器在特征分析和识别时的资源开销,从而提高话题跟踪的效率。
[0026]Step3、热点话题处理服务器在所述多条第二社交新闻报道消息中符合社交新闻报道的热点话题跟踪条件的前提下,将所述多条第二社交新闻报道消息中携带的热点话题确定为待跟踪的热点话题。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据和人工智能的热点话题处理方法,其特征在于,应用于热点话题处理服务器,所述方法至少包括:获取多条第一社交新闻报道消息,其中,所述第一社交新闻报道消息由社交平台互动服务器抓取得到,所述第一社交新闻报道消息包括第一热点话题、所述第一热点话题对应的状态描述以及所述第一热点话题的消息抓取时刻;对所述多条第一社交新闻报道消息进行预设消息转换操作,并基于事先设定的时序步长对进行了所述预设消息转换操作后的所述第一社交新闻报道消息进行识别,基于消息识别情况生成包含语义关键特征形式消息的多条第二社交新闻报道消息,其中,所述预设消息转换操作用于将所述第一热点话题对应的状态描述转换为语义关键特征;在所述多条第二社交新闻报道消息中符合社交新闻报道的热点话题跟踪条件的前提下,将所述多条第二社交新闻报道消息中携带的热点话题确定为待跟踪的热点话题。2.根据权利要求1所述的方法,其特征在于,在所述多条第二社交新闻报道消息中符合社交新闻报道的热点话题跟踪条件的前提下,将所述多条第二社交新闻报道消息中携带的热点话题确定为待跟踪的热点话题,包括:基于设定条件从所述多条第二社交新闻报道消息中确定出不符合社交新闻报道的热点话题跟踪条件的多条第三社交新闻报道消息以及符合社交新闻报道的热点话题跟踪条件的多条第四社交新闻报道消息;获取所述多条第三社交新闻报道消息中每条第三社交新闻报道消息的共性社交新闻报道消息,其中,所述共性社交新闻报道消息和对应的所述第三社交新闻报道消息在状态描述和消息抓取时刻上存在关联;在所述共性社交新闻报道消息符合热点话题关联指标的前提下,优化所述第三社交新闻报道消息,以得到目标社交新闻报道消息,其中,所述目标社交新闻报道消息用于表示更新后的所述多条第三社交新闻报道消息;在所述目标社交新闻报道消息符合社交新闻报道的热点话题跟踪条件的前提下,将所述目标社交新闻报道消息以及所述多条第四社交新闻报道消息中携带的热点话题确定为待跟踪的热点话题。3.根据权利要求2所述的方法,其特征在于,基于设定条件从所述多条第二社交新闻报道消息中确定出不符合社交新闻报道的热点话题跟踪条件的多条第三社交新闻报道消息以及符合社交新闻报道的热点话题跟踪条件的多条第四社交新闻报道消息,包括:从所述多条第二社交新闻报道消息中确定出不符合热点话题动态清洗条件的社交新闻报道消息,以作为所述多条第三社交新闻报道消息;从所述多条第二社交新闻报道消息中确定出符合热点话题动态清洗条件,且符合所述社交新闻报道的热点话题跟踪条件的社交新闻报道消息,以作为所述多条第四社交新闻报道消息。4.根据权利要求2所述的方法,其特征在于,基于设定条件从所述多条第二社交新闻报道消息中确定出不符合社交新闻报道的热点话题跟踪条件的多条第三社交新闻报道消息以及符合社交新闻报道的热点话题跟踪条件的多条第四社交新闻报道消息,包括:从所述多条第二社交新闻报道消息中确定出包含第一类别热点话题的社交新闻报道消息,以作为所述多条第三社交新闻报道消息,其中,所述第一类别热点话题为不满足舆情
风向跟进条件的热点话题;从所述多条第二社交新闻报道消息中确定出包含第二类别热点话题,且符合所述社交新闻报道的热点话题跟踪条件的社交新闻报道消息,以作为所述多条第四社交新闻报道消息,其中,所述第二类别热点话题为满足舆情风向跟进条件的热点话题。5.根据权利要求2所述的方法,其特征在于,基于设定条件从所述多条第二社交新闻报道消息中确定出不符合社交新闻报道的热点话题跟踪条件的多条第三社交新闻报道消息以及符合社交新闻报道的热点话题跟踪条件的多条第四社交新闻报道消息,包括:在第一热点话题被x...

【专利技术属性】
技术研发人员:崔冬
申请(专利权)人:崔冬
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1