用于在线资讯的处理方法、装置及存储介质制造方法及图纸

技术编号:36446361 阅读:26 留言:0更新日期:2023-01-25 22:41
本发明专利技术实施例公开了一种用于在线资讯的处理方法、装置及存储介质,涉及互联网技术领域,能够提高在线资讯的排序效率,从而减轻后台服务器运算压力。本发明专利技术包括:根据所设定的主题,从目标数据源获取资讯;确定所获取的资讯中的指标参数的类型,并对来自不同目标数据源的资讯进行维度补齐换算;按照维度补齐换算后的指标参数,对来自不同目标数据源的资讯进行排序,并按照排序结果向客户端推送资讯。本发明专利技术适用于资讯的排序和推送。发明专利技术适用于资讯的排序和推送。发明专利技术适用于资讯的排序和推送。

【技术实现步骤摘要】
用于在线资讯的处理方法、装置及存储介质


[0001]本专利技术涉及互联网
,尤其涉及一种用于在线资讯的处理方法、装置及存储介质。

技术介绍

[0002]在目前的门户网站多种多样,在toB业务中,数据提供方需要向企业、专业机构提供很多资讯,这些资讯需要实时。因此就需要从全网获取主题资讯,每分钟获取的文章数量可能成千上万。
[0003]并且由于资讯较多,企业、专业机构的业务人员,以及企业家个人,一般也不会查看排名靠后的资讯。
[0004]但是在每次用户请求读取资讯时,都对所有主题资讯都进行计算和排序,由于不同来源的资讯的数据标准和参数都不相同,分析算法复杂,需要花费较多时间和并且占用大量的硬件资源。

技术实现思路

[0005]本专利技术的实施例提供一种用于在线资讯的处理方法、装置及存储介质,能够提高在线资讯的排序效率,从而减轻后台服务器运算压力。
[0006]为达到上述目的,本专利技术的实施例采用如下技术方案:
[0007]第一方面,本专利技术的实施例提供的方法,包括:
[0008]根据所设定的主题,从目标数据源获取资讯;确定所获取的资讯中的指标参数的类型,并对来自不同目标数据源的资讯进行维度补齐换算;按照维度补齐换算后的指标参数,对来自不同目标数据源的资讯进行排序,并按照排序结果向客户端推送资讯。
[0009]第二方面,本专利技术的实施例提供的装置,包括:
[0010]提取模块,用于根据所设定的主题,从目标数据源获取资讯;
[0011]处理模块,用于确定所获取的资讯中的指标参数的类型,并对来自不同目标数据源的资讯进行维度补齐换算;
[0012]排序模块,用于按照维度补齐换算后的指标参数,对来自不同目标数据源的资讯进行排序;
[0013]发送模块,用于按照排序结果向客户端推送资讯。
[0014]第三方面,本专利技术的实施例提供的存储介质,存储有计算机程序或指令,当所述计算机程序或指令被运行时,实现第一方面的实施例提供的方法所述的方法。
[0015]本专利技术实施例提供的用于在线资讯的处理方法、装置及存储介质,根据所设定的主题,从目标数据源获取资讯;确定所获取的资讯中的指标参数的类型,并对来自不同目标数据源的资讯进行维度补齐换算;按照维度补齐换算后的指标参数,对来自不同目标数据源的资讯进行排序,并按照排序结果向客户端推送资讯。相对于现有技术中,若每次若全部都进行排序,则会浪费较多资源,给后台服务器造成压力。本专利技术实施例中,通过快速补充
缺失的指标参数类型,并对前30篇进行排序。从而可以统一来自不同来源的各个资讯,并进行排序,从而可以简化资讯的排序算法,提高在线资讯的排序效率,减轻后台服务器运算压力,从而加快排序速度。
附图说明
[0016]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0017]图1为本专利技术实施例提供的方法流程示意图;
[0018]图2为本专利技术实施例提供的装置结构示意图。
具体实施方式
[0019]为使本领域技术人员更好地理解本专利技术的技术方案,下面结合附图和具体实施方式对本专利技术作进一步详细描述。下文中将详细描述本专利技术的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施方式是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。本
技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本专利技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的任一单元和全部组合。本
技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本专利技术所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
[0020]本专利技术实施例提供一种用于在线资讯的处理方法,如图1所示,包括:
[0021]S1、根据所设定的主题,从目标数据源获取资讯。
[0022]S2、确定所获取的资讯中的指标参数的类型,并对来自不同目标数据源的资讯进行维度补齐换算。
[0023]其中,可以预先进行试验调查,从而确定网站上的一篇文章吸引力用到的维度。所述指标参数的类型还包括:点赞量、转发量、评论量和打赏量。本实施例中,通过维度补齐换算,将不同来源的资讯的指标参数进行统一。首先确定各个目标数据源所具有的全部指标参数的类型,并判断各个目标数据源的资讯所缺失的指标参数的类型。并对各个目标数据源所缺失的指标参数进行补全,使得来自不同目标数据源的资讯具有相同的指标参数。例如:文章分别来自:东方财富网、创业邦、雷锋网,3个网站。其中,东方财富网的文章没有阅读量,只有收藏量。创业邦、雷锋网的文章,既有阅读量又有收藏量,需要对东方财富网的文
章进行维度补齐换算,使之也具有阅读量。
[0024]S3、按照维度补齐换算后的指标参数,对来自不同目标数据源的资讯进行排序,并按照排序结果向客户端推送资讯。
[0025]本实施例中,步骤S1中,包括:从主题字段中提取关键词。从作为目标数据源的网站,提取符合所述关键词的文章。实际应用中,服务器设备可以根据主题定义从目标数据源获取资讯。
[0026]本实施例中,步骤S2中,包括:从各个目标数据源的网站中,确定指标参数的类型,其中,指标参数的类型至少包括:收藏量和阅读量。
[0027]进一步的,所述对来自不同目标数据源的资讯进行维度补齐换算,包括:
[0028]提取第一网站至第M网站的文章。确定第m指标参数与目标指标参数的比例系数。根据所确定的比例系数,分别获取各个网站的文章相对于所述目标指标参数所缺失指标参数。其中,M为大于1的正整数。所述第m网站的文章的指标参数作为第m指标参数,1≤m≤M,所述第m指标参数的类型包括目标指标参数的类型中的一部分,至少有一个网站的文章的指标参数的类型最多且作为所述目标指标参数。比如:所提取的网站中,存在一个网站的指标参数是齐全的。从A网站爬取到50篇相关文章,包括了各篇文章的阅读量和收藏量,然后计算出50篇文章的平均阅读量和平均收藏量,并计算的比例系数α=平本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于在线资讯的处理方法,其特征在于,包括:S1、根据所设定的主题,从目标数据源获取资讯;S2、确定所获取的资讯中的指标参数的类型,并对来自不同目标数据源的资讯进行维度补齐换算;S3、按照维度补齐换算后的指标参数,对来自不同目标数据源的资讯进行排序,并按照排序结果向客户端推送资讯。2.根据权利要求1所述的方法,其特征在于,步骤S1中,包括:从主题字段中提取关键词;从作为目标数据源的网站,提取符合所述关键词的文章。3.根据权利要求2所述的方法,其特征在于,步骤S2中,包括:从各个目标数据源的网站中,确定指标参数的类型,其中,指标参数的类型至少包括:收藏量和阅读量。4.根据权利要求3所述的方法,其特征在于,所述指标参数的类型还包括:点赞量、转发量、评论量和打赏量。5.根据权利要求3所述的方法,其特征在于,所述对来自不同目标数据源的资讯进行维度补齐换算,包括:提取第一网站至第M网站的文章,其中,M为大于1的正整数;确定第m指标参数与目标指标参数的比例系数,其中,所述第m网站的文章的指标参数作为第m指标参数,1≤m≤M,所述第m指标参数的类型包括目标指标参数的类型中的一部分,至少有一个网站的文章的指标参数的类型最多且作为所述目标指标参数;根据所确定的比例系数,分别获取各个网站的文章相对于所述目标指标参数所缺失指标参数。6.根据权利要求1所述的方法,其特征在于,步骤S3中,包括:获取各个指标参数的权重;按照维度补齐换算后的指标参数和各个指标参数的权重,对来自不同...

【专利技术属性】
技术研发人员:夏正新王东传佟立兵李鹏
申请(专利权)人:南京一盏神灯网络信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1