用于获取信息的方法及装置制造方法及图纸

技术编号:20916730 阅读:18 留言:0更新日期:2019-04-20 09:44
本申请实施例公开了用于获取信息的方法及装置。该方法的一具体实施方式包括:获取设定时间内的媒体信息;提取上述媒体信息的媒体主体词,并查询对应上述媒体主体词的至少一个特征词,其中,特征词用于表征上述媒体主体词对应的媒体主体的特征;计算上述至少一个特征词之间的相似度,得到至少一个特征词类型信息;对于上述至少一个特征词类型信息中的特征词类型信息,获取与上述媒体主体词和该特征词类型信息对应的查询结果信息,根据上述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合。该实施方式能够通过媒体主体词获取目标信息,有利于根据目标信息获取与媒体主体词相关的信息,提高信息的阅读量。

Methods and devices for obtaining information

The embodiment of this application discloses a method and device for obtaining information. One specific embodiment of the method includes: acquiring media information within a set time; extracting the media subject words of the above-mentioned media information, and querying at least one feature word corresponding to the media subject words, in which the feature words are used to represent the characteristics of the media subject corresponding to the above-mentioned media subject words; calculating the similarity between at least one feature word and obtaining at least one feature word. For the feature word type information in at least one of the above-mentioned feature word type information, the query result information corresponding to the media subject word and the feature word type information is obtained, and the target information set corresponding to the feature word type information is constructed according to the above-mentioned media subject word and the query result information. The implementation method can obtain target information through media subject words, which is helpful to obtain information related to media subject words according to the target information and improve the reading amount of information.

【技术实现步骤摘要】
用于获取信息的方法及装置
本申请实施例涉及数据处理
,具体涉及用于获取信息的方法及装置。
技术介绍
随着网络技术的发展,各种信息能够在网络上快速传递,提高了人们获取信息的效率。通常,某一信息的阅读量越高,与该信息相关的信息的阅读量也越高,进而能够使得该信息和该信息相关的信息成为热点信息,有利于信息的传播。
技术实现思路
本申请实施例提出了用于获取信息的方法及装置。第一方面,本申请实施例提供了一种用于获取信息的方法,该方法包括:获取设定时间内的媒体信息;提取上述媒体信息的媒体主体词,并查询对应上述媒体主体词的至少一个特征词,其中,特征词用于表征上述媒体主体词对应的媒体主体的特征;计算上述至少一个特征词之间的相似度,得到至少一个特征词类型信息;对于上述至少一个特征词类型信息中的特征词类型信息,获取与上述媒体主体词和该特征词类型信息对应的查询结果信息,根据上述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合。在一些实施例中,上述媒体信息包括媒体标题,以及,上述提取上述媒体信息的媒体主体词,包括:从上述媒体信息的媒体标题中提取媒体主体词。在一些实施例中,上述查询对应上述媒体主体词的至少一个特征词,包括:查询对应上述媒体主体词的历史搜索信息;将上述历史搜索信息进行语义识别,得到对应上述媒体主体词的至少一个特征词。在一些实施例中,上述计算上述至少一个特征词之间的相似度,得到至少一个特征词类型信息,包括:获取上述至少一个特征词中每个特征词的词向量;计算上述至少一个特征词对应的至少一个词向量之间的欧氏距离,根据欧氏距离将上述至少一个词向量划分为至少一个词向量集合;对于上述至少一个词向量集合中的词向量集合,对该词向量集合中的词向量对应的特征词进行语义识别,得到对应该词向量集合的特征词类型信息。在一些实施例中,上述获取与上述媒体主体词和该特征词类型信息对应的查询结果信息,包括:以上述媒体主体词和该特征词类型信息为搜索关键词获取至少一条搜索结果信息,上述搜索结果信息包括标题信息;提取上述至少一条搜索结果信息中搜索结果信息的标题信息,从标题信息中提取目标关键词,得到目标关键词集合,其中,目标关键词用于表征上述特征词类型信息的特征;计算上述媒体主体词与目标关键词集合中每个目标关键词之间的关联度,并将大于关联度阈值的关联度对应的目标关键词设置为查询结果信息。在一些实施例中,上述根据上述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合,包括:将上述媒体主体词和查询结果信息组合为目标信息。第二方面,本申请实施例提供了一种用于获取信息的装置,该装置包括:媒体信息获取单元,被配置成获取设定时间内的媒体信息;特征词查询单元,被配置成提取上述媒体信息的媒体主体词,并查询对应上述媒体主体词的至少一个特征词,其中,特征词用于表征上述媒体主体词对应的媒体主体的特征;特征词类型信息获取单元,被配置成计算上述至少一个特征词之间的相似度,得到至少一个特征词类型信息;目标信息获取单元,对于上述至少一个特征词类型信息中的特征词类型信息,被配置成获取与上述媒体主体词和该特征词类型信息对应的查询结果信息,根据上述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合。在一些实施例中,上述媒体信息包括媒体标题,以及,上述特征词查询单元包括:媒体主体词提取子单元,被配置成从上述媒体信息的媒体标题中提取媒体主体词。在一些实施例中,上述特征词查询单元包括:历史搜索信息查询子单元,被配置成查询对应上述媒体主体词的历史搜索信息;特征词获取子单元,被配置成将上述历史搜索信息进行语义识别,得到对应上述媒体主体词的至少一个特征词。在一些实施例中,上述特征词类型信息获取单元包括:词向量获取子单元,被配置成获取上述至少一个特征词中每个特征词的词向量;词向量集合获取子单元,被配置成计算上述至少一个特征词对应的至少一个词向量之间的欧氏距离,根据欧氏距离将上述至少一个词向量划分为至少一个词向量集合;特征词类型信息获取子单元,被配置成对于上述至少一个词向量集合中的词向量集合,对该词向量集合中的词向量对应的特征词进行语义识别,得到对应该词向量集合的特征词类型信息。在一些实施例中,上述目标信息获取单元包括:搜索结果信息获取子单元,被配置成以上述媒体主体词和该特征词类型信息为搜索关键词获取至少一条搜索结果信息,上述搜索结果信息包括标题信息;目标关键词获取子单元,被配置成提取上述至少一条搜索结果信息中搜索结果信息的标题信息,从标题信息中提取目标关键词,得到目标关键词集合,其中,目标关键词用于表征上述特征词类型信息的特征;查询结果信息设置子单元,被配置成计算上述媒体主体词与目标关键词集合中每个目标关键词之间的关联度,并将大于关联度阈值的关联度对应的目标关键词设置为查询结果信息。在一些实施例中,上述目标信息获取单元包括:目标信息获取子单元,被配置成将上述媒体主体词和查询结果信息组合为目标信息。第三方面,本申请实施例提供了一种服务器,包括:一个或多个处理器;存储器,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器执行上述第一方面的用于获取信息的方法。第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现上述第一方面的用于获取信息的方法。本申请实施例提供的用于获取信息的方法及装置,首先获取设定时间内的媒体信息;然后提取媒体信息的媒体主体词,并查询对应媒体主体词的至少一个特征词;之后,计算上述至少一个特征词之间的相似度,得到至少一个特征词类型信息;最后获取与媒体主体词和特征词类型信息对应的查询结果信息,根据媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合。本技术方案能够通过媒体主体词获取目标信息,有利于根据目标信息获取与媒体主体词相关的信息,提高信息的阅读量。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1是本申请的一个实施例可以应用于其中的示例性系统架构图;图2是根据本申请的用于获取信息的方法的一个实施例的流程图;图3是根据本申请的用于获取信息的方法的一个应用场景的示意图;图4是根据本申请的用于获取信息的方法的又一个实施例的流程图;图5是根据本申请的用于获取信息的装置的一个实施例的结构示意图;图6是适于用来实现本申请实施例的服务器的计算机系统的结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。图1示出了可以应用本申请实施例的用于获取信息的方法或用于获取信息的装置的示例性系统架构100。如图1所示,系统架构100可以包括网络服务器101、102、103,网络104和信息获取服务器105。网络104用以在网络服务器101、102、103和信息获取服务器105之间提供通信链路的介质。网络104本文档来自技高网...

【技术保护点】
1.一种用于获取信息的方法,包括:获取设定时间内的媒体信息;提取所述媒体信息的媒体主体词,并查询对应所述媒体主体词的至少一个特征词,其中,特征词用于表征所述媒体主体词对应的媒体主体的特征;计算所述至少一个特征词之间的相似度,得到至少一个特征词类型信息;对于所述至少一个特征词类型信息中的特征词类型信息,获取与所述媒体主体词和该特征词类型信息对应的查询结果信息,根据所述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合。

【技术特征摘要】
1.一种用于获取信息的方法,包括:获取设定时间内的媒体信息;提取所述媒体信息的媒体主体词,并查询对应所述媒体主体词的至少一个特征词,其中,特征词用于表征所述媒体主体词对应的媒体主体的特征;计算所述至少一个特征词之间的相似度,得到至少一个特征词类型信息;对于所述至少一个特征词类型信息中的特征词类型信息,获取与所述媒体主体词和该特征词类型信息对应的查询结果信息,根据所述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合。2.根据权利要求1所述的方法,其中,所述媒体信息包括媒体标题,以及所述提取所述媒体信息的媒体主体词,包括:从所述媒体信息的媒体标题中提取媒体主体词。3.根据权利要求1所述的方法,其中,所述查询对应所述媒体主体词的至少一个特征词,包括:查询对应所述媒体主体词的历史搜索信息;将所述历史搜索信息进行语义识别,得到对应所述媒体主体词的至少一个特征词。4.根据权利要求1所述的方法,其中,所述计算所述至少一个特征词之间的相似度,得到至少一个特征词类型信息,包括:获取所述至少一个特征词中每个特征词的词向量;计算所述至少一个特征词对应的至少一个词向量之间的欧氏距离,根据欧氏距离将所述至少一个词向量划分为至少一个词向量集合;对于所述至少一个词向量集合中的词向量集合,对该词向量集合中的词向量对应的特征词进行语义识别,得到对应该词向量集合的特征词类型信息。5.根据权利要求1所述的方法,其中,所述获取与所述媒体主体词和该特征词类型信息对应的查询结果信息,包括:以所述媒体主体词和该特征词类型信息为搜索关键词获取至少一条搜索结果信息,所述搜索结果信息包括标题信息;提取所述至少一条搜索结果信息中搜索结果信息的标题信息,从标题信息中提取目标关键词,得到目标关键词集合,其中,目标关键词用于表征所述特征词类型信息的特征;计算所述媒体主体词与目标关键词集合中每个目标关键词之间的关联度,并将大于关联度阈值的关联度对应的目标关键词设置为查询结果信息。6.根据权利要求1至5任意一项所述的方法,其中,所述根据所述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合,包括:将所述媒体主体词和查询结果信息组合为目标信息。7.一种用于获取信息的装置,包括:媒体信息获取单元,被配置成获取设定时间内的媒体信息;特征词查询单元,被配置成提取所述媒体信息的媒体主体词,并查询对应所述媒体主体词的至少一个特征词,其中,特征词用于表征所述媒体主体词对应的媒体主体的特征;特征词类型信息获取单元,被配置...

【专利技术属性】
技术研发人员:郑烨翰薛成韵梁海金
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1