The embodiment of this application discloses a method and device for obtaining information. One specific embodiment of the method includes: acquiring media information within a set time; extracting the media subject words of the above-mentioned media information, and querying at least one feature word corresponding to the media subject words, in which the feature words are used to represent the characteristics of the media subject corresponding to the above-mentioned media subject words; calculating the similarity between at least one feature word and obtaining at least one feature word. For the feature word type information in at least one of the above-mentioned feature word type information, the query result information corresponding to the media subject word and the feature word type information is obtained, and the target information set corresponding to the feature word type information is constructed according to the above-mentioned media subject word and the query result information. The implementation method can obtain target information through media subject words, which is helpful to obtain information related to media subject words according to the target information and improve the reading amount of information.
【技术实现步骤摘要】
用于获取信息的方法及装置
本申请实施例涉及数据处理
,具体涉及用于获取信息的方法及装置。
技术介绍
随着网络技术的发展,各种信息能够在网络上快速传递,提高了人们获取信息的效率。通常,某一信息的阅读量越高,与该信息相关的信息的阅读量也越高,进而能够使得该信息和该信息相关的信息成为热点信息,有利于信息的传播。
技术实现思路
本申请实施例提出了用于获取信息的方法及装置。第一方面,本申请实施例提供了一种用于获取信息的方法,该方法包括:获取设定时间内的媒体信息;提取上述媒体信息的媒体主体词,并查询对应上述媒体主体词的至少一个特征词,其中,特征词用于表征上述媒体主体词对应的媒体主体的特征;计算上述至少一个特征词之间的相似度,得到至少一个特征词类型信息;对于上述至少一个特征词类型信息中的特征词类型信息,获取与上述媒体主体词和该特征词类型信息对应的查询结果信息,根据上述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合。在一些实施例中,上述媒体信息包括媒体标题,以及,上述提取上述媒体信息的媒体主体词,包括:从上述媒体信息的媒体标题中提取媒体主体词。在一些实施例中,上述查询对应上述媒体主体词的至少一个特征词,包括:查询对应上述媒体主体词的历史搜索信息;将上述历史搜索信息进行语义识别,得到对应上述媒体主体词的至少一个特征词。在一些实施例中,上述计算上述至少一个特征词之间的相似度,得到至少一个特征词类型信息,包括:获取上述至少一个特征词中每个特征词的词向量;计算上述至少一个特征词对应的至少一个词向量之间的欧氏距离,根据欧氏距离将上述至少一个词向量划分为至少一个词向 ...
【技术保护点】
1.一种用于获取信息的方法,包括:获取设定时间内的媒体信息;提取所述媒体信息的媒体主体词,并查询对应所述媒体主体词的至少一个特征词,其中,特征词用于表征所述媒体主体词对应的媒体主体的特征;计算所述至少一个特征词之间的相似度,得到至少一个特征词类型信息;对于所述至少一个特征词类型信息中的特征词类型信息,获取与所述媒体主体词和该特征词类型信息对应的查询结果信息,根据所述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合。
【技术特征摘要】
1.一种用于获取信息的方法,包括:获取设定时间内的媒体信息;提取所述媒体信息的媒体主体词,并查询对应所述媒体主体词的至少一个特征词,其中,特征词用于表征所述媒体主体词对应的媒体主体的特征;计算所述至少一个特征词之间的相似度,得到至少一个特征词类型信息;对于所述至少一个特征词类型信息中的特征词类型信息,获取与所述媒体主体词和该特征词类型信息对应的查询结果信息,根据所述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合。2.根据权利要求1所述的方法,其中,所述媒体信息包括媒体标题,以及所述提取所述媒体信息的媒体主体词,包括:从所述媒体信息的媒体标题中提取媒体主体词。3.根据权利要求1所述的方法,其中,所述查询对应所述媒体主体词的至少一个特征词,包括:查询对应所述媒体主体词的历史搜索信息;将所述历史搜索信息进行语义识别,得到对应所述媒体主体词的至少一个特征词。4.根据权利要求1所述的方法,其中,所述计算所述至少一个特征词之间的相似度,得到至少一个特征词类型信息,包括:获取所述至少一个特征词中每个特征词的词向量;计算所述至少一个特征词对应的至少一个词向量之间的欧氏距离,根据欧氏距离将所述至少一个词向量划分为至少一个词向量集合;对于所述至少一个词向量集合中的词向量集合,对该词向量集合中的词向量对应的特征词进行语义识别,得到对应该词向量集合的特征词类型信息。5.根据权利要求1所述的方法,其中,所述获取与所述媒体主体词和该特征词类型信息对应的查询结果信息,包括:以所述媒体主体词和该特征词类型信息为搜索关键词获取至少一条搜索结果信息,所述搜索结果信息包括标题信息;提取所述至少一条搜索结果信息中搜索结果信息的标题信息,从标题信息中提取目标关键词,得到目标关键词集合,其中,目标关键词用于表征所述特征词类型信息的特征;计算所述媒体主体词与目标关键词集合中每个目标关键词之间的关联度,并将大于关联度阈值的关联度对应的目标关键词设置为查询结果信息。6.根据权利要求1至5任意一项所述的方法,其中,所述根据所述媒体主体词和查询结果信息构建对应该特征词类型信息的目标信息集合,包括:将所述媒体主体词和查询结果信息组合为目标信息。7.一种用于获取信息的装置,包括:媒体信息获取单元,被配置成获取设定时间内的媒体信息;特征词查询单元,被配置成提取所述媒体信息的媒体主体词,并查询对应所述媒体主体词的至少一个特征词,其中,特征词用于表征所述媒体主体词对应的媒体主体的特征;特征词类型信息获取单元,被配置...
【专利技术属性】
技术研发人员:郑烨翰,薛成韵,梁海金,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。