The invention relates to a popular content search method and system, the popular content search method comprises the following steps: obtaining a search keyword; according to search keywords, search in the default index database, get the text data according to the preset time; thermal fluctuation degree algorithm, each dimension parameters corresponding to the text by heat the value of heat will increase; heat value and preset attenuation value as the product dimension values of the parameters, and the parameters of the heat value of the dimension of the sum of the sum, and get the text content of the data according to the content of heat value; the heat value, and the ranking of text data, the text data sorted the text; the data sorted as display corresponding to the external application or send according to popular content retrieval keyword search out. The invention can reflect the degree of heat in the time period and the timeliness of the content heat value, and effectively improve the accuracy of obtaining the hot content information.
【技术实现步骤摘要】
热门内容搜索方法和系统
本专利技术涉及数据检索
,特别是涉及一种热门内容搜索方法和系统。
技术介绍
在数据检索服务中,首先采集内容信息,然后根据采集到的内容信息数据建立索引。外部应用在使用这些内容信息数据的时候,通过索引进行全文检索,默认根据信息的发布时间、评论数、点赞数等维度进行排序,得到关注度高的内容信息。在实现过程中,专利技术人发现传统技术中至少存在如下问题:采用传统内容检索方法,由于评论数、点赞数等会随着时间的增长而变大,得出的内容热度值会不断地增大;但内容热度值往往是有时效性的,会随着时间的变化产生波动,传统热门内容搜索方法不能体现这种时效性,无法得到准确的内容热度值,从而得到热门内容信息的准确率低。
技术实现思路
基于此,有必要针对传统热门内容搜索方法得到热门内容信息的准确率低的问题,提供一种热门内容搜索方法和系统。为了实现上述目的,一方面,本专利技术实施例提供了一种热门内容搜索方法,包括以下步骤:获取检索关键词;根据检索关键词,在预设索引库中进行检索,得到各文本数据;根据预设的时间波动热度算法,得到文本数据的各维度参数对应的热度增幅值;将热度增幅值和预设衰减值的乘积作为维度参数的热度值,并对各维度参数的热度值进行相加求和,得到文本数据的内容热度值;根据内容热度值,对各文本数据进行排序,得到排序后的各文本数据;将排序后的各文本数据作为根据检索关键词搜索出的热门内容进行显示或发送给相应的外部应用。另一方面,本专利技术实施例还提供了一种热门内容搜索系统,包括:全文检索单元,用于获取检索关键词,并根据检索关键词,在预设索引库中进行检索,得到各文本数 ...
【技术保护点】
一种热门内容搜索方法,其特征在于,包括以下步骤:获取检索关键词;根据所述检索关键词,在预设索引库中进行检索,得到各文本数据;根据预设的时间波动热度算法,得到所述文本数据的各维度参数对应的热度增幅值;将所述热度增幅值和预设衰减值的乘积作为所述维度参数的热度值,并对各所述维度参数的热度值进行相加求和,得到所述文本数据的内容热度值;根据所述内容热度值,对各所述文本数据进行排序,得到排序后的各文本数据;将所述排序后的各文本数据作为根据所述检索关键词搜索出的热门内容进行显示或发送给相应的外部应用。
【技术特征摘要】
1.一种热门内容搜索方法,其特征在于,包括以下步骤:获取检索关键词;根据所述检索关键词,在预设索引库中进行检索,得到各文本数据;根据预设的时间波动热度算法,得到所述文本数据的各维度参数对应的热度增幅值;将所述热度增幅值和预设衰减值的乘积作为所述维度参数的热度值,并对各所述维度参数的热度值进行相加求和,得到所述文本数据的内容热度值;根据所述内容热度值,对各所述文本数据进行排序,得到排序后的各文本数据;将所述排序后的各文本数据作为根据所述检索关键词搜索出的热门内容进行显示或发送给相应的外部应用。2.根据权利要求1所述的热门内容搜索方法,其特征在于,根据预设的时间波动热度算法,基于以下公式得到所述文本数据的各维度参数对应的热度增幅值:所述热度增幅值=所述维度参数当前时间的参数值-所述维度参数上一个时间段的参数值。3.根据权利要求1所述的热门内容搜索方法,其特征在于,所述维度参数包括点赞参数、评论参数和阅读参数;将各所述维度参数的热度值进行相加求和,得到所述文本数据的内容热度值的步骤包括:获取所述热度值与所述维度参数对应的热度权重的乘积,对各所述乘积进行相加求和,得到所述内容热度值。4.根据权利要求1至3任意一项所述的热门内容搜索方法,其特征在于,根据所述内容热度值,对各所述文本数据进行排序的步骤之前还包括:根据所述检索关键词与所述预设索引库中词句的匹配程度,得到各所述文本数据的匹配值;对各所述文本数据进行排序,得到排序后的各文本数据的步骤包括:对所述内容热度值和所述匹配值进行相加求和,得到最终分值;根据所述最终分值由大到小的顺序,对各所述文本数据进行排序,得到所述排序后的各文本数据。5.根据权利要求4所述的热门内容搜索方法,其特征在于,在获取检索关键词的步骤之前还包括步骤:根据预设的爬取规则,爬取网站的内容信息,获取所述内容信息的文本数据;对所述文本数据进行分词,得到分词后的词语和句子;根据所述分词后的词语和句子,建立倒排索引,并根据所述倒排索引,构建所述预设索引库。6.一种热门内容搜索系统,其特征...
【专利技术属性】
技术研发人员:覃文森,张伟力,陈鹏,
申请(专利权)人:广东万丈金数信息技术股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。