【技术实现步骤摘要】
多维度高度可定制的新闻聚合方法
本专利技术涉及一种多维度高度可定制的新闻聚合方法。
技术介绍
新闻聚合是指收集互联网各类媒体、网站(如今日头条、人民网、新华网等)的新闻和消息,然后以某种方式过滤筛选后呈现终端用户。现有的新闻聚合的例子如各大资讯类app:今日头条、一点资讯、腾讯新闻和网易新闻等,主要提供了频道或者栏目订阅的功能,用户订阅后,可以进到相应栏目中查看相关的新闻。但只能查看订阅的该app下的文章,因此,数据来源不够丰富,预定的频道或者栏目粒度较粗,且不能自定义。
技术实现思路
为解决现有技术的不足,本专利技术提供了一种可以解决上述问题的多维度高度可定制的新闻聚合方法。为了实现上述目标,本专利技术采用如下的技术方案:一种多维度高度可定制的新闻聚合方法,包含以下步骤:获取若干网络媒体的新闻文献;对每一份新闻文献进行预处理;对每一份新闻文献进行结构化处理以定义新闻文献的多个检索字段;将结构化处理后的新闻文献存入数据库并构建索引;接收用户的 ...
【技术保护点】
1.一种多维度高度可定制的新闻聚合方法,其特征在于,包含以下步骤:/n获取若干网络媒体的新闻文献;/n对每一份所述新闻文献进行预处理;/n对每一份所述新闻文献进行结构化处理以定义所述新闻文献的多个检索字段;/n将结构化处理后的所述新闻文献存入数据库并构建索引;/n接收用户的配置信息,所述配置信息包含至少一个检索字段限定;/n根据用户设定的所述配置信息从所述数据库中检索符合条件的所述新闻文献;/n将匹配到的所述新闻文献发送至用户。/n
【技术特征摘要】
1.一种多维度高度可定制的新闻聚合方法,其特征在于,包含以下步骤:
获取若干网络媒体的新闻文献;
对每一份所述新闻文献进行预处理;
对每一份所述新闻文献进行结构化处理以定义所述新闻文献的多个检索字段;
将结构化处理后的所述新闻文献存入数据库并构建索引;
接收用户的配置信息,所述配置信息包含至少一个检索字段限定;
根据用户设定的所述配置信息从所述数据库中检索符合条件的所述新闻文献;
将匹配到的所述新闻文献发送至用户。
2.根据权利要求1所述的多维度高度可定制的新闻聚合方法,其特征在于,
所述对每一份所述新闻文献进行结构化处理以定义所述新闻文献的多个检索字段的具体方法为:
提取所述新闻文献的文献来源、关键词和实体信息;
分析所述新闻文献得到所述新闻文献的情感指数和业务领域标签;
将所述文献来源、所述关键词、所述实体信息、所述情感指数和所述业务领域标签关联至对应的所述新闻文献将其作为所述新闻文献的检索字段。
3.根据权利要求2所述的多维度高度可定制的新闻聚合方法,其特征在于,
当所述网络媒体是社交媒体时,提取出的所述文献来源还包含发布账号;
用户在配置文献来源字段时,可以针对社交媒体设定若干具体的发布账号。
4.根据权利要求2所述的多维度高度可定制的新闻聚合方法,其特征在于,
所述关键词包含标题关键词和正文关键词;
用户在配置关键词字段时可以分别设定标题关键词字段和正文关键词字段。
5.根据权利要求4所述的多维度高度可定制的新闻聚合方法,其特征在于,
所述对每一份所述新闻文献进行结构化处理以定义所述新闻文献的多个检索字...
【专利技术属性】
技术研发人员:张国卫,李学江,郑有为,
申请(专利权)人:新华智云科技有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。