The invention discloses a natural language analysis technology based on information push system, includes the following modules: data integration module for 24 hours to collect the whole network information; data storage module for information storage, the data acquisition module integrated into the database; data processing module for collection the storage of data clustering, text extraction, impurity, layout optimization, and analysis the composition of special heat; the user portrait model, through the user behavior and operation of the client, and establish user discrimination model, learning to understand the reading interest of user information, and reading of the user's preference prediction; information push module for, according to the user's reading preferences, intelligent matching and information content in the database, and the matching of information push For users. The present invention has low pushing operation cost and high recommendation accuracy of the information push system based on natural language analysis technology.
【技术实现步骤摘要】
一种基于自然语言分析技术的信息推送系统
本专利技术涉及推荐引擎领域,尤其涉及一种基于自然语言分析技术的信息推送系统。
技术介绍
当今社会,每天生产大量的新闻资讯内容,并设置相对独特的原创图文、视频栏目,新闻编辑团队从中筛选出相对优质、热门的资讯内容推送给用户,或者,聚合第三方新闻平台的资源,根据用户的阅读行为记录来推送给用户个性化资讯内容,前者的推送方式缺点在于,推送规则单一,将优质、热门的资讯内容推送给每一个人必然是不能贴合用户需求的;后者的推送方式缺点在于,聚合第三方新闻平台的资源,聚合成本较高,且用户的阅读习惯受到该第三方新闻平台的限制,无法深入挖掘用户潜在兴趣。互联网上各种信息掺杂,且更新速度非常快,需要投入大量的人力来进行编辑和筛选工作,运营成本非常高;对用户的阅读兴趣分析不够精准,推送给用户的资讯内容没有和用户需求相贴合,长此以往会导致用户阅读兴趣下降,用户量减少。
技术实现思路
为克服现有技术的不足,本专利技术的目的是:提供一种基于自然语言分析技术的信息推送系统,通过算法对文章进行热度分析,在内容编选方面减少人工干预,对个性化推荐效果进行自我修正,提高推荐结果的准确度。为了解决
技术介绍
中的技术问题,本专利技术提供了一种基于自然语言分析技术的信息推送系统,包括以下模块:数据整合模块,用于对全网资讯信息进行24小时不间断采集;数据存储模块,用于将所述数据整合模块采集的资讯信息存储到数据库;数据处理模块,用于对采集入库的数据进行正文抽取、聚类、去杂质、排版优化,并进行热度分析,组成专题;用户画像模型,通过用户在客户端的行为和操作,建立起用户区分度模型, ...
【技术保护点】
一种基于自然语言分析技术的信息推送系统,其特征在于,包括以下模块:数据整合模块,用于对全网资讯信息进行24小时不间断采集;数据存储模块,用于将所述数据整合模块采集的资讯信息存储到数据库;数据处理模块,用于对采集入库的数据进行正文抽取、聚类、去杂质、排版优化,并进行热度分析,组成专题;用户画像模型,通过用户在客户端的行为和操作,建立起用户区分度模型,学习了解用户的阅读兴趣信息,进而对用户的阅读偏好进行预测;信息推送模块,用于根据用户的阅读偏好,与数据库中的资讯内容进行智能化匹配,并将匹配中的信息推送给用户。
【技术特征摘要】
1.一种基于自然语言分析技术的信息推送系统,其特征在于,包括以下模块:数据整合模块,用于对全网资讯信息进行24小时不间断采集;数据存储模块,用于将所述数据整合模块采集的资讯信息存储到数据库;数据处理模块,用于对采集入库的数据进行正文抽取、聚类、去杂质、排版优化,并进行热度分析,组成专题;用户画像模型,通过用户在客户端的行为和操作,建立起用户区分度模型,学习了解用户的阅读兴趣信息,进而对用户的阅读偏好进行预测;信息推送模块,用于根据用户的阅读偏好,与数据库中的资讯内容进行智能化匹配,并将匹配中的信息...
【专利技术属性】
技术研发人员:晋彤,李永康,
申请(专利权)人:广州特道信息科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。