互联网大数据的信息推荐方法以及AI系统技术方案

技术编号:35352879 阅读:13 留言:0更新日期:2022-10-26 12:24
本发明专利技术提供一种互联网大数据的信息推荐方法,包括:当所述手机监听到的输入信息中包括预设内容时,所述手机将所述用户的内容信息获取请求发送至大数据服务器;所述大数据服务器根据所述预设内容并通过网络爬虫技术从互联网的第一信息渠道获取初始信息;若所述初始信息与预设内容的匹配度达到第一预设值,则所述大数据服务器从所述初始信息中筛选出与所述预设内容具有关联的筛选信息;所述大数据服务器根据所述初始信息以及所述筛选信息并通过网络爬虫技术从互联网的第二信息渠道获取大数据信息;所述大数据服务器对所述大数据信息进行预处理;所述大数据服务器将处理后的所述大数据信息发送至所述手机。本发明专利技术提高获取的大数据信息的准确性。的大数据信息的准确性。的大数据信息的准确性。

【技术实现步骤摘要】
互联网大数据的信息推荐方法以及AI系统


[0001]本专利技术涉及互联网大数据信息
,尤其涉及一种互联网大数据的信息推荐方法以及AI系统。

技术介绍

[0002]大数据(big data),指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。随着互联网的发展,网络信息爆炸式增长,这些网络信息具有一定的使用价值,为了充分利用这些网络信息,大数据技术运用而生。
[0003]大数据技术是以任何系统的全部数据资源为对象并从中发现数据之间表现的相关性关系的信息处理技术,目前已经广泛应用于互联网的流程优化、目标化消息及广告推送、用户个性化服务与改善等方面。目前,大数据信息是一次性地从互联网获取得到,这些数据信息针对性不强而且容易获得大量的垃圾信息。

技术实现思路

[0004]鉴于此,为了在一定程度上解决相关技术中的技术问题之一,有必要提供一种互联网大数据的信息推荐方法以及AI系统,提高获取的大数据信息的准确性。
[0005]本专利技术第一方面提供一种互联网大数据的信息推荐方法,所述方法包括:
[0006]手机持续监听手机用户的输入信息;
[0007]当所述手机监听到的输入信息中包括预设内容时,所述手机将所述用户的内容信息获取请求发送至大数据服务器,所述内容信息获取请求包括所述预设内容;
[0008]所述大数据服务器根据所述预设内容并通过网络爬虫技术从互联网的第一信息渠道获取初始信息;
>[0009]所述大数据服务器分析所述初始信息得到所述初始信息与所述预设内容的匹配度;
[0010]若所述初始信息与预设内容的匹配度达到第一预设值,则所述大数据服务器从所述初始信息中筛选出与所述预设内容具有关联的筛选信息;
[0011]所述大数据服务器根据所述初始信息以及所述筛选信息并通过网络爬虫技术从互联网的与所述第一信息渠道不同的第二信息渠道获取大数据信息;
[0012]所述大数据服务器对所述大数据信息进行预处理;
[0013]所述大数据服务器将处理后的所述大数据信息发送至所述手机以向所述用户呈现预处理后的所述大数据信息。
[0014]在一个优选的实施方式中,所述大数据服务器根据所述初始信息以及所述筛选信息并通过网络爬虫技术从互联网的与所述第一信息渠道不同的第二信息渠道获取大数据信息之后,所述方法还包括:
[0015]判断获取的所述大数据信息的条目数是否达到设定值;
[0016]若所述大数据信息的条目数未达到设定值,则获取其他用户曾经向所述大数据服务器发送信息获取请求后通过网络爬虫技术所获取的大数据信息;其中,其他用户的信息获取请求包括所述预设内容;
[0017]将基于其他用户的请求所获取的大数据信息并入到本次获取的大数据信息中以便于所述大数据服务器对合并后的大数据信息进行预处理。
[0018]在一个优选的实施方式中,所述方法还包括:
[0019]所述大数据服务器分析所述用户针对所述预设内容的偏好;
[0020]根据所述偏好将所述用户进行归类处理,相同偏好的用户归为同类;
[0021]所述获取其他用户曾经向所述大数据服务器发送信息获取请求后通过网络爬虫技术所获取的大数据信息,包括:
[0022]获取具有相同偏好的其他用户曾经向所述大数据服务器发送信息获取请求后通过网络爬虫技术所获取的大数据信息。
[0023]在一个优选的实施方式中,所述大数据服务器分析所述用户针对所述预设内容的偏好,根据所述偏好将所述用户进行归类处理,相同偏好的用户归为同类,包括:
[0024]根据所述输入信息识别出输入信息所包括的预设内容的结构句中所包括的肯定/否定词和句尾词;
[0025]根据所述肯定/否定词和所述句尾词识别所述输入信息中针对所述预设内容属于肯定还是属于否定;
[0026]将针对所述预设内容属于肯定的用户归为同类;
[0027]将针对所述预设内容属于否定的用户归为不同类。
[0028]在一个优选的实施方式中,所述大数据服务器分析所述用户针对所述预设内容的偏好,根据所述偏好将所述用户进行归类处理,相同偏好的用户归为同类,包括:
[0029]分析所述手机在过去第一预设时间段内监听到所述用户输入的所述预设内容的次数;
[0030]将过去第一预设时间段内监听到输入的所述预设内容的次数不小于第二预设值的用户归为同类;
[0031]将过去第一预设时间段内监听到输入的所述预设内容的次数小于第二预设值的用户归为不同类。
[0032]在一个优选的实施方式中,所述方法还包括:
[0033]所述手机收集所述用户在过去第二预设时间段内与所述其他用户的沟通内容,判断所述沟通内容与所述预设内容是否具有关联性;
[0034]若所述沟通内容与所述输入信息具有关联性,则将所述其他用户设定为关联用户,以便于当所述大数据信息的条目数未达到设定值时,获取所述其他用户曾经向所述大数据服务器发送信息获取请求后通过网络爬虫技术所获取的大数据信息。
[0035]在一个优选的实施方式中,所述大数据服务器对所述大数据信息中除所述预设内容外的其他字段进行统计分析,将带有相同字段的数据信息合并得到数据集合,每一个数据集合带有相应的字段标识;
[0036]所述若所述大数据信息的条目数未达到设定值,则获取其他用户曾经向所述大数据服务器发送信息获取请求后通过网络爬虫技术所获取的大数据信息,包括:
[0037]若所述大数据信息的条目数未达到设定值,则查询所述用户在过去第三预设时间段内与所述其他用户的沟通内容;
[0038]确定所述沟通内容中所包括除所述预设内容之外的字段;
[0039]获取其他用户曾经向所述大数据服务器发送信息获取请求后通过网络爬虫技术所获取的大数据信息的数据集合,所述数据集合为带有对应字段标识的集合。
[0040]本专利技术第二方面提供一种互联网大数据的信息推荐AI系统,所述系统包括手机以及大数据服务器,所述系统能够实现所述的互联网大数据的信息推荐方法。
[0041]通过以上方案可知,本专利技术通过持续监听用户的输入信息,并且当输入信息包括预设内容时,通过大数据服务器获取相关的大数据信息,所述大数据服务器根据所述预设内容并通过网络爬虫技术从互联网的第一信息渠道获取初始信息,若所述初始信息与预设内容的匹配度达到第一预设值,则所述大数据服务器从所述初始信息中筛选出与所述预设内容具有关联的筛选信息,然后所述大数据服务器根据所述初始信息以及所述筛选信息并通过网络爬虫技术从互联网的与所述第一信息渠道不同的第二信息渠道获取大数据信息,最终所述大数据服务器将处理后的所述大数据信息发送至所述手机以向所述用户呈现预处理后的所述大数据信息。本专利技术优选依据所述预设内容从第一信息渠道获取初始信息,所述大数据服务器对初始信息进行筛选,筛选出具有关联的筛选信息,从而从第一信息渠道得到本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种互联网大数据的信息推荐方法,其特征在于,所述方法包括:手机持续监听手机用户的输入信息;当所述手机监听到的输入信息中包括预设内容时,所述手机将所述用户的内容信息获取请求发送至大数据服务器,所述内容信息获取请求包括所述预设内容;所述大数据服务器根据所述预设内容并通过网络爬虫技术从互联网的第一信息渠道获取初始信息;所述大数据服务器分析所述初始信息得到所述初始信息与所述预设内容的匹配度;若所述初始信息与预设内容的匹配度达到第一预设值,则所述大数据服务器从所述初始信息中筛选出与所述预设内容具有关联的筛选信息;所述大数据服务器根据所述初始信息以及所述筛选信息并通过网络爬虫技术从互联网的与所述第一信息渠道不同的第二信息渠道获取大数据信息;所述大数据服务器对所述大数据信息进行预处理;所述大数据服务器将处理后的所述大数据信息发送至所述手机以向所述用户呈现预处理后的所述大数据信息。2.根据权利要求1所述的互联网大数据的信息推荐方法,其特征在于,所述大数据服务器根据所述初始信息以及所述筛选信息并通过网络爬虫技术从互联网的与所述第一信息渠道不同的第二信息渠道获取大数据信息之后,所述方法还包括:判断获取的所述大数据信息的条目数是否达到设定值;若所述大数据信息的条目数未达到设定值,则获取其他用户曾经向所述大数据服务器发送信息获取请求后通过网络爬虫技术所获取的大数据信息;其中,其他用户的信息获取请求包括所述预设内容;将基于其他用户的请求所获取的大数据信息并入到本次获取的大数据信息中以便于所述大数据服务器对合并后的大数据信息进行预处理。3.根据权利要求2所述的互联网大数据的信息推荐方法,其特征在于,所述方法还包括:所述大数据服务器分析所述用户针对所述预设内容的偏好;根据所述偏好将所述用户进行归类处理,相同偏好的用户归为同类;所述获取其他用户曾经向所述大数据服务器发送信息获取请求后通过网络爬虫技术所获取的大数据信息,包括:获取具有相同偏好的其他用户曾经向所述大数据服务器发送信息获取请求后通过网络爬虫技术所获取的大数据信息。4.根据权利要求3所述的互联网大数据的信息推荐方法,其特征在于,所述大数据服务器分析所述用户针对所述预设内容的偏好,根据所述偏好将所述用户进行归类处理,相同偏好的用户归为同类,包括:根据所述输入信息...

【专利技术属性】
技术研发人员:张亚军
申请(专利权)人:深圳市天龙世纪科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1