一种数据采集装置及方法制造方法及图纸

技术编号:35656175 阅读:13 留言:0更新日期:2022-11-19 16:52
本发明专利技术公开了一种数据采集装置及方法,通过智能终端采集用户所访问的网页,并记录该网页对应的第一时间,所述第一时间为用户打开该网页至用户关闭该网页之间的时间间隔;当所述第一时间达到设定第一数值的时候,监听用户所浏览的浏览内容;将用户的所述浏览内容进行文字处理,并提取文字处理后的关键词;根据所述关键词的含义获取对应的标签,并将所述标签作为用户的标签打包发送到服务器;服务器根据用户对应的标签选取对应的推荐内容,并将所述推荐内容发送到智能终端;智能终端将接收到的所述推荐内容进行显示。本发明专利技术根据明确的用户喜好对用户进行合适内容的推荐,使得推广的效果具有明显的提升。具有明显的提升。具有明显的提升。

【技术实现步骤摘要】
一种数据采集装置及方法


[0001]本专利技术涉及计算机网络领域,特别涉及一种数据采集装置及方法。

技术介绍

[0002]目前,随着用户对于互联网的需求不断提高,各个应用软件也会根据用户需求,对服务器的处理程序进行逐步的优化。目前,通过大部分的软件会根据用户的实际情况,推荐用户可能感兴趣的内容,但是这样的方式需要从用户的智能终端中获取用户对于其他软件的使用情况,会涉及到用户的隐私,引起用户的不满。
[0003]对于上述的情况,大多数的软件会在用户的授权内对用户的信息进行采集,并进行深入的分析得到用户的所感兴趣的内容,再据此对用户进行合理的推送。或者软件会根据用户所访问的自身内容分析得到用户的所感兴趣的内容,并对用户进行合理的推荐。
[0004]对于一些提供网页服务的服务器,就只能通过记录用户所访问的网页来对用户进行分析。目前的情况是,记录用户所访问的网页,并结合用户所浏览该网页的时间,根据该网页的浏览时间和网页类型对用户进行分析得到用户喜好,最后根据用户喜好推荐对应的内容。由此可见,这样的方式仅仅是将用户的喜好精准到了网页,而对于一个网页中,就有多种多样的信息,这样所造成的结果必然导致对于用户喜好的分析不准确,进而所推荐的内容,也不是精准的投其所好,不能有效的戳中用户的痛点,使得内容推广的效果不佳。

技术实现思路

[0005]本专利技术的目的是克服上述现有技术中存在的问题,提供一种数据采集装置,根据明确的用户喜好对用户进行合适内容的推荐,使得推广的效果具有明显的提升。
[0006]为此,本专利技术提供一种数据采集方法,包括如下步骤:
[0007]智能终端采集用户所访问的网页,并记录该网页对应的第一时间,所述第一时间为用户打开该网页至用户关闭该网页之间的时间间隔;
[0008]当所述第一时间达到设定第一数值的时候,监听用户所浏览的浏览内容;
[0009]将用户的所述浏览内容进行文字处理,并提取文字处理后的关键词;
[0010]根据所述关键词的含义获取对应的标签,并将所述标签作为用户的标签打包发送到服务器;
[0011]服务器根据用户对应的标签选取对应的推荐内容,并将所述推荐内容发送到智能终端;
[0012]智能终端将接收到的所述推荐内容进行显示。
[0013]进一步,所述浏览内容为以下三种情况的其中一种:
[0014]情况一:浏览内容是位于所述智能终端屏幕中,且在任一位置停留显示的时长超过第二时间的内容;
[0015]情况二:浏览内容是鼠标选定的内容;
[0016]情况三:浏览内容是鼠标长时间停留的位置且该位置具有文字内容的内容。
[0017]更进一步,在提取文字处理后的关键词的时候,包括如下步骤:
[0018]智能终端根据用户的浏览情况确定所述浏览内容的情况;
[0019]将确定的情况的浏览内容转化文字,并得到文字的存储空间大小;
[0020]根据所述文字的存储空间大小得到对应的关键词个数;
[0021]根据所述关键词个数在所述文字中提取关键词;
[0022]将提取后的关键词依次排列并输出。
[0023]更进一步,所述关键词在排列的时候,根据其出现的频率由高到低依次排列。
[0024]进一步,根据所述关键词的含义获取对应的标签的时候,包括如下步骤:
[0025]将所述关键词通过词语查询技术得到对应的词意;
[0026]通过关键字提取技术提取所述词意中的关键字;
[0027]将提取出的关键字依次排列;
[0028]查找依次排列的关键字对应的标签,并输出。
[0029]更进一步,所述关键字在排列的时候,根据其出现的频率由高到低依次排列。
[0030]进一步,服务器根据用户对应的标签选取对应的推荐内容的时候,包括如下步骤:
[0031]根据所述标签得到对应的相近标签;
[0032]查找对应的相近标签所对应的推荐内容;
[0033]根据相近标签与所述标签的关联程度由大到小将对应的所述推荐内容依次排列;
[0034]对依次排列的所述推荐内容设置对应的停留时间;
[0035]将排序并设置到停留时间的所述推荐内容输出。
[0036]相对应与上述的一种数据采集方法,本专利技术还提供了一种数据采集装置,包括安装在智能终端上的第一处理单元和安装在服务器上的第二处理单元,所述第一处理单元和所述第二处理单元信号连接,用于实现上述一种数据采集方法。
[0037]本专利技术提供的一种数据采集装置,具有如下有益效果:
[0038]本专利技术根据用户在网页中所浏览的重点内容,并根据这些重点内容和浏览时间综合评价用户喜好,在进行内容的推荐,进而使得根据明确的用户喜好对用户进行合适内容的推荐,使得推广的效果具有明显的提升;
[0039]本专利技术在对用户所浏览的网页的内容进行监控的时候,通过监控用户对于所浏览内容的选定以及浏览时间,并根据所浏览内容的细节得到用户喜好,这样可以使得在得到的用户喜好相对于现有的方式更加的清楚明确;
[0040]本专利技术在对浏览的内容进行获取的时候,将用户的智能终端的在打开网页之后屏幕所呈现的内容,鼠标选定的内容,以及鼠标位于有实质性内容处的内容,分别进行等级的确定,并且根据等级得到各个内容的重要程度,并由此得到浏览内容的标签,进而使得后续对于用户喜好评估的更加准确。
附图说明
[0041]图1为本专利技术提供的方法的整体流程示意框图;
[0042]图2为本专利技术的方法在提取文字处理后的关键词的流程示意框图;
[0043]图3为本专利技术的方法在根据关键词的含义获取对应的标签的流程示意框图;
[0044]图4为本专利技术的方法在服务器根据用户对应的标签选取对应的推荐内容的流程示
意框图。
具体实施方式
[0045]下面结合附图,对本专利技术的一个具体实施方式进行详细描述,但应当理解本专利技术的保护范围并不受具体实施方式的限制。
[0046]在本申请文件中,未经明确的部件型号以及结构,均为本领域技术人员所公知的现有技术,本领域技术人员均可根据实际情况的需要进行设定,在本申请文件的实施例中不做具体的限定。
[0047]具体的,如图1

4所示,本专利技术实施例提供了一种数据采集方法,包括如下步骤:
[0048](一)智能终端采集用户所访问的网页,并记录该网页对应的第一时间,所述第一时间为用户打开该网页至用户关闭该网页之间的时间间隔;
[0049](二)当所述第一时间达到设定第一数值的时候,监听用户所浏览的浏览内容;
[0050](三)将用户的所述浏览内容进行文字处理,并提取文字处理后的关键词;
[0051](四)根据所述关键词的含义获取对应的标签,并将所述标签作为用户的标签打包发送到服务器;
[0052](五)服务器根据用户对应的标签选取对应的推荐内容,并将所述推荐内容发送本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据采集方法,其特征在于,包括如下步骤:智能终端采集用户所访问的网页,并记录该网页对应的第一时间,所述第一时间为用户打开该网页至用户关闭该网页之间的时间间隔;当所述第一时间达到设定第一数值的时候,监听用户所浏览的浏览内容;将用户的所述浏览内容进行文字处理,并提取文字处理后的关键词;根据所述关键词的含义获取对应的标签,并将所述标签作为用户的标签打包发送到服务器;服务器根据用户对应的标签选取对应的推荐内容,并将所述推荐内容发送到智能终端;智能终端将接收到的所述推荐内容进行显示。2.如权利要求1所述的一种数据采集方法,其特征在于,所述浏览内容为以下三种情况的其中一种:情况一:浏览内容是位于所述智能终端屏幕中,且在任一位置停留显示的时长超过第二时间的内容;情况二:浏览内容是鼠标选定的内容;情况三:浏览内容是鼠标长时间停留的位置且该位置具有文字内容的内容。3.如权利要求2所述的一种数据采集方法,其特征在于,在提取文字处理后的关键词的时候,包括如下步骤:智能终端根据用户的浏览情况确定所述浏览内容的情况;将确定的情况的浏览内容转化文字,并得到文字的存储空间大小;根据所述文字的存储空间大小得到对应的关键词个数;根据所述关键词个数在所述文字中提取关键词;将提取后的关键词依次排...

【专利技术属性】
技术研发人员:郭璇张杨王碧琳王静孙星杨硕李鹏博吴涛范冰洁齐壮
申请(专利权)人:河南应用技术职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1