基于人工智能模型的数据挖掘方法及系统技术方案

技术编号:34543134 阅读:14 留言:0更新日期:2022-08-13 21:40
本发明专利技术是关于基于人工智能模型的数据挖掘方法及系统,通过待定用户兴趣短语的特征价值评分来确定待进行挖掘的用户行为数据的最终用户兴趣知识向量的思路,不仅能够提高用户兴趣挖掘的效率,还可以保障用户兴趣挖掘的准确性,从而得到准确可靠的最终用户兴趣知识向量,以便利用最终用户兴趣知识向量准确定位用户需求,进而基于用户需求进行针对性的大数据推送处理,实现兴趣挖掘、需求分析、大数据推送的全链条数据处理。的全链条数据处理。的全链条数据处理。

【技术实现步骤摘要】
基于人工智能模型的数据挖掘方法及系统


[0001]本专利技术涉及数据挖掘
,具体而言,涉及一种基于人工智能模型的数据挖掘方法及系统。

技术介绍

[0002]数据挖掘(Data mining)是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法来实现上述目标。当下,数据挖掘在用户兴趣分析中应用较为广泛,但是大部分数据挖掘技术在兴趣挖掘的效率和精度方面还需进行改进。

技术实现思路

[0003]第一方面,本专利技术实施例提供了一种基于人工智能模型的数据挖掘方法,应用于数据挖掘系统,所述方法包括:调取待进行挖掘的用户行为数据,然后确定出对所述待进行挖掘的用户行为数据和所述待进行挖掘的用户行为数据的前一组用户行为数据进行兴趣知识捕捉过程中挖掘到的目标兴趣挖掘参考向量,其中,所述目标兴趣挖掘参考向量用于反映前一组用户行为数据的用户兴趣知识向量中包含在所述待进行挖掘的用户行为数据中的用户兴趣知识向量;结合所述目标兴趣挖掘参考向量在所述待进行挖掘的用户行为数据中确定用户兴趣挖掘窗口;在所述用户兴趣挖掘窗口中确定待定用户兴趣短语和待定用户兴趣短语的特征价值评分;并基于所述待定用户兴趣短语的特征价值评分和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量。
[0004]如此设计,通过待定用户兴趣短语的特征价值评分来确定待进行挖掘的用户行为数据的最终用户兴趣知识向量的思路,不仅能够提高用户兴趣挖掘的效率,还可以保障用户兴趣挖掘的准确性,从而得到准确可靠的最终用户兴趣知识向量,以便利用最终用户兴趣知识向量准确定位用户需求,进而基于用户需求进行针对性的大数据推送处理,实现兴趣挖掘、需求分析、大数据推送的全链条数据处理。
[0005]在一些可能的实施例下,所述结合所述目标兴趣挖掘参考向量在所述待进行挖掘的用户行为数据中确定用户兴趣挖掘窗口,包括:结合所述目标兴趣挖掘参考向量对所述待进行挖掘的用户行为数据进行待挖掘数据集的筛选处理,得到所述待进行挖掘的用户行为数据中的用户兴趣挖掘窗口。
[0006]如此设计,在对待进行挖掘的用户行为数据进行用户兴趣挖掘之前,通过目标兴趣挖掘参考向量在待进行挖掘的用户行为数据中筛选出用户兴趣挖掘窗口的思路,无需对待进行挖掘的用户行为数据的所有用户行为数据块进行用户兴趣挖掘,这样能够减少特征运算的复杂度,并节约不必要的资源开销。
[0007]在一些可能的实施例下,所述结合所述目标兴趣挖掘参考向量对所述待进行挖掘的用户行为数据进行待挖掘数据集的筛选处理,得到所述待进行挖掘的用户行为数据中的用户兴趣挖掘窗口,包括:确定所述目标兴趣挖掘参考向量中历史兴趣挖掘参考向量在所
述待进行挖掘的用户行为数据中的分布标签,得到目标分布标签;基于所述目标分布标签在所述待进行挖掘的用户行为数据中确定第一用户行为数据块;将所述待进行挖掘的用户行为数据中除所述第一用户行为数据块以外的剩余用户行为数据块确定为所述用户兴趣挖掘窗口。
[0008]如此设计,通过对待进行挖掘的用户行为数据进行待挖掘数据集的筛选处理的思路,可以进一步减少数据挖掘系统的系统开销,这样能够提高数据挖掘系统的数据处理效率,侧面提高兴趣挖掘的时效性。
[0009]在一些可能的实施例下,所述基于所述待定用户兴趣短语的特征价值评分和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量,包括:在所述待定用户兴趣短语中挑选不少于一个特征价值评分最高的待定用户兴趣短语作为目标待定用户兴趣短语;基于所述目标待定用户兴趣短语和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量。
[0010]在一些可能的实施例下,所述在所述待定用户兴趣短语中挑选不少于一个特征价值评分最高的待定用户兴趣短语作为所述目标待定用户兴趣短语,包括:在所述待定用户兴趣短语所处的用户兴趣短语序列中挑选特征价值评分最高的待定用户兴趣短语作为目标待定用户兴趣短语,其中,所述用户兴趣短语序列中包含每个待定用户兴趣短语的特征价值评分;基于所述目标待定用户兴趣短语在所述待进行挖掘的用户行为数据中的分布标签,在所述用户兴趣挖掘窗口中确定待处理的数据清洗窗口;在所述用户兴趣短语序列中过滤掉处于所述待处理的数据清洗窗口内的待定用户兴趣短语的内容,得到完成调整的用户兴趣短语序列;在完成调整的用户兴趣短语序列中挑选特征价值评分最高的用户兴趣短语作为目标待定用户兴趣短语,直到挑选出的目标待定用户兴趣短语的数目达到设定数目。
[0011]如此设计,采用在用户兴趣挖掘窗口确定待定用户兴趣短语,并确定待定用户兴趣短语的特征价值评分,以根据特征价值评分确定目标待定用户兴趣短语的思路,能够得到精度更佳,抗干扰性更高的待定用户兴趣短语,从而得到更准确和更可信的最终用户兴趣知识向量。此外,能够将高精度的用户兴趣短语加入到数据挖掘系统中,这使得用户兴趣知识向量的完整性和多样性受到保障,从而提高生成的兴趣知识库的准确性。
[0012]在一些可能的实施例下,所述在所述用户兴趣挖掘窗口中确定待定用户兴趣短语,包括:对于所述用户兴趣挖掘窗口中的每个行为数据单元,根据每个行为数据单元的分布标签信息在所述用户兴趣挖掘窗口中确定第二用户行为数据块;如果确定出第二用户行为数据块内目标行为数据单元的数目大于设定数目,则确定该行为数据单元为所述待定用户兴趣短语;其中,所述目标行为数据单元与该行为数据单元之间的行为热力值之差大于设定行为热力值。
[0013]在一些可能的实施例下,所述待定用户兴趣短语的数目为多个;所述方法还包括:在所述用户兴趣挖掘窗口中确定待定用户兴趣短语和待定用户兴趣短语的特征价值评分之后,通过预设专家系统模型对多个所述待定用户兴趣短语进行优化,得到完成优化的待定用户兴趣短语;所述基于所述待定用户兴趣短语的特征价值评分和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量,包括:基于所述完成优化的待定用户兴趣短语的特征价值评分和所述目标兴趣挖掘参考向量确定所述待进
行挖掘的用户行为数据的最终用户兴趣知识向量。
[0014]在一些可能的实施例下,所述在所述用户兴趣挖掘窗口中确定所述待定用户兴趣短语的特征价值评分,包括:在所述待进行挖掘的用户行为数据中确定每个待定用户兴趣短语所对应的用户行为数据块的文本描述内容,并确定所述文本描述内容的量化描述值,得到多个量化描述值;在所述多个量化描述值中挑选最小量化描述值作为每个待定用户兴趣短语的特征价值评分。
[0015]如此设计,采用特征价值评分来确定待进行挖掘的用户行为数据的最终用户兴趣知识向量的思路,可以改善相关技术挖掘出的用户兴趣短语价值度低下,全面性较差导致的数据挖掘系统挖掘精度低下的缺陷。此外,采用预设专家系统模型对待定用户兴趣短语进行优化的思路,能够尽可能确定出抗干扰性高的待定用户兴趣短语,从而侧面保障了最终用户本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能模型的数据挖掘方法,其特征在于,应用于数据挖掘系统,所述方法包括:调取待进行挖掘的用户行为数据,然后确定出对所述待进行挖掘的用户行为数据和所述待进行挖掘的用户行为数据的前一组用户行为数据进行兴趣知识捕捉过程中挖掘到的目标兴趣挖掘参考向量;其中,所述目标兴趣挖掘参考向量用于反映所述前一组用户行为数据的用户兴趣知识向量中包含在所述待进行挖掘的用户行为数据中的用户兴趣知识向量;结合所述目标兴趣挖掘参考向量在所述待进行挖掘的用户行为数据中确定用户兴趣挖掘窗口;在所述用户兴趣挖掘窗口中确定待定用户兴趣短语和待定用户兴趣短语的特征价值评分;以及,基于所述待定用户兴趣短语的特征价值评分和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量。2.根据权利要求1所述的方法,其特征在于,所述结合所述目标兴趣挖掘参考向量在所述待进行挖掘的用户行为数据中确定用户兴趣挖掘窗口,包括:结合所述目标兴趣挖掘参考向量对所述待进行挖掘的用户行为数据进行待挖掘数据集的筛选处理,得到所述待进行挖掘的用户行为数据中的用户兴趣挖掘窗口。3.根据权利要求2所述的方法,其特征在于,所述结合所述目标兴趣挖掘参考向量对所述待进行挖掘的用户行为数据进行待挖掘数据集的筛选处理,得到所述待进行挖掘的用户行为数据中的用户兴趣挖掘窗口,包括:确定所述目标兴趣挖掘参考向量中历史兴趣挖掘参考向量在所述待进行挖掘的用户行为数据中的分布标签,得到目标分布标签;基于所述目标分布标签在所述待进行挖掘的用户行为数据中确定第一用户行为数据块;将所述待进行挖掘的用户行为数据中除所述第一用户行为数据块以外的剩余用户行为数据块确定为所述用户兴趣挖掘窗口。4.根据权利要求1所述的方法,其特征在于,所述基于所述待定用户兴趣短语的特征价值评分和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量,包括:在所述待定用户兴趣短语中挑选不少于一个特征价值评分最高的待定用户兴趣短语作为目标待定用户兴趣短语;基于所述目标待定用户兴趣短语和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量;其中,所述在所述待定用户兴趣短语中挑选不少于一个特征价值评分最高的待定用户兴趣短语作为目标待定用户兴趣短语,包括:在所述待定用户兴趣短语所处的用户兴趣短语序列中挑选特征价值评分最高的待定用户兴趣短语作为目标待定用户兴趣短语;其中,所述用户兴趣短语序列中包含每个待定用户兴趣短语的特征价值评分;基于所述目标待定用户兴趣短语在所述待进行挖掘的用户行为数据中的分布标签,在所述用户兴趣挖掘窗口中确定待处理的数据清洗窗口;在所述用户兴趣短语序列中过滤掉处于所述待处理的数据清洗窗口内的待定用户兴趣短语的内容,得到完成调整的用户兴趣短语序列;在完成调整的用户兴趣短语序列中挑选特征价值评分最高的用户兴趣短语作为目标待定用户兴趣短
语,直到挑选出的目标待定用户兴趣短语的数目达到设定数目。5.根据权利要求1所述的方法,其特征在于,所述在所述用户兴趣挖掘窗口中确定待定用户兴趣短语,包括:对于所述用户兴趣挖掘窗口中的每个行为数据单元,根据每个行为数据单元的分布标签信息在所述用户兴趣挖掘窗口中确定第...

【专利技术属性】
技术研发人员:胡志强国忠金张睿李小倩刘心语张甲兵
申请(专利权)人:山东云聚科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1