【技术实现步骤摘要】
基于人工智能模型的数据挖掘方法及系统
[0001]本专利技术涉及数据挖掘
,具体而言,涉及一种基于人工智能模型的数据挖掘方法及系统。
技术介绍
[0002]数据挖掘(Data mining)是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统和模式识别等诸多方法来实现上述目标。当下,数据挖掘在用户兴趣分析中应用较为广泛,但是大部分数据挖掘技术在兴趣挖掘的效率和精度方面还需进行改进。
技术实现思路
[0003]第一方面,本专利技术实施例提供了一种基于人工智能模型的数据挖掘方法,应用于数据挖掘系统,所述方法包括:调取待进行挖掘的用户行为数据,然后确定出对所述待进行挖掘的用户行为数据和所述待进行挖掘的用户行为数据的前一组用户行为数据进行兴趣知识捕捉过程中挖掘到的目标兴趣挖掘参考向量,其中,所述目标兴趣挖掘参考向量用于反映前一组用户行为数据的用户兴趣知识向量中包含在所述待进行挖掘的用户行为数据中的用户兴趣知识向量;结合所述目标兴趣挖掘参考向量在所述待进行挖掘的用户行为数据中确定用户兴趣挖掘窗口;在所述用户兴趣挖掘窗口中确定待定用户兴趣短语和待定用户兴趣短语的特征价值评分;并基于所述待定用户兴趣短语的特征价值评分和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量。
[0004]如此设计,通过待定用户兴趣短语的特征价值评分来确定待进行挖掘的用户行为数据的最终用户兴趣知识向量的思路,不仅能 ...
【技术保护点】
【技术特征摘要】
1.一种基于人工智能模型的数据挖掘方法,其特征在于,应用于数据挖掘系统,所述方法包括:调取待进行挖掘的用户行为数据,然后确定出对所述待进行挖掘的用户行为数据和所述待进行挖掘的用户行为数据的前一组用户行为数据进行兴趣知识捕捉过程中挖掘到的目标兴趣挖掘参考向量;其中,所述目标兴趣挖掘参考向量用于反映所述前一组用户行为数据的用户兴趣知识向量中包含在所述待进行挖掘的用户行为数据中的用户兴趣知识向量;结合所述目标兴趣挖掘参考向量在所述待进行挖掘的用户行为数据中确定用户兴趣挖掘窗口;在所述用户兴趣挖掘窗口中确定待定用户兴趣短语和待定用户兴趣短语的特征价值评分;以及,基于所述待定用户兴趣短语的特征价值评分和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量。2.根据权利要求1所述的方法,其特征在于,所述结合所述目标兴趣挖掘参考向量在所述待进行挖掘的用户行为数据中确定用户兴趣挖掘窗口,包括:结合所述目标兴趣挖掘参考向量对所述待进行挖掘的用户行为数据进行待挖掘数据集的筛选处理,得到所述待进行挖掘的用户行为数据中的用户兴趣挖掘窗口。3.根据权利要求2所述的方法,其特征在于,所述结合所述目标兴趣挖掘参考向量对所述待进行挖掘的用户行为数据进行待挖掘数据集的筛选处理,得到所述待进行挖掘的用户行为数据中的用户兴趣挖掘窗口,包括:确定所述目标兴趣挖掘参考向量中历史兴趣挖掘参考向量在所述待进行挖掘的用户行为数据中的分布标签,得到目标分布标签;基于所述目标分布标签在所述待进行挖掘的用户行为数据中确定第一用户行为数据块;将所述待进行挖掘的用户行为数据中除所述第一用户行为数据块以外的剩余用户行为数据块确定为所述用户兴趣挖掘窗口。4.根据权利要求1所述的方法,其特征在于,所述基于所述待定用户兴趣短语的特征价值评分和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量,包括:在所述待定用户兴趣短语中挑选不少于一个特征价值评分最高的待定用户兴趣短语作为目标待定用户兴趣短语;基于所述目标待定用户兴趣短语和所述目标兴趣挖掘参考向量确定所述待进行挖掘的用户行为数据的最终用户兴趣知识向量;其中,所述在所述待定用户兴趣短语中挑选不少于一个特征价值评分最高的待定用户兴趣短语作为目标待定用户兴趣短语,包括:在所述待定用户兴趣短语所处的用户兴趣短语序列中挑选特征价值评分最高的待定用户兴趣短语作为目标待定用户兴趣短语;其中,所述用户兴趣短语序列中包含每个待定用户兴趣短语的特征价值评分;基于所述目标待定用户兴趣短语在所述待进行挖掘的用户行为数据中的分布标签,在所述用户兴趣挖掘窗口中确定待处理的数据清洗窗口;在所述用户兴趣短语序列中过滤掉处于所述待处理的数据清洗窗口内的待定用户兴趣短语的内容,得到完成调整的用户兴趣短语序列;在完成调整的用户兴趣短语序列中挑选特征价值评分最高的用户兴趣短语作为目标待定用户兴趣短
语,直到挑选出的目标待定用户兴趣短语的数目达到设定数目。5.根据权利要求1所述的方法,其特征在于,所述在所述用户兴趣挖掘窗口中确定待定用户兴趣短语,包括:对于所述用户兴趣挖掘窗口中的每个行为数据单元,根据每个行为数据单元的分布标签信息在所述用户兴趣挖掘窗口中确定第...
【专利技术属性】
技术研发人员:胡志强,国忠金,张睿,李小倩,刘心语,张甲兵,
申请(专利权)人:山东云聚科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。