【技术实现步骤摘要】
一种基于影响度的负序列模式分析系统及方法
[0001]本专利技术涉及序列模式挖掘
,特别涉及一种基于影响度的负序列模式分析系统及方法。
技术介绍
[0002]目前的直播商家通常不能直观的了解客户,获取的相关数据比如用户的注册信息,购买记录等有限。通过对大量的客户购买记录进行挖掘和分析,发现客户频繁购买的有趣序列模式,从而得到有价值的直播商品展示顺序信息。再进一步将这些信息提供给商家参考,使其可以在直播中以合适的顺序向客户推荐和展示商品,将商家直播的浏览者转变为购买者。可以有效地增加客户的交易机会,提高商家直播的商品交易量和经济效益。
[0003]序列模式分析可以发现交易之间关系规律,即能够根据商品买卖的情况来获取这些商品之间的关系信息,从而更好地进行商品组合推荐和制定销售决策。它的主要目的是研究商品购买的先后关系,找出其中的规律,即不仅需要知道商品是否被购买,而且需要确定该商品与其它商品之间购买的先后顺序,例如,购买文具的一个典型顺序是购买“铅笔”,之后很有可能继续购买“小刀”,再是购买“橡皮”。序列模式挖掘能 ...
【技术保护点】
【技术特征摘要】
1.一种基于影响度的负序列模式分析系统,其特征在于:包括,数据预处理模块,用于获取数据及对数据进行预处理,并将数据存入到数据库;频繁模式挖掘模块,用于使用预先设定的算法,并根据用户设置的最小支持度阈值,在数据预处理模块处理得到的数据集中挖掘频繁模式;影响度分析模块,用于对频繁模式挖掘模块得到的正和负频繁序列模式分别进行影响度计算,求取出模式的影响度,并根据用户设置的最小影响度阈值,选取出满足影响度约束的频繁模式;图形化界面表示模块,用于将影响度分析模块的挖掘结果在系统的图形化界面上进行表示,并在该页面中为用户提供搜索框。2.一种基于影响度的负序列模式分析方法,其特征在于:作如下定义,负尺寸:负序列ns中负元素的总数称为ns的负尺寸。如果negsize(ns)=n,则ns是一个n
‑
neg
‑
size序列;正伙伴:一个负元素的正伙伴是(ab),记为即即正元素(ab)的正伙伴是(ab)本身,即p((ab))=(ab)。一个负序列ns=<s1s2,
…
,s
k
>的正伙伴,就是将ns中的所有负元素都变为它们的正伙伴,表示为p(ns),即p(ns)=<s1s2,
…
,s
k
>|s
j
=p(s
i
),s
i
∈ns;最大正子序列:假设ns=<s1s2,
…
,s
m
>是一个m
‑
size和n
‑
neg
‑
size的负序列(m>n),子序列s包含所有正元素,则称s为ns的最大正子序列,表示为MPS(ns);1
‑
Neg
‑
Size最大子序列:对于一个负序列ns,其包含MPS(ns)和一个负元素e的子序列称为1
‑
neg
‑
size最大子序列,记为1
‑
negMS
i
。包含ns的所有1
‑
neg
‑
size最大子序列的子序列集称为1
‑
neg
‑
size最大子序列集,记为1
‑
negMSS
ns
;元素频繁约束:一个负元素e
n
不能出现在NSC中,除非它的正元素伙伴p(e
n
)是频繁的,即sup(p(e
n
))≥min
‑
sup。例如,如果则元素满足此约束;1
‑
length
‑
neg元素格式约束:NSC中仅不允许出现连续的1
‑
length负元素。例如,满足此约束,但不满足;负包含:令ds=<d1,d2,
…
,d
t
>为一个客户购买数据序列,ns=<s1,s2,
…
,s
m
>为一个m
‑
size和n
‑
neg
‑
size的负序列(1)如果m>2t+1,则ds不包含ns;(2)如果m≥1且n=1,则当时ds包含ns;(3)否则,如果时ds包含ns;(3)否则,如果则ds包含ns;所述基于影响度的负序列模式分析方法具体包括以下步骤,S100数据获取及预处理:获取直播交易数据,将直播购物中的交易数据进行清洗,对清理后的数据中的商品名称用数字表示,并将该对应关系存入到数据库中,接下来将处理后的数据表示为序列的形式,得到的若干个直播交易序列作为频繁模式挖掘的数据集;S200频繁模式挖掘:使用修改后的sc
‑
NSP算法,并根据用户设置的最小支持度阈值,在上述处理得到的数据集中挖掘频繁模式;S300频繁模式影响度分析:对上述通过支持度...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。