System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于有向网络信息传播的关键竞品识别方法及系统技术方案_技高网
当前位置: 首页 > 专利查询>安徽大学专利>正文

一种基于有向网络信息传播的关键竞品识别方法及系统技术方案

技术编号:41195004 阅读:2 留言:0更新日期:2024-05-07 22:23
本发明专利技术公开了一种基于有向网络信息传播的关键竞品识别方法及系统,属于复杂网络数据挖掘技术领域。本发明专利技术主要包括:执行网络爬虫程序在亚马逊平台收集目标产品P的问答信息和评论信息;执行SNowNLP从问答信息中识别目标产品P的竞品c,构建竞品c的集合为竞品集合C<subgt;1</subgt;;根据问答信息和评论信息计算每个竞品c的点评得分RS;构建以竞品集合C<subgt;1</subgt;中竞品c作为节点v的网络G;根据点评得分RS计算每个节点v的初始得分vs<supgt;q</supgt;;根据初始得分vs<supgt;q</supgt;计算每个节点v的最终得分score。本发明专利技术执行网络爬虫程序收集目标竞品的问答信息和评论信息,构建了比较网络模型,计算得到目标商品的关键竞品,信息收集和比较过程简单快速,能够较为全面和准确地识别竞品。

【技术实现步骤摘要】

本专利技术涉及复杂网络数据挖掘,具体涉及一种基于有向网络信息传播的关键竞品识别方法及系统


技术介绍

1、随着技术的进步和市场的饱和,竞品的同质化变得普遍和严重竞品选择已经成为客户的典型决策问题。用户在电商平台上的购物体验变得越来越重要,为了提高用户的购物体验,电商平台需要准确地识别出与目标商品具有竞争力的其他商品。与传统商务相比,电子商务呈现出新的技术特征,包括交互性、粘性、个性化和社交性,这些特征促进了客户之间的沟通和协作并蓬勃发展在线用户生成内容(ugc)。

2、大多数客户通过在线ugc获得更详细的竞品信息、个性化体验和实时反馈,这显著影响甚至改变了客户的偏好和购买意向。然而,网上购物的蓬勃发展产生了大量的ugc,例如电子商务平台上的在线评论,现有的竞品识别方法主要依靠人工分类或者简单的规则匹配从在线ugc获得更详细的竞品信息、个性化体验和实时反馈,信息收集和比较过程非常繁琐和耗时,难以准确全面地识别所有竞品,难以适应电商平台上商品的动态更新和多样性。


技术实现思路

1、为解决现有的竞品识别方法主要依靠人工分类或者简单的规则匹配从在线ugc获得更详细的竞品信息、个性化体验和实时反馈,信息收集和比较过程非常繁琐和耗时的技术问题,本专利技术提供一种基于有向网络信息传播的关键竞品识别方法及系统。

2、本专利技术采用以下技术方案实现:一种基于有向网络信息传播的关键竞品识别方法,其包括以下步骤:

3、步骤s1,执行网络爬虫程序在亚马逊平台收集目标产品p的问答信息和评论信息;

4、步骤s2,执行snownlp从问答信息中识别目标产品p的竞品c,构建竞品c的集合为竞品集合c1;

5、步骤s3,根据问答信息和评论信息计算每个竞品c的点评得分rs;构建以竞品集合c1中竞品c作为节点v的网络g;

6、步骤s4,根据点评得分rs计算每个节点v的初始得分vsq;

7、步骤s5,根据初始得分vsq计算每个节点v的最终得分score,根据最终得分score获取目标产品p的关键竞品集合c2。

8、上述的基于有向网络信息传播的关键竞品识别方法,其通过执行网络爬虫程序收集目标竞品的问答信息和评论信息,通过snownlp识别竞品,根据问答信息计算点评得分,将目标竞品及其竞品作为节点,将竞品之间的比较关系作为边,构建了比较网络模型,计算得到目标商品的关键竞品,信息收集和比较过程简单快速,方便用户较为全面和准确地识别竞品。

9、作为上述方案的进一步改进,在步骤s1中,若收集的问答信息或评论信息的内容为空,则删除该条问答信息或评论信息。

10、作为上述方案的进一步改进,在步骤s1中,若收集到问答信息或评论信息中的名称为英文格式,则转化为中文格式。

11、作为上述方案的进一步改进,在步骤s2中,通过snownlp对问答信息进行分词,标注问答信息中名词作为目标产品p,即实现从问答信息中识别竞品。

12、作为上述方案的进一步改进,步骤s1中收集的问答信息包括:问题句qi、回答句aij、问题句qi的数目n和回答句aij的数目m;评论信息包括:评论和评论的数目l;

13、计算点评得分rs包括:构建问题集q和回答集ai,q为:q={qi},qi代表第i个问题句q,ai为:ai={aij},aij代表第i个问题句的第j个回答句a;

14、执行snownlp获取每个问答信息中回答句aij的文本情感值snow(aij),计算回答句aij的文本情感平均值作为第一文本情感平均值sv,sv为:其中,0≤snow(aij)≤1;

15、执行snownlp获取每个评论的数字评分r,计算每个评论的数字平均评分nr,nr为:其中,r1(l=1,2,...,l)代表第l条评论的数字评分;

16、执行snownlp获取每个评论的文本情感值s,计算每个评论的文本情感平均值作为第二文本情感平均值ts,ts为:其中,sl代表第l条评论的文本情感值s。

17、获取数字评分nr和文本情感值ts归一化后的数据nr'和ts',nr'∈[0,1],ts'∈[0,1];

18、计算竞品c的点评得分rs,rs为:

19、作为上述方案的进一步改进,网络g为:g=(v,e),其中,v代表所有节点v的集合,v={v1,v2,...,vt},vt代表第t个节点v;e={<va,vb>}代表有向边的集合,va代表竞品c的节点v并作为有向边的起始点,vb代表竞品c竞品的节点v并作为有向边的终点,va∈v,vb∈v。

20、作为上述方案的进一步改进,vsq(q=1,2,...,t)为:其中,rsq表示第q个竞品c的评论得分rs。

21、作为上述方案的进一步改进,步骤s5包括以下步骤:

22、步骤s51,构建节点va的出度邻居节点集合neighbor(va)out,neighbor(va)out={va1,va2,..,van},其中,van代表第n个邻居节点;

23、计算传播频率p,p为:p(v,va)代表节点va向节点v进行信息传播的概率,degree(va)out代表节点va的出度;

24、步骤s52,根据初始得分vsq和传播频率p计算节点va的最终得分score,score为:p(va,van)代表节点van向节点va进行信息传播的概率;

25、步骤s53,获取竞品集合c1中最终得分score最高的节点va并标识为节点vamax,将节点vamax在竞品集合c1中对应的竞品c移动至预设的关键竞品集合c2;

26、步骤s54,计算网络平均度avgdegree,avgdegree为:

27、edges代表网络的边数,num(nodes)代表网络的节点个数;根据网络平均度avgdegree计算节点vamax的一阶邻居节点和二阶邻居节点在节点vamax对应的竞品c移动至关键竞品集合c2后的初始得分;

28、步骤s55,判断是否节点va的数量等于0,否则执行步骤s52,是则输出关键竞品集合s。

29、作为上述方案的进一步改进,v1sq'为:

30、v2sq'为:

31、其中,v1sq和v2sq分别代表:节点vamax在竞品集合c1中对应的竞品c移动至关键竞品集合s2之前,节点vamax的一阶邻居节点和二阶邻居节点的初始得分vsq;

32、v1sq和v2sq分别代表:节点vamax在竞品集合c1中对应的竞品c移动至关键竞品集合s2之后,节点vamax的一阶邻居节点和二阶邻居节点的初始得分vsq;

33、vsq=max(vsq,0)。

34、本专利技术还提供了一种基于有向网络信息传播的关键竞品识别系统,其用于上述任意一项所述的基于有向网络信息传播的关键竞品识别方法,其包括:

35、信息收集模块,其用于通过执行网络爬本文档来自技高网...

【技术保护点】

1.一种基于有向网络信息传播的关键竞品识别方法,其特征在于,其包括以下步骤:

2.如权利要求1所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,在步骤S1中,若收集的问答信息或评论信息的内容为空,则删除该条问答信息或评论信息。

3.如权利要求1所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,在步骤S1中,若收集到问答信息或评论信息中的名称为英文格式,则转化为中文格式。

4.如权利要求1所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,在步骤S2中,通过SNowNLP对问答信息进行分词,标注问答信息中名词作为目标产品P,即实现从问答信息中识别竞品。

5.如权利要求1所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,步骤S1中收集的问答信息包括:问题句qi、回答句aij、问题句qi的数目N和回答句aij的数目M;评论信息包括:评论和评论的数目L;

6.如权利要求5所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,网络G为:G=(V,E),其中,V代表所有节点v的集合,V={v1,v2,...,vt},vt代表第t个节点v;E={<va,vb>}代表有向边的集合,va代表竞品c的节点v并作为有向边的起始点,vb代表竞品c竞品的节点v并作为有向边的终点,va∈V,vb∈V。

7.如权利要求6所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,vsq(q=1,2,...,t)为:其中,RSq表示第q个竞品c的评论得分RS。

8.如权利要求7所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,步骤S5包括以下步骤:

9.如权利要求8所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,

10.一种基于有向网络信息传播的关键竞品识别系统,其用于权利要求1-9任意一项所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,其包括:

...

【技术特征摘要】

1.一种基于有向网络信息传播的关键竞品识别方法,其特征在于,其包括以下步骤:

2.如权利要求1所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,在步骤s1中,若收集的问答信息或评论信息的内容为空,则删除该条问答信息或评论信息。

3.如权利要求1所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,在步骤s1中,若收集到问答信息或评论信息中的名称为英文格式,则转化为中文格式。

4.如权利要求1所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,在步骤s2中,通过snownlp对问答信息进行分词,标注问答信息中名词作为目标产品p,即实现从问答信息中识别竞品。

5.如权利要求1所述的基于有向网络信息传播的关键竞品识别方法,其特征在于,步骤s1中收集的问答信息包括:问题句qi、回答句aij、问题句qi的数目n和回答句aij的数目m;评论信息包括:评论和评论的数目l;

6.如权利要...

【专利技术属性】
技术研发人员:颜登程叶选繁刘森林任思宇王庆人张以文
申请(专利权)人:安徽大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1