竞争产品信息获取方法技术

技术编号:39601408 阅读:7 留言:0更新日期:2023-12-03 20:01
本申请涉及一种可用于大数据技术领域的竞争产品信息获取方法

【技术实现步骤摘要】
竞争产品信息获取方法、装置、计算机设备和存储介质


[0001]本申请涉及大数据
,特别是涉及一种竞争产品信息获取方法

装置

计算机设备

存储介质和计算机程序产品


技术介绍

[0002]获取竞争对手的竞争产品信息对软件产品来说具有巨大的价值,它可以帮助技术人员了解不断变化的市场以及用户环境,从而调整策略

扩充功能并提高用户下载量

[0003]传统技术中,获取竞争产品信息一般是通过调查方法与内容分析相结合的方式来对竞争选手的竞争产品进行分析

如,技术人员可以通过发布调查问卷

采集用户意见等方式来对可能存在的竞争产品进行调查,并且对调查结果进行内容分析,以分析哪些竞争产品是威胁较大的,从而获取竞争产品信息

[0004]然而,目前的这种技术手段并不够准确,无法获取准确的竞争产品信息


技术实现思路

[0005]基于此,有必要针对上述技术问题,提供一种准确的竞争产品信息获取方法

装置

计算机设备

计算机可读存储介质和计算机程序产品

[0006]第一方面,本申请提供了一种竞争产品信息获取方法

所述方法包括:
[0007]获取当前产品的第一网络评价文本数据;
[0008]从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据,并从所述第二网络评价文本数据的比较文本数据中提取第一竞争产品信息,所述比较文本数据是比较所述当前产品与竞争产品的文本数据;
[0009]确定所述第一竞争产品信息中不同竞争产品名称的词频率;
[0010]基于所述词频率,从所述第一竞争产品信息中筛选得到第二竞争产品信息

并从所述第二网络评价文本数据中提取所述第二竞争产品信息对应的第三网络评价文本数据;
[0011]基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息

[0012]在其中一个实施例中,所述从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据包括:
[0013]获取比较文本分类器,所述比较文本分类器用于对网络评价文本数据是否包含比较文本数据进行分类;
[0014]将所述第一网络评价文本数据输入至所述比较文本分类器,得到所述第一网络评价文本数据对应的预测分类标签;
[0015]根据所述对应的预测分类标签,从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据

[0016]在其中一个实施例中,所述获取比较文本分类器包括:
[0017]获取初始比较文本分类器

及网络评价文本分类训练集;
[0018]根据所述网络评价文本分类训练集,对所述初始比较文本分类器进行逻辑回归训练,并获取训练完成的初始比较文本分类器的损失函数;
[0019]采用梯度下降法对所述损失函数进行优化,并根据优化后的损失函数,得到比较文本分类器

[0020]在其中一个实施例中,还包括:
[0021]获取网络评价文本分类测试集

及所述网络评价文本分类测试集对应的真实标签;
[0022]将所述网络评价文本分类测试集输入至比较文本分类器,得到所述网络评价文本分类测试集对应的预测分类标签;
[0023]对比所述真实标签

与预测分类标签,得到
KAPPA
系数,并根据所述
KAPPA
系数,对所述比较文本分类器进行校验

[0024]在其中一个实施例中,所述基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息包括:
[0025]对所述第三网络评价文本数据进行情感分析,得到第二竞争产品信息中不同竞争产品信息的平均情感取向

及平均情感得分;
[0026]根据第二竞争产品信息中不同竞争产品信息的所述平均情感取向

及所述平均情感得分,得到情感分析结果;
[0027]基于所述情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息

[0028]在其中一个实施例中,所述对所述第三网络评价文本数据进行情感分析,得到第二竞争产品信息中不同竞争产品信息的平均情感取向

及平均情感得分包括:
[0029]对所述第三网络评价文本数据进行情感分析,获取所述第二竞争产品信息中不同竞争产品信息对应的评价文本总数量

积极评价文本数量

消极评价文本数量

及评价文本情感强度;
[0030]根据所述评价文本总数量

所述积极评价文本数量

及所述消极评价文本数量,得到第二竞争产品信息中不同竞争产品信息的平均情感取向;
[0031]根据所述评价文本情感强度,得到第二竞争产品信息中不同竞争产品信息的平均情感得分

[0032]第二方面,本申请还提供了一种竞争产品信息获取装置

所述装置包括:
[0033]数据获取模块,用于获取当前产品的第一网络评价文本数据;
[0034]一次筛选模块,用于从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据,并从所述第二网络评价文本数据的比较文本数据中提取第一竞争产品信息,所述比较文本数据是比较所述当前产品与竞争产品的文本数据;
[0035]词频确定模块,用于确定所述第一竞争产品信息中不同竞争产品名称的词频率;
[0036]二次筛选模块,用于基于所述词频率,从所述第一竞争产品信息中筛选得到第二竞争产品信息

并从所述第二网络评价文本数据中提取所述第二竞争产品信息对应的第三网络评价文本数据;
[0037]三次筛选模块,用于基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息

[0038]第三方面,本申请还提供了一种计算机设备

所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0039]获取当前产品的第一网络评价文本数据;
[0040]从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据,并从所述第二网络评价文本数据的比较文本数据中提取第一竞争产品信息,所述比较文本数据是比较所述当前产品与竞争产品的文本数据;
[0041]确定所述第一竞争产品信息本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种竞争产品信息获取方法,其特征在于,所述方法包括:获取当前产品的第一网络评价文本数据;从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据,并从所述第二网络评价文本数据的比较文本数据中提取第一竞争产品信息,所述比较文本数据是比较所述当前产品与竞争产品的文本数据;确定所述第一竞争产品信息中不同竞争产品名称的词频率;基于所述词频率,从所述第一竞争产品信息中筛选得到第二竞争产品信息

并从所述第二网络评价文本数据中提取所述第二竞争产品信息对应的第三网络评价文本数据;基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息
。2.
根据权利要求1所述的方法,其特征在于,所述从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据包括:获取比较文本分类器,所述比较文本分类器用于对网络评价文本数据是否包含比较文本数据进行分类;将所述第一网络评价文本数据输入至所述比较文本分类器,得到所述第一网络评价文本数据对应的预测分类标签;根据所述对应的预测分类标签,从所述第一网络评价文本数据中筛选出包含比较文本数据的第二网络评价文本数据
。3.
根据权利要求2所述的方法,其特征在于,所述获取比较文本分类器包括:获取初始比较文本分类器

及网络评价文本分类训练集;根据所述网络评价文本分类训练集,对所述初始比较文本分类器进行逻辑回归训练,并获取训练完成的初始比较文本分类器的损失函数;采用梯度下降法对所述损失函数进行优化,并根据优化后的损失函数,得到比较文本分类器
。4.
根据权利要求2所述的方法,其特征在于,还包括:获取网络评价文本分类测试集

及所述网络评价文本分类测试集对应的真实标签;将所述网络评价文本分类测试集输入至比较文本分类器,得到所述网络评价文本分类测试集对应的预测分类标签;对比所述真实标签

与预测分类标签,得到
KAPPA
系数,并根据所述
KAPPA
系数,对所述比较文本分类器进行校验
。5.
根据权利要求1所述的方法,其特征在于,所述基于对所述第三网络评价文本数据进行情感分析得到的情感分析结果,从所述第二竞争产品信息中筛选得到目标竞争产品信息包括:对所述第三网络评价文本数据进行情感分析,得到第二竞争产品信息中不同竞争产品信息的平均情感取向
...

【专利技术属性】
技术研发人员:马子琛
申请(专利权)人:中国银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1