一种评论质量分类的方法、装置、设备及可读介质制造方法及图纸

技术编号:27530411 阅读:13 留言:0更新日期:2021-03-03 11:06
本发明专利技术公开了一种评论质量分类的方法,包括以下步骤:获取评论数据,并根据评论数据的元数据特征分析得到质量评价参考指标;根据评论数据的语言特征构建质量评价指标体系;基于质量评价指标体系构建分类模型,并基于分类模型通过递归神经网络的最小二乘支持向量机对评论数据进行分类;以及基于质量评价参考指标对基于分类模型的分类结果进行评价。本发明专利技术还公开了一种评论质量分类的装置、计算机设备和可读存储介质。本发明专利技术构建了基于FPGA的用户评论质量评价体系,在数据量逐渐增大的时候,能够保持较高的性能和处理速率;针对非商业化平台,评论质量较高且更加合理。评论质量较高且更加合理。评论质量较高且更加合理。

【技术实现步骤摘要】
一种评论质量分类的方法、装置、设备及可读介质


[0001]本专利技术涉及评论质量评估
,尤其涉及一种评论质量分类的方法、装置、设备及可读介质。

技术介绍

[0002]随着电子商务的快速发展,商业化购物平台开始对用户评论数据进行收集,并对其进行排序、分类、重要性评级等操作后展示给客户,以便其能迅速在海量的评论中找到满足自己需求的评论。通过优化评论展示方式,提升用户体验,同时增加用户购买率。
[0003]当前现有的评论质量评价技术大部分为纯软件实现,将其转变为分类和排序问题,通过从不同层面提取与评论有关的特征指标,使用有监督的机器学习方法来对其质量进行分类及预测,速率较低,占用CPU资源较大,需要定期维护;且对于非商业化平台的研究较少,用户评价通常较为随意,不能有效反映产品的真实价值;评价标准也大都仅基于有用性投票,较为片面单一。

技术实现思路

[0004]有鉴于此,本专利技术实施例的目的在于提出一种评论质量分类的方法、装置、设备及可读介质,构建了基于FPGA的用户评论质量评价体系,在数据量逐渐增大的时候,能够保持较高的性能和处理速率;针对非商业化平台,评论质量较高且更加合理。
[0005]基于上述目的,本专利技术实施例的一方面提供了一种评论质量分类的方法,包括以下步骤:获取评论数据,并根据评论数据的元数据特征分析得到质量评价参考指标;根据评论数据的语言特征构建质量评价指标体系;基于质量评价指标体系构建分类模型,并基于分类模型通过递归神经网络的最小二乘支持向量机对评论数据进行分类;以及基于质量评价参考指标对基于分类模型的分类结果进行评价。
[0006]在一些实施方式中,根据评论数据的元数据特征分析得到质量评价参考指标包括:基于评论数据获取评论有用投票数和评论者历史评论有用率;基于评论有用投票数和评论者历史评论有用率计算得到有用评论指标。
[0007]在一些实施方式中,根据评论数据的语言特征构建质量评价指标体系包括:基于中文词库中正面情感词和负面情感词标准分析评论数据中情感词和修饰词的数量指标;基于评论数据中的用户评分与平均分的差异值计算评论数据的评分差异指标。
[0008]在一些实施方式中,根据评论数据的语言特征构建质量评价指标体系包括:基于自动化可读性指数计算评论数据的可读性指标。
[0009]在一些实施方式中,根据评论数据的语言特征构建质量评价指标体系包括:基于评论对应的主题相似度最高的概率值作为评论数据的相关性指标。
[0010]在一些实施方式中,基于分类模型通过递归神经网络的最小二乘支持向量机对评论数据进行分类包括:通过递归神经网络的最小二乘支持向量机对评论数据进行并行处理,并分类结果推送给用户。
[0011]在一些实施方式中,基于质量评价参考指标对基于分类模型的分类结果进行评价包括:基于查准率、召回率、准确率和F值指标对分类结果进行分析和评价。
[0012]本专利技术实施例的另一方面,还提供了一种评论质量分类的装置,包括:初始模块,配置用于获取评论数据,并根据评论数据的元数据特征分析得到质量评价参考指标;构建体系模块,配置用于根据评论数据的语言特征构建质量评价指标体系;分类模块,配置用于基于质量评价指标体系构建分类模型,并基于分类模型通过递归神经网络的最小二乘支持向量机对评论数据进行分类;以及分析模块,配置用于基于质量评价参考指标对基于分类模型的分类结果进行评价。
[0013]本专利技术实施例的再一方面,还提供了一种计算机设备,包括:至少一个处理器;以及存储器,存储器存储有可在处理器上运行的计算机指令,指令由处理器执行时实现上述方法的步骤。
[0014]本专利技术实施例的再一方面,还提供了一种计算机可读存储介质,计算机可读存储介质存储有被处理器执行时实现如上方法步骤的计算机程序。
[0015]本专利技术具有以下有益技术效果:构建了基于FPGA的用户评论质量评价体系,在数据量逐渐增大的时候,能够保持较高的性能和处理速率;针对非商业化平台,评论质量较高且更加合理。
附图说明
[0016]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的实施例。
[0017]图1为本专利技术提供的评论质量分类的方法的实施例的示意图;
[0018]图2为本专利技术提供的评论质量分类的装置的实施例的示意图;
[0019]图3为本专利技术提供的计算机设备的实施例的示意图;
[0020]图4为本专利技术提供的计算机可读存储介质的实施例的示意图;
[0021]图5为本专利技术提供的评论质量分类的分类评价的混淆矩阵的示意图。
具体实施方式
[0022]为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术实施例进一步详细说明。
[0023]需要说明的是,本专利技术实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一”“第二”仅为了表述的方便,不应理解为对本专利技术实施例的限定,后续实施例对此不再一一说明。
[0024]基于上述目的,本专利技术实施例的第一个方面,提出了评论质量分类的方法的实施例。图1示出的是本专利技术提供的评论质量分类的方法的实施例的示意图。如图1所示,本专利技术实施例包括如下步骤:
[0025]S01、获取评论数据,并根据评论数据的元数据特征分析得到质量评价参考指标;
[0026]S02、根据评论数据的语言特征构建质量评价指标体系;
[0027]S03、基于质量评价指标体系构建分类模型,并基于分类模型通过递归神经网络的最小二乘支持向量机对评论数据进行分类;以及
[0028]S04、基于质量评价参考指标对基于分类模型的分类结果进行评价。
[0029]在本实施例中,首先基于用户特征、评论内容、用户打分等信息提取出与评论质量相关的指标,进而构建一个基于该领域的评论质量评价体系,再通过FPGA加速的支持向量机算法对评论进行分类,最后对分类结果进行分析和评价。
[0030]在本专利技术的一些实施例中,根据评论数据的元数据特征分析得到质量评价参考指标包括:基于评论数据获取评论有用投票数和评论者历史评论有用率;基于评论有用投票数和评论者历史评论有用率计算得到有用评论指标。
[0031]在本实施例中,获取原始评论数据,提取评论质量评价指标。将影响评论质量的特征分为两类:元数据特征、语言特征,从这两个类别分别提取相关指标。其中元数据特征包括:评论有用投票数、评分星级、评论者以往发表的评论有用率;语言特征包括评论长度、平均句长、相关性、修饰词数量、情感词数量和可读性。其中有用性投票数和评论者以往发表的评论有用率作为评论质量的评价标准。评价标准计算方式为:(该评论有用投票数/该产品所有评论投票数+评论者以往发表的评本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种评论质量分类的方法,其特征在于,包括以下步骤:获取评论数据,并根据所述评论数据的元数据特征分析得到质量评价参考指标;根据所述评论数据的语言特征构建质量评价指标体系;基于所述质量评价指标体系构建分类模型,并基于所述分类模型通过递归神经网络的最小二乘支持向量机对所述评论数据进行分类;以及基于所述质量评价参考指标对基于所述分类模型的分类结果进行评价。2.根据权利要求1所述的评论质量分类的方法,其特征在于,根据所述评论数据的元数据特征分析得到质量评价参考指标包括:基于所述评论数据获取评论有用投票数和评论者历史评论有用率;基于所述评论有用投票数和所述评论者历史评论有用率计算得到有用评论指标。3.根据权利要求1所述的评论质量分类的方法,其特征在于,根据所述评论数据的语言特征构建质量评价指标体系包括:基于中文词库中正面情感词和负面情感词标准分析所述评论数据中情感词和修饰词的数量指标;基于所述评论数据中的用户评分与平均分的差异值计算所述评论数据的评分差异指标。4.根据权利要求1所述的评论质量分类的方法,其特征在于,根据所述评论数据的语言特征构建质量评价指标体系包括:基于自动化可读性指数计算所述评论数据的可读性指标。5.根据权利要求1所述的评论质量分类的方法,其特征在于,根据所述评论数据的语言特征构建质量评价指标体系包括:基于评论对应的主题相似度最高的概率值作为所述评论数据的相关性...

【专利技术属性】
技术研发人员:张灿刘伟牟奇
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1