【技术实现步骤摘要】
一种应用于大数据的评论文本处理方法及存储介质
[0001]本申请涉及大数据和文本处理
,特别涉及一种应用于大数据的评论文本处理方法及存储介质。
技术介绍
[0002]随着电子信息产业的快速发展,互联网的数据量呈几何倍数增长,现代社会正处于大数据时代。面对数据量规模达PB甚至EB级以上的数据,不仅在数据存储上,也在数据处理上带来了巨大的压力。当个别计算机设备难以存储或者处理如此庞大的数据时,可以采用多台计算机设备来协同处理,大数据技术和云计算概念应运而生。
[0003]所谓大数据,并不是定量地规定数据量达到多少TB、多少PB或者多少EB。对于大数据的概念而言,需要从数据的“质量”方面进行考虑。一般而言,大数据是指无法在可承受的时间范围内通过常规工具进行捕捉、管理和处理的数据集合。
[0004]现目前,大数据的应用近乎涉及方方面面,比如信息检索与大数据搜索、汉语分词、文本分类与聚类、话题发现、情感分析、电商用户画像分析等。以电商用户画像分析为例,大数据技术通常可以基于电商用户的相关评论进行画像分析。然而一些 ...
【技术保护点】
【技术特征摘要】
1.一种应用于大数据的评论文本处理方法,其特征在于,所述方法包括:确定与待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识;根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,确定所述电商对象反馈评论对应的分治整合的目标语义特征区分标识;基于所述目标语义特征区分标识,对所述电商对象反馈评论进行分治整合并进行文本表达性修正处理。2.如权利要求1所述的方法,其特征在于,所述确定与待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,包括:针对一组待进行评论文本修正处理的电商对象反馈评论,确定该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识。3.如权利要求2所述的方法,其特征在于,所述根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,确定所述电商对象反馈评论对应的分治整合的目标语义特征区分标识,包括:根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识;所述基于所述目标语义特征区分标识,对所述电商对象反馈评论进行分治整合并进行文本表达性修正处理,包括:根据确定的分治整合的目标语义特征区分标识,对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理。4.如权利要求3所述的方法,其特征在于,在根据事先保留的每种语义特征区分标识的评论倾向整合方式对应的分治整合的语义特征区分标识,以及确定出的该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的评论倾向整合方式的语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识之前,所述方法还包括:判断该组待进行评论文本修正处理的电商对象反馈评论中的每个待进行评论文本修正处理的电商对象反馈评论中是否均包含热门订单专题,如果否,则进行后续步骤;如果是,则判断该热门订单专题是否符合设定的每种语义特征区分标识的分治整合对应的热门订单激活指标,如果否,则进行后续步骤。5.如权利要求4所述的方法,其特征在于,当该热门订单专题符合设定的每种语义特征区分标识的分治整合对应的热门订单激活指标时,所述方法还包括:根据每个待进行评论文本修正处理的电商对象反馈评论中包含的热门订单专题,以及设定的每种语义特征区分标识的分治整合对应的热门订单激活指标,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识;
根据确定的分治整合的目标语义特征区分标识,对该组待进行评论文本修正处理的电商对象反馈评论进行分治整合并进行文本表达性修正处理;所述根据每个待进行评论文本修正处理的电商对象反馈评论中包含的热门订单专题,以及设定的每种语义特征区分标识的分治整合对应的热门订单激活指标,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识包括:根据每个待进行评论文本修正处理的电商对象反馈评论中包含的热门订单专题,确定该组待进行评论文本修正处理的电商对象反馈评论对应的热门订单的文本误解可能性,其中所述文本误解可能性为该组待进行评论文本修正处理的电商对象反馈评论对应的热门订单的买卖方沟通情况与存在异常的文本理解事件的测评结果;如果所述文本误解可能性大于设定的第一文本误解可能性阈值,则确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识为文本歧义性标识;如果所述文本误解可能性小于设定的第二文本误解可能性阈值,则根据设定的每种语义特征区分标识的分治整合结果对应的关联语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识,其中,所述第一文本误解可能性阈值大于所述第二文本误解可能性阈值;所述根据设定的每种语义特征区分标识的分治整合结果对应的关联语义特征区分标识,确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识包括:判断该组待进行评论文本修正处理的电商对象反馈评论中存在订单优化的每两个待进行评论文本修正处理的电商对象反馈评论对应的关联语义特征区分标识是否均为全局相关性语义描述;如果是,则确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识为可调语义标识;如果否,则确定该组待进行评论文本修正处理的电商对象反馈评论对应的分治整合的目标语义特征区分标识为不可调语义标识。6.如权利要求3或4所述的方法,其特征在于,所述根据事先保留的每种语义特征区分标识的评论...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。