【技术实现步骤摘要】
信息处理方法以及装置、计算设备、存储介质
本申请实施例涉及计算机应用
,尤其涉及一种信息处理方法以及装置、计算设备、存储介质。
技术介绍
随着网络技术的迅速发展,网络交流在人们的日常生活中越来越多。网络舆情信息是指人们在网络上发布的评论信息、社交信息、产品信息、文章等信息。如同一事件相关网络舆情信息数量过多,会导致该事件发酵成热点事件,相关舆论可以对事件的走向产生重大影响,因此,对网络舆情信息的监控需求日益增加。通常,可以采用对网络舆情信息进行实时自动采集、分析、汇总、监控等处理以识别其中的热点事件。现有技术中,对海量的网络舆情信息进行处理时,多采用基于热点关键词等方式搜索相关的网络舆情信息,并将与热点关键词相关的网络舆情信息发送至监控人员,由监控人员对所述多个网络舆情信息进行人工审核,以确定各个网络舆情信息是否为风险信息,针对存在风险的网络舆情信息可以进行风险处理,以避免产生恶劣影响。例如,监控人员判断对某个产品的评论是负面评论,可以联系评论者解决其问题以消除产品的负面影响。但是,通过人工审核网络舆情信息风险 ...
【技术保护点】
1.一种信息处理方法,其特征在于,应用于计算设备中,包括:/n确定网络舆情信息;/n提取所述网络舆情信息对应的风险数据;其中,所述风险数据包括:风险类型、风险实体、风险触发词和/或风险载体;/n输出基于所述风险数据生成的风险提示信息;/n根据所述风险数据,获取针对所述网络舆情信息的处置流程;/n检测用户对所述风险提示信息触发的处置提示请求,输出所述处置流程对应的处置提示信息。/n
【技术特征摘要】
1.一种信息处理方法,其特征在于,应用于计算设备中,包括:
确定网络舆情信息;
提取所述网络舆情信息对应的风险数据;其中,所述风险数据包括:风险类型、风险实体、风险触发词和/或风险载体;
输出基于所述风险数据生成的风险提示信息;
根据所述风险数据,获取针对所述网络舆情信息的处置流程;
检测用户对所述风险提示信息触发的处置提示请求,输出所述处置流程对应的处置提示信息。
2.根据权利要求1所述的方法,其特征在于,所述风险数据包括风险类型以及风险实体时,所述根据所述风险数据,获取针对所述网络舆情信息的处置流程包括:
如果所述风险类型不为空,且所述风险实体为空,确定所述网络舆情信息的处置流程为不处置;
如果所述风险类型不为空,且所述风险实体与预设第一实体相匹配,确定所述网络舆情信息的处置流程为等待处置流程;
如果所述风险类型与预设第一类型相匹配,且所述风险实体与预设第二实体相匹配,确定所述网络舆情信息的处置流程为等待处置流程。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
确定所述网络舆情信息对应的扩散状态;其中,所述扩散状态包括易扩散状态以及非易扩散型状态;
所述根据所述风险数据,获取针对所述网络舆情信息的处置流程还包括:
如果所述风险类型不为空,所述风险实体与预设第一实体相匹配,且所述网络舆情信息的扩散状态为易扩散状态,确定所述网络舆情信息的处置流程为紧急处置流程。
4.根据权利要求3所述的方法,其特征在于,所述确定所述网络舆情信息对应的扩散状态包括:
确定所述网络舆情信息发布者的身份标识对应标识类型;
如果所述发布者的身份标识对应标识类型与预设至少一个标识类型中任一个标识类型相匹配,确定所述网络舆情信息的扩散类型对应的扩散状态为易扩散状态;
如果所述发布者的身份标识对应标识类型与预设所述至少一个标识类型中每一个标识类型均不匹配,确定所述网络舆情信息对应的扩散状态为非易扩散状态。
5.根据权利要求3所述的方法,其特征在于,所述确定所述网络舆情信息对应的扩散状态包括:
确定所述网络舆情信息所属目标类别;其中所述目标类别为从至少一个信息类别中确定的所述网络舆情所在的类别,所述至少一个信息类别基于至少一个网络舆情信息进行聚类获得;
如果所述目标类别所包含的网络舆情信息的数量大于预设数量阈值,确定所述网络舆情信息的扩散状态为易扩散状态;
如果所述目标类别所包含的网络舆情信息的数量小于或等于预设数量阈值,确定所述网络舆情信息的扩散状态为非易扩散状态。
6.根据权利要求1所述的方法,其特征在于,所述风险数据包括风险类型;所述提取网络舆情信息对应的风险数据包括:
提取所述网络舆情信息中包含风险关键词的风险句;
将所述网络舆情信息对应的所述风险句输入训练获得的类型预测模型,预测获得所述网络舆情信息对应的风险类型。
7.根据权利要求6所述的方法,其特征在于,所述类型预测模型通过以下方式训练获得:
确定至少一个类型训练样本以及每个类型训练样本对应的参考类型;其中,每个类型训练样本由一个网络信息中包含风险关键词的风险句构成;每个训练样本对应的参考类型为每个训练样本所属的真实风险类型;
构建类型预测模型;
利用所述至少一个类型训练样本,以及每个类型训练样本对应的参考类型,训练获得所述类型预测模型的模型参数。
8.根据权利要求1所述的方法,其特征在于,所述风险类型包括:假货类型、侵权类型、劣质类型、欺诈类型、投诉类型、违禁品类型、恶意评价类型、黄赌毒类型和/或数据安全类型。
9.根据权利要求1所述的方法,其特征在于,所述风险数据包括:风险实体;所述提取网络舆情信息对应的风险数据包括:
提取所述网络舆情信息中包含所述风险关键词的风险句;
将所述网络舆情信息的所述风险句输入训练获得的实体识别模型,获得所述网络舆情信息对应的风险实体。
10.根据权利要求9所述的方法,其特征在于,所述实体识别模型通过以下方式训练获得:
确定至少一个实体训练样本;其中,每个实体训练样本由一个网络信息中包含风险关键词的风险句构成;每个风险句中的至少一个词语被标注为正实体或者负实体;
构建实体识别模型;
基于每个风险句中的至少一个词语被标注为正实体或者负实体的正确识别结果,利用所述至少一个实体训练样本,训练获得所述实体识别模型的模型参数。
11.根据权利要求6所述的方法,其特征在于,所述风险数据包括风险类型以及风险触发词,所述提取网络舆情信息对应的风险数据还包括:
确定所述风险句中的第一关键词;
查找所述第一关键词中与所述网络舆情信息的风险类型相匹配的词语为风险触发词。
12.根据权利要求9所述的方法,其特征在于,所述风险数据包括风险实体以及风险载体,所述提取网络舆情信息对应的风险数据还包括:
确定所述网络舆情信息对应风险实体中的公司实体;
将所述公司实体输入训练获得的载体识别模型,识别所述网络舆情信息的风险载体。
13.根据权利要求12所述的方法,其特征在于,所述载体识别模型通过以下方式训练获得:
确定至少一个载体训练样本以及每个载体训练样本对应参考载体;其中,每个载体训练样本由一个网络信息对应风险实体中的公司实体构成;所述参考载体为所述网络信息的真实风险载体;
构建载体识别模型;
基于至少一个载体训练样本以及每个载体训练样本对应参考载体,训练获得所述载体识别模型的模型参数。
14.根据权利要求1~13任一项所述的方法,其特征在于,所述确定网络舆情信息包括:
查找包含风险关键词的网络舆情信息。
15.根据权利要求14所述的方法,其特征在于,所述风险关键词通过以下方式确...
【专利技术属性】
技术研发人员:吴保华,包双超,杨俊杰,顾斌,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛;KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。