【技术实现步骤摘要】
一种数据处理方法及装置
本公开涉及互联网信息分析
,尤其涉及一种数据处理方法及装置。
技术介绍
现有的舆情分析系统面向政府、企业和个人,能够登录复杂网站对舆情数据进行准确的提取,根据获取到的舆情数据提供舆情情报分析、建议、图表及个性化的日报、月报、年报等服务,并且可以通过云架构和大数据处理实现对舆情的全方位实时监测。现有的舆情分析系统在对舆情数据进行处理后主要以图文和视频这种“平面化”方式呈现舆情数据,舆情数据的呈现方式单一。而随着5G时代的来临,通信速率的提升会给用户带来更大的信息流。不管是处理舆情数据,还是处理除舆情数据之外的其他数据,使用现有的呈现方式,都会使用户在消化信息流时花费更多的时间和精力。因此,如何创新数据的呈现方式,是一个有待解决的问题。
技术实现思路
有鉴于此,本公开提出了一种数据处理方法及装置,至少解决了以上提到的技术问题。根据本公开的第一方面,提供了一种数据处理方法,所述方法包括:获取用于描述用户的基本信息的属性标签;利用所述属性标签确定用于表征所述用 ...
【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n获取用于描述用户的基本信息的属性标签;/n利用所述属性标签确定用于表征所述用户的第一虚拟对象。/n
【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
获取用于描述用户的基本信息的属性标签;
利用所述属性标签确定用于表征所述用户的第一虚拟对象。
2.如权利要求1所述的方法,其特征在于,获取用于描述用户的基本信息的属性标签包括:
从所述用户输入的表单中获取所述基本信息作为属性标签,其中,所述表单包括按照键值对方式存储的所述基本信息。
3.如权利要求1所述的方法,其特征在于,利用所述属性标签确定表征所述用户的第一虚拟对象包括:
从预设的虚拟对象库中,确定与各个属性标签均对应的虚拟对象作为第一虚拟对象,其中,所述虚拟对象库包括按照与各自的属性标签对应存储的至少一个虚拟对象。
4.如权利要求1所述的方法,其特征在于,还包括:
获取用户针对应用程序执行操作而获取的用户操作数据。
5.如权利要求4所述的方法,其特征在于,所述用户操作数据包括所述用户的历史浏览信息以及所述用户在所述应用程序的文本框内输入的文本信息。
6.如权利要求4所述的方法,其特征在于,还包括:
从所述用户操作数据中获取用于描述用户的社会行为的行为标签。
7.如权利要求6所述的方法,其特征在于,从所述用户操作数据中获取用于描述用户的社会行为的行为标签包括:
利用预设的与行为相关的行为实体抽取方式,将从所述行为数据中提取出的行为实体作为所述行为标签。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:
确定与所述行为标签对应的第一子图像元素;
利用第一子图像元素对第一虚拟对象进行修正,生成第二虚拟对象。
9.如权利要求8所述的方法,其特征在于,第一子图像元素包括用于表征所述用户的穿衣方式和/或肢体呈现方式的图像元素。
10.如权利要求8所述的方法,其特征在于,所述方法还包括:
从所述用户操作数据中确定用于描述所述用户的主观情感的情感标签。
11.如权利要求10所述的方法,其特征在于,所述主观情感包括具有按照情感强度而划分的情感等级的正向情感、中立情感或负向情感。
12.如权利要求11所述的方法,其特征在于,从所述用户操作数据中确定用于描述所述用户的主观情感的情感标签包括:
利用预设的情感词典,获取所述用户操作数据中的情感分词;
将所述情感分词输入到情感机器学习模型组件,生成包括用户情感以及对应的情感等级的情感标签。
13.如权利要求12所述的方法,其特征在于,所述情感机器学习模型组件是利用训练库中的训练情感分词以及对应的训练情感标签进行训练完成的组件。
14.如权利要求10所述的方法,其特征在于,所述方法还包括:
确定与所述情感标签对应的第二子图像元素;
利用第二子图像元素对第二虚拟对象进行修正,生成第三虚拟对象。
15.如权利要求14所述的方法,其特征在于,第二子图像元素包括用于表征用户表情的图像元素。
16.如权利要求4所述的方法,其特征在于,所述方法还包括:
从所述用户操作数据提取出用于表征用户观点的文本分词;
对所述文本分词执行聚类处理,获取到聚类后的文本分词;
利用聚类后的文本分词生成所述用户的评论分句。
17.如权利要求16所述的方法,其特征在于,所述方法还包括:
相关联地呈现所述评论分句与第一虚拟对象。
18.如权利要求17所述的方法,其特征在于,所述方法还包括:
获取所述用户输入的询问信息;
生成所述询问信息的答复信息。
19.如权利要求18所述的方法,其特征在于,生成所述询问信息的答复信息包括:
将所述询问信息输入到训练完成的对话机器学习模型组件,获取所述答复信息。
20.一种数据处理装置,其特征在于,所述装置包括:
属性标签获取模块,用于获取用于描述用户的基本信息的属性标签;
第一虚拟对象确定模块,用于利用所述属性标签确定用于表征所述用户的第一虚拟对象。
21.根据权利要求20所述的装置,其特征在于,所述属性标签获取模块用于从所述用户输入的...
【专利技术属性】
技术研发人员:刘杉,张苗如,谭绮婷,杜明轩,夏睿,钱辰扬,
申请(专利权)人:中国传媒大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。