【技术实现步骤摘要】
数据处理方法、装置和系统
[0001]本申请涉及多媒体领域,具体而言,涉及一种数据处理方法、装置和系统。
技术介绍
[0002]在当下信息爆炸的新媒体时代,大量的视频内容被持续产出和分发,视频内容信息量也朝着碎片化的趋势发展,其表达方式同样愈发多样化,例如短视频行业。但是,在各种社交媒体的广泛传播下,用户获得信息的方式往往是被动和碎片化的,使得大部分获取的内容都较为单薄。
[0003]针对上述的问题,目前尚未提出有效的解决方案。
技术实现思路
[0004]本申请实施例提供了一种数据处理方法、装置和系统,以至少解决相关技术中用户从互联网上获取数据的方式往往是被动和碎片化的,导致用户获得的数据较为单薄的技术问题。
[0005]根据本申请实施例的一个方面,提供了一种数据处理方法,包括:接收第一数据,其中,第一数据包括:第一实体;对第一数据进行语义识别,得到第一数据的第一结构化数据,其中,第一结构化数据为结构化处理后的第一实体信息;利用知识图谱对第一结构化数据进行预测,得到第一结构化数据对应的知识信息,其中,知识图谱用于表征不同实体之间的关联关系;基于第一结构化数据将知识信息嵌入至第一数据中,生成第二数据;输出第二数据。
[0006]根据本申请实施例的另一方面,还提供了一种数据处理方法,包括:获取第一数据,其中,第一数据包括:第一实体;对第一数据进行语义识别,得到第一数据的第一结构化数据,其中,第一结构化数据为结构化处理后的第一实体信息;利用知识图谱对第一结构化数据进行预测,得到第一结 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,包括:接收第一数据,其中,所述第一数据包括:第一实体;对所述第一数据进行语义识别,得到所述第一数据的第一结构化数据,其中,所述第一结构化数据为结构化处理后的第一实体信息;利用知识图谱对所述第一结构化数据进行预测,得到所述第一结构化数据对应的知识信息,其中,所述知识图谱用于表征不同实体之间的关联关系;基于所述第一结构化数据将所述知识信息嵌入至所述第一数据中,生成第二数据;输出所述第二数据。2.根据权利要求1所述的方法,其中,对所述第一数据进行语义识别,得到所述第一数据的第一结构化数据,包括:获取所述第一数据的第一多模态信息,其中,所述第一多模态信息包括如下两种类型的信息:图像、音频和文本;对所述第一多模态信息进行语义识别,得到所述第一实体信息;对所述第一实体信息进行结构化处理,得到所述第一结构化数据。3.根据权利要求1所述的方法,其中,利用知识图谱对所述第一结构化数据进行预测,得到所述第一结构化数据对应的知识信息,包括:利用图卷积网络对所述知识图谱进行特征提取,得到所述知识图谱的特征向量;基于所述特征向量对所述第一结构化数据进行链接预测,得到所述知识信息。4.根据权利要求3所述的方法,其中,所述方法还包括:获取文本数据和视频数据,其中,所述视频数据包括:第二实体;对所述文本数据进行结构化处理,得到所述文本数据对应的第二结构化数据,其中,所述第二结构化数据为结构化处理后的三元组信息,所述三元组信息包括:实体、实体属性和实体关系;对所述视频数据进行语义识别,得到所述视频数据对应的第三结构化数据,其中,所述第三结构化数据为结构化处理后的第二实体信息;基于所述第二结构化数据和所述第三结构化数据,构建所述知识图谱。5.根据权利要求4所述的方法,其中,对所述文本数据进行结构化处理,得到所述文本数据对应的第二结构化数据,包括:对所述文本数据进行分词处理,得到所述文本数据对应的词序列;对所述词序列进行语义识别,确定所述文本数据包含的实体信息;对所述词序列进行关系抽取,确定所述实体信息之间的关系信息;基于所述实体信息和所述实体信息之间的关系信息,建立所述第二结构化数据。6.根据权利要求4所述的方法,其中,对所述视频数据进行语义识别,得到所述视频数据对应的第三结构化数据,包括:获取所述视频数据的第二多模态信息,其中,所述第二多模态信息包括:图像信息、音频信息和文本信息;对所述第二多模态信息进行语义识别,得到所述第二实体信息;对所述第二实体信息进行结构化处理,得到所述第三结构化数据。7.根据权利要求1至6中任意一项所述的方法,其中,基于所述第一结构化数据将所述
知识信息嵌入至所述第一数据中,生成第二数据,包括:确定第一结构化数据在所述第一数据中的目标位置,其中,所述目标位置包括:时间位置和空间位置;获取所述知识信息对应的输出效果;基于所述输出效果将所述知识信息叠加在所述目标位置上,得到所述第二数据。8.一种数据处理方法,包括:获取第一数据,其中,所述第一数据包括:第一实体;对所述第一数据进行语义识别,得到所述第一数据的第一结构化数据,其中,所述第一结构化数据为结构化处理后的第一实体信息;利用知识图谱对所述第一结构化数据进行预测,得到所述第一结构化数据对应的知识信息,其中,所述知识图谱用于表征不同实体之间的关联关系;基于所述第一结构化数据将所述知识信息嵌入至所述第一数据中,生成第二数据。9.根据权利要求8所述的方法,其中,对所述第一数据进行语义识别,得到所述第一数据的第一结构化数据,包括:获取所述第一数据的第一多模态信息,其中,所述第一多模态信息包括如下两种类型的信息:图像、音频和文本;对所述第一多模态信息进行语义识别,得到所述第一实体信息;对所述第一实体信息进行结构化处理,得到所述第一结构化数据。10.根据权利要求8所述的方法,其中,利用知识图谱对所述第一结构化数据进行预测,得到所述第一结构化数据对应的知识信息,包括:利用图卷积网络对所述知识图谱进行特征提取,得到所述知识图谱的特征向量;基于所述特征向量对所述第一结构化数据进行链接预测,得到所述知识信息。11.一种数据处理方法,包括:通过调用第一接口获取第一数据,其中,所述第一接口包含第一参数,所述第一参数的参数值为所述第一数据,所述第一数据包括:第一实体;对所述第一数据进行语义识别,得到所述第一数据的第一结构化数据,其中,所述第一结构化数据为结构化处理后的第一实体信息;利用知识图谱对所述第一结构化数据进行预测,得到所述第一结构化数据对应的知识信息,其中,所述知识图谱用于表征不同实体之间的关联关系;基于所述第一结构化数据将所述知识信息嵌入至所述第一数据中,生成第二数据;通过调用...
【专利技术属性】
技术研发人员:江泽胤子,毛超杰,唐铭谦,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。