【技术实现步骤摘要】
名人知识分析方法、装置、设备及存储介质
[0001]本专利技术涉及大数据
,提供一种名人知识分析方法、装置、设备及存储介质。
技术介绍
[0002]互联网的发展为知识工程提供了新的机遇,在一定程度上,是互联网的出现帮助突破了传统知识工程在知识获取方面的瓶颈。从1998年Tim Berners Lee提出语义网至今,涌现出大量以互联网资源为基础的新一代知识库,这类知识库的构建方法可以分为三类:互联网众包、专家协作和互联网挖掘。
[0003]互联网全面挖掘多渠道聚合的海量名人内容,面向融媒体运营构建知识库,致力于打造出名家人物库提供融媒体详尽的参考资料。目前,一些纸媒网站将珍贵声像、图片、文字资料进行数据库处理,建立特色“媒资库”,通过重新整合利用,实现将杂乱的名人信息有次序的组织在一起形成传播,不仅将可视化信息流顺畅地表达,还能保障信息层次的丰富性。
[0004]然而,现有的媒资库向用户推荐名人信息是通过人工编辑的方式,需要人工在媒资库中查询相关报道内容,向用户推荐名人,这种方法不但需要耗费大量人力成本, ...
【技术保护点】
【技术特征摘要】
1.一种名人知识分析方法,其特征在于,所述方法包括:基于预设的大数据平台,获取包括名人信息的数据内容;对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像;根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库。2.根据权利要求1所述的方法,其特征在于,所述对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像,包括:解析所述数据内容的文本信息,抽取内容关键字生成内容标签,根据所述内容标签,对名人信息进行分类处理;根据评论舆情及预设算法,对分类后的所述名人信息进行情感分析;根据预处理后的所述名人信息,得到名人信息关联的多维度指标,生成名人画像,其中,所述多维度指标包括基本信息、作品成果、关键词、影响力、相关报道、评论舆情、相关名人。3.根据权利要求1所述的方法,其特征在于,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:根据预先设置的关键词提取算法,提取名人信息的关键词,将所述关键词设置为名人信息展示页面的词云展示,从所述关键词中选取部分词,生成名人标签;根据所述关键词及所述名人标签,确定名人间的相似度,对所述相似度结果进行排序,得到与所述名人信息关联的名人进行展示,构建名人知识库。4.根据权利要求1所述的方法,其特征在于,所述名人信息的数据类型包括文字、图片、音视频,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:对所述文字进行字符解析,确定文字标签;将所述名人知识库中的图片处理为文字,提取文本标签并生成图片内容的多维标签,根据所述多维标签的向量处理,确定图片标签;对所述名人知识库中的音视频进行分类,识别所述音视频的图像语义信息,提取描述音视频内容的标签信息,确定音视频标签;将所述文字标签、图片标签及音视频标签存储在标签库。5.根据权利要求4所述的方法,其特征在于,所述根据预处...
【专利技术属性】
技术研发人员:赵显臣,罗贵旭,曹浩文,
申请(专利权)人:新奥特北京视频技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。