名人知识分析方法、装置、设备及存储介质制造方法及图纸

技术编号:37994429 阅读:20 留言:0更新日期:2023-06-30 10:08
本发明专利技术实施例提供了一种名人知识分析方法、装置、设备及存储介质,所述方法包括:基于预设的大数据平台,获取包括名人信息的数据内容,对名人信息进行数据预处理,得到名人信息的多维度指标,生成名人画像,根据预处理后的名人信息及名人画像,提取数据标签,构建名人知识库。本发明专利技术利用大数据分析技术,全面挖掘多渠道聚合的海量名人内容,经过数据内容处理、分析后,实现名人信息内容的结构化、知识化,构建大容量、多维度、自学习、可交互的名人知识库,形成自动的名家数据服务,满足面向融媒体运营辅助选题、辅助写稿、辅助发布的需求。辅助发布的需求。辅助发布的需求。

【技术实现步骤摘要】
名人知识分析方法、装置、设备及存储介质


[0001]本专利技术涉及大数据
,提供一种名人知识分析方法、装置、设备及存储介质。

技术介绍

[0002]互联网的发展为知识工程提供了新的机遇,在一定程度上,是互联网的出现帮助突破了传统知识工程在知识获取方面的瓶颈。从1998年Tim Berners Lee提出语义网至今,涌现出大量以互联网资源为基础的新一代知识库,这类知识库的构建方法可以分为三类:互联网众包、专家协作和互联网挖掘。
[0003]互联网全面挖掘多渠道聚合的海量名人内容,面向融媒体运营构建知识库,致力于打造出名家人物库提供融媒体详尽的参考资料。目前,一些纸媒网站将珍贵声像、图片、文字资料进行数据库处理,建立特色“媒资库”,通过重新整合利用,实现将杂乱的名人信息有次序的组织在一起形成传播,不仅将可视化信息流顺畅地表达,还能保障信息层次的丰富性。
[0004]然而,现有的媒资库向用户推荐名人信息是通过人工编辑的方式,需要人工在媒资库中查询相关报道内容,向用户推荐名人,这种方法不但需要耗费大量人力成本,效率低下,而且数据会重复采集、利用程度低。因此,如何提供一种应用于融媒体的名人知识库系统,自动提供数据分析服务是本领域技术人员亟需解决的问题。

技术实现思路

[0005]本专利技术实施例提供一种名人知识分析方法、装置、设备及存储介质,以实现构造名人知识库,形成自动的名家数据服务。
[0006]第一方面,本专利技术实施例公开了一种名人知识分析方法方法,所述方法包括:
[0007]基于预设的大数据平台,获取包括名人信息的数据内容;
[0008]对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像;
[0009]根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库。
[0010]可选的,所述对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像,包括:
[0011]解析所述相关数据内容的文本信息,抽取内容关键字生成内容标签,根据所述内容标签,对名人信息进行分类处理;
[0012]根据评论舆情及预设算法,对分类后的所述名人信息进行情感分析;
[0013]根据预处理后的所述名人信息,得到名人信息关联的多维度指标,生成名人画像,其中,所述多维度指标包括基本信息、作品成果、关键词、影响力、相关报道、评论舆情、相关名人。
[0014]可选的,根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识
库,包括:
[0015]根据预先设置的关键词提取算法,提取名人信息的关键词,将所述关键词设置为名人信息展示页面的词云展示,从所述关键词中选取部分词,生成名人标签;
[0016]根据所述关键词及所述名人标签,确定名人间的相似度,对所述相似度结果进行排序,得到与所述名人信息关联的名人进行展示,构建名人知识库。
[0017]可选的,所述名人信息的数据类型包括文字、图片、音视频,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:
[0018]对所述文字进行字符解析,确定文字标签;
[0019]将所述名人知识库中的图片处理为文字,提取文本标签并生成图片内容的多维标签,根据所述多维标签的向量处理,确定图片标签;
[0020]对所述名人知识库中的音视频进行分类,识别所述音视频的图像语义信息,提取描述音视频内容的标签信息,确定音视频标签;
[0021]将所述文字标签、图片标签及音视频标签存储在标签库。
[0022]可选的,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:
[0023]根据所述名人画像,对所述文字标签、图片标签及音视频标签进行分类,提取名人的标志特征,生成描述名人的特征标签;
[0024]更新所述标签库中的名人的特征标签,将更新的名人的特征标签在名人信息展示页面词云展示。
[0025]可选的,所述基于预设的大数据平台,获取包括名人信息的数据内容,包括:
[0026]过滤包括名人信息的数据内容中的重复内容及无效信息,其中,所述无效信息是与所述名人信息无关的数据内容;
[0027]根据敏感词和标签库,筛选数据内容的文字、图片和音视频,将敏感内容置于待审查区域中,供运维人员二次处理。
[0028]可选的,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库之后,还包括:
[0029]提供人工维护界面,供运维人员对待审查区域中的名人信息进行信息确认与信息补录;
[0030]响应于名人信息展示页面的检索操作,显示名人分析内容,包括:基本信息、作品成果、关键词、影响力、相关报道、评论舆情、相关名人。
[0031]第二方面,本专利技术实施例还公开了一种名人知识分析装置,所述装置包括:
[0032]第一获取模块,用于基于预设的大数据平台,获取包括名人信息的数据内容;
[0033]数据处理模块,用于对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像;
[0034]构建知识库模块,用于根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库。
[0035]在本专利技术实施的第三方面,还提供了一种电子设备,包括:收发机、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;
[0036]所述处理器,用于读取存储器中的程序实现执行上述第一方面任一所述的名人知
识分析方法;
[0037]在本专利技术实施的第四方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面任一所述的名人知识分析方法。
[0038]本专利技术实施例包括以下优点:
[0039]本专利技术提供的名人知识分析方法,基于预设的大数据平台,获取包括名人信息的数据内容,对名人信息进行数据预处理,得到名人信息的多维度指标,生成名人画像,根据预处理后的名人信息及名人画像,提取数据标签,构建名人知识库。本专利技术利用大数据分析技术,全面挖掘多渠道聚合的海量名人内容,经过数据内容处理、分析后,实现名人信息内容的结构化、知识化,构建大容量、多维度、自学习、可交互的名人知识库。通过大数据平台名人信息的收集、清洗,能够自动进行名人数据沉淀、标签标注、热度趋势计算、相关名人计算等分析。同时根据数据的分析、挖掘,形成自动的名家数据服务,满足面向融媒体运营辅助选题、辅助写稿、辅助发布的需求。
附图说明
[0040]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0041]图1是本专利技术实施例提供的名人知识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种名人知识分析方法,其特征在于,所述方法包括:基于预设的大数据平台,获取包括名人信息的数据内容;对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像;根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库。2.根据权利要求1所述的方法,其特征在于,所述对所述名人信息进行数据预处理,得到所述名人信息的多维度指标,生成名人画像,包括:解析所述数据内容的文本信息,抽取内容关键字生成内容标签,根据所述内容标签,对名人信息进行分类处理;根据评论舆情及预设算法,对分类后的所述名人信息进行情感分析;根据预处理后的所述名人信息,得到名人信息关联的多维度指标,生成名人画像,其中,所述多维度指标包括基本信息、作品成果、关键词、影响力、相关报道、评论舆情、相关名人。3.根据权利要求1所述的方法,其特征在于,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:根据预先设置的关键词提取算法,提取名人信息的关键词,将所述关键词设置为名人信息展示页面的词云展示,从所述关键词中选取部分词,生成名人标签;根据所述关键词及所述名人标签,确定名人间的相似度,对所述相似度结果进行排序,得到与所述名人信息关联的名人进行展示,构建名人知识库。4.根据权利要求1所述的方法,其特征在于,所述名人信息的数据类型包括文字、图片、音视频,所述根据预处理后的名人信息及所述名人画像,提取数据标签,构建名人知识库,包括:对所述文字进行字符解析,确定文字标签;将所述名人知识库中的图片处理为文字,提取文本标签并生成图片内容的多维标签,根据所述多维标签的向量处理,确定图片标签;对所述名人知识库中的音视频进行分类,识别所述音视频的图像语义信息,提取描述音视频内容的标签信息,确定音视频标签;将所述文字标签、图片标签及音视频标签存储在标签库。5.根据权利要求4所述的方法,其特征在于,所述根据预处...

【专利技术属性】
技术研发人员:赵显臣罗贵旭曹浩文
申请(专利权)人:新奥特北京视频技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1