【技术实现步骤摘要】
本专利技术涉及数据挖掘、数据分析和知识推理领域,设计并实现了一种对资源内容进行多维度、语义化、结构化的标注方法。
技术介绍
近年来,随着经济社会的高速发展,资源的数量迅速增加,而资源标注发展相对缓慢,资源的检索问题日益突出。研究资源标注方法可以有效的解决资源的管理和检索问题, 提高资源的使用率,满足了资源在效率、使用和管理上的要求,这将对我国现阶段智能标注的研究和发展、对资源的合理高效利用起到积极的推动作用。目前,资源标注方法有很多,主要可以分为基于资源属性标注的方法、基于资源内容的特征标注方法、基于资源内容的标签标注方法和基于资源特定领域的本体的语义标注方法。基于资源属性标注的方法主要通过为资源的属性特征标注相应的值的方式实现。 这种方式简单易用,可对资源的重要属性信息进行较好的描述,可作为资源检索的基础数据,但是属性信息仅为资源所含信息的小部分,缺少对资源内容语义信息的描述;属性项需在系统设计时确定,不易修改,扩展性较差;非规范化的简单文字匹配造成的语义歧义性难以避免。基于资源内容的特征标注方法主要是提取资源的通用特征或领域相关特征来标注资源。这种方式一般用 ...
【技术保护点】
一种基于语义标签库的多维度内容标注方法,其特征在于,包括以下步骤:1.1建立语义标签库;语义标签库由规范标签库、扩展标签库、临时标签库、标签关联库和标签数据分析构成,其中扩展标签库包含规范标签库的内容;1.2配置可扩展的资源种类;1.3建立多级、可配置的内容标注维度;将资源按照内容特征划分维度,建立多层次的内容维度;1.4建立可配置、可修改的资源种类与内容标注维度的对应关系;1.5进行基于语义标签库的资源内容标注;标注资源时,直接从规范标签库中选取规范标签进行标注,也可以输入标引词,系统自动对标引词在扩展标签库中进行匹配:如果匹配成功,则在规范标签库中获取规范标签及其标注码 ...
【技术特征摘要】
【专利技术属性】
技术研发人员:吕锐,张鹏洲,张弛,林波,王民,温宇俊,龚隽鹏,宋卿,刘伟,陈国伟,
申请(专利权)人:新华通讯社,中国传媒大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。