基于本体的稿件自动审查方法技术

技术编号:11688708 阅读:126 留言:0更新日期:2015-07-07 22:14
本发明专利技术提供一种基于本体的稿件自动审查方法。包括有如下步骤:选择领域本体;稿件预处理获取构建词表;稿件个体模型自动构建,包括个体识别、数据属性与对象属性填充;自动审稿,包括数据属性匹配、对象属性匹配以及结果相应结果信息返回,返回信息作为审稿结果返回给用户。本发明专利技术方法利用知识本体技术构件个体,能够对个体稿件进行自动审核,并返回审稿结果,大幅度降低人员工作强度,提高出版效率。

【技术实现步骤摘要】

本专利技术涉及数字出版物
,尤其涉及到一种用于数字信息处理技术的。
技术介绍
知识处理是信息技术发展的必然趋势,随着对知识应用要求越来越高,传统的知识数据库系统已经不能满足新的需求,所以将本体引用到知识工程中,将本体相关原理技术运用到知识库的开发中。本体知识系统是20世纪70年代后期,专家系统、知识系统和知识密集型的信息系统的构建技术发展而形成知识工程,所建立的系统简称为知识系统(knowledge-basedsystems)。知识系统是人工智能学科最重要的工业化和商业化产物。知识系统用于辅助人们进行问题求解,如检测信用卡诈骗、加速船舶设计、辅助医疗诊断、使科学软件更加智能化、向全体决策人员提供金融服务、产品质量的评价和广告宣传、支持电子网络的服务恢复。随着知识系统的发展与流行,知识服务也成为了信息技术发展的必然趋势,基于本体的知识工程应用开始受人瞩目,在数字出版行业的知识服务是知识工程新的应用领域,目前人们还在依靠人工方式进行稿件审核,还没有一种自动化的基于领域本体的审稿技术。
技术实现思路
本专利技术所要解决的技术问题是正对上述存在的技术不足,提供一种利用知识本体技术构件个体,能够对个体稿件进行自动审核,并返回审稿结果,大幅度降低人员工作强度,提高出版效率的。本专利技术解决其技术问题所采用的技术方案是: ,其特征在于,包括有如下步骤: 选择领域本体:根据稿件所属领域选择相应的领域本体模型,该模型是在其他领域模型系统中已经构建好的、包含类、对象属性、数据属性和规则信息的本体模型,而且相应的个体模型已经搭建好。稿件预处理获取构建词表:在计算机系统中对稿件进行拆分处理,并对其中的文本信息使用分词工具进行分词且过滤掉没有用的虚词、助词等停用词后得到一个构建词表,该词表用于构建与稿件对应的个体模型,词表保存有相应的位置信息。稿件个体模型自动构建:稿件个体模型自动构建包括个体识别、数据属性与对象属性填充,具体实现分为以下几个步骤: 个体识别:以根据所选领域模型类信息为参照标准类,在计算机系统中采用相应的分类算法或工具对构建词表分类,计算其与参照标准类词语的相似度,根据相似度阀值标识出构建词表中的个体。为个体填充数据属性、对象属性:将对应参照标准类下的个体名称和数据属性名称、对象属性名称在构建词表中进行匹配;使用相似度计算的方式匹配,匹配范围是在与构建词表中个体附近的词语进行匹配;当匹配程度达到一个阈值时,将对应的文本数据标填充到数据属性和对象属性,并标识出该文本为相应属性。自动审稿:自动审稿包括数据属性匹配、对象属性匹配结果以及相应结果信息返回,返回信息作为审稿结果返回给用户,具体实现如下: 数据属性匹配:根据所选领域本体模型中与构建词表匹配成功的个体的数据属性与识别出的个体数据属性进行匹配,匹配度达到一定阀值则匹配成功,否则匹配失败返回个体信息数组(匹配类型即数据属性匹配、个体信息即被参照个体与稿件个体信息、源信息即被参照数据属性源信息与稿件数据属性源信息)。对象属性匹配:根据所选领域本体模型中与构建词表匹配成功的个体的对象属性与识别出的个体对象属性进行匹配,匹配度达到一定阀值则匹配成功,否则匹配失败返回个体信息数组(匹配类型即对象属性匹配、个体信息即被参照个体与稿件个体信息、源信息即被参照对象属性源信息与稿件数据属性源信息)。匹配方法:根据所选领域本体模型中与词库匹配成功个体属性为匹配标准,采用相似度计算方法或者工具计算对应属性之间的相似度,当相似度达到一定阀值则匹配成功,低于阀值则匹配失败。返回信息处理:根据返回信息数组对逻辑有误的地方标红,且将信息编号返回给用户查看。本专利技术的原理是根据稿件所属领域选择相应的领域本体模型,以该模型为被参照本体模型;将作者的稿件进行一系列预处理获得用于构建杆件个体模型的词库;通过个体识别、数据属性与对象属性填充构建稿件个体模型;然后通过对被参照模型与稿件个体模型的属性匹配完成自动审稿并返回审稿结果信息。本专利技术的有益效果是: 本专利技术方法利用知识本体技术构件个体,能够对个体稿件进行自动审核,并返回审稿结果,大幅度降低人员工作强度,提高了出版效率。【附图说明】图1是本专利技术实施例的流程图。【具体实施方式】下面结合【具体实施方式】,对本专利技术作进一步的说明: 如图1所示的,包括有如下步骤: 步骤(I)被参照本体的选择:根据稿件所属领域选择相应的领域本体模型,该模型是在其他领域模型系统中已经构建好的、包含类、对象属性、数据属性和规则信息的本体模型,而且相应的个体模型已经搭建好。步骤(2)稿件预处理获取构建词表:对稿件进行拆分处理,并对其中的文本信息使用分词工具进行分词且过滤掉没有用的虚词、助词等停用词得到一个构建词表,该词表用于构建与稿件对应的个体模型,词表保存有相应的位置信息。步骤(3)稿件个体模型自动构建:稿件个体模型自动构建包括个体识别、数据属性与对象属性填充,具体实现分为以下几当前第1页1 2 本文档来自技高网...

【技术保护点】
基于本体的稿件自动审查方法,其特征在于,包括有如下步骤:选择领域本体:根据稿件所属领域选择相应的领域本体模型,该模型是在其他领域模型系统中已经构建好的、包含类、对象属性、数据属性和规则信息的本体模型,而且相应的个体模型已经搭建好;稿件预处理获取构建词表:在计算机系统中对稿件进行拆分处理,并对其中的文本信息使用分词工具进行分词且过滤掉没有用的虚词、助词等停用词后得到一个构建词表,该词表用于构建与稿件对应的个体模型,词表保存有相应的位置信息;稿件个体模型自动构建:稿件个体模型自动构建包括个体识别、数据属性与对象属性填充,其中个体识别为以根据所选领域模型类信息为参照标准类,在计算机系统中采用相应的分类算法或工具对构建词表分类,计算其与参照标准类词语的相似度,根据相似度阀值标识出构建词表中的个体;为个体填充数据属性和对象属性是将对应参照标准类下的个体名称和数据属性名称、对象属性名称在构建词表中进行匹配,匹配成功后该词填充为对应稿件个体的相应属性值;自动审稿:自动审稿包括数据属性匹配、对象属性匹配结果以及相应结果信息返回,返回信息作为审稿结果返回给用户。

【技术特征摘要】

【专利技术属性】
技术研发人员:刘永坚白立华杨朝阳杨慧曾瑞李文忠
申请(专利权)人:武汉理工大学时代出版传媒股份有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1