【技术实现步骤摘要】
一种共享图书系统中图书内容审核的方法
本专利技术属于共享图书
,尤其涉及一种共享图书系统中图书内容自动审核的方法,进一步涉及一种通过训练图书内容审核模型和提取共享图书中的特征词来进行内容审核的方法。
技术介绍
随着国民阅读率逐年提升,图书作为知识与信息的载体,具有被共享的需求和客观条件。共享图书系统不仅为人们提供了一种快捷获取图书资源的渠道,而且实现了对于闲置图书资源的再利用。对于共享图书平台来说,对共享图书的内容进行审核尤为重要。内容审核机制可以防止共享图书系统成为低俗信息流通的渠道,对于提高共享图书系统的可用性来说十分重要。但目前现存的大多数共享图书系统中都缺少对于图书内容审核的机制,少数具备图书审核模块的共享图书系统也仅限于通过人工审核的方式对共享图书内容进行检查。而人工审核图书内容的方式效率较低且出错率高,无法较好的满足图书内容审核的需求。
技术实现思路
本专利技术要解决的技术问题是,提供一种共享图书系统中图书内容审核的方法,使得用户共享的图书内容可以被自动审核;本专利技术通过训练图书内容审核模型和提取图书内容文本特征来实现此方法。本方法首先训练图书内容 ...
【技术保护点】
1.一种共享图书系统中图书内容审核的方法,其特征在于,包括以下步骤:步骤1、训练图书内容审核模型,在训练过程中基于N元模型对特征词进行扩展并计算每个特征词的权;步骤2、解析用户共享图书中的文字内容,提取图书文字内容中的特征词并进行扩展;步骤3、根据训练好的图书内容审核模型和从用户共享图书中提取到的特征词以及训练好的逻辑回归模型判断图书内容是否通过审核,实现共享图书系统中对于图书内容的自动审核。
【技术特征摘要】
1.一种共享图书系统中图书内容审核的方法,其特征在于,包括以下步骤:步骤1、训练图书内容审核模型,在训练过程中基于N元模型对特征词进行扩展并计算每个特征词的权;步骤2、解析用户共享图书中的文字内容,提取图书文字内容中的特征词并进行扩展;步骤3、根据训练好的图书内容审核模型和从用户共享图书中提取到的特征词以及训练好的逻辑回归模型判断图书内容是否通过审核,实现共享图书系统中对于图书内容的自动审核。2.一种共享图书系统中图书内容审核的方法,其特征在于,包括以下步骤:步骤1:制作正负数据集,使用数据集训练图书内容审核模型;步骤2:提取用户共享图书中的文字内容;步骤3:从步骤2得到的文字内容中提取特征词并进行扩展;步骤4:将步骤3得到的特征词放入步骤1所得模型得到审核结果。3.如权利要求2所述共享图书系统中图书内容审核的方法,其特征在于,步骤1具体为:步骤1.1:将包含敏感信息的文本内容归类为负数据集,将不包含敏感信息的文本内容归类为正...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。