直播平台信息审核方法、系统及存储介质技术方案

技术编号:25407201 阅读:14 留言:0更新日期:2020-08-25 23:10
本发明专利技术公开了一种直播平台信息审核方法、系统及存储介质,该审核方法包括如下步骤:S1:截取主播用户在直播客户端输出的语音文本和文字文本;S2:将S1所得语音文本转化为转化文本,所述转化文本为文字格式;S3:对转化文本和文字文本进行敏感词匹配、获取敏感词数值;S4:将S3所得敏感词数值进行筛选,生成审核数值;S5:将S4所得审核数值形成预审文本、输出至管理员客户端。本发明专利技术能够大幅减少管理员在直播平台上的工作量,减少管理员误操作、杜绝直播平台上出现发布不良信息的情况。

【技术实现步骤摘要】
直播平台信息审核方法、系统及存储介质
本专利技术属于互联网直播
,具体来说涉及一种直播平台信息审核方法,以及用于实现该方法的直播平台信息审核系统及存储介质。
技术介绍
网络直播是一种新兴的网络社交方式。主播利用摄像头等工具在直播平台上进行视频直播。而随着互联网直播的不断普及。很多嗅觉敏锐的商户开始利用直播平台进行线上的产品推广来配合线下一对一的买卖。入驻平台的用户为了更好的宣传销售自己的商品,往往会在平台上发布大量的商品信息,平台日均发布的商品信息数量越来越多。为了避免不法用户借此机会试图发布一些违反国家规定的不良信息(例如涉黄、毒、赌、暴力恐怖等的商品信息),平台需要对主播在直播过程中发布得信息进行一定审核。现有得网络直播一般采用委任管理员结合群众监督举报得方式进行实现。这种监督方式造成管理员得工作量较大且容易产生疏漏,不适合处理直播间数量较多的直播平台。因此,如何开发出一种新型的直播平台信息审核方法,以克服上述问题,是本领域技术人员需要研究的方向。
技术实现思路
本专利技术的目的是提供一种直播平台信息审核方法,能够大幅减少管理员在直播平台上的工作量,杜绝直播平台上出现发布不良信息的情况。其采用的技术方案如下:一种直播平台信息审核方法,其包括如下步骤:S1:截取主播用户在直播客户端输出的语音文本和文字文本;S2:将S1所得语音文本转化为转化文本,所述转化文本为文字格式;S3:对转化文本和文字文本进行敏感词匹配、获取敏感词数值;S4:将S3所得敏感词数值进行筛选,生成审核数值;S5:将S4所得审核数值形成预审文本、输出至管理员客户端。优选的是,上述直播平台信息审核方法中,步骤S2包括:S21:检测S1所得语音文本得语言类型;S22:获取与所述语言类型匹配得语音标准模型,并基于该语音标准模型对所述语音文本进行处理,生成标准语音文本;S23:获取与所述语言类型匹配得语音转化文本模型,并基于该语音转化模型对所述标准化语音信息进行处理,转化为转化文本。更优选的是,上述直播平台信息审核方法中,步骤S3包括:S31:将转化文本与预存的敏感词列表进行匹配、取得转化文本中出现的敏感词数;S32:将文字文本与预存的敏感词列表进行匹配、取得文字文本中出现的敏感词数;S33:将S31所得敏感词数与S32所得敏感词数进行累加、该累加值即为敏感词数值。进一步优选的是,上述直播平台信息审核方法中,步骤S4包括:S41:将敏感词数值与预存的敏感词阈值进行比较、若敏感词数值大于敏感阈值,跳转至S42;S42:暂存敏感词数值、并以该敏感词数值为审核数值。为实现上述直播平台信息审核方法,本专利技术还公开了一种直播平台信息审核系统。其包括:获取模块,检测模块,标准模块,转化模块,比对模块,筛选模块,通知模块,举报模块和管理员客户端;所述获取模块用于截取直播客户端输出的语音文本和文字文本;所述检测模块用于检测所述语音文本的语言类型;所述标准模块用于获取匹配于语言类型的语音标准模型,并基于该语音标准模型将语音文本转化为标准语音文本;所述转化模块用于获取匹配于语言类型得语音转化模型,并基于该语音转化模型将标准语音文本转化为文字格式的转化文本;所述比对模块中预存有敏感词列表、用于对转化文本和文字文本进行敏感词匹配、获取敏感词数值;所述筛选模块中预存有敏感词阈值、用于筛选出高于敏感词阈值的敏感词数值作为审核数值;所述通知模块用于将审核数值生成预审文本输出至管理员客户端;所述举报模块用于接受举报信息并将该举报信息转发至管理员客户端;所述管理员客户端用于实现管理员的登录访问。为实现上述直播平台信息审核方法,本专利技术还公开了一种计算机可读存储介质,所述计算机可读存储介质中存有计算机程序,其特征在于:所述计算机程序在被执行时实现上项所述直播平台信息审核方法。通过采用上述技术方案:根据直播平台的特殊播放模式,分别针对语音文本与文字文本进行过滤。具体来说:通过将语音文本转化为文本格式、与文字文本一起进行基于敏感词过滤的文本检测,高效过滤色情、广告、摄政、暴恐等垃圾文字及敏感词。同时,配合用户通过举报模块对管理员反馈后,管理员综合预审文本进行抉择管理,复查是否有违规现象、并在查实后对其进行相应的关闭直播间、禁言甚至封号处理。与现有技术相比,本专利技术能够大幅减少管理员在直播平台上的工作量,杜绝直播平台上出现发布不良信息的情况。附图说明上面结合附图与具体实施方式对本专利技术作进一步详细的说明:图1为本专利技术实施例1的流程示意图;图2为本专利技术实施例1的结构示意图;各附图标记与部件名称对应关系如上:1、获取模块;2、检测模块;3、标准模块;4、转化模块;5、比对模块;6、筛选模块;7、通知模块;8、举报模块;9、管理员客户端。具体实施方式为了更清楚地说明本专利技术的技术方案,上面将结合各个实施例作进一步描述。、如图1-2所示:一种直播平台信息审核系统,其包括:获取模块1,检测模块2,标准模块3,转化模块4,比对模块5,筛选模块6,通知模块7,举报模块8和管理员客户端9。其中,所述获取模块1用于截取直播客户端输出的语音文本和文字文本;所述检测模块2用于检测所述语音文本的语言类型;所述标准模块3用于获取匹配于语言类型的语音标准模型,并基于该语音标准模型将语音文本转化为标准语音文本;所述转化模块4用于获取匹配于语言类型得语音转化模型,并基于该语音转化模型将标准语音文本转化为文字格式的转化文本;所述比对模块5中预存有敏感词列表、用于对转化文本和文字文本进行敏感词匹配、获取敏感词数值;所述筛选模块6中预存有敏感词阈值、用于筛选出高于敏感词阈值的敏感词数值作为审核数值;所述通知模块7用于将审核数值生成预审文本输出至管理员客户端9;所述举报模块8用于接受举报信息并将该举报信息转发至管理员客户端9。实践中,其工作过程如下:S1:截取主播用户在直播客户端输出的语音文本和文字文本;S2:将S1所得语音文本转化为转化文本,所述转化文本为文字格式:S21:检测S1所得语音文本得语言类型;S22:获取与所述语言类型匹配得语音标准模型,并基于该语音标准模型对所述语音文本进行处理,生成标准语音文本;S23:获取与所述语言类型匹配得语音转化文本模型,并基于该语音转化模型对所述标准化语音信息进行处理,转化为转化文本;S3:对转化文本和文字文本进行敏感词匹配、获取敏感词数值:S31:将转化文本与预存的敏感词列表进行匹配、取得转化文本中出现的敏感词数;S32:将文字文本与预存的敏感词列表进行匹配、取得文字文本中出现的敏感词数;S33:将S31所得敏感词数与S32所得敏感词数进行累加、该累加值即为敏感词数值。S4:将S3所得敏感词数值进行筛选,生成审核数值:S41:将敏感词数值与预存的敏感词阈值进行比较、若敏感词数值大于敏感阈值,跳转至S42;S42:暂存敏感词数值、并以该敏感词数本文档来自技高网...

【技术保护点】
1.一种直播平台信息审核方法,其特征在于,包括如下步骤:/nS1:截取主播用户在直播客户端输出的语音文本和文字文本;/nS2:将S1所得语音文本转化为转化文本,所述转化文本为文字格式;/nS3:对转化文本和文字文本进行敏感词匹配、获取敏感词数值;/nS4:将S3所得敏感词数值进行筛选,生成审核数值;/nS5:将S4所得审核数值形成预审文本、输出至管理员客户端。/n

【技术特征摘要】
1.一种直播平台信息审核方法,其特征在于,包括如下步骤:
S1:截取主播用户在直播客户端输出的语音文本和文字文本;
S2:将S1所得语音文本转化为转化文本,所述转化文本为文字格式;
S3:对转化文本和文字文本进行敏感词匹配、获取敏感词数值;
S4:将S3所得敏感词数值进行筛选,生成审核数值;
S5:将S4所得审核数值形成预审文本、输出至管理员客户端。


2.如权利要求1所述直播平台信息审核方法,其特征在于,步骤S2包括:
S21:检测S1所得语音文本得语言类型;
S22:获取与所述语言类型匹配得语音标准模型,并基于该语音标准模型对所述语音文本进行处理,生成标准语音文本;
S23:获取与所述语言类型匹配得语音转化文本模型,并基于该语音转化模型对所述标准化语音信息进行处理,转化为转化文本。


3.如权利要求2所述直播平台信息审核方法,其特征在于,步骤S3包括:
S31:将转化文本与预存的敏感词列表进行匹配、取得转化文本中出现的敏感词数;
S32:将文字文本与预存的敏感词列表进行匹配、取得文字文本中出现的敏感词数;
S33:将S31所得敏感词数与S32所得敏感词数进行累加、该累加值即为敏感词数值。


4.如权利要求2所述直播平台信息审核方法,其特征在于,步骤S4包括:
S...

【专利技术属性】
技术研发人员:宁思乔刘德友
申请(专利权)人:全息空间深圳智能科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1