【技术实现步骤摘要】
字幕敏感信息自动屏蔽转译方法和装置
[0001]本申请涉及计算机
,尤其涉及一种字幕敏感信息自动屏蔽转译方法和装置。
技术介绍
[0002]现阶段电视机用户看到的影视视频内容可涵盖不同类型、不同国家、不同语言,影视业务内容投放也具备大量的节目资源对于运营工作来讲具有不小的工作体量。用户在浏览不同国家、不同地区的语种节目需要借助对应字幕、台词来辅助理解影视节目所表达的意图。但字幕信息中会处在敏感词等问题,影响用户观影体验。
[0003]现有技术中,一般为后期人工编辑校准,根据演员剧本等具备台词的电影、电视剧进行字幕编辑,这些传统方式对人工依赖较大,工作量大,处理速度不足。
技术实现思路
[0004]本申请针对目前敏感字幕筛选编辑中,存在的对人工依赖性高、人工工作量大,处理速度慢的问题,提供一种字幕敏感信息自动屏蔽转译方法和装置,实现对字幕敏感信息的自动屏蔽转译,从而解放人力,提高处理速度。
[0005]本申请的上述目的是通过以下技术方案来实现的:
[0006]第一方面,本申请实施例 ...
【技术保护点】
【技术特征摘要】
1.一种字幕敏感信息自动屏蔽转译方法,其特征在于,包括:获取字幕源文件;对所述字幕源文件进行解析,得到字幕解析结果;基于预设语义识别算法和所述字幕解析结果对字幕中的各台词进行关联度计算,判断字幕中词语的词义和字幕中语句的句义;基于所述词义和语义通过预设敏感语义词识别算法对字幕中词语和语句进行敏感度判断,确定敏感信息;将敏感信息用近义词代替,生成脱敏字幕。2.根据权利要求1所述的字幕敏感信息自动屏蔽转译方法,其特征在于,所述对所述字幕源文件进行解析包括对字幕文件属性进行解析;其中,所述字幕文件属性包括文件格式、台词时间点和文件大小。3.根据权利要求1所述的字幕敏感信息自动屏蔽转译方法,其特征在于,所述基于预设语义识别算法和所述字幕解析结果对字幕中的各台词进行关联度计算,判断字幕中词语的词义和字幕中语句的句义包括:通过预设语义识别算法对字幕台词进行关联度计算;根据高关联度的多个台词确定语境;将连贯度高的语句在该语境下判断句义;将连贯度高的词语在该语境下判断词义。4.根据权利要求1所述的字幕敏感信息自动屏蔽转译方法,其特征在于,所述基于所述词义和语义通过预设敏感词语识别算法对字幕中词语和语句进行敏感度判断,确定敏感信息包括:基于所述词义通过预设敏感语义识别算法对字幕中词语进行敏感度判断,确定敏感词语;基于所述句义通过预设敏感语义识别算法对字幕中语句进行敏感度判断,确定敏感语...
【专利技术属性】
技术研发人员:杨雨薇,
申请(专利权)人:广州欢网科技有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。