一种文字标签方法及文字标签装置制造方法及图纸

技术编号:18138485 阅读:71 留言:0更新日期:2018-06-06 11:51
本发明专利技术公开了一种文字标签方法,包括:获取待分析的媒体资源,确定所述媒体资源的媒体类型;根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签;通过所述文字标签对所述媒体资源进行标识。本发明专利技术还公开了一种文字标签装置。

【技术实现步骤摘要】
一种文字标签方法及文字标签装置
本专利技术涉及通信领域,尤其涉及一种文字标签方法及文字标签装置。
技术介绍
随着多媒体、互联网等技术日渐成熟,教育类资源所包含的消息内容从最初的文本逐渐扩展至语音、图片、视频等富媒体形式。在诸如淘宝、微信等应用中,非文本消息所占的比重也越来越大。其中信息内容的关键信息在用户的使用过程中具有非常重要的作用,目前常见的一些提取技术如下:数据挖掘、视频特征提取和音视频自动标注等。但是,数据挖掘无法实现自动分类及分析;视频特征提取没有针对整个视频主题提取;音视频只针对音频部分内容转换。因此,亟需一种进行文字标签的技术方案,能自动对非文本内容的媒体资源打文字标签,进行自动标注。
技术实现思路
有鉴于此,本专利技术实施例希望提供一种文字标签方法及文字标签装置,能自动对非文本内容的媒体资源打文字标签,进行自动标注。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供了一种文字标签方法,所述方法包括:获取待分析的媒体资源,确定所述媒体资源的媒体类型;根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签;通过所述文字标签对所述媒体资源进行标识。上述方案中,当所述媒体资源的媒体类型为图片时,所述根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签包括:获取所述媒体资源的图片内容;根据预设的内容库确定所述图片内容对应的主题,将所述主题确定为所述媒体资源的文字标签。上述方案中,当所述的媒体资源的媒体类型为音频时,所述根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签包括:以第一周期为周期对所述媒体资源进行提取处理,提取第一时间长度的音频文件得到切分音频文件,分别获取各切分音频文件的音频内容;分别根据各切分音频文件的音频内容确定各切分音频文件对应的主题;从各切分音频文件对应的主题中选择频率超过第一阈值的主题作为所述媒体资源的文字标签。上述方案中,当所述媒体资源的媒体类型为视频时,所述根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签包括:以第二周期为周期对所述媒体资源进行提取处理,得到视频数据帧和第二时间长度的提取音频文件,分别获取各视频数据帧的帧内容,并分别获取各提取音频文件的音频内容;分别根据各视频数据帧的帧内容确定各视频数据帧的帧主题;分别根据所述各提取音频文件的音频内容确定各提取音频文件的音频主题;从各视频数据帧的帧主题和所述各提取音频文件的音频主题中选择频率超过第二阈值的主题作为所述媒体资源的文字标签。上述方案中,所述方法还包括:当接收到检索词时,查找与所述检索词匹配的文字标签;获取与所述检索词匹配的文字标签对应的检索结果;其中,所述检索结果包括具有文字标签的媒体资源和具有文字标签的文本资源,获取所述检索结果的获取位置包括第一检索位置和第二检索位置,所述第一检索位置包括以下至少之一:检索历史、收藏历史和推荐资源,所述第二检索位置为存储检索资源的数据库。上述方案中,所述方法还包括:根据获取所述检索结果的获取位置显示所述检索结果。本专利技术实施例还提供了一种文字标签装置,所述装置包括:类型分析单元、标签确定单元和标识单元;其中,所述类型分析单元,用于获取待分析的媒体资源,确定所述媒体资源的媒体类型;所述标签确定单元,用于根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签;所述标识单元,用于通过所述文字标签对所述媒体资源进行标识。上述方案中,当所述媒体资源的媒体类型为图片时,所述标签确定单元具体用于:获取所述媒体资源的图片内容;根据预设的内容库确定所述图片内容对应的主题,将所述主题确定为所述媒体资源的文字标签。上述方案中,当所述的媒体资源的媒体类型为音频时,所述标签确定单元具体用于:以第一周期为周期对所述媒体资源进行提取处理,提取第一时间长度的音频文件得到切分音频文件,分别获取各切分音频文件的音频内容;分别根据各切分音频文件的音频内容确定各切分音频文件对应的主题;从各切分音频文件对应的主题中选择频率超过第一阈值的主题作为所述媒体资源的文字标签。上述方案中,当所述媒体资源的媒体类型为视频时,所述标签确定单元具体用于:以第二周期为周期对所述媒体资源进行提取处理,得到视频数据帧和第二时间长度的提取音频文件,分别获取各视频数据帧的帧内容,并分别获取各提取音频文件的音频内容;分别根据各视频数据帧的帧内容确定各视频数据帧的帧主题;分别根据所述各提取音频文件的音频内容确定各提取音频文件的音频主题;从各视频数据帧的帧主题和所述各提取音频文件的音频主题中选择频率超过第二阈值的主题作为所述媒体资源的文字标签。上述方案中,所述装置还包括:检索单元,用于:当接收到检索词时,查找与所述检索词匹配的文字标签;获取与所述检索词匹配的文字标签对应的检索结果;其中,所述检索结果包括具有文字标签的媒体资源和具有文字标签的文本资源,获取所述检索结果的获取位置包括第一检索位置和第二检索位置,所述第一检索位置包括以下至少之一:检索历史、收藏历史和推荐资源,所述第二检索位置为存储检索资源的数据库。上述方案中,所述装置还包括:显示单元,用于根据获取所述检索结果的获取位置显示所述检索结果。本专利技术实施例的文字标签方法及文字标签装置,获取待分析的媒体资源,确定所述媒体资源的媒体类型;根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签;通过所述文字标签对所述媒体资源进行标识。如此,根据非文本的媒体资源的媒体类型来对媒体资源进行主题分析,确定媒体资源的主题,并进一步的确定媒体资源的文字标签,实现对非文本内容的自动标注。附图说明图1为本专利技术实施例一提供的文字标签方法的流程示意图;图2为本专利技术实施例二提供的实现文字标签方法的系统的结构示意图;图3为本专利技术实施例四提供的一种文字标签装置的结构示意图;图4为本专利技术实施例四提供的另一种文字标签装置的结构示意图。具体实施方式下面结合附图对技术方案的实施作进一步的详细描述。实施例一本专利技术实施例一提供一种文字标签方法,如图1所示,所述方法包括:S101、获取待分析的媒体资源,确定所述媒体资源的媒体类型;可通过显示界面向用户提供一输入接口,当用户通过该输入接收输入媒体资源的信息时,则可确定该媒体资源为需要进行文字标签的待分析的媒体资源。当接收到输入的待分析的媒体资源时,获取待分析的媒体资源,判断该媒体资源的媒体类型,其中,媒体类型包括图片、音频、视频等类型。具体的判断媒体资源的媒体类型的具体实现,可通过媒体资源的携带的信息等方式进行判断,本专利技术实施例对此不进行任何限定。这里,通过该输入接口,可使得用户输入各种不同类型的媒体资源。需要说明的是,通过该输入接口也可接收用户的输入操作输入的文本资源。S102、根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资本文档来自技高网...
一种文字标签方法及文字标签装置

【技术保护点】
一种文字标签方法,其特征在于,所述方法包括:获取待分析的媒体资源,确定所述媒体资源的媒体类型;根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签;通过所述文字标签对所述媒体资源进行标识。

【技术特征摘要】
1.一种文字标签方法,其特征在于,所述方法包括:获取待分析的媒体资源,确定所述媒体资源的媒体类型;根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签;通过所述文字标签对所述媒体资源进行标识。2.根据权利要求1所述的方法,其特征在于,当所述媒体资源的媒体类型为图片时,所述根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签包括:获取所述媒体资源的图片内容;根据预设的内容库确定所述图片内容对应的主题,将所述主题确定为所述媒体资源的文字标签。3.根据权利要求1所述的方法,其特征在于,当所述的媒体资源的媒体类型为音频时,所述根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签包括:以第一周期为周期对所述媒体资源进行提取处理,提取第一时间长度的音频文件得到切分音频文件,分别获取各切分音频文件的音频内容;分别根据各切分音频文件的音频内容确定各切分音频文件对应的主题;从各切分音频文件对应的主题中选择频率超过第一阈值的主题作为所述媒体资源的文字标签。4.根据权利要求1所述的方法,其特征在于,当所述媒体资源的媒体类型为视频时,所述根据所述媒体类型获取所述媒体资源的资源内容,根据所述媒体类型对所述媒体资源的资源内容进行主题分析确定所述媒体资源对应的文字标签包括:以第二周期为周期对所述媒体资源进行提取处理,得到视频数据帧和第二时间长度的提取音频文件,分别获取各视频数据帧的帧内容,并分别获取各提取音频文件的音频内容;分别根据各视频数据帧的帧内容确定各视频数据帧的帧主题;分别根据所述各提取音频文件的音频内容确定各提取音频文件的音频主题;从各视频数据帧的帧主题和所述各提取音频文件的音频主题中选择频率超过第二阈值的主题作为所述媒体资源的文字标签。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:当接收到检索词时,查找与所述检索词匹配的文字标签;获取与所述检索词匹配的文字标签对应的检索结果;其中,所述检索结果包括具有文字标签的媒体资源和具有文字标签的文本资源,获取所述检索结果的获取位置包括第一检索位置和第二检索位置,所述第一检索位置包括以下至少之一:检索历史、收藏历史和推荐资源,所述第二检索位置为存储检索资源的数据库。6.根据权利...

【专利技术属性】
技术研发人员:魏冰李小文李阳熊正国杨帅孔令军张璐白义
申请(专利权)人:中国移动通信集团公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1