A method for measuring the amount of video title information includes the following steps: S1, dividing the video title text to be measured into one or more separate words; S2, counting the probability of each word appearing in all video title text, and selecting a reference text, counting the probability of each word appearing in the reference text. 3. Calculate the average information entropy of each word in all video title text, and calculate the average information entropy of each word in the reference text; 4. Weight the average information entropy of each word in all video title text and the average information entropy in the reference text, and take the result of the sum as the video title. The value of information. The invention also relates to the related computer readable storage medium and electronic equipment.
【技术实现步骤摘要】
视频标题信息量的度量方法、可读存储介质及电子设备
本专利技术涉及数据处理的
,更具体地,涉及一种视频标题信息量的度量方法以及相关的计算机可读存储介质和电子设备。
技术介绍
网站上视频的标题一般由用户在上传时填写,通过填写一些有意义的文字使得视频观看者能够通过标题快速的获取信息。标题的质量是视频质量的一部分,一个能够包含更多视频内容信息的标题可以吸引更多用户观看,因此对视频标题的信息量进行度量是非常重要的。目前,现有技术中并无对视频标题信息量进行度量的实现方案。
技术实现思路
针对上述问题,为了对视频标题信息量进行度量,作为本专利技术的一个方面,提出了一种视频标题信息量的度量方法,其中,该方法包括以下步骤:S1、将待度量的视频标题文本切分为一个或多个单独的词语;S2、统计各词语在所有视频标题文本中出现的概率,并选择一个参照文本,统计各词语在所述参照文本中出现的概率;S3、计算各词语在所有视频标题文本中的平均信息熵,并计算各词语在参照文本中的平均信息熵;以及S4、将各词语在所有视频标题文本中的平均信息熵与在参照文本中的平均信息熵加权求和,并将求和的结果作为视频标题的信息量的值。在一些实施例中,步骤S1还包括去除所述词语中的无意义词语的步骤。在一些实施例中,在步骤S2中,通过下式统计各词语在所有视频标题文本中出现的概率:其中,pi是视频标题中第i个词语在所有视频标题文本中出现的概率,Ni是视频标题中第i个词语在所有视频标题文本中出现的次数,N是所有视频标题文本中出现的词语的总出现次数;以及通过下式统计各词语在所有参照文本中出现的概率:其中,si是视频标题中第i ...
【技术保护点】
1.一种视频标题信息量的度量方法,包括以下步骤:S1、将待度量的视频标题文本切分为一个或多个单独的词语;S2、统计各词语在所有视频标题文本中出现的概率,并选择一个参照文本,统计各词语在所述参照文本中出现的概率;S3、计算各词语在所有视频标题文本中的平均信息熵,并计算各词语在参照文本中的平均信息熵;以及S4、将各词语在所有视频标题文本中的平均信息熵与在参照文本中的平均信息熵加权求和,并将求和的结果作为视频标题的信息量的值。
【技术特征摘要】
1.一种视频标题信息量的度量方法,包括以下步骤:S1、将待度量的视频标题文本切分为一个或多个单独的词语;S2、统计各词语在所有视频标题文本中出现的概率,并选择一个参照文本,统计各词语在所述参照文本中出现的概率;S3、计算各词语在所有视频标题文本中的平均信息熵,并计算各词语在参照文本中的平均信息熵;以及S4、将各词语在所有视频标题文本中的平均信息熵与在参照文本中的平均信息熵加权求和,并将求和的结果作为视频标题的信息量的值。2.根据权利要求1所述的方法,其中,步骤S1还包括去除所述词语中的无意义词语的步骤。3.根据权利要求1所述的方法,其中,在步骤S2中,通过下式统计各词语在所有视频标题文本中出现的概率:其中,pi是视频标题中第i个词语在所有视频标题文本中出现的概率,Ni是视频标题中第i个词语在所有视频标题文本中出现的次数,N是所有视频标题文本中出现的词语的总出现次数;以及通过下式统计各词语在所有参照文本中出现的概率:其中,si是视频标题中第i个词语在参照文本中出现的概率,Mi是视频标题中第i个词语在参照文本中出现的次数...
【专利技术属性】
技术研发人员:王璐,张文明,陈少杰,
申请(专利权)人:武汉斗鱼网络科技有限公司,
类型:发明
国别省市:湖北,42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。