【技术实现步骤摘要】
一种基于NLP的流媒体内容分析方法及系统
[0001]本专利技术涉及信息处理
,具体是涉及一种基于NLP的流媒体内容分析方法及系统。
技术介绍
[0002]新品发布或者上市时,了解流媒体内容导向对于新品的战略布局调整至关重要,随着短视频的兴起,需要对流媒体视频的内容进行准确的分析,使得厂商能够及时知道新品的舆情,目前难以自动对大量的流媒体视频内容进行较为准确的舆情分析。因此,需要提供一种基于NLP的流媒体内容分析方法及系统,旨在解决上述问题。
技术实现思路
[0003]针对现有技术存在的不足,本专利技术的目的在于提供一种基于NLP的流媒体内容分析方法及系统,以解决上述
技术介绍
中存在的问题。
[0004]本专利技术是这样实现的,一种基于NLP的流媒体内容分析方法,所述方法包括以下步骤:接收用户输入的检索关键词,根据检索关键词确定相匹配的流媒体视频;根据热度值对流媒体视频进行筛选,对筛选后的流媒体视频进行处理,确定每个流媒体视频对应的文本信息;接收用户输入的功能关键词,将功能关键词和检索关键词归纳为 ...
【技术保护点】
【技术特征摘要】
1.一种基于NLP的流媒体内容分析方法,其特征在于,所述方法包括以下步骤:接收用户输入的检索关键词,根据检索关键词确定相匹配的流媒体视频;根据热度值对流媒体视频进行筛选,对筛选后的流媒体视频进行处理,确定每个流媒体视频对应的文本信息;接收用户输入的功能关键词,将功能关键词和检索关键词归纳为名词,基于NLP提取每个文本信息中的形容词和名词,为每个形容词绑定一个名词,确定所述文本信息的内容评价信息;对所有的内容评价信息进行分析整合得到流媒体评价信息,将流媒体评价信息中功能关键词的评价内容进行特殊标记。2.根据权利要求1所述的基于NLP的流媒体内容分析方法,其特征在于,所述对筛选后的流媒体视频进行处理,确定每个流媒体视频对应的文本信息的步骤,具体包括:判定筛选后的流媒体视频是否存在字幕信息;当存在字幕信息时,对流媒体视频中的字幕信息进行文字识别得到文本信息;当不存在字幕信息时,获取流媒体视频的音频信息,对所述音频信息进行语音转文字得到文本信息。3.根据权利要求1所述的基于NLP的流媒体内容分析方法,其特征在于,所述基于NLP提取每个文本信息中的形容词和名词的步骤,具体包括:确定文本信息对应的流媒体视频作者的影响度;当影响度小于或者等于设定影响值时,使用分词工具提取文本信息中的形容词和名词,并对提取的形容词和名词进行位置标记;当影响度大于设定影响值时,接收训练语料信息,基于CNN
‑
LSTM模型对训练语料信息进行特征学习得到专属神经网络模型,通过专属神经网络模型对文本信息进行处理得到形容词和名词,对得到的形容词和名词进行位置标记。4.根据权利要求3所述的基于NLP的流媒体内容分析方法,其特征在于,所述为每个形容词绑定一个名词,确定所述文本信息的内容评价信息的步骤,具体包括:根据位置标记为每个形容词绑定一个名词,确定每个形容词的词性,所述词性包括褒义词、贬义词以及中性词;根据名词对所有的形容词进行分类,得到若干个类别,每个类别所对应的名词是相同的;确定所述文本信息的文本评价值,文本评价值=a
×
褒义词的个数+b
×
贬义词的个数+c
×
中性词的个数,所述类别和文本评价值构成内容评价信息,a、b和c均为定值。5.根据权利要求4所述的基于NLP的流媒体内容分析方法,其特征在于,所述对所有的内容评价信息进行分析整合得到流媒体评价信息的步骤,具体包括:对所有内容评价信息中的类别进行整合,对相同名词对应的类别进行合并;调取每个文本评价值对应的流媒体视频作者的影响度;确定总体评价值,总体评价值=∑文本评价值
×
影响度,整合后的类别和总体评价值构成流媒体评价信息。6.一种基于NLP的流媒体内容分析系统,其特征在于,所述系统包括:流媒体视频确定模块,用于接收用户输入的检索...
【专利技术属性】
技术研发人员:潘春霞,姜凤龙,朱亚辉,
申请(专利权)人:苏州极易科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。