【技术实现步骤摘要】
新闻舆情识别方法、设备及存储介质
本专利技术涉及互联网舆情识别领域,尤其是涉及一种新闻舆情识别方法、设备及存储介质。
技术介绍
舆情是指在一定的社会空间内,围绕中介性社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。现有的新闻舆情识别技术,是将新闻信息标题和文本拼接成一个文本,然后用关键词匹配的方式将这条新闻特征化,输入到深度学习基本模型中,结合文本的标签进行分类学习,学习出分类器参数,然后用来预测新文本的类别,判断是否属于舆情事件。现有的新闻舆情识别技术无法准确地区分舆情与非舆情新闻,且舆情识别的速度较慢,无法满足新闻舆情的时效性要求。
技术实现思路
本专利技术的目的是至少在一定程度上解决现有技术中存在的技术问题之一。为此,本专利技术提出一种新闻舆情识别方法,能够准确地区分舆情与非舆情新闻,并提升了新闻舆情识别的效果和效率。本专利技术还提出一种新闻舆情识别设备。本专利技术还提出一 ...
【技术保护点】
1.一种新闻舆情识别方法,其特征在于,包括:/n获取新闻报道;/n从所述新闻报道中提取多维度特征,所述多维度特征包括非结构化数据特征和结构化数据特征;/n建立新闻舆情文本语义理解模型;/n根据所述非结构化数据特征和所述新闻舆情文本语义理解模型,获取语义识别结果;/n对所述结构化数据特征进行时效检测,获取时效检测结果;/n对所述结构化数据特征进行影响力检测,获取影响力检测结果;/n根据所述语义识别结果、所述时效检测结果,及所述影响力检测结果,获取新闻舆情识别结果。/n
【技术特征摘要】
1.一种新闻舆情识别方法,其特征在于,包括:
获取新闻报道;
从所述新闻报道中提取多维度特征,所述多维度特征包括非结构化数据特征和结构化数据特征;
建立新闻舆情文本语义理解模型;
根据所述非结构化数据特征和所述新闻舆情文本语义理解模型,获取语义识别结果;
对所述结构化数据特征进行时效检测,获取时效检测结果;
对所述结构化数据特征进行影响力检测,获取影响力检测结果;
根据所述语义识别结果、所述时效检测结果,及所述影响力检测结果,获取新闻舆情识别结果。
2.根据权利要求1所述的一种新闻舆情识别方法,其特征在于,所述非结构化数据特征包括所述新闻报道的标题和正文,所述结构化数据特征包括所述新闻报道的时间特征和来源网站。
3.根据权利要求2所述的一种新闻舆情识别方法,其特征在于,所述根据所述非结构化数据特征和所述新闻舆情文本语义理解模型,获取语义识别结果,包括:
采用双向长短期记忆神经网络算法对所述标题进行处理,获取标题语义向量;
采用卷积神经网络算法对所述正文进行处理,获取正文语义向量;
对所述标题语义向量和所述正文语义向量进行权重学习,获取所述语义识别结果。
4.根据权利要求3所述的一种新闻舆情识别方法,其特征在于,所述采用双向长短期记忆神经网络算法对所述标题进行处理,获取标题语义向量,包括:
将所述标题中的文字转换成词向量;
采用双向长短期记忆神经网络算法提取所述标题的正向语义和反向语义;
对所述正向语义、所述反向语义和所述词向量进行向量拼接,得到上下文语义向量;
对所述上下文语义向量进行压缩,得到所述标题语义向量。
5.根据权利要求3或4所述的一种新闻舆情识别方法,其特征在于,所述采用卷积神经网络算法对所述正文进行处理,获取正文语义向量,包括:
将所述正文中的文字转换成词向量;
采用卷积神经网络算法对所述...
【专利技术属性】
技术研发人员:赖文波,陈志群,刘晓靓,陈锦冰,
申请(专利权)人:深圳中泓在线股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。