【技术实现步骤摘要】
一种基于多种自然语言处理技术的无人驾驶新闻分析方法
[0001]本专利技术属于新闻分析
,尤其涉及一种基于多种自然语言处理技术的无人驾驶新闻分析方法。
技术介绍
[0002]在计算机技术和大数据技术的推动下,越来越多的研究者开始从媒体新闻、公司报道等方面提取出文本情绪信息,相关研究仍然处于快速发展之中。与之相应的,计算机科学领域中的大数据和人工智能技术的快速发展也使得海量的信息挖掘和分析更加自动化、智能化,特别是自然语言处理领域中以机器学习、深度学习算法为代表的文本挖掘技术的日渐成熟,为上市公司和市场投资者提供了更有效及时的新闻媒体信息,但现有的方法效率和准确性有待提高。
[0003]目前,无人驾驶技术成为汽车产业发展新变量。鲜有针对无人驾驶相关新闻进行文本分析的研究,因此如何通过对无人驾驶新闻进行挖掘分析和文本处理以实现对无人驾驶技术提供重要数据支持,以帮助改善或提高相关政策文件制定,且如何使投资者针对新闻情绪做出理性决策,进而及时调整投资策略成为当下研究重点。
[0004]因此,有必要提供一种新的基 ...
【技术保护点】
【技术特征摘要】
1.一种基于多种自然语言处理技术的无人驾驶新闻分析方法,其特征在于,包括以下步骤:S1:采集与无人驾驶相关的新闻文档数据;S2:对所述新闻文档数据进行预处理,得到处理后新闻文档数据;S3:构建主题提取模型,通过所述主题提取模型对所述处理后新闻文档数据进行主题提取和困惑度值计算,得到多个新闻主题数据和困惑度值,基于所述困惑度值大小选择出最优的若干个新闻主题数据;S4:构建情绪值计算模型,将所述新闻文档数据输入所述情绪值计算模型中进行训练,得到训练后情绪值计算模型;S5:将所述处理后新闻文档数据输入所述训练后情绪值计算模型,得到每条所述处理后新闻文档数据的情绪值;S6:基于最优的若干个新闻主题数据和每条所述处理后新闻文档数据的情绪值制作出每个不同的所述新闻主题数据下情绪值的视觉图表,实现了新闻分析的目的。2.根据权利要求1所述的一种基于多种自然语言处理技术的无人驾驶新闻分析方法,其特征在于:所述步骤S1中采集与无人驾驶相关的新闻文档数据的具体内容如下:通过网络爬虫技术,从互联网中爬取含有与无人驾驶相关的关键词的新闻文档数据,所述关键词包括无人驾驶、自动驾驶和智能驾驶。3.根据权利要求1所述的一种基于多种自然语言处理技术的无人驾驶新闻分析方法,其特征在于:所述步骤S2中对所述新闻文档数据进行预处理,得到处理后新闻文档数据,具体内容如下:对所述新闻文档数据进行数据清洗,包括去除重复、无关的新闻文档数据并对其中进行停用词去除和分词处理。4.根据权利要求1所述的一种基于多种自然语言处理技术的无人驾驶新闻分析方法,其特征在于:所述步骤S3中构建主题提取模型,通过所述主题提取模型对所述处理后新闻文档数据进行主题提取和困惑度值计算,得到多个...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。