一种基于神经网络和网络舆情的汽车品质监控方法及装置制造方法及图纸

技术编号:37973398 阅读:22 留言:0更新日期:2023-06-30 09:48
本申请涉及一种基于神经网络和网络舆情的汽车品质监控方法及装置。所述方法包括:以网络爬虫的形式爬取目标网站的汽车舆情信息,并对汽车舆情信息进行文本预处理,得到目标舆情信息;通过目标多标签分类模型和基于神经网络的目标分词模型对目标舆情信息进行处理,得到携带有舆情标签的舆情文本;基于监控指标体系和携带有舆情标签的舆情文本,输出汽车品质监控结果。本申请通过网络爬虫的形式批量获取汽车舆情信息;采用目标多标签分类模型和基于神经网络的目标分词模型处理目标舆情信息,并基于监控指标体系对处理结果进行比较,以此及时准确的反馈与汽车品质相关信息的同时,实现对汽车品质不良案件的多维度预警,降低了汽车品质管理的成本。品质管理的成本。品质管理的成本。

【技术实现步骤摘要】
一种基于神经网络和网络舆情的汽车品质监控方法及装置


[0001]本申请涉及计算数据处理
,特别是涉及一种基于神经网络和网络舆情的汽车品质监控方法及装置。

技术介绍

[0002]随着汽车品质监控技术的发展,汽车企业获取与汽车品质相关的信息的途径逐渐被拓宽;目前,与汽车品质相关的信息的获取渠道主要包括售后维修渠道、互联网渠道、客服电话和质检总局投诉信息。
[0003]然而,针对与汽车品质相关的信息进行监控的情况下,传统的汽车品质监控方式存在无法及时准确的反馈与汽车品质相关的信息。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够及时准确的反馈与汽车品质相关的信息的基于神经网络和网络舆情的汽车品质监控方法及装置。
[0005]第一方面,本申请提供了一种基于神经网络和网络舆情的汽车品质监控方法。方法包括:
[0006]以网络爬虫的形式爬取目标网站的汽车舆情信息;其中,汽车舆情信息包括目标网站中与汽车品质相关的网页文本内容;
[0007]对汽车舆情信息进行文本预处理,得到目标舆情本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络和网络舆情的汽车品质监控方法,其特征在于,所述方法包括:以网络爬虫的形式爬取目标网站的汽车舆情信息;其中,所述汽车舆情信息包括所述目标网站中与汽车品质相关的网页文本内容;对所述汽车舆情信息进行文本预处理,得到目标舆情信息;采用基于神经网络的目标分词模型对所述目标舆情信息执行分词操作,得到舆情文本;采用目标多标签分类模型对所述舆情文本执行分类操作,得到携带有舆情标签的所述舆情文本;其中,所述舆情标签包括用于表征舆情类型的投诉标签、问题类型标签和故障类型标签;基于监控指标体系处理所述携带有舆情标签的所述舆情文本,获取当前监控指标值;所述监控指标体系为根据多维度监控指标之间的关联关系构建得到;所述监控指标体系包含与所述多维度监控指标相对应的指标阈值;所述多维度监控指标包括舆情热度、舆情生长度和舆情覆盖度;比较所述当前监控指标值和所述指标阈值,输出汽车品质监控结果。2.根据权利要求1所述的方法,其特征在于,所述网页文本内容包括新闻信息和评论信息;所述以网络爬虫的形式爬取目标网站的汽车舆情信息的步骤,包括:通过分别对比各源网站的舆情指数和质量舆情占比,确认所述目标网站;其中,所述舆情指数用于表征所述源网站中与汽车品质相关的投诉信息的关注热度和所述关注热度的变化趋势;所述质量舆情占比为在预设时间段内候选的源网站中所述投诉信息的数量,与所述预设时间段内和所述候选的源网站同类型的源网站中所述投诉信息的数量之和的比值;使用Scrapy爬虫框架爬取所述目标网站的所述新闻信息和所述评论信息;其中,所述新闻信息包括所述网页文本内容的发布时间、发布站点、发布用户信息、新闻标题、新闻内容、点击量、转发量和评论数;所述评论信息包括回帖时间、回帖用户信息和回帖内容。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:对第一数量的售后维修信息和所述第一数量的所述目标舆情信息分别进行标注,获取第一舆情数据集;分别对第二数量的所述售后维修信息和所述第二数量的所述目标舆情信息进行标注,获取第二舆情数据集;其中,所述第一数量大于所述第二数量;采用加入CNN层的BiLSTM

CRF模型作为候选分词模型;确定出用于训练所述候选分词模型的各目标训练数据集;其中,所述目标训练数据集包括所述第一舆情数据集,以及通用数据集中的一种数据集或任意组合的数据集;所述通用数据集包括CoNLL数据集、icwb2

data数据集、人民日报数据集和中文字向量;通过各所述目标训练数据集分别对所述候选分词模型进行训练,得到各完成训练的候选分词模型;基于各所述完成训练的候选分词模型对所述第二舆情数据集进行分词,得到分词结果;根据评价指标和所述分词结果对各所述完成训练的候选分词模型进行性能评估,得到模型性能评估结果;依照所述模型性能评估结果,确定出当前最佳候选分词模型,并将所述当前最佳候选
分词模型作为所述目标分词模型。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:对所述目标舆情信息进行标注,获取舆情数据集;在所述舆情数据集中选取目标数量的数据作为训练数据集,将所述舆情数据集中除所述训练数据集外的剩余数据作为测试数据集;通过所述训练数据集对各候选多标签分类模型分别进行训练,得到各完成训练的候选多标签分...

【专利技术属性】
技术研发人员:许树淮黄蓝菁曾志彬李菁
申请(专利权)人:东风本田发动机有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1