基于BERT和DNN模型的交通社交媒体数据处理方法技术

技术编号：26730672 阅读：49 留言：0更新日期：2020-12-15 14:31

本发明专利技术涉及一种基于BERT和DNN模型的交通社交媒体数据处理方法，具体包括以下步骤：步骤S1：获取交通领域的社交媒体数据或与交通相关的社交媒体数据，并对交通领域的社交媒体数据或与交通相关的社交媒体数据进行数据预处理；步骤S2：调整BERT模型和DNN模型；步骤S3：通过调整后的BERT模型和DNN模型构建分析框架，根据分析框架对完成数据预处理的交通领域的社交媒体数据或与交通相关的社交媒体数据进行内容分析。与现有技术相比，本发明专利技术具有提高社交媒体数据分析的效率和准确度等优点。

全部详细技术资料下载

【技术实现步骤摘要】
基于BERT和DNN模型的交通社交媒体数据处理方法
本专利技术涉及交通数据分析领域，尤其是涉及一种基于BERT和DNN模型的交通社交媒体数据处理方法。
技术介绍
社交媒体数据作为目前主要的数据来源之一，提供了新角度的用户信息和新方向的分析视角。与传统的统计数据相比较，社交媒体数据为各个领域提供了用户主观的数据信息，同时社交媒体平台的特性使得所获取到的社交媒体数据可以涵盖极大的用户规模和范围，包含多种用户类型和社会关系，动态更新的社交媒体数据还具有很好的时效性，这些都是传统调查统计手段及其获取的数据所无法比拟的。社交媒体数据在交通领域的应用是较新的尝试，近年来，主要包括关于出行需求模型的研究、关于集计出行行为的研究、关于个人出行行为的研究、关于公共交通的评估研究、关于交通情况的研究以及关于自然灾害下交通系统的研究几个方面，在以上研究领域中，针对社交媒体数据的内容分析是研究社交媒体数据的基础技术。BERT是一种新语言表示模型，具有以下特点：一、具有Transformer机制，即双向编码器表示机制，与现有的...

【技术保护点】
1.一种基于BERT和DNN模型的交通社交媒体数据处理方法，其特征在于，具体包括以下步骤：/n步骤S1：获取交通领域的社交媒体数据或与交通相关的社交媒体数据，并对所述交通领域的社交媒体数据或与交通相关的社交媒体数据进行数据预处理；/n步骤S2：调整BERT模型和DNN模型；/n步骤S3：通过调整后的所述BERT模型和DNN模型构建分析框架，根据所述分析框架对完成数据预处理的交通领域的社交媒体数据或与交通相关的社交媒体数据进行内容分析。/n

【技术特征摘要】
1.一种基于BERT和DNN模型的交通社交媒体数据处理方法，其特征在于，具体包括以下步骤：
步骤S1：获取交通领域的社交媒体数据或与交通相关的社交媒体数据，并对所述交通领域的社交媒体数据或与交通相关的社交媒体数据进行数据预处理；
步骤S2：调整BERT模型和DNN模型；
步骤S3：通过调整后的所述BERT模型和DNN模型构建分析框架，根据所述分析框架对完成数据预处理的交通领域的社交媒体数据或与交通相关的社交媒体数据进行内容分析。

2.根据权利要求1所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法，其特征在于，所述交通领域的社交媒体数据或与交通相关的社交媒体数据具体为从社交媒体平台上获取的基于交通领域的交通社交媒体数据。

3.根据权利要求1所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法，其特征在于，所述数据预处理的操作包括删除无用字符、文本向量化、数据过滤和数据特征提取。

4.根据权利要求3所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法，其特征在于，所述数据过滤的公式具体如下：

其中，similarity为过滤后的交通领域的社交媒体数据或与交通相关的社交媒体数据，tar_vec为与交通领域相关的文本对应的向量，ori_vec为与要过滤的文本对应的向量。

5.根据权利要求3所述的一种基于BERT和DNN模型的交通社交媒体数据处理方法，其特征在于，所述数据特征提取的公式具体如下：

其中，Content_feature是数据特征，n是输入文本数据的字符数，word_veci是输入中的第i个特征字符对应的特征向量。

【专利技术属性】
技术研发人员：李健，李梓叶，
申请(专利权)人：同济大学，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人