一种车型主数据匹配方法及系统技术方案

技术编号：40830486 阅读：23 留言：0更新日期：2024-04-01 14:53

本发明专利技术公开了一种车型主数据匹配方法及系统，属于智能汽车技术领域。所述方法包括：构建车型数据的语料库，并对语料库中的样本数据进行分词处理；对分词处理后的语料库中的部分样本数据进行噪声增强处理，生成正样本；根据生成的正样本对语料库进行样本扩增，构建训练集；构建车型匹配模型，通过所述训练集训练车型匹配模型；通过车型匹配模型进行不同业务模块的车型数据匹配。本发明专利技术通过语料库中的部分样本数据进行噪声增强处理，生成正样本，提高了正样本的抗干扰性，以此方式构建训练集并训练得到车型识别模型，并结合多级匹配算法，可以实现不同业务模块之间的车型数据准确、快速匹配。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于智能汽车，具体涉及一种车型主数据匹配方法及系统。

技术介绍

1、随着智能汽车技术和互联网技术的发展，汽车领域涌现了一大批互联网公司，除了传统的汽车销售、租赁、保险等基础服务，还提供车辆定位和导航、自动驾驶技术、车联网技术、车辆安全技术等技术服务以及汽车金融服务、车辆维护和保养、车联网服务等诸多服务功能。

2、由于汽车领域业务范围广泛，车型数据来源复杂，涉及多个业务模块，汽车车型是业务模块之间信息流的重要内容，而同一车型在不同模块间的不同名称造成了整个系统的割裂，对不同业务之间的信息推送造成了不利影响。例如对于同一款车型，不同业务模块之间的车型数据可能存在差异，甚至含有错误信息，影响了不同业务模块之间的信息对接。由于车型数据量庞大，而车型匹配较为复杂，不同模块之间的车型如使用人工进行匹配显然不现实，因此，对不同业务系统的车型名称进行智能、准确的匹配成为急需解决的问题。

3、现有的智能车型识别方法多采用机器学习等模型进行车型识别训练，然而在同一款车型的车型描述数据存在差异甚至含有错误信息时，车型识别的准...

【技术保护点】

1.一种车型主数据匹配方法，其特征在于，所述方法包括：

2.根据权利要求1所述的车型主数据匹配方法，其特征在于，所述对分词处理后的语料库中的部分样本数据进行噪声增强处理，生成正样本具体包括：

3.根据权利要求2所述的车型主数据匹配方法，其特征在于，所述分别计算对不同类型的关键字进行处理的概率具体包括：

4.根据权利要求3所述的车型主数据匹配方法，其特征在于，所述替换、删除处理包括：

5.根据权利要求3所述的车型主数据匹配方法，其特征在于，所述打乱顺序处理具体包括：

6.根据权利要求2所述的车型主数据匹配方法，其特征在于，所述分别...

【技术特征摘要】

1.一种车型主数据匹配方法，其特征在于，所述方法包括：

2.根据权利要求1所述的车型主数据匹配方法，其特征在于，所述对分词处理后的语料库中的部分样本数据进行噪声增强处理，生成正样本具体包括：

3.根据权利要求2所述的车型主数据匹配方法，其特征在于，所述分别计算对不同类型的关键字进行处理的概率具体包括：

4.根据权利要求3所述的车型主数据匹配方法，其特征在于，所述替换、删除处理包括：

5.根据权利要求3所述的车型主数据匹配方法，其特征在于，所述打乱顺序处理具体包括：

6.根据权利要求2所述的车型主数据匹配方法，其特征在于...

【专利技术属性】
技术研发人员：杨剑，
申请(专利权)人：星云海数字科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人