一种车型主数据匹配方法及系统技术方案

技术编号:40830486 阅读:23 留言:0更新日期:2024-04-01 14:53
本发明专利技术公开了一种车型主数据匹配方法及系统,属于智能汽车技术领域。所述方法包括:构建车型数据的语料库,并对语料库中的样本数据进行分词处理;对分词处理后的语料库中的部分样本数据进行噪声增强处理,生成正样本;根据生成的正样本对语料库进行样本扩增,构建训练集;构建车型匹配模型,通过所述训练集训练车型匹配模型;通过车型匹配模型进行不同业务模块的车型数据匹配。本发明专利技术通过语料库中的部分样本数据进行噪声增强处理,生成正样本,提高了正样本的抗干扰性,以此方式构建训练集并训练得到车型识别模型,并结合多级匹配算法,可以实现不同业务模块之间的车型数据准确、快速匹配。

【技术实现步骤摘要】

本专利技术属于智能汽车,具体涉及一种车型主数据匹配方法及系统


技术介绍

1、随着智能汽车技术和互联网技术的发展,汽车领域涌现了一大批互联网公司,除了传统的汽车销售、租赁、保险等基础服务,还提供车辆定位和导航、自动驾驶技术、车联网技术、车辆安全技术等技术服务以及汽车金融服务、车辆维护和保养、车联网服务等诸多服务功能。

2、由于汽车领域业务范围广泛,车型数据来源复杂,涉及多个业务模块,汽车车型是业务模块之间信息流的重要内容,而同一车型在不同模块间的不同名称造成了整个系统的割裂,对不同业务之间的信息推送造成了不利影响。例如对于同一款车型,不同业务模块之间的车型数据可能存在差异,甚至含有错误信息,影响了不同业务模块之间的信息对接。由于车型数据量庞大,而车型匹配较为复杂,不同模块之间的车型如使用人工进行匹配显然不现实,因此,对不同业务系统的车型名称进行智能、准确的匹配成为急需解决的问题。

3、现有的智能车型识别方法多采用机器学习等模型进行车型识别训练,然而在同一款车型的车型描述数据存在差异甚至含有错误信息时,车型识别的准确度难以保障,不利于本文档来自技高网...

【技术保护点】

1.一种车型主数据匹配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的车型主数据匹配方法,其特征在于,所述对分词处理后的语料库中的部分样本数据进行噪声增强处理,生成正样本具体包括:

3.根据权利要求2所述的车型主数据匹配方法,其特征在于,所述分别计算对不同类型的关键字进行处理的概率具体包括:

4.根据权利要求3所述的车型主数据匹配方法,其特征在于,所述替换、删除处理包括:

5.根据权利要求3所述的车型主数据匹配方法,其特征在于,所述打乱顺序处理具体包括:

6.根据权利要求2所述的车型主数据匹配方法,其特征在于,所述分别...

【技术特征摘要】

1.一种车型主数据匹配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的车型主数据匹配方法,其特征在于,所述对分词处理后的语料库中的部分样本数据进行噪声增强处理,生成正样本具体包括:

3.根据权利要求2所述的车型主数据匹配方法,其特征在于,所述分别计算对不同类型的关键字进行处理的概率具体包括:

4.根据权利要求3所述的车型主数据匹配方法,其特征在于,所述替换、删除处理包括:

5.根据权利要求3所述的车型主数据匹配方法,其特征在于,所述打乱顺序处理具体包括:

6.根据权利要求2所述的车型主数据匹配方法,其特征在于...

【专利技术属性】
技术研发人员:杨剑
申请(专利权)人:星云海数字科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1