一种制造商名称识别方法、装置、电子设备及可读介质制造方法及图纸

技术编号:30767385 阅读:24 留言:0更新日期:2021-11-10 12:29
本申请公开了一种制造商名称识别方法、装置、电子设备及可读介质。方法包括:从物料清单文件中获取与电子元件的制造商对应的元件文本;对元件文本进行预处理,得到电子元件的元件文本;对元件文本进行分词,得到至少一个关键词;以及根据每个关键词确定电子元件的标准制造商名称。本申请提供的方案能够更精确地识别BOM文件中的制造商名称。别BOM文件中的制造商名称。别BOM文件中的制造商名称。

【技术实现步骤摘要】
一种制造商名称识别方法、装置、电子设备及可读介质


[0001]本申请涉及识别
,具体涉及一种制造商名称识别方法、装置、电子设备及可读介质。

技术介绍

[0002]随着互联网技术的发展,越来越多的厂家开始通过互联网上的元器件采购平台来进行元器件的采购。通常厂家在进行采购时,根据自己需要的元器件的信息生成物料清单(Bill of Material,BOM)文件,将BOM文件导入元器件采购平台进行识别,从而得到所需要的元器件的购买详情。
[0003]然而,现有的元器件采购平台在通过BOM文件中元器件的制造商进行识别的时候,只有在BOM文件中的制造商名称完全无误的时候才能搜索到,若厂家在生成BOM文件前输入制造商名称时出现了格式错误或者字符错误,则无法成功进行识别,影响元器件的采购。

技术实现思路

[0004]为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种制造商名称识别方法、装置、电子设备及可读介质,能够更精确地识别BOM文件中的制造商名称。
[0005]根据本申请的一个方面,提供了一种制造商名称识别本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种制造商名称识别方法,其特征在于,包括:从物料清单文件中获取与电子元件对应的元件文本;对所述元件文本进行预处理;对预处理后的所述元件文本进行分词,得到至少一个关键词;以及根据每个所述关键词确定所述电子元件的标准制造商名称。2.根据权利要求1所述的制造商名称识别方法,其特征在于,所述对所述元件文本进行预处理包括:对所述元件文本进行编码转换;和/或根据预设的允许字符库,将所述元件文本中的非允许字符进行替换;和/或将所述元件文本中的字母字符统一修改为大写或小写;和/或将所述元件文本中的全角字符转换为半角字符。3.根据权利要求2所述的制造商名称识别方法,其特征在于,所述对所述元件文本进行预处理包括:对所述元件文本进行编码转换;其中,所述对所述元件文本进行编码转换包括:确定所述元件文本的特征信息;将所述特征信息输入预先训练的编码识别模型中,该编码识别模型通过作为输入的样本编码的特征信息与作为输出的样本识别结果,训练得到;确定所述编码识别模型的识别结果;以及当所述识别结果为非标准编码时,对所述元件文本进行编码转换处理。4.根据权利要求3所述的制造商名称识别方法,其特征在于,所述编码识别模型通过如下方式进行训练:获取标准编码特征信息样本集和非标准编码特征信息样本集;其中,所述样本标准编码特征信息样本集中包括标准编码对应的至少一个特征信息,所述非标准编码特征信息样本集中包括非标准编码对应的至少一个特征信息;以及利用标准编码特征信息样本集和非标准编码特征信息样本集对所述编码识别模型进行训练;其中,在将所述标准编码特征信息样本集作为所述编码识别模型的输入时,将标准编码作为识别结果作为所述编码识别模型的输出;在将所述非标准编码特征信息样本集作为所述编码识别模型的输入时,将非标准编码作为识别结果作为所述编码识别模型的输出。5.根据权利要求1所述的制造商名称识别方法,其特征在于,所述对预处理后的所述元件文本进行分词,得到至少一个关键词包括:根据分词库对所述元件文本进行分词,生成至少一个词汇,其中,所述分词库中包括至少一个标准词汇,其中,所述标准词汇为用于构成标准制造商名称的词汇;将所述词汇以及与所述词汇对应的标准词汇进行相似度计算;以及将相似度大于预设阈值的词汇作为关键...

【专利技术属性】
技术研发人员:林颖朝谢国清
申请(专利权)人:深圳市云采网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1