近似商标的获取方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:20389777 阅读:23 留言:0更新日期:2019-02-20 02:49
本申请涉及一种近似商标的获取方法、装置、计算机设备和存储介质。本方法基于最长公共子序列、最长公共字串以及编辑距离对待检测文字商标与在先商标进行字符串整体性的相似度判定,从而筛选出相似度较高的相近在先商标,再对待检测文字商标与相近在先商标之间的差异字符进行字音以及字形的相似度判定,综合字符串整体判定结果和字符独立判定结果计算出综合相似度,将综合相似度较高的在先商标反馈给用户,实现快速获取待检测文字商标的近似商标,提高近似商标检索的效率,同时,对待检测文字商标与在先商标间的近似性判断是由字符串整体判定结果和字符独立判定结果综合后的结果决定的,有效提高近似商标检索的准确率。

【技术实现步骤摘要】
近似商标的获取方法、装置、计算机设备和存储介质
本申请涉及信息数据处理
,特别是涉及一种近似商标的获取方法、装置、计算机设备和存储介质。
技术介绍
目前,业内对于文字商标近似判定主要依靠人工检索商标库中的近似商标并对商标间的相似性进行判断,如商标审查员、律师等检索人员根据从业经验从商标库中进行商标检索以及对检索结果中的商标进行相似性判定,近似商标的人工检索以及判定的处理速度有限,导致商标的检索、审查的工作效率低。
技术实现思路
基于此,有必要针对近似商标的人工检索以及判定的处理速度有限,导致商标的检索、审查的工作效率低的技术问题,提供一种近似商标的获取方法、装置、计算机设备和存储介质。一种近似商标的获取方法,所述方法包括:获取待检测文字商标;获取所述待检测文字商标与商标库中各个在先商标之间的最长公共子序列、最长公共字串以及编辑距离;根据所述最长公共子序列、所述最长公共字串以及所述编辑距离,计算所述待检测文字商标与各所述在先商标之间的字符串相似度;将与所述待检测文字商标的字符串相似度大于预设筛选阈值的在先商标确定为相近在先商标;当所述待检测文字商标为中文文字商标时,获取所述待检测文字商标与所述相近在先商标间的差异中文字符,计算所述差异中文字符间的字音相似度以及字形相似度;根据所述待检测文字商标与所述相近在先商标间的字符串相似度、所述差异中文字符的字音相似度以及字形相似度,计算所述待检测文字商标与相近在先商标之间的综合相似度,将综合相似度大于相似度阈值的相近在先商标确定为近似商标。在其中一个实施例中,所述根据所述最长公共子序列、所述最长公共字串以及所述编辑距离,计算所述待检测文字商标与各所述在先商标之间的字符串相似度的步骤,包括:根据计算所述待检测文字商标与所述在先商标之间的字符串相似度;其中,s表示所述待检测文字商标与所述在先商标间的字符串相似度;a表示所述最长公共子序列的长度值;b表示所述最长公共字串的长度值;c表示所述编辑距离值;X表示所述待检测文字商标的长度值,Y表示所述在先商标的长度值;max(·)表示取最大值。在其中一个实施例中,所述获取所述待检测文字商标与所述相近在先商标间的差异中文字符的步骤之前,还包括:分别获取所述待检测文字商标中各个中文字符对应的第一字符编码,以及所述相近在先商标中各个中文字符对应的第二字符编码;分别对所述第一字符编码以及所述第二字符编码进行排序;若排序后的第一字符编码以及排序后的第二字符编码一致,则将所述相近在先商标中确定为近似商标;若排序后的第一字符编码以及排序后的第二字符编码不一致,则进入获取所述待检测文字商标与所述相近在先商标间的差异中文字符的步骤。在其中一个实施例中,所述差异中文字符包括第一差异字符以及第二差异字符;其中,所述第一差异字符包括在所述待检测文字商标的中文字符中,与所述相近在先商标的中文字符不同的差异字符;所述第二差异字符包括在所述相近在先商标的中文字符中,与所述待检测文字商标的文字符不同的差异字符;所述计算所述差异中文字符间的字音相似度的步骤,包括:获取第一差异字符对应的第一拼音序列以及第二差异字符对应的第二拼音序列;根据所述第一拼音序列与所述第二拼音序列间的编辑距离确定所述第一差异字符以及所述第二差异字符的字音相似度。在其中一个实施例中,所述计算所述差异中文字符间的字形相似度的步骤,包括:获取第一差异字符对应的第一四角编码以及第二差异字符对应的第二四角编码;根据所述第一四角编码以及所述第二四角编码间的汉明距离确定所述第一差异字符以及所述第二差异字符的字形相似度。在其中一个实施例中,所述将与所述待检测文字商标的字符串相似度大于预设筛选阈值的在先商标确定为相近在先商标的步骤之后,还包括:当所述待检测文字商标为英文文字商标时,分别对所述待检测文字商标以及所述相近在先商标进行英文切词获得对应的英文字符串;对各所述英文字符串进行拼写检查,若所述英文字符串为合法的英文单词,对所述英文字符串进行词性还原获得原始英文单词;计算根据所述待检测文字商标获得的原始英文单词与根据所述相近在先商标获得的原始英文单词间的编辑距离值,根据所述编辑距离值获取所述待检测文字商标以及所述相近在先商标间的英文单词相似度;根据所述字符串相似度以及所述英文单词相似度计算所述待检测文字商标与所述相近在先商标的综合相似度,将综合相似度大于相似度阈值的相近在先商标确定为近似商标。一种近似商标的获取装置,所述装置包括:文字商标获取模块,用于获取待检测文字商标;字符串对比模块,用于获取所述待检测文字商标与商标库中各个在先商标之间的最长公共子序列、最长公共字串以及编辑距离;字符串相似度获取模块,用于根据所述最长公共子序列、所述最长公共字串以及所述编辑距离,计算所述待检测文字商标与各所述在先商标之间的字符串相似度;相近商标获取模块,用于将与所述待检测文字商标的字符串相似度大于预设筛选阈值的在先商标确定为相近在先商标;字符相似度获取模块,用于当所述待检测文字商标为中文文字商标时,获取所述待检测文字商标与所述相近在先商标间的差异中文字符,计算所述差异中文字符间的字音相似度以及字形相似度;近似商标获取模块,用于根据所述待检测文字商标与所述相近在先商标间的字符串相似度、所述差异中文字符的字音相似度以及字形相似度,计算所述待检测文字商标与相近在先商标之间的综合相似度,将综合相似度大于相似度阈值的相近在先商标确定为近似商标。在其中一个实施例中,近似商标的获取装置还包括换序判定模块;所述换序判定模块,用于分别获取所述待检测文字商标中各个中文字符对应的第一字符编码,以及所述相近在先商标中各个中文字符对应的第二字符编码;分别对所述第一字符编码以及所述第二字符编码进行排序;在排序后的第一字符编码以及排序后的第二字符编码一致时,将所述相近在先商标中确定为近似商标;在排序后的第一字符编码以及排序后的第二字符编码不一致时,使字符相似度获取模块获取所述待检测文字商标与所述相近在先商标间的差异中文字符。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取待检测文字商标;获取所述待检测文字商标与商标库中各个在先商标之间的最长公共子序列、最长公共字串以及编辑距离;根据所述最长公共子序列、所述最长公共字串以及所述编辑距离,计算所述待检测文字商标与各所述在先商标之间的字符串相似度;将与所述待检测文字商标的字符串相似度大于预设筛选阈值的在先商标确定为相近在先商标;当所述待检测文字商标为中文文字商标时,获取所述待检测文字商标与所述相近在先商标间的差异中文字符,计算所述差异中文字符间的字音相似度以及字形相似度;根据所述待检测文字商标与所述相近在先商标间的字符串相似度、所述差异中文字符的字音相似度以及字形相似度,计算所述待检测文字商标与相近在先商标之间的综合相似度,将综合相似度大于相似度阈值的相近在先商标确定为近似商标。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取待检测文字商标;获取所述待检测文字商标与商标库中各个在先商标之间的最长公共子序列、最长公共字串以及编辑距离;根据所述最长公共子序列、所述最长公共字串以及所述编辑距本文档来自技高网...

【技术保护点】
1.一种近似商标的获取方法,所述方法包括:获取待检测文字商标;获取所述待检测文字商标与商标库中各个在先商标之间的最长公共子序列、最长公共字串以及编辑距离;根据所述最长公共子序列、所述最长公共字串以及所述编辑距离,计算所述待检测文字商标与各所述在先商标之间的字符串相似度;将与所述待检测文字商标的字符串相似度大于预设筛选阈值的在先商标确定为相近在先商标;当所述待检测文字商标为中文文字商标时,获取所述待检测文字商标与所述相近在先商标间的差异中文字符,计算所述差异中文字符间的字音相似度以及字形相似度;根据所述待检测文字商标与所述相近在先商标间的字符串相似度、所述差异中文字符的字音相似度以及字形相似度,计算所述待检测文字商标与相近在先商标之间的综合相似度,将综合相似度大于相似度阈值的相近在先商标确定为近似商标。

【技术特征摘要】
1.一种近似商标的获取方法,所述方法包括:获取待检测文字商标;获取所述待检测文字商标与商标库中各个在先商标之间的最长公共子序列、最长公共字串以及编辑距离;根据所述最长公共子序列、所述最长公共字串以及所述编辑距离,计算所述待检测文字商标与各所述在先商标之间的字符串相似度;将与所述待检测文字商标的字符串相似度大于预设筛选阈值的在先商标确定为相近在先商标;当所述待检测文字商标为中文文字商标时,获取所述待检测文字商标与所述相近在先商标间的差异中文字符,计算所述差异中文字符间的字音相似度以及字形相似度;根据所述待检测文字商标与所述相近在先商标间的字符串相似度、所述差异中文字符的字音相似度以及字形相似度,计算所述待检测文字商标与相近在先商标之间的综合相似度,将综合相似度大于相似度阈值的相近在先商标确定为近似商标。2.根据权利要求1所述的方法,其特征在于,所述根据所述最长公共子序列、所述最长公共字串以及所述编辑距离,计算所述待检测文字商标与各所述在先商标之间的字符串相似度的步骤,包括:根据计算所述待检测文字商标与所述在先商标之间的字符串相似度;其中,s表示所述待检测文字商标与所述在先商标间的字符串相似度;a表示所述最长公共子序列的长度值;b表示所述最长公共字串的长度值;c表示所述编辑距离值;X表示所述待检测文字商标的长度值,Y表示所述在先商标的长度值;max(·)表示取最大值。3.根据权利要求1所述的方法,其特征在于,所述获取所述待检测文字商标与所述相近在先商标间的差异中文字符的步骤之前,还包括:分别获取所述待检测文字商标中各个中文字符对应的第一字符编码,以及所述相近在先商标中各个中文字符对应的第二字符编码;分别对所述第一字符编码以及所述第二字符编码进行排序;若排序后的第一字符编码以及排序后的第二字符编码一致,则将所述相近在先商标中确定为近似商标;若排序后的第一字符编码以及排序后的第二字符编码不一致,则进入获取所述待检测文字商标与所述相近在先商标间的差异中文字符的步骤。4.根据权利要求1至3任意一项所述的方法,其特征在于,所述差异中文字符包括第一差异字符以及第二差异字符;其中,所述第一差异字符包括在所述待检测文字商标的中文字符中,与所述相近在先商标的中文字符不同的差异字符;所述第二差异字符包括在所述相近在先商标的中文字符中,与所述待检测文字商标的文字符不同的差异字符;所述计算所述差异中文字符间的字音相似度的步骤,包括:获取第一差异字符对应的第一拼音序列以及第二差异字符对应的第二拼音序列;根据所述第一拼音序列与所述第二拼音序列间的编辑距离确定所述第一差异字符以及所述第二差异字符的字音相似度。5.根据权利要求4所述的方法,其特征在于,所述计算所述差异中文字符间的字形相似度的步骤,包括:获取第一差异字符对应的第一四角编码以及第二差异字符对应的第二四角编码;根据所述第一四角编码以及所述第二四角编码间...

【专利技术属性】
技术研发人员:叶素兰窦文伟唐玲莉吴晓贝
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1