【技术实现步骤摘要】
一种强噪声复杂背景图像中的汉字组词方法
本专利技术涉及计算机
,尤其涉及一种强噪声复杂背景图像中的汉字组词方法。
技术介绍
自动识别图像、视频中的文字的计算机技术,具有广阔的应用场景,如在物流行业中,将物流快递运单进行快速扫描成像和自动识别,并提取出物流运单上的有效信息;在教育行业中,将图片中的文字信息转换为可编辑的Word文档;在安防行业中,对视频中出现的车牌等信息进行识别和提取。随着各行业科技的发展,仅仅对汉字进行识别和提取是不够的,还需要对已识别的汉字进行组词,从而将其内容反馈给用户,以达到更进一步的业务需求。譬如,在具有复杂背景和变形文字的强噪声图片上,对变形文字进行识别,并将其组合成相应的文字内容呈现给用户,使得该技术能广泛应用到各具体行业或场景中。现有技术对于具有复杂背景和变形文字的强噪声图片,无法实现其精准组词和翻译文字内容,无法应用到具体的场景或行业中。
技术实现思路
本专利技术实施例提出一种强噪声复杂背景图像中的汉字组词方法,能够提高在强噪声复杂背景图像中汉字定位、 ...
【技术保护点】
1.一种强噪声复杂背景图像中的汉字组词方法,其特征在于,包括:/n根据若干个包含汉字的背景图像,构建用于汉字定位的神经网络模型;其中,所述背景图像为强噪音复杂背景图像;/n获取待处理的第一背景图像,并根据所述神经网络模型对所述第一背景图像进行汉字定位,获得若干个汉字定位框;/n根据预设的深度学习模型,对所述若干个汉字定位框中的文字进行汉字识别,获得待组词乱序文字;/n获取待组词乱序文字对应的待组词字符串,并根据字符串中的字符查找表查询所有待组词字符串对应的出现总次数,以此构建第一向量;/n根据所述待组词字符串当前的字符排列顺序,分别查询第一字符词频表和第二字符词频表,并根据 ...
【技术特征摘要】
1.一种强噪声复杂背景图像中的汉字组词方法,其特征在于,包括:
根据若干个包含汉字的背景图像,构建用于汉字定位的神经网络模型;其中,所述背景图像为强噪音复杂背景图像;
获取待处理的第一背景图像,并根据所述神经网络模型对所述第一背景图像进行汉字定位,获得若干个汉字定位框;
根据预设的深度学习模型,对所述若干个汉字定位框中的文字进行汉字识别,获得待组词乱序文字;
获取待组词乱序文字对应的待组词字符串,并根据字符串中的字符查找表查询所有待组词字符串对应的出现总次数,以此构建第一向量;
根据所述待组词字符串当前的字符排列顺序,分别查询第一字符词频表和第二字符词频表,并根据查询结果构建第一条件概率计数向量和第二条件概率计数向量;其中,所述第一字符词频表、第二字符词频表和字符查找表组成字符频表;所述字符表由预设的训练文本和训练模型而得到;
根据第一向量、第一条件概率计数向量和第二条件概率计数向量,分别计算得出所述待组词字符串对应的第一条件概率向量和第二条件概率向量;
分别对所述第一条件概率向量和第二条件概率向量中的各元素取对数,并将概率之积转化为对数概率之和,依次获得第一自然语序度量值和第二自然语序度量值;
根据所述第一自然语序度量值和第二自然语序度量值,获得所述待组词字符串当前的字符排列顺序对应的自然语序度量值,并遍历所述待组词字符串的所有字符排列顺序,按照相同的计算方法,依次获得若干个自然语序度量值,再选择自然语序度量值最大的字符排列顺序,将所述待组词字符串进行自动组词。
2.根据权利要求1所述的强噪声复杂背景图像中的汉字组词方法,其特征在于,所述第一字符词频表中的第i行第j列个元素表示哈希值为i的字符后相邻的哈希值为j的组合在所有训练文本中的出现频次;其中,i和j为正整数;
所述第二字符词频表中的第i行第j列个元素表示哈希值为i的字符后的第二个字符哈希值为j的组合在所有训练文本中的出现频次;
所述字符查找表中记录的常用字符对应的列号,分别为每个常用字符的哈希值。
3.根据权利要求1所述的强噪声复杂背景图像中的汉字组词方法,其特征在于,所述根据字符串中的字符查找表查询所有待组词字符串对应的出现总次数,以此构建第一向量,具体为:
将所述待组词字符串映射到对应的字符查找表对应的列上,得到每个字符的出现总次数,记为第一向量s_total。
4.根据权利要求3所述的强噪声复杂背景图像中的汉字组词方法,其特征在于,所述根据所述待组词字符串当前的字符排列顺序,分别查询所述第一字符词频表和所述第二字符词频表,并根据查询结果构建第一条件概率计数向量和第二条件概率计数向量,具体为:
根据所述待组词字符串当前的字符排列顺序,对于每一组相邻的元素(a,b)查找第一字符词频表中对应的元素R1ab,并将所有查询得到的元素构建成第一条件概率计数向量w_n1;
根据所述待组词字符串当前的字符排列顺序,对于每一组相隔1个字符的元素(c,d)查找第二字符词频表中对应的元素R2cd,并将所有查询得到的元素构建成第二条件概率计数向量w_n2。
5.根据权利要求4所述的强噪声复杂背景图像中的汉字组词方法,其特征在于,所述根据第一向量、第一条件概率计数向量和第二条件概率计数向量,分别计算得出所述待组词字符串对应的第一条件概率向量和第二条件概率向量,具体为:
将第一向量s_total的前n-1个元素向量除以第一条件概率计数向量w_n1,得到所述第一条件概率向量w1;其中,所述第一向量s_total包含n个元素;所述第一条件概率向量w1中的元素为所述待组词字符串中前一个字符出现后,后一个字符也出现的条件概率向量;
将第一向量s_total的前n-1个元素向量除以第二条件概率计数向量w_n2,得到所述第二条件概率向量w2;其中,所述第二条件概率向量w2中的元素为所述待组词字符串中前一个...
【专利技术属性】
技术研发人员:蔡浩,陈小明,孙浩军,张承钿,姚浩生,胡超,刘正阳,梁道远,曾鑫,白璐,
申请(专利权)人:汕头大学,广东叁玖捌大数据科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。