【技术实现步骤摘要】
本专利技术属于模式识别
,具体涉及ー种采用人工智能领域的新算法的印刷体汉字识别系统。
技术介绍
自动文摘的研究是自然语言处理的ー个重要领域。但是目前所有的自动文摘模型均以文字的机内表示为系统输入,与实用化的目标显然还有相当大的差距,因为大量的文献资料仍是以传统的纸面印刷形式存在的。为此,本文提出了ー个印刷体汉字识别的并行神经网络方法,并进行了实验模拟。在对2500个汉字的测试中,识别率97%,误识率1%,拒识率2%。应该指出,虽然我们的系统是就印刷体汉字而设计的,其基本实现原理和方法同样适用于印刷体英文,以及手写体数字、英文和汉字等符号的识别。 本系统进行印刷体汉字识别的主要步骤是扫描仪输入一模糊增强与聚类分割一图象数据ニ值化一通过并行神经网络进行汉字匹配。
技术实现思路
本专利技术的目的是提供一种对输入射频数字信号输出ー个至多个的精确中心频点、带宽控制,带外信号抑制和信号増益功能的可调带通滤波器系统。实现本专利技术目的的技术方案是ー种印刷体汉字识别系统,采用人工智能领域的新算法,有效地提高了汉字识别的质量,该系统包括扫描输入,将印刷在纸面上的汉字经光电转换设 ...
【技术保护点】
一种印刷体汉字识别系统,该系统包括:扫描输入,将印刷在纸面上的汉字经光电转换设备转换成电信号,形成多灰度级的数字信号,输入给计算机处理;模糊增强与聚类分割模块,包括模糊增强与平滑、多灰度级最佳分割;图象数据二值化模块,图象的平滑和增强及多灰度级的聚类分割之后,采用整体阈值选择法进行二值化,先统计出图象的灰度直方图,然后把直方图在某一阈值处分割成两组,当被分成的两组间方差为最大时,确定阈值;汉字识别模块,本系统采用并行神经网络方法,通过控制网络CN对样本进行粗分类,用识别网络RN对各粗类进行细分类,从而识别汉字。
【技术特征摘要】
【专利技术属性】
技术研发人员:陶军,
申请(专利权)人:苏州工业园区七星电子有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。