用于表示和搜索字的系统和方法技术方案

技术编号:42108648 阅读:17 留言:0更新日期:2024-07-25 00:31
一种用于表示和搜索字的方法和支持系统,包括:获取字的图像;通过在图像中的字上定义多个节点和多个边来标记字的结构;以及通过提取一组二维坐标来表示该多个节点并通过提取矩阵来表示该多个边,来生成字的表示;以及在可搜索数据库中提供该表示。

【技术实现步骤摘要】
【国外来华专利技术】


技术介绍

1、在包含符号或字的书面语言系统中,某些字可能复杂且难以理解。因此,学习者需要能够表示字的方法和支持系统来高效地使用、搜索、学习或理解语言。


技术实现思路

1、许多书面语言系统都是语标,其中直观地表示口语单位的符号或字表示单词或短语。此类语言系统可能包括大量单独的字,并且在这些字中搜索特定字可能具有挑战性且耗时。中文字(也称为“hanz i”或汉字)使用符号,且是世界上最早的书面语言形式之一,可以追溯到大约五千年前。许多汉字被认为具有两个子结构(或成分),包括部首成分和语音成分。部首成分通常是指具有含义的子结构。语音成分是指可能有意义或可能没有意义的附加子结构。

2、本文公开了用于表示字(或其成分)以生成包括字的可搜索和/或可分解表示的数据库(例如,数字化数据库)的方法、系统和技术。在一些实施例中,该方法包括获取字(或其成分)的光栅图像,以及将字(或其成分)表示为图形(例如,二维图形)中的节点和边(或线)。在一些实施例中,该数据库包括至少80,000个可搜索和可分解的字。在一些实施例中本文档来自技高网...

【技术保护点】

1.一种用于表示字的方法,包括:

2.根据权利要求1所述的方法,其中所述字包括语标。

3.根据权利要求1所述的方法,其中所述图像包括光栅图像。

4.一种在数据库中搜索字的方法,包括:

5.根据权利要求4所述的方法,还包括基于所述字子结构来预测所述输出字的一个或多个含义。

6.根据权利要求5所述的方法,还包括显示所述输出字的一个或多个预测含义。

7.根据权利要求4所述的方法,其中,使用一组可能的节点组合来搜索所述字中的字子结构进一步包括:

8.根据权利要求7所述的方法,其中所述一个或多个度量包括节点分支差异...

【技术特征摘要】
【国外来华专利技术】

1.一种用于表示字的方法,包括:

2.根据权利要求1所述的方法,其中所述字包括语标。

3.根据权利要求1所述的方法,其中所述图像包括光栅图像。

4.一种在数据库中搜索字的方法,包括:

5.根据权利要求4所述的方法,还包括基于所述字子结构来预测所述输出字的一个或多个含义。

6.根据权利要求5所述的方法,还包括显示所述输出字的一个或多个预测含义。

7.根据权利要求4所述的方法,其中,使用一组可能的节点组合来搜索所述字中的字子结构...

【专利技术属性】
技术研发人员:J·M·鲍尔C·许
申请(专利权)人:汉字探测有限责任公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1