具有相似音标校正功能的单词输入查询方法技术

技术编号:2826233 阅读:918 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种具有相似音标校正功能的单词输入查询方法,其包括以下步骤:从输入的音标组合中撷取第一个音节内容,根据制定的音标相似替换规则,得到与输入的第一个音节所有相似音标集合A;接着,逐个从此音标组合A中取出一个音标,然后到区块信息中查到以此音标开始所在区块号;接着,再将此区块中所有音标取出,逐个与输入音标比较,若满足所制定的音标相似规则,则将此音标记录到音标集合B;最后,输出符合该音标集合B的单词集合。

【技术实现步骤摘要】

本专利技术涉及一种单词输入查询方法,尤其是一种根据输入相近音标,并且与音标比对,得到正确单词的具有音标校正功能的单词输入查询方法。
技术介绍
在目前所使用的各种个人信息处理设备中,对于方便快速查询电子辞典是愈来愈普遍的一个功能,给使用者很大的便利性。在电子辞典中,其查询单词的方式,一般都是由输入单词的拼写字母组合进行查询。但是,当使用者听到一个陌生的单词时,不知道此单词的正确拼写方式,或是无法确定拼写的字母时,一般最直接的想法就是输入此单词的音标,然后进行查询。例如,当使用者听到是以较多字母所拼成的一个单词时,例如philanthropist(慈善家),其音标为[f′lnθrpist]。由于每个音节所对应的字母拼写方式有好多种组合,例如「f」所对应的字母拼写可能包含下列几种:「phi」、「fa」、「ffa」、「fi」「ffi」、「pho」、「pha」或是「phou」。然而,使用者也有可能将[f]的拼音听成[fI]、[f]、或[fo]等。因此,要找出「philanthropist」这个单词的完整拼写,对于使用者来说是非常困难的事情。因此,根据目前所使用的单词查询方式,并不能让使用者将所听到的音标直接输入,并且进行查询到正确的单词。
技术实现思路
本专利技术为解决
技术介绍
中存在的上述技术问题,而提供一种具有音标校正功能的单词输入查询法。本专利技术的技术解决方案是:本专利技术为一种具有相似音标校正的单词输入查询法,其特征在于:该方法包括以下步骤:-->1)提供一关键词数据库,包含一音标数据库及一单词数据库;2)在上述音标数据库中建立一音标区块索引,其具有一起始音标区块及一结束音标区块;3)建立一相似音标替换规则;4)提供及分析一第一音标组合,以撷取出其中至少一个音阶内容;5)根据上述相似音标替换规则,找出与上述第一音标组合的所有相近音标集合为第一音标集合;6)在上述第一音标集合中,逐个从其中取出音标;7)在上述起始音标区块及所述结尾音标区块查询到音标开始的所有音标所在区块;8)将上述区块中所有音标取出,且逐个与上述第一音标组合比较,若满足所述制定音标相似规则,则将音标记录至一第二音标集合;9)找出相对应上述第二音标集合的所有单词集合;10)输出所述单词集合。上述音标数据库及所述单词数据库具有对应关系。上述相似音标替换规则包含一发音相近的元音替换规则。上述相似音标替换规则还包含一发音相近的子音替换规则。上述相似音标替换规则还包含一长短音发音的替换规则。上述相似音标替换规则还包含一轻音的替换规则。上述第二音标组合包含相似于上述第一音标组合的上述音阶内容的多数个音标。本专利技术通过建立查询的关键词数据库及制定相似音标替换规则,得到直接且又方便的单词输入方法,即使使用者无法输入正确的拼音音标,也可以查询到正确的单词。附图说明图1为本专利技术建立具有对应关系的关键词数据库的示意图;-->图2为本专利技术将图1中音标数据库按照一定的规则,建立音标区块索引的示意图;图3为本专利技术表示具有音标校正功能的单词输入查询方法流程图。其中,1-关键词数据库,10-音标数据库,20-单词数据库,30-音标区块索引,301-区块的起始信息,302-区块的起始与结束的音标编号;具体实施方式本专利技术具有音标校正功能的单词输入查询法,需先制定相似音标替换规则,及建立查询的关键词数据库,其至少包含音标数据库及单词数据库,然后进行查询步骤。首先,先制定的相似音标替换规则。将英文字母中,发音相近的英文字母例如,[a]、[e]、[i]元音进行相互替换,例如,元音[a]与元音[Λ]的发音相近,可以相互替换。又例如,元音[Λ]与元音[ε]的发音相近,可相互替换。另外,元音[ε]与元音[]的发音相近,可相互替换。元音[]与元音[o]的发音相近,也可以相互替换。另外,元音[o]与元音[u]的发音相近,同样也可以相互替换。因此,可以得到一个以相似元音发音,而可以相互替换的规则,即元音[a]与元音[ε]、元音[o]及元音[u]可以相互替换。因此,可以制定出以元音音标相互替换的替换规则。另外,还制定以发音相近的子音相互替换的规则,其中,子音发音相近的英文字母包含[b]、[p]及[t]、[d]。因此,字母[b]与字母[p]的子音可以互换,字母[t]与字母[d]的子音可以互换。因此,可以制定以子音音标相互替换的替换规则。另外,对于英文字母发音为长音或是短音者,也是设定为可以相互替换。例如,字母[i]与字母[o]可以相互替换,及字母[u]与字母[u]也可以相互替换。因此,也可以建立一组字母音标以长音与短音发音的音标相互替换的替换规则。在此,要特别说明的是,在本实施例中,对于单词的词首或是词尾发音较轻的音节可以省略。根据以上所述,在本实施例中所制定的相似音标替换规则,至少包含四种-->替换规则,包含相似元音音标替换规则、相似子音音标替换规则、长短音音标替换规则、省略词首或词尾发音音节。如图1所示,其表示在执行本实施例单词查询方法时,需先根据在电子辞典中所有的查询关键词,建立具有对应关系的关键词数据库1,其至少包含音标数据库10以及关键词数据库20。建立方式是撷取在电子辞典内每一个关键词(keyword)的音标,建立一个音标数据库10。同时,也将所有的单词,建立一个单词数据库20。其中,在音标数据库10中,将每一个关键词的音标加以编号,因此,每一个音标即对应一个编号。同样地,在单词数据库20中,将每一个单词加以编号,每一个单词对应一个编号。因此,通过记录音标与单词之间的对应关系,可以建立出一套音标数据库10与单词数据库20的对应关系,且其对应关系可以是一对一、一对多或者是多对一。根据以上所述,以一对一的对应关系为示范例,在图1中,编号为100的音标为[dI(r)],相对应于单词数据库20中,编号为137的单词「deer」。又在另一个以多对一的对应关系的示范例中,在音标数据库10中,编号为100的音标[deθ]与编号101的音标[dεθ]同时对应在单词数据库20中,编号为135的单词「death」。因此,在音标数据库10及单词数据库20之间,可以得到多种对应关系。参见图2,将图1中的音标数据库10,按照规则建立一音标区块索引30,在此音标区块索引30内包含:区块启始信息301以及区块的起始与结束音标编号302,其中区块起始信息301还包含记录可以用起始几个音标字符标记。参见图3,其表示本专利技术具有音标校正功能的单词输入查询方法的流程图。步骤50表示电子辞典接收到第一音标组合。接着,步骤52表示根据所接收到的第一音标组合,分析该音标内容,并撷取出该第一音标组合之至少一音节内容。步骤54,找出与输入第一音标组合的所有相近音标集合为第一音标集合,可表示为A{[a1],[a2],[a3],[a4]…本文档来自技高网...

【技术保护点】
一种具有相似音标校正功能的单词输入查询法,其特征在于:该方法包括以下步骤:    1)提供一关键词数据库,包含一音标数据库及一单词数据库;    2)在所述音标数据库中建立一音标区块索引,其具有一起始音标区块及一结束音标区块;    3)建立一相似音标替换规则;    4)提供及分析一第一音标组合,以撷取出其中至少一个音阶内容;    5)根据所述相似音标替换规则,找出与所述第一音标组合的所有相近音标集合为第一音标集合;    6)在所述第一音标集合中,逐个从其中取出音标;    7)在所述起始音标区块及所述结尾音标区块查询到音标开始的所有音标所在区块;    8)将所述区块中所有音标取出,且逐个与所述第一音标组合比较,若满足所述制定音标相似规则,则将音标记录至一第二音标集合;    9)找出相对应所述第二音标集合的所有单词集合;    10)输出所述单词集合。

【技术特征摘要】
1、一种具有相似音标校正功能的单词输入查询法,其特征在于:该方法包括以下步骤:1)提供一关键词数据库,包含一音标数据库及一单词数据库;2)在所述音标数据库中建立一音标区块索引,其具有一起始音标区块及一结束音标区块;3)建立一相似音标替换规则;4)提供及分析一第一音标组合,以撷取出其中至少一个音阶内容;5)根据所述相似音标替换规则,找出与所述第一音标组合的所有相近音标集合为第一音标集合;6)在所述第一音标集合中,逐个从其中取出音标;7)在所述起始音标区块及所述结尾音标区块查询到音标开始的所有音标所在区块;8)将所述区块中所有音标取出,且逐个与所述第一音标组合比较,若满足所述制定音标相似规则,则将音标记录至一第二音标集合;9)找出相对应所述第二音标集合的所有单词集合;10)输出所述单词集合。2、根据权利要求1所述的具...

【专利技术属性】
技术研发人员:陈淮琰陈迎春
申请(专利权)人:无敌科技西安有限公司
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1