一种关键词自动扩展查询方法及其装置制造方法及图纸

技术编号:2820103 阅读:321 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种关键词自动扩展查询方法及其装置,该方法包括以下步骤:1)建立一数据库:该数据库包含关键词、词汇和识别码;2)将关键词与至少一词汇对应;3)将相关的关键词与一识别码对应;4)通过用户输入的关键词,确定数据库中与该关键词对应的识别码;5)通过该识别码提取该识别码对应相关的关键词;6)通过相关的关键词,查询出与每一相关的关键词对应的词汇。本发明专利技术提供了一种关键词自动扩展查询方法及其装置,解决现有技术中仅能查询包含查询字符串的词汇,无法输入查询字符串的同义字或相关的查询字符串提供使用者查询、且查询装置无法让使用者迅速获得符合期望的查询结果的问题。

【技术实现步骤摘要】

本专利技术涉及一种关键词自动扩展查询方法及其装置
技术介绍
从古至今不同民族的文化交流及贸易活动都需要通过语言及文字做为彼此 沟通的桥梁,语言及文字的用字遣词会随着时间和空间而有所变更,不论是在 交谈、书信往来的沟通状况下,由此可见借助随身携带的消费性产品来达成交 流的重要性。由于,现今辅助沟通的工具仅能査询包含查询字符串的词汇,无法输入查 询字符串的同义字或相关的查询字符串提供使用者查询査询。举例来说,即使 同一相同语系的文字相似,但其对于意指同一物品的用语会使用不同的文字, 当使用者查询「西红柿」时,只会出现「西方」、「西瓜」等相同前缀的查询结 果,并不会出现同等「西红柿」的正确查询结果——「西红柿」,如此,必然造 成使用者查询上的困扰,而使得查询任务不正确。此外,运用在不相同语系的查询方面,使用者仅能使用有限的单字去査询, 无法使用相关词汇来查询时,将无法获得正确及多元的查询结果,例如使用 者输入「gO」仅会显示包含「gO」的释义、「gO」的变形词及「gO」的例句等,并无法通过査询「go」而获得包含「gone」的查询结果——「goneforever」及 「goneforever」的中译「一去不复返」。因此,在查询的扩展度方面尚有相当的 改良空间。综上所述,在随身携带的消费性产品上进行关键词扩展查询必会提升使用 者查询的操作便利性及多元学习的效果,减少查询失败的挫折感且更贴近使用 者的使用需求。
技术实现思路
本专利技术的目的在于提供一种关键词自动扩展査询方法及其装置,以解决背 景技术中所述的仅能查询包含查询字符串的词汇,无法输入查询字符串的同义 字或相关的査询字符串提供使用者查询、且查询装置无法让使用者迅速获得符 合期望的査询结果的问题。 本专利技术的技术解决方案是一种关键词自动扩展査询方法,其特殊之处在于,该方法包括以下步骤1) 建立一数据库该数据库包含关键词、词汇和识别码;2) 将关键词与至少一词汇对应;3) 将相关的关键词与一识别码对应;4) 通过用户输入的关键词,确定数据库中与该关键词对应的识别码;5) 通过该识别码提取该识别码对应相关的关键词;6) 通过相关的关键词,査询出与每一相关的关键词对应的词汇。上述步骤2)中将关键词与至少一词汇对应是通过杂凑表(HashTable)、队 列(Queue)或排序名单(SortList)实现的。上述词汇包括关键词的例句或关键词的释义。 上述识别码是数字、英文、符号及其组合的群组。一种关键词自动扩展查询装置,其特殊之处在于该装置包括用于储存包 含有关键词、个词汇和识别码的数据库的储存模块,将关键词与至少一词汇对 应、将相关的关键词对应于识别码的对应模块,用来接收查询字符串且分析查 询字符串包含的关键词的输入模块,依据关键词对应的识别码在数据库中提取 该识别码对应的相关的关键词,以及与相关的关键词对应的词汇的查询模块, 用来输出查询结果的输出模块,所述输入模块、储存模块、对应模块、输出模 块均与査询模块连接。上述关键词自动扩展查询装置还包括用于设定査询模块的査询模式的设定 模块,所述设定模块与查询模块连接。本专利技术的关键词自动扩展查询方法及其装置通过设定识别码,将与一关键 词相关的关键词与一识别码对应,通过输入相关关键词中的任一关键词即可将 所有相关关键词对应的词汇查询出来,实现了关键词的自动扩展查询,提高了 查询效率。 附图说明图l是本专利技术的方法流程图2是本专利技术的结构示意图3是本专利技术的对应模块工作原理示意图4是本专利技术的输入模块工作原理示意图5是本专利技术的查询模块、输出模块工作原理示意图; 图6是本专利技术的设定模块工作原理示意图; 图7是查询字符串为「队长」时的査询示意图8是查询模式为「中韩」、「日韩」、「中日韩」时的査询示意图-, 图9是查询模式为「中日韩」时,输入查询字符串为「待人」时的査询 示意图10是选择查询模式为「相异语系查询」且为「英汉」时的查询示意图。 具体实施例方式参见图l,本专利技术的方法包括以下步骤1) 建立一数据库该数据库包含关键词、词汇和识别码;2) 将关键词与至少一词汇对应;3) 将相关的关键词与一识别码对应;4) 通过用户输入的关键词,确定数据库中与该关键词对应的识别码;5) 通过该识别码提取该识别码对应相关的关键词;6) 通过相关的关键词,查询出与每一相关的关键词对应的词汇。其中,步骤2)中将关键词与至少一词汇对应是通过杂凑表(HashTable)、 队列(Queue)或排序名单(SortList)实现的。 识别码是数字、英文、符号及其组合的群组。参见图2,本专利技术包括用于储存包含有多个关键词110、多个词汇130和多 个识别码150的数据库70的储存模块10,将关键词110与至少一词汇130对应、 相关的关键词110对应识别码150的对应模块20,用来接收查询字符串且分析 查询字符串包含的关键词110的输入模块30,依据关键词110对应的识别码150 在数据库70中提取该识别码150对应的词汇130的查询模块40,用来输出查询 结果的输出模块50,所述输入模块30、储存模块10、对应模块20、输出模块 50均与查询模块40连接。参见图3,对应模块20:将每一关键词110对应于至少一个词汇130,其中 相关的关键词110对应于一个识别码150。例如相关的关键词110 「go、 gone、 went、 going」对应于一个识别码150,相关的关键词110 「队长、隊長」对应于 一个识别码150;其中对应模块20可为杂凑表(HashTable)、队列(Queue)或 排序名单(SortList)。其中,识别码150是选自数字、英文、符号及其组合的群组,例如识别 码150为「001」、「A01J)1」等。参见图4,输入模块30:用来接收査询字符串310且分析查询字符串310 包含的关键词110,例如接收查询字符串310为「西红柿」。参见图5,词汇130可为关键词110的例句关键词110为「西红柿」,词 汇130可为「西红柿」的例句「西红柿炒蛋」。另外,词汇130也可为关键词110 的释义;例如关键词110为「西红柿j,词汇130为「西红柿」的释义「蔬菜 类,果实扁圆,熟后成红色,可食」。查询模块40:依据关键词110对应的识别码150在数据库70中提取识别码 150对应的相关关键词,将相关关键词对应词汇130作为查询结果410,例如 输入查询字符串310为「西红柿」,则列出与之对应的词汇「番茄」、「西红 柿」、「酱」等相关关键词对应的词汇。输出模块50:用来输出查询结果410,如列出对应于查询字符串310 「西红 柿」的词汇130为「番茄」、「西红柿」、「酱」等,从词汇130中选择「国 语—西红柿」后,随即出现「西红柿」的查询结果410为「西红柿」的注音、释 义及例句。参见图6本专利技术还包括有设定模块60:用来设定查询模块40的査询模式 610,其中查询模式610为相同语系查询或相异语系查询。当查询模式610为相同语系査询时可选择「汉语」为简繁用语的对应及同 义字,通过此査询模式610得到査询结果410为「番茄」意即「西红柿」、「火 牛」意即「变压器」。另一方面,使用者欲学习不同语系的语言则可以选择查询模式610为「相 异语系查询」,本文档来自技高网...

【技术保护点】
一种关键词自动扩展查询方法,其特征在于:该方法包括以下步骤: 1)建立一数据库:该数据库包含关键词、词汇和识别码; 2)将关键词与至少一词汇对应; 3)将相关的关键词与一识别码对应; 4)通过用户输入的关键词,确定数据库中与该关键词对应的识别码; 5)通过该识别码提取该识别码对应相关的关键词; 6)通过相关的关键词,查询出与每一相关的关键词对应的词汇。

【技术特征摘要】

【专利技术属性】
技术研发人员:陈淮琰熊国超郑建锋
申请(专利权)人:无敌科技西安有限公司
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1