由外部资料扩充例句之系统及其方法技术方案

技术编号:6868178 阅读:271 留言:0更新日期:2012-04-11 18:40
一种由外部资料扩充例句之系统及其方法,其通过至外部资料库获取范例资料后,由范例资料中提取包含目标资料之范例句的技术手段,可以尽可能的增加辞典资料库中之字词的例句,并达成减少辞典软件开发商不断发布新例句之负担的技术功效。

【技术实现步骤摘要】

一种资料扩充系统及其方法,特别是指一种。
技术介绍
使用者在学习语言时,往往会遇到无法理解某个字词的意义的情况,大部分的使用者在遇到这种情况时,通常会通过查找辞典的方式来取得字词的意义。当然,随着电子产品的普及、网路的发达,使用者查找辞典的行为也由查找资料纸本的辞典转变为使用可以查找字词释义的辞典软件或线上的字词释义服务。目前的辞典软件或线上字词释义服务在提供使用者查找字词的意义时,通常会依据被查找之字词至辞典资料库中查找与该字词对应的释义资料,例如字词的说明、词性、例句以及例句的翻译等,并在查找后显示给使用者观看。其中,字词的例句以及例句的翻译可以让使用者更快更正确的得知被查找之字词可以如何使用,因此,大部分的使用者都会希望辞典软件或线上字词释义服务所显示的释义资料可以包含例句。然而,目前的辞典软件或线上字词释义服务所使用之辞典资料库中,并非所有字词的各个解释都有相对应的例句,如此,当使用者使用辞典软件或线上字词释义服务查找字词的释义资料时,将可能无法获得出被查找之字词的例句,使用者的期待无法被满足。综上所述,可知先前技术中长期以来一直存在目前的辞典资料库中没有储存所有字词之例句而导致使用者查找字词无法获得例句的问题,因此有必要提出改进的技术手段,来解决此一问题。
技术实现思路
有鉴于先前技术存在目前的辞典资料库中没有储存所有字词之例句的问题,本专利技术遂提供一种,其中本专利技术所提供之由外部资料扩充例句之系统,至少包含储存模块,用于提供目标资料表及例句资料表;资料获取模块,用于由外部资料库获取范例资料;例句提取模块,用于依据储存于目标资料表中之目标资料,由范例资料中提取包含目标资料之范例句,并储存范例句至例句资料表中。本专利技术所提供之由外部资料扩充例句之系统,资料获取模块为至预先建立之辞典资料库中读取该范例资料、至使用者建立之字词资料库中搜寻该范例资料,或至线上字词库/句库中下载该范例资料。本专利技术所提供之由外部资料扩充例句之系统,其中,例句提取模块还用于由范例资料中提取对应范例句之翻译资料,储存模块更用于储存翻译资料至例句资料表中。此外, 例句提取模块更用于判断范例资料之资料组成结构,并依据资料组成结构由范例资料中读取范例句。本专利技术所提供之由外部资料扩充例句之系统,更包含索引建立模块,用于依据字词资料表中与目标字词对应之目标识别资料及例句资料表中与范例句对应之例句识别资料产生查找索引资料,储存模块更用于储存查找索引资料。本专利技术所提供之由外部资料扩充例句之方法,其步骤至少包括提供目标资料表及例句资料表;由外部资料库获取范例资料;依据储存于目标资料表中之目标资料,由范例资料中提取包含目标资料之范例句;储存范例句至例句资料表中。本专利技术所提供之由外部资料扩充例句之方法,其中,由范例资料中提取包含目标资料之范例句之步骤为判断范例资料之资料组成结构,并依据资料组成结构由范例资料中读取范例句。本专利技术所提供之由外部资料扩充例句之方法,于储存范例句至例句资料表中之步骤前,还包含依据目标资料修正范例句中之错误语法为正确语法之步骤,及/或包含由范例资料中提取对应范例句之翻译资料之步骤,并于储存范例句至例句资料表中之步骤时, 一并储存翻译资料至例句资料表。本专利技术所提供之由外部资料扩充例句之方法,更包含依据字词资料表中与目标字词对应之目标识别资料及例句资料表中与范例句对应之例句识别资料产生查找索引资料, 并储存查找索引资料之步骤。本专利技术所提供之系统与方法如上,与先前技术之间的差异在于本专利技术通过至外部资料库获取范例资料后,由范例资料中提取包含目标资料之范例句,藉以解决先前技术所存在的问题,并可以达成减少辞典软件开发商不断发布新例句之负担的技术功效。附图说明图1为本专利技术所提之由外部资料扩充例句之系统架构图。图2A为本专利技术所提之由外部资料扩充例句之方法流程图。图2B为本专利技术所提之另一种由外部资料扩充例句之方法流程图。图2C为本专利技术所提之提取范例句之详细方法流程图。图3为本专利技术实施例所提之查找索引资料之关系示意图。具体实施例方式以下将配合图式及实施例来详细说明本专利技术之特征与实施方式,内容足以使任何熟习相关技艺者能够轻易地充分理解本专利技术解决技术问题所应用的技术手段并据以实施, 藉此实现本专利技术可达成的功效。本专利技术所提之目标字词为被储存在辞典资料库中的字词,使用者可以使用目标字词查找出相对应的释义资料,本专利技术也可以依据目标字词取得范例句;本专利技术所提之释义资料为让使用者更了解相对应之字词的涵义的资料,包含字词的发音、说明、例 句等,但本专利技术所提之释义资料并不以此为限。其中,本专利技术所提之范例句为包含目标字词的例句。以下先以「图1」本专利技术所提之由外部资料扩充例句之系统架构图来说明本专利技术的系统运作。如「图1」所示,本专利技术之系统含有储存模块110、资料获取模块120以及例句提取模块130。储存模块110负责储存目标资料表以及例句资料表,藉以提供目标资料表以及例句资料表给后续模块使用。储存模块110所储存之目标资料表中的每笔记录至少包含目标资料以及相对应之目标识别资料,其中,目标资料可以为单字/单词、片语等,目标识别资料则可以为一连串文数字的组合,且目标资料表中不存在相同的目标识别资料,但本专利技术所提之目标资料以及目标识别资料并不以上述为限。 储存模块110所储存之例句资料表中的每笔记录至少包含范例句以及相对应之例句识别资料。相似的,例句识别资料可以为一连串文数字的组合,且例句资料表中不存在相同的例句识别资料。另外,储存模块110更可以将与例句资料表中之范例句对应的翻译资料储存到例句资料表中。资料获取模块120负责由本专利技术之外(与本专利技术没有直接关联)的资料库中获取范例资料。范例资料通常为包含范例句的一段文字,但本专利技术所提之范例资料并不以此为限。资料获取模块120可以至辞典软件所预先建立之辞典资料库中读取出范例资料, 例如由辞典资料库所包含之谤语、名言、日常用语、场景对话等内容中读取出包含范例句的范例资料,又如由辞典资料库所包含之线上阅读、线上翻译之内容中读取出包含范例句的范例资料。资料获取模块120也可以至使用者自行建立之字词资料库中,读取例句中包含目标字词之释义资料做为范例资料,在此情况下,释义资料所对应的字词/片语即为目标资料。另外,资料获取模块120还可以通过线上字词库/句库所提供的搜寻功能,使用目标资料搜寻出范例资料。上述预先建立之辞典资料库以及使用者自行建立之字词资料库可以储存在执行本专利技术之装置的内部储存媒体中,也可以储存在执行本专利技术之装置外部的其他装置中。当辞典资料库与自词资料库储存在外部的其他装置中时,资料获取模块120会连线到该装置下载范例资料。例句提取模块130负责依据目标资料,由资料获取模块120所获取的范例资料中提取出范例句,并将提取出的范例句储存到储存模块110的例句资料表中。例句提取模块 130可以先判断范例资料的资料组成结构,并依据范例资料的资料组成结构得之范例句在范例资料的哪一个部分,藉以由范例资料中读取出范例句。一般而言,例句提取模块130中可以预先储存各种来源之范例资料的资料组成结构,但本专利技术并不以此为限,例如,例句提取模块130也可以直接分析范例资料的内容,藉以判断可以提取的范例句。例句提取模块130也可以由范例本文档来自技高网...

【技术保护点】
1.一种由外部资料扩充例句之方法,其特征在于,该方法至少包含下列步骤:提供一目标资料表及一例句资料表;由外部资料库获取一范例资料;依据储存于该目标资料表中之一目标资料,由该范例资料中提取包含该目标资料之一范例句;及储存该范例句至该例句资料表中。

【技术特征摘要】

【专利技术属性】
技术研发人员:邱全成冯玮
申请(专利权)人:英业达股份有限公司
类型:发明
国别省市:71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1