一种信息挖掘方法及装置制造方法及图纸

技术编号:15437228 阅读:147 留言:0更新日期:2017-05-25 19:24
本发明专利技术公开了一种信息挖掘方法及装置,所述方法包括获得待译对象包含的各个关键词及各关键词对应的翻译译项,从各个关键词对应的翻译译项中确定出至少一个译文引导词,所述译文引导词为各个关键词对应的翻译译项中所起的引导作用较大的翻译译项,将待译对象及译文引导词作为检索依据,检索待译对象对应的翻译参考信息;从检索结果中获取参考价值较高的至少一个检索条目并返回。可见,本发明专利技术通过获得待译对象对应的引导作用较大的引文引导词,结合利用待译对象及译文引导词对待译对象对应的翻译参考信息进行引导式检索,并通过从检索结果中获得及返回参考价值较高的至少一个检索条目,有效提升了基于网络搜索的辅助翻译效率及效果。

Information mining method and device

The invention discloses an information mining method and device, the method includes translation for each keyword to be translated and the corresponding object contains keywords, translation from various keywords corresponding to identify at least one of the guide words, the translation guide word translation for the translation in the guiding role of the various keywords corresponding to bigger, will be translated and the guide words as the basis of search, the information retrieval object to be translated; obtain high reference value from the search results in at least one of the search items and return. Therefore, the invention is obtained through the object to be translated corresponding to the larger boot citation guide words, combined with guided retrieval reference information to be translated using translation and translation guide words to translate object object, and through the acquisition and at least one retrieval entry return reference value is high from the search results, effectively enhance the the efficiency and effectiveness of assisted translation search based on network.

【技术实现步骤摘要】
一种信息挖掘方法及装置
本专利技术属于数据挖掘
,尤其涉及一种信息挖掘方法及装置。
技术介绍
翻译人员的翻译能力不仅取决于其双语水平,还取决于其对翻译工具和翻译资源的掌握能力。随着互联网技术的发展,互联网中蕴含了越来越丰富的能够辅助翻译的网络资源,翻译人员在遇到疑难词汇或短语时也越来越倾向于借助互联网来实现辅助翻译。目前,基于互联网实现辅助翻译的手段主要有三种:1)借助网络词典,2)借助网络自动翻译机器,3)借助网络搜索引擎从网络搜索翻译参考信息。对于网络词典而言,如在线翻译词典等,由于其尚未提供足够的语境翻译信息,易导致翻译人员在面对同一词汇/短语的多个翻译译项(如计算机对应computer、calculatingmachine等多个译项)时,往往无法决策;而网络自动翻译机器,如Google在线翻译等,因受机器翻译技术发展水平的限制,翻译质量常不尽如人意,距离实用化还有很大差距;借助网络搜索引擎,可以对互联网上的多语言官方网站、翻译论坛、翻译社区等蕴含的大量双语信息进行检索应用,这些信息具有动态性,并包含了大量的双语语境信息,能够较好地辅助翻译人员进行翻译。为了提高对互联网上的翻译参考信息进行检索时的检索效率及效果,得到参考价值较高的翻译参考信息,进而实现更好地辅助翻译,如何高效、准确地获取互联网中蕴含的与当前翻译需求关联较紧密的翻译参考信息变得十分重要。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种信息挖掘方法及装置,以实现高效、准确地获取互联网中蕴含的与当前翻译需求关联较紧密的翻译参考信息,进而提升基于网络搜索的辅助翻译效率及效果。为此,本专利技术公开如下技术方案:一种信息挖掘方法,包括:获得待译对象包含的各个关键词,及各个关键词在目标语言中对应的翻译译项;从各个关键词对应的翻译译项中确定出至少一个译文引导词,所述译文引导词为各个关键词对应的翻译译项中所起的引导作用较大的翻译译项;其中,翻译译项所起的引导作用为:在将待译对象及翻译译项作为检索依据,来利用翻译译项对待译对象进行引导式检索时,翻译译项对检索出所述待译对象对应的翻译参考信息所起到的引导作用;将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果;基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,并返回所述至少一个检索条目。上述方法,优选的,所述从各个关键词对应的翻译译项中确定出至少一个译文引导词包括:对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,得到一译项序列;从所述译项序列的相应端获得引导作用较大的至少一个翻译译项作为译文引导词。上述方法,优选的,所述对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,包括:依据各个关键词所对应的翻译译项的数量,对不同关键词的翻译译项进行排序;其中,同一关键词的各个翻译译项作为一个整体参与排序,关键词对应的翻译译项的数量与关键词翻译译项所起引导作用的大小呈反向关系;当存在所对应的翻译译项数量相同的不同关键词时,按所述不同关键词分别在所述待译对象中的重要度,对所述不同关键词的翻译译项进行排序;其中,关键词在待译对象中的重要度与关键词翻译译项所起的引导作用的大小呈正向关系;依据采用同一关键词的每个翻译译项对待译对象进行引导式检索时搜索引擎返回的检索条目的个数,对同一关键词的各个翻译译项进行排序;翻译译项对应的检索条目的个数与翻译译项所起的引导作用的大小呈正向关系。上述方法,优选的,所述将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果,包括:将所述待译对象及所述译文引导词作为检索依据在多个预定的搜索引擎中进行检索,得到多个搜索引擎的检索结果。上述方法,优选的,基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,包括:对所述多个搜索引擎的检索结果进行噪音滤除处理,并对滤除噪音后所得的多个搜索引擎的检索结果中相同的检索条目进行合并处理;依据待译对象及译文引导词在所述合并处理后所得的各检索条目中的出现位置、距离、信息来源,及所述各检索条目在每个搜索引擎返回检索结果中的默认排序中的任意一种或多种,计算合并后所得的各检索条目与所述待译对象的相关度数值;基于相关度数值,对合并后所得的各个检索条目进行排序;从排序后所得的条目序列的相应端获得相关度数值较高的至少一个检索条目,并返回所述至少一个检索条目。一种信息挖掘装置,包括:第一获取单元,用于获得待译对象包含的各个关键词,及各个关键词在目标语言中对应的翻译译项;确定单元,用于从各个关键词对应的翻译译项中确定出至少一个译文引导词,所述译文引导词为各个关键词对应的翻译译项中所起的引导作用较大的翻译译项;其中,翻译译项所起的引导作用为:在将待译对象及翻译译项作为检索依据,来利用翻译译项对待译对象进行引导式检索时,翻译译项对检索出所述待译对象对应的翻译参考信息所起到的引导作用;检索单元,用于将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果;第二获取单元,用于基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,并返回所述至少一个检索条目。上述装置,优选的,所述确定单元,进一步用于:对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,得到一译项序列;从所述译项序列的相应端获得引导作用较大的至少一个翻译译项作为译文引导词。上述装置,优选的,所述确定单元,进一步用于:依据各个关键词所对应的翻译译项的数量,对不同关键词的翻译译项进行排序;其中,同一关键词的各个翻译译项作为一个整体参与排序,关键词所对应的翻译译项的数量与关键词翻译译项所起引导作用的大小呈反向关系;当存在所对应的翻译译项数量相同的不同关键词时,按所述不同关键词分别在所述待译对象中的重要度,对所述不同关键词的翻译译项进行排序;其中,关键词在待译对象中的重要度与关键词翻译译项所起的引导作用的大小呈正向关系;依据采用同一关键词的每个翻译译项对待译对象进行引导式检索时搜索引擎返回的检索条目的个数,对同一关键词的各个翻译译项进行排序;翻译译项对应的检索条目的个数与翻译译项所起的引导作用的大小呈正向关系。上述装置,优选的,所述检索单元,进一步用于:将所述待译对象及所述译文引导词作为检索依据在多个预定的搜索引擎中进行检索,得到多个搜索引擎的检索结果。上述装置,优选的,所述第二获取单元,进一步用于:对所述多个搜索引擎的检索结果进行噪音滤除处理,并对滤除噪音后所得的多个搜索引擎的检索结果中相同的检索条目进行合并处理;依据待译对象及译文引导词在所述合并处理后所得的各检索条目中的出现位置、距离、信息来源,及所述各检索条目在每个搜索引擎返回检索结果中的默认排序中的任意一种或多种,计算合并后所得的各个检索条目与所述待译对象的相关度数值;基于相关度数值,对合并后所得的各个检索条目进行排序;从排序后所得的条目序列的相应端获得相关度数值较高的至少一个检索条目,并返回所述至少一个检索条目。由以上方案可知,本专利技术公开了一种信息挖掘方法本文档来自技高网...
一种信息挖掘方法及装置

【技术保护点】
一种信息挖掘方法,其特征在于,包括:获得待译对象包含的各个关键词,及各个关键词在目标语言中对应的翻译译项;从各个关键词对应的翻译译项中确定出至少一个译文引导词,所述译文引导词为各个关键词对应的翻译译项中所起的引导作用较大的翻译译项;其中,翻译译项所起的引导作用为:在将待译对象及翻译译项作为检索依据,来利用翻译译项对待译对象进行引导式检索时,翻译译项对检索出所述待译对象对应的翻译参考信息所起到的引导作用;将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果;基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,并返回所述至少一个检索条目。

【技术特征摘要】
1.一种信息挖掘方法,其特征在于,包括:获得待译对象包含的各个关键词,及各个关键词在目标语言中对应的翻译译项;从各个关键词对应的翻译译项中确定出至少一个译文引导词,所述译文引导词为各个关键词对应的翻译译项中所起的引导作用较大的翻译译项;其中,翻译译项所起的引导作用为:在将待译对象及翻译译项作为检索依据,来利用翻译译项对待译对象进行引导式检索时,翻译译项对检索出所述待译对象对应的翻译参考信息所起到的引导作用;将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果;基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,并返回所述至少一个检索条目。2.根据权利要求1所述的方法,其特征在于,所述从各个关键词对应的翻译译项中确定出至少一个译文引导词包括:对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,得到一译项序列;从所述译项序列的相应端获得引导作用较大的至少一个翻译译项作为译文引导词。3.根据权利要求2所述的方法,其特征在于,所述对各个关键词的翻译译项按照各翻译译项所起的引导作用的大小进行排序处理,包括:依据各个关键词所对应的翻译译项的数量,对不同关键词的翻译译项进行排序;其中,同一关键词的各个翻译译项作为一个整体参与排序,关键词对应的翻译译项的数量与关键词翻译译项所起引导作用的大小呈反向关系;当存在所对应的翻译译项数量相同的不同关键词时,按所述不同关键词分别在所述待译对象中的重要度,对所述不同关键词的翻译译项进行排序;其中,关键词在待译对象中的重要度与关键词翻译译项所起的引导作用的大小呈正向关系;依据采用同一关键词的每个翻译译项对待译对象进行引导式检索时搜索引擎返回的检索条目的个数,对同一关键词的各个翻译译项进行排序;翻译译项对应的检索条目的个数与翻译译项所起的引导作用的大小呈正向关系。4.根据权利要求1所述的方法,其特征在于,所述将所述待译对象及所述译文引导词作为检索依据,检索所述待译对象对应的翻译参考信息,得到检索结果,包括:将所述待译对象及所述译文引导词作为检索依据在多个预定的搜索引擎中进行检索,得到多个搜索引擎的检索结果。5.根据权利要求4所述的方法,其特征在于,基于预定的参考价值评价方式,从所述检索结果包含的各检索条目中获得参考价值较高的至少一个检索条目,包括:对所述多个搜索引擎的检索结果进行噪音滤除处理,并对滤除噪音后所得的多个搜索引擎的检索结果中相同的检索条目进行合并处理;依据待译对象及译文引导词在所述合并处理后所得的各检索条目中的出现位置、距离、信息来源,及所述各检索条目在每个搜索引擎返回检索结果中的默认排序中的任意一种或多种,计算合并后所得的各检索条目与所述待译对象的相关度数值;基于相关度数值,对合并后所得的各个检索条目进行排序;从排序后所...

【专利技术属性】
技术研发人员:王伟
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1