当前位置: 首页 > 专利查询>卢玉成专利>正文

手机网络检索用语简称-全称转换识别方法及装置制造方法及图纸

技术编号:8593946 阅读:445 留言:0更新日期:2013-04-18 07:06
本发明专利技术公开了一种手机网络检索用语简称-全称转换识别方法及装置,所述转换识别方法包括步骤:将输入的简称分解为由一个一个单字组成的单字串;从一全称数据库中找出含有所述单字串中所有单字的全称串,如果找不到所述全称串,则输出没有匹配的全称;对找到的候选全称串,分别按照相关度公式进行评分,并将最大评分值所对应的候选全称串作为该简称所对应的全称进行输出。本发明专利技术的转换识别方法,兼顾了准确率和处理速度。

【技术实现步骤摘要】

本专利技术涉及数据检索
,尤其与一种手机网络检索用语简称-全称转换识别方法及一种手机网络检索用语简称-全称转换识别装置有关。
技术介绍
在日常交流和书面写作中,根据人们日常的思维习惯和语言习惯,人们经常使用缩略语来指代一个名称较长的实体名称,如用“北工大”来指代“北京工业大学”。特别随着手机上网越来越普及,网络查询功能也越来越多地被广泛应用。但是,手机不像计算机具有操作屏幕大、查看方便、书写方便的特点,用户更希望通过词语缩略语的查询来获得自己需要的信息。因此,一种用手机网络用语简称来识别其全称的方法与装置就显得非常有必要。全称(F)是对实体或对象的名称的完整称呼,简称(A)是为了表达的简洁明快,而对全称进行精简压缩后得到的称呼,若F和A具有全简称关系,则称F为A的全称,A为F的简称。简称处理问题就是对给定的一个简称A,设法了解它的全称。简称处理问题已经成为自然语言处理、信息检索等应用中一个基本而又关键的问题。自然语言处理是计算机科学领域与人工智能领域中的一个重要问题。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。随着计算机和互联网的广泛应用,计算机可处理的自然语言文本数量空前增长,面向海量信息的文本挖掘、信息提取、跨语言信息处理、人机交互等应用需求急速增长,自然语言处理的对象也从小规模受限语言处理转向大规模真实文本处理,其研究必将对人们的生活产生深远的影响。信息检索,研究如何从纷繁复杂的大量信息中,快速、准确获取所需信息的技术。信息检索技术经过多年的发展,目前已经相当成熟,新型信息检索技术正朝智能化、动态化、多样化、个性化等方向发展。解决网络用语检索的简称处理问题的方法可以分为两大类一类是基于模式的方法,主要利用语言学和自然语言处理技术,通过词法分析和语法分析提取关系模式,然后利用模式匹配获取全简称关系,但该方法准确率难以达到理想的实用要求;另一类是基于统计的方法,主要基于语料库和统计语言模型,通过计算概念之间的关联度来获取全简称关系,该方法准确率虽高,但不能满足超大规模获取。而其他一些处理全简称问题的方法,处理速度不高,难以应用于搜索引擎这样的实时系统中。
技术实现思路
针对现有技术中存在的问题,本专利技术的目的在于提供一种手机网络检索用语简称-全称转换识别方法,以解决现有技术手机网络检索用语简称-全称转换识别方法不能兼顾准确率和处理速度的技术问题。本专利技术的另一个目的在于提供一种手机网络检索用语简称-全称转换识别装置。为实现上述目的,本专利技术的技术方案如下一种手机网络检索用语简称-全称转换识别方法,包括步骤将输入的简称分解为由一个一个单字组成的单字串;从一全称数据库中找出含有所述单字串中所有单字的全称串,如果找不到所述全称串,则输出没有匹配的全称;对找到的候选全称串,分别按照相关度公式进行评分,并将最大评分值所对应的候选全称串作为该简称所对应的全称进行输出。一种手机网络检索用语简称-全称转换识别装置,包括全称数据库、输入单元、匹配单元、评分单元、比较器和输出单元;所述输入单元,接收一输入的简称;所述匹配单元,将所述输入单元所输入的所述简称分解为由一个一个单字组成的单字串;并从所述全称数据库中找出含有所述单字串中所有单字的全称串;所述评分单元,对找到的候选全称串,分别按照相关度公式进行评分;所述比较器,比较所述评分单元的评分,选出最大评分值;输出单元,如果找不到所述全称串,则由输出单元输出没有匹配的全称;否则将最大评分值所对应的全称串作为该简称所对应的全称进行输出。本专利技术的有益效果在于,本专利技术的手机网络检索用语简称-全称转换识别方法,首先接收一个简称A作为输入,然后从一个全称数据库中找到A的侯选全称Fl.....Fn,最后根据特定的判断法则,挑选最好的一个(或多个)全称Fi,作为A的全称。本专利技术的方法具有较高的准确性和较快的处理速度,在含有2101个全称数据库(全国普通高校名称)的测试中,准确率达到97%。附图说明图1为本专利技术实施例的手机网络检索用语简称-全称转换识别方法的流程图。图2为本专利技术实施例的手机网络检索用语简称-全称转换识别装置的示意图。具体实施例方式体现本专利技术特征与优点的典型实施例将在以下的说明中详细叙述。应理解的是本专利技术能够在不同的实施例上具有各种的变化,其皆不脱离本专利技术的范围,且其中的说明及所附附图在本质上是当作说明之用,而非用以限制本专利技术。本专利技术的手机网络检索用语简称-全称转换识别方法,主要的步骤包括首先接收一简称A作为输入,然后从一全称数据库中找到简称A的侯选全称Fl.....Fn,最后根据一个判断法则,挑选最好的一个全称Fi作为A的全称输出。以下具体介绍本专利技术实施例的手机网络检索用语简称-全称转换识别方法与装置。本专利技术实施例的手机网络检索用语简称-全称转换识别方法,需要用到一全称数据库(包括检索用语简称所对应的一个或多个领域的所有可能全称的数据库,简称为FDB)。在给定的全称数据库FDB中,全称的形式如表I所示,它们以3列的方式存储在全称数据库中。表I本文档来自技高网
...

【技术保护点】
一种手机网络检索用语简称?全称转换识别方法,包括步骤:将输入的简称分解为由一个一个单字组成的单字串;从一全称数据库中找出含有所述单字串中所有单字的全称串,如果找不到所述全称串,则输出没有匹配的全称;对找到的候选全称串,分别按照相关度公式进行评分,并将最大评分值所对应的候选全称串作为该简称所对应的全称进行输出。

【技术特征摘要】
1.一种手机网络检索用语简称-全称转换识别方法,包括步骤将输入的简称分解为由一个一个单字组成的单字串;从一全称数据库中找出含有所述单字串中所有单字的全称串,如果找不到所述全称串,则输出没有匹配的全称;对找到的候选全称串,分别按照相关度公式进行评分,并将最大评分值所对应的候选全称串作为该简称所对应的全称进行输出。2.如权利要求1所述的手机网络检索用语简称-全称转换识别方法,其特征在于,所述相关度公式为3.如权利要求2所述的手机网络检索用语简称-全称转换识别方法,其特征在于,还包括针对每个全称预先计算相关度并将结果进行缓存的步骤。4.如权利要求3所述的手机网络检索用语简称-全称转换识别方法,其特征在于,还包括建立全称数据库的单字倒排表的步骤。5.一种手机网络检索用语简称-全称转换识别装置,包括全称数据库、输入单元、匹配单元、评分单元、比较器和输出单元;所述输入单元,接收一输入的简称;所述匹...

【专利技术属性】
技术研发人员:卢玉成
申请(专利权)人:卢玉成
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1