一种流行缩略语的中文释义匹配系统,其特征在于包括中央计算机、筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组、查询服务器。一种流行缩略语的中文释义匹配方法,其利用流行缩略语的中文释义匹配系统以进行,其特征在于,包括以下步骤:原始信息搜集步骤、筛选步骤、编制步骤、查询步骤、返查步骤、总结步骤。步骤。步骤。
【技术实现步骤摘要】
一种流行缩略语的中文释义匹配系统与方法
[0001]本专利技术涉及缩略语的分析和查询
,尤其涉及一种流行缩略语的中文释义匹配系统与方法。
技术介绍
[0002]英语由于其本身不够简略,很多科技或者法律等学术名称难以很短就说清,因此,英文行文中缩略语大行其道,这一方面对于英语国家人员节约输入和读取精力,但对于非英语母语国家人员来讲,有很大的理解困难,例如ASAP,英语国家人员都理解是as soon as possible,非英语母语国家人员则不明所以。介于英语缩略语在科技、法律、医疗、商业信函中的广泛使用,为非英语母语国家人员提供缩略语的查询和翻译功能刻不容缓。
[0003]但是现有技术中鲜有这种软件或技术,一般缩略语查询多依附于词典,或者是某电子词典的一部分,或者最多是某词典的词库,也有将缩略语单独列出进行查询的一些软件,但是这些软件或系统,明显内容不足。
[0004]缩略语与词汇查询有着非常大的不同,一般词汇内容较为固定,如果要查询词汇,95
‑
98%以上的内容都可以靠词典或者电子词典本身搞定,但是缩略词则很难,一是缩略词的变化很快,往往一个月就可以产生数以千计的新缩略语,固定词库很难应付其高速增长的态势,二是缩略语的查询比较难,往往需要结合上下文,语境,其
的说明才能确定到底是哪一个具体含义。例如BT、ZT、PMP等缩略语,其在不同领域都有不同含义,有时一个缩略词的含义有十几种,这为查询确认带来了很大困难。还有一个现有技术的不足,是在用户发现没有该要查询的含义时,系统可以利用该发现直接丰富词库,而现有技术的查询往往不具备这样的功能,导致词库只能由管理人员更新,浪费了查询者的参与意愿。
技术实现思路
[0005]本专利技术的第一目的是解决现有技术中所存在的没有有效又全面地查询缩略语的中文释义的有效系统,而设计的。而且系统经过尽心设计,充分地适合互联网时代的情况,大量地吸纳并筛选新的缩略语,并周期性地经过审核和编辑,有效地加入词库。同时,本申请还有效地利用了读者的增补意愿,将查询不到的词直接纳入审核,使得用户的参与意愿得到了充分尊重,词库的建设也更有针对性。
[0006]本申请要求保护一种流行缩略语的中文释义匹配系统,其特征在于:包括中央计算机、筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组、查询服务器。
[0007]筛选服务器从互联网获取数据,用于从互联网获取数据中筛选疑似缩略语信息并生成初步条目。
[0008]基础服务器存储有缩略语释义条目,缩略语释义条目有预加载的部分和后来加入的部分,缩略语释义条目包含缩略语、英文全称、中文释义、摘要,摘要包含缩略语的定义、作用、由来、用途、
的说明,且不少于150字。
[0009]筛选终端组包含若干个筛选终端,每个筛选终端用于给出初步条目是否属于缩略
语的判断意见。
[0010]编制终端组包含若干个编制终端,每个编制终端用于将筛选终端确认的缩略语条目按照缩略语释义条目进行规范编写。
[0011]查询终端组包含若干个查询终端,每个查询终端用于查询人员从基础服务器中查询和确认缩略语释义条目。
[0012]查询服务器接收所有查询终端的查询行为数据,并如实记录。
[0013]进一步地,每一个筛选终端、编制终端和查询终端均是具有需要身份认证的智能手机或PDA,每一个筛选终端和查询终端均只允许特定的一个认证人员登录;每一个编制终端允许不特定的认证人员登录,但登录时必须输入自身的身份码。
[0014]所述缩略语是英文缩略语,摘要为中文且可选地包含英文。
[0015]基础服务器和筛选服务器均自带计算模块,中央计算机全部或补充地处理筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组之间的计算或数据处理操作。
[0016]中央计算机配有计算用的足量缓冲存储器,以及至少一台能自动按指示向互联网发送邮件的PC终端。
[0017]一种流行缩略语的中文释义匹配方法,其利用如前所述的一种流行缩略语的中文释义匹配系统以进行,其特征在于,包括以下步骤。
[0018](1)原始信息搜集步骤:由中央计算机周期性地搜集疑似缩略语的原始字符串信息,并将其记录到筛选服务器的预收录存储区;每24h搜集不少于500
‑
1000条;该疑似缩略语至少包含一个连续英文字符串和多个连续英文单词,连续英文字符串至少包含两个大写英文字母,多个连续英文单词中至少两个连续单词的首字母存在于连续英文字符串中,并且以同样顺序连续存在。
[0019](2)筛选步骤:中央计算机指示筛选服务器,将每天新增的原始字符串信息,发送至随机的筛选终端以筛选,每一个筛选终端在接收到原始字符串信息后,调取并参考基础服务器中已有的同样的或者相似的缩略语的连续字符串,判断是否是新的有效的缩略语,如果不是,指示筛选服务器予以删除,如果是,指示筛选服务器将该原始字符串信息存入永久存储区,并将该原始字符串信息发送至某一个编制终端;每天24时前,确保前一天新增的原始字符串信息全部得到筛选。
[0020](3)编制步骤:当某随机的编制终端接到判定为是的原始字符串信息时,将其按照缩略语、英文全称、中文释义、摘要的顺序编制为适于基础服务器存储的缩略语条目,并经另一台随机的编制终端修改确认,将缩略语正式条目发送至基础服务器,存储为缩略语释义条目。
[0021](4)查询步骤:使用人使用某一台查询终端,输入欲查询的缩略语以查询,基础服务器向该查询终端推送与该缩略语相符的一个或多个缩略语条目,并由查询终端确认,当查到正确释义时,终止查询,当没有找到正确释义时,查询人填写该缩略语的可能英文全称和可能释义,生成返查缩略语释义并将其推送至中央计算机;并且查询终端作出的所有查询行为,都记录且送至查询服务器存储。
[0022](5)返查步骤:对于返查缩略语释义,将其发送至筛选服务器的返查存储区存储,并按照步骤(2)同样的操作送至筛选终端进行筛选,并按照步骤(2)
‑
(3)顺序执行。
[0023](6)总结步骤:当匹配系统运行1
‑
3月时,分析查询服务器的结果,并统计查询到
的,没查到的以及返查缩略语释义被确认的比例数据,生成匹配报告,并上传至查询服务器以及所有的筛选终端、编制终端和查询终端。
[0024]进一步地,针对于步骤(2)、(3)中向筛选终端和编制终端发送工作,每次随机地向筛选终端或编制终端选取一个并发送工作,直至全部筛选终端或编制终端都执行过一次工作,重复此过程;步骤(3)中编制终端的编制工作附加摘要的中文翻译。
[0025]本专利技术的优点是,主要可以分为以下几点,一是设置了一套专门的缩略语查询系统,查询缩略语的准确度,全面性都有保证,现有技术中并无单纯缩略语的系统,这一点是明显进步。二是将缩略语的编制工作有效分解,现有技术中即使有缩略语词库,其也都是由管理人员人工编制的,本申请将其编制过程分为,自动收集,初步判本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种流行缩略语的中文释义匹配系统,其特征在于:包括中央计算机、筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组、查询服务器;筛选服务器从互联网获取数据,用于从互联网获取数据中筛选疑似缩略语信息并生成初步条目;基础服务器存储有缩略语释义条目,缩略语释义条目有预加载的部分和后来加入的部分,缩略语释义条目包含缩略语、英文全称、中文释义、摘要,摘要包含缩略语的定义、作用、由来、用途、技术领域的说明,且不少于150字;筛选终端组包含若干个筛选终端,每个筛选终端用于给出初步条目是否属于缩略语的判断意见;编制终端组包含若干个编制终端,每个编制终端用于将筛选终端确认的缩略语条目按照缩略语释义条目进行规范编写;查询终端组包含若干个查询终端,每个查询终端用于查询人员从基础服务器中查询和确认缩略语释义条目;查询服务器接收所有查询终端的查询行为数据,并如实记录。2.如权利要求1所述的一种流行缩略语的中文释义匹配系统,其特征在于:每一个筛选终端、编制终端和查询终端均是具有需要身份认证的智能手机或PDA,每一个筛选终端和查询终端均只允许特定的一个认证人员登录;每一个编制终端允许不特定的认证人员登录,但登录时必须输入自身的身份码;所述缩略语是英文缩略语,摘要为中文且可选地包含英文;基础服务器和筛选服务器均自带计算模块,中央计算机全部或补充地处理筛选服务器、基础服务器、筛选终端组、编制终端组、查询终端组之间的计算或数据处理操作;中央计算机配有计算用的足量缓冲存储器,以及至少一台能自动按指示向互联网发送邮件的PC终端。3.一种流行缩略语的中文释义匹配方法,其利用如前权利要求2所述的一种流行缩略语的中文释义匹配系统以进行,其特征在于,包括以下步骤:(1)原始信息搜集步骤:由中央计算机周期性地搜集疑似缩略语的原始字符串信息,并将其记录到筛选服务器的预收录存储区;每24h搜集不少于500
‑
1000条;该疑似缩略语至少包含一个连续英文字符串和多个连续英文单词,连续英文字符串至少包含两个大写英文字母,多个连续英文单词中至少两个连续单词的首字母...
【专利技术属性】
技术研发人员:孙怀芳,
申请(专利权)人:临沂职业学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。