一种行业应用软件词根表的分类进退方法技术

技术编号:8735163 阅读:173 留言:0更新日期:2013-05-26 11:45
本发明专利技术公开了一种行业应用软件词根表的分类进退方法。本方法为:1)在词根表数据库中建立一当前库和一历史库,将当前库中的词根按递进分类方法进行分组,每一分组设有一最大容量值;2)根据新词根的适合系数确定其所对应的分组Ti,将其添加到Ti并自动补充该词根的属性;3)如果Ti中词根总数超过其最大容量值ki,则进行降级操作:将该Ti中所有词根按适合系数排序,适合系数最小的词根进入其前一分组Ti-1;4)依次触发降级操作直到某一分组中的词根总数未超过其最大容量值,如果适合系数最低分组T1发生降级,则将T1中适合系数最小词根移到历史库。本发明专利技术提升了词根表当前库的稳定性和自我优化能力,以及词根表体系的开放性。

【技术实现步骤摘要】

本专利技术属于行业应用软件建设领域,具体来说,涉及一种对支撑行业应用软件数据字段命名的语义字典表进行分类进退方法。由于业务内容的不断发展,领域知识呈动态的变化趋势,词根表成为一个动态变化的开放系统,使用分类进退方法对其进行适应性设计,可在控制词根表无限膨胀的前提下满足业务需要。本专利技术不仅能应用于保险领域,对其他领域的行业应用也有指导意义。
技术介绍
词根表是行业应用软件中用以表述领域内容的术语组成的词码表。词根包括最基础的词及其缩写符号,也可以是某些词根组成的新词,由中英文为基础另加多种语言的词根集合构成词根表。统一词根表便于更大范围的交流和共享。词根是领域概念在软件实现过程中的缩写与约定,是软件设计和实现中各种概念元素命名构造的基本单位。词根的分类进退设计旨在适应行业软件开发规范和标准的发展,统一领域语义,实现软件开发过程成果物的一致性,供开发人员参考遵循,避免不必要的重复工作和资源浪费,提高工作效率和质量。一般而言,一项标准的制定按照立项论证、人员分配、文献检索、起草准备、征求意见稿、审查会及定稿多个步骤完成。而当标准制定后,标准随具体业务环境发展而变化的可能性较小,具有一定的迟滞性,具体到词根表设计,以往的方法都仅实现封闭的词根表积累,并未实现动态、开放的局部流动,不存在词根表的分类进退设计,因为存在大量重复工作和资源浪费,工作效率低且质量差。
技术实现思路
针对现有技术中 存在的技术问题,本专利技术的目的在于提供。基于此分类进退设计生成的词根表反映了行业业务的实际发展需求,也解决了词根表无限膨胀的问题。词根表是行业应用软件构建和实施的基础,是开发过程一系列成果物的重要支撑。完善、规范的词根表,有助于提高开发效率,提升软件品质。IDC “中国保险解决方案2009-2013市场预测与分析”指出,中科软在保险行业IT解决方案(包括财产险核心业务系统、寿险核心业务系统、ERM、多渠道客户服务、网上保险系统、再保险业务处理系统等)提供商的收入及市场份额连续五年均排名第一。为实现上述目的,本专利技术的解决方案是: 列举词根表的分类词根表可按照不同的规则进行多种分类,如单分类、组合分类等。⑴单分类可将词根表按照不同的属性进行单一分类,如分为应用/备用、业务/财务等,这一分类形式称为单分类。⑵递进分类可将词根表根据不同的属性进行递进分类,如(基础,通用)、(核心、通用)、(基础、专用)、(核心、专用)等。递进分类之间有递进关系,词根可按照一定规则在不同的组合分类之间变动。该方法的主要思想是:词根表可按照分类方法分为递进的不同类别,分类进退设计是指词根表分为当前库和历史库,将当前库分为多个具有递进关系的“个体”容量一定的分组。当发生如下两种情况:I)插入(新“个体”需要加入已分组的当前库时);2)巡查(定期,如每半年检索数据字典,确定当前库所有使用频率有变化的“个体”);将触发升级和降级规则,从而最终实现词根表内“个体”在分组之间的流动和循环。词根表的优化设计步骤如下:(I)检索数据字典,按照使用频率将当前库分为具有递进关系的多个分组;(2)当有新“个体”需要加入词根表时,计算其“适合系数”,并自动补充相关属性;(3)根据该“个体”的适合系数,将其自动添加到当前库Ti分组;(4)如果Ti分组“个体”总数超过其“个体”容量Ici,则将该分组Ti中所有“个体”按“适合”系数排序,“适合系数”最小的“个体”进入其前一分组IV1,依次触发降级操作,适合系数最低分组T1分组“个体”若发生降级,则将适合系数最小词根直接进入历史库;(5)定期(如每半年)检索数据字典,确认使用频率变化的“个体”;(6)计算使用频率变化的个体的适合系数,将其插入到相应的目标分组;(7)若目标分组“个体”数超过其“个体”容量,则触发新的降级操作;(8)进入(5),直到新“个体”需要加入,进入(2)。与现有技术相比,本专利技术的积极效果为:本专利技术在词根表这一指导行业软件开发的标准制定过程中,采用了循环优化的方法,提升了标准对具体业务环境反映的准确性和对具体业务指导的实时性。由于采用分类进退设计方法,提升了词根表当前库的稳定性和自我优化能力,同时由于历史库是容错的、开放的,从而提升整个词根表体系的开放性,以便在行业应用软件中有效的使用,与现有方法论相比,本专利技术有本质的差别。事实上,特定领域内的语义字典积累及其分类进退发展具有重要意义。中科软凭借在行业应用领域的经验和领域知识积累,实现了分类进退设计的词根表在保险领域内的良好实践。附图说明图1词根表变化对行业应用软件开发的影响;图2新词根加入时词根表分类进退步骤流程图;图3为定期巡查时词根表分类进退步骤流程图;图4为文本分类方法流程图;图5为分类进退降级方法流程图。具体实现方式下面结合附图对本专利技术进行进一步详细描述。I)有新“个体”加入时,词根表分类进退步骤流程如图2所示。2)定期检索数据字典,确定使用频率发生变化的个体,词根表分类进退步骤流程如图3所示。注I初始词根表分组规则(I)根据“适合”系数将词根表分为当前库和历史库,当前库个体“容量”为N(N为固定数,如5000),历史库“个体”容量为M(M不固定);(2)根据已有数据字段名/数据表名,程序变量名/程序表名生成数据字典,确定词根个体的使用频率;(3)检索数据字典,确定词根表每一“个体”的使用频率,按照使用频率从大到小的顺序,依次将词根表当前库分为Tk、...,T2jT1等k个使用频率依次降低的分组,每个组的最大“个体”容量为I^Eki= N,历史库G1的“个体”容量可以无限大。注2计算“个体”的“适合”系数根据规范文件一ACORD/保险术语/金融术语/词典/保险术语表,形成中英文名称的“适合”系数计算算法,计算不同“个体”的“适合”系数大小:I)检索保险术语表是否存在该词英文名称,记为V1,存在则V1 = I,反之则为O ;2)检索ACORD文件是否存在该词英文名称,记为V2,存在则V2 = 1,反之则为O ;3)检索《精编英汉保险词典》,确认该英文名称的中文含义中是否有对应的中文名称,记为V3,存在则V3 = I,反之则为O ;4)检索保险术语文件是否存在该词中文名称,记为V4,存在则%= 1,反之则为O ;`5)检索金融术语文件是否存在该词中文名称,记为V5,存在则V5= I,反之则为O ;6)检索《精编英汉保险词典》,确认该中文名称的含义中是否有对应的中文含义,记为v6,,存在则V6 = I,反之则为O ;7)计算“个体”的“适合”系数为:fitness = a ^1+ α 2ν2+ α 3ν3+ α 4ν4+ α 5ν5+ α 6ν6 ( α j+ α 2+ α 3+ α 4+ α 5+ α 6 = I);8)若不同“个体”的“适合”系数相等,则进行标注供人工定时处理。注3对新加入“个体”添加其他属性(I)对于中文含义或英文含义为空的“个体”,自动检索保险术语表(中文含义)和ACORD文件(英文含义)进行补充,未检索到则进行标注供人工操作;(2)新“个体”检索匹配到库中“个体”且仅有一个中文含义或英文含义时,直接补充为该中英文含义;(3)对于分类属性为空的“个体”,自动添加分类属性,首先对个体进行分类,其流程如图4所不。输入:词根X1U11本文档来自技高网...

【技术保护点】
一种行业应用软件词根表的分类进退方法,其步骤为:1)在词根表数据库中建立一当前库和一历史库,将当前库中的词根按照递进分类方法进行分组,每一分组设有一最大容量值;2)当一新词根需要加入词根表时,根据词根的适合系数确定其所对应的分组Ti,将其添加到该分组Ti并自动补充该词根的属性;3)如果该Ti分组中词根总数超过其最大容量值ki,则进行降级操作:将该分组Ti中所有词根按适合系数排序,适合系数最小的词根进入其前一分组Ti?1;4)依次触发降级操作直到某一分组中的词根总数未超过其最大容量值,如果适合系数最低分组T1发生降级,则将分组T1中适合系数最小词根移到历史库。

【技术特征摘要】

【专利技术属性】
技术研发人员:左春张正庞朴魏萍
申请(专利权)人:中科软科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1