一种词根表的相似词处理方法技术

技术编号:8735164 阅读:214 留言:0更新日期:2013-05-26 11:45
本发明专利技术公开了一种词根表的相似词处理方法。本方法为:在词根表数据库中建立一相似库、一当前库和一历史库;当新个体加入词根表时,计算相似个体的相似系数和适合系数,适合系数最大者进入词根表当前库,其他个体则加入相似库,并补充相似库和属性。与现有技术相比,本发明专利技术提升了词根表对领域业务反映的广泛性。随着大数据的广泛应用,以建议书系统等为代表的行业应用不断发展,在这种情况下,从词根表的层面进行相似词的处理和积累,可方便进行更多的行业应用。本发明专利技术不仅能应用于保险领域,对其他领域的行业应用也有指导意义。

【技术实现步骤摘要】

本专利技术属于行业应用软件建设领域,具体涉及,主要是对支撑行业应用软件数据字段命名的语义字典表进行相似词的处理。
技术介绍
词根表是行业应用软件中用以表述领域内容的术语组成的词码表。词根包括最基础的词及其缩写符号,也可以是某些词根组成的新词。词根是领域概念在软件实现过程中的缩写与约定,是软件设计和实现中各种概念元素命名构造的基本单位。词根的分类进退设计旨在适应行业软件开发规范和标准的发展,统一领域语义,实现软件开发过程成果物的一致性,供开发人员参考遵循,避免不必要的重复工作和资源浪费,提高工作效率和质量。在词根表的层面进行相似词的处理和积累,有利于为软件开发人员设计数据结构、撰写需求规格说明书提供更多的选择性;为建议书系统等行业应用提供可用素材,同时有利于构建一个开放、丰富的词根表体系。
技术实现思路
本专利技术解决的技术问题:本专利技术提出了一种行业应用软件词根表中相似词的处理方法。本专利技术的目的是提供一种行业应用软件词根表中相似词的处理方法。基于此处理方法生成的词根表相似库反映了行业业务的实际发展需求。词根表是行业应用软件构建和实施的基础,是开发过程一系列成果物的重要支撑。丰富、多样的词根表体系,有助于提高开发效率,提升软件品质。IDC “中国保险解决方案2009-2013市场预测与分析”指出,中科软在保险行业IT解决方案(包括财产险核心业务系统、寿险核心业务系统、ERM、多渠道客户服务、网上保险系统、再保险业务处理系统等)提供商的收入及市场份额连续五年均排名第一。该方法的主要思想是:当新个体加入词根表时,计算相似“个体”的相似系数和“适合”系数,适合系数最大者进入词根表当前库,其他个体则加入相似库,并补充相似库和属性。词根表相似词的处理步骤如下:(I)新“个体”加入词根表时,计算与已有词根表及相似库“个体”的相似系数;(2)相似系数大于k(如0.9)的所有个体中,“适合”系数最大者保留在词根表中,其余个体进入相似库;(3)补充“个体”在相似库中其余属性。其中,据规范文件ACORD文件、金融术语文件、《精编英汉保险词典》、保险术语表和保险术语文件计算适合系数。与现有技术相比,本专利技术的积极效果为:本专利技术在词根表这一指导行业软件开发的标准制定过程中,增加了相似词的处理,提升了词根表对领域业务反映的广泛性。中科软凭借在行业应用领域的经验和领域知识积累,实现了词根表相似词处理在保险领域内的良好实践。随着大数据的广泛应用,以建议书系统等为代表的行业应用不断发展,在这种情况下,从词根表的层面进行相似词的处理和积累,可方便进行更多的行业应用。本专利技术不仅能应用于保险领域,对其他领域的行业应用也有指导意义。附图说明附图为本专利技术的方法流程图。具体实现方式下面结合附图对本专利技术进行详细描述。本专利技术的处理方法流程如图所示。I)有新“个体”加入时,计算与已有词根表及相似库“个体”的相似系数;2)相似系数大于k(如0.9)的所有个体中,“适合”系数最大者保留在词根表中,其余个体进入相似库;3)补充“个体”在相似库中其余属性。权利要求1.,其步骤为: 1)在词根表数据库中建立一相似库、一当前库和一历史库; 2)新词根加入当前库时,计算其适合系数; 3)计算每一新词根与当前库及相似库中词根的相似系数; 4)将新词根中相似系数大于k,且适合系数最大者保留在当前库,其余词根进入相似库。2.如权利要求1所述的方法,其特征在于对相似库中词根的属性进行补充。3.如权利要求1或2所述的方法,其特征在于根据规范文件ACORD文件、金融术语文件、《精编英汉保险词典》、保险术语表和保险术语文件计算所述适合系数。全文摘要本专利技术公开了。本方法为在词根表数据库中建立一相似库、一当前库和一历史库;当新个体加入词根表时,计算相似个体的相似系数和适合系数,适合系数最大者进入词根表当前库,其他个体则加入相似库,并补充相似库和属性。与现有技术相比,本专利技术提升了词根表对领域业务反映的广泛性。随着大数据的广泛应用,以建议书系统等为代表的行业应用不断发展,在这种情况下,从词根表的层面进行相似词的处理和积累,可方便进行更多的行业应用。本专利技术不仅能应用于保险领域,对其他领域的行业应用也有指导意义。文档编号G06F17/30GK103116659SQ20131007753公开日2013年5月22日 申请日期2013年3月12日 优先权日2013年3月12日专利技术者左春, 庞朴, 张正, 魏萍 申请人:中科软科技股份有限公司本文档来自技高网...

【技术保护点】
一种词根表的相似词处理方法,其步骤为:1)在词根表数据库中建立一相似库、一当前库和一历史库;2)新词根加入当前库时,计算其适合系数;3)计算每一新词根与当前库及相似库中词根的相似系数;4)将新词根中相似系数大于k,且适合系数最大者保留在当前库,其余词根进入相似库。

【技术特征摘要】

【专利技术属性】
技术研发人员:左春庞朴张正魏萍
申请(专利权)人:中科软科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1