【技术实现步骤摘要】
数据对象英文编码方法及装置
本专利技术属于核电
,具体涉及一种数据对象英文编码方法及装置。
技术介绍
随着我国核电群堆化管理以及核电事业的国际化,一批国产化的核电生产管理系统也在快速研发中。核电信息化项目建设过程中,中小型信息系统的数据对象英文编码通常由各项目承建方的业务人员编码,大型信息系统的数据对象英文编码则会由建设方的对应领域的业务专家编码。不同堆型、不同项目的编码方法不统一,导致同一中文数据对象的英文编码不一致,影响系统间的数据交换。2010年版《英汉核电技术词典》定义了核电领域62889个标准英文词条及3754条核电常用缩写词。在信息系统设计时,直接使用该词典还会遇到诸多问题:(1)《英汉核电技术词典》绝大多数的词条均是词组,而目前许多数据对象中文名称无法与该词典的词组直接对应;(2)词汇量不够。该词典还缺少库存、人工智能、信息技术、文件管理等领域的词条;(3)不满足信息系统要求。信息系统所依赖的基础IT设施有其特定要求,比如命名长度要求、特殊字符要求;(4)英文编码对人员要求很高。一个信息系统的数据 ...
【技术保护点】
1.一种数据对象英文编码方法,其特征在于,所述方法包括:/n获取待编码的数据对象;/n根据所述数据对象所关联的类别,以及类别与词库调用顺序的对应关系,确定所述数据对象被编码过程中所需的词库调用顺序,各词库内容互不重复;/n对所述数据对象进行分词处理,得到多个词;/n按照确定的词库调用顺序依次调用各词库对所述多个词进行编码,直至所述多个词被编码完成,形成编码结果。/n
【技术特征摘要】
1.一种数据对象英文编码方法,其特征在于,所述方法包括:
获取待编码的数据对象;
根据所述数据对象所关联的类别,以及类别与词库调用顺序的对应关系,确定所述数据对象被编码过程中所需的词库调用顺序,各词库内容互不重复;
对所述数据对象进行分词处理,得到多个词;
按照确定的词库调用顺序依次调用各词库对所述多个词进行编码,直至所述多个词被编码完成,形成编码结果。
2.根据权利要求1所述的方法,其特征在于,按照确定的词库调用顺序依次调用各词库对所述多个词进行编码,直至所述多个词被编码完成,形成编码结果,包括:
在按照确定的词库调用顺序每次调用词库时,若所述多个词中未被编码的词语与该次调用的词库匹配,则根据该次调用的词库对匹配的词进行编码,直至所述多个词被编码完成,形成编码结果。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述编码结果的字符长度;
判断所述编码结果的字符长度是否符合预设条件;
在所述编码结果的字符长度不符合预设条件的情况下,持续根据调用的中英缩写对照库,将当前多个单词字符最长的非缩写单词替换为缩写单词,形成新的编码结果,直至所述新的编码结果的字符长度符合预设条件。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若判断所述数据对象的类别为表名称,则获取所述数据对象关联的领域;
按照确定的词库调用顺序依次调用各词库对所述多个词进行编码,直至所述多个词被编码完成,形成编码结果,包括:
按照确定的词库调用顺序依次调用各词库对所述多个词和所述数据对象的领域进行编码,直至所述多个词和所述数据对象的领域被编码完成,形成编码结果。
5.一种数据对象英文编码装置,其特征在于,所述装置包括:
第一获取模块,用于获取待编码的数据对象;
第一确定模块,用于根据所述数据对象所关联的类别,以及类别与词库调用顺...
【专利技术属性】
技术研发人员:张冀兰,姚昊,杨加东,郭强,刘华,熊伟,富会佳,肖薇,杨沥铭,
申请(专利权)人:中核核电运行管理有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。