The invention discloses a dictionary input method and a system, belonging to the technical field of translation. The method comprises: acquiring a plurality of input character information, a plurality of character information as input to the same entry picture information; when the probability of the same position of the same morpheme morpheme multiple input character information in the larger than the threshold, determining the final morpheme morpheme for entry. In the invention, for the same entry picture, can obtain a plurality of input character information, through the selected the same morpheme probability greater than the threshold value of the same morpheme positions of a plurality of input character information, to ensure the accuracy of screening high input results in multiple input character information, it can effectively improve the accuracy of dictionary entry the results of the.
【技术实现步骤摘要】
本专利技术涉及翻译
,特别涉及一种词典录入方法及系统。
技术介绍
现有技术中,对于词典类数据的录入,一般由一人或两人进行整本词典的录入工作,不仅耗时长,效率低而且还不能保证准确率。
技术实现思路
本专利技术实施例提供了一种词典录入方法及系统,旨在解决如何提高词典录入结果的准确率。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。根据本专利技术实施例的第一方面,提供了一种词典录入方法,包括:获取多个录入字符信息,多个字符信息为对同一词条图片进行录入后的信息;当多个录入字符信息中相同语素位置同一语素出现的概率大于阈值时,确定语素为最终语素。根据本专利技术实施例的第二方面,提供一种词典录入系统,包括:录入模块,用于获取多个录入字符信息,录入字符信息为对同一词条图片进行录入后的信息,最终语素模块,当录入模块获取的多个录入字符信息中相同语素位置同一语素出现的概率大于阈值时,确定同一语素为最终语素。本专利技术实施例提供的技术方案可以包括以下有益效果:在本专利技术中,针对同一词条图片,能够获得多个录入字符信息,通过筛选出多个录入字符信息中相同语素位置出现概率大于阈值的同一语素,能够确保在多个录入字符信息中筛选出准确性较高的录入结果,因此能够有效提高词典录入结果的准确性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书 ...
【技术保护点】
一种词典录入方法,其特征在于,包括:获取多个录入字符信息,所述多个录入字符信息为对同一词条图片进行录入后的信息;当所述多个录入字符信息中相同语素位置同一语素出现的概率大于阈值时,确定所述语素为最终语素。
【技术特征摘要】
1.一种词典录入方法,其特征在于,包括:获取多个录入字符信息,所述多个录入字符信息为对同一词条图片进行录入后的信息;当所述多个录入字符信息中相同语素位置同一语素出现的概率大于阈值时,确定所述语素为最终语素。2.如权利要求1所述的方法,其特征在于,所述确定所述语素为最终语素包括:当对应的词典库中存在所述语素时,确定所述语素为所述最终语素。3.如权利要求1所述的方法,其特征在于,获取多个录入字符信息前,还包括:获取识别字符信息,所述识别字符信息为所述同一词条图片进行光学字符识别后的信息。4.如权利要求3所述的方法,其特征在于,所述当所述多个录入字符信息中相同语素位置同一语素出现的概率大于阈值时,确定所述语素为最终语素包括:当所述多个录入字符信息和所述识别字符信息中所述相同语素位置所述同一语素出现的概率大于阈值时,确定所述语素为最终语素。5.如权利要求3所述的方法,其特征在于,所述获取识别字符信息后,还包括:获取多个修正字符信息,所述多个修正字符信息为对所述识别字符信息进行修正后的信息。6.如权利要求5所述的方法,其特征在于,所述当所述多个录入字符信息中相同语素位置同一语素出现的概率大于阈值时,确定所述语素为最终语素包括:当所述多个录入字符信息、所述识别字符信息和所述多个修正字符信息中所述相同语素位置所述同一语素出现的概率大于阈值时,确定所述语素为最终语素。7.如权利要求1至6任一权利要求所述的方法,其特征在于,所述获取多个录入字符信息前,还包括:获取词典的扫描图片;获取所述扫描图片按照词条切割...
【专利技术属性】
技术研发人员:蔡盼盼,
申请(专利权)人:语联网武汉信息技术有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。