古籍中文字的校对方法、系统及校对服务器技术方案

技术编号:9060672 阅读:275 留言:0更新日期:2013-08-21 23:48
本发明专利技术提出一种古籍中文字的校对方法,包括:校对服务器获得古籍图像并将古籍图像切分为多个字图像块;对每个字图像块进行识别,计算每个字图像块与标准字之间的相似度;当字图像块与标准字之间的相似度小于等于第一预设值且大于第二预设值时,对对应的字图像块进行聚类,并将对应的字图像块存储至标准字为索引的至少一个待选集合中;将待选集合中的字图像块及待选集合对应的索引提供至客户端,以供客户端的用户进行判断;根据用户的判断结果对待选集合中的字图像块进行校对。本发明专利技术的实施例可有效地提高古籍图像中每个字图像块对应的文字识别的正确率,保证古籍图像的翻译质量。本发明专利技术还提出了一种古籍中文字的校对系统及校对服务器。

【技术实现步骤摘要】

【技术保护点】
一种古籍中文字的校对方法,其特征在于,包括以下步骤:校对服务器获得古籍图像,并将所述古籍图像切分为多个字图像块,其中,每个所述字图像块包括至少一个文字;所述校对服务器对所述每个字图像块进行识别,并计算每个字图像块与标准字之间的相似度;当所述字图像块与标准字之间的相似度大于第一预设值时,所述校对服务器将对应的字图像块存储至所述标准字为索引的优选集合中;当所述字图像块与标准字之间的相似度小于等于第一预设值且大于第二预设值时,所述校对服务器对对应的字图像块进行聚类,并根据聚类结果将所述对应的字图像块存储至所述标准字为索引的至少一个待选集合中,其中,所述第一预设值大于所述第二预设值;所述校对服务器将所...

【技术特征摘要】

【专利技术属性】
技术研发人员:詹君
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1