一种RDP窗口标题文字识别的方法及装置制造方法及图纸

技术编号:26304555 阅读:34 留言:0更新日期:2020-11-10 20:00
一种RDP窗口标题文字识别的方法,所述方法包含:定义文字转换表,其中包含字形特征信息和对应的字符编码信息;截获、解析包含RDP窗口标题的RDP协议数据,提取出RDP窗口标题中的字形特征信息数据;将所述RDP窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相对应的字符编码信息数据;将所述RDP窗口标题的字符编码信息数据存储至数据库中。本发明专利技术还公开一种RDP窗口标题文字识别的装置。通过本发明专利技术可提高RDP窗口标题文字识别的准确率,同时还可缩短RDP窗口标题文字识别的时间。

【技术实现步骤摘要】
一种RDP窗口标题文字识别的方法及装置
本专利技术涉及计算机
,具体涉及一种RDP窗口标题文字识别的方法及装置。
技术介绍
远程桌面协议(RemoteDesktopProtocol,简称:RDP)是一个多通道(multi-channel)的协议,让客户端连上提供终端机服务的服务器端。RDP尝试只提供那些必需的服务,达到操作有效、尺度小的效果。RDP支持虚拟通道来传送客户端与服务器端之间的数据交流,以RDP为基础的远程桌面可以让用户使用远程计算机上的所有应用程序、文件和网络资源,而无需执行本地程序。随着互联网的快速发展,RDP被广泛应用,随之而来的网络安全隐患也越来越多。因此,需要对RDP传输的内容进行审计,以便及时发现非法访问、异常操作等安全信息,保障网络安全。RDP审计其中一项重要的任务是对RDP传输的窗口标题进行审计。常见的计算机之间的传输文字方法为:发送端传输Unicode、ASCII等字符编码,接收端利用字库软件或硬件渲染后展示文字;如果接收端字库缺失,则无法正确展示内容。但是,RDP传输窗口标题文字的方法与之不同,其传输方法为:直接传输字形码(字形码:点阵代码的一种。为了将汉字在显示器或打印机上输出,把汉字按图形符号设计成点阵图,就得到了相应的点阵代码),这样可以避免因远程接收端无字库无法正确的显示,解决上述问题。另一方面,使用字形码表述字形的方式传输文字,接收端虽然可以正确的展示出字形,但是审计方却又无法自动识别出文字语义,进而对其进行审计。现有技术一般采用OCR技术来识别RDP传输的窗口标题的文字语义,但存在以下问题:一、OCR技术的识别速度太慢,识别10个字大概需要零点几秒的时间。二、OCR技术要求待识别的文字的分辨率较大,汉字一般需超过16*16像素,但是RDP传输的窗口标题文字大多只有10*10像素或者12*12像素,导致使用OCR识别文字的识别率和正确率都不高。因此亟待需要一种快速可靠的方法来识别RDP传输的窗口标题的文字语义。
技术实现思路
本专利技术公开一种RDP窗口标题文字识别的方法,所述方法包含:定义文字转换表,其中包含字形特征信息和对应的字符编码信息;截获、解析包含RDP窗口标题的RDP协议数据,提取出RDP窗口标题中的字形特征信息数据;将所述RDP窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相对应的字符编码信息数据;将所述RDP窗口标题的字符编码信息数据存储至数据库中。具体的,所述定义文字转换表的方法包含:将所述字形特征信息以二进制数表示;将所述字形特征信息逐一转换为唯一的统一查询码,所述统一查询码是位数为常数C的二进制数;转换所述统一查询码的转换规则具体为:设所述表示字形特征信息的二进制数的最大位数值为C;若待转换的所述表示字形特征信息的二进制数的位数等于C,则所述统一查询码等于所述表示字形特征信息的二进制数;否则,所述统一查询码等于所述表示字形特征信息的二进制数通过补位算法转换成为的位数等于C的二进制数;将所述字形特征信息及所述统一查询码与其相对应的所述字符编码信息一一对应,生成文字转换表;将所述文字转换表以二叉树的数据结构存储,所述文字转换表的所述统一查询码存储成二叉树的节点,所述文字转换表中的所述字符编码信息存储成二叉树的叶子节点。具体的,所述将所述RDP窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相应的字符编码信息数据的方法包含:将所述RDP窗口标题中的字形特征信息数据以二进制数表示;将所述表示RDP窗口标题中的字形特征信息数据的二进制数按照所述转换统一查询码的转换规则并使用所述补位算法转换为所述统一查询码数据;将所述统一查询码数据输入所述文字转换表,所述文字转换表以二叉树的数据结构存储;按顺序将所述统一查询码数据的每一位数字与从所述二叉树的根开始的节点一一匹配,形成路径,查找到叶子节点,获得所述RDP窗口标题的字符编码信息数据。具体的,所述定义文字转换表的方法还包含:将所述字形特征信息以二进制数表示;将所述字形特征信息和对应的所述字符编码信息,生成一条文字转换记录;将多条所述文字转换记录组成一张所述文字转换表,其中每条所述文字转换记录中包含的所述表示字形特征信息的二进制数的位数相同;所述文字转换记录中包含的所述表示字形特征信息的二进制数的位数不同,可组成多张所述文字转换表;多张所述文字转换表组成文字转换库;将每张所述文字转换表分别以二叉树的数据结构存储,所述文字转换表的所述表示字形特征信息存储成二叉树的节点,所述文字转换表中的所述字符编码信息存储成二叉树的叶子节点。具体的,所述将所述RDP窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相应的RDP窗口标题的字符编码信息数据的方法还包含:将所述RDP窗口标题中的字形特征信息数据以二进制数表示;按照所述表示RDP窗口标题中的字形特征信息的二进制数的位数,在所述文字转换库中匹配相应的所述文字转换表;将所述表示RDP窗口标题中的字形特征信息的二进制数输入相匹配的所述文字转换表,所述文字转换表以二叉树的数据结构存储;按顺序将所述表示RDP窗口标题中的字形特征信息的二进制数的每一位数字与从所述二叉树的根开始的节点一一匹配,形成路径,查找到叶子节点,获得所述RDP窗口标题的字符编码信息数据。本专利技术还公开一种RDP窗口标题文字识别的装置,包含:转换表定义单元,用于定义文字转换表,其中包含字形特征信息和字符编码信息;数据提取单元,用于截获、解析包含RDP窗口标题的RDP协议数据,提取出RDP窗口标题的字形特征信息数据;文字识别单元,用于将从数据提取单元取得的所述RDP窗口标题的字形特征信息数据,输入从转换表定义单元取得的文字转换表,通过查找所述的文字转换表,获得相应的字符编码信息数据,并保存到数据库中。具体的,所述转换表定义单元包含:字形特征信息数据化模块,用于将所述字形特征信息以二进制数表示;统一查询码生成模块,用于将从字形特征信息数据化模块取得的所述字形特征信息逐一转换为唯一的统一查询码,所述统一查询码是位数为常数C的二进制数;转换所述统一查询码的转换规则具体为:设所述表示字形特征信息的二进制数的最大位数为C;若待转换的所述表示字形特征信息的二进制数的位数等于C,则所述统一查询码等于所述表示字形特征信息的二进制数;否则,所述统一查询码等于所述表示字形特征信息的二进制数通过补位算法转换成为的位数等于C的二进制数;文字转换表生成模块,用于将从字形特征信息数据化模块取得的所述字形特征信息及从统一查询码生成模块取得的所述统一查询码与其相对应的所述字符编码信息一一对应,生成文字转换表;文字转换表存储模块,用于将从文字转换表生成模块取得的所述文字转换表以二叉树的数据结构存储,所述文字转换表的所述统一查询码存储成二叉树的节本文档来自技高网
...

【技术保护点】
1.一种RDP窗口标题文字识别的方法,其特征在于,所述方法包含:/n定义文字转换表,其中包含字形特征信息和对应的字符编码信息;/n截获、解析包含RDP窗口标题的RDP协议数据,提取出RDP窗口标题中的字形特征信息数据;/n将所述RDP窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相对应的字符编码信息数据;/n将所述RDP窗口标题的字符编码信息数据存储至数据库中。/n

【技术特征摘要】
1.一种RDP窗口标题文字识别的方法,其特征在于,所述方法包含:
定义文字转换表,其中包含字形特征信息和对应的字符编码信息;
截获、解析包含RDP窗口标题的RDP协议数据,提取出RDP窗口标题中的字形特征信息数据;
将所述RDP窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相对应的字符编码信息数据;
将所述RDP窗口标题的字符编码信息数据存储至数据库中。


2.根据权利要求1所述的方法,其特征在于,所述定义文字转换表的方法包含:
将所述字形特征信息以二进制数表示;
将所述字形特征信息逐一转换为唯一的统一查询码,所述统一查询码是位数为常数C的二进制数;转换所述统一查询码的转换规则具体为:设所述表示字形特征信息的二进制数的最大位数值为C;若待转换的所述表示字形特征信息的二进制数的位数等于C,则所述统一查询码等于所述表示字形特征信息的二进制数;否则,所述统一查询码等于所述表示字形特征信息的二进制数通过补位算法转换成为的位数等于C的二进制数;
将所述字形特征信息及所述统一查询码与其相对应的所述字符编码信息一一对应,生成文字转换表;
将所述文字转换表以二叉树的数据结构存储,所述文字转换表的所述统一查询码存储成二叉树的节点,所述文字转换表中的所述字符编码信息存储成二叉树的叶子节点。


3.根据权利要求2所述的方法,其特征在于,所述将所述RDP窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相应的字符编码信息数据的方法包含:
将所述RDP窗口标题中的字形特征信息数据以二进制数表示;
将所述表示RDP窗口标题中的字形特征信息数据的二进制数按照所述转换统一查询码的转换规则并使用所述补位算法转换为所述统一查询码数据;
将所述统一查询码数据输入所述文字转换表,所述文字转换表以二叉树的数据结构存储;按顺序将所述统一查询码数据的每一位数字与从所述二叉树的根开始的节点一一匹配,形成路径,查找到叶子节点,获得所述RDP窗口标题的字符编码信息数据。


4.根据权利要求1所述的方法,其特征在于,所述定义文字转换表的方法还包含:
将所述字形特征信息以二进制数表示;
将所述字形特征信息和对应的所述字符编码信息,生成一条文字转换记录;
将多条所述文字转换记录组成一张所述文字转换表,其中每条所述文字转换记录中包含的所述表示字形特征信息的二进制数的位数相同;所述文字转换记录中包含的所述表示字形特征信息的二进制数的位数不同,可组成多张所述文字转换表;多张所述文字转换表组成文字转换库;
将每张所述文字转换表分别以二叉树的数据结构存储,所述文字转换表的所述表示字形特征信息存储成二叉树的节点,所述文字转换表中的所述字符编码信息存储成二叉树的叶子节点。


5.根据权利要求4所述的方法,其特征在于,所述将所述RDP窗口标题中的字形特征信息数据输入所述文字转换表,通过查表,获得相应的RDP窗口标题的字符编码信息数据的方法还包含:
将所述RDP窗口标题中的字形特征信息数据以二进制数表示;
按照所述表示RDP窗口标题中的字形特征信息的二进制数的位数,在所述文字转换库中匹配相应的所述文字转换表;
将所述表示RDP窗口标题中的字形特征信息的二进制数输入相匹配的所述文字转换表,所述文字转换表以二叉树的数据结构存储;按顺序将所述表示RDP窗口标题中的字形特征信息的二进制数的每一位数字与从所述二叉树的根开始的节点一一匹配,形成路径,查找到叶子节点,获得所述RDP窗口标题的字符编码信息数据。


6.一种RDP窗口标题文字识别的装置,其特征在于,包含:
转换表定义单元,用于定义文字转换表,其中包含字形特征信息和字符编码信息;
数据提取单元,用于截获、解析包含RDP窗口标题的RDP协议数据,提取出RDP窗口标题的字形特征信息数据;
文字识别单元,用于将从数据提取单元取得的所述RDP窗口标题的字形特...

【专利技术属性】
技术研发人员:周春楠赵之阳郭波赵贵阳
申请(专利权)人:亿阳安全技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1