挖掘石窟壁画群中石窟壁画时空关联关系的方法和装置制造方法及图纸

技术编号:14505411 阅读:47 留言:0更新日期:2017-01-31 14:48
本发明专利技术实施例公开了挖掘石窟壁画群中石窟壁画时空关联关系的方法和装置,方案包括:确定石窟壁画群中各石窟壁画的第一描述数据,将各石窟壁画确定为一个元组,基于Apriori算法对第一描述数据进行词频统计,得到各石窟壁画的描述词及所对应的词频,确定相应元组的预定类别属性,根据预定类别属性确定相应元组的属性值,以属于描述类属性的各个描述词的属性值,将各个元组关联成复杂网络,利用复杂网络分析算法,将复杂网络分割为多个网络模块,确定符合预定条件的目标网络模块所包括元组对应的石窟壁画确定为存在时空关联关系,应用本发明专利技术实施例可以确定石窟壁画群中石窟壁画的时空关联关系,为研究石窟壁画的整体关联关系提供参考数据。

【技术实现步骤摘要】

本专利技术涉及图像处理领域,特别涉及一种挖掘石窟壁画群中石窟壁画时空关联关系的方法和装置
技术介绍
所谓石窟壁画为绘制在石洞墙壁上的画作,而同一石窟内的多幅石窟壁画构成石窟壁画群,其中,国内已经发现的石窟壁画群包括:新疆石窟壁画群、敦煌莫高窟壁画群等等。由于石窟壁画群作为重要的文化遗产,国内外学者发表了大量关于石窟壁画群的专著文献,以从历史渊源、宗教背景、壁画内容、艺术风格、建筑风格、壁画原材料等诸多方面对壁画群中单幅壁画进行了大量深入细致的研究工作。尽管关于壁画群中单幅壁画的研究能够为石窟壁画领域的提供大量的参考数据,但是,所提供的参考数据比较单一和分散,因此,为了提供研究石窟壁画的关于整体关系的参考数据,存在对石窟壁画群中各个石窟壁画间的关联关系的确定的需求。
技术实现思路
本专利技术实施例公开了一种挖掘石窟壁画群中石窟壁画时空关联关系的方法和装置,以挖掘确定出石窟壁画群中石窟壁画的时空关联关系,为研究石窟壁画的整体的关联关系提供参考数据。具体方案如下:一方面,本专利技术实施例提供了一种挖掘石窟壁画群中石窟壁画时空关联关系的方法,所述方法包括:确定石窟壁画群中各石窟壁画的第一描述数据,并将每幅石窟壁画确定为一个元组,其中,所述石窟壁画的第一描述数据为:从预先获得的该石窟壁画中的描述信息以及预先获得的关于该石窟壁画的介绍信息中提取得到;基于Apriori算法对各石窟壁画的第一描述数据进行第一词频统计,进而,获得各石窟壁画所对应的描述词和所述描述词所对应的词频;将各石窟壁画中词频超过第一预设阈值的多个描述词确定为相应元组的预定类别属性,其中,所述预定类别属性包括:时间类属性、空间类属性和描述类属性;从各石窟壁画的第一描述数据中,确定所对应元组的属于预定类别属性的各个描述词所对应的多个描述子数据,并将所述多个描述子数据中出现次数超过预设数量阈值的目标描述子数据确定为相应描述词所对应的元组的属性值;根据各个元组的属于描述类属性的各个描述词的属性值,将所述各个元组关联成复杂网络,其中,复杂网络中的节点为所述元组;利用复杂网络分析算法,将所述复杂网络中的所有元组以模块化参数最大化的标准分割为多个网络模块,每个网络模块中包括至少一个元组;将所述多个网络模块中符合预定条件的目标网络模块所包括元组对应的石窟壁画确定为存在时空关联关系,其中,所述预定条件包括:所包括元组的属于时间类属性的描述词的属性值不同和/或空间类属性的描述词的属性值不同。较佳的,所述基于Apriori算法对各石窟壁画的第一描述数据进行第一词频统计,包括:基于Apriori算法对各石窟壁画的第一描述数据进行除语气助词、数字、语气词、标点符号以及结构助词之外的第一词频统计。较佳的,关于该石窟壁画中的描述信息的获得方式,包括:对纸质形式的石窟壁画中的描述信息依次进行扫描和光学字符识别,从而获得该石窟壁画中的描述信息;关于该石窟壁画的介绍信息的获得方式,包括:对纸质形式的该石窟壁画的介绍信息依次进行扫描和光学字符识别,从而获得该石窟壁画的介绍信息。较佳的,所述获得各壁画所对应的描述词和所述描述词所对应的词频包括:利用基于无监督学习的自组织映射算法对所述各壁画所对应的描述词进行量化分析,以滤除属于噪声的描述词;获得滤除噪声的描述词的各石窟壁画所对应的描述词和所述描述词所对应的词频,所述属于噪声的描述词为对所述纸质形式的石窟壁画中的描述信息和/或所述纸质形式的该石窟壁画的介绍信息依次进行进行扫描和光学字符识别时,出现的错误识别的描述词;其中,所述自组织映射算法中参数选择六边形映射格点,初始化码书选择随机码书,训练过程选择批处理batch训练算法,映射函数选择高斯邻域函数所述高斯邻域函数中σ为邻域半径,rc为单元c的位置,c代表batch训练过程中,对应的各石窟壁画所对应的描述词训练输出结果索引,nc表示滤除噪声的描述词的各石窟壁画所对应的描述词与未滤除噪声的描述词间的高斯距离,rc是batch训练过程输出的滤除噪声的描述词的各石窟壁画所对应的描述词,ri是训练输入的各石窟壁画所对应的描述词,||rc-ri||表示训练时产生的噪声的一阶原点矩。较佳的,所述根据各个元组的属于描述类属性的各个描述词的属性值,将所述各个元组关联成复杂网络,包括:针对每两个元组,当所述两个元组的属于描述类属性的各个描述词的属性值相同的数量超过第三预设阈值时,确定所述两个元组相互关联;依次确定每两个元组间的关联关系,将所述各元组关联成复杂网络。较佳的,在所述将所述多个网络模块中符合预定条件的目标网络模块所包括元组对应的石窟壁画确定为存在时空关联关系之后,还包括:计算所述目标网络模块占所有网络模块的百分比,以定量确定所述石窟壁画群中各石窟壁画的时空关联关系。另一方面,本专利技术实施例还提供了一种挖掘石窟壁画群中石窟壁画时空关联关系的装置,所述装置包括:确定单元:用于确定石窟壁画群中各石窟壁画的第一描述数据,并将每幅石窟壁画确定为一个元组,其中,所述石窟壁画的第一描述数据为:从预先获得的该石窟壁画中的描述信息以及预先获得的关于该石窟壁画的介绍信息中提取得到;词频统计单元:用于基于Apriori算法对各石窟壁画的第一描述数据进行第一词频统计,进而,获得各石窟壁画所对应的描述词和所述描述词所对应的词频;预定类别属性确定单元:用于将各石窟壁画中词频超过第一预设阈值的多个描述词确定为相应元组的预定类别属性,其中,所述预定类别属性包括:时间类属性、空间类属性和描述类属性;属性值确定单元:用于从各石窟壁画的第一描述数据中,确定所对应元组的属于预定类别属性的各个描述词所对应的多个描述子数据,并将所述多个描述子数据中出现次数超过预设数量阈值的目标描述子数据确定为相应描述词所对应的元组的属性值;复杂网络关联单元:用于根据各个元组的属于描述类属性的各个描述词的属性值,将所述各个元组关联成复杂网络,其中,复杂网络中的节点为所述元组;网络模块分割单元:用于利用复杂网络分析算法,将所述复杂网络中的所有元组以模块化参数最大化的标准分割为多个网络模块,每个网络模块中包括至少一个元组;时空关联关系确定单元:用于将所述多个网络模块中符合预定条件的目标网络模块所包括元组对应的石窟壁画确定为存在时空关联关系,其中,所述预定条件包括:所包括元组的属于时间类属性的描述词的属性本文档来自技高网...

【技术保护点】
一种挖掘石窟壁画群中石窟壁画时空关联关系的方法,其特征在于,所述方法包括:确定石窟壁画群中各石窟壁画的第一描述数据,并将每幅石窟壁画确定为一个元组,其中,所述石窟壁画的第一描述数据为:从预先获得的该石窟壁画中的描述信息以及预先获得的关于该石窟壁画的介绍信息中提取得到;基于Apriori算法对各石窟壁画的第一描述数据进行第一词频统计,进而,获得各石窟壁画所对应的描述词和所述描述词所对应的词频;将各石窟壁画中词频超过第一预设阈值的多个描述词确定为相应元组的预定类别属性,其中,所述预定类别属性包括:时间类属性、空间类属性和描述类属性;从各石窟壁画的第一描述数据中,确定所对应元组的属于预定类别属性的各个描述词所对应的多个描述子数据,并将所述多个描述子数据中出现次数超过预设数量阈值的目标描述子数据确定为相应描述词所对应的元组的属性值;根据各个元组的属于描述类属性的各个描述词的属性值,将所述各个元组关联成复杂网络,其中,复杂网络中的节点为所述元组;利用复杂网络分析算法,将所述复杂网络中的所有元组以模块化参数最大化的标准分割为多个网络模块,每个网络模块中包括至少一个元组;将所述多个网络模块中符合预定条件的目标网络模块所包括元组对应的石窟壁画确定为存在时空关联关系,其中,所述预定条件包括:所包括元组的属于时间类属性的描述词的属性值不同和/或空间类属性的描述词的属性值不同。...

【技术特征摘要】
1.一种挖掘石窟壁画群中石窟壁画时空关联关系的方法,其特征在于,所
述方法包括:
确定石窟壁画群中各石窟壁画的第一描述数据,并将每幅石窟壁画确定为
一个元组,其中,所述石窟壁画的第一描述数据为:从预先获得的该石窟壁画
中的描述信息以及预先获得的关于该石窟壁画的介绍信息中提取得到;
基于Apriori算法对各石窟壁画的第一描述数据进行第一词频统计,进而,
获得各石窟壁画所对应的描述词和所述描述词所对应的词频;
将各石窟壁画中词频超过第一预设阈值的多个描述词确定为相应元组的预
定类别属性,其中,所述预定类别属性包括:时间类属性、空间类属性和描述
类属性;
从各石窟壁画的第一描述数据中,确定所对应元组的属于预定类别属性的
各个描述词所对应的多个描述子数据,并将所述多个描述子数据中出现次数超
过预设数量阈值的目标描述子数据确定为相应描述词所对应的元组的属性值;
根据各个元组的属于描述类属性的各个描述词的属性值,将所述各个元组
关联成复杂网络,其中,复杂网络中的节点为所述元组;
利用复杂网络分析算法,将所述复杂网络中的所有元组以模块化参数最大
化的标准分割为多个网络模块,每个网络模块中包括至少一个元组;
将所述多个网络模块中符合预定条件的目标网络模块所包括元组对应的石
窟壁画确定为存在时空关联关系,其中,所述预定条件包括:所包括元组的属
于时间类属性的描述词的属性值不同和/或空间类属性的描述词的属性值不同。
2.根据权利要求1所述的方法,其特征在于,所述基于Apriori算法对各石
窟壁画的第一描述数据进行第一词频统计,包括:
基于Apriori算法对各石窟壁画的第一描述数据进行除语气助词、数字、语
气词、标点符号以及结构助词之外的第一词频统计。
3.根据权利要求1所述的方法,其特征在于,关于该石窟壁画中的描述信
息的获得方式,包括:
对纸质形式的石窟壁画中的描述信息依次进行扫描和光学字符识别,从而
获得该石窟壁画中的描述信息;
关于该石窟壁画的介绍信息的获得方式,包括:
对纸质形式的该石窟壁画的介绍信息依次进行扫描和光学字符识别,从而
获得该石窟壁画的介绍信息。
4.根据权利要求3所述的方法,其特征在于,所述获得各壁画所对应的描
述词和所述描述词所对应的词频包括:
利用基于无监督学习的自组织映射算法对所述各壁画所对应的描述词进行
量化分析,以滤除属于噪声的描述词;
获得滤除噪声的描述词的各石窟壁画所对应的描述词和所述描述词所对应
的词频,所述属于噪声的描述词为对所述纸质形式的石窟壁画中的描述信息和/
或所述纸质形式的该石窟壁画的介绍信息依次进行进行扫描和光学字符识别
时,出现的错误识别的描述词;其中,所述自组织映射算法中参数选择六边形
映射格点,初始化码书选择随机码书,训练过程选择批处理batch训练算法,映
射函数选择高斯邻域函数所述高斯邻域函数中σ为邻域半径,
rc为单元c的位置,c代表batch训练过程中,对应的各石窟壁画所对应的描述词
训练输出结果索引,nc表示滤除噪声的描述词的各石窟壁画所对应的描述词与
未滤除噪声的描述词间的高斯距离,rc是batch训练过程输出的滤除噪声的描述词
的各石窟壁画所对应的描述词,ri是训练输入的各石窟壁画所对应的描述词,
||rc-ri||表示训练时产生的噪声的一阶原点矩。
5.根据权利要求1所述的方法,其特征在于,所述根据各个元组的属于描
述类属性的各个描述词的属性值,将所述各个元组关联成复杂网络,包括:
针对每两个元组,当所述两个元组的属于描述类属性的各个描述词的属性

\t值相同的数量超过第三预设阈值时,确定所述两个元组相互关联;
依次确定每两个元组间的关联关系,将所述各元组关联成复杂网络。
6.根据权利要求1所述的方法,其特征在于,在所述将所述多个网络模块
中符合预定条件的目标网络模块所包...

【专利技术属性】
技术研发人员:赵海英陈洪
申请(专利权)人:北京邮电大学世纪学院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1