一种中医古籍数据收集整理系统技术方案

技术编号:30701122 阅读:15 留言:0更新日期:2021-11-06 09:37
本发明专利技术公开了一种中医古籍数据收集整理系统,包括:图像采集模块,用于实现中医古籍图像的采集;古籍电子档生成模块,用于根据中医古籍图像内载的文本及文本格式生成对应的古籍电子档;古籍电子档标记模块,用于实现古籍电子档内载药方名称、中药名称、文献名称、疾病名称等的识别,并为每一个药方名称、中药名称、文献名称、疾病名称配置一详情超链接;古籍电子档整理模块,用于实现古籍电子档的排序,生成中医古籍文献。本发明专利技术在可以实现中医古籍数据快速整理的同时,实现了其内载药方名称、中药名称、文献名称、疾病名称、专有名词和专业术语的注释,从而大大方便了用户对中医古籍数据的查阅和理解。的查阅和理解。的查阅和理解。

【技术实现步骤摘要】
一种中医古籍数据收集整理系统


[0001]本专利技术涉及中医古籍管理领域,具体涉及一种中医古籍数据收集整理系统。

技术介绍

[0002]在中医领域,从原始社会诞生并不断发展变化的中医学积累了大量的医学文献古籍著作。这些文献著作数量庞大、内容繁杂,种类多样,包括精气学说、阴阳五行学说、气血津液、藏象、经络、体质、病因、发病、病机、治则、养生等。它们中大多使用文言文或古人的口语、歌诀进行记载,书写方式,成书年代都有所不同,与现代汉语有着较大的区别。并且,包含很多中医领域的专有名词和专业术语,人们在查阅的过程中很容易存在理解的偏差。必须借助计算机技术等现代化手段,提供有效的数字化中医药知识元数据,才能更好地在中医古籍宝库中挖掘有价值的知识。
[0003]目前,现有的中医药古籍数据库虽然可以实现检索的功能,但是检索所得信息仍然需要使用者去分析,才能够为研究工作提供信息支撑。同时,中医古籍整理的过程需要人为花费大量的时间和精力,费时费力的同时,容易出错。

技术实现思路

[0004]为解决上述问题,本专利技术提供了一种中医古籍数据收集整理系统,在可以实现中医古籍数据快速整理的同时,实现了其内载药方名称、中药名称、文献名称、疾病名称、专有名词和专业术语的注释,从而大大方便了用户对中医古籍数据的查阅和理解。
[0005]为实现上述目的,本专利技术采取的技术方案为:
[0006]一种中医古籍数据收集整理系统,包括:
[0007]图像采集模块,用于实现中医古籍图像的采集;
[0008]古籍电子档生成模块,用于根据中医古籍图像内载的文本及文本格式生成对应的古籍电子档;
[0009]古籍电子档标记模块,用于实现古籍电子档内载药方名称、中药名称、文献名称、疾病名称等的识别,并为每一个药方名称、中药名称、文献名称、疾病名称配置一详情超链接;
[0010]古籍电子档整理模块,用于实现古籍电子档的排序,为每一个古籍电子档找到其适配的位置,并建立其与相关古籍电子档之间的关联关系,生成中医古籍文献。
[0011]进一步地,所述图像采集模块包括镜框、安装在镜框前侧的双目视觉传感器以及用于实现翻书动作识别的内嵌安装在指环内的三维姿态传感器,用于实现用户翻阅中医古籍视频以及翻书动作覆盖时间点的采集。
[0012]进一步地,所述古籍电子档生成模块首先调用视频取帧脚本,基于翻书动作覆盖时间点获取目标中医古籍图像,得到中医古籍图像集,然后基于CTPN+CRNN实现中医古籍图像内载的文本的定位和识别,从反而获取到中医古籍图像内载的文本及文本格式,生成对应的古籍电子档。
[0013]进一步地,通过点击详情超链接可以直接实现药方详情、中药详情、文献详情、疾病详情的查看。
[0014]进一步地,还包括:
[0015]古籍注释模块,用于基于中医古籍词典实现古籍电子档内载专有名词和专业术语的识别,并实现为每一个专有名词和专业术语配置一注释超链接。
[0016]古籍电子档审核模块,用于基于中医古籍词典实现古籍电子档内载文本的审核,并以着色标记的方式实现疑似错误位置的反馈。
[0017]进一步地,所述中医古籍词典基于网络爬虫模块在预设的网络基站上爬取对应的中医文献集,经人工+机器学习整理所得。
[0018]进一步地,还包括:
[0019]检索关键字生成模块,用于生成每一页古籍电子档的检索关键字,并构建各检索关键字之间的关系。
[0020]本专利技术具有以下有益效果:
[0021]1)在可以实现中医古籍数据快速整理的同时,实现了其内载药方名称、中药名称、文献名称、疾病名称、专有名词和专业术语的注释,从而大大方便了用户对中医古籍数据的查阅和理解。
[0022]2)基于图像采集模块+古籍电子档生成模块的设计,实现了中医古籍图像集的快速采集及其内载信息的识别整理,在可以减轻工作量的同时,可以很好的避免人为错误;
附图说明
[0023]图1为本专利技术实施例一种中医古籍数据收集整理系统的系统框图。
具体实施方式
[0024]下面结合具体实施例对本专利技术进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本专利技术,但不以任何形式限制本专利技术。应当指出的是,对本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变形和改进。这些都属于本专利技术的保护范围。
[0025]如图1所示,一种中医古籍数据收集整理系统,包括:
[0026]图像采集模块,用于实现中医古籍图像的采集;
[0027]古籍电子档生成模块,用于根据中医古籍图像内载的文本及文本格式生成对应的古籍电子档;
[0028]古籍电子档标记模块,用于实现古籍电子档内载药方名称、中药名称、文献名称、疾病名称等的识别,并为每一个药方名称、中药名称、文献名称、疾病名称配置一详情超链接;通过点击详情超链接可以直接实现药方详情、中药详情、文献详情、疾病详情的查看;
[0029]古籍注释模块,用于基于中医古籍词典实现古籍电子档内载专有名词和专业术语的识别,并实现为每一个专有名词和专业术语配置一注释超链接;
[0030]古籍电子档审核模块,用于基于中医古籍词典实现古籍电子档内载文本的审核,并以着色标记的方式实现疑似错误位置的反馈。反馈时,以弹出对话框的形式实现,弹出对话框内载携带有着色标记的疑似错误位置文本以及参考正确文本,用于点击“修订”即可直
接进入疑似错误位置文本的修订界面,点击“无误”,则跳过该疑似错误位置继续进行下一处疑似错误位置的反馈。
[0031]古籍电子档整理模块,用于实现古籍电子档的排序,为每一个古籍电子档找到其适配的位置,并建立其与相关古籍电子档之间的关联关系,生成中医古籍文献;基于刻面技术来实现古籍电子档定位,通过计算不同古籍电子档术语间的刻面距离来准确定位古籍电子档;在定位古籍电子档时,在已知刻面的约束下选择相应的术语,以此来完成对所需古籍电子档的描述,如果选择成功,则返回相应的古籍电子档;如果选择不成功,则根据同义词词典和概念距离图计算术语的相似性,形成新的定位信息。
[0032]检索关键字生成模块,用于生成每一页古籍电子档的检索关键字,并构建各检索关键字之间的关系。通过检索关键字可以实现古籍电子档的快速查询。
[0033]本实施例中,所述图像采集模块包括镜框、安装在镜框前侧的双目视觉传感器以及用于实现翻书动作识别的内嵌安装在指环内的三维姿态传感器,用于实现用户翻阅中医古籍视频以及翻书动作覆盖时间点的采集。
[0034]本实施例中,所述古籍电子档生成模块首先调用视频取帧脚本,基于翻书动作覆盖时间点获取目标中医古籍图像,得到中医古籍图像集,然后基于CTPN+CRNN实现中医古籍图像内载的文本的定位和识别,从反而获取到中医古籍图像内载的文本及文本格式,生成对应的古籍电子档。具体的,剔除翻书动作覆盖时间点对应的视频帧,剩余的视频帧即对应目标中医古籍图像。
[0035]本具体实施通过中医本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种中医古籍数据收集整理系统,其特征在于:包括:图像采集模块,用于实现中医古籍图像的采集;古籍电子档生成模块,用于根据中医古籍图像内载的文本及文本格式生成对应的古籍电子档;古籍电子档标记模块,用于实现古籍电子档内载药方名称、中药名称、文献名称、疾病名称的识别,并为每一个药方名称、中药名称、文献名称、疾病名称配置一详情超链接;古籍电子档整理模块,用于实现古籍电子档的排序,为每一个古籍电子档找到其适配的位置,并建立其与相关古籍电子档之间的关联关系,生成中医古籍文献。2.如权利要求1所述的一种中医古籍数据收集整理系统,其特征在于:所述图像采集模块包括镜框、安装在镜框前侧的双目视觉传感器以及用于实现翻书动作识别的内嵌安装在指环内的三维姿态传感器,用于实现用户翻阅中医古籍视频以及翻书动作覆盖时间点的采集。3.如权利要求1所述的一种中医古籍数据收集整理系统,其特征在于:所述古籍电子档生成模块首先调用视频取帧脚本,基于翻书动作覆盖时间点获取目标中医古籍图像,得到中医古籍图像集,然后基于CTPN+C...

【专利技术属性】
技术研发人员:周艳红
申请(专利权)人:陕西中医药大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1