【技术实现步骤摘要】
本申请涉及文档处理领域,尤其涉及一种基于文档的公式确定方法、装置、电子设备及存储介质。
技术介绍
1、公式作为一种重要的工具,被广泛使用在各业务场景所对应的日常工作中。公式通常来自于最新的学术研究成果、文献或业务文档,种类和用法十分广泛。以医学的业务场景为例,公式就包括生理参数的计算、药物剂量调整方案以及疾病风险评估等多种方面。因此,从学术研究成果、文献或业务文档中自动化的确定公式十分困难。
2、目前,从文档中提取公式的方法多依赖于人工进行,通过人工对文档内容进行分析查阅提取公式。
3、因此,如何高效且自动化的从文档中提取公式,成为了目前亟待解决的问题。
技术实现思路
1、本申请提供一种基于文档的公式确定方法、装置、电子设备及存储介质,用以自动从文档中提取公式。
2、第一方面,本申请提供一种基于文档的公式确定方法,包括:
3、获取待处理文档,从待处理文档中确定多个文档块;其中,文档块至少包括文本块、公式块、表格块三种类型;
4、若
...【技术保护点】
1.一种基于文档的公式确定方法,包括:
2.根据权利要求1所述的方法,其特征在于,根据所述公式名从所有的文档块中确定目标块,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述第一相关度,从所有的文档块中确定所述目标块,包括:
4.根据权利要求1所述的方法,其特征在于,若确定所述文本块中存在公式描述信息,则确定所述公式描述信息对应的公式名,包括:
5.根据权利要求4所述的方法,其特征在于,还包括:
6.根据权利要求1所述的方法,其特征在于,从所述待处理文档中确定多个文档块,包括:
7.根据权
...【技术特征摘要】
1.一种基于文档的公式确定方法,包括:
2.根据权利要求1所述的方法,其特征在于,根据所述公式名从所有的文档块中确定目标块,包括:
3.根据权利要求2所述的方法,其特征在于,根据所述第一相关度,从所有的文档块中确定所述目标块,包括:
4.根据权利要求1所述的方法,其特征在于,若确定所述文本块中存在公式描述信息,则确定所述公式描述信息对应的公式名,包括:
5.根据权利要求4所述的方法,其特征在于,还包括:
6.根据权利要求1所述的方法,其特征在于,从所述待处理文档中确定多个文档块,包括:
7.根据权利要求6所述的方法,其特征在于,根据预设的数据格式,对所述待处理文档进行解析处理,得到所述预设数据格式的文档块,包括:
8.根据权利要求7所述的方法,其特征在于,对所述文档数据...
【专利技术属性】
技术研发人员:张文静,刘兆祥,王恺,廉士国,
申请(专利权)人:中国联合网络通信集团有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。