【技术实现步骤摘要】
信息抽取方法、装置、设备及计算机可读存储介质
本专利技术涉及数据处理领域,尤其涉及一种信息抽取方法、装置、设备及计算机可读存储介质。
技术介绍
互联网的快速发展,极大的降低了用户访问互联网的门槛,随之出现了大量的保险相关的搜索需求。针对这些搜索需求,衍生出了保险智能信息抽取服务。用户可以上传需要进行信息抽取的文档,抽取该文档中的关键信息,并展示给用户。现有技术中,接收到用户上传的需要进行信息抽取的文档之后,一般都需要维护人员阅读保险产品的相关文档,从文档中提取出产品相关信息经加工后输出相关结果。但是,采用上述方法往往需要大量重复性工作及人工操作,一方面较为耗费人力资源,另一方面答案获取速度较慢,造成用户体验较差。
技术实现思路
本专利技术提供一种信息抽取方法、装置、设备及计算机可读存储介质,用于解决现有的信息抽取方法需要大量重复性工作及人工操作,一方面较为耗费人力资源,另一方面答案获取速度较慢,造成用户体验较差的技术问题。本专利技术的第一个方面是提供一种信息抽取方法,包括: ...
【技术保护点】
1.一种信息抽取方法,其特征在于,包括:/n获取终端设备输入的待处理文档,所述待处理文档中包括待抽取信息标签;/n采用预设的网络模型,根据所述待抽取信息标签从所述待处理文档中抽取目标信息;/n将所述目标信息发送至所述终端设备进行显示;/n所述方法还包括:/n获取预设的待训练文本;/n对所述待训练文本中的共同属性进行统计,获得至少一个标签信息;/n通过所述标签信息对所述待训练文本进行标注,获得标注后的待训练文本;/n通过所述标注后的待训练文本对预设的待训练模型进行训练,获得所述网络模型。/n
【技术特征摘要】
1.一种信息抽取方法,其特征在于,包括:
获取终端设备输入的待处理文档,所述待处理文档中包括待抽取信息标签;
采用预设的网络模型,根据所述待抽取信息标签从所述待处理文档中抽取目标信息;
将所述目标信息发送至所述终端设备进行显示;
所述方法还包括:
获取预设的待训练文本;
对所述待训练文本中的共同属性进行统计,获得至少一个标签信息;
通过所述标签信息对所述待训练文本进行标注,获得标注后的待训练文本;
通过所述标注后的待训练文本对预设的待训练模型进行训练,获得所述网络模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待抽取信息标签从所述待处理文档中抽取目标信息之后,还包括:
将所述目标信息发送至所述终端设备,以使用户对所述目标信息进行手动修正;
获取修正后的目标信息,存储所述修正后的目标信息。
3.根据权利要求2所述的方法,其特征在于,存储所述修正后的目标信息,包括:
将所述修正后的目标信息发送至管理平台进行审核;
若接收到管理平台发送的审核通过的信息,则存储所述修正后的目标信息。
4.根据权利要求2或3所述的方法,其特征在于,所述存储所述修正后的目标信息之后,还包括:
当存储的修正后的目标信息的数量超过预设的阈值,则根据修正后的目标信息对所述网络模型进行训练,获得更新后的网络模型。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述将所述目标信息发送至所述终端设备进行显示,包括:
将所述目标信息发送至所述终端设备,以使所述终端设备将所述目标信息在所述待处理文档中突出显示。
6.一种信息抽取方法,其特征在于,包括:
获取用户输入的待处理文档,其中,所述待处理文档中包括待抽取信息标签;
将所述待处理文档发...
【专利技术属性】
技术研发人员:唐维维,石廷鑫,王旭东,李鑫,
申请(专利权)人:泰康保险集团股份有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。