信息明确度评估方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:23513101 阅读:30 留言:0更新日期:2020-03-18 00:18
本发明专利技术提供一种信息明确度评估方法、装置、设备及计算机可读存储介质,方法包括:接收目标语句;根据所述目标语句确定待评估语句;通过预设的神经网络模型对所述待评估语句的明确度进行评估,获得评估结果,根据所述评估结果进行信息抽取。从而能够提高抽取到的信息的明确度。

Information clarity evaluation methods, devices, equipment and computer-readable storage media

【技术实现步骤摘要】
信息明确度评估方法、装置、设备及计算机可读存储介质
本专利技术涉及信息检索和文本信息处理领域,尤其涉及一种信息明确度评估方法、装置、设备及计算机可读存储介质。
技术介绍
从非结构化文本中抽取信息,即信息抽取,是文本信息处理领域的基础任务之一,具体地,抽取的信息可以包括实体属性、实体关系以及时间等。此外,信息抽取还是很多自然语言处理高级任务的前提,其中,高级任务包括智能问答,机器写作,文本阅读理解等。从文本中提取出含有所需信息的语句,是信息抽取的前提工作。在很多场景中,从文本中直接抽取信息,存在准确率低、训练成本高、容错率低等缺点。因此,如何提高信息抽取的准确性成为亟待解决的问题。为了提高信息抽取的准确性,现有技术中提出一种信息抽取方法,具体地,可以从文本中先找出含有所需信息的语句,然后运用规则或者人工方法抽取信息,是信息抽取的一种折衷手段。但是,上述方法虽然能够实现信息的快速抽取时,但是往往存在以下问题:1、识别的信息语句,可能包含不确定的信息。例如:“李白可能出生于四川。”,所述的信息是不确定的;2、识别的信息语句,可能包含不本文档来自技高网...

【技术保护点】
1.一种信息明确度评估方法,其特征在于,包括:/n接收目标语句;/n根据所述目标语句确定待评估语句;/n通过预设的神经网络模型对所述待评估语句的明确度进行评估,获得评估结果,根据所述评估结果进行信息抽取。/n

【技术特征摘要】
1.一种信息明确度评估方法,其特征在于,包括:
接收目标语句;
根据所述目标语句确定待评估语句;
通过预设的神经网络模型对所述待评估语句的明确度进行评估,获得评估结果,根据所述评估结果进行信息抽取。


2.根据权利要求1所述的方法,其特征在于,所述根据所述目标语句确定待评估语句,包括:
确定所述与目标语句相邻的上文和/或下文中预设个数的语句;
将所述目标语句与所述与目标语句相邻的上文和/或下文中预设个数的语句作为所述待评估语句。


3.根据权利要求1所述的方法,其特征在于,所述通过预设的神经网络模型对所述待评估语句的明确度进行评估之前,还包括:
通过预设的已对语句明确度进行标注后的待训练文本对所述预设的待训练模型进行训练,获得所述预设的神经网络模型。


4.根据权利要求1所述的方法,其特征在于,所述通过预设的神经网络模型对所述待评估语句的明确度进行评估之前,还包括:
确定所述待评估语句中每一个词语的词性信息,根据所述词性信息对所述待评估语句进行词性标注,获得标注后的待评估语句;和/或,
确定所述待评估语句中的指代词信息,根据所述指代词信息对所述待评估语句进行指代词标注,获得标注后的待评估语句;和/或,
确定所述待评估语句中的主语信息,根据所述主语信息对所述待评估语句进行主语标注,获得标注后的待评估语句;和/或,
确定所述待评估语句中的不确定语义词语信息,根据所述不确定语义词语信息对所述待评估语句进行不确定语义标注,获得标注后的待评估语句;
通过预设的向量转换模型将所述标注后的待评估语句转换为所述待评估语句对应的语句向量与标注向量;
将所述待评估语句对应的语句向量与标注向量输入至所述预设的神经网络模型。


5.根据权利要求2所述的方法,其特征在于,所述通过预设的神经网络模型对所述待评估语句的明确度进行评估,获得评估结果,包括:
确定所...

【专利技术属性】
技术研发人员:谢海华陈雪飞佟津乐
申请(专利权)人:北大方正集团有限公司北大方正信息产业集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1