信息分析方法及装置、电子设备和计算机可读存储介质制造方法及图纸

技术编号:29045029 阅读:15 留言:0更新日期:2021-06-26 05:58
本公开的实施例提供了信息分析方法及装置、电子设备和计算机可读存储介质。该方法包括:获取待分析文本;利用分析模型,预测所述待分析文本针对事件问题的答案,得到第一预测结果;其中,所述分析模型预先基于多个训练语料训练得到,所述训练语料标注有至少一个问题标注信息和针对所述至少一个问题中各问题的答案标注信息,所述至少一个问题包括以下任意一项或多项:事件问题,至少一个论元角色问题;响应于所述第一预测结果包括所述事件问题的答案,利用所述分析模型预测所述事件问题的答案对应的各论元角色问题的答案,得到第二预测结果;基于所述第一预测结果和所述第二预测结果,确定所述待分析文本对应的事件信息和论元信息。本公开技术方案能够提高从舆情新闻中提取事件信息与论元信息的准确性。取事件信息与论元信息的准确性。取事件信息与论元信息的准确性。

【技术实现步骤摘要】
信息分析方法及装置、电子设备和计算机可读存储介质


[0001]本公开涉及数据处理
,特别涉及信息分析方法及装置、电子设备和计算机可读存储介质。

技术介绍

[0002]舆情是指在一定的社会空间内,围绕社会事件的发生、发展和变化,作为主体的民众对作为客体的社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。
[0003]随着互联网技术的快速发展,网络的开发性和灵活性让其成为反映社会舆情的主要载体之一。通过对企业的舆情新闻进行信息提取和结构化存储,可以让用户方便的获取到其关注企业的全面舆情信息,并且有利于对企业的舆情信息进行析,准确判断企业的发展趋势,还可以进一步生成舆情报告和各种统计报表,以便于决策。
[0004]现有技术对企业的舆情新闻进行信息提取时,采用基于事件与论元的流水线(pipeline)方式来提取舆情新闻中的事件与论元值,先识别事件(如收购),识别出事件再抽取相应事件的论元值(如时间、收购物)。在实现本公开的过程中,本专利技术人通过研究发现,上述基于事件与论元的流水线方式来提取舆情新闻中的事件与论元值的方法,存在误差传导问题,若前面的事件识别不准确,就会导致后续的论元值识别也不准确,从而导致从企业的舆情新闻中提取的信息存在错误。

技术实现思路

[0005]本公开的目的在于提供一种信息分析方法及装置、电子设备和计算机可读存储介质,进而至少在一定程度上提高从舆情新闻中提取事件与论元值的准确性。
[0006]本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
[0007]根据本公开的第一方面,提供一种信息分析方法,包括:
[0008]获取待分析文本;
[0009]利用分析模型,预测所述待分析文本针对事件问题的答案,得到第一预测结果;其中,所述分析模型预先基于多个训练语料训练得到,所述训练语料标注有至少一个问题标注信息和针对所述至少一个问题中各问题的答案标注信息,所述至少一个问题包括以下任意一项或多项:事件问题,至少一个论元角色问题;
[0010]响应于所述第一预测结果包括所述事件问题的答案,利用所述分析模型预测所述事件问题的答案对应的各论元角色问题的答案,得到第二预测结果;
[0011]基于所述第一预测结果和所述第二预测结果,确定所述待分析文本对应的事件信息和论元信息。
[0012]可选地,在本公开上述任一实施例的信息分析方法中,所述利用分析模型,预测所述待分析文本针对事件问题的答案,包括:
[0013]向所述分析模型输入所述待分析文本和所述事件问题,经所述分析模型输出所述待分析文本针对所述事件问题的答案。
[0014]可选地,在本公开上述任一实施例的信息分析方法中,所述响应于所述第一预测结果包括所述事件问题的答案,利用所述分析模型预测所述事件问题的答案对应的各论元角色问题的答案,包括:
[0015]响应于所述第一预测结果包括所述事件问题的答案,获取所述事件问题的答案对应的各论元角色问题,并向所述分析模型输入所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案;或者,
[0016]响应于所述第一预测结果包括所述事件问题的答案,获取所述事件问题的答案对应的各论元角色问题,并向所述分析模型输入所述待分析文本和所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案。
[0017]可选地,在本公开上述任一实施例的信息分析方法中,所述向所述分析模型输入所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案,包括:
[0018]按照预设顺序,逐一向所述分析模型输入所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案;或者,
[0019]按照预设格式,向所述分析模型输入所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案。
[0020]可选地,在本公开上述任一实施例的信息分析方法中,向所述分析模型输入所述待分析文本和所述事件问题的答案对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案,包括:
[0021]按照预设顺序,逐一向所述分析模型输入所述待分析文本和所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案;或者,
[0022]按照预设格式,向所述分析模型输入所述待分析文本和所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案。
[0023]可选地,在本公开上述任一实施例的信息分析方法中,所述获取所述事件问题的答案对应的各论元角色问题,包括:
[0024]基于预先设定的第一对应关系,确定所述第一预测结果中的事件问题的答案对应的事件类型;
[0025]基于预先设定的第二对应关系,确定所述事件类型对应的各论元角色问题。
[0026]可选地,在本公开上述任一实施例的信息分析方法中,所述基于所述第一预测结果和所述第二预测结果,确定所述待分析文本对应的事件信息和论元信息,包括:
[0027]基于预先设定的第一对应关系,确定所述第一预测结果中的事件问题的答案对应的事件类型,基于所述第一预测结果中的事件问题和所述对应的事件类型,得到所述待分析文本对应的事件信息,所述待分析文本对应的事件信息包括所述对应的事件类型;
[0028]基于所述对应的各论元角色问题和所述对应的各论元角色问题的答案,得到所述待分析文本对应的论元信息,所述待分析文本对应的论元信息包括论元角色和所述论元角色的论元值。
[0029]可选地,在本公开上述任一实施例的信息分析方法中,所述分析模型包括:预训练
语言模型。
[0030]可选地,在本公开上述任一实施例的信息分析方法中,预先基于多个训练语料训练得到所述分析模型,包括:
[0031]分别针对多个初始语料中的每个初始语料,按照预设标注方式添加至少一个问题标注信息和针对所述至少一个问题中各问题的答案标注信息,得到所述多个训练语料;
[0032]将所述多个训练语料分别输入所述分析模型,以使所述分析模型学习所述多个训练语料针对所述至少一个问题中各问题的答案。
[0033]可选地,在本公开上述任一实施例的信息分析方法中,针对初始语料按照预设标注方式添加至少一个问题标注信息和针对所述至少一个问题中各问题的答案标注信息,得到训练语料,包括:
[0034]将所述初始语料、所述至少一个问题中的各问题和各问题的答案按照预设方式拼接,得到训练语料。
[0035]可选地,在本公开上述任一实施例的信息分析方法中,还包括:
[0036]利用识别模型,识别所述待分析文本中是否存在否定词、以及所述否定词是否作用于所述待分析文本中的事件触发词;其中,所述识别模型预先基于否定本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息分析方法,其特征在于,包括:获取待分析文本;利用分析模型,预测所述待分析文本针对事件问题的答案,得到第一预测结果;其中,所述分析模型预先基于多个训练语料训练得到,所述训练语料标注有至少一个问题标注信息和针对所述至少一个问题中各问题的答案标注信息,所述至少一个问题包括以下任意一项或多项:事件问题,至少一个论元角色问题;响应于所述第一预测结果包括所述事件问题的答案,利用所述分析模型预测所述事件问题的答案对应的各论元角色问题的答案,得到第二预测结果;基于所述第一预测结果和所述第二预测结果,确定所述待分析文本对应的事件信息和论元信息。2.根据权利要求1所述的方法,其特征在于,所述利用分析模型,预测所述待分析文本针对事件问题的答案,包括:向所述分析模型输入所述待分析文本和所述事件问题,经所述分析模型输出所述待分析文本针对所述事件问题的答案。3.根据权利要求1或2所述的方法,其特征在于,所述响应于所述第一预测结果包括所述事件问题的答案,利用所述分析模型预测所述事件问题的答案对应的各论元角色问题的答案,包括:响应于所述第一预测结果包括所述事件问题的答案,获取所述事件问题的答案对应的各论元角色问题,并向所述分析模型输入所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案;或者,响应于所述第一预测结果包括所述事件问题的答案,获取所述事件问题的答案对应的各论元角色问题,并向所述分析模型输入所述待分析文本和所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案。4.根据权利要求3所述的方法,其特征在于,所述向所述分析模型输入所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案,包括:按照预设顺序,逐一向所述分析模型输入所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案;或者,按照预设格式,向所述分析模型输入所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案。5.根据权利要求3所述的方法,其特征在于,向所述分析模型输入所述待分析文本和所述事件问题的答案对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案,包括:按照预设顺序,逐一向所述分析模型输入所述待分析文本和所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案;或者,按照预设格式,向所述分析模型输入所述待分析文本和所述对应的各论元角色问题,经所述分析模型输出所述待分析文本针对所述各论元角色问题的答案。6.根据权利要求3

5任一所述的方法,其特征在于,所述获取所述事件问题的答案对应的各论元角色问题,包括:基于预先设定的第一对应关系,确定所述第一预测结果中的事件问题的答案对应的事
件类型;基于预先设定的第二对应关系,确定所述事件类型对应的各论元角色问题。7.根据权利要求1

6任一所述的方法,其特征在于,所述基于所述第一预测结果和所述第二预测结果,确定所述待分析文本对应的事件信息和论元信息,包括:基于预先设定的第一对应关系,确定所述第一预测...

【专利技术属性】
技术研发人员:刘文强
申请(专利权)人:北京金堤征信服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1