用于对实体关系实例进行过滤的方法和设备技术

技术编号：3900721 阅读：200 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了一种对实体关系实例进行过滤的方法和设备。所述方法可以包括：基于实体关系实例的可靠性相关信息来对实体关系实例的可靠性进行标记；以及对经过标记的实体关系实例进行过滤，以得到可靠的实体关系实例。通过本发明专利技术，可以得到精确度更高的实体关系实例，为基于实体关系实例的高层分析提供了更加可靠的基础，从而使得得到的实体关系实例对于高层决策具有更大的实用性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信息抽取的
，更具体地涉及用于对实体关系实例进行过滤的方法和设备。
技术介绍
随着经济全球化的不断发展、市场区域的持续扩大以及竞争对手的不断增多，对于企业而言，拥有对外界信息进行捕捉和处理的能力显得愈发重要。具体来说，就是需要这样一种技术处理能力，即，通过对与之相关企业的商业关系分析营造出一个虚拟的企业经营环境，用以帮助企业各级决策者获得知识和洞察力，进而做出对企业更为有利的决策。信息抽取是构筑上述技术处理能力的核心技术之一，而实体关系抽取继而是信息抽取领域中的重要研究课题之一。实体关系抽取是一种用于自动地从文本中发现实体之间的关系的技术。例如，对于给定文本“AMD plans to compete with Intel atom chip”，根据该技术能够自动分析出命名实体“AMD”和“Intel”之间存在“竞争(compete) ”关系。实体关系抽取作为信息抽取领域的重要技术之一，其处理结果将会直接影响到更高层分析，例如企业商业信息处理。因此，高效准确的实体关系抽取方法是对于实体关系抽取而言是非常重要的。从技术的角度来讲，实体关系抽取是要自动识别用自然语言表达的两个实体之间的关联。在现有技术中，通常使用的方法主要包括基于规则的抽取方法和机器学习的抽取方法。基于规则的抽取方法需要针对不同的领域由专家构造相应的知识库。而另外一种基于机器学习的抽取方法则是将关系抽取转换为分类问题，其通过构造关系候选，利用机器学习得到分类器，从而利用该分类器将关系标注为属于哪个预定义的关系。由于关系抽取问题本身具有极大的复杂...

【技术保护点】
一种用于对实体关系实例进行过滤的方法，包括：基于实体关系实例的可靠性相关信息来对实体关系实例的可靠性进行标记；以及对经过标记的实体关系实例进行过滤，以得到可靠的实体关系实例。

【技术特征摘要】

【专利技术属性】
技术研发人员：沈国阳，胡长建，许洪志，
申请(专利权)人：日电中国有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人