【技术实现步骤摘要】
基于信息图谱的信息匹配方法、装置、存储介质和服务器
本专利技术涉及信息处理
,尤其涉及一种基于信息图谱的信息匹配方法、装置、存储介质和服务器。
技术介绍
金融是现代经济的核心,金融的健康平稳发展是保证国民经济持续稳定发展的重要前提条件。随着互联网的迅猛发展,金融市场上每天都会产生大量的信息资讯,包括公告、问答、新闻、研究等内容,人们面临着信息爆炸,海量的金融信息分散在互联网上,信息具有碎片化,多语言和国际化的性质。大量非结构化的文本信息充斥着互联网,企业用户如何从海量信息源中挖掘出有价值的信息是一个巨大的挑战。现有技术中,用户需要从各大网站一一搜寻需求信息,搜寻难度大,耗费时间较长,且用户获取的信息不全面。
技术实现思路
本专利技术实施例提供了一种基于信息图谱的信息匹配方法、装置、存储介质和服务器,以解决现有技术中,用户需要从各大网站一一搜寻需求信息,搜寻难度大,耗费时间较长,且用户获取的信息不全面的问题。本专利技术实施例的第一方面提供了一种基于信息图谱的信息匹配方法,包括:监控并抓取用户指定的信息平台上发布的文本信息;将抓取的文本信息进行预处理,获取有效文本信 ...
【技术保护点】
1.一种基于信息图谱的信息匹配方法,其特征在于,包括:监控并抓取用户指定的信息平台上发布的文本信息;将抓取的文本信息进行预处理,获取有效文本信息;对所述有效文本信息进行命名体识别,获取识别的命名实体;根据所述命名实体与所述用户对应的预定义信息图谱,获取与所述用户匹配的文本信息。
【技术特征摘要】
1.一种基于信息图谱的信息匹配方法,其特征在于,包括:监控并抓取用户指定的信息平台上发布的文本信息;将抓取的文本信息进行预处理,获取有效文本信息;对所述有效文本信息进行命名体识别,获取识别的命名实体;根据所述命名实体与所述用户对应的预定义信息图谱,获取与所述用户匹配的文本信息。2.根据权利要求1所述的信息匹配方法,其特征在于,所述将抓取的文本信息进行预处理,获取有效文本信息的步骤,包括:对抓取的文本信息进行数据清洗;根据预定义的抽取类别名,从经过所述数据清洗的文本信息中抽取与所述预定义的实体类别名对应的文本信息;根据预设分类模型,将抽取的文本信息进行分类;根据分类后的文本信息生成有效文本信息。3.根据权利要求1所述的信息匹配方法,其特征在于,所述根据所述命名实体与所述用户对应的预定义信息图谱,获取与所述用户匹配的文本信息的步骤,包括:从所述用户对应的预定义信息图谱中,获取所述用户对应的用户命名实体的关键字与所述用户命名实体的属性;根据所述用户命名实体的关键字,从所述有效文本信息中抽取与所述用户命名实体的关键字关联的命名实体;根据所述用户命名实体的属性,对所述命名实体进行关联性处理,得到各个命名实体之间的实体关系。4.根据权利要求1至3任一项所述的信息匹配方法,其特征在于,所述根据所述命名实体与所述用户对应的预定义信息图谱,获取与所述用户匹配的文本信息的步骤,还包括:根据所述命名实体与自定义机器学习模型,获取所述命名实体对应的文本信息的关注值;根据所述命名实体与所述关注值,获取与所述用户匹配的文本信息。5.根据权利要求4所述的信息匹配方法,其特征在于,所述关注值为正负面情感值,所述将所述命名实体输入至自定义机器学习模型中,得到所述命名实体对应的文本信息的关注值的步骤,包括:将所述命名实体输...
【专利技术属性】
技术研发人员:王建华,邹娟梅,王宇,孙家全,
申请(专利权)人:深圳价值在线信息科技股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。