【技术实现步骤摘要】
企业信息图谱构建方法、装置、计算机设备及存储介质
本专利技术涉及计算机
,尤其涉及一种企业信息图谱构建方法、装置、计算机设备及存储介质。
技术介绍
互联网的网页中保存有海量的企业数据信息以供网络用户进行浏览,然而面对海量的企业数据信息用户只能浏览网页中静态的数据信息,而无法从网页中提取用户所需的有用信息并对企业进行关联分析,从而导致从海量企业数据信息中获取有用信息并进行分析的效率较低。因而现有的技术方法中存在无法高效地对海量企业数据信息进行提取及分析的问题。
技术实现思路
本专利技术实施例提供了一种企业信息图谱构建方法、装置、计算机设备及存储介质,旨在解决现有技术中存在无法海量企业数据信息进行提取及分析的问题。第一方面,本专利技术实施例提供了一种企业信息图谱构建方法,其包括:若接收到用户所输入的网址信息,将所述网址信息作为待爬取列表添加至预设的信息爬取程序中;将已添加待爬取列表的信息爬取程序发送至与预设管理服务器建立网络连接的多台信息采集终端;通过所述管理服务器接收多台信息采集终端所采集得到的企业数据信息并保存至预设的数据库中;若接收到用户所输入的图谱构建信息, ...
【技术保护点】
1.一种企业信息图谱构建方法,其特征在于,包括:若接收到用户所输入的网址信息,将所述网址信息作为待爬取列表添加至预设的信息爬取程序中;将已添加待爬取列表的信息爬取程序发送至与预设管理服务器建立网络连接的多台信息采集终端;通过所述管理服务器接收多台信息采集终端所采集得到的企业数据信息并保存至预设的数据库中;若接收到用户所输入的图谱构建信息,获取所述数据库中所保存的企业数据信息,根据图谱构建信息中的识别模型对所述企业数据信息进行分词处理以得到单词;根据图谱构建信息中的关键字信息对所得到的单词进行匹配以获取与关键字信息相匹配的企业实体信息及实体关联信息;根据图谱构建信息中的图谱构 ...
【技术特征摘要】
1.一种企业信息图谱构建方法,其特征在于,包括:若接收到用户所输入的网址信息,将所述网址信息作为待爬取列表添加至预设的信息爬取程序中;将已添加待爬取列表的信息爬取程序发送至与预设管理服务器建立网络连接的多台信息采集终端;通过所述管理服务器接收多台信息采集终端所采集得到的企业数据信息并保存至预设的数据库中;若接收到用户所输入的图谱构建信息,获取所述数据库中所保存的企业数据信息,根据图谱构建信息中的识别模型对所述企业数据信息进行分词处理以得到单词;根据图谱构建信息中的关键字信息对所得到的单词进行匹配以获取与关键字信息相匹配的企业实体信息及实体关联信息;根据图谱构建信息中的图谱构建规则、所得到的企业实体信息及实体关联信息构建得到企业信息图谱。2.根据权利要求1所述的企业信息图谱构建方法,其特征在于,所述根据图谱构建信息中的识别模型对所述企业数据信息进行分词处理以得到单词,包括:根据所述识别模型中的向量提取规则对企业数据信息中所包含的语句进行特征提取以得到所有语句中字符的特征向量;根据所述识别模型中概率计算公式对所得到字符的特征向量进行计算以得到所有字符的单词起始概率和单词终止概率;根据所述识别模型中预设的概率阈值对所得到的语句中字符的单词起始概率和单词终止概率进行判断以得到所有语句的概率判断结果;根据所得到的所有语句的概率判断结果对语句进行分词处理以得到单词。3.根据权利要求1所述的企业信息图谱构建方法,其特征在于,所述若接收到用户所输入的图谱构建信息,获取所述数据库中所保存的企业数据信息,根据图谱构建信息中的识别模型对所述企业数据信息进行分词处理以得到单词之前,还包括:通过预设的训练数据对识别模型进行训练,以得到训练后的识别模型。4.根据权利要求1所述的企业信息图谱构建方法,其特征在于,所述根据图谱构建信息中的关键字信息对所得到的单词进行匹配以获取与关键字信息相匹配的企业实体信息及实体关联信息,包括:根据预设的实体关键字对所得到的单词进行匹配以将包含预设实体关键字的单词作为识别得到的企业实体信息;根据预设的关联关键字对所得到的企业实体信息之间的单词进行匹配以将包含预设关联关键字的单词作为企业实体信息之间的实体关联信息。5.根据权利要求1所述的企业信息图谱构建方法,其特征在于,所述根据图谱构建信息中的图谱构建规则、所得到的企业实体信息及实体关联信息构建得到企业信息图谱,包括:根据所述图谱构建规则中的实体构建规则及所得...
【专利技术属性】
技术研发人员:吴壮伟,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。