【技术实现步骤摘要】
信息处理方法及信息处理装置、电子设备、存储介质
[0001]本公开涉及信息处理
,特别涉及一种信息处理方法及信息处理装置、电子设备、存储介质。
技术介绍
[0002]在传统型企业中,明确的实体一般采用标准实体名称。但在实际的业务场景下,很多情况会用到它的别名或是其他形式的非标准化表述,比如“学生平安保险”常在售前场景下被称作“学平险”和“学生险”,而这种实体别名的缺失,会限制命名实体识别技术和实体链接技术的应用。其中,实体识别技术和实体链接技术为很多应用场景下的关键技术,比如搜索系统、知识图谱、智能问答系统等。为了实体识别技术和实体链接技术的更便捷应用,需要解决这种别名缺少的问题。
技术实现思路
[0003]本公开提供一种信息处理方法及信息处理装置、电子设备、存储介质。
[0004]第一方面,本公开提供了一种信息处理方法,该信息处理方法包括:
[0005]获取待生成别名信息的实体所对应的标准实体名称;
[0006]基于所述标准实体名称及所述实体对应的行业知识图谱,确定出所述实体对应的第一实体别名;其中,所述标准实体名称确定为用于表征所述实体的实体特征时所采用的基本名称;
[0007]获取所述第一实体别名的特征信息;
[0008]基于所述第一实体别名的特征信息对所述第一实体别名进行实体别名衍生,获得第二实体别名;其中,所述第二实体别名不同于所述第一实体别名;
[0009]基于所述第二实体别名,或,所述第二实体别名与所述第一实体别名,输出目标实体别名。 ...
【技术保护点】
【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:获取待生成别名信息的实体所对应的标准实体名称;基于所述标准实体名称及所述实体对应的行业知识图谱,确定出所述实体对应的第一实体别名;其中,所述标准实体名称确定为用于表征所述实体的实体特征时所采用的基本名称;获取所述第一实体别名的特征信息;基于所述第一实体别名的特征信息对所述第一实体别名进行实体别名衍生,获得第二实体别名;其中,所述第二实体别名不同于所述第一实体别名;基于所述第二实体别名,或,所述第二实体别名与所述第一实体别名,输出目标实体别名。2.根据权利要求1所述的信息处理方法,其特征在于,所述获取所述第一实体别名的特征信息,包括:基于别名信息生成规则,获取所述第一实体别名的第一特征信息;和/或,基于音形图谱,获取所述第一实体别名的第二特征信息;其中,所述第二特征信息不同于所述第一特征信息。3.根据权利要求2所述的信息处理方法,其特征在于,所述别名信息生成规则,包括:第一提取规则,或,第二提取规则;所述基于别名信息生成规则,获取所述第一实体别名的第一特征信息,包括:对所述第一实体别名进行分词,获得多个分词,基于所述第一提取规则,在所述多个分词中提取至少一个字作为所述第一特征信息;或,对所述第一实体别名进行分词,获得多个分词,基于所述第二提取规则,至少提取所述多个分词中的一个分词作为所述第一特征信息。4.根据权利要求3所述的信息处理方法,其特征在于,所述基于所述第一提取规则,在所述多个分词中至少提取至少一个字作为所述第一特征信息,包括:基于每个所述分词遍历保留词集合;其中,所述保留词集合为预先建立的包含有保留词的词汇集合;若所述分词未存在于所述保留词集合中,则将所述分词中预定位置的字作为所述第一实体别名的第一特征信息;若所述分词存在于所述保留词集合中,则将所述分词作为生成所述第一实体别名的第一特征信息。5.根据权利要求4所述的信息处理方法,其特征在于,所述基于所述第二提取规则,至少提取所述多个分词中的一个分词作为所述第一特征信息,包括:基于每个所述分词遍历保留词集合;其中,所述保留词集合为预先建立的包含有保留词的词汇集合;若所述分词未存在于所述保留词集合中,则基于分词的词频与逆向文件频率TFIDF模型确定TFIDF值,若所述分词的TFIDF值大于预定阈值,则将所述分词作为所述第一实体别名的第一特征信息;
若所述分词存在于所述保留词集合中,则确定所述分词为所述第一实体别名的第一特征信息。6.根据权利要求2所述的信息处理方法,其特征在于,所述音形图谱包括多个音形节点,每个所述音形节点对应一个常用字;所述基于音形图谱,获取所述第一实体别名的第二特征信息,包括:确定出所述第一实体别名中需要替换的待替换字;根据所述音形图谱中与所述待替换字对应的常用字之间的音近的相似程度,获取所述第一实体别名中与所述待替换字相关的第二特征信息;和/或,根据所述音形图谱中与所述待替换字对应的常用字之间的形近的相似程度,获取所述第一实体别名中与所述待替换字相关的第二特征信息。7.根据权利要求6所述的信息处理方法,其特征在于,所述基于所述待替换字,根据所述音形图谱中与所述待替换字对应的常用字之间的音近的相似程度,获取所述第一实体别名中与所述待替换字相关的第二特征信息,包括:遍历所述音形图谱的音形节点,确定出与所述待替换字音近的常用字,将与所述待替换字音近的常用字作为所述第二特征信息;所述基于所述待替换字,根据所述音形图谱中与所述待替换字对应的常用字之间的形近的相似程度,获取所述第一实体别名中与所述待替换字相关的第二特征信息,包括:遍历所述音形图谱的音形节点,将与所述待替换字形近的常用字作为所述第二特征信息。8.根据权利要求2所述的信息处理方法,其特征在于,所述行业知识图谱包括多个行业知识节点;每个所述行业知识节点与实体相关联,每个所述行业知识节点具有与所述实体相关联的实体名称;所述基于所述标准实体名称及所述实体对应的行业知识图谱,确定出所述实体对应的第一实体别名,包括:基于所述标准实体名称遍历所述行业知识图谱中的各个行业知识节点,确定出与所述实体具有从属关系的各个行业知识节点对应的实体名称,得到所述实体对应的第一实体别名。9.根据权利要求8所述的信息处理方法,其特征在于,所述基于所述标准实体名称遍历所述行业知识图谱中的各个行业知识节点,确定出与所述实体具有从属关系的各个行业知识节点对应的实体名称之后,还包括:确...
【专利技术属性】
技术研发人员:汪自立,马超,夏粉,蒋宁,吴海英,肖冰,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。