信息处理方法及信息处理装置、电子设备、存储介质制造方法及图纸

技术编号:37678120 阅读:22 留言:0更新日期:2023-05-26 04:44
本公开提供了一种信息处理方法及信息处理装置、电子设备、存储介质,该方法包括:获取待生成别名信息的实体所对应的标准实体名称;基于标准实体名称及实体对应的行业知识图谱,确定出实体对应的第一实体别名;获取第一实体别名的特征信息;基于第一实体别名的特征信息对第一实体别名进行实体别名衍生,获得第二实体别名;其中,第二实体别名不同于第一实体别名;基于第二实体别名,或,第二实体别名与第一实体别名,输出目标实体别名。本公开中基于第一实体别名的特征信息的别名衍生方式能够有效保证实体别名中关键信息的保留,使得衍生出的第二实体别名能够表征实体的基本特征,同时能够获取一定数量的实体别名解决别名缺少的问题。问题。问题。

【技术实现步骤摘要】
信息处理方法及信息处理装置、电子设备、存储介质


[0001]本公开涉及信息处理
,特别涉及一种信息处理方法及信息处理装置、电子设备、存储介质。

技术介绍

[0002]在传统型企业中,明确的实体一般采用标准实体名称。但在实际的业务场景下,很多情况会用到它的别名或是其他形式的非标准化表述,比如“学生平安保险”常在售前场景下被称作“学平险”和“学生险”,而这种实体别名的缺失,会限制命名实体识别技术和实体链接技术的应用。其中,实体识别技术和实体链接技术为很多应用场景下的关键技术,比如搜索系统、知识图谱、智能问答系统等。为了实体识别技术和实体链接技术的更便捷应用,需要解决这种别名缺少的问题。

技术实现思路

[0003]本公开提供一种信息处理方法及信息处理装置、电子设备、存储介质。
[0004]第一方面,本公开提供了一种信息处理方法,该信息处理方法包括:
[0005]获取待生成别名信息的实体所对应的标准实体名称;
[0006]基于所述标准实体名称及所述实体对应的行业知识图谱,确定出所述实体对应的第一实体别名;其中,所述标准实体名称确定为用于表征所述实体的实体特征时所采用的基本名称;
[0007]获取所述第一实体别名的特征信息;
[0008]基于所述第一实体别名的特征信息对所述第一实体别名进行实体别名衍生,获得第二实体别名;其中,所述第二实体别名不同于所述第一实体别名;
[0009]基于所述第二实体别名,或,所述第二实体别名与所述第一实体别名,输出目标实体别名。
[0010]第二方面,本公开提供了一种信息处理装置,该信息处理装置包括:
[0011]第一信息获取模块,用于获取待生成别名信息的实体所对应的标准实体名称;
[0012]信息确定模块,用于基于所述标准实体名称及所述实体对应的行业知识图谱,确定出所述实体对应的第一实体别名;其中,所述标准实体名称确定为用于表征所述实体的实体特征时所采用的基本名称;
[0013]第二信息获取模块,用于获取所述第一实体别名的特征信息;
[0014]第三信息获取模块,用于基于所述第一实体别名的特征信息对所述第一实体别名进行实体别名衍生,获得第二实体别名;其中,所述第二实体别名不同于所述第一实体别名;
[0015]实体别名输出模块,用于基于所述第二实体别名,或,所述第二实体别名与所述第一实体别名,输出目标实体别名。
[0016]第三方面,本公开提供了一种电子设备,该电子设备包括:至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述第一方面所述的信息处理方法。
[0017]第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,其中,所述计算机程序在被处理器/处理核执行时实现上述的第一方面所述的信息处理方法。
[0018]本公开所提供的信息处理方法,标准实体名称可以准确地表征待生成别名信息的实体的实体特征,行业知识图谱包含了本行业的更多信息,因此,基于标准实体名称及实体对应的行业知识图谱确定实体对应的第一实体别名更准确;基于第一实体别名的特征信息对第一实体别名进行实体别名衍生,即在第一实体别名基础上进一步衍生获得第二实体别名,保留了第一实体别名的关键信息,使得衍生出的第二实体别名能够表征实体的基本特征,同时能够获得更多的目标实体别名,以解决实体别名缺少的问题。
[0019]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0020]附图用来提供对本公开的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
[0021]图1为本公开实施例提供的一种信息处理方法的流程图;
[0022]图2为本公开实施例提供的一个行业知识图谱;
[0023]图3为本公开实施例提供的一个音形图谱;
[0024]图4为本公开实施例提供的一种实体别名生成方法的流程图;
[0025]图5为本公开实施例提供的一种信息处理装置的框图;
[0026]图6为本公开实施例提供的一种电子设备的框图。
具体实施方式
[0027]为使本领域的技术人员更好地理解本公开的技术方案,以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0028]在不冲突的情况下,本公开各实施例及实施例中的各特征可相互组合。
[0029]如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
[0030]本文所使用的术语仅用于描述特定实施例,且不意欲限制本公开。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由
……
制成”时,指定存在所述特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
[0031]除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应当被解释为具有与其在相关技术以及本公开的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
[0032]根据本公开实施例的信息处理方法,能够通过行业知识图谱确定出第一实体别名,通过获取第一实体别名的特征信息对第一实体别名进行实体别名衍生,获得第二实体别名,从而将第二实体别名作为目标实体别名进行输出。基于第一实体别名的特征信息的别名衍生方式能够有效保证实体别名中关键信息的保留,使得衍生出的第二实体别名能够表征实体的基本特征,同时能够获取一定数量的实体别名解决别名缺少的问题。
[0033]根据本公开实施例的信息处理方法可以由终端设备或服务器等电子设备执行,终端设备可以为车载设备、用户设备(User Equipment,UE)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(Personal Digital Assistant,PDA)、手持设备、计算设备、车载设备、可穿戴设本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:获取待生成别名信息的实体所对应的标准实体名称;基于所述标准实体名称及所述实体对应的行业知识图谱,确定出所述实体对应的第一实体别名;其中,所述标准实体名称确定为用于表征所述实体的实体特征时所采用的基本名称;获取所述第一实体别名的特征信息;基于所述第一实体别名的特征信息对所述第一实体别名进行实体别名衍生,获得第二实体别名;其中,所述第二实体别名不同于所述第一实体别名;基于所述第二实体别名,或,所述第二实体别名与所述第一实体别名,输出目标实体别名。2.根据权利要求1所述的信息处理方法,其特征在于,所述获取所述第一实体别名的特征信息,包括:基于别名信息生成规则,获取所述第一实体别名的第一特征信息;和/或,基于音形图谱,获取所述第一实体别名的第二特征信息;其中,所述第二特征信息不同于所述第一特征信息。3.根据权利要求2所述的信息处理方法,其特征在于,所述别名信息生成规则,包括:第一提取规则,或,第二提取规则;所述基于别名信息生成规则,获取所述第一实体别名的第一特征信息,包括:对所述第一实体别名进行分词,获得多个分词,基于所述第一提取规则,在所述多个分词中提取至少一个字作为所述第一特征信息;或,对所述第一实体别名进行分词,获得多个分词,基于所述第二提取规则,至少提取所述多个分词中的一个分词作为所述第一特征信息。4.根据权利要求3所述的信息处理方法,其特征在于,所述基于所述第一提取规则,在所述多个分词中至少提取至少一个字作为所述第一特征信息,包括:基于每个所述分词遍历保留词集合;其中,所述保留词集合为预先建立的包含有保留词的词汇集合;若所述分词未存在于所述保留词集合中,则将所述分词中预定位置的字作为所述第一实体别名的第一特征信息;若所述分词存在于所述保留词集合中,则将所述分词作为生成所述第一实体别名的第一特征信息。5.根据权利要求4所述的信息处理方法,其特征在于,所述基于所述第二提取规则,至少提取所述多个分词中的一个分词作为所述第一特征信息,包括:基于每个所述分词遍历保留词集合;其中,所述保留词集合为预先建立的包含有保留词的词汇集合;若所述分词未存在于所述保留词集合中,则基于分词的词频与逆向文件频率TFIDF模型确定TFIDF值,若所述分词的TFIDF值大于预定阈值,则将所述分词作为所述第一实体别名的第一特征信息;
若所述分词存在于所述保留词集合中,则确定所述分词为所述第一实体别名的第一特征信息。6.根据权利要求2所述的信息处理方法,其特征在于,所述音形图谱包括多个音形节点,每个所述音形节点对应一个常用字;所述基于音形图谱,获取所述第一实体别名的第二特征信息,包括:确定出所述第一实体别名中需要替换的待替换字;根据所述音形图谱中与所述待替换字对应的常用字之间的音近的相似程度,获取所述第一实体别名中与所述待替换字相关的第二特征信息;和/或,根据所述音形图谱中与所述待替换字对应的常用字之间的形近的相似程度,获取所述第一实体别名中与所述待替换字相关的第二特征信息。7.根据权利要求6所述的信息处理方法,其特征在于,所述基于所述待替换字,根据所述音形图谱中与所述待替换字对应的常用字之间的音近的相似程度,获取所述第一实体别名中与所述待替换字相关的第二特征信息,包括:遍历所述音形图谱的音形节点,确定出与所述待替换字音近的常用字,将与所述待替换字音近的常用字作为所述第二特征信息;所述基于所述待替换字,根据所述音形图谱中与所述待替换字对应的常用字之间的形近的相似程度,获取所述第一实体别名中与所述待替换字相关的第二特征信息,包括:遍历所述音形图谱的音形节点,将与所述待替换字形近的常用字作为所述第二特征信息。8.根据权利要求2所述的信息处理方法,其特征在于,所述行业知识图谱包括多个行业知识节点;每个所述行业知识节点与实体相关联,每个所述行业知识节点具有与所述实体相关联的实体名称;所述基于所述标准实体名称及所述实体对应的行业知识图谱,确定出所述实体对应的第一实体别名,包括:基于所述标准实体名称遍历所述行业知识图谱中的各个行业知识节点,确定出与所述实体具有从属关系的各个行业知识节点对应的实体名称,得到所述实体对应的第一实体别名。9.根据权利要求8所述的信息处理方法,其特征在于,所述基于所述标准实体名称遍历所述行业知识图谱中的各个行业知识节点,确定出与所述实体具有从属关系的各个行业知识节点对应的实体名称之后,还包括:确...

【专利技术属性】
技术研发人员:汪自立马超夏粉蒋宁吴海英肖冰
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1