一种信息获取方法及装置制造方法及图纸

技术编号:27935609 阅读:10 留言:0更新日期:2021-04-02 14:15
本发明专利技术提供一种信息获取方法及装置,包括:获取每个客户的信息要素,并获得每个客户的信息要素的特征向量,分别计算每个客户的信息要素的特征向量与参考向量的相似度,参考向量为参考用户的信息要素的特征向量;对相似度进行排序,根据预设间隔抽取部分相似度,并获取抽取的部分相似度对应的客户的信息要素。这样,计算每个客户的信息要素的特征向量与参考客户的信息要素的特征向量的相似度,根据相似度对客户的信息要素进行筛选,在后续获取客户的信息要素时,可以根据预设间隔抽取部分相似度,筛除部分相似度较高的客户的信息要素,减小获取客户的信息要素的过程中的计算量,优先计算时间。

【技术实现步骤摘要】
一种信息获取方法及装置
本专利技术涉及计算机
,特别涉及一种信息获取方法及装置。
技术介绍
随着计算机技术和互联网技术的不断发展,信息技术在现代银行经营业务中得到了普遍应用。银行在大量的业务中产生大量的客户信息,例如对公客户信息“十三要素”、个人客户信息“九要素”。庞大的客户信息使得在对客户信息特征提取时,需要较大的计算量,耗费较长的计算时间。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种信息获取方法及装置,减小计算量,优化计算时间。为实现上述目的,本专利技术有如下技术方案:一种信息获取方法,包括:获取每个客户的信息要素,并获取所述每个客户的信息要素的特征向量;分别计算所述每个客户的信息要素的特征向量与参考向量的相似度;所述参考向量为参考客户的信息要素的特征向量;对所述相似度进行排序,根据预设间隔依次抽取所述相似度中的部分相似度,以获得所述部分相似度对应的客户的信息要素。可选的,所述获取每个客户的信息要素,并获取所述每个客户的信息要素的特征向量,包括:对每个客户的信息要素进行分词,并收集所有的分词;根据收集的所有的分词获取所述每个客户的每个分词的频率,分别对所述每个客户的每个分词的频率进行降序排列并编号;分别将每个客户的信息要素的每个分词的频率的编号作为神经网络模型的输入数据,将相邻的分词的频率的编号作为所述神经网络模型的输出数据,以获得每个客户的信息要素的中间参数矩阵;根据所述每个客户的信息要素的中间参数矩阵获得所述每个客户的信息要素的特征向量。可选的,所述根据所述每个客户的信息要素的中间参数矩阵获得所述每个客户的信息要素的特征向量包括:将所述每个客户的信息要素的分词分别对应中间参数矩阵的行向量,以获得每个客户的信息要素的分词的向量;将每个客户的信息要素的分词的向量组成多维向量,该多维向量为所述每个客户的信息要素的特征向量。可选的,所述分别计算所述每个客户的信息要素的特征向量与参考向量的相似度,包括:分别计算所述每个客户的信息要素的向量与所述参考向量的余弦值,所述余弦值表示客户的信息要素的向量与参考向量的相似度。可选的,所述信息要素包括:姓名、证件类型、证件号码、证件有效期、国籍、性别、职业、联系地址和联系电话。一种信息获取装置,包括:第一获取单元,用于获取每个客户的信息要素,并获取所述每个客户的信息要素的特征向量;计算单元,用于分别计算所述每个客户的信息要素的特征向量与参考向量的相似度;所述参考向量为参考客户的信息要素的特征向量;第二获取单元,用于对所述相似度进行排序,根据预设间隔依次抽取所述相似度中的部分相似度,以获得所述部分相似度对应的客户的信息要素。可选的,所述第一获取单元包括:分词单元、排序单元、第一子获取单元以及第二子获取单元;所述分词单元,用于对每个客户的信息要素进行分词,并收集所有的分词;所述排序单元,用于根据收集的所有的分词获取所述每个客户的每个分词的频率,分别对所述每个客户的每个分词的频率进行降序排列并编号;所述第一子获取单元,用于分别将每个客户的信息要素的每个分词的频率的编号作为神经网络模型的输入数据,将相邻的分词的频率的编号作为所述神经网络模型的输出数据,以获得每个客户的信息要素的中间参数矩阵;所述第二子获取单元,用于根据所述每个客户的信息要素的中间参数矩阵获得所述每个客户的信息要素的特征向量。可选的,所述第二子获取单元具体用于将所述每个客户的信息要素的分词分别对应中间参数矩阵的行向量,以获得每个客户的信息要素的分词的向量;将每个客户的信息要素的分词的向量组成多维向量,该多维向量为所述每个客户的信息要素的特征向量。可选的,所述计算单元具体用于分别计算所述每个客户的信息要素的向量与所述参考向量的余弦值,所述余弦值表示客户的信息要素的向量与参考向量的相似度。可选的,所述信息要素包括:姓名、证件类型、证件号码、证件有效期、国籍、性别、职业、联系地址和联系电话。本专利技术实施例提供的一种信息获取方法,包括:获取每个客户的信息要素,并获得每个客户的信息要素的特征向量,计算每个客户的信息要素的特征向量与参考向量的相似度,参考向量为参考用户的信息要素的特征向量;对相似度进行排序,根据预设间隔抽取部分相似度,并获取抽取的部分相似度对应的客户的信息要素。这样,计算每个客户的信息要素的特征向量与参考客户的信息要素的特征向量的相似度,根据相似度对客户的信息要素进行筛选,在后续获取客户的信息要素时,可以根据预设间隔抽取部分相似度,筛除部分相似度较高的客户的信息要素,减小获取客户的信息要素的过程中的计算量,优先计算时间。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1示出了根据本专利技术实施例一种信息获取方法的流程示意图;图2示出了根据本专利技术实施例一种信息获取装置的结构示意图;图3示出了根据本专利技术实施例一种信息获取装置的结构示意图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图对本专利技术的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是本专利技术还可以采用其它不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似推广,因此本专利技术不受下面公开的具体实施例的限制。正如
技术介绍
的描述,随着计算机技术和互联网技术的不断发展,信息技术在现代银行经营业务中得到了普遍应用。银行在大量的业务中产生大量的客户信息,例如对公客户信息“十三要素”、个人客户信息“九要素”。庞大的客户信息使得在对客户信息特征提取时,需要较大的计算量,耗费较长的计算时间。为此,本申请实施例提供一种信息获取方法,包括:获取每个客户的信息要素,并获得每个客户的信息要素的特征向量,计算每个客户的信息要素的特征向量与参考向量的相似度,参考向量为参考用户的信息要素的特征向量;对相似度进行排序,根据预设间隔抽取部分相似度,并获取抽取的部分相似度对应的客户的信息要素。这样,计算每个客户的信息要素的特征向量与参考客户的信息要素的特征向量的相似度,根据相似度对客户的信息要素进行筛选,在后续获取客户的信息要素时,可以根据预设间隔抽取部分相似度,筛除部分相似度较高的客户的信息要素,减小获取客户的信息要素的过程中的计算量,优先计算时间。为了便于理解本申请的技术方案和技术效果,以下将结合附图对具体的实施例进行详细的说明。参考图1所示,在步骤S01中,获取每个客户的信息要素并获取所述每个客户的信息要素的特征向量。获取每个客户的信息要素,信息要素用于表示客户的身份信本文档来自技高网
...

【技术保护点】
1.一种信息获取方法,其特征在于,包括:/n获取每个客户的信息要素,并获取所述每个客户的信息要素的特征向量;/n分别计算所述每个客户的信息要素的特征向量与参考向量的相似度;所述参考向量为参考客户的信息要素的特征向量;/n对所述相似度进行排序,根据预设间隔依次抽取所述相似度中的部分相似度,以获得所述部分相似度对应的客户的信息要素。/n

【技术特征摘要】
1.一种信息获取方法,其特征在于,包括:
获取每个客户的信息要素,并获取所述每个客户的信息要素的特征向量;
分别计算所述每个客户的信息要素的特征向量与参考向量的相似度;所述参考向量为参考客户的信息要素的特征向量;
对所述相似度进行排序,根据预设间隔依次抽取所述相似度中的部分相似度,以获得所述部分相似度对应的客户的信息要素。


2.根据权利要求1所述的方法,其特征在于,所述获取每个客户的信息要素,并获取所述每个客户的信息要素的特征向量,包括:
对每个客户的信息要素进行分词,并收集所有的分词;
根据收集的所有的分词获取所述每个客户的每个分词的频率,分别对所述每个客户的每个分词的频率进行降序排列并编号;
分别将每个客户的信息要素的每个分词的频率的编号作为神经网络模型的输入数据,将相邻的分词的频率的编号作为所述神经网络模型的输出数据,以获得每个客户的信息要素的中间参数矩阵;
根据所述每个客户的信息要素的中间参数矩阵获得所述每个客户的信息要素的特征向量。


3.根据权利要求2所述的方法,其特征在于,所述根据所述每个客户的信息要素的中间参数矩阵获得所述每个客户的信息要素的特征向量包括:
将所述每个客户的信息要素的分词分别对应中间参数矩阵的行向量,以获得每个客户的信息要素的分词的向量;
将每个客户的信息要素的分词的向量组成多维向量,该多维向量为所述每个客户的信息要素的特征向量。


4.根据权利要求1所述的方法,其特征在于,所述分别计算所述每个客户的信息要素的特征向量与参考向量的相似度,包括:
分别计算所述每个客户的信息要素的向量与所述参考向量的余弦值,所述余弦值表示客户的信息要素的向量与参考向量的相似度。


5.根据权利要求1-4任意一项所述的方法,其特征在于,所述信息要素包括:姓名、证件类型、证件号码、证件有效期、国籍、性别、职业、联系地址和联系电话。

【专利技术属性】
技术研发人员:黄雅欢周健
申请(专利权)人:中国农业银行股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1