一种用户画像的方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:23289354 阅读:48 留言:0更新日期:2020-02-08 19:05
本发明专利技术揭示了一种用户画像的方法、装置、存储介质及计算机设备,其中,用户画像的方法,所述方法具有对应的用户画像系统,用户画像系统具有对应的服务器,包括:获取第一用户开具的发票信息,并上传至服务器,其中,第一用户包含于所有使用用户画像系统进行画像的用户;从服务器下载第一发票信息,解析第一发票信息,生成第一发票信息对应的结构化数据,其中,第一发票信息为第一用户的发票信息;根据预设的标签体系,对解析后的第一发票信息进行打标,生成多个标签;根据多个标签,输出第一用户对应的用户画像。与现有技术相比,本发明专利技术基于电子发票,对用户进行标签化,提升服务用户的能力,做到对用户服务的个性化,做到用户的精准分类。

A method, device, storage medium and computer equipment for user portrait

【技术实现步骤摘要】
一种用户画像的方法、装置、存储介质及计算机设备
本专利技术涉及到人工智能领域,特别是涉及到一种用户画像的方法、装置、存储介质及计算机设备。
技术介绍
随着电子信息行业的发展,发票电子化的必要性越来越高,对发票的信息提取和处理也越来越重要。以往的电子发票仅用于解决发票业务的问题,未能将发票信息最大化利用。为了后续给用户提供更好的服务,就需要精准的将用户进行分类。因此,如何最大化利用发票信息,建立用户画像,从而实现对用户的精准分类,显得十分必要。
技术实现思路
本专利技术的主要目的为提供一种用户画像的方法,旨在解决最大化利用发票信息,建立用户画像,从而实现对用户的精准分类的技术问题。本专利技术提供一种用户画像的方法,所述方法具有对应的用户画像系统,用户画像系统具有对应的服务器,包括:获取第一用户开具的发票信息,并上传至服务器,其中,第一用户包含于所有使用用户画像系统进行画像的用户;从服务器下载第一发票信息,解析第一发票信息,生成第一发票信息对应的结构化数据,其中,第一发票信息为第一用户的发票信息;根据预设的标签体系,对解析后的第一发票信息进行打标,生成多个标签;根据多个标签,输出第一用户对应的用户画像。优选的,用户画像系统具有对应的神经网络,根据预设的标签体系,对解析后的第一发票信息进行打标,生成多个标签的步骤,包括:根据预设的标签体系,通过神经网络对解析后的第一发票信息进行打标,生成多个标签。优选的,从服务器下载第一发票信息,解析第一发票信息,生成第一发票信息对应的结构化数据的步骤,包括:获取第一发票信息并将第一发票信息转为预设数据格式;从预设数据格式的第一发票信息中筛选和清洗第一发票信息,得到第一发票信息中的有效信息,其中,有效信息为用于建立用户画像的数据信息。优选的,各标签具有对应的维度,根据多个标签,输出第一用户对应的用户画像的步骤,包括:将各标签与第一用户各维度的信息一一关联;通过第一用户各维度对应的标签,生成并输出第一用户对应的用户画像。本专利技术还提供一种用户画像的装置,包括:获取模块,用于获取第一用户开具的发票信息,并上传至服务器,其中,第一用户包含于所有使用用户画像系统进行画像的用户;执行模块,用于从服务器下载第一发票信息,解析第一发票信息,生成第一发票信息对应的结构化数据,其中,第一发票信息为第一用户的发票信息;打标模块,用于根据预设的标签体系,对解析后的第一发票信息进行打标,生成多个标签;画像模块,用于根据多个标签,输出第一用户对应的用户画像。优选的,打标模块包括:打标子模块,用于根据预设的标签体系,通过神经网络对解析后的第一发票信息进行打标,生成多个标签。优选的,执行模块包括:获取子模块,用于获取第一发票信息并将第一发票信息转为预设数据格式;解析子模块,用于从预设数据格式的第一发票信息中筛选和清洗第一发票信息,得到第一发票信息中的有效信息,其中,有效信息为用于建立用户画像的数据信息。优选的,画像模块包括:联系子模块,用于将各标签与第一用户各维度的信息一一关联;输出子模块,用于通过第一用户各维度对应的标签,生成并输出第一用户对应的用户画像。本专利技术还提供一种存储介质,其为计算机可读的存储介质,其上存储有计算机程序,计算机程序被执行时实现上述的用户画像的方法。本专利技术还提供一种计算机设备,其包括处理器、存储器及存储于存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现如上述的用户画像的方法。本专利技术的有益效果在于:通过使用服务器,存储大量的历史发票数据,再通过对大量的历史发票数据的解析,获取到有效的信息,建立和用户的链接关系,对用户进行标签化,提升服务用户的能力,做到对用户服务的个性化,做到用户的精准分类。附图说明图1为本专利技术一种用户画像的方法的第一实施例的流程示意图;图2为图1中用户画像系统与服务器配合工作的示意图;图3为本专利技术一种用户画像的方法的第二实施例的流程示意图;图4为图2中用户画像系统的深度卷积神经网络的结构示意图;图5为本专利技术一种用户画像的方法的第三实施例的流程示意图;图6为本专利技术一种用户画像的方法的第四实施例的流程示意图;图7为本专利技术一种用户画像的方法的四实施例的标签体系示意图;图8为本专利技术一种用户画像的装置的第一实施例的结构示意图;图9为本申请提供的存储介质一实施例的结构框图;图10为本申请提供的计算机设备一实施例的结构框图。标号说明:1、获取模块;2、执行模块;3、打标模块;4、画像模块;5、用户画像系统;6、服务器;7、深度卷积神经网络;8、输入层;9、卷积层;10、采样层;11、全连接层;12、softmax输出层;100、存储介质;200、计算机程序;300、计算机设备;400、处理器。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。参照图1至图2,本专利技术提供一种用户画像的方法,所述方法具有对应的用户画像系统5,用户画像系统5具有对应的服务器6,包括:S1:获取第一用户开具的发票信息,并上传至服务器6,其中,第一用户包含于所有使用所述用户画像系统进行画像的用户;S2:从服务器6下载第一发票信息,解析第一发票信息,生成第一发票信息对应的结构化数据,其中,第一发票信息为第一用户的发票信息;S3:根据预设的标签体系,对解析后的第一发票信息进行打标,生成多个标签;S4:根据多个标签,输出第一用户对应的用户画像。在本专利技术实施例中,用户画像系统5为软件系统,服务器6为分布式云存储服务器。用户画像系统5经用户授权后,通过应用程序从用户的邮箱或者通过商家的发票数据库中下载有关用户的电子发票数据,并将下载的电子发票数据上传至分布式云服务器中。具体的,在数据采集上使用了提高效率的多进程爬虫和zookeeper队列,在用户授权后,能够在快速采集电子发票数据,获取的大量历史数据,能够更好的提高用户画像的准确度;使用分布式云存储服务器,支持海量数据的操作,通过分布式存储的方式,上传获取的历史开票数据,其中,存储技术是基于hadoop(hadoop,海杜普)大数据集群的存储技术,使用了大数据中的应用技术,数据存储在HDFS(HadoopDistributedFileSystem,分布式文件系统)中,映射到hive表,能够保障数据的安全性,提升了生成用户画像的效率,也增强了系统的稳定性和可靠性,能够支持超大文件、具备高容错能力、高数据访问能力。用户画像系统5从分布式云服务器中下载电子发票数据,然后解析电子发票数据,生成电子发票数据对应的结构化数据。用户画像系统5根据预设的标签体系,对解析后的电子发票本文档来自技高网...

【技术保护点】
1.一种用户画像的方法,其特征在于,所述方法具有对应的用户画像系统,所述用户画像系统具有对应的服务器,包括:/n获取第一用户开具的发票信息,并上传至所述服务器,其中,所述第一用户包含于所有使用所述用户画像系统进行画像的用户;/n从所述服务器下载所述第一发票信息,解析所述第一发票信息,生成所述第一发票信息对应的结构化数据,其中,所述第一发票信息为所述第一用户的发票信息;/n根据预设的标签体系,对解析后的所述第一发票信息进行打标,生成多个标签;/n根据多个所述标签,输出所述第一用户对应的用户画像。/n

【技术特征摘要】
1.一种用户画像的方法,其特征在于,所述方法具有对应的用户画像系统,所述用户画像系统具有对应的服务器,包括:
获取第一用户开具的发票信息,并上传至所述服务器,其中,所述第一用户包含于所有使用所述用户画像系统进行画像的用户;
从所述服务器下载所述第一发票信息,解析所述第一发票信息,生成所述第一发票信息对应的结构化数据,其中,所述第一发票信息为所述第一用户的发票信息;
根据预设的标签体系,对解析后的所述第一发票信息进行打标,生成多个标签;
根据多个所述标签,输出所述第一用户对应的用户画像。


2.根据权利要求1所述的用户画像的方法,其特征在于,所述用户画像系统具有对应的神经网络,所述根据预设的标签体系,对解析后的所述第一发票信息进行打标,生成多个标签的步骤,包括:
根据预设的标签体系,通过所述神经网络对解析后的所述第一发票信息进行打标,生成多个标签。


3.根据权利要求1所述的用户画像的方法,其特征在于,所述从所述服务器下载所述第一发票信息,解析所述第一发票信息,生成所述第一发票信息对应的结构化数据的步骤,包括:
获取所述第一发票信息并将所述第一发票信息转为预设数据格式;
从所述预设数据格式的所述第一发票信息中筛选和清洗所述第一发票信息,得到所述第一发票信息中的有效信息,其中,所述有效信息为用于建立用户画像的数据信息。


4.根据权利要求1所述的用户画像的方法,其特征在于,各所述标签具有对应的维度,所述根据多个所述标签,输出所述第一用户对应的用户画像的步骤,包括:
将各所述标签与所述第一用户各维度的信息一一关联;
通过所述第一用户各所述维度对应的所述标签,生成并输出所述第一用户对应的用户画像。


5.一种用户画像的装置,其特征在于,包括:
获取模块,用于获取第一用户开具...

【专利技术属性】
技术研发人员:张民遐谷鹏刘城城
申请(专利权)人:海南高灯科技有限公司
类型:发明
国别省市:海南;46

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1