一种车主身份识别方法及装置制造方法及图纸

技术编号:16780088 阅读:59 留言:0更新日期:2017-12-13 00:12
本申请公开了一种车主身份识别方法及装置,该车主身份识别方法中,获取未知身份用户的用户数据后,利用预先设立的模型,根据用户数据确定用户是车主的概率值,其中,预先设立的模型通过学习真实车主和真实非车主的用户数据得到。由于确定了用户是车主的概率,可以便于其它业务进一步根据该概率值进行具体的业务判断,并且,通过学习真实车主和真实非车主的用户数据得到模型,可以提高车主身份识别的准确性。

A method and device for identification of car owners

The invention discloses a device and a method to identify the identity of the owner, the owner of identity recognition method, user data acquisition unknown users, using pre established model, according to the user data to determine whether the user is the owner of the probability value, the pre established model through learning the true owners and non owners of real user data get. Due to the fact that the probability of a user is a vehicle owner, it is convenient for other businesses to further judge the specific business according to the probability value. And by learning the user data of real owners and real non owners, we can improve the accuracy of car owner identification.

【技术实现步骤摘要】
一种车主身份识别方法及装置
本公开一般涉及计算机领域,具体涉及身份识别技术,尤其涉及一种车主身份识别方法及装置。
技术介绍
在我国,汽车保有量已经达到亿级别,而伴随互联网的迅速发展,出行类app在方便用户查询出行路线的同时,也提供了诸多方便车主用车的在线服务,如:在线加油、违章查询、汽车用品、车险、停车缴费、代驾等服务。如今,如何在车主没有填写任何信息的情况下,通过用户使用过的出行服务、积累的大量出行数据,预测出该用户是否为车主,进而为车主用户提供更加个性的服务,是目前需要解决的问题。目前存在的根据用户的路线检索等行为判断用户是否为车主的方法,其准确性不高,容易造成误判,导致对非车主提供车主的个性服务进而对非车主用户造成打扰。
技术实现思路
鉴于现有技术中的上述缺陷或不足,期望提供一种车主身份识别方法及装置,以提高车主身份识别的准确性。第一方面,本专利技术实施例提供一种车主身份识别方法,所述方法包括:获取未知身份用户的用户数据;利用预先设立的模型,根据所述用户数据确定所述用户是车主的概率值,所述预先设立的模型通过学习真实车主和真实非车主的用户数据得到。第二方面,本专利技术实施例提供一种车主身份识别装置,所述装置包括:数据获取单元,用于获取未知身份用户的用户数据;身份识别单元,用于利用预先设立的模型,根据所述用户数据确定所述用户是车主的概率值,所述预先设立的模型通过学习真实车主和真实非车主的用户数据得到。第三方面,本专利技术实施例提供一种设备,包括处理器和存储器;所述存储器包含可由所述处理器执行的指令以使得所述处理器执行第一方面中提供的方法。第四方面,本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序用于实现第一方面中提供的方法。本专利技术实施例提供一种车主身份识别方法及装置,获取未知身份用户的用户数据后,利用预先设立的模型,根据用户数据确定用户是车主的概率值,其中,预先设立的模型通过学习真实车主和真实非车主的用户数据得到。由于确定了用户是车主的概率,可以便于其它业务进一步根据该概率值进行具体的业务判断,并且,通过学习真实车主和真实非车主的用户数据得到模型,可以提高车主身份识别的准确性。附图说明通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:图1为本专利技术实施例提供的车主身份识别方法流程图;图2为本专利技术实施例提供的车主身份识别装置结构示意图;图3为本专利技术实施例提供的车主身份识别设备结构示意图。具体实施方式下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关专利技术,而非对该专利技术的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与专利技术相关的部分。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。请参考图1,本专利技术实施例提供的车主身份识别方法,包括:步骤S101、获取未知身份用户的用户数据;步骤S102、利用预先设立的模型,根据用户数据确定用户是车主的概率值,其中,预先设立的模型通过学习真实车主和真实非车主的用户数据得到。由于步骤S102中确定的是用户是车主的概率,可以便于其它业务进一步根据该概率值进行具体的业务判断,并且,预先设立的模型是通过学习真实车主和真实非车主的用户数据得到的,可以提高车主身份识别的准确性。例如,将真实车主的用户数据作为正样本,用户数据可以从各业务线获取,用户数据的具体内容可以包括:在线加油、违章查询、汽车用品、车险、停车缴费、代驾;将真实非车主的用户数据作为负样本,例如可以根据用户画像标签筛选出真实非车主,例如确定为初中生的用户,即可确定为非车主,将真实非车主的用户数据作为负样本,所选择的用户数据需要和正样本及步骤S101中获取的未知身份用户的用户数据内容一致,例如可以都选择违章查询、车险、停车缴费、路线查询这几种用户数据。使用真实车主和真实非车主的用户数据作为样本来确定模型,可以避免类似高频打车用户对模型识别能力的干扰,因为高频打车用户在用车前也会查看路况、使用导航查询路线,而该用户并非车主,故使用这类用户确定模型,无法保证正负样本的可靠性,将影响模型效果。在本专利技术实施例中,用户数据可以具体包括如下之一或组合:驾驶行为数据;汽车服务数据;出行统计数据。其中,驾驶行为数据可以包括:驾车行为数据、驾车两框检索数据、驾车方案数据等;汽车服务数据可以包括:4S店数据、汽车保养数据、汽车维修数据、收费站数据、加油数据等;出行统计数据可以包括:用户设定时间内的出行总次数、驾驶出行占比、公交出行占比等。这些用户数据可以通过合作的相关网站获得,或者根据实际情况从其它渠道获得。在本专利技术实施例中,需要确定的是用户是车主的概率值,预先设立的模型采用逻辑回归模型较佳,优选的,可以采用如下模型:hθ(x)=g(θTx);其中,hθ(x)为用户是车主的概率值,x为量化后的用户数据,θ为通过学习真实车主和真实非车主的用户数据确定的各项用户数据对应的权重。训练集在汽车保养、汽车装饰、洗车、加油站特征上量化后值分别为:[(5,12,7,9),(4,1,9,20)……],将这些数值作为x值代入hθ(x)=g(θTx)中,由于训练集对应的hθ(x)值已知,所以对其参数(特征的权重)进行学习(梯度下降法),可以得到特征的权重,例如计算出的权重分别为0.43、0.62、3.99、11.73。学习出权重后,即可使用求得的权重代入公式,进而在实际应用中,根据用户的用户数据作为x值得出概率hθ(x)。进一步,还可以在模型的权重确定后,对模型进行评估、进行泛化能力验证,从而进一步保证模型进行车主身份识别的准确性。对于LR(LogisticRegression,逻辑回归模型)分类模型的评估,常用准召、AUC(AreaundertheCurveofROC,ROC曲线下方的面积,ROC,receiveroperatingcharacteristiccurve,接收者操作特征曲线)指标来评估。对其基本指标评估后,通过未参与建模的业务数据进行泛化能力的验证。泛化能力(generalizationability)是指机器学习算法对新鲜样本的适应能力。学习的目的是学到隐含在数据对背后的规律,对具有同一规律的学习集以外的数据,经过训练的网络也能给出合适的输出,该能力称为泛化能力。该指标标示模型应用的真实数据上的效果。所以,本专利技术实施例中的预先设立的模型是通过准召或AUC指标评估后的模型;和/或预先设立的模型是通过泛化能力验证的模型。应当注意,尽管在附图中以特定顺序描述了本专利技术方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。相反,流程图中描绘的步骤可以改变执行顺序。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。本专利技术实施例还相应提供一种车主身份识别装置,如图2所示,该装置包括:数据获取单元201,用于获取未知身份用户的用户数据;身份识别单元202,用于利用预先设立的模型,根据用户数据确定用户是车主的概率值,其中,预先设立的模型通过学习真本文档来自技高网...
一种车主身份识别方法及装置

【技术保护点】
一种车主身份识别方法,所述方法包括:获取未知身份用户的用户数据;利用预先设立的模型,根据所述用户数据确定所述用户是车主的概率值,所述预先设立的模型通过学习真实车主和真实非车主的用户数据得到。

【技术特征摘要】
1.一种车主身份识别方法,所述方法包括:获取未知身份用户的用户数据;利用预先设立的模型,根据所述用户数据确定所述用户是车主的概率值,所述预先设立的模型通过学习真实车主和真实非车主的用户数据得到。2.如权利要求1所述的方法,其特征在于,所述用户数据,具体包括如下之一或组合:驾驶行为数据;汽车服务数据;出行统计数据。3.如权利要求2所述的方法,其特征在于,所述驾驶行为数据,具体包括如下之一或组合:驾车行为数据、驾车两框检索数据、驾车方案数据;所述汽车服务数据具体包括如下之一或组合:4S店数据、汽车保养数据、汽车维修数据、收费站数据、加油数据;所述出行统计数据具体包括如下之一或组合:用户设定时间内的出行总次数、驾驶出行占比、公交出行占比。4.如权利要求1所述的方法,其特征在于,所述预先设立的模型具体为:逻辑回归模型。5.如权利要求4所述的方法,其特征在于,所述预先设立的模型具体为:hθ(x)=g(θTx);其中,hθ(x)为用户是车主的概率值,x为量化后的用户数据,θ为通过学习真实车主和真实非车主的用户数据确定的各项用户数据对应的权重。6.如权利要求1所述的方法,其特征在于,所述预先设立的模型是通过准召或接收者操作特征曲线ROC下方的面积AUC指标评估后的模型;和/或所述预先设立的模型是通过泛化能力验证的模型。7.一种车主身份识别装置,所述装置包括:数据获取单元,用于获取未知身份用户的用户数据;身份识别单元,用于利用预先设立的模型,根据所述用户数据确定...

【专利技术属性】
技术研发人员:闫泳杉
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1