一种网约车车型自动推荐方法和装置制造方法及图纸

技术编号:34828398 阅读:28 留言:0更新日期:2022-09-08 07:19
本申请实施例提供一种网约车车型自动推荐方法和装置,涉及终端领域,能够为用户提供准确的网约车的车型选择,提高用户体验。其方法为:响应于用户输入起点和终点以及选中打车选项的操作,显示车型选择界面;对车型选择页面进行截图;基于OCR模型、第一深度学习模型和第二深度学习模型对车型选择界面的截图包含的信息进行处理,从而得到车型选择界面中各种车型对应的价格、接驾时间、复选框的中心坐标、复选框是否被用户选中等信息在内的全部打车相关信息;再根据打车相关信息和用户数据生成推荐车型,最后选中推荐车型的复选框。最后选中推荐车型的复选框。最后选中推荐车型的复选框。

【技术实现步骤摘要】
一种网约车车型自动推荐方法和装置


[0001]本申请涉及终端领域,尤其涉及一种网约车车型自动推荐方法和装置。

技术介绍

[0002]网约车是移动互联网辅助下的一种非常便利的出行方式。用户可以在电子设备(例如,手机)上安装网约车应用(application,APP)。在网约车APP中,通常存在不同价格、不同车型的网约车。用户可以根据自己的需求手动选择相应的网约车。
[0003]但是,用户在网约车APP中手动选择车型的过程繁琐且耗时,因此如何在终端侧自动为用户提供准确的车型选择成为亟待解决的问题。

技术实现思路

[0004]本申请提供一种网约车车型自动推荐方法和装置,能够为用户提供准确的网约车的车型选择,提高用户体验。
[0005]为达到上述目的,本申请的实施例采用如下技术方案:
[0006]第一方面,提供了一种网约车车型自动推荐方法,包括:响应于用户输入起点和终点以及选中打车选项的操作,显示车型选择界面;对车型选择页面进行截图;基于光学字符识别OCR模型获取截图中的文本及文本坐标;将截图中的所有文本拼接,通过查找函数获取输入文本编码x,同时根据超参数将截图切分成多个子图,对多个子图中的每个子图分别进行编码得到图片编码v;将x和v输入第一深度学习模型中,获取第一深度学习模型输出的语义角色标注结果,语义角色标注结果包括打车起点和终点、车型名称、接驾时间和价格中的至少一项;再将x和v以及语义角色标注结果输入第二深度学习模型中,获取第二深度学习模型输出的复选框信息,复选框信息包括车型名称对应的复选框中心坐标以及车型名称对应的复选框是否被选中的信息;根据语义角色标注结果、复选框信息和用户数据生成推荐车型,其中,用户数据包括用户打车的时间、用户输入的起点和终点、用户打车时的天气、用户打车时电子设备的电量、用户的常驻地中的至少一项;根据推荐车型的复选框中心坐标选中推荐车型。
[0007]基于本申请实施例提供的方法,检测到用户(乘客)打开网约车页面后,响应于用户输入起点和终点以及选中打车选项的操作,可以显示车型选择界面。进一步的,可以通过多个深度学习模型(例如,OCR模型、第一深度学习模型和第二深度学习模型)对车型选择界面的截图包含的信息进行处理,从而得到车型选择界面中各种车型对应的价格、接驾时间、复选框的中心坐标、复选框是否被用户选中等信息在内的全部打车相关信息。再根据打车相关信息和用户打车的时间、地点(起点和/或终点)、天气、电子设备的电量、用户的常驻地等特征可以自动完成车型选择的操作,能够实现在电子设备端全自动完成用户打车功能,免去用户的思考与点选操作,简化用户操作流程。
[0008]在一种可能的设计中,第一深度学习模型的计算流程如公式(1)

(4)所示,
[0009]v=(v1,v2,

,v
m
),x=(x1,x2,

,x
n
)
ꢀꢀꢀꢀ
(1)
[0010][0011](p1,p2,

,p
n
)=FFN(h)
ꢀꢀꢀꢀ
(3)
[0012][0013]其中,公式(1)表示第一深度学习模型的输入编码的文本部分x与图像部分v,文本部分x包括n个文本编码,图像部分v包括m个图像编码;公式(2)表示将输入编码x和v输入到Transformer编码器中得到隐藏状态h;公式(3)表示将隐藏状态h的文本部分输入前馈神经网络FFN得到每个文本字符的标签(p1,p2,

,p
n
);公式(4)表示将p
x
与真实标签y计算交叉熵得到第一深度学习模型的损失。
[0014]在一种可能的设计中,第二深度学习模型的计算流程如公式(5)

(17)所示,
[0015]x=(x1,x2,

,x
n
),v=(v1,v2,

,v
m
)
ꢀꢀꢀꢀꢀ
(5)
[0016][0017][0018][0019]loss
match
=CrossEntropy(p
match
,y
match
)(9)
[0020]u=v

c
vis
ꢀꢀꢀꢀ
(10)
[0021][0022][0023]p
cord
=sig(FFN(g))
ꢀꢀꢀꢀ
(13)
[0024]loss
cord
=MSE(p
cord
,y
cord
)
ꢀꢀꢀꢀꢀ
(14)
[0025]p
select
=softmax(FFN(g))
ꢀꢀꢀꢀꢀꢀ
(15)
[0026]loss
select
=CrossEntropy(p
select
,y
select
)
ꢀꢀꢀꢀ
(16)
[0027]L=loss
match
+loss
cord
+loss
select
ꢀꢀꢀꢀꢀ
(17)
[0028]其中,公式(5)表示第二深度学习模型的输入编码的文本部分x与图像部分v,文本部分x包括n个文本编码,图像部分v包括m个图像编码;公式(6)表示将拼接后的输入编码输入到Transformer编码器中,获取模型的隐藏状态编码c,其中,表示向量拼接;公式(7)表示将文本部分编码的所有key实体起始位置字符隐藏状态与Key向量emb(entity)where entity in(key)拼接,将所有Value实体起始位置字符隐藏状态与Value向量emb(entity)where entity in(value)拼接得到in(value)拼接得到公式(8)表示将和到双仿射前馈神经网络BiaffineFNN网络计算匹配概率p
match
;公式(9)表示基于匹配概率p
match
与真实匹配标签计算匹配损失loss
match
;公式(10)表示将图像隐藏状态c
vis
与输入的图像编码v进行哈达玛积运算,作为残差连接,得到融合残差连接的图像上下文表示u;公式(11)表示将图像上下文表示u的转置矩阵与KV实体向量拼接并进行线性变换(乘W表示线性变换)后的矩阵进行乘法运算,得到矩阵相乘结果后对结果进行softmax运算得到最终的注意力值a;公式(12)表示基于注意力值a计算图像的最终编码表示g;公式(13)与公式(15)表示基于图像编码表示g接入坐标回归
任务层与选择预测任务层;如公式(14)与公式(16)表示分别使用均方误差和交叉熵的方式计算最损失loss<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种网约车车型自动推荐方法,其特征在于,包括:响应于用户输入起点和终点以及选中打车选项的操作,显示车型选择界面;对所述车型选择页面进行截图;基于光学字符识别OCR模型获取所述截图中的文本及文本坐标;将所述截图中的所有文本拼接,通过查找函数获取输入文本编码x,同时根据超参数将所述截图切分成多个子图,对所述多个子图中的每个子图分别进行编码得到图片编码v;将所述x和所述v输入第一深度学习模型中,获取所述第一深度学习模型输出的语义角色标注结果,所述语义角色标注结果包括打车起点和终点、车型名称、接驾时间和价格中的至少一项;再将所述x和所述v以及所述语义角色标注结果输入第二深度学习模型中,获取所述第二深度学习模型输出的复选框信息,所述复选框信息包括所述车型名称对应的复选框中心坐标以及所述车型名称对应的复选框是否被选中的信息;根据所述语义角色标注结果、所述复选框信息和用户数据生成推荐车型,其中,所述用户数据包括用户打车的时间、用户输入的起点和终点、用户打车时的天气、用户打车时电子设备的电量、用户的常驻地中的至少一项;根据所述推荐车型的复选框中心坐标选中所述推荐车型。2.根据权利要求1所述的方法,其特征在于,所述第一深度学习模型的计算流程如公式(1)

(4)所示,v=(v1,v2,

,v
m
),x=(x1,x2,

,x
n
)
ꢀꢀꢀꢀ
(1)(p1,p2,

,p
n
)=FFN(h)
ꢀꢀꢀꢀ
(3)其中,公式(1)表示所述第一深度学习模型的输入编码的文本部分x与图像部分v,文本部分x包括n个文本编码,图像部分v包括m个图像编码;公式(2)表示将输入编码x和v输入到Transformer编码器中得到隐藏状态h;公式(3)表示将隐藏状态h的文本部分输入前馈神经网络FFN得到每个文本字符的标签(p1,p2,

,p
n
);公式(4)表示将p
x
与真实标签y计算交叉熵得到所述第一深度学习模型的损失。3.根据权利要求1所述的方法,其特征在于,所述第二深度学习模型的计算流程如公式(5)

(17)所示,x=(x1,x2,

,x
n
),v=(v1,v2,

,v
m
)
ꢀꢀꢀꢀꢀ
(5)(5)(5)loss
match
=CrossEntropy(p
match
,y
match
)
ꢀꢀꢀ
(9)u=v

c
vis
ꢀꢀꢀꢀ
(10)(10)
p
cord
=sig(FFN(g))
ꢀꢀꢀꢀ
(13)loss
cord
=MSE(p
cord
,y
cord
)
ꢀꢀꢀꢀꢀ
(14)p
select
=softmax(FFN(g))
ꢀꢀꢀ
(15)loss
select
=CrossEntropy(p
select
,y
select
)
ꢀꢀꢀꢀ
(16)L=loss
match
+loss
cord
+loss
select
ꢀꢀꢀꢀ
(17)其中,公式(5)表示所述第二深度学习模型的输入编码的文本部分x与图像部分v,文本部分x包括n个文本编码,图像部分v包括m个图像编码;公式(6)表示将拼接后的输入编码输入到Transformer编码器中,获取模型的隐藏状态编码c,其中,表示向量拼接;公式(7)表示将文本部分编码的所有key实体起始位置字符隐藏状态与Key向量emb(entity)where entity in(key)拼接,将所有Value实体起始位置字符隐藏状态与Value向量emb(entity)where entityin(value)拼接得到entityin(value)拼接得到entityin(value)拼接得到公式(8)表示将和到双仿射前馈神经网络BiaffineFNN网络计算匹配概率p
match
;公式(9)表示基于匹配概率p
match
与真实匹配标签计算匹配损失loss
match
;公式(10)表示将图像隐藏状态c
vis
与输入的图像编码v进行哈达玛积...

【专利技术属性】
技术研发人员:丁勇
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1