一种网约车车型自动推荐方法和装置制造方法及图纸

技术编号：34828398 阅读：28 留言：0更新日期：2022-09-08 07:19

本申请实施例提供一种网约车车型自动推荐方法和装置，涉及终端领域，能够为用户提供准确的网约车的车型选择，提高用户体验。其方法为：响应于用户输入起点和终点以及选中打车选项的操作，显示车型选择界面；对车型选择页面进行截图；基于OCR模型、第一深度学习模型和第二深度学习模型对车型选择界面的截图包含的信息进行处理，从而得到车型选择界面中各种车型对应的价格、接驾时间、复选框的中心坐标、复选框是否被用户选中等信息在内的全部打车相关信息；再根据打车相关信息和用户数据生成推荐车型，最后选中推荐车型的复选框。最后选中推荐车型的复选框。最后选中推荐车型的复选框。

全部详细技术资料下载

【技术实现步骤摘要】
一种网约车车型自动推荐方法和装置

[0001]本申请涉及终端领域，尤其涉及一种网约车车型自动推荐方法和装置。

技术介绍

[0002]网约车是移动互联网辅助下的一种非常便利的出行方式。用户可以在电子设备(例如，手机)上安装网约车应用(application，APP)。在网约车APP中，通常存在不同价格、不同车型的网约车。用户可以根据自己的需求手动选择相应的网约车。
[0003]但是，用户在网约车APP中手动选择车型的过程繁琐且耗时，因此如何在终端侧自动为用户提供准确的车型选择成为亟待解决的问题。

技术实现思路

[0004]本申请提供一种网约车车型自动推荐方法和装置，能够为用户提供准确的网约车的车型选择，提高用户体验。
[0005]为达到上述目的，本申请的实施例采用如下技术方案：
[0006]第一方面，提供了一种网约车车型自动推荐方法，包括：响应于用户输入起点和终点以及选中打车选项的操作，显示车型选择界面；对车型选择页面进行截图；基于光学字符识别OCR模型获取截图中的文本及文本坐标；将截图中的所有文本拼接，通过查找函数获取输入文本编码x，同时根据超参数将截图切分成多个子图，对多个子图中的每个子图分别进行编码得到图片编码v；将x和v输入第一深度学习模型中，获取第一深度学习模型输出的语义角色标注结果，语义角色标注结果包括打车起点和终点、车型名称、接驾时间和价格中的至少一项；再将x和v以及语义角色标注结果输入第二深度学习模型中，获取第二深度学习模型输出的复选框信息，复选框信息包括车型名称...

【技术保护点】

【技术特征摘要】
1.一种网约车车型自动推荐方法，其特征在于，包括：响应于用户输入起点和终点以及选中打车选项的操作，显示车型选择界面；对所述车型选择页面进行截图；基于光学字符识别OCR模型获取所述截图中的文本及文本坐标；将所述截图中的所有文本拼接，通过查找函数获取输入文本编码x，同时根据超参数将所述截图切分成多个子图，对所述多个子图中的每个子图分别进行编码得到图片编码v；将所述x和所述v输入第一深度学习模型中，获取所述第一深度学习模型输出的语义角色标注结果，所述语义角色标注结果包括打车起点和终点、车型名称、接驾时间和价格中的至少一项；再将所述x和所述v以及所述语义角色标注结果输入第二深度学习模型中，获取所述第二深度学习模型输出的复选框信息，所述复选框信息包括所述车型名称对应的复选框中心坐标以及所述车型名称对应的复选框是否被选中的信息；根据所述语义角色标注结果、所述复选框信息和用户数据生成推荐车型，其中，所述用户数据包括用户打车的时间、用户输入的起点和终点、用户打车时的天气、用户打车时电子设备的电量、用户的常驻地中的至少一项；根据所述推荐车型的复选框中心坐标选中所述推荐车型。2.根据权利要求1所述的方法，其特征在于，所述第一深度学习模型的计算流程如公式(1)
‑
(4)所示，v＝(v1，v2，
…
，v
m
)，x＝(x1，x2，
…
，x
n
)
ꢀꢀꢀꢀ
(1)(p1，p2，
…
，p
n
)＝FFN(h)
ꢀꢀꢀꢀ
(3)其中，公式(1)表示所述第一深度学习模型的输入编码的文本部分x与图像部分v，文本部分x包括n个文本编码，图像部分v包括m个图像编码；公式(2)表示将输入编码x和v输入到Transformer编码器中得到隐藏状态h；公式(3)表示将隐藏状态h的文本部分输入前馈神经网络FFN得到每个文本字符的标签(p1，p2，
…
，p
n
)；公式(4)表示将p
x
与真实标签y计算交叉熵得到所述第一深度学习模型的损失。3.根据权利要求1所述的方法，其特征在于，所述第二深度学习模型的计算流程如公式(5)
‑
(17)所示，x＝(x1，x2，
…
，x
n
)，v＝(v1，v2，
…
，v
m
)
ꢀꢀꢀꢀꢀ
(5)(5)(5)loss
match
＝CrossEntropy(p
match
，y
match
)
ꢀꢀꢀ
(9)u＝v
⊙
c
vis
ꢀꢀꢀꢀ
(10)(10)
p
cord
＝sig(FFN(g))
ꢀꢀꢀꢀ
(13)loss
cord
＝MSE(p
cord
，y
cord
)
ꢀꢀꢀꢀꢀ
(14)p
select
＝softmax(FFN(g))
ꢀꢀꢀ
(15)loss
select
＝CrossEntropy(p
select
，y
select
)
ꢀꢀꢀꢀ
(16)L＝loss
match
+loss
cord
+loss
select
ꢀꢀꢀꢀ
(17)其中，公式(5)表示所述第二深度学习模型的输入编码的文本部分x与图像部分v，文本部分x包括n个文本编码，图像部分v包括m个图像编码；公式(6)表示将拼接后的输入编码输入到Transformer编码器中，获取模型的隐藏状态编码c，其中，表示向量拼接；公式(7)表示将文本部分编码的所有key实体起始位置字符隐藏状态与Key向量emb(entity)where entity in(key)拼接，将所有Value实体起始位置字符隐藏状态与Value向量emb(entity)where entityin(value)拼接得到entityin(value)拼接得到entityin(value)拼接得到公式(8)表示将和到双仿射前馈神经网络BiaffineFNN网络计算匹配概率p
match
；公式(9)表示基于匹配概率p
match
与真实匹配标签计算匹配损失loss
match
；公式(10)表示将图像隐藏状态c
vis
与输入的图像编码v进行哈达玛积...

【专利技术属性】
技术研发人员：丁勇，
申请(专利权)人：荣耀终端有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人