价格实体识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号:37320393 阅读:7 留言:0更新日期:2023-04-21 23:00
本公开涉及一种价格实体识别方法、装置、存储介质及电子设备,以识别视频中价格实体的价格形态,提高价格识别的准确性。其中,该方法包括:获取待识别的目标视频;基于所述目标视频,确定文本信息;将所述文本信息输入价格识别模型中,确定所述文本信息中价格实体的价格形态,所述价格形态包括用于表征原价的价格形态、用于表征现价的价格形态和可用虚拟资源对应的价格形态中的至少一者;其中,所述价格识别模型用于确定所述文本信息中的所有价格实体,并针对每一价格实体,根据所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的上下文信息确定所述价格实体的价格形态。价格形态。价格形态。

【技术实现步骤摘要】
价格实体识别方法、装置、存储介质及电子设备


[0001]本公开涉及文本识别
,具体地,涉及一种价格实体识别方法、装置、存储介质及电子设备。

技术介绍

[0002]视频类应用程序可以向用户展示介绍美食、休闲娱乐等商品或服务的视频,该视频可以包括商品或服务的套餐内容、服务项目、价格描述等基本信息,并且该视频可以通过锚点的形式挂载相应的商品详情信息,这些挂载的商品价格应该和视频介绍的商品价格相同。因此,需要识别视频介绍的商品价格。
[0003]相关技术主要通过序列标注模型识别视频介绍的商品价格。但是,由于商品价格存在原价、现价等多种表达形态,相关技术的此种方式无法准确识别不同表达形态的价格,从而影响实际的业务处理。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面,本公开提供一种价格实体识别方法,所述方法包括:
[0006]获取待识别的目标视频;
[0007]基于所述目标视频,确定文本信息;
[0008]将所述文本信息输入价格识别模型中,确定所述文本信息中价格实体的价格形态,所述价格形态包括用于表征原价的价格形态、用于表征现价的价格形态和可用虚拟资源对应的价格形态中的至少一者;
[0009]其中,所述价格识别模型用于确定所述文本信息中的所有价格实体,并针对每一价格实体,根据所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的上下文信息确定所述价格实体的价格形态。
[0010]第二方面,本公开提供一种价格实体识别装置,所述装置包括:
[0011]获取模块,用于获取待识别的目标视频;
[0012]确定模块,用于基于所述目标视频,确定文本信息;
[0013]识别模块,用于将所述文本信息输入价格识别模型中,确定所述文本信息中价格实体的价格形态,所述价格形态包括用于表征原价的价格形态、用于表征现价的价格形态和可用虚拟资源对应的价格形态中的至少一者;
[0014]其中,所述价格识别模型用于确定所述文本信息中的所有价格实体,并针对每一价格实体,根据所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的上下文信息确定所述价格实体的价格形态。
[0015]第三方面,本公开提供一种非临时性计算机可读介质,其上存储有计算机程序,该
程序被处理装置执行时实现第一方面中所述方法的步骤。
[0016]第四方面,本公开提供一种电子设备,包括:
[0017]存储装置,其上存储有计算机程序;
[0018]处理装置,用于执行所述存储装置中的所述计算机程序,以实现第一方面中所述方法的步骤。
[0019]通过上述技术方案,可以将基于目标视频确定的文本信息输入价格识别模型,得到该文本信息中的价格实体的价格形态,提供了一种新的价格识别方式。并且,价格形态根据价格实体在文本信息中的位置和价格实体在文本信息中的上下文信息确定,可以减少由于文本识别错误导致的价格识别错误的情况以及文本信息中其他数量词对价格识别的干扰,从而提高价格识别的准确性。
[0020]本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
附图说明
[0021]结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。在附图中:
[0022]图1是根据本公开一示例性实施例示出的一种价格实体识别方法的流程图;
[0023]图2是根据本公开一示例性实施例示出的一种价格实体识别方法中价格识别模型的示意图;
[0024]图3是根据本公开一示例性实施例示出的一种价格实体识别方法中第一识别子模型的示意图;
[0025]图4是根据本公开一示例性实施例示出的一种价格实体识别方法中第二识别子模型的处理过程示意图;
[0026]图5是根据本公开另一示例性实施例示出的一种价格实体识别方法中第二识别子模型的处理过程示意图;
[0027]图6是根据本公开一示例性实施例示出的一种价格实体识别装置的框图;
[0028]图7是根据本公开一示例性实施例示出的一种电子设备的框图。
具体实施方式
[0029]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0030]应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
[0031]本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定
义将在下文描述中给出。
[0032]需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。另外需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
[0033]本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
[0034]可以理解的是,在使用本公开各实施例公开的技术方案之前,均应当依据相关法律法规通过恰当的方式对本公开所涉及个人信息的类型、使用范围、使用场景等告知用户并获得用户的授权。
[0035]例如,在响应于接收到用户的主动请求时,向用户发送提示信息,以明确地提示用户,其请求执行的操作将需要获取和使用到用户的个人信息。从而,使得用户可以根据提示信息来自主地选择是否向执行本公开技术方案的操作的电子设备、应用程序、服务器或存储介质等软件或硬件提供个人信息。
[0036]作为一种可选的但非限定性的实现方式,响应于接收到用户的主动请求,向用户发送提示信息的方式例如可以是弹窗的方式,弹窗中可以以文字的方式呈现提示信息。此外,弹窗中还可以承载供用户选择“同意”或者“不同意”向电子设备提供个人信息的选择控件。
[0037]可以理解的是,上述通知和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种价格实体识别方法,其特征在于,所述方法包括:获取待识别的目标视频;基于所述目标视频,确定文本信息;将所述文本信息输入价格识别模型中,确定所述文本信息中价格实体的价格形态,所述价格形态包括用于表征原价的价格形态、用于表征现价的价格形态和可用虚拟资源对应的价格形态中的至少一者;其中,所述价格识别模型用于确定所述文本信息中的所有价格实体,并针对每一价格实体,根据所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的上下文信息确定所述价格实体的价格形态。2.根据权利要求1所述的方法,其特征在于,所述确定所述文本信息中的所有价格实体,包括:确定所述文本信息中的所有价格实体,并确定每一所述价格实体在所述文本信息中的位置,得到目标文本序列;所述根据所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的上下文信息确定所述价格实体的价格形态,包括:根据所述目标文本序列中每一分词对应的词向量,确定用于表征所述目标文本序列语义的一序列词向量,并针对所述目标文本序列中的每一所述价格实体,确定所述价格实体中各词向量对应的平均向量;根据所述平均向量与所述序列词向量,确定所述价格实体的价格形态。3.根据权利要求2所述的方法,其特征在于,所述价格识别模型包括分类器,所述根据所述平均向量与所述序列词向量,确定所述价格实体的价格形态,包括:将所述平均向量和所述序列词向量进行拼接,得到所述价格实体对应的目标词向量;将所述目标词向量输入所述分类器,得到所述价格实体对应的价格形态和所述价格实体在所述价格形态下的分类概率。4.根据权利要求3所述的方法,其特征在于,所述将所述平均向量和所述序列词向量进行拼接,得到所述价格实体对应的目标词向量,包括:将所述平均向量进行降维处理,得到降维平均向量;将所述序列词向量进行降维处理,得到降维序列词向量;将所述降维平均向量和所述降维序列词向量进行拼接,得到所述价格实体对应的目标词向量。5.根据权利要求1

4任一所述的方法,其特征在于,所述价格识别模型包括第一识别子模型和第二识别子模型,所述第一识别子模型用于确定所述文本信息中的所有价格实体;所述第二识别子模型用于针对所述第一识别子模型确定的每一所述价格实体,根据所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的上下文信息确定所述价格实体的价格形态。6.根据权利要求5所述的方法,其特征在于,所述第一识别子模型和所述第二识别子模型的模型结构相同,或者,所述第一识别子模型和所述第二识别子模型的模型结构不同。7.根据权利要求5所述的方法,其特征在于,所述价格识别模型的训练过程包括:获取标注有价格形态标签和价格实体位置的样本文本信息,其中所述样本文本信息包
括样本视频的标题信息、对所述样本视频进行语音识别得到的文本信息和对所述样本视频的视频帧进行文字识别得到的文本信息;...

【专利技术属性】
技术研发人员:孙健
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1