价格实体识别方法、装置、存储介质及电子设备制造方法及图纸

技术编号：37320393 阅读：7 留言：0更新日期：2023-04-21 23:00

本公开涉及一种价格实体识别方法、装置、存储介质及电子设备，以识别视频中价格实体的价格形态，提高价格识别的准确性。其中，该方法包括：获取待识别的目标视频；基于所述目标视频，确定文本信息；将所述文本信息输入价格识别模型中，确定所述文本信息中价格实体的价格形态，所述价格形态包括用于表征原价的价格形态、用于表征现价的价格形态和可用虚拟资源对应的价格形态中的至少一者；其中，所述价格识别模型用于确定所述文本信息中的所有价格实体，并针对每一价格实体，根据所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的上下文信息确定所述价格实体的价格形态。价格形态。价格形态。

全部详细技术资料下载

【技术实现步骤摘要】
价格实体识别方法、装置、存储介质及电子设备

[0001]本公开涉及文本识别
，具体地，涉及一种价格实体识别方法、装置、存储介质及电子设备。

技术介绍

[0002]视频类应用程序可以向用户展示介绍美食、休闲娱乐等商品或服务的视频，该视频可以包括商品或服务的套餐内容、服务项目、价格描述等基本信息，并且该视频可以通过锚点的形式挂载相应的商品详情信息，这些挂载的商品价格应该和视频介绍的商品价格相同。因此，需要识别视频介绍的商品价格。
[0003]相关技术主要通过序列标注模型识别视频介绍的商品价格。但是，由于商品价格存在原价、现价等多种表达形态，相关技术的此种方式无法准确识别不同表达形态的价格，从而影响实际的业务处理。

技术实现思路

[0004]提供该
技术实现思路
部分以便以简要的形式介绍构思，这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征，也不旨在用于限制所要求的保护的技术方案的范围。
[0005]第一方面，本公开提供一种价格实体识别方法，所述方法包括：
[0006]获取待识别的目标视频；
[0007]基于所述目标视频，确定文本信息；
[0008]将所述文本信息输入价格识别模型中，确定所述文本信息中价格实体的价格形态，所述价格形态包括用于表征原价的价格形态、用于表征现价的价格形态和可用虚拟资源对应的价格形态中的至少一者；
[0009]其中，所述价格识别模型用于确定所述文本信息中的所有价格实体...

【技术保护点】

【技术特征摘要】
1.一种价格实体识别方法，其特征在于，所述方法包括：获取待识别的目标视频；基于所述目标视频，确定文本信息；将所述文本信息输入价格识别模型中，确定所述文本信息中价格实体的价格形态，所述价格形态包括用于表征原价的价格形态、用于表征现价的价格形态和可用虚拟资源对应的价格形态中的至少一者；其中，所述价格识别模型用于确定所述文本信息中的所有价格实体，并针对每一价格实体，根据所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的上下文信息确定所述价格实体的价格形态。2.根据权利要求1所述的方法，其特征在于，所述确定所述文本信息中的所有价格实体，包括：确定所述文本信息中的所有价格实体，并确定每一所述价格实体在所述文本信息中的位置，得到目标文本序列；所述根据所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的上下文信息确定所述价格实体的价格形态，包括：根据所述目标文本序列中每一分词对应的词向量，确定用于表征所述目标文本序列语义的一序列词向量，并针对所述目标文本序列中的每一所述价格实体，确定所述价格实体中各词向量对应的平均向量；根据所述平均向量与所述序列词向量，确定所述价格实体的价格形态。3.根据权利要求2所述的方法，其特征在于，所述价格识别模型包括分类器，所述根据所述平均向量与所述序列词向量，确定所述价格实体的价格形态，包括：将所述平均向量和所述序列词向量进行拼接，得到所述价格实体对应的目标词向量；将所述目标词向量输入所述分类器，得到所述价格实体对应的价格形态和所述价格实体在所述价格形态下的分类概率。4.根据权利要求3所述的方法，其特征在于，所述将所述平均向量和所述序列词向量进行拼接，得到所述价格实体对应的目标词向量，包括：将所述平均向量进行降维处理，得到降维平均向量；将所述序列词向量进行降维处理，得到降维序列词向量；将所述降维平均向量和所述降维序列词向量进行拼接，得到所述价格实体对应的目标词向量。5.根据权利要求1
‑
4任一所述的方法，其特征在于，所述价格识别模型包括第一识别子模型和第二识别子模型，所述第一识别子模型用于确定所述文本信息中的所有价格实体；所述第二识别子模型用于针对所述第一识别子模型确定的每一所述价格实体，根据所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的位置和所述价格实体在所述文本信息中的上下文信息确定所述价格实体的价格形态。6.根据权利要求5所述的方法，其特征在于，所述第一识别子模型和所述第二识别子模型的模型结构相同，或者，所述第一识别子模型和所述第二识别子模型的模型结构不同。7.根据权利要求5所述的方法，其特征在于，所述价格识别模型的训练过程包括：获取标注有价格形态标签和价格实体位置的样本文本信息，其中所述样本文本信息包
括样本视频的标题信息、对所述样本视频进行语音识别得到的文本信息和对所述样本视频的视频帧进行文字识别得到的文本信息；...

【专利技术属性】
技术研发人员：孙健，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人