System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及人工智能领域,尤其涉及一种电商评论关系抽取方法及装置。
技术介绍
1、商品评论在今天的电商生态系统中扮演着至关重要的角色。随着越来越多的消费者依赖在线购物,他们常常依赖其他购买者的意见和反馈来做出决策。这些评论潜藏着大量有价值的信息,其中包括产品的性能、质量、功能、用户体验等方面的关键信息。这些信息对于消费者的购物体验和决策至关重要,对于企业改进产品和服务同样至关重要。传统的关系抽取方法在处理评论数据时通常表现出一些局限性,基于管道学习方法的方案会产生误差积累与信息利用不充分,进而影响最终抽取效果。基于联合抽取方法的方案存在实体冗余问题,训练效率较为低下。
技术实现思路
1、有鉴于此,本专利技术实施例提供一种电商评论关系抽取方法及装置,能够缓解主客实体对齐效率低的问题。。
2、在第一方面,本专利技术实施例提供一种电商评论关系抽取方法,包括:
3、输入电商评论文本;
4、通过预训练模型对所述电商评论文本进行处理后得到语义特征向量;
5、对所述语义特征向量进行处理,得到全局对应矩阵和序列标记结果;
6、利用所述全局对应矩阵对所述序列标记结果进行修剪,得到所述评论文本的三元组。
7、结合第一方面,在第一方面的第一种实施方式中,所述对所述语义特征向量进行处理,得到全局对应矩阵,包括:
8、对所述语义特征向量进行扩维拼接,获得两两向量对应的全局对应语义矩阵;
9、判断全局对应语义矩阵
10、根据语义特征向量获得全局对应掩码矩阵,与所述全局对应向量矩阵相乘得到全局对应矩阵。
11、结合第一方面,在第一方面的第二种实施方式中,所述对所述语义特征向量进行处理,得到序列标记结果,包括:
12、将所述语义特征向量输入潜在关系判别模型,获得潜在关系序列矩阵;
13、将所述潜在关系序列矩阵映射为关系类别向量;
14、将所述关系类别向量与所述语义特征向量拼接,获得关系语义向量;
15、从所述关系语义向量中预测出文本中每个关系的头尾实体并标记,获得序列标记结果。
16、结合第一方面的第二种实施方式,在第一方面的第三种实施方式中,所述将所述语义特征向量输入潜在关系判别模型,获得潜在关系序列矩阵,包括:
17、将所述语义特征向量输入潜在关系判别模型,获得潜在关系概率矩阵,当关系对应的概率大于或等于预设概率值时,判定存在所述关系,否则判定不存在,判定结果输出为潜在关系序列矩阵。
18、结合第一方面的第二种实施方式,在第一方面的第四种实施方式中,还包括:
19、将所述语义特征向量输入潜在关系判别模型前,对所述语义特征向量进行平均池化操作;
20、将所述关系类别向量与所述语义特征向量拼接前,对所述语义特征向量进行平均池化操作。
21、结合第一方面,在第一方面的第五种实施方式中,利用所述全局对应矩阵对所述序列标记结果进行修剪,得到所述评论文本的三元组,包括:
22、当全局对应矩阵中的实体与序列标记结果中的实体相似率大于或等于预设概率时,确定所述序列标记结果中的实体为所述电商评论文本的实体;
23、当全局对应矩阵中的实体与序列标记结果中的实体相似率小于预设概率时,排除所述序列标记结果中的实体为所述电商评论文本的实体。
24、在第二方面,本专利技术实施例提供一种电商评论关系抽取装置,包括:
25、输入模块,用于输入电商评论文本;
26、预训练模块,用于通过预训练模型对所述电商评论文本进行处理后得到语义特征向量;
27、第一数据处理模块,用于对所述语义特征向量进行处理,得到全局对应矩阵和序列标记结果;
28、第二数据处理模块,用于利用所述全局对应矩阵对所述序列标记结果进行修剪,得到所述评论文本的三元组。
29、结合第二方面,在第二方面的第一种实施方式中,所述第一数据处理模块,包括:
30、对所述语义特征向量进行扩维拼接,获得两两向量对应的全局对应语义矩阵;
31、判断全局对应语义矩阵中两两对应向量间存在关系的概率,获得全局对应向量矩阵;
32、根据语义特征向量获得全局对应掩码矩阵,与所述全局对应向量矩阵相乘得到全局对应矩阵。
33、结合第二方面,在第二方面的第二种实施方式中,所述第一数据处理模块,包括:
34、关系判别单元,用于将所述语义特征向量输入潜在关系判别模型,获得潜在关系序列矩阵;
35、映射单元,用于将所述潜在关系序列矩阵映射为关系类别向量;
36、拼接单元,用于将所述关系类别向量与所述语义特征向量拼接,获得关系语义向量;
37、实体标记单元,用于从所述关系语义向量中预测出文本中每个关系的头尾实体并标记,获得序列标记结果。
38、结合第二方面的第二种实施方式,在第二方面的第三种实施方式中,所述关系判别单元,包括:
39、将所述语义特征向量输入潜在关系判别模型,获得潜在关系概率矩阵,当关系对应的概率大于或等于预设概率值时,判定存在所述关系,否则判定不存在,判定结果输出为潜在关系序列矩阵。
40、结合第二方面的第二种实施方式,在第二方面的第四种实施方式中,还包括:
41、将所述语义特征向量输入潜在关系判别模型前,对所述语义特征向量进行平均池化操作;
42、将所述关系类别向量与所述语义特征向量拼接前,对所述语义特征向量进行平均池化操作。
43、结合第二方面,在第二方面的第五种实施方式中,所述第二数据处理模块,包括:
44、实体判别单元,用于当全局对应矩阵中的实体与序列标记结果中的实体相似率大于或等于预设概率时,确定所述序列标记结果中的实体为所述电商评论文本的实体;
45、当全局对应矩阵中的实体与序列标记结果中的实体相似率小于预设概率时,排除所述序列标记结果中的实体为所述电商评论文本的实体。
46、在第三方面,本专利技术实施例提供一种电子设备,所述电子设备包括:壳体、处理器、存储器、电路板和电源电路,其中,电路板安置在壳体围成的空间内部,处理器和存储器设置在电路板上;电源电路,用于为上述电子设备的各个电路或器件供电;存储器用于存储可执行程序代码;处理器通过读取存储器中存储的可执行程序代码来运行与可执行程序代码对应的程序,用于执行前述方法中任一实施例提供的电商评论关系抽取方法。
47、本专利技术的实施例提供的电商评论关系抽取方法及装置,输入电商评论文本;通过预训练模型对所述电商评论文本进行处理后得到语义特征向量;对所述语义特征向量进行处理,得到全局对应矩阵和序列标记结果;利用所述全局对应矩阵对所述序列标记结果进行修剪,得到所述评论文本的三元组。这样,通过全局对应矩阵对序本文档来自技高网...
【技术保护点】
1.一种电商评论关系抽取方法,其特征在于,包括:
2.根据权利要求1所述的电商评论关系抽取方法,其特征在于,所述对所述语义特征向量进行处理,得到全局对应矩阵,包括:
3.根据权利要求1所述的电商评论关系抽取方法,其特征在于,所述对所述语义特征向量进行处理,得到序列标记结果,包括:
4.根据权利要求3所述的电商评论关系抽取方法,其特征在于,所述将所述语义特征向量输入潜在关系判别模型,获得潜在关系序列矩阵,包括:
5.根据权利要求3所述的电商评论关系抽取方法,其特征在于,还包括:
6.根据权利要求1所述的电商评论关系抽取方法,其特征在于,利用所述全局对应矩阵对所述序列标记结果进行修剪,得到所述评论文本的三元组,包括:
7.一种电商评论关系抽取装置,其特征在于,包括:
8.根据权利要求7所述的电商评论关系抽取装置,其特征在于,所述第一数据处理模块,包括:
9.根据权利要求7所述的电商评论关系抽取装置,其特征在于,所述第一数据处理模块,包括:
10.根据权利要求9所述的电商评论关系
...【技术特征摘要】
1.一种电商评论关系抽取方法,其特征在于,包括:
2.根据权利要求1所述的电商评论关系抽取方法,其特征在于,所述对所述语义特征向量进行处理,得到全局对应矩阵,包括:
3.根据权利要求1所述的电商评论关系抽取方法,其特征在于,所述对所述语义特征向量进行处理,得到序列标记结果,包括:
4.根据权利要求3所述的电商评论关系抽取方法,其特征在于,所述将所述语义特征向量输入潜在关系判别模型,获得潜在关系序列矩阵,包括:
5.根据权利要求3所述的电商评论关系抽取方法,其特征在于,...
【专利技术属性】
技术研发人员:王佳冀,贾朝晖,毕迎迎,
申请(专利权)人:鼎道智联北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。