当前位置: 首页 > 专利查询>中国电子科技集团有限公司电子科学研究院专利>正文

一种面向博弈的命名实体识别方法及装置制造方法及图纸

技术编号：39309538 阅读：8 留言：0更新日期：2023-11-12 15:56

本申请公开了一种面向博弈的命名实体识别方法及装置，包括预先采用如下步骤训练网络模型：获取标注语料，并通过预训练的BERT语言模型获得相应的词向量；基于获得的词向量提取上下文特征；将提取的上下文特征输入到多头注意力机制模块，以为提取的上下文特征设置注意力权重；利用CRF模块对多头注意力机制模块的输出进行解码，以获得预测标注序列；对所述预测标注序列中的各个实体进行提取分类；对待识别语料，将所述待识别语料输入训练好的网络模型，以通过所述网络模型，以完成命名实体识别。本申请的方法能够提高信息处理和分析的效率和准确性，对于情报领域的信息处理和决策具有重要意义。重要意义。重要意义。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向博弈的命名实体识别方法及装置

[0001]本申请涉及人工智能
，尤其涉及一种面向博弈的命名实体识别方法及装置。

技术介绍

[0002]科技情报是指通过收集、分析和利用科技信息来支持决策的过程。随着科技的不断发展和应用，科技情报的重要性也越来越突出，在解决经济、社会和国际问题中发挥着关键作用。在当今世界，科技情报已经成为国家和企业竞争的重要手段。随着科技的发展，科技情报的形式也在不断变化。首先，人工智能技术的应用已经成为科技情报的重要领域。人工智能技术可以通过机器学习等技术对大量数据进行分析，从而发现隐藏在数据中的规律和趋势。这些规律和趋势可以为企业和国家制定决策提供重要参考。其次，大数据、云计算等新技术也为科技情报带来了新的可能性。大数据技术可以对大量数据进行分析，从而发现隐藏在数据中的规律和趋势。云计算技术则可以提供高效的数据存储和处理能力，从而支持科技情报的实时分析和决策。在AI和大数据时代，科技情报工作未来面临需求、模式、方式和视角的变化，做好开源科技情报工作具有战略必要性。
[0003]命名标识是指为实体命名并进行标识的过程，命名标识已经成为信息管理和交流的重要手段。随着信息技术的发展，命名标识的形式也在不断变化。首先，区块链技术已经成为命名标识的重要领域。区块链技术可以通过去中心化的方式对数据进行存储和管理，从而保证数据的安全性和可信度。在命名标识方面，区块链技术可以为实体提供唯一的标识，并保证标识的不可篡改性。其次，人工智能技术的应用也为命名标识带来了新的可能性。例如利用知识图谱进行...

【技术保护点】

【技术特征摘要】
1.一种面向博弈的命名实体识别方法，其特征在于，包括预先采用如下步骤训练网络模型：获取标注语料，并通过预训练的BERT语言模型获得相应的词向量；基于获得的词向量提取上下文特征；将提取的上下文特征输入到多头注意力机制模块，以为提取的上下文特征设置注意力权重；利用CRF模块对多头注意力机制模块的输出进行解码，以获得预测标注序列；对所述预测标注序列中的各个实体进行提取分类；对待识别语料，将所述待识别语料输入训练好的网络模型，以通过所述网络模型，以完成命名实体识别。2.如权利要求1所述的面向博弈的命名实体识别方法，其特征在于，通过预训练的BERT语言模型获得相应的词向量包括：预先采用自注意力机制对所述BERT语言模型进行训练，其中所述自注意力机制满足：其中，d
k
表示输入向量维度，Q、K、V代表输入字向量矩阵；所述自注意力机制采用多头注意力机制模式，满足：MultiHead(Q,K,V)＝Concat(head1,head1,
…
,head
n
)W在所述多头注意力机制模式中加入有跳跃网络层和归一化层。3.如权利要求2所述的面向博弈的命名实体识别方法，其特征在于，基于获得的词向量提取上下文特征是通过BiLSTM模块完成的，其中所述BiLSTM模块配置有BiLSTM网络，所述BiLSTM网络包括前向LSTM和后向LSTM，用以分别计算前向特征信息和后向特征信息以结合前向特征信息和后向特征信息获得最终的隐藏状态H。4.如权利要求3所述的面向博弈的命名实体识别方法，其特征在于，将提取的上下文特征输入到多头注意力机制模块，以为提取的上下文特征设置注意力权重包括：将关键向量K、值向量V和查询向量Q分别进行线性映射：K＝K*W
jK

【专利技术属性】
技术研发人员：董琦，徐慧慧，王常衡，尚晓舟，杨焱煜，贾袁骏，
申请(专利权)人：中国电子科技集团有限公司电子科学研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人