关键词确定方法及装置制造方法及图纸

技术编号:36895413 阅读:36 留言:0更新日期:2023-03-15 22:27
本申请提供关键词确定方法及装置,其中所述关键词确定方法包括:获取目标对话文本,并提取所述目标对话文本中的至少一个词语和各词语的词特征,其中,所述目标对话文本中包含至少两个对话对象对应的子对话文本;针对任一对话对象,根据各词语的词特征和该对话对象对应的子对话文本,利用预设的重要度预测模型,确定该对话对象的目标重要度;针对任一词语,基于该词语的词特征和各对话对象的目标重要度,利用预设的关键度预测模型,确定该词语的目标关键度;根据各词语的目标关键度,确定所述目标对话文本中的目标关键词。可以根据对话对象的目标重要度更好地抽取关键词,提高关键词的确定效率和准确率。词的确定效率和准确率。词的确定效率和准确率。

【技术实现步骤摘要】
关键词确定方法及装置


[0001]本申请涉及数据处理
,特别涉及一种关键词确定方法。本申请同时涉及一种关键词确定装置、一种计算设备,一种计算机可读存储介质,以及一种芯片。

技术介绍

[0002]人工智能(artificial intelligence;AI)是指已工程化(即设计并制造)的系统感知环境的能力,以及获取、处理、应用和表示知识的能力。自然语言处理、机器人、计算机视觉成为了人工智能最为热门的三个产业方向。人工智能领域关键技术的发展状况,包括机器学习、知识图谱、自然语言处理、计算机视觉、人机交互、生物特征识别、虚拟现实/增强现实等关键技术。随着计算机技术的发展,自然语言处理领域也得到了快速发展,自然语言处理(NLP,Natural Language Processing)是计算机科学领域的一个重要研究方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理的具体表现形式包括机器翻译、文本摘要、文本分类、文本校对、信息抽取、语音合成、语音识别等。自然语言处理面临四大挑战:一是在词法、句法、语义、语用和语音等本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种关键词确定方法,其特征在于,包括:获取目标对话文本,并提取所述目标对话文本中的至少一个词语和各词语的词特征,其中,所述目标对话文本中包含至少两个对话对象对应的子对话文本;针对任一对话对象,根据各词语的词特征和该对话对象对应的子对话文本,利用预设的重要度预测模型,确定该对话对象的目标重要度;针对任一词语,基于该词语的词特征和各对话对象的目标重要度,利用预设的关键度预测模型,确定该词语的目标关键度;根据各词语的目标关键度,确定所述目标对话文本中的目标关键词。2.根据权利要求1所述的方法,其特征在于,所述重要度预测模型包括词语子重要度预测模型和对话对象子重要度预测模型;针对任一对话对象,根据各词语的词特征和该对话对象对应的子对话文本,利用预设的重要度预测模型,确定该对话对象的目标重要度,包括:根据各词语的词特征,利用所述词语子重要度预测模型,确定各词语的初始重要度;针对任一对话对象,根据所述初始重要度和该对话对象对应的子对话文本,利用所述对话对象子重要度预测模型,确定该对话对象的目标重要度。3.根据权利要求2所述的方法,其特征在于,根据所述初始重要度和该对话对象对应的子对话文本,利用所述对话对象子重要度预测模型,确定该对话对象的目标重要度,包括:确定各词语分别在该对话对象对应的子对话文本中的第一词数,并确定该对话对象对应的子对话文本的第一句子数量;根据所述各词语的所述初始重要度、所述第一词数以及所述第一句子数量,利用所述对话对象子重要度预测模型,确定该对话对象的目标重要度。4.根据权利要求2所述的方法,其特征在于,所述词特征包含至少一个子词特征;根据所述各词语的词特征,利用所述词语子重要度预测模型,确定各词语的初始重要度,包括:获取各子词特征的权重;根据第一词语的所述各子词特征以及所述各子词特征的权重,利用所述词语子重要度预测模型,确定所述第一词语的初始重要度,其中,所述第一词语为任一词语。5.根据权利要求1所述的方法,其特征在于,所述关键度预测模型包括对话对象子关键度预测模型和词语子关键度预测模型;基于该词语的词特征和各对话对象的目标重要度,利用预设的关键度预测模型,确定该词语的目标关键度,包括:基于各对话对象的...

【专利技术属性】
技术研发人员:赵硕丰
申请(专利权)人:北京金山数字娱乐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1