鼎富智能科技有限公司专利技术

鼎富智能科技有限公司共有71项专利

  • 本发明实施例提供了音频检测方法和装置,包括:获取原始音频和哨兵音频的哨兵特征向量;对原始音频进行MFCC特征提取,得到第一原始特征向量;将原始音频进行音频分帧和静音识别,确定候选匹配位置;将候选匹配位置按照滑窗顺序,对第一原始特征向量进...
  • 本申请提供了一种文本生成模型的训练方法、装置,以及文本生成方法,能够提升第一模型生成的文本的准确性。模型包括第一模型,第一模型为第一神经网络经过训练生成,第一神经网络包括第一子神经网络、标签向量生成器、解码器和概率分布预测器,方法包括:...
  • 本申请提供了一种文本生成方法和装置,该方法使用大模型根据输入文本序列,预测相应的输出分词序列在通用的预定义词表的第一概率分布;使用第一神经网络预测相应的输出分词序列在输入文本构成的词表中的第二概率分布;使用检索器从外挂语料库中获取与输入...
  • 本申请提供了一种语音合成方法和系统,方法包括:将输入文本转换成音素序列;使用编码器对所述音素序列进行特征提取,获取编码特征;若输出流式语音,根据所述编码特征确定所述输入文本的每一片段的第一声学特征,使用声码器不断将每一片段的所述第一声学...
  • 本申请提供了一种智能客服系统及其与客户的交互方法,能够实现对所使用的大模型对于目标领域知识的自动学习,提升了系统精准回复客户的能力
  • 本申请提供了一种文本生成方法和装置,能够在不改变大模型的结构以及重新训练大模型的情况下,有效提高大模型的知识扩展能力和新词组产生能力
  • 本申请提供了一种用于语音合成的文本处理方法和系统,能够满足各种业务场景对合成语音的韵律需求,且无需人工对韵律进行大量的人工设计和调试,节省了语音合成方案落地的成本。该方法,应用于用于语音合成的文本处理系统,用于语音合成的文本处理系统包括...
  • 本申请提供了一种网站检索方法和装置,能够提高搜索引擎的检索结果的准确率,以及提高获取目标网站的效率。方法包括:基于初始待搜索文本的词性,确定所述初始待搜索文本中至少一个关键子文本;根据至少一个所述关键子文本中每一所述关键子文本的语义,对...
  • 本申请提供了一种网站数据采集方法和装置,能够实现对具有不同交互方式的不同网站进行数据采集,无需对各个目标网站定制数据采集方案,进而能够节省人力和成本,提升采集网站数据的效率。方法包括:获取目标网站的第一页面的第一源码,以及基于数据采集需...
  • 本发明提供了一种文本抽取方法、装置及服务器,涉及自然语言处理的技术领域,该方法包括:获取待处理文本以提取句子特征向量;将句子特征向量输入至动态预测模型,计算动态预测得分,将动态预测得分大于得分阈值的句子确定为关键句;对关键句进行事件类型...
  • 本申请提供一种事件抽取方法、装置及电子设备,该方法包括:使用神经网络模型获取事件提示向量,事件提示向量包括多组令牌嵌入向量,每组令牌嵌入向量表征一个事件类别;获取待处理文本,并根据事件提示向量对待处理文本进行事件分类,获得事件类别;从待...
  • 本申请实施例提供一种振铃音识别方法及装置,包括从预设平台获取第一时间范围内的每一通未接通话的信道数据;对于每一通未接通话,利用预设模型从信道数据中截取多个语音段;利用预设模型对多个语音段依次进行振铃音识别,以及,在识别出其中一个语音段对...
  • 本申请实施例提供一种振铃音类型识别方法及装置,方法包括获取待识别音频信号;对待识别音频信号进行特征提取,得到多种音频特征;将多种音频特征分别输入至第一分类模型的多个输入分支,得到模型输出结果;第一分类模型是基于带有振铃音标签的音频数据集...
  • 本申请提供一种多事件抽取方法、装置、电子设备及存储介质,用于改善从文本内容中抽取出多个事件的准确率较低的问题。该方法包括:使用神经网络模型获取事件提示向量;获取待处理文本,并根据事件提示向量对待处理文本进行事件分类,获得多个事件类别;从...
  • 本申请提供一种语音合成方法、装置、电子设备及存储介质,其中语音合成方法包括:采用情绪分类模型对情绪样本数据进行处理,获取带有第一情绪标签的情绪特征向量;采用情绪特征向量和带有第二情绪标签的合成模型训练数据,对语音合成模型进行训练;采用训...
  • 本申请实施例提供一种诈骗信息处理方法及装置,涉及数据处理技术领域,该诈骗信息处理方法包括:先获取待处理的诈骗笔录数据;从诈骗笔录数据中抽取案发时间信息;再对诈骗笔录数据进行账户识别处理,得到涉案账户信息;以及对诈骗笔录数据进行联络信息识...
  • 本申请实施例提供一种信息提取的方法、装置及电子设备,该方法包括:获取待提取文件,从待提取文件中提取时间信息,其中,时间信息包括发生时间、准备时间,发现时间和记录时间中的至少一个时间;当时间信息包含发生时间时,将发生时间作为目标时间信息;...
  • 一种地址文本归一化匹配方法及装置,涉及数据处理技术领域和算法匹配领域,包括:获取待入库地址数据,待入库地址数据的模型训练;模型识别待入库地址数据的关键信息;通过关键信息对待入库地址数据进行预处理和数据入库,得到入库数据。在进行地址文本归...
  • 本申请提供一种基于联合训练的文本摘要抽取方法及相应装置,用于改善抽取出的摘要文本的语义正确性不够的问题。该方法包括:获取待处理文本,并对待处理文本进行分句,获得多个待处理语句;使用摘要抽取模型中的向量抽取层对多个待处理语句进行向量化表示...
  • 本申请提供一种多模态数据集的数据增强方法及装置,应用于数据处理技术领域,其中,方法包括:获取多模态数据集中的第一图像文本对;将第一图像文本对中的第一图像转换为对应的第一图像向量;根据第一图像向量生成第二图像向量;将第二图像向量转换为对应...