深圳市北科瑞讯信息技术有限公司专利技术

深圳市北科瑞讯信息技术有限公司共有10项专利

  • 本申请涉及一种语音识别文本纠错方法、装置、电子设备及存储介质,所述方法,通过获取输入音频对应的文本信息,依据文本信息进行编码转换,得到编码整型符号信息,依据编码整型符号信息进行特征提取处理,得到语义特征信息和词性特征信息,并对语义特征信...
  • 本申请提供了一种语音数据转换方法、装置、电子设备及可读存储介质,属于智能机器人技术领域。本申请通过,获取待转换为语音数据的目标文本数据,并基于预设字典确定所述目标文本数据中是否存在生僻字;在确定所述目标文本数据中存在所述生僻字的情况下,...
  • 本发明公开了一种语音增强方法及装置、存储介质、电子设备,其中,该方法包括:获取原始语音,其中,所述原始语音包括有用音频信号;采用自动编码器对所述原始语音进行相位编码,得到增强语音;采用条件生成对抗网络对所述增强语音进行分类判别,输出所述...
  • 本申请涉及一种基于关键词识别的数据扩充方法,包括:获取训练文本,对训练文本进行分词处理,并识别文本分词中的关键词;对关键词进行掩码,并将掩码后的训练文本进行文本补全,得到第一扩充文本;从预设词库内筛选出关键词的相似词,利用相似词对训练文...
  • 本申请涉及一种文本摘要与关键词抽取方法,包括:获取包括若干文本分句的训练文本数据;将多个文本分句转换为句向量,并标记多个句向量的关键词标签及摘要句标签;对标记后的多个句向量进行上下文信息嵌入,得到标准向量集;利用标准向量集对预构建的摘要...
  • 本发明提供了一种新闻素材的采集方法及装置、存储介质、电子装置,其中,该方法包括:采用限制来源的方式从指定数据源采集目标主题的第一新闻源数据;提取所述第一新闻源数据中的第一关键词集合,并基于所述第一关键词集合采用非限制来源的方式从搜索引擎...
  • 本发明提供了一种混合语音的识别方法及装置、存储介质、电子装置,其中,该方法包括:获取待音素识别的混合语音,其中,所述混合语音包括中文单词和英文单词;从所述混合语音中提取英文非缩写单词;采用第一预设字素序列到音素序列G2P模型识别所述英文...
  • 本发明提供了一种新闻稿件的生成方法及装置、存储介质、电子装置,其中,该方法包括:获取新闻源数据中的关键词,以及抽取所述新闻源数据中的实体信息;从所述实体信息中提取与所述关键词匹配的实体特征信息;提取所述新闻源数据的文本特征信息,并根据所...
  • 话题溯源方法和系统
    话题溯源方法包括:输入新闻,抽取其中的时间戳、专有名词和关键词;发现重复新闻,以时间戳最早的一篇新闻代表重复新闻;设置当前话题层次为根层次,创建根类簇,以时间戳最早的新闻为话题根节点;S1:构建当前类簇词汇表表示类簇中所有新闻,词汇表不...
  • 一种商业社会网络构建方法和系统,该方法包括识别输入的财经新闻中的商业实体;识别句子中商业实体间的商业关系;根据识别的商业实体以及商业实体间的商业关系构建商业社会网络。本发明从大规模财经新闻中自动获取被提及的商业实体以及各商业实体间的商业...
1