科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本发明提供一种人群聚集检测方法、装置、电子设备和存储介质,其中方法包括:对待检测的人群图像进行目标检测,得到所述人群图像中行人的图像位置;基于所述行人的图像位置,确定行人之间的图像距离;将所述行人的图像位置转换到深度坐标系下,得到行人之...
  • 本申请公开了一种语音笔录筛选方法、装置、存储介质及设备,该方法包括:首先获取待筛选的目标语音识别文本及其所归属的目标用户的个人信息,然后,提取目标语音识别文本的文本特征,并确定目标用户的个人风格特征,接着,将目标语音识别文本的文本特征和...
  • 本发明提供一种目的地预判方法、装置、电子设备和存储介质,其中方法包括:获取待预判车辆的行车信息;基于所述行车信息预估所述待预判车辆的行车意图,并基于所述行车信息和所述行车意图进行轨迹预估,得到所述待预判车辆的预估目的地。本发明提供的方法...
  • 本申请公开了一种信息交互方法、装置、设备及存储介质,本申请预先利用跨语种、跨场景的多模态训练数据及场景知识图谱库,通过无监督的方式训练得到回复生成模型,进而在获取到当前交互场景下的多模态数据之后,可以参考场景知识图谱库,利用回复生成模型...
  • 本申请公开了一种插帧生成模型构建方法、视频插帧方法,先利用第一样本图像集、该第一样本图像集对应的实际插帧图像、第二样本图像集、该第二样本图像集对应的实际插帧图像、第三样本图像集和该第三样本图像集对应的实际插帧图像,构建插帧生成模型;再利...
  • 本申请公开了一种总结模型的训练方法和工单生成方法及相关设备、装置,其中,总结模型的训练方法包括:获取样本文本;其中,样本文本对应有参考总结文本和对照文本;利用总结模型的编码网络对样本文本和对照文本进行编码,得到样本文本的第一表示和对照文...
  • 本申请实施例公开了一种语音特征预测方法、装置、设备及可读存储介质,对文本特征序列进行至少一个韵律层级的编码,得到至少一个韵律层级的隐变量序列,至少可以在一个韵律层级上对隐层特征进行多种控制,在得到多个韵律层级的隐变量序列时,还可以在每个...
  • 本申请实施例公开了一种语音时长预测方法、装置、设备及可读存储介质,在获取文本数据后,利用预先训练好的时长预测模型对文本数据进行至少两个韵律层级的编码,得到至少两个韵律层级的编码特征序列;利用上述时长预测模型,根据上述至少两个韵律层级的编...
  • 本发明提供一种图像拼接方法、装置、电子设备和存储介质,其中方法包括:确定待拼接的两幅图像,两幅图像的部分视角重叠;基于所述两幅图像中任一图像中的目标的拍摄距离,确定所述两幅图像的实际平移参数;基于所述实际平移参数,对首尾拼接后的两幅图像...
  • 本发明提供一种语音识别方法、装置、电子设备和存储介质,其中方法包括:确定用户的待识别语音;基于预设状态转移路径,对所述待识别语音进行语音识别解码,得到语音识别结果;所述预设状态转移路径是基于所述用户的地域信息和/或历史输入信息扩充得到的...
  • 本发明公开了一种事件抽取方法,包括:依据至少一个预设的参数类型对待抽取文本进行第一参数抽取,获得第一参数信息;若第一参数信息的数量大于两个,则依据所有第一参数信息获得第一抽取结果,并将第一抽取结果作为事件抽取结果,其中,第一抽取结果包括...
  • 本申请公开了一种文档检索方法、装置、存储介质及设备,该方法包括:首先,获取待检索的目标文档;并将其进行分词,得到各个目标词语,然后,根据预先构建的词料库,将各个目标词语中不包含在语料库的目标词语和属于停用词的目标词语删除,得到各个处理后...
  • 本申请公开了一种公式识别方法、装置、存储介质及设备,该方法包括:首先获取包含待识别的目标公式的目标图像,提取目标图像的图像特征;然后根据该图像特征,按照预设的公式空间结构关系,对目标公式进行识别,得到目标公式的空间结构信息;并按照预设的...
  • 本申请公开了一种推荐方法和相关模型的训练方法、电子设备、存储装置,其中推荐模型的训练方法包括:获取多个样本路径实例;其中,多个样本路径实例属于至少一种元路径,样本路径实例包含多个顺序连接的样本节点,且样本路径实例的起点为样本对象,样本路...
  • 本实用新型实施例提供一种用于情绪识别的眼镜,所述眼镜的镜框包括鼻梁架和桩头,所述用于情绪识别的眼镜包括:心率传感器,内嵌于所述鼻梁架,用于监测对象的心率;至少一个摄像头,内置于所述桩头,用于拍摄所述对象的图像;主板,与所述心率传感器和所...
  • 本实用新型提供了一种音箱支架,包括横向杆(3)和呈剪刀叉形布置的两个臂杆,臂杆的一端与横向杆铰接,另一端设置有用于夹紧音箱的夹棒(6),臂杆的中部开设有长条孔,音箱支架还包括弹性件和用于悬挂音箱的横销(5),横销依次穿过两个臂杆的长条孔...
  • 本实用新型提供一种车载功放,所述车载功放包括:壳体,所述壳体设有第一滑槽;安装脚,所述安装脚滑动安装于所述第一滑槽,且设置为适于在滑动路径上的多个位置固定,并从所述第一滑槽伸出至所述壳体外;主板,所述主板设于所述壳体内。本实用新型提供的...
  • 本申请实施例公开了一种合成语音处理方法及相关装置,方法包括:获取针对第一用户的原始合成语音;通过预先训练好的正向生成器模型处理所述原始合成语音,得到针对所述第一用户的目标合成语音,所述正向生成器模型至少具备改善所述第一用户的合成语音的相...
  • 本申请实施例公开了一种合成语音处理方法及相关装置,方法包括:获取针对第一用户的原始合成语音;提取所述原始合成语音的幅度谱和相位谱,所述幅度谱包括能量维幅度谱和除所述能量维幅度谱之外的其他维幅度谱;通过预先训练好的正向生成器模型处理所述其...
  • 本实用新型实施例提供一种扫描笔,用以解决现有技术中扫描笔在使用时用户需要调整头部姿势,而且现有技术中扫描笔适用的握持姿势和人体普遍的握笔姿势不相同,造成阅读不舒适,阅读效率较低的缺陷,实现提升用户的握持和使用舒适性,且能够改善阅读视线,...