上海数珩信息科技股份有限公司专利技术

上海数珩信息科技股份有限公司共有36项专利

  • 本发明涉及一种混合增强型知识获取及回答的装置、方法及介质,包括:数据存储和索引模块,用于使用ES技术作为数据存储和索引工具;自定义分词模块,用于利用先进的自然语言处理技术进行文本分词,优化查询词的处理,增强搜索阶段的数据召回质量,确保召...
  • 本发明涉及一种根据功能配置进行智能响应的数智人构建装置及方法,该装置包括:智能语音模块,接收和解析用户的语音输入;向量搜索模块:根据用户的问题生成对应的向量,并在向量空间内进行搜索;知识库问答模块:从知识库中提取需要的信息;LangTr...
  • 本发明涉及大数据处理技术领域,具体地说是一种可实时部署的语言链执行装置、方法及设备,所述可实时部署的语言链执行装置包括:解析模块,用于使用JIT编译技术将用户输入的代码或者命令解析为相应的机器语言;执行模块,用于按照解析模块提供的指令运...
  • 本发明涉及语言模型训练技术领域,具体地说是一种支持多种大语言模型训练的装置、方法及设备,该支持多种大语言模型训练的装置包括:数据集管理模块,用于上传和自动识别数据集,为后面的训练提供数据支撑;模型列表模块,用于查看当前所有模型的相关信息...
  • 本发明涉及一种知识梳理与冲突解决的自动化装置、方法及存储介质,该装置包括:数据预处理和向量化单元,用于对系统中的所有句子进行预处理并向量化,存储到向量数据库;相似句子查找单元,用于当有新的源句子输入时,检索出与源句子在语义上最接近的历史...
  • 本发明涉及一种基于RBAC的支持多租户的数据权限管理装置及方法,该装置包括:租户信息管理器,用于存储租户的基本信息;角色权限管理器,用于存储角色和权限的映射关系;用户角色管理器,用于存储用户在不同租户下的角色信息,并将用户ID和角色ID...
  • 本发明涉及数字人技术领域,具体地说是一种快速生成模拟人类口型的方法、系统及设备,其方法主要包括以下步骤:1)先将声音信号转化为小段梅尔光谱,并分配给不同的图形处理单元GPU进行并行处理;2)在每个GPU上运行相同的计算模型,根据输入的梅...
  • 本发明涉及一种可灵活适配应用场景的大语言模型装置及处理方法,其方法包括以下步骤:1)将一个大规模参数的模型拆分成多个小模型,且在拆分过程中,随机将参数分配到多个小模型中;2)使用某一个具体场景频繁出现的文本对拆分了的每个模型进行预训练;...
  • 本发明涉及一种基于视线识别的数字人交互拟真方法、装置及终端,其方法包括以下步骤:摄像头实时捕捉到用户的视线位置,图像信息被机器学习的模型进行处理,并识别出用户眼部的元素;根据瞳孔位置和眼球方向的预测结果,通过模型算法生成一张二维热图,进...
  • 本发明涉及一种基于语言模型树的智能体思考装置、方法及设备,该装置中,输入分类模型负责识别外部输入的类型,并分发给推理模型、预测模型和执行模型,推理模型用于进行规则逻辑判断,预测模型用于根据事实预测后续可能发生的事情,执行模型用于根据指令...
  • 本发明涉及一种基于微调的快速适应发音人的语音合成方法及装置,其方法包括以下步骤,1)数据集准备:针对每个发音人,准备大于10条的短音频;以pipeline的方式对音频进行集中批量预处理操作;使用whisper模型对音频进行自动转录,再辅...
  • 本发明涉及一种基于语言模型驱动的全自动网络爬虫方法及装置,该网络爬虫方法包括以下步骤:1)收集网络爬虫的需求并提炼出关键词和关键步骤;2)将步骤1)中的关键词和关键步骤转换成可供训练的提示词结构;3)将提示词结构输入至大语言模型进行学习...
  • 本发明提供了一种基于大语言模型的自然语言问答方法、装置、介质及设备,该方法包括:获取参考知识文档;将所述参考知识文档分割成多个文本块,并对所述多个文本块进行分词及词向量表示,得到包括多个文本特征向量的向量数据库;获取用户输入的自然语言问...
  • 本发明涉及一种适应语音唤醒和人脸唤醒方法、装置、设备及存储介质,其方法包括以下步骤,1)语音唤醒词定制:通过麦克风录制唤醒关键词语音,后台生成当前智能设备的唤醒信息;2)人脸检测:摄像头检测到人脸,使用当前检测到的实时人脸和后台设置的人...
  • 本发明涉及一种利用语言模型树生成特定布局网页的方法及装置,其方法具体包括以下步骤,1)需求输入:用户通过交互界面输入网页的需求;2)需求解析:将用户的需求输入转化为能够被AI模型理解的格式,并发送给AI模型;3)AI模型处理:解析完成的...
  • 本发明涉及一种基于语言模型的限定领域的信息问答和查询系统及方法,该系统包括:数据库知识库模块,用于收集和整理特定领域的专业知识,并将这些知识整理成结构化的数据,存储在数据库知识库中;数据检索模块,用于当用户提出问题时,根据问题的内容,从...
  • 本发明涉及自然语言处理技术领域,具体地说是一种数字人实时模拟指定人物音色的方法、装置及存储介质,所述的数字人实时模拟指定人物音色的方法,包括以下步骤:1)收集需要转换成目标人物音色的声音,将声音进行切割;2)对步骤1)中切割好的音频进行...
  • 本发明涉及一种人类动作视频采集和流畅合成的方法及装置,其方法包括以下步骤:1)真人动作视频采集:使用视频采集设备,对每个动作进行捕捉和录制,获得原始动作视频片段;2)动作视频片段合成:通过插帧操作获得头部插帧段和尾部插帧段,将头部插帧段...
  • 本发明涉及大数据处理技术领域,具体地说是一种向量数据库主从备份和分片策略的高可用系统及方法,该系统包括:监控系统,用于监控和管理向量数据库,帮助用户对向量数据库进行全面和实时的监控,并确保数据库的稳定和效率;向量数据库高可用集群,通过在...
  • 本发明涉及图像通信技术领域,具体地说是一种加快远程数字人响应速度的方法,包括以下步骤: