一种建立数字人物并和数字人物对话的方法和系统技术方案

技术编号:31607295 阅读:12 留言:0更新日期:2021-12-29 18:33
本发明专利技术公开了一种建立数字人物并和数字人物对话的方法和系统。本发明专利技术提出了一种新的从人物的非聊天记录的资料和聊天记录的资料建立数字人物的方法;提出了时代数据库的概念及时代数据库和人物数据库的链接方法;提出了一种新的对用户的问题进行分析的方法,通过人物和时代数据库查找相关答案并返回给用户。本发明专利技术改变了以往只有通过文字介绍,雕像头像等非交互的媒体来了解各个人物的情况。当本发明专利技术系统被放置在各博物馆,纪念馆,纪念碑,雕像等附近时,它可以增进用户和人物的互动,让历史人物能够生动地和用户进行交互,增加用户学习和了解人物相关信息的兴趣。和了解人物相关信息的兴趣。和了解人物相关信息的兴趣。

【技术实现步骤摘要】
一种建立数字人物并和数字人物对话的方法和系统


[0001]本专利技术属于人机交互
,尤其涉及一种建立数字人物并和数字人物对话的方法和系统。

技术介绍

[0002]现有的聊天机器人或者聊天系统和用户对话时通常基于大数据的训练结果,但是回答是千人一面,而不是特定人物的回答。每一个人物都有他/她的时代烙印和背景,但现有的聊天机器人或聊天系统均没有考虑人物所在的时代信息和特点。

技术实现思路

[0003]本专利技术的目的在于针对现有技术的不足,提供一种建立数字人物并和数字人物对话的方法和系统,改变了传统文字/照片/视频对人物的记录方式,让人物“活起来”可以和用户进行对话。
[0004]本专利技术的目的是通过以下技术方案来实现的:本专利技术提出了一种新的从人物的非聊天记录的资料(如网络,辞典,简历,档案等)和聊天记录的资料建立数字人物的方法;提出了时代数据库的概念及时代数据库和人物数据库的链接方法;提出了一种新的对用户的问题进行分析的方法(而不是传统的大语料库的训练),通过人物和时代数据库查找相关答案并返回给用户。本专利技术的具体实现步骤如下:
[0005]S1:建立数字人物数据库:分别对各个人物的非聊天记录的资料和聊天记录的资料进行分析,并分别构建人物信息自动归类结果表,人物信息自动归类结果表中每个人物对应多个表单,每个表单分若干小类;将非聊天记录的资料和聊天记录的资料构建的人物信息自动归类结果表合并后,形成数字人物数据库;
[0006]S2:建立时代数据库:按时间顺序对世界的每一个地区制作一个编年史的表格框架,构建时代信息自动归类结果表,包括年代、发生的主要事件、主要人物;以人物为线索将数字人物数据库和时代数据库建立关联;
[0007]S3:建立对话模块:用户选择数字人物,区分用户的问题是个人问题还是非个人问题;对于个人问题,首先激活该人物对应的数字人物数据库,当数字人物数据库无法回答时,激活时代数据库;对于非个人问题,激活时代数据库;通过数据库关键字匹配,生成给用户的回答。
[0008]进一步地,所述步骤S1中,将各个人物的材料整理到数字人物数据库中,根据不同的数据源有以下两种不同的实现方式:
[0009]S11:对该人物的非聊天记录的资料的分析和建立人物数据库:
[0010]第1步:通过各种非聊天记录的资料来源,在这些信息中查找关于某人物X的信息,包括文字描述、照片、视频、音频信息;
[0011]第2步:设定人物的多个表单,每个表单分小类,建立人物信息自动归类结果表;
[0012]第3步:运用文本分类技术,将该人物的文字描述自动归类到人物信息自动归类结
果表中的各个小类;
[0013]第4步:运用计算机视觉技术对照片以及视频进行分析和分类,将照片和视频的原始文件自动归类到人物信息自动归类结果表中的各个小类,分以下两种情况进行处理:
[0014]情况1:如果分到小类过程中分类错误率大于阈限,则将照片和视频的原始文件自动归类到人物信息自动归类结果表中该人物的各个表单而非小类中;如果自动归类到表单的错误率仍然大于阈限,则不对照片或者视频的原始文件归类,将原始文件放入人物信息自动归类结果表中的某人物无法归类的照片/视频行,或者通过人工分小类;
[0015]情况2:如果分到小类过程中分类错误率小于等于阈限,则将照片或视频的原始文件自动归类到人物信息自动归类结果表中该人物的各个小类;
[0016]第5步:对音频文件进行分析:
[0017]1)运用音频分析技术,将音频分为语音音频和非语音音频,并保留原始音频文件;
[0018]2)对于语音音频,运用语音识别技术将音频中的信息转化成文字,将转换成的文字的内容按照第3步补充到人物信息自动归类结果表的各个小类;根据识别出来的文字的归类结果,将音频的原始文件自动归到人物信息自动归类结果表的对应的小类;
[0019]3)对于非语音音频,将不自动归类,把音频的原始文件放入人物信息自动归类结果表中的某人物无法归类的音频行,或者人工归到小类;
[0020]第6步:重复第1步至第5步,将各个人物整合到人物信息自动归类结果表中;
[0021]S12:对该人物的聊天记录的资料的分析和建立人物数据库:
[0022]第1步:标定某人物X是聊天记录的哪一方,把X说的内容标定为XS,和X说话的人Y说的内容标定为YS;
[0023]第2步:对聊天内容中的文本信息进行分析,具体为:
[0024]1)对X说的内容XS按照数字人物的类别进行分类;
[0025]2)在一轮对话中,对于Y说的内容YS,只要X的回复是肯定的,则对Y说的内容YS按照数字人物的类别进行分类;
[0026]第3步:对聊天内容中的照片、视频和音频这些非文本信息进行分析,具体为:
[0027]1)根据S11第4、5步中的方法,将X说的内容XS归纳到人物信息自动归类结果表中;
[0028]2)在一轮对话中,对于Y发送的非文本文件,只要X的回复是肯定的,则根据S11第4、5步中的方法,将Y说的内容YS归纳到人物信息自动归类结果表中;
[0029]第4步:重复第1步至第3步,将各个人物整合到人物信息自动归类结果表中。
[0030]进一步地,所述步骤S2中,建立时代数据库具体包括以下子步骤:
[0031]第1步:按时间顺序对世界的每一个地区制作一个编年史的表格框架,构建时代信息自动归类结果表,包括年代、发生的主要事件、主要人物;
[0032]第2步:按照建立数字人物数据库的方法,以年代为起始线索,自动搜素互联网或者各种电子字典/辞典得到的信息,自动归类到时代信息自动归类结果表的各个小类中;
[0033]第3步:以人物为线索将人物数据库和时代数据库建立关联。
[0034]进一步地,所述步骤S3中,所述对话模块包括4个子模块:
[0035]子模块1:非个人问题和个人问题区分模块
[0036]运用人工神经网络区分是个人问题还是非个人问题,如果区分出来是个人问题则进入子模块2,如果区分出来是非个人问题则进入子模块3;
[0037]子模块2:个人问题回答模块,具体实现包括以下步骤:
[0038]第1步:根据用户选择的人物,激活数字人物数据库该人物对应的所有行;
[0039]第2步:对数字人物数据库该人物激活的文本信息行里面的文字进行分词,获得“数据关键词”;
[0040]第3步:提取用户问题中的关键词,如果没有提取到关键词,则进入子模块3;
[0041]第4步:生成关键词的同义词;
[0042]第5步:根据问题关键词及其同义词,在数字人物数据库该人物的激活行中寻找匹配的数据关键词及其同义词;
[0043]1)如果没有匹配到任何数据关键词或者同义词,则询问并引导用户是否换一种说法,或者询问其他问题,并返回子模块1;
[0044]2)如果只有1个匹配的数据关键词包括其同义词,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种建立数字人物并和数字人物对话的方法,其特征在于,该方法包括以下步骤:S1:建立数字人物数据库:分别对各个人物的非聊天记录的资料和聊天记录的资料进行分析,并分别构建人物信息自动归类结果表,人物信息自动归类结果表中每个人物对应多个表单,每个表单分若干小类;将非聊天记录的资料和聊天记录的资料构建的人物信息自动归类结果表合并后,形成数字人物数据库。S2:建立时代数据库:按时间顺序对世界的每一个地区制作一个编年史的表格框架,构建时代信息自动归类结果表,包括年代、发生的主要事件、主要人物;以人物为线索将数字人物数据库和时代数据库建立关联。S3:建立对话模块:用户选择数字人物,区分用户的问题是个人问题还是非个人问题;对于个人问题,首先激活该人物对应的数字人物数据库,当数字人物数据库无法回答时,激活时代数据库;对于非个人问题,激活时代数据库;通过数据库关键字匹配,生成给用户的回答。2.根据权利要求1所述的一种建立数字人物并和数字人物对话的方法,其特征在于,所述步骤S1中,将各个人物的材料整理到数字人物数据库中,根据不同的数据源有以下两种不同的实现方式:S11:对该人物的非聊天记录的资料的分析和建立人物数据库:第1步:通过各种非聊天记录的资料来源,在这些信息中查找关于某人物X的信息,包括文字描述、照片、视频、音频信息;第2步:设定人物的多个表单,每个表单分小类,建立人物信息自动归类结果表;第3步:运用文本分类技术,将该人物的文字描述自动归类到人物信息自动归类结果表中的各个小类;第4步:运用计算机视觉技术对照片以及视频进行分析和分类,将照片和视频的原始文件自动归类到人物信息自动归类结果表中的各个小类,分以下两种情况进行处理:情况1:如果分到小类过程中分类错误率大于阈限,则将照片和视频的原始文件自动归类到人物信息自动归类结果表中该人物的各个表单而非小类中;如果自动归类到表单的错误率仍然大于阈限,则不对照片或者视频的原始文件归类,将原始文件放入人物信息自动归类结果表中的某人物无法归类的照片/视频行,或者通过人工分小类;情况2:如果分到小类过程中分类错误率小于等于阈限,则将照片或视频的原始文件自动归类到人物信息自动归类结果表中该人物的各个小类;第5步:对音频文件进行分析:1)运用音频分析技术,将音频分为语音音频和非语音音频,并保留原始音频文件;2)对于语音音频,运用语音识别技术将音频中的信息转化成文字,将转换成的文字的内容按照第3步补充到人物信息自动归类结果表的各个小类;根据识别出来的文字的归类结果,将音频的原始文件自动归到人物信息自动归类结果表的对应的小类;3)对于非语音音频,将不自动归类,把音频的原始文件放入人物信息自动归类结果表中的某人物无法归类的音频行,或者人工归到小类;第6步:重复第1步至第5步,将各个人物整合到人物信息自动归类结果表中;S12:对该人物的聊天记录的资料的分析和建立人物数据库:第1步:标定某人物X是聊天记录的哪一方,把X说的内容标定为XS,和X说话的人Y说的
内容标定为YS;第2步:对聊天内容中的文本信息进行分析,具体为:1)对X说的内容XS按照数字人物的类别进行分类;2)在一轮对话中,对于Y说的内容YS,只要X的回复是肯定的,则对Y说的内容YS按照数字人物的类别进行分类;第3步:对聊天内容中的照片、视频和音频这些非文本信息进行分析,具体为:1)根据S11第4、5步中的方法,将X说的内容XS归纳到人物信息自动归类结果表中;2)在一轮对话中,对于Y发送的非文本文件,只要X的回复是肯定的,则根据S11第4、5步中的方法,将Y说的内容YS归纳到人物信息自动归类结果表中;第4步:重复第1步至第3步,将各个人物整合到人物信息自动归类结果表中。3.根据权利要求1所述的一种建立数字人物并和数字人物对话的方法,其特征在于,所述步骤S2中,建立时代数据库具体包括以下子步骤:第1步:按时间顺序对世界的每一个地区制作一个编年史的表格框架,构建时代信息自动归类结果表,包括年代、发生的主要事件、主要人物;第2步:按照建立数字人物数据库的方法,以年代为起始线索,自动搜素互联网或者各种电子字典/辞典得到的信息,自动归类到时代信息自动归类结果表的各个小类中;第3步:以人物为线索将人物数据库和时代数据库建立关联。4.根据权利要求1所述的一种建立数字人物并和数字人物对话的方法,其特征在于,所述步骤S3中,所述对话模块包括4个子模块:子模块1:非个人问题和个人问题区分模块运用人工神经网络区分是个人问题还是非个人问题,如果区分出来是个人问题则进入子模块2,如果区分出来是非个人问题则进入子模块3;子模块2:个人问题回答模块,具体实现包括以下步骤:第1步:根据用户选择的人物,激活数字人物数据库该人物对应的所有行;第2步:对数字人物数据库该人物激活的文本信息行里面的文字进行分词,获得“数据关键词”;第3步:提取用户问题中的关键词,如果没有提取到关键词,则进入子模块3;第4步:生成关键词的同义词;第5步:根据问题关键词及其同义词,在数字人物数据库该人物的激活行中寻找匹配的数据关键...

【专利技术属性】
技术研发人员:吴昌旭
申请(专利权)人:心行者科技杭州有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1