System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及资料管理系统的领域,尤其是涉及一种基于aigc的办公问答方法、系统及其存储介质。
技术介绍
1、企业会有很多内部的资料,例如企业文化、规章制度、员工手册、岗位说明、内训资料等。而企业员工在工作的过程中,往往需要查询一些企业内部资料才能了解企业对流程和规范的具体要求,据此来执行工作。例如当员工需要出差时,需要了解出差流程(包括出差申请流程、出差行为流程)和差旅费用标准,员工需要去找到相应的规章制度文件和具体条款,或找相关管理部门进行询问。
2、由于企业的各种资料品类繁多,且分散在各个业务部门,企业内部员工很难快速找到正确的信息。这使得企业员工的工作效率下降,甚至因为查询错误而提供出错误的信息。
技术实现思路
1、为了改善企业员工能以快速查询到需要的答案的问题,本申请提供一种基于aigc的办公问答方法、系统及其存储介质。
2、本申请提供的一种基于aigc的办公问答方法,采用如下的技术方案:
3、一种基于aigc的办公问答方法,包括:
4、对原始资料数据进行语义解析,并自动生成主题目录数据、摘要数据;
5、通过所述原始资料数据、所述主题目录数据、所述摘要数据生成存储向量数据,并存入存储向量数据库中;
6、读取用户输入的提问语言并进行语义解析,并提取需求主题数据,通过所述需求主题数据确定预测回答格式数据;
7、通过所述预测回答格式数据与所述需求主题数据确定需求主题向量数据;
8、通过所
9、将所述存储向量数据对应的所述原始资料数据、所述主题目录数据、所述摘要数据提取并输出给用户。
10、通过采用上述技术方案,实现对原始资料数据输入后的自动生成相应的向量数据并存入存储向量数据库中,简化资料管理工作,不需要对原始资料进行精细分类和编辑,方便快捷;并通过先对提问语言进行语义解析,然后提取后得到预测回答格式数据,再通过预测回答格式数据与提问语言转化为向量数据进入存储向量数据库中搜索得到存储向量数据,通过预测回答格式能够进一步实现限定向量的搜索范围,降低了将所有相关答案都进行搜索的概率,提高了搜索效率;可用于多模态资料的搜索,文本图片、视频、音频都可以作为检索内容,用户只需要用自然语言提出问题,不需要进行复杂的系统操作,避免因操作导致的检索结果错误。
11、可选的,所述通过所述需求主题数据确定预测回答格式数据包括:
12、预设关联向量数据库以及规范用语向量数据库;
13、通过所述需求主题数据确定相似主题向量数据,通过所述相似主题向量数据与所述规范用语向量数据库确定规范用语向量数据;
14、通过所述规范用语向量数据与所述关联向量数据库确定关联向量数据,通过关联向量数据确定预测回答格式数据。
15、通过采用上述技术方案,降低用户所用的自然语言的语义偏差导致后续向量搜索时检索到偏差较大的答案,将用户的自然语言矫正成企业内部所用的规范用语后再进行检索,提高了准确性,提高了检索效率。
16、可选的,通过所述需求主题向量数据在所述存储向量数据库中确定所述存储向量数据包括:
17、预设向量距离数据,通过所述向量距离数据与所述需求主题向量数据确定需求向量范围值,若所述存储向量数据库中存在一个向量点的向量值落于所述需求向量范围值内,那么此向量点的向量值即为所述存储向量数据。
18、通过采用上述技术方案,通过向量值的比较实现对向量点的搜索,降低了暴力搜索对所有向量点与需求主题向量数据之间的向量距离的计算,通过数据之间的大小比较、位置与范围的比较替代原先的大量距离计算,大大减小了计算量,提高了检索速度。
19、可选的,若所述存储向量数据库中不存在向量点的向量值落于所述需求向量范围值内:预设放大比例值,通过所述放大比例值与原先的所述向量距离数据确定新的所述向量距离数据;
20、通过新的所述向量距离数据与所述需求主题向量数据确定新的所述需求向量范围值,若所述存储向量数据库中存在一个向量点的向量值落于所述需求向量范围值内,那么此向量点的向量值即为所述存储向量数据;
21、若所述存储向量数据库中仍不存在一个向量点的向量值落于所述需求向量范围值内,通过当前的所述向量距离数据与初始的所述向量距离数据确定已放大比例数据,将所述已放大比例数据与预设的所述最大比例阈值数据进行对比处理;
22、若所述已放大比例数据小于预设的所述最大比例阈值数据,则返回通过所述放大比例值与原先的所述向量距离数据确定新的所述向量距离数据;
23、若所述已放大比例数据大于预设的所述最大比例阈值数据,则输出无结果信号给用户。
24、通过采用上述技术方案,若需求向量范围值内不存在向量点,则按照放大比例值放大需求向量范围值,降低了需求向量范围值过小而导致无匹配的向量点,导致无法输出的概率。
25、可选的,若所述存储向量数据库中存在至少两个向量点的向量值落于所述需求向量范围值内时:
26、预设向量点数量数据,若落于所述需求向量范围值内的向量点数量小于所述向量点数量数据,则通过需求主题向量数据的向量值与落于所述需求向量范围值内的向量点的向量值确定向量距离差值数据,所述向量距离差值数据最小的向量点作为所述存储向量数据。
27、通过采用上述技术方案,当需求向量范围值内的向量点数量小于向量点数量数据时,表示向量点的数量较少,此时可对这些向量点的向量值计算与需求主题向量数据之间的向量距离,从而得到最近的向量点,实现了又快有精准的向量点搜索。
28、可选的,若落于所述需求向量范围值内的向量点数量大于向量点数量数据:
29、预设缩小比例值,通过所述需求向量范围值确定大范围值,通过原先的所述需求向量范围值确定小范围值;
30、通过所述大范围值与所述小范围值确定范围差值,通过所述范围差值与所述缩小比例值确定新的所述需求向量范围值;
31、若新的所述需求向量范围值内的向量点的数量仍大于所述向量点数量数据,则通过新的所述需求向量范围值更新所述大范围值,并重复此步骤。
32、通过采用上述技术方案,当范围内的向量点数量过多时,可按照缩小比例值进行缩小,从而继续排除向量点,直至向量点的数量在向量带你数量数据的范围之内了,再进行向量距离的计算,实现了先快速排除大量不符合条件的向量点,再对少量符合条件的向量点进行向量距离的计算,得到最合适的向量点。
33、可选的,在将所述存储向量数据对应的所述原始资料数据、所述主题目录数据、所述摘要数据提取并输出给用户后,还包括:
34、读取用户输入的结果数据,通过所述结果数据确定所述向量距离差值数据是否为提问语言的正确答复;
35、若所述结果数据为否,则记录相应问题语言对应的所述向量距离差值数据为错误答复数据,本文档来自技高网...
【技术保护点】
1.一种基于AIGC的办公问答方法,其特征在于,包括:
2.根据权利要求1所述的一种基于AIGC的办公问答方法,其特征在于,所述通过所述需求主题数据确定预测回答格式数据包括:
3.根据权利要求1所述的一种基于AIGC的办公问答方法,其特征在于,通过所述需求主题向量数据在所述存储向量数据库中确定所述存储向量数据包括:
4.根据权利要求3所述的一种基于AIGC的办公问答方法,其特征在于,若所述存储向量数据库中不存在向量点的向量值落于所述需求向量范围值内:
5.根据权利要求4所述的一种基于AIGC的办公问答方法,其特征在于,若所述存储向量数据库中存在至少两个向量点的向量值落于所述需求向量范围值内时:
6.根据权利要求5所述的一种基于AIGC的办公问答方法,其特征在于,若落于所述需求向量范围值内的向量点数量大于向量点数量数据:
7.根据权利要求5所述的一种基于AIGC的办公问答方法,其特征在于,在将所述存储向量数据对应的所述原始资料数据、所述主题目录数据、所述摘要数据提取并输出给用户后,还包括:
8.根据
9.一种基于AIGC的办公问答系统,根据权利要求1所述的一种基于AIGC的办公问答方法,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,存储有能够被处理器加载并执行如权利要求1至8中任一种基于AIGC的办公问答方法的计算机程序。
...【技术特征摘要】
1.一种基于aigc的办公问答方法,其特征在于,包括:
2.根据权利要求1所述的一种基于aigc的办公问答方法,其特征在于,所述通过所述需求主题数据确定预测回答格式数据包括:
3.根据权利要求1所述的一种基于aigc的办公问答方法,其特征在于,通过所述需求主题向量数据在所述存储向量数据库中确定所述存储向量数据包括:
4.根据权利要求3所述的一种基于aigc的办公问答方法,其特征在于,若所述存储向量数据库中不存在向量点的向量值落于所述需求向量范围值内:
5.根据权利要求4所述的一种基于aigc的办公问答方法,其特征在于,若所述存储向量数据库中存在至少两个向量点的向量值落于所述需求向量范围值内时:
6.根据权利要求5...
【专利技术属性】
技术研发人员:李碧浩,柳阳,熊木星,
申请(专利权)人:上海复通软件技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。