一种向量匹配方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:34175030 阅读:24 留言:0更新日期:2022-07-17 11:42
本申请提供了一种向量匹配方法、装置、电子设备和可读存储介质,属于知识图谱技术领域。所述方法包括:获取目标企业的工作信息记录;根据所述工作信息记录,确定所述目标企业中每个用户的用户向量集和每条信息的信息向量集;根据每个用户的用户向量集和每条信息的信息向量集,构建向量知识库;通过所述向量知识库进行向量匹配,其中,所述向量匹配包括用户和用户之间、用户和信息之间、信息和信息之间三者中的至少一种匹配。本申请提高企业办公效率。效率。效率。

A vector matching method, device, electronic device and readable storage medium

【技术实现步骤摘要】
一种向量匹配方法、装置、电子设备和可读存储介质


[0001]本申请涉及知识图谱
,尤其涉及一种向量匹配方法、装置、电子设备和可读存储介质。

技术介绍

[0002]随着数字化进程的不断加深,企业协同办公平台迅猛发展,这些企业协同办公平台,针对知识密集型企业轻流程重知识的特点,发展出了团队沟通工具、协同视频会议、协同云文档等工具来促进团队协作,提高组织运转效率,加速创新,推动组织的数字化转型。另一方面随着当前NLP和知识图谱相关技术的大力发展,企业协同办公平台不仅仅在远程协同环境和工具上提升效率,而是逐渐向企业中信息、知识的语义理解等更深层的协同能力上加快提升企业内外部协同效率。比如,各类企业服务机器人、面向领域的沟通话术研究等等,都是基于内容理解的层面来辅助工作提升效率。因此,研究企业中通过沟通会话和企业中一系列文档知识的语义理解来提升企业效率提升是有重大价值和现实意义。
[0003]当前企业协同办公平台中的知识语义化表示,都是通过自然语言处理和知识图谱等技术单独应用在企业知识库检索等场景中,没有在整体上探索结合协同办公平台中的大量会话信息的应用,导致企业办公效率低。

技术实现思路

[0004]本申请实施例的目的在于提供一种向量匹配方法、装置、电子设备和可读存储介质,以解决企业办公效率低的问题。具体技术方案如下:
[0005]第一方面,提供了一种向量匹配方法,所述方法包括:
[0006]获取目标企业的工作信息记录;
[0007]根据所述工作信息记录,确定所述目标企业中每个用户的用户向量集和每条信息的信息向量集;
[0008]根据每个用户的用户向量集和每条信息的信息向量集,构建向量知识库;
[0009]通过所述向量知识库进行向量匹配,其中,所述向量匹配包括用户和用户之间、用户和信息之间、信息和信息之间三者中的至少一种匹配。
[0010]可选地,所述确定所述目标企业中每个用户的用户向量集包括:
[0011]根据所述用户与关联对象之间的信息交互确定所述用户的关联对象向量;
[0012]根据所述用户的处理信息确定所述用户的处理信息向量;
[0013]根据所述用户的工作行为确定所述用户的工作行为向量;
[0014]将所述关联对象向量、处理信息向量和工作行为向量作为所述用户向量集。
[0015]可选地,所述根据所述用户与关联对象之间的信息交互确定所述用户的关联对象向量包括:
[0016]确定所述目标企业中的交互信息和所述交互信息对应的交互用户,其中,所述交互用户包括用户和所述用户的关联对象;
[0017]按照所述交互信息出现的时间顺序,将所述交互用户进行排序;
[0018]根据排序后的交互用户,采用LSTM模型学习得到每个用户的关联对象向量,其中,所述关联对象向量用于指示所述用户与关联对象之间的关联关系。
[0019]可选地,所述根据所述用户的处理信息确定所述用户的处理信息向量包括:
[0020]获取所述用户的用户标识和所述用户标识对应的处理信息,其中,所述处理信息包括信息类型和信息内容;
[0021]基于所述用户标识和所述处理信息,通过中文预训练模型得到所述用户的处理信息向量,其中,所述处理信息向量用于指示所述用户和所述处理信息之间的关联关系。
[0022]可选地,所述根据所述用户的工作行为确定所述用户的工作行为向量包括:
[0023]获取所述用户的用户标识、用户角色和至少一个工作行为,其中,所述工作行为按照时间顺序进行排序;
[0024]基于所述用户标识、所述用户角色和所述至少一个工作行为,通过中文预训练模型得到所述用户的工作行为向量,其中,所述工作行为向量用于指示所述用户和所述工作行为之间的关联关系。
[0025]可选地,确定所述目标企业中每条信息的信息向量集包括:
[0026]根据所述目标企业的工作信息确定所述信息的信息语义向量;
[0027]根据处理所述信息的用户确定所述信息的关联用户向量;
[0028]根据所述信息的来源确定所述信息的关联信息向量;
[0029]将所述信息语义向量、所述关联用户向量和所述关联信息向量作为所述信息向量集。
[0030]可选地,根据所述目标企业的工作信息确定所述信息的信息语义向量包括:
[0031]将所述目标企业的每条工作信息转化为工作序列;
[0032]通过所述工作序列对初始中文预训练模型进行训练,得到目标中文预训练模型,其中,所述目标中文预训练模型符合所述目标企业的企业特点;
[0033]通过所述目标中文预训练模型得到所述信息的信息语义向量,其中,所述信息语义向量用于指示所述信息的信息语义。
[0034]可选地,根据处理所述信息的用户确定所述信息的关联用户向量包括:
[0035]获取所述信息的信息标识、信息类型和关联用户信息,其中,所述关联用户信息包括关联用户角色和关联用户名称;
[0036]基于所述信息标识、所述信息类型和所述关联用户信息,通过中文预训练模型得到所述信息的关联用户向量,其中,所述关联用户向量用于指示所述信息和所述关联用户之间的关联关系。
[0037]可选地,根据所述信息的来源确定所述信息的关联信息向量包括:
[0038]确定所述信息的信息来源;
[0039]确定所述信息来源中包含的除所述信息之外的关联信息;
[0040]根据所述信息和所述关联信息,通过中文预训练模型得到所述信息的关联信息向量,其中,所述关联信息向量用于指示所述信息和所述关联信息之间的关联关系。
[0041]可选地,通过所述向量知识库进行向量匹配包括:
[0042]确定目标向量,其中,所述目标向量为待匹配的向量;
[0043]从所述向量知识库中查找与所述目标向量的向量相似度大于相似度阈值的匹配向量,其中,所述匹配向量和所述目标向量之间的匹配为用户和用户之间的匹配、用户和信息之间的匹配、信息和信息之间的匹配三者中的至少一种。
[0044]第二方面,提供了一种向量匹配装置,所述装置包括:
[0045]获取模块,用于获取目标企业的工作信息记录;
[0046]确定模块,用于根据所述工作信息记录,确定所述目标企业中每个用户的用户向量集和每条信息的信息向量集;
[0047]构建模块,用于根据每个用户的用户向量集和每条信息的信息向量集,构建向量知识库;
[0048]匹配模块,用于通过所述向量知识库进行向量匹配,其中,所述向量匹配包括用户和用户之间、用户和信息之间、信息和信息之间三者中的至少一种匹配。
[0049]第三方面,提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
[0050]存储器,用于存放计算机程序;
[0051]处理器,用于执行存储器上所存放的程序时,实现任一所述的向量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种向量匹配方法,其特征在于,所述方法包括:获取目标企业的工作信息记录;根据所述工作信息记录,确定所述目标企业中每个用户的用户向量集和每条信息的信息向量集;根据每个用户的用户向量集和每条信息的信息向量集,构建向量知识库;通过所述向量知识库进行向量匹配,其中,所述向量匹配包括用户和用户之间、用户和信息之间、信息和信息之间三者中的至少一种匹配。2.根据权利要求1所述的方法,其特征在于,所述确定所述目标企业中每个用户的用户向量集包括:根据所述用户与关联对象之间的信息交互确定所述用户的关联对象向量;根据所述用户的处理信息确定所述用户的处理信息向量;根据所述用户的工作行为确定所述用户的工作行为向量;将所述关联对象向量、处理信息向量和工作行为向量作为所述用户向量集。3.根据权利要求2所述的方法,其特征在于,所述根据所述用户与关联对象之间的信息交互确定所述用户的关联对象向量包括:确定所述目标企业中的交互信息和所述交互信息对应的交互用户,其中,所述交互用户包括用户和所述用户的关联对象;按照所述交互信息出现的时间顺序,将所述交互用户进行排序;根据排序后的交互用户,采用LSTM模型学习得到每个用户的关联对象向量,其中,所述关联对象向量用于指示所述用户与关联对象之间的关联关系。4.根据权利要求2所述的方法,其特征在于,所述根据所述用户的处理信息确定所述用户的处理信息向量包括:获取所述用户的用户标识和所述用户标识对应的处理信息,其中,所述处理信息包括信息类型和信息内容;基于所述用户标识和所述处理信息,通过中文预训练模型得到所述用户的处理信息向量,其中,所述处理信息向量用于指示所述用户和所述处理信息之间的关联关系。5.根据权利要求2所述的方法,其特征在于,所述根据所述用户的工作行为确定所述用户的工作行为向量包括:获取所述用户的用户标识、用户角色和至少一个工作行为,其中,所述工作行为按照时间顺序进行排序;基于所述用户标识、所述用户角色和所述至少一个工作行为,通过中文预训练模型得到所述用户的工作行为向量,其中,所述工作行为向量用于指示所述用户和所述工作行为之间的关联关系。6.根据权利要求1

5任意一项所述的方法,其特征在于,确定所述目标企业中每条信息的信息向量集包括:根据所述目标企业的工作信息确定所述信息的信息语义向量;根据处理所述信息的用户确定所述信息的关联用户向量;根据所述信息的来源确定所述信息的关联信息向量;将所述信息语义向量、所述关联用户向量和所述关联信息向量作为所述信息向量集。
7.根据权利要求6所述的方法,其特征在于,根据所...

【专利技术属性】
技术研发人员:梁秀钦齐云飞徐凯波
申请(专利权)人:北京明略软件系统有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1