文本匹配方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26259804 阅读:18 留言:0更新日期:2020-11-06 17:54
本申请实施例提供了一种文本匹配方法、装置、电子设备及存储介质,涉及文本识别技术领域。文本匹配方法包括接收用户端上传的第一文本;对第一文本进行分词处理,得到第一词向量矩阵;通过词频‑逆向文件频率算法对第一词向量矩阵中的每个词向量赋予权重,得到第一词频矩阵;将第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与第一词频矩阵相似度最高的目标词频矩阵;将与目标词频矩阵对应的目标文本发送给用户端。本申请实施例提供的文本匹配方法、装置、电子设备及存储介质能够匹配与第一文本关联度高的目标文本,降低产品文案撰写的时间和人力成本。

【技术实现步骤摘要】
文本匹配方法、装置、电子设备及存储介质
本文件涉及文本识别
,尤其涉及一种文本匹配方法、装置、电子设备及存储介质。
技术介绍
产品文案的主要目的是为了让商家所经营的产品更有认知度,销售力,更好的获得目标受众的认知,更有效的把产品价值传达给目标受众。目前,对于产品文案的制作,大都是根据对产品的理解并搜索关键词,然后花费大量大量时间阅读搜索出的文本内容,从中找出与产品关联度高的文本后再参考其中的内容进行文案的撰写。然而,在此过程中由于需要大量的时间来进行文本的检索和文本内容的阅读理解,导致产品文案撰写需要耗费大量的时间和人力成本。
技术实现思路
本申请实施例提供一种文本匹配方法,用以解决现有技术中存在的产品文案撰写需要耗费大量时间和人力成本的问题。本申请实施例提供一种文本匹配装置,用以解决现有技术中存在的产品文案撰写需要耗费大量时间和人力成本的问题。本申请实施例还提供一种电子设备及计算机可读存储介质。本申请实施例采用下述技术方案:一种文本匹配方法,包括:接收用户端上传的第一文本;对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与所述第一词频矩阵相似度最高的至少一个目标词频矩阵;将与所述至少一个目标词频矩阵对应的目标文本发送给所述用户端。可选的,所述方法还包括:从目标网站获取多篇第二文本;对所述多篇第二文本进行分词处理,得到与所述多篇第二文本一一对应的多个第二词向量矩阵;通过词频-逆向文件频率算法对所述多个第二词向量矩阵中的每个词向量赋予权重,得到与所述多个第二词向量矩阵一一对应的所述多个第二词频矩阵。可选的,所述从目标网站获取多篇第二文本,包括:通过网络爬虫从目标网站获取多篇第二文本。可选的,所述从目标网站获取多篇第二文本,包括:从至少一个目标网站获取多篇第二文本。可选的,所述方法还包括:确定出所述第一词频矩阵中的关键向量;所述将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,包括:将所述第一词频矩阵中的关键向量与所述多个第二词频矩阵中的关键向量进行相似度计算;其中,所述关键向量为词频矩阵中所对应的权重最大的至少一个词向量。一种文本匹配装置,包括:接收模块,用于接收用户端上传的第一文本;分词处理模块,用于对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;权重模块,用于通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;运算模块,用于将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与所述第一词频矩阵相似度最高的至少一个目标词频矩阵;发送模块,用于将与所述至少一个目标词频矩阵对应的目标文本发送给所述用户端。可选的,文本匹配装置还包括:获取模块,用于从目标网站获取多篇第二文本;分词处理模块还用于对所述多篇第二文本进行分词处理,得到与所述多篇第二文本一一对应的多个第二词向量矩阵;权重模块还用于通过词频-逆向文件频率算法对所述多个第二词向量矩阵中的每个词向量赋予权重,得到与所述多个第二词向量矩阵一一对应的所述多个第二词频矩阵。可选的,文本匹配装置还包括:确定模块,用于确定出所述第一词频矩阵中的关键向量;运算模块在用于将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算时,具体用于:将所述第一词频矩阵中的关键向量与所述多个第二词频矩阵中的关键向量进行相似度计算;其中,所述关键向量为词频矩阵中所对应的权重最大的至少一个词向量。一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序,实现以下流程:接收用户端上传的第一文本;对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与所述第一词频矩阵相似度最高的至少一个目标词频矩阵;将与所述至少一个目标词频矩阵对应的目标文本发送给所述用户端。一种计算机可读存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现以下流程:接收用户端上传的第一文本;对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与所述第一词频矩阵相似度最高的至少一个目标词频矩阵;将与所述至少一个目标词频矩阵对应的目标文本发送给所述用户端。本申请一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果:由于对第一文本进行分词处理,并对分词处理得到的第一词向量矩阵进行加权得到第一词频矩阵,然后将第一词频矩阵与预存储的第二词频矩阵进行相似度计算,得到与第一词频矩阵相似度最高的目标词频矩阵,最后将与目标词频矩阵对应的目标文本发送给用户端。因此,客户端能够获取与第一文本关联度高的目标文本,以便于用户参考目标文本进行文案的撰写,降低产品文案撰写的时间和人力成本。附图说明此处所说明的附图用来提供对本文件的进一步理解,构成本文件的一部分,本文件的示意性实施例及其说明用于解释本文件,并不构成对本文件的不当限定。在附图中:图1为本申请一个实施例提供的文本匹配方法、装置、电子设备及存储介质的应用环境示意图。图2为本申请一个实施例提供的文本匹配方法的流程示意图。图3为本申请一个实施例提供的确定多个第二词频矩阵的流程图。图4为本申请一个实施例提供的电子设备的结构示意图。图5为本申请一个实施例提供的文本匹配装置的结构示意图。本文档来自技高网...

【技术保护点】
1.一种文本匹配方法,其特征在于,包括:/n接收用户端上传的第一文本;/n对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;/n通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;/n将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与所述第一词频矩阵相似度最高的至少一个目标词频矩阵;/n将与所述至少一个目标词频矩阵对应的目标文本发送给所述用户端。/n

【技术特征摘要】
1.一种文本匹配方法,其特征在于,包括:
接收用户端上传的第一文本;
对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;
通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;
将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与所述第一词频矩阵相似度最高的至少一个目标词频矩阵;
将与所述至少一个目标词频矩阵对应的目标文本发送给所述用户端。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从目标网站获取多篇第二文本;
对所述多篇第二文本进行分词处理,得到与所述多篇第二文本一一对应的多个第二词向量矩阵;
通过词频-逆向文件频率算法对所述多个第二词向量矩阵中的每个词向量赋予权重,得到与所述多个第二词向量矩阵一一对应的所述多个第二词频矩阵。


3.根据权利要求2所述的方法,其特征在于,所述从目标网站获取多篇第二文本,包括:
通过网络爬虫从目标网站获取多篇第二文本。


4.根据权利要求2所述的方法,其特征在于,所述从目标网站获取多篇第二文本,包括:
从至少一个目标网站获取多篇第二文本。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定出所述第一词频矩阵中的关键向量;
所述将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,包括:
将所述第一词频矩阵中的关键向量与所述多个第二词频矩阵中的关键向量进行相似度计算;
其中,所述关键向量为词频矩阵中所对应的权重最大的至少一个词向量。


6.一种文本匹配装置,其特征在于,包括:
接收模块,用于接收用户端上传的第一文本;
分词处理模块,用于对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;
权重模块,用于通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;
运算模块,用于将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与所述第一词频矩阵相似度最高的至少一个目标词频矩阵;
发送模块,用于将与所述至少一个目标词频矩阵对应的目标文本发送给所述...

【专利技术属性】
技术研发人员:丁子洋刘贺龙
申请(专利权)人:上海熙满网络科技有限公司
类型:发明
国别省市:上海;31

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1