【技术实现步骤摘要】
文本匹配方法、装置、电子设备及存储介质
本文件涉及文本识别
,尤其涉及一种文本匹配方法、装置、电子设备及存储介质。
技术介绍
产品文案的主要目的是为了让商家所经营的产品更有认知度,销售力,更好的获得目标受众的认知,更有效的把产品价值传达给目标受众。目前,对于产品文案的制作,大都是根据对产品的理解并搜索关键词,然后花费大量大量时间阅读搜索出的文本内容,从中找出与产品关联度高的文本后再参考其中的内容进行文案的撰写。然而,在此过程中由于需要大量的时间来进行文本的检索和文本内容的阅读理解,导致产品文案撰写需要耗费大量的时间和人力成本。
技术实现思路
本申请实施例提供一种文本匹配方法,用以解决现有技术中存在的产品文案撰写需要耗费大量时间和人力成本的问题。本申请实施例提供一种文本匹配装置,用以解决现有技术中存在的产品文案撰写需要耗费大量时间和人力成本的问题。本申请实施例还提供一种电子设备及计算机可读存储介质。本申请实施例采用下述技术方案:一种文本匹配方法,包括:接收用户端上传的第一文本;对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算, ...
【技术保护点】
1.一种文本匹配方法,其特征在于,包括:/n接收用户端上传的第一文本;/n对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;/n通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;/n将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与所述第一词频矩阵相似度最高的至少一个目标词频矩阵;/n将与所述至少一个目标词频矩阵对应的目标文本发送给所述用户端。/n
【技术特征摘要】
1.一种文本匹配方法,其特征在于,包括:
接收用户端上传的第一文本;
对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;
通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;
将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与所述第一词频矩阵相似度最高的至少一个目标词频矩阵;
将与所述至少一个目标词频矩阵对应的目标文本发送给所述用户端。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从目标网站获取多篇第二文本;
对所述多篇第二文本进行分词处理,得到与所述多篇第二文本一一对应的多个第二词向量矩阵;
通过词频-逆向文件频率算法对所述多个第二词向量矩阵中的每个词向量赋予权重,得到与所述多个第二词向量矩阵一一对应的所述多个第二词频矩阵。
3.根据权利要求2所述的方法,其特征在于,所述从目标网站获取多篇第二文本,包括:
通过网络爬虫从目标网站获取多篇第二文本。
4.根据权利要求2所述的方法,其特征在于,所述从目标网站获取多篇第二文本,包括:
从至少一个目标网站获取多篇第二文本。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定出所述第一词频矩阵中的关键向量;
所述将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,包括:
将所述第一词频矩阵中的关键向量与所述多个第二词频矩阵中的关键向量进行相似度计算;
其中,所述关键向量为词频矩阵中所对应的权重最大的至少一个词向量。
6.一种文本匹配装置,其特征在于,包括:
接收模块,用于接收用户端上传的第一文本;
分词处理模块,用于对所述第一文本进行分词处理,得到与所述第一文本对应的第一词向量矩阵;
权重模块,用于通过词频-逆向文件频率算法对所述第一词向量矩阵中的每个词向量赋予权重,得到与所述第一词向量矩阵对应的第一词频矩阵,所述第一词频矩阵中包括所述第一词向量矩阵的所有词向量及与所述第一词向量矩阵中所有词向量一一对应的权重;
运算模块,用于将所述第一词频矩阵与预存储的多个第二词频矩阵进行相似度计算,得到与所述第一词频矩阵相似度最高的至少一个目标词频矩阵;
发送模块,用于将与所述至少一个目标词频矩阵对应的目标文本发送给所述...
【专利技术属性】
技术研发人员:丁子洋,刘贺龙,
申请(专利权)人:上海熙满网络科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。