The embodiment of the application belongs to the technical field of big data analysis, and relates to a data similarity calculation method, which includes: obtaining the data to be matched; extracting the key information in the data to be matched; matching the business scenario corresponding to the key information according to the key information; determining the pre trained algorithm model corresponding to the business scenario, and inputting the data to be matched to the The algorithm model is described and the calculation result of similarity is output. The application also provides a similarity calculation device, a computer device and a storage medium for data. The application also provides a data similarity calculation device, a computer device and a storage medium. With the application, the data information can be matched with the business scenario, and then the algorithm model suitable for the business scenario can be selected to calculate the data information, which improves the calculation result and reduces the labor input cost.
【技术实现步骤摘要】
数据的相似度计算方法、装置、计算机设备及存储介质
本申请涉及大数据分析
,尤其涉及一种数据的相似度计算方法、装置、计算机设备及存储介质。
技术介绍
在对信息进行处理时,信息数据的相似度计算广泛应用于信息检索中,例如,机器翻译、自动问答、文本挖掘等领域。在这些应用之中,数据相似度计算是一个基础且非常关键的环节。目前,基于相同的平台或者网页下,大多数的数据在匹配时,无论是什么使用场景都是使用相同的算法进行计算,但是,对于有些业务场景,可能并不适合该算法模型,致使得到的数据结果往往不够准确。
技术实现思路
本申请实施例的目的在于提出一种数据的相似度计算方法、装置、计算机设备及存储介质,旨在解决现有的数据的相似度计算不准确的问题。为了解决上述技术问题,本申请实施例提供一种数据的相似度计算方法,采用了如下所述的技术方案:获取待匹配数据;提取所述待匹配数据中的关键信息;根据所述关键信息,匹配与所述关键信息对应的业务场景;确定与所述业务场景对应的预先训练的算法模型,将所述待匹配数据输入至所述算法模型,并输出相似度的计算结果。进一步的,所述提取所述待匹配数据中的关键信息的步骤具 ...
【技术保护点】
1.一种数据的相似度计算方法,其特征在于,包括下述步骤:获取待匹配数据;提取所述待匹配数据中的关键信息;根据所述关键信息,匹配与所述关键信息对应的业务场景;确定与所述业务场景对应的预先训练的算法模型,将所述待匹配数据输入至所述算法模型,并输出相似度的计算结果。
【技术特征摘要】
1.一种数据的相似度计算方法,其特征在于,包括下述步骤:获取待匹配数据;提取所述待匹配数据中的关键信息;根据所述关键信息,匹配与所述关键信息对应的业务场景;确定与所述业务场景对应的预先训练的算法模型,将所述待匹配数据输入至所述算法模型,并输出相似度的计算结果。2.根据权利要求1所述的数据的相似度计算方法,其特征在于,所述提取所述待匹配数据中的关键信息的步骤具体包括:对所述待匹配数据进行清洗处理,得到清洗后的数据;对所述清洗后的数据进行向量化处理,得到特征向量数据;计算所述特征向量数据,并将计算结果作为所述关键信息。3.根据权利要求1所述的数据的相似度计算方法,其特征在于,所述提取所述待匹配数据中的关键信息的步骤具体包括:对所述待匹配数据进行清洗处理,得到清洗后的数据;判断所述清洗后的数据中是否存在与预先设定的数据信息内容相同的数据;若是,则将清洗后的数据中与预先设定的数据信息内容相同的数据作为所述关键信息。4.根据权利要求2或3所述的数据的相似度计算方法,其特征在于,所述匹配与所述关键信息对应的业务场景的步骤,具体包括:提取前次使用的业务场景;判断所述关键信息是否与所述前次使用的业务场景相匹配;若是,则继续使用前次的业务场景;若否,则重新匹配业务场景。5.根据权利要求4所述的数据的相似度计算方法,其特征在于,所述重新匹配业务场景的步骤,具体包括:判断所述关键信息是否与预设的至少一个业务场景的参数信息相一致;若是,则选择业务场景的参数信息与关键信息相一致对应的业务场景;若否,则提示不存在对应的业务场景,并提示增加业务场景和对应的算法模型。6.根据权利要求5所述的数据的相似度计算方...
【专利技术属性】
技术研发人员:蔡俊,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。