【技术实现步骤摘要】
文本匹配方法及装置、存储介质和计算机设备
本专利技术涉及计算机
,具体地涉及一种文本匹配方法及装置、存储介质和计算机设备。
技术介绍
随着经济社会发展水平的不断提高,高铁地铁等交通工具的投入,在方便人员流动的同时,降低了作案成本,增加了案件复杂性从而增加破案代价。现有的相关案件分析过程中,通常仅根据案件资源中的内容等基本特征判定是否为相关案件,其分析结果并不理想。另外,不仅对于案件的文本分析中存在这种问题,在对其他存在隐含社会关系(如经济发展情况、商圈分布情况、人口聚集程度等等)的文本进行分析时,也存在无法在分析过程中引入社会关系,导致分析结果不理想的问题。
技术实现思路
本专利技术解决的技术问题是如何提高对存在社会属性的文本的匹配准确性。为解决上述技术问题,本专利技术实施例提供一种文本匹配方法,所述方法包括:获取至少两组的待检测文本;对每一组待检测文本进行文本解析,以提取该待检测文本中的初始特征;获取所述初始特征对应的关联数据,并提取所述关联数据中的特征作为挖掘特征;根据初始特征和 ...
【技术保护点】
1.一种文本匹配方法,其特征在于,所述方法包括:/n获取至少两组的待检测文本;/n对每一组待检测文本进行文本解析,以提取该待检测文本中的初始特征;/n获取所述初始特征对应的关联数据,并提取所述关联数据中的特征作为挖掘特征;/n根据初始特征和挖掘特征确定所述至少两组待检测文本彼此之间的匹配度,以对各组待检测文本进行匹配。/n
【技术特征摘要】
1.一种文本匹配方法,其特征在于,所述方法包括:
获取至少两组的待检测文本;
对每一组待检测文本进行文本解析,以提取该待检测文本中的初始特征;
获取所述初始特征对应的关联数据,并提取所述关联数据中的特征作为挖掘特征;
根据初始特征和挖掘特征确定所述至少两组待检测文本彼此之间的匹配度,以对各组待检测文本进行匹配。
2.根据权利要求1所述的方法,其特征在于,所述根据初始特征和挖掘特征确定所述至少两组待检测文本彼此之间的匹配度包括:
将至少两组待检测文本的初始特征和挖掘特征输入特征积分模型,以使得所述特征积分模型基于不同待检测文本之间初始特征的相关性和/或挖掘特征的相关性计算至少两组待检测文本彼此之间的匹配度。
3.根据权利要求2所述的方法,其特征在于,所述特征积分模型根据时空得分规则、范围匹配得分规则、精准匹配得分规则中的至少一种规则计算至少两组待检测文本彼此之间的匹配度。
4.根据权利要求1所述的方法,其特征在于,所述对每一组待检测文本进行文本解析,以提取该待检测文本中的初始特征,包括:
识别每一组待检测文本中的关键词,并获取该关键词对应的文本内容;
基于所述关键词及其对应的文本内容获取该待检测文本的初始特征。
5.根据权利要求4所述的方法,其特征在于,所述待检测文本中的内容按照预设排列规则排列,所述对每一组待检测文本进行文本解析,以提取该待检测文本中的初始特征,包括:
按照所述预设排列规则的顺序提取该待检测文本中的初始特征。
6.根据权利要求1所述的方法,其特征在于,所述获...
【专利技术属性】
技术研发人员:吴鹏,王夷,李东晓,吴翔,俞楠,葛华,
申请(专利权)人:上海芯翌智能科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。