System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于特征文本的内容主体搜索方法、装置、设备及介质制造方法及图纸_技高网

基于特征文本的内容主体搜索方法、装置、设备及介质制造方法及图纸

技术编号:40355338 阅读:12 留言:0更新日期:2024-02-09 14:40
本说明书实施例公开了一种基于特征文本的内容主体搜索方法、装置、设备及介质,涉及计算机技术领域,用于解决现有传统搜索方式维护成本高且场景适应性差的问题,方法包括:获取当前平台中各内容主体所对应的关键词集合,以对关键词集合中各关键词所对应的历史查询记录进行口语语句化处理,获得各关键词所对应的口语语句;对各口语语句进行转换汇总,获得当前平台中各内容主体所对应的特征文本,以基于各内容主体所对应的特征文本确定当前平台的内容主体特征;获取当前平台接收的待搜索关键词,以基于待搜索关键词与所述内容主体特征中各特征文本的匹配度,确定当前待搜索关键词所对应的搜索结果。

【技术实现步骤摘要】

本说明书涉及计算机,尤其涉及一种基于特征文本的内容主体搜索方法、装置、设备及介质


技术介绍

1、当前网站与app已经有了非常成熟的内容搜索功能,特别是电商行业,发展除了非常精准的搜索和推荐服务。智能搜索利用语义解析、词语向量、自然语言处理、机器学习等先进技术,能够在海量内容中为用户呈现理想的搜索结果,还能个性化实现平台运营方希望提供的“配套”结果。但是搭建一套电商级别的搜索系统,成本很高,需要有大量的运营数据,对研发人员的要求也很高,很多平台也不需要功能如此强大的搜索能力。因此对于中小型平台来说基于搜索引擎将关键词与目标内容进行匹配的传统搜索是较为常用的搜索推荐方式。

2、现有的传统搜索是使用搜索引擎将关键词与目标内容进行匹配,通过目标内容的标题、关键词设置,获得相关性的倒排索引,向用户展示搜索结果。但是当前搜索方式比较依赖关键词设置的全面性,需要大量的单个关键词维护,否则难以得到理想的搜索结果。并且对于老年人较为口语化的搜索进行响应的能力较差,使得老年人用户往往难以得到想要的搜索内容,导致使用场景适应性以及搜索效果较差。


技术实现思路

1、为了解决上述技术问题,本说明书一个或多个实施例提供了一种基于特征文本的内容主体搜索方法、装置、设备及介质。

2、本说明书一个或多个实施例采用下述技术方案:

3、本说明书一个或多个实施例提供一种基于特征文本的内容主体搜索方法,方法包括:

4、获取当前平台中各内容主体所对应的关键词集合,以对所述关键词集合中各关键词所对应的历史查询记录进行口语语句化处理,获得各关键词所对应的口语语句;

5、对各口语语句进行转换汇总,获得所述当前平台中各内容主体所对应的特征文本,以基于各内容主体所对应的特征文本确定当前平台的内容主体特征;

6、获取所述当前平台接收的待搜索关键词,以基于所述待搜索关键词与所述内容主体特征中各特征文本的匹配度,确定当前待搜索关键词所对应的搜索结果。

7、可选地,在本说明书一个或多个实施例中,获取当前平台中各内容主体所对应的关键词集合,具体包括:

8、根据所述当前平台的展示主体列表,确定当前平台所对应的内容主体;其中,所述内容主体包括:文章类型主体、资讯类型主体、服务类型主体、商品类型主体、作者类型主体、功能类型主体;

9、根据所述当前平台中各内容主体的功能描述,确定所述当前平台中各内容主体所对应的关键词,以汇总各所述对应的关键词确定所述当前平台中各内容主体所对应的关键词集合。

10、可选地,在本说明书一个或多个实施例中,对所述关键词集合中各关键词所对应的历史查询记录进行口语语句化处理,获得各关键词所对应的口语语句,具体包括:

11、获取所述当前平台的搜索功能所对应的数据库,以基于所述数据库确定所述当前平台的历史查询记录;

12、并获取各所述历史查询记录所对应的搜索结果,确定各所述搜索结果所对应的标准语句;

13、提取所述标准语句的搜索关键词,确定搜索关键词与所述历史查询记录的第一匹配度;其中,所述搜索关键词对应于多个历史查询记录;

14、基于余弦相似度算法获取所述关键词集合中各关键词相对应的搜索关键词,以基于所述搜索关键词与所述历史查询记录的第一匹配度,确定所述关键词集合中各关键词与所述历史查询记录的第一匹配度;

15、若基于所述第一匹配度大于预设阈值,则将所述历史查询记录所对应的口语语句,作为各所述关键词所对应的口语语句。

16、可选地,在本说明书一个或多个实施例中,对各口语语句进行转换汇总,获得所述当前平台中各内容主体所对应的特征文本,以基于各内容主体所对应的特征文本确定当前平台的内容主体特征,具体包括:

17、对各所述口语语句进行汇总获得各所述内容主体所对应的口语语句集合;

18、对所述口语语句集合中各口语语句基于获取时间戳进行排序,以依次对各所述口语语句进行无缝连接,获得所述当前平台中各内容主体所对应的特征文本;

19、将各内容主体所对应的特征文本作为所述当前平台中各所述内容主体所对应的内容主体特征,以便于对所述内容主体特征进行维护。

20、可选地,在本说明书一个或多个实施例中,获取所述当前平台接收的待搜索关键词,以基于所述待搜索关键词与所述内容主体特征中各特征文本的匹配度,确定当前待搜索关键词所对应的搜索结果,具体包括:

21、接收所述当前平台前端输入的待搜索关键词,对所述待搜索关键词进行字符拆分获得所述待搜索关键词的组成字符;

22、获取各所述组成字符在所述各特征文本的占比,以汇总各所述组成字符的占比,确定所述待搜索关键词与各所述特征文本的第二匹配度;

23、若确定所述第二匹配度大于预设搜索匹配度阈值,则确定所述特征文本所对应的内容主体为所述当前待搜索关键词所对应的搜索结果。

24、可选地,在本说明书一个或多个实施例中,获取所述当前平台接收的待搜索关键词,以基于所述待搜索关键词与所述内容主体特征中各特征文本的匹配度,确定当前待搜索关键词所对应的搜索结果之后,所述方法还包括:

25、根据各所述内容主体所对应的第二匹配度,确定各所述搜索结果的权重值;

26、基于所述待搜索关键词所对应的前端ip,确定所述搜索结果的传输通道,以使所述当前平台的搜索引擎基于所述传输通道将所述搜索结果传输到前端展示界面;

27、基于各所述搜索结果的权重值确定各所述搜索结果的展示位置,以将各所述搜索结果上传到所述前端展示界面对应的展示位置。

28、可选地,在本说明书一个或多个实施例中,获取所述当前平台接收的待搜索关键词,以基于所述待搜索关键词与所述内容主体特征中各特征文本的匹配度,确定当前待搜索关键词所对应的搜索结果之后,所述方法还包括:

29、基于所述当前待搜索关键词与所述搜索结果中所述内容主体的匹配关系,确定所述当前待搜索关键词所对应的文本特征;

30、基于所述当前待搜索关键词对所述对应的文本特征进行扩充,获得所述内容主体更新后的文本特征。

31、本说明书一个或多个实施例提供一种基于特征文本的内容主体搜索装置,装置包括:

32、获取单元,用于获取当前平台中各内容主体所对应的关键词集合,以对所述关键词集合中各关键词所对应的历史查询记录进行口语语句;

33、确定单元,用于对各口语语句进行转换汇总,获得所述当前平台中各内容主体所对应的特征文本,以基于各内容主体所对应的特征文本确定当前平台的内容主体特征;

34、搜索单元,用于获取所述当前平台接收的待搜索关键词,以基于所述待搜索关键词与所述内容主体特征中各特征文本的匹配度,确定当前待搜索关键词所对应的搜索结果。

35、本说明书一个或多个实施例提供一种基于特征文本的内容主体搜索设备,设备包括:

36、至少一个处理器本文档来自技高网...

【技术保护点】

1.一种基于特征文本的内容主体搜索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于特征文本的内容主体搜索方法,其特征在于,所述获取当前平台中各内容主体所对应的关键词集合,具体包括:

3.根据权利要求1所述的一种基于特征文本的内容主体搜索方法,其特征在于,对所述关键词集合中各关键词所对应的历史查询记录进行口语语句化处理,获得各关键词所对应的口语语句,具体包括:

4.根据权利要求1所述的一种基于特征文本的内容主体搜索方法,其特征在于,所述对各口语语句进行转换汇总,获得所述当前平台中各内容主体所对应的特征文本,以基于各内容主体所对应的特征文本确定当前平台的内容主体特征,具体包括:

5.根据权利要求1所述的一种基于特征文本的内容主体搜索方法,其特征在于,获取所述当前平台接收的待搜索关键词,以基于所述待搜索关键词与所述内容主体特征中各特征文本的匹配度,确定当前待搜索关键词所对应的搜索结果,具体包括:

6.根据权利要求5所述的一种基于特征文本的内容主体搜索方法,其特征在于,获取所述当前平台接收的待搜索关键词,以基于所述待搜索关键词与所述内容主体特征中各特征文本的匹配度,确定当前待搜索关键词所对应的搜索结果之后,所述方法还包括:

7.根据权利要求1所述的一种基于特征文本的内容主体搜索方法,其特征在于,获取所述当前平台接收的待搜索关键词,以基于所述待搜索关键词与所述内容主体特征中各特征文本的匹配度,确定当前待搜索关键词所对应的搜索结果之后,所述方法还包括:

8.一种基于特征文本的内容特征搜索装置,其特征在于,所述装置包括:

9.一种基于特征文本的内容主体搜索设备,其特征在于,所述设备包括:

10.一种非易失性存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令能够:

...

【技术特征摘要】

1.一种基于特征文本的内容主体搜索方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于特征文本的内容主体搜索方法,其特征在于,所述获取当前平台中各内容主体所对应的关键词集合,具体包括:

3.根据权利要求1所述的一种基于特征文本的内容主体搜索方法,其特征在于,对所述关键词集合中各关键词所对应的历史查询记录进行口语语句化处理,获得各关键词所对应的口语语句,具体包括:

4.根据权利要求1所述的一种基于特征文本的内容主体搜索方法,其特征在于,所述对各口语语句进行转换汇总,获得所述当前平台中各内容主体所对应的特征文本,以基于各内容主体所对应的特征文本确定当前平台的内容主体特征,具体包括:

5.根据权利要求1所述的一种基于特征文本的内容主体搜索方法,其特征在于,获取所述当前平台接收的待搜索关键词,以基于所述待搜索关键词与所述内容主体特征中各特征文本...

【专利技术属性】
技术研发人员:张冠群王思博元英会
申请(专利权)人:浪潮卓数大数据产业发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1