【技术实现步骤摘要】
一种标题生成方法、设备及计算机可读存储介质
本专利技术涉及互联网技术,尤其涉及一种标题生成方法、设备及计算机可读存储介质。
技术介绍
医疗百科词典为用户提供了较为专业、权威的医疗知识,使得用户可以方便、快捷地了解健康知识和疾病的介绍。相关技术中,用户在查询健康知识或是疾病介绍时,一般是在医疗百科词典的搜索页面中直接输入自己所要查询的标题,以得到健康知识或疾病介绍,即得到相对应的搜索结果。然而,医疗百科词典中的各个词条的标题都是专业人士编辑的,标题专业化程度较强,用户在搜索时所输入的标题则较为口语化,而口语化的标题和专业的标题在语义上可能存在差异,换句话说,医疗百科词典中的各个词条的标题与用户的搜索习惯的贴合程度太低,这样导致专业的词条内容被用户搜索到的几率较小,从而使得针对专业医疗词条的搜索效果较差。
技术实现思路
本专利技术实施例提供一种标题生成方法、设备及计算机可读存储介质,能够提高针对专业医疗词条的搜索效果。本专利技术实施例的技术方案是这样实现的:本专利技术实施例提供一种标题生成方法,包括:获取待生成标题的词条数据;其中,所述待生成标题的词条数据中包括至少一个子词条数据;从标题信息数据库中,针对所述待生成标题的词条数据提取到多个标题内容组合;其中,标题内容组合中包含有候选标题和所述候选标题所对应的信息内容;根据所述多个标题内容组合中的信息内容,将所述多个标题内容组合中的候选标题与所述至少一个子词条数据中的每个子词条数据进行匹配,得到与所述每个子
【技术保护点】
1.一种标题生成方法,其特征在于,包括:/n获取待生成标题的词条数据;其中,所述待生成标题的词条数据中包括至少一个子词条数据;/n从标题信息数据库中,针对所述待生成标题的词条数据提取到多个标题内容组合;其中,标题内容组合中包含有候选标题和所述候选标题所对应的信息内容;/n根据所述多个标题内容组合中的信息内容,将所述多个标题内容组合中的候选标题与所述至少一个子词条数据中的每个子词条数据进行匹配,得到与所述每个子词条数据对应的标题集合;/n针对所述标题集合中的每个候选标题计算出搜索热门度,根据所述搜索热门度从所述标题集合中为所述每个子词条数据选择出标题,完成针对所述待生成标题的词条数据的标题生成;其中,所述搜索热门度表征了候选标题与用户搜索习惯的贴合程度。/n
【技术特征摘要】 【专利技术属性】
1.一种标题生成方法,其特征在于,包括:
获取待生成标题的词条数据;其中,所述待生成标题的词条数据中包括至少一个子词条数据;
从标题信息数据库中,针对所述待生成标题的词条数据提取到多个标题内容组合;其中,标题内容组合中包含有候选标题和所述候选标题所对应的信息内容;
根据所述多个标题内容组合中的信息内容,将所述多个标题内容组合中的候选标题与所述至少一个子词条数据中的每个子词条数据进行匹配,得到与所述每个子词条数据对应的标题集合;
针对所述标题集合中的每个候选标题计算出搜索热门度,根据所述搜索热门度从所述标题集合中为所述每个子词条数据选择出标题,完成针对所述待生成标题的词条数据的标题生成;其中,所述搜索热门度表征了候选标题与用户搜索习惯的贴合程度。
2.根据权利要求1所述的方法,其特征在于,所述每个子词条数据都有其所属的类型;所述根据所述多个标题内容组合中的信息内容,将所述多个标题内容组合中的候选标题与所述至少一个子词条数据中的每个子词条数据进行匹配,得到与所述每个子词条数据对应的标题集合,包括:
对所述多个标题内容组合的信息内容进行解析,得到所述多个标题内容组合的信息内容所属的类型,从而得到与所述信息内容相对应的各个候选标题所属的标题类型;
利用所述标题类型和所述每个子词条数据的类型,对所述各个候选标题和所述每个子词条数据进行匹配,得到与所述每个子词条数据对应的一个或多个匹配候选标题;
利用所述一个或多个匹配候选标题组成所述标题集合。
3.根据权利要求2所述的方法,其特征在于,所述利用所述标题类型和所述每个子词条数据的类型,对所述各个候选标题和所述每个子词条数据进行匹配,得到与所述每个子词条数据对应的一个或多个匹配候选标题,包括:
对所述每个子词条数据的类型和所述标题类型进行匹配,将与所述每个子词条数据的类型匹配上的标题类型作为匹配标题类型;
挑选出所述各个候选标题中属于所述匹配标题类型的候选标题,得到所述一个或多个匹配候选标题。
4.根据权利要求2或3所述的方法,其特征在于,在所述获取待生成标题的词条数据之后,所述根据所述多个标题内容组合中的信息内容,将所述多个标题内容组合中的标题与所述至少一个子词条数据中的每个子词条数据进行匹配,得到与所述每个子词条数据对应的标题集合之前,所述方法还包括:
将所述至少一个子词条数据中未分类的子词条数据的每个字符进行编码,得到字符编码结果;
针对所述字符编码结果进行语序特征挖掘,得到所述未分类的子词条数据的特征向量;
对所述特征向量进行分类,得到所述未分类的子词条数据的类型,从而得到所述每个子词条数据的类型。
技术研发人员:康战辉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。