一种文本生成方法、装置、服务器及存储介质制造方法及图纸

技术编号:24853552 阅读:31 留言:0更新日期:2020-07-10 19:07
本发明专利技术实施例公开了一种文本生成方法、装置、服务器及存储介质,方法包括:从历史检索词中识别出属于询问对象评价类的目标检索词集合,以及每个目标检索词对应的询问类型;获取每个目标检索词对应的对象属性信息;根据不同的询问类型确定对应的成文结构,并依据对象属性信息获取成文结构中所需的语料;基于成文结构对语料进行组合,得到每个目标检索词对应的文本,该文本用于作为搜索引擎中的结果页。本发明专利技术实施例将询问对象评价类的检索词划分不同的询问类型,并获取与不同类型的检索词涉及对象相关的语料,合成为文本作为搜索引擎中的结果,从而解决了现有技术中针对询问评价类的搜索请求搜索效率较低,且无法提供高可靠性检索结果的问题。

【技术实现步骤摘要】
一种文本生成方法、装置、服务器及存储介质
本专利技术实施例涉及互联网
,尤其涉及一种文本生成方法、装置、服务器及存储介质。
技术介绍
随着互联网技术的发展,搜索引擎已经成为用户获取信息的重要途径。据统计,在搜索引擎上,每天发生着约100亿次的搜索请求,这些搜索请求的背后是用户对于获取相关信息的诉求。其中,存在着大量有关不同产品如何选择、某特定品类排行和产品优缺点对比等询问评价类的搜索请求。现有技术中,针对询问评价类的搜索请求,提供给用户的搜索结果通常是根据检索词匹配的相关网站或网页,或者从一些问答知识类网站数据库以及其他途径提取的相关答案。然而,匹配到的网站或网页的来源不可控,导致其置信度不可控,而且和用户诉求的匹配度也无法保证。而知识问答类网站中,不论是网友的回答还是企业的回答,质量也都参差不齐,用户无法得到可靠性高的搜索结果。
技术实现思路
本专利技术实施例提供一种文本生成方法、装置、服务器及存储介质,解决了现有技术中针对询问评价类的搜索请求搜索效率较低,且无法提供高可靠性检索结果的问题。第本文档来自技高网...

【技术保护点】
1.一种文本生成方法,其特征在于,所述方法包括:/n从历史检索词中识别出属于询问对象评价类的目标检索词集合,以及每个目标检索词对应的询问类型;/n获取每个目标检索词对应的对象属性信息;/n根据不同的询问类型确定对应的成文结构,并依据所述对象属性信息获取所述成文结构中所需的语料;/n基于所述成文结构对所述语料进行组合,得到每个目标检索词对应的文本,其中,所述文本用于作为搜索引擎中的结果页。/n

【技术特征摘要】
1.一种文本生成方法,其特征在于,所述方法包括:
从历史检索词中识别出属于询问对象评价类的目标检索词集合,以及每个目标检索词对应的询问类型;
获取每个目标检索词对应的对象属性信息;
根据不同的询问类型确定对应的成文结构,并依据所述对象属性信息获取所述成文结构中所需的语料;
基于所述成文结构对所述语料进行组合,得到每个目标检索词对应的文本,其中,所述文本用于作为搜索引擎中的结果页。


2.根据权利要求1所述的方法,其特征在于,从历史检索词中识别出属于询问对象评价类的目标检索词集合,以及每个目标检索词对应的询问类型,包括:
依据预设的与询问对象评价类相关的特征词在历史检索词中进行匹配,识别出目标检索词集合;
在目标检索词集合中,依据匹配到的特征词与询问类型的对应关系,确定每个目标检索词对应的询问类型。


3.根据权利要求1所述的方法,其特征在于,获取每个目标检索词对应的对象属性信息,包括:
从每个目标检索词中提取询问目标;
将所述询问目标在预先创建的对象知识体系中进行匹配,根据匹配结果获取与所述询问目标对应的对象属性信息;
其中,所述对象属性信息至少包括对象名称和/或对象特征。


4.根据权利要求1所述的方法,其特征在于,所述询问类型至少包括推荐排名类和评价对比类;
相应的,所述推荐排名类对应的成文结构至少包括排名信息、对象信息和推广信息;
所述评价对比类对应的成文结构至少包括对象信息和推广信息。


5.根据权利要求4所述的方法,其特征在于,所述语料包括排名语料,相应的,依据所述对象属性信息获取所述成文结构中所需的排名语料,包括:
依据所述对象属性信息在预先创建的对象知识体系中获取与所述对象属性信息相关的搜索指数或资讯指数;
依据所述搜索指数或资讯指数确定对象的关注热度排名,作为所述排名语料。


6.根据权利要求4所述的方法,其特征在于,所述语料包括对象语料,相应的,依据所述对象属性信息获取所述成文结构中所需的对象语料,包括:
从知识类或经验分享类网站中获取与所述对象属性信息相关的基础对象语料;
利用所述对象属性信息作为词根,利用预设的对象所属行业的特征词库作为关键词,在网页库中进行匹配,提取出各网页中与所述对象属性信息和所述关键词相关的辅助对象语料;
将所述基础对象语料和所述辅助对象语料作为最终的对象语料。


7.根据权利要求4所述的方法,其特征在于,所述语料包括推广语料,相应的,依据所述对象属性信息获取所述成文结构中所需的推广语料,包括:
在预先创建的推广语料库中,依据所述对象属性信息获取与之相关的至少一个推广语料,其中,在推广语料库中,各推广语料按照其相关的对象属性信息进行标识;
依据推广语料的评分,从所述至少一个推广语料中选择最终的推广语料;
其中,所述评分是依据推广语料库中各推广语料的历史点击次数和经识别确定的语料质量数据确定。


8.根据权利要求1-7中任一所述的方法,其特征在于,在得到每个目标检索词对应的文本之后,所述方法还包括:
依据文本对应的询问类型和对象属性信息对文本打标签;
将具有标签的文本作为搜索引擎中的结果页,以便当用户的检索请求与标签相匹配时,将对应的文本作为检索结果显示。


9.一种文本生成装置,其特征在于,所述装置包括:
询问类型确定模块,用于从历史检索词中识别出属于询问对象评价类的目标检索词集合,以及每个目标检索词对应的询问类型;
属性信息确定模块,用于获取每个目标检索词对应的对象属性信息;
所需语料获取模块,用于根据不同的询问类型确定对应的成文结构,并依据所述对象属性信息...

【专利技术属性】
技术研发人员:张思密
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1