基于人工智能的检索语句语义片段获取方法、装置及终端制造方法及图纸

技术编号:16587445 阅读:47 留言:0更新日期:2017-11-18 15:02
本发明专利技术提出一种基于人工智能的检索语句语义片段获取方法、装置及终端,其中,该方法包括:对获取的检索语句进行预处理,确定检索语句中包括的第一主体词及语义片段集;根据历史检索数据,确定语义片段集中各语义片段与第一主体词间的关联度;根据各语义片段与第一主体词间的关联度,对语义片段集进行过滤处理,确定与检索语句对应的目标语义片段集。实现了与检索语句对应的目标语义片段集的获取,由于不需要人工编辑抽取模板,节省了人力资源,有利于自动化实现,且语义片段的获取方式灵活,能自适应挖掘各种粒度的语义片段,提高了语义片段的识别效果,从而使query的检索结果可以更好的满足用户需求,改善了用户体验。

Method, device and terminal for acquiring semantic fragments of retrieval sentences based on Artificial Intelligence

The invention provides a method for obtaining artificial intelligence retrieval based on semantic sentence fragment device and a terminal, wherein the method comprises the following steps: to obtain query preprocessing, determine the search statement including the first body words and semantic segment set; based on historical data retrieval, the semantic correlation of the semantic focus fragment fragment with the first subject word; according to the degree of association of the semantic segment with the first body between words, filtering of semantic segment set, and determine the target semantic segment query corresponding set. The target acquisition and semantic query fragment set corresponding to, because it does not need to manually edit template extraction, save human resources, is conducive to the realization of automation, access and semantic segment can be flexible, adaptive mining semantic segment of various size, improve the semantic segment recognition effect, so that the search results can be query to better meet the needs of users, improve the user experience.

【技术实现步骤摘要】
基于人工智能的检索语句语义片段获取方法、装置及终端
本专利技术涉及计算机
,尤其涉及一种基于人工智能的检索语句语义片段获取方法、装置及终端。
技术介绍
人工智能(ArtificialIntelligence,简称AI),是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。在检索语句(query)语义理解技术中,通常用意图和槽位的形式结构化表示query的语义信息。其中,槽位指一些语义片段;意图,指query的需求词即主体词。例如,query为“找一部不用付费的搞笑英文电影”,“电影”作为需求词表示意图,即query的主体词;“不用付费的”、“搞笑”、“英文”等语义片段用于限定主体词“电影”。语义片段的切分边界直接影响了槽位识别结果,从而间接影响到用户对query检索结果的满意度。若语义片段的切分粒度过小,可能导致结果转义。比如,“不用付费的”被切分成“不用”和“付本文档来自技高网...
基于人工智能的检索语句语义片段获取方法、装置及终端

【技术保护点】
一种基于人工智能的检索语句语义片段获取方法,其特征在于,包括:对获取的检索语句进行预处理,确定所述检索语句中包括的第一主体词及语义片段集;根据历史检索数据,确定所述语义片段集中各语义片段与所述第一主体词间的关联度;根据所述各语义片段与所述第一主体词间的关联度,对所述语义片段集进行过滤处理,确定与所述检索语句对应的目标语义片段集。

【技术特征摘要】
1.一种基于人工智能的检索语句语义片段获取方法,其特征在于,包括:对获取的检索语句进行预处理,确定所述检索语句中包括的第一主体词及语义片段集;根据历史检索数据,确定所述语义片段集中各语义片段与所述第一主体词间的关联度;根据所述各语义片段与所述第一主体词间的关联度,对所述语义片段集进行过滤处理,确定与所述检索语句对应的目标语义片段集。2.如权利要求1所述的方法,其特征在于,所述确定所述检索语句中包括的第一主体词及语义片段集,包括:对获取的检索语句进行切词处理,确定所述检索语句中包含的分词序列;根据预设的主体词列表,确定所述分词序列中包含的第一主体词。3.如权利要求2所述的方法,其特征在于,所述确定所述分词序列中包含的第一主体词,包括:判断所述检索语句的句尾包括的第一分词,是否在预设的名词列表中;若是,则确定所述第一分词为所述第一主体词;若否,则判断所述检索语句的句首包括的第二分词,是否在预设的专名实体词列表;若在,确定所述第二分词为所述第一主体词。4.如权利要求1所述的方法,其特征在于,所述根据历史检索数据,确定所述语义片段集中各语义片段与所述第一主体词间的关联度,包括:对历史检索数据进行数据训练,确定所述历史检索数据中包含的各语义片段与各主体词间的关联度表;通过查询所述关联度表,确定所述语义片段集中各语义片段与所述第一主体词间的关联度。5.如权利要求4所述的方法,其特征在于,所述对历史检索数据进行数据训练之前,还包括:获取历史检索数据;根据检索频次、满意度、和/或点击量,对所述历史检索数据进行清洗;所述对历史检索数据进行数据训练,包括:对清洗后的历史检索数据进行数据训练。6.如权利要求1-5任一所述的方法,其特征在于,所述确定与所述检索语句对应的目标语义片段集之后,还包括:根据所述历史检索数据,依次确定与目标语义片段集中各目标语义片段组合后被检索的主体词的数量;根据与各目标语义片段组合后被检索的主体词的数量,确定各目标语义片段的置信度;根据所述各目标语义片段的置信度,对所述目标语义片段集进行更新处理。7.如权利要求6所述的方法,其特征在于,所述确定各目标语义片段的置信度之后,还包括:根据所述各目标语义片段获取检索结果;根据所述各目标语义片段的置信度,确定所述检索结果的显示顺序。8.一种基于人工智能的检索语句语义片段获取装置,其特征在于,包括:第一确定模块,用于对获取的检索语句进行预处理,确定所述检索语句中包括的第一主体词及语义片段集;第二确定模块,用于根据历...

【专利技术属性】
技术研发人员:吴玉芳
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1