一种语义检索的方法及装置制造方法及图纸

技术编号:22974688 阅读:33 留言:0更新日期:2019-12-31 23:25
本发明专利技术公开了一种语义检索的方法及装置,该方法包括:获取分词词表以及用户输入的文本。根据分词词表对所述文本进行分词,确定第一分词结果。根据第一分词结果,对所述文本进行搜索。该方法提高了系统的语义检索能力,能够有效对文本进行搜索。

A method and device of semantic retrieval

【技术实现步骤摘要】
一种语义检索的方法及装置
本申请涉及一种语义检索方法及装置,特别涉及一种移动出行领域的语义检索方法及装置。
技术介绍
在地址搜索的过程中,可能会出现搜索结果不准确的情况,这会直接影响用户的搜索体验。目前通用的做法是利用通用词表对用户输入的文本进行分词,根据分词结果搜索用户感兴趣的内容。该种方法因通用词表缺乏针对性,导致搜索结果准确度较低,用户体验不佳。
技术实现思路
针对搜索结果不准确的问题,本专利技术的目的在于提供一种更加准确、有效的语义检索的方法。为达到上述专利技术目的,本专利技术提供的技术方案如下:一种语义检索的方法,包括获取分词词表;获取用户输入的文本;根据分词词表对所述文本进行分词,确定第一分词结果;以及根据所述第一分词结果,对所述文本进行搜索。在本专利技术中,所述第一分词结果包括细粒度分词结果和粗粒度分词结果。在本专利技术中,所述第一分词结果进一步包括同时出现的概率大于设定阈值的多个词语的组合。在本专利技术中,分词词表的生成方法,包括获取词表模型;获取训练语料;本文档来自技高网...

【技术保护点】
1.一种语义检索的方法,其特征在于,所述方法包括:/n获取分词词表;/n获取用户输入的文本;/n根据分词词表对所述文本进行分词,确定第一分词结果;/n根据所述第一分词结果,对所述文本进行搜索。/n

【技术特征摘要】
1.一种语义检索的方法,其特征在于,所述方法包括:
获取分词词表;
获取用户输入的文本;
根据分词词表对所述文本进行分词,确定第一分词结果;
根据所述第一分词结果,对所述文本进行搜索。


2.权利要求1所述的语义检索的方法,其特征在于,所述第一分词结果包括细粒度分词结果和粗粒度分词结果。


3.权利要求1所述的语义检索的方法,其特征在于,所述第一分词结果包括同时出现的概率大于设定阈值的多个词语的组合。


4.权利要求1所述的语义检索的方法,其特征在于,所述分词词表的生成方法包括:
获取词表模型;
获取训练语料;
根据词表模型对训练语料进行分词,获得第二分词结果;
根据第二分词结果,确定分词词表。


5.权利要求4所述的获取分词词表的方法,其特征在于,所述根据第二分词结果,确定分词词表进一步包括:通过多轮迭代的方式确定分词词表。


6.权利要求4所述的获取分词词表的方法,其特征在于,所述多轮迭代的每一轮迭代进一步包括:
根据所述词表模型对训练语料进行初步分词,确定初步词语;
获取预设规则;
判断所述初步词语是否符合预设规则;
响应于所述初步词语符合预设规则时,将所述初步词语加入所述词表模型,生成新的词表模型,进行下一轮分词。


7.权利要求1所述的获...

【专利技术属性】
技术研发人员:胡娟
申请(专利权)人:北京嘀嘀无限科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1