基于文本的旅游实体识别方法、系统、设备及存储介质技术方案

技术编号:42046784 阅读:30 留言:0更新日期:2024-07-16 23:28
本发明专利技术提供了基于文本的旅游实体识别方法、系统、设备及存储介质,该方法包括:建立地理类信息索引库以及包含地址信息的景点类信息索引库、酒店类信息索引库;对于待识别文本进行语义识别,获得地理类实体文本和机构类实体文本;将地理类实体文本在地理类信息索引库进行匹配,获得第一地理实体信息;对机构类实体文本进行分类,获得第一机构类实体文本和第二机构类实体,分别在景点类信息索引库和酒店类信息索引库中进行匹配,获得景点实体信息和酒店实体信息;仅将地址信息归属于第一地理实体信息的景点实体信息和/或酒店实体信息作为识别结果。本发明专利技术能够通过匹配实体地理位置上的关联与过滤,大大提升了文本实体识别的准确率。

【技术实现步骤摘要】

所属的技术人员能够理解,本专利技术的各个方面可以实现为系统、方法或程序产品。因此,本专利技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“平台”。图4是本专利技术的基于文本的旅游实体识别设备的结构示意图。下面参照图4来描述根据本专利技术的这种实施方式的电子设备600。图4显示的电子设备600仅仅是一个示例,不应对本专利技术实施例的功能和使用范围带来任何限制。如图4所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同平台组件(包括存储单元620和处理单元610)的总线630、显示单元640等。其中,存储单元存储有程序代码,程序代码可以被处理单元610执行,使得处理单元610执行本说明书上述方法部分中描述的根据本专利技术各种示例性实施方式的步骤。例如,处理单元610可以执行如图1中所示的步骤。存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(ram)62本文档来自技高网...

【技术保护点】

1.一种基于文本的旅游实体识别方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于文本的旅游实体识别方法,其特征在于,所述步骤S110还包括:所述地理类信息索引库具有各地域的依赖关系,所述酒店类信息索引库中包括大量酒店实体信息,每个所述酒店实体信息具有酒店名称的分词信息。

3.如权利要求2所述的基于文本的旅游实体识别方法,其特征在于,所述步骤S130中,包括:将所述地理类实体文本在所述地理类信息索引库进行文本匹配,获得满足匹配条件的第一地理实体信息和未满足匹配条件的第二地理实体信息。

4.如权利要求3所述的基于文本的旅游实体识别方法,其特征在于...

【技术特征摘要】

1.一种基于文本的旅游实体识别方法,其特征在于,包括以下步骤:

2.如权利要求1所述的基于文本的旅游实体识别方法,其特征在于,所述步骤s110还包括:所述地理类信息索引库具有各地域的依赖关系,所述酒店类信息索引库中包括大量酒店实体信息,每个所述酒店实体信息具有酒店名称的分词信息。

3.如权利要求2所述的基于文本的旅游实体识别方法,其特征在于,所述步骤s130中,包括:将所述地理类实体文本在所述地理类信息索引库进行文本匹配,获得满足匹配条件的第一地理实体信息和未满足匹配条件的第二地理实体信息。

4.如权利要求3所述的基于文本的旅游实体识别方法,其特征在于,所述步骤s140中,包括:

5.如权利要求4所述的基于文本的旅游实体识别方法,其特征在于,所述步骤s141之后、步骤s143之前还包括:

6.如权利要求5所...

【专利技术属性】
技术研发人员:葛万峰邵冲周辉牛硕鲁玲周海燕
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1