【技术实现步骤摘要】
预上线道路挖掘方法、装置、电子设备及存储介质
[0001]本公开涉及人工智能
,特别涉及智能交通、深度学习以及自然语言处理等领域的预上线道路挖掘方法、装置、电子设备及存储介质。
技术介绍
[0002]地图产品中,道路是最基本的构成要素,对于用户导航、路径时长预估等都有着重要的作用,相应地,如果缺失,会造成导航错误、路径时长预估错误等,严重影响用户体验。
[0003]因此,提前获知预上线道路,以便对地图进行及时更新,是非常必要的。目前,主要依赖于人工采集等方式来获知预上线道路,但这种方式需要耗费较大的人力和时间成本,且效率低下。
技术实现思路
[0004]本公开提供了预上线道路挖掘方法、装置、电子设备及存储介质。
[0005]一种预上线道路挖掘方法,包括:
[0006]从预定数据源获取文本信息;
[0007]从获取到的文本信息中筛选出与预上线道路相关的文本信息;
[0008]对筛选出的文本信息进行预上线道路信息提取,得到挖掘出的预上线道路。
[0009]一种 ...
【技术保护点】
【技术特征摘要】
1.一种预上线道路挖掘方法,包括:从预定数据源获取文本信息;从获取到的文本信息中筛选出与预上线道路相关的文本信息;对筛选出的文本信息进行预上线道路信息提取,得到挖掘出的预上线道路。2.根据权利要求1所述的方法,其中,所述从预定数据源获取文本信息包括:在预定应用提供的搜索框中输入所构建的搜索词进行搜索,得到搜索结果列表,分别对所述搜索结果列表中的各搜索结果页进行信息抓取,得到所述文本信息;和/或,对预定的信息发布源发布的信息进行抓取,得到所述文本信息。3.根据权利要求1所述的方法,其中,所述从获取到的文本信息中筛选出与预上线道路相关的文本信息包括:根据所构建的筛选词从获取到的文本信息中筛选出与预上线道路相关的文本信息。4.根据权利要求3所述的方法,其中,所述根据所构建的筛选词从获取到的文本信息中筛选出与预上线道路相关的文本信息包括:针对获取到的任一文本信息,若确定所述文本信息中同时包括第一白名单列表中的筛选词以及第二白名单列表中的筛选词,且不包括黑名单列表中的筛选词,则将所述文本信息作为筛选出的文本信息,所述第一白名单列表中的筛选词和所述第二白名单列表中的筛选词为不同类型的筛选词。5.根据权利要求3所述的方法,还包括:对筛选出的文本信息进行二次筛选,所述二次筛选包括:针对筛选出的任一文本信息,分别利用预先训练得到的分类模型对所述文本信息进行分类,若根据分类结果确定所述文本信息为与预上线道路相关的文本信息,则将所述文本信息作为筛选出的文本信息。6.根据权利要求1~5中任一项所述的方法,还包括:对筛选出的文本信息进行文本去重处理;对进行去重处理后的文本信息进行预上线道路信息提取。7.一种预上线道路挖掘装置,包括:获取模块、筛选模块以及挖掘模块;所述获取模块,用于从预定数据源获取文本信息;所述筛选模块,用于从获取到的文本信息中筛选出与预上线道路相关的文本信息;所述挖掘模块,用于对筛选出的文本信息进行预上线道路信息提取,得到挖掘出的预上线道路。8.根据权利要求7所述的装置,...
【专利技术属性】
技术研发人员:李壮,葛德金,李江龙,谷艳蕾,李曼,卢振,曹婷婷,杨建忠,夏德国,于文文,白玉,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。