【技术实现步骤摘要】
基于人工智能的搜索文本理解方法、装置、设备和介质
[0001]本公开涉及人工智能领域,尤其涉及自然语言处理、深度学习、预训练模型
,可应用在智慧城市、智慧政务场景下,具体涉及一种基于人工智能的搜索文本理解方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术:人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]搜索是智慧城市、智慧政务建设中的最典型需求,而对搜索文本进行理解作为搜索系统的基础分析模块,是指导检索召回和排序策略的重要一环。传统的搜索文本理解,一般只有基础的语义分析。而在警务搜索的场景,数据更为丰富和复杂,不同的数据源还存在着关联,用户不仅有通用的模糊搜索需求也会 ...
【技术保护点】
【技术特征摘要】
1.一种搜索文本理解方法,包括:获取与目标搜索领域相关联的目标搜索文本;从所述目标搜索文本中抽取预设要素标签所对应的要素内容,其中,所述预设要素标签包括通用要素标签和与所述目标搜索领域相对应的领域要素标签;从所述目标搜索文本中抽取预设实体标签所对应的一个或多个实体内容,其中所述实体标签为待搜索主题;确定所述实体内容与所述要素内容之间的关系;以及响应于确定所述实体内容为多个,确定所述实体内容之间的关系。2.如权利要求1所述的方法,还包括:对所述目标搜索文本进行分词,以获得一个或多个词语;以及对所述一个或多个词语进行词重要性评估,以确定所述一个或多个词语各自所对应的重要性分数。3.如权利要求1所述的方法,其中,从所述目标搜索文本中抽取预设要素标签所对应的要素内容包括:从所述目标搜索文本中抽取通用要素标签所对应的通用要素内容;以及确定所述通用要素内容中的与所述领域要素标签相匹配的领域要素内容。4.如权利要求1或3所述的方法,其中,基于经训练的Bi
‑
GRU
‑
CRF模型从所述目标搜索文本中抽取所述通用要素标签所对应的通用要素内容。5.如权利要求1或3所述的方法,其中,基于枚举字典进行双向最大匹配,以获取所述领域要素标签所对应的领域要素内容。6.如权利要求2所述的方法,其中,对所述一个或多个词语进行词重要性评估包括:基于经训练的BERT
‑
CRF模型对所述一个或多个词语进行词重要性评估。7.如权利要求1所述的方法,还包括:对所抽取的要素内容进行归一化,以转换为相应的预设格式内容。8.如权利要求1所述的方法,其中,从所述目标搜索文本中抽取预设实体标签所对应的一个或多个实体内容包括:基于预设语言模板和依存分析技术,确定第一实体内容以及与所述第一实体内容相关联的目标实体内容。9.如权利要求2所述的方法,其中,所述目标实体包括第一实体内容以及与所述第一实体内容相关联的目标实体内容,并且其中,从所述目标搜索文本中抽取预设实体标签所对应的一个或多个实体内容包括:基于所述词重要性分数,确定所述第一实体内容以及与所述第一实体内容相关联的所述目标实体内容。10.如权利要求1或8所述的方法,其中,确定所述实体内容与所述要素内容之间的关系包括:基于依存分析结果以及与所述目标搜索领域相对应的预设约束规则,确定所述实体内容与所述要素内容之间的关系。11.如权利要求1所述的方法,其中,所述预设实体标签包括以下项中的至少一项:人、酒店、火车、航班、案件、案情。12.如权利要求1所述的方法,其中,所述预设要素标签包括以下项中的至少一项:地
点、时间、年龄、人名、号码、组织机构。13.一种搜索文本理解装置,包括:获取单元,配置为获取与目标搜索领域相关联的目标搜索文本;第一抽取单元,...
【专利技术属性】
技术研发人员:洪赛丁,龚建,孙珂,夏志群,卓泽城,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。