【技术实现步骤摘要】
一种基于特病特药场景的搜索方法
[0001]本专利技术涉及特病特药场景领域,具体为一种基于特病特药场景的搜索方法。
技术介绍
[0002]特药,一般是治疗恶性肿瘤等重特大疾病的一些费用较高、疗效确切、副作用小且无其他治疗方案可替代的特效药。
[0003]传统针对特药场景的检索方法大多使用基于字符串匹配的方案,如搜索lcs,bm25等方法计算匹配度,使用倒排索引展示搜索信息,其中bm25是指输入问题Q0,在数据中去匹配其它Q时,可以用BM25进行排序。“BM”其实就是指Best Matching,BM25也称Okapi BM25。
[0004]但不管是lcs还是bm25,在匹配至特药领域时,都存在如下问题:
[0005]1、传统搜索基于字符缺语义上的理解,缺少没有关注用户自身病种、搜索行为,缺少对用户个性化需求的精准搜索排序。
[0006]2、传统搜索难以满足灵活复杂的用户或医药工作者对特病、特药的描述,由于特病特药场景癌种细分种类繁多,不同分期分型描述更是多样,需要使用不同的药品或治疗方案。如 ...
【技术保护点】
【技术特征摘要】
1.一种基于特病特药场景的搜索方法,其特征在于,包括步骤:S1:获取用户输入的搜索关键词或文本,并对所述搜索关键词或文本进行清洗、过滤、剔除等预处理步骤,清洗过滤掉非必要的符号、空格及语气助词,并将特殊字符剔除;S2:基于所述处理后的数据,在类目术语词库中进行词条词汇精准匹配,获取用户配置的最接近术语;S3:重新封装检索条件,基于重新封装的检索条件通过数据接口接入召回排序识别系统,并进行召回&排序,并输出结果。2.根据权利要求1所述的一种基于特病特药场景的搜索方法,其特征在于:所述S1中非必要符合、空格包括零长度空格、零长度连接符、零长度非连接符。3.根据权利要求1所述的一种基于特病特药场景的搜索方法,其特征在于:所述S1中对特殊字符剔除的步骤具体步骤包括:对文本关键词进行特殊字符的清洗,当特殊字符为象形字形时,依据象形字表呈现的象形字形与原始字符的映射关系进行象形字形到原始字符的替换;当特殊字符为删除性字符时,根据不同删除性字符采用不同清洗方式,清洗方式包括:当删除性字符为退格字符,则将退格字符与该退格字符前一字符同时删除;当删除性字符为删除字符,则将删除字符与该删除字符后一字符同时删除。4.根据权利要求1所述的一种基于特病特药场景的搜索方法,其特征在于:所述S2中在类目术语词库中进行词条词汇精准匹配的具体过程包括:获取处理后的数据,根据皮尔逊相关系数算法计算所述数据相对于类目术语词库中其他词汇的相关系数;通过预设的等级归类规则,将每两个词汇按照相关系数确定归类等级;根据预先设置的词汇提取规则,对词汇进行提取,并基于已提取的词汇确定至少一个关联搜索词汇;针对各关联搜索词汇,基于预先训练好的模型对当...
【专利技术属性】
技术研发人员:田东坡,
申请(专利权)人:上海镁信健康科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。