【技术实现步骤摘要】
本专利技术提出一种基于历史上下文的大语言模型用户查询改写系统及方法,属于人工智能。
技术介绍
1、在信息检索系统中,用户查询的准确性和表达的精确性对于提升搜索结果的相关性和优化用户体验至关重要。传统的查询处理方法主要依赖关键词匹配和简单的逻辑规则,但在应对复杂语境、隐含意图或专业领域的查询时常显不足。近年来,随着大语言模型(large language model,deepseek模型)的快速发展,特别是基于transformer架构的模型的应用,它们在理解复杂语言结构和生成连贯文本方面展现出巨大的潜力,为查询改写技术带来了革命性的进展。这种技术进步为更准确和智能的查询处理提供了新的解决方案。
2、在对话式搜索系统中,用户能够通过多轮交互满足复杂的信息需求,而其中的关键步骤之一便是为每条与上下文相关的用户语句生成适当的搜索查询。deepseek模型在任务解决方面的强大能力促使研究者将其集成到现有的对话搜索系统中,以优化每次查询。例如,wang等人使用few-shot方法生成与查询相关的段落(query2doc),并将生成内容
...【技术保护点】
1.一种基于历史上下文的大语言模型用户查询改写系统,其特征在于:包括顺序连接的数据输入层、查询优化器、候选查询池、候选查询-上下文对齐评分机制以及查询优化输出层;
2.一种使用权利要求1所述基于历史上下文的大语言模型用户查询改写系统的改写方法,其特征在于,具体步骤如下:
3.根据权利要求2所述的基于历史上下文的大语言模型用户查询改写方法,其特征在于,数据集为QReCC,QReCC包括问题重写,检索和阅读理解;QReCC使用字典存储人工改写后的完整的数据,人工改写后的完整的数据由原始查询问题、人工改写的查询、相关上下文信息以及对应的相关文本链接信
...【技术特征摘要】
1.一种基于历史上下文的大语言模型用户查询改写系统,其特征在于:包括顺序连接的数据输入层、查询优化器、候选查询池、候选查询-上下文对齐评分机制以及查询优化输出层;
2.一种使用权利要求1所述基于历史上下文的大语言模型用户查询改写系统的改写方法,其特征在于,具体步骤如下:
3.根据权利要求2所述的基于历史上下文的大语言模型用户查询改写方法,其特征在于,数据集为qrecc,qrecc包括问题重写,检索和阅读理解;qrecc使用字典存储人工改写后的完整的数据,人工改写后的完整的数据由原始查询问题、人工改写的查询、相关上下文信息以及对应的相关文本链接信息整合为一条完整的数据,并将完整的数据作为字典的元素;将不同元素作为字典的键值对,其中键为描述性的名称,值为相应的数据,数据记录的来源包括qrecc中自带的quac-conv、nq-conv和trec-conv数据集,确保了数据的多样性和广泛性,并确保上下文信息的充分性和对话的连贯性。
4.根据权利要求2所述的基于历史上下文的大语言模型用户查询改写方法,其特征在于,从准确性、清晰性、信息充足性和简洁性四个特点人工设计提示词的具体规则如下:
5.根据权利要求4所述的基于...
【专利技术属性】
技术研发人员:刘鹏,涂清文,刘兵,杨文嘉,俞啸,朱成明,黄新建,侯文巧,李兵,单昊,张国圆,张鹏,
申请(专利权)人:中国矿业大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。