基于大语言模型的智能资讯推荐及资讯搜索系统技术方案

技术编号:39598133 阅读:10 留言:0更新日期:2023-12-03 19:57


【技术实现步骤摘要】
基于大语言模型的智能资讯推荐及资讯搜索系统


[0001]本专利技术属于属于人工智能
,特别涉及一种基于大语言模型的智能资讯推荐及资讯搜索系统


技术介绍

[0002]在人工智能
,自然语言处理

信息检索和推荐系统的应用已经相当普遍

这些技术被广泛应用于搜索引擎

社交媒体

新闻网站和各种移动应用中,为用户提供个性化的信息获取和推荐服务

[0003]最接近本申请的一项现有技术可能是各大搜索引擎的信息推荐系统,比如
Google
的个性化新闻推荐,它通过分析用户的搜索历史

点击行为等信息,结合自然语言处理技术,从海量信息中筛选出用户可能感兴趣的内容

此类系统的一个共同特点是,它们主要基于用户的历史行为进行推荐,而不是通过对信息本身的深入理解和分析

[0004]然而,这些现有技术的一大问题是,它们主要依赖用户的历史行为数据,或者一些自主的输入内容进行查找,这些系统往往忽视了信息的质量和重要性,有时可能会推荐一些质量低下的或者与用户真正需求不符的信息

这些问题在本专利技术中得到了解决


技术实现思路

[0005]专利技术目的:为了克服现有技术中存在的不足,本专利技术提供一种基于大语言模型的智能资讯推荐及资讯搜索系统,能够实现个性化的资讯推荐,提升搜索质量和搜索精度

[0006]技术方案:为实现上述目的,本专利技术的技术方案如下:
[0007]基于大语言模型的智能资讯推荐方法,包括以下步骤:
[0008]S1
:从互联网上获取资讯信息的资讯标题

资讯正文

资讯链接和资讯图片信息;
[0009]S2
:在大语言模型中编写关键词
prompt
和摘要
prompt
,利用大语言模型从每篇资讯的正文中获取资讯摘要和预设数量的关键词,并将获得的资讯标题

资讯摘要

资讯关键词

资讯链接和资讯图片信息存储到表格数据中;
[0010]S3
:读取步骤
S2
中的表格数据,对资讯关键词进行分词处理,并生成查询词到资讯序号的字典;
[0011]S4
:当用户输入搜索关键词后,从步骤
S3
的字典中找到包含所述搜索关键词的资讯;
[0012]S5
:对预设时间段内的所有的资讯摘要以
N
个为一组进行分组,然后通过大语言模型和重要摘要
prompt
来根据重要性进行重要摘要的筛选,并筛选获得重要摘要,将筛选出来的重要摘要作为新的所有摘要;重复该过程直到所述预设时间段内有小于或等于
M
个所有摘要,然后返回对应的
M
个资讯作为新的推荐资讯

[0013]进一步地,在步骤
S2
中,如果资讯正文的内容长度小于或等于预设字数长度,则直接构造摘要
prompt2
模型和关键词
prompt2
模型获取资讯摘要和资讯关键词;
[0014]如果资讯正文的内容大于预设字数长度,则将所述资讯正文分成若干个文章分
段,且每个文章分段的字数长度不大于预设字数长度,并将每个文章分段分别构造摘要
prompt1
模型和关键词
prompt1
模型分别获取各文章分段的分段摘要和分段关键词,然后再将获得分段摘要

分段关键词分别通过摘要
prompt2
模型和关键词
prompt2
模型获取资讯摘要和资讯关键词

[0015]进一步地,构造的关键词
prompt1
模型和关键词
prompt2
相同,且构造的关键词
prompt1/
关键词模型
prompt2
模型包含以下需求:
[0016]根据获得的资讯,生成
A
个关于资讯内容的关键词,要求能够提出资讯主题;
[0017]使用
json
格式输出:
json
的格式为
{"keyword:["
关键词
1","
关键词
2",
……

"
关键词
A"]"}。
[0018]进一步地,构造的摘要
prompt1
模型和摘要
prompt2
相同,且构造的摘要
prompt1
模型
/
摘要
prompt2
模型包含以下需求:
[0019]生成一句话摘要;
[0020]要高度总结资讯正文的内容;
[0021]获得的资讯摘要长度在三十个字以内;
[0022]根据不同的大语言模型,将获得的资讯摘要拼接在资讯的最前面或者最后面

[0023]进一步地,在步骤
S3
中,当一篇资讯被加载后,在所述被加载资讯的最近若干年内所发布的所有资讯作为相关资讯搜索范围;
[0024]判断当前资讯的剩余查询词的交集资讯是否有十篇或者剩余两个查询词时,将这些资讯作为历史相关资讯

[0025]进一步地,在步骤
S3
中,有新的资讯数据增量加入时,增量更新表格数据和查询词到资讯序号的字典并生成历史相关资讯

[0026]进一步地,在步骤
S4
中,当出现多个关键词同时查询时,对多个资讯序号逐个取交集,如果用户选择或的关系来查询资讯,则对“或”关系的查询词资讯进行分别取交集并且合并展示,然后返回给用户

[0027]进一步地,在步骤
S5
中,根据重要性,每组中返回其中最重要的两个资讯摘要的序号,并且重复该过程直至产生
M
个摘要序号,然后在
M
个资讯摘要的前面分别添加序号;当用户输入关键词后,大语言模型输出对应摘要的资讯作为推荐资讯

[0028]进一步地,所述大语言模型为
chatgpt3.5/4、chatglm

6b、baichuan

13b

chat
中的任一种

[0029]基于大语言模型的智能资讯推荐方法的资讯搜索系统,包括:
[0030]数据获取模块,用于从互联网上获取资讯信息的资讯标题

资讯正文

资讯链接和资讯图片信息;
[0031]数据分析模块,用于根据构造的关键词
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
基于大语言模型的智能资讯推荐方法,其特征在于:包括以下步骤:
S1
:从互联网上获取资讯信息的资讯标题

资讯正文

资讯链接和资讯图片信息;
S2
:在大语言模型中编写关键词
prompt
和摘要
prompt
,利用大语言模型从每篇资讯的正文中获取资讯摘要和预设数量的关键词,并将获得的资讯标题

资讯摘要

资讯关键词

资讯链接和资讯图片信息存储到表格数据中;
S3
:读取步骤
S2
中的表格数据,对资讯关键词进行分词处理,并生成查询词到资讯序号的字典;
S4
:当用户输入搜索关键词后,从步骤
S3
的字典中找到包含所述搜索关键词的资讯;
S5
:对预设时间段内的所有的资讯摘要以
N
个为一组进行分组,然后通过大语言模型和重要摘要
prompt
来根据重要性进行重要摘要的筛选,并筛选获得重要摘要,将筛选出来的重要摘要作为新的所有摘要;重复该过程直到所述预设时间段内有小于或等于
M
个所有摘要,然后返回对应的
M
个资讯作为新的推荐资讯
。2.
根据权利要求1所述的基于大语言模型的智能资讯推荐方法,其特征在于:在步骤
S2
中,如果资讯正文的内容长度小于或等于预设字数长度,则直接构造摘要
prompt2
模型和关键词
prompt2
模型获取资讯摘要和资讯关键词;如果资讯正文的内容大于预设字数长度,则将所述资讯正文分成若干个文章分段,且每个文章分段的字数长度不大于预设字数长度,并将每个文章分段分别构造摘要
prompt1
模型和关键词
prompt1
模型分别获取各文章分段的分段摘要和分段关键词,然后再将获得分段摘要

分段关键词分别通过摘要
prompt2
模型和关键词
prompt2
模型获取资讯摘要和资讯关键词
。3.
根据权利要求2所述的基于大语言模型的智能资讯推荐方法,其特征在于:构造的关键词
prompt1
模型和关键词
prompt2
相同,且构造的关键词
prompt1/
关键词模型
prompt2
模型包含以下需求:根据获得的资讯,生成
A
个关于资讯内容的关键词,要求能够提出资讯主题;使用
json
格式输出:
json
的格式为
{"keyword:["
关键词
1","
关键词
2",
……

"
关键词
A"]"}。4.
根据权利要求2所述的基于大语言模型的智能资讯推荐方法,其特征在于:构造的摘要
prompt1
模型和摘要
prompt2
相同,且构造的摘要

【专利技术属性】
技术研发人员:郝培宁李志姜东晓
申请(专利权)人:上海捷晓信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1